[摘要]本文提出了全新的個性化旅游服務(wù)系統(tǒng)模型,對個性化旅游服務(wù)的兩種常見的實現(xiàn)方法,即聚類分析與關(guān)聯(lián)規(guī)則進行了討論,并給出了個性化旅游服務(wù)系統(tǒng)引擎的設(shè)計思路與實現(xiàn)算法。
[關(guān)鍵詞]個性化旅游服務(wù)系統(tǒng);個性化推薦;模型
[中圖分類號]F592 [文獻標(biāo)識碼]A [文章編號]1005-6432(2010)35-0038-02
1 概述
時至今日,個性化的思想和技術(shù)在各個領(lǐng)域中已是無處不在。通過個性化的思想及個性化服務(wù)技術(shù)可以為不同的用戶提供不同的服務(wù)。個性化服務(wù)通過收集和分析用戶相關(guān)信息來學(xué)習(xí)用戶的興趣和行為,從而實現(xiàn)有針對性的推薦。在互聯(lián)網(wǎng)領(lǐng)域,個性化服務(wù)能夠大大的提高網(wǎng)站的服務(wù)質(zhì)量。而在旅游服務(wù)領(lǐng)域,個性化服務(wù)能夠提高用戶滿意度,有利于旅行社的發(fā)展。而現(xiàn)在的旅游服務(wù),在給游客推薦出游地點時往往忽視了游客本身的興趣和喜好,而游客自己在選擇出游地點上帶有一定的盲目性和隨意性,這樣游客在旅游之后往往發(fā)現(xiàn)目的地跟心中期望不符,這樣對提高用戶的滿意度是非常不利的。
綜上所述,為了滿足游客個體差異造成的各式各樣的需求,提出了個性化的旅游服務(wù)系統(tǒng)是很有必要的。本文第一章簡要的介紹了系統(tǒng)的背景知識,在第二章中詳細的介紹了個性化推薦系統(tǒng)的架構(gòu),第三章詳細介紹了系統(tǒng)中個性化推薦引擎的結(jié)構(gòu)和實現(xiàn)方法,最后在第四章中對全文進行了總結(jié)。
2 個性化旅游服務(wù)系統(tǒng)的結(jié)構(gòu)
個性化旅游服務(wù)系統(tǒng)由客戶端和服務(wù)器端組成,服務(wù)器端主要包括用戶認證、用戶建模、數(shù)據(jù)匹配、推薦結(jié)果封裝四大模塊,實現(xiàn)用戶合法性認證、用戶興趣發(fā)現(xiàn)、個性化推薦以及產(chǎn)生推薦結(jié)果這一個完整的過程。而客戶端的主要完成發(fā)送用戶請求以及接受服務(wù)器端的信息,并且提供對個性化推薦結(jié)果的反饋信息。系統(tǒng)各模塊詳細介紹如下:
(1)用戶請求。這一部分包括用戶提交需求以及用戶提交反饋信息兩部分的內(nèi)容。
(2)用戶認證。這一模塊主要功能是對用戶身份進行驗證,通過驗證的用戶才能合法的使用個性化服務(wù)系統(tǒng)系統(tǒng)。
(3)用戶建模。不同的用戶可能有不同的興趣和要求,用戶興趣建模是一個能為用戶提供個性化推薦系統(tǒng)的核心組成部分,它能夠獲取每個用戶的不同需求。
用戶興趣建模的主要步驟分為:①在觀察用戶選擇的基礎(chǔ)上,記錄、識別用戶的目標(biāo);②在識別用戶目標(biāo)的基礎(chǔ)上,分析用戶的興趣所在,為個性化的推薦提供依據(jù)。
(4)個性化推薦。根據(jù)不同用戶的模型,考慮不同用戶不同的興趣傾向,按照一定的規(guī)則,在服務(wù)數(shù)據(jù)庫中匹配關(guān)聯(lián)信息,作出決策,給不同的用戶提供不同的推薦結(jié)果。
(5)發(fā)送推薦信息。將推薦結(jié)構(gòu)按照一定的數(shù)據(jù)結(jié)構(gòu)和傳輸標(biāo)準打包后發(fā)送給用戶。
(6)用戶反饋。該模塊收集用戶對收到的推薦結(jié)果作出的反應(yīng),并將收集到的信息發(fā)送到服務(wù)器端,以便于服務(wù)器端進一步調(diào)整用戶模型以及推薦策略。
3 個性化推薦
3.1 個性化推薦過程
個性化推薦過程主要包括如下過程:①收集用戶信息;②分析用戶特性,根據(jù)在所有用戶中統(tǒng)計出來的數(shù)據(jù),找出若干個所有用戶選擇最多的景點,并以此為分組特性將用戶分成若干個組;③對每個組的用戶再進行統(tǒng)計,找出組內(nèi)的關(guān)聯(lián)情況,形成組內(nèi)的若干條規(guī)則,從而得到組內(nèi)成員的共同特性;④據(jù)實踐的變化對所有用戶的權(quán)重進行調(diào)整,突出用戶對各種興趣增長或減弱的趨勢,反映最新的變化情況,如下圖所示。
3.2 基于k-中心點思想的聚類算法
之所以采用k-中心點算法,是因為:①該算法通過簇內(nèi)主要點的位置來確定選擇中心點,對孤立點的敏感性??;②該算法對屬性性類型沒有局限性。算法描述:
輸入:所有游客的興趣模型數(shù)據(jù)庫,期望得到的簇的數(shù)目k。
輸出:是得所有對象與其最近中心點的偏差總和最小化的k個簇。
方法:①選擇k個對象作為初始的簇中心;②Repeat;③對每個對象,計算離其最近的簇中心點,并將對象分配到該中心點代表的簇;④隨機選取非中心點Orandom;⑤計算用Orandom代替Oj形成新集合前后的總代價Sj,S;⑥若S
表示j,km戶興趣度向量之間的距離。
3.3 基于聚類結(jié)果的個性化推薦
我們根據(jù)同一類別中其他用戶的景點選擇停留行為向單個用戶推送景點,對于新用戶,由于無法通過其行為計算出必須的用戶興趣度,所以不進行個性化推薦。
推薦過程:單個用戶U。
?、俨檎宜鶎俚姆诸愵悇eK;②查找當(dāng)年K中其他用戶的景點選擇記錄,計算各景點被這些用戶選擇的總次數(shù);③對上述的次數(shù)進行降序排序;④選取第一位U沒有選擇過的景點進行推薦。
3.4 應(yīng)用個性化推薦的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
應(yīng)用數(shù)據(jù)挖掘技術(shù),對log文件進行預(yù)處理得到用戶會話文件(用戶會話是指一個用戶在特定的時間內(nèi)所選擇的景點、選擇的順序),所有的用戶會話構(gòu)成會話文件,從中可以挖掘得到下面形式的關(guān)聯(lián)規(guī)則:
(1)選擇景點Plaeeal的客戶中,有a%又下載了Plaeecl。
(2)選擇景點Placea2、Plaeea3、Plaeea4和Placea5的客戶中,有b%又選擇了Placee2。
(3)由選擇景點Placea6開始進行一次景點選擇的客戶中,有c%緊接著選擇了Placec3。
上述規(guī)則中,Placeai(i=l,2,3,4,5,6)和Plaeecj(j=1,2,3)分別為關(guān)聯(lián)規(guī)則的前項和后項,a%、b%和c%為規(guī)則的置信度。根據(jù)關(guān)聯(lián)規(guī)則的表述形式,表示為:①Placeal→Placeel,置信度為a%;本系統(tǒng)中該條規(guī)則發(fā)現(xiàn)閾值為75%;②Placea2Placea3 Plaeea4 Placea5→Plaeec2,置信度為b%;本系統(tǒng)中該條規(guī)則發(fā)現(xiàn)閾值為50%,滑動窗口深度為3;③Placea6→Placec3,置信度為c%;本系統(tǒng)中該條規(guī)則發(fā)現(xiàn)閾值為60%。
基于關(guān)聯(lián)規(guī)則的個性化推薦過程如下:①每年12月和6月進行關(guān)聯(lián)規(guī)則的發(fā)現(xiàn);log日志時間限制為最近兩年;②剔除一年時間內(nèi)選擇景點個數(shù)小于2個的用戶記錄;③根據(jù)系統(tǒng)兩年內(nèi)的日志,計算發(fā)現(xiàn)超過閾值的而產(chǎn)生的三條規(guī)則;④根據(jù)發(fā)現(xiàn)的規(guī)則,對于滿足規(guī)則前項而沒有選擇后項的用戶,主動推薦規(guī)則后項的景點。
3.5 關(guān)聯(lián)規(guī)則和聚類分析互補的推薦決策
聚類分析和關(guān)聯(lián)規(guī)則互補的推薦方法是,在挖掘時,分別采用關(guān)聯(lián)規(guī)則和聚類分析得到規(guī)則和聚類結(jié)果;推薦時,如果當(dāng)前用戶訪問模式能夠與關(guān)聯(lián)規(guī)則匹配,則優(yōu)先推薦按照關(guān)聯(lián)規(guī)則推薦的結(jié)果,然后再推薦基于聚類分析的推薦結(jié)果;否則,計算當(dāng)前用戶訪問模式與聚類分析結(jié)果的匹配值,找到相似的類,按照聚類分析結(jié)果進行推薦。
與基于聚類結(jié)果的實驗分析相比,基于關(guān)聯(lián)推薦的推薦結(jié)果更加準確,但是只能對在行為滿足關(guān)聯(lián)推薦前項的用戶才能做出推薦;而基于聚類分析的推薦能夠為所有用戶推薦景點,但是推薦的準確度有所不足。
4 小結(jié)
基于用戶興趣挖掘的個性化信息服務(wù),能較好的利用已知的用戶行為,擴展了系統(tǒng)提供信息服務(wù)的能力,是一個新興的有著巨大應(yīng)用前景的研究領(lǐng)域,經(jīng)過眾多研究^員的努力,已經(jīng)取得了一定的進展。本文提出了全新的個性化旅游服務(wù)系統(tǒng)模型,隨后文章對游客行為與興趣之間的關(guān)聯(lián)做了討論和分析,由此提出了游客興趣發(fā)現(xiàn),接著結(jié)合游客興趣發(fā)現(xiàn)提出了卜性化的推薦思路。在本文中,個性化旅游服務(wù)系統(tǒng)主要由游客興趣挖掘與個性化推薦引擎兩個部分組成。其中,游客的興趣挖掘部分主要實現(xiàn)用戶建模,發(fā)現(xiàn)用戶的興趣所在,為個性化推薦提供決策依據(jù)。個性化推薦引擎主要綜合基于聚類分析與關(guān)聯(lián)規(guī)則兩種方法實現(xiàn)景點的推薦過程。個性化推薦服務(wù)技術(shù)是時下非常流行的一種技術(shù),相信旅游個性化服務(wù)也將逐漸成為旅游服務(wù)領(lǐng)域的熱門話題,而隨著旅游市場的擴大和技術(shù)的發(fā)展,進一步的研究重點包括:①更加準確、高效的用戶興趣發(fā)現(xiàn)方法??紤]時序、空間因素對用戶行為的影響將變得格外重要。②高用戶滿意度,如何建立更加準確、高效的推薦引擎仍是一個研究熱點與重