曾令偉 王冬 吳蔣
摘要:該文的旅游線(xiàn)路推薦系統(tǒng)模型,核心推薦模塊主要采用的是關(guān)聯(lián)規(guī)則apriori算法,文中分析了該系統(tǒng)建立的平臺(tái),然后通過(guò)模擬數(shù)據(jù)驗(yàn)證該系統(tǒng)的實(shí)踐意義。
關(guān)鍵詞:旅游線(xiàn)路;推薦模型;Apriori算法;實(shí)踐
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)08-1906-02
1 概述
本文的旅游線(xiàn)路推薦系統(tǒng)采用的是關(guān)聯(lián)規(guī)則apriori算法,主要研究旅游線(xiàn)路的景點(diǎn)推薦,根據(jù)文獻(xiàn)[3]設(shè)計(jì)的系統(tǒng)框架,推薦模塊采用了關(guān)聯(lián)規(guī)則相關(guān)技術(shù)來(lái)實(shí)現(xiàn)。由于該系統(tǒng)處在實(shí)驗(yàn)室階段,并沒(méi)有投入實(shí)際應(yīng)用,所以在使用數(shù)據(jù)方面只能采用模擬數(shù)據(jù)來(lái)完成。
2 開(kāi)發(fā)環(huán)境及應(yīng)用技術(shù)簡(jiǎn)介
它以擁有“語(yǔ)法高亮”,IntelliSense(自動(dòng)編譯功能)以及高級(jí)除錯(cuò)功能而著稱(chēng)。比如,它允許用戶(hù)進(jìn)行遠(yuǎn)程調(diào)試,單步執(zhí)行等。還有允許用戶(hù)在調(diào)試期間重新編譯被修改的代碼,而不必重新啟動(dòng)正在調(diào)試的程序。其編譯及建置系統(tǒng)以預(yù)編譯頭文件、最小重建功能及累加連結(jié)著稱(chēng)。這些特征明顯縮短程式編輯、編譯及連結(jié)的時(shí)間花費(fèi),在大型軟件計(jì)劃上尤其顯著[1]。
2) Microsoft Office Access
MS ACCESS以它自己的格式將數(shù)據(jù)存儲(chǔ)在基于Access Jet的數(shù)據(jù)庫(kù)引擎里。它還可以直接導(dǎo)入或者鏈接數(shù)據(jù)。軟件開(kāi)發(fā)人員和數(shù)據(jù)架構(gòu)師可以使用Microsoft Access開(kāi)發(fā)應(yīng)用軟件,“高級(jí)用戶(hù)”可以使用它來(lái)構(gòu)建軟件應(yīng)用程序。和其他辦公應(yīng)用程序一樣,ACCESS支持Visual Basic宏語(yǔ)言,它是一個(gè)面向?qū)ο蟮木幊陶Z(yǔ)言,可以引用各種對(duì)象 [2]。
3) 數(shù)據(jù)挖掘技術(shù)系統(tǒng)采用文獻(xiàn)[3]介紹的數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則算法Apriori 經(jīng)典算法,來(lái)實(shí)現(xiàn)旅游線(xiàn)路推薦系統(tǒng)。
3 系統(tǒng)的實(shí)現(xiàn)
2) 推薦系統(tǒng)界面
4 系統(tǒng)實(shí)踐分析
1) 推薦的結(jié)果為I1、I2、I3也即南山、西島和亞龍灣。這些景點(diǎn)都是收到游客大力青睞的地點(diǎn),推薦景點(diǎn)的結(jié)果和現(xiàn)實(shí)游客的需求符合度較高,說(shuō)明該系統(tǒng)的科學(xué)性、合理性較強(qiáng)。
2) 在實(shí)踐運(yùn)用中,數(shù)據(jù)庫(kù)內(nèi)容的產(chǎn)生是取自電子商務(wù)網(wǎng)站的交易事務(wù)數(shù)據(jù),然后,以這些數(shù)據(jù)為基礎(chǔ),使用上述的數(shù)據(jù)挖掘技術(shù),產(chǎn)生頻繁項(xiàng)集,然后挖掘出知識(shí)來(lái),最后轉(zhuǎn)換成推薦線(xiàn)路推薦給用戶(hù)[6]。在這個(gè)過(guò)程中存在一些問(wèn)題如下:
①?gòu)碾娮由虅?wù)網(wǎng)站產(chǎn)生的數(shù)據(jù)十分繁雜,過(guò)于龐大,在數(shù)據(jù)處理中將會(huì)產(chǎn)生大量的頻繁項(xiàng)集。
②選擇的最小支持度要求要低,這勢(shì)必使得計(jì)算機(jī)計(jì)算時(shí)間過(guò)長(zhǎng)。選擇較低的最小支持度原因在于客戶(hù)的使用范圍也很大,造成網(wǎng)站數(shù)據(jù)量太大,客戶(hù)同時(shí)被推薦的幾率就很少,這樣,挖掘頻繁項(xiàng)集只能選擇較低的支持度。
③推薦出的線(xiàn)路可能存在偏差。數(shù)據(jù)挖掘出的知識(shí)也即推薦線(xiàn)路的產(chǎn)生是滿(mǎn)足最小支持度和最小置信度規(guī)則的前提下產(chǎn)生的,這些知識(shí)未必都十分準(zhǔn)確,可能存在少許錯(cuò)誤,這對(duì)用戶(hù)在使用過(guò)程中,置信度和忠誠(chéng)度是一個(gè)不小的考驗(yàn)。
4.3系統(tǒng)應(yīng)用的實(shí)際意義
本研究完成了一個(gè)簡(jiǎn)單的應(yīng)用模型,雖然距離實(shí)踐應(yīng)用還有較大距離,但還是具備一定的實(shí)際意義。
1)對(duì)于各大旅行社而言,可以根據(jù)挖掘的推薦路線(xiàn),進(jìn)行風(fēng)景區(qū)線(xiàn)路規(guī)劃,推出合理的行程安排,從而提高經(jīng)濟(jì)效益。
2)對(duì)于用戶(hù)(旅游者)而言,無(wú)需經(jīng)過(guò)大量的比較,繁瑣的咨詢(xún)來(lái)獲得合理、經(jīng)濟(jì)的旅游行程。通過(guò)使用系統(tǒng),用戶(hù)就可以很輕松得到滿(mǎn)意的推薦安排,節(jié)省了大量的時(shí)間和精力。
參考文獻(xiàn):
[1] http://baike.baidu.com/view/2070966.htm?fromId=100377#ref_[1]_2070966.
[2] http://baike.baidu.com/view/1162845.htm?fromId=868282.
[3] 曾令偉.Apriori算法在旅游線(xiàn)路推薦系統(tǒng)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2013.
[4] 陳京民. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)[M] .北京:電子工業(yè)出版社, 2007.
[5] 佟強(qiáng),周園春,閻保平.關(guān)聯(lián)規(guī)則挖掘算法[J] .微電子學(xué)與計(jì)算機(jī), 2005( 6).
[6] 李緒成,王保保.挖掘關(guān)聯(lián)規(guī)則中Apriori算法的一種改進(jìn)[J].計(jì)算機(jī)工程, 2010(7).