張 艷
(黃山職業(yè)技術(shù)學(xué)院 旅游系,安徽 黃山 245000)
隨著旅游業(yè)的發(fā)展,改變了傳統(tǒng)固化、程序化的旅游方式,如今旅游者對旅游內(nèi)容的要求越來越高,行程安排也逐漸追求個(gè)性化。并且游客更加傾向于自主選擇游覽景點(diǎn),自主規(guī)劃旅游線路,但是目前的生態(tài)旅游信息非常散亂,并缺少結(jié)構(gòu)化的特征,普通游客很難根據(jù)這些信息制定自己的旅游路線。同時(shí),游客選擇陌生景點(diǎn)時(shí)無法親身體驗(yàn),決策行為不確定,這就需要旅游路線推薦盡可能充分了解游客的偏好,從而為游客推薦滿意的旅游路線。
旅游是一種包括生態(tài)、空間、經(jīng)濟(jì)、心理等的復(fù)雜行為,其中,空間行為是生態(tài)旅游推薦路線較為重要的一個(gè)因素,因此將重點(diǎn)研究空間容量統(tǒng)計(jì)在生態(tài)旅游路線自動(dòng)推薦方法中的應(yīng)用。在這種背景下,傳統(tǒng)的旅游路線推薦方法已經(jīng)不能滿足游客需求,因此設(shè)計(jì)一個(gè)基于空間容量統(tǒng)計(jì)的生態(tài)旅游路線自動(dòng)推薦方法,以解決傳統(tǒng)方法召回率差的問題。此次設(shè)計(jì)方法首先采用空間容量統(tǒng)計(jì)方法收集生態(tài)旅游數(shù)據(jù),由于數(shù)據(jù)中存在一定的模糊性,因此對其處理,然后統(tǒng)計(jì)生態(tài)旅游者旅游時(shí)的地理位置數(shù)據(jù),生成旅游者的行動(dòng)軌跡,并去除行動(dòng)軌跡中的異常點(diǎn),獲得生態(tài)旅游者的感興趣信息。最后采用空間容量統(tǒng)計(jì)方法計(jì)算旅游景點(diǎn)的瞬時(shí)容量,并對旅游線路匹配,自動(dòng)輸出匹配結(jié)果評分高的數(shù)據(jù),以此完成了生態(tài)旅游線路的自動(dòng)推薦。實(shí)驗(yàn)對比結(jié)果表明,此次設(shè)計(jì)的方法比傳統(tǒng)方法召回率高,能夠正確推薦旅游路線。
在對生態(tài)旅游路線自動(dòng)推薦之前,收集與旅游景點(diǎn)和用戶相關(guān)的信息,以提高生態(tài)旅游路線推薦的合理性。生態(tài)旅游數(shù)據(jù)收集[1]過程如下圖所示:
利用空間容量統(tǒng)計(jì)方法收集生態(tài)旅游數(shù)據(jù),由于空間數(shù)據(jù)具有拓?fù)潢P(guān)系,使旅游數(shù)據(jù)屬性之間出現(xiàn)一種非線性關(guān)系[2],因此對這些數(shù)據(jù)聚類處理,計(jì)算公式如下圖所示:
(1)
同時(shí),統(tǒng)計(jì)后的數(shù)據(jù)具有一定的空間信息模糊特性,該特性會(huì)導(dǎo)致數(shù)據(jù)收集結(jié)果不準(zhǔn)確,因此利用空間容量統(tǒng)計(jì)方法對空間數(shù)據(jù)處理,計(jì)算公式如下:
(2)
通過上述計(jì)算,完成對空間數(shù)據(jù)的處理,以此完成生態(tài)旅游數(shù)據(jù)的收集,為生態(tài)旅游路線自動(dòng)推薦提供基礎(chǔ)依據(jù)。
在上述生態(tài)旅游數(shù)據(jù)收集的基礎(chǔ)上,對生態(tài)旅游者空間行為挖掘[5]。采用空間容量統(tǒng)計(jì)方法統(tǒng)計(jì)生態(tài)旅游者旅游時(shí)的地理位置數(shù)據(jù),生成旅游者軌跡信息[6]。根據(jù)上述收集的生態(tài)旅游數(shù)據(jù)的相關(guān)信息,對旅游者軌跡預(yù)處理,假設(shè)某用戶的軌跡數(shù)據(jù)集為:
Y={tm1,tm2,……,tmn}
(3)
公式(3)中,tm1、tm2、tmn分別代表采樣點(diǎn)的位置信息,Y代表用戶集合。
在定義相關(guān)軌跡點(diǎn)的數(shù)據(jù)信息后,處理原始數(shù)據(jù),因?yàn)樵趯ι鷳B(tài)旅游者空間行為數(shù)據(jù)挖掘時(shí),會(huì)受外在的干擾原因的影響,而造成錯(cuò)誤采樣[7],因此對挖掘軌跡平滑處理。
按照時(shí)間因素考慮軌跡異常情況,假定有m-2、m-1、m、m+1、m+2五個(gè)點(diǎn),設(shè)置閾值,當(dāng)m點(diǎn)與m-1的距離大于m-1到m+1并且存在一個(gè)大于閾值的關(guān)系時(shí),則確定為軌跡中的異常點(diǎn)。在發(fā)現(xiàn)異常點(diǎn)后,將其從軌跡中去除,旅游者軌跡中的異常點(diǎn)如下圖所示:
在上述對初始軌跡預(yù)處理后,得到去除異常點(diǎn)的軌跡點(diǎn)集合tmj={p1,p2,p3,……,pn},根據(jù)該集合,尋找生態(tài)旅游者的軌跡中的熱點(diǎn)區(qū)域。考慮在已經(jīng)得到的軌跡點(diǎn)中,若當(dāng)前區(qū)域停留了一定的時(shí)長,說明當(dāng)前游客可能對該區(qū)域進(jìn)行了一次停留訪問[8],則將該區(qū)域標(biāo)記為一個(gè)熱點(diǎn)區(qū)域W,同時(shí),將軌跡中熱點(diǎn)區(qū)域結(jié)合記作Wr={d,f,g,h},d、f、g、h分別代表的是軌跡點(diǎn)集合、訪問次數(shù)、訪問時(shí)長以及用戶對該區(qū)域的興趣度[9]大小。移動(dòng)對象的軌跡與停留區(qū)域如下圖所示:
將上述得到的感興趣點(diǎn)進(jìn)行序列化[10],計(jì)算公式如下所示:
(4)
公式(4)中,J代表不同熱點(diǎn)區(qū)域的不同特征,v代表感興趣點(diǎn)的時(shí)間閾值,gt、fi代表臨近的熱點(diǎn)區(qū)域,a代表熱點(diǎn)區(qū)域的距離閾值。
通過上述計(jì)算,對所獲取的軌跡端進(jìn)行兩次遍歷處理,獲得用戶的熱點(diǎn)區(qū)域集合,完成生態(tài)旅游者空間行為的挖掘。
在上述生態(tài)旅游數(shù)據(jù)收集和生態(tài)旅游者空間行為挖掘的基礎(chǔ)上,對生態(tài)旅游路線自動(dòng)推薦。由于在旅游景區(qū)中,各個(gè)景點(diǎn)之間存在差異性[11],并且空間標(biāo)準(zhǔn)不一致,因此采用空間容量統(tǒng)計(jì)[12]方法對旅游空間使用范圍界定,計(jì)算過程如下圖:
考慮到景點(diǎn)之間游客流動(dòng)性的特點(diǎn),利用整個(gè)風(fēng)景旅游區(qū)的平均游覽時(shí)間計(jì)算景區(qū)的日周轉(zhuǎn)率[13],選取景點(diǎn)最小的瞬時(shí)合理容量代替每個(gè)景點(diǎn)的瞬時(shí)合理容量進(jìn)行計(jì)算,計(jì)算公式如下所示:
(5)
通過上述計(jì)算,對旅游區(qū)合理容量約束[14],在此基礎(chǔ)上,根據(jù)旅游者的感興趣區(qū)域匹配旅游路線,計(jì)算公式如下:
(6)
在線路匹配后,會(huì)生成多種旅游匹配線路,每種方案都會(huì)有相應(yīng)的得分,在對旅游線路推薦時(shí),按照下述計(jì)算公式,選取得分最高的路線推薦給旅游者:
(7)
公式(7)中,Qij代表第ij個(gè)用戶的需求,h代表旅游線路推薦的得分,bij代表路線排序因子[15],Ak為路線推薦結(jié)果。 在用戶尋找線路時(shí),按照上述計(jì)算自動(dòng)推薦最優(yōu)線路,以此完成基于空間容量統(tǒng)計(jì)的生態(tài)旅游路線自動(dòng)推薦。
采用實(shí)驗(yàn)的方式,對上述提出的方法驗(yàn)證,在某實(shí)驗(yàn)網(wǎng)站收集2015年4月至10月的旅游數(shù)據(jù)。這些數(shù)據(jù)中包括用戶簽到地點(diǎn)和簽到數(shù)據(jù)等。為保證網(wǎng)絡(luò)數(shù)據(jù)的準(zhǔn)確性,對網(wǎng)站的簽到記錄、用戶數(shù)、地點(diǎn)數(shù)等信息進(jìn)行采集,次數(shù)為100次,并隨機(jī)挑選一組采集數(shù)據(jù),同時(shí)為減少實(shí)驗(yàn)時(shí)間,對實(shí)驗(yàn)數(shù)據(jù)預(yù)處理,去掉簽到次數(shù)少于5次的地點(diǎn),處理后的實(shí)驗(yàn)信息如表1所示:
表1 實(shí)驗(yàn)數(shù)據(jù)
隨機(jī)抽取實(shí)驗(yàn)數(shù)據(jù)集中的50%作為訓(xùn)練集,剩余的作為測試集,并將測試集中的數(shù)據(jù)隨機(jī)分為7個(gè)集合,進(jìn)行7次實(shí)驗(yàn)。
為保證實(shí)驗(yàn)嚴(yán)謹(jǐn)性,將傳統(tǒng)的方法與此次設(shè)計(jì)的基于空間容量統(tǒng)計(jì)的生態(tài)旅游路線自動(dòng)推薦方法對比,對比兩種路線推薦方法的召回率。
召回率代表推薦地點(diǎn)中正確推薦的地點(diǎn)占測試集中用戶訪問地點(diǎn)的比重,召回率計(jì)算公式如下:
(8)
公式(8)中,N代表召回率,Z為推薦正確的地點(diǎn)個(gè)數(shù),C為測試集中地點(diǎn)個(gè)數(shù),A為用戶不喜歡地點(diǎn)個(gè)數(shù),A數(shù)值是針對每個(gè)用戶的喜好而排除的數(shù)量,N越高代表用戶對推薦的線路滿意程度高。
采用上述公式對實(shí)驗(yàn)數(shù)據(jù)分析,以減少實(shí)驗(yàn)對比難度。
為使實(shí)驗(yàn)結(jié)果更加直觀,設(shè)計(jì)實(shí)驗(yàn)平臺,實(shí)驗(yàn)平臺如下圖所示:
圖5中,云存儲(chǔ)資源池主要存儲(chǔ)實(shí)驗(yàn)數(shù)據(jù);云計(jì)算資源池主要對實(shí)驗(yàn)數(shù)據(jù)實(shí)時(shí)計(jì)算,并生成相應(yīng)的實(shí)驗(yàn)結(jié)果發(fā)送到實(shí)驗(yàn)控制終端;基站為實(shí)驗(yàn)提供網(wǎng)絡(luò)支持;管理員客戶端實(shí)時(shí)監(jiān)控實(shí)驗(yàn)情況;旅游景點(diǎn)客戶端提供旅游景點(diǎn)信息。
在上述實(shí)驗(yàn)數(shù)據(jù)以及實(shí)驗(yàn)平臺準(zhǔn)備完成的基礎(chǔ)上,對兩種方法的實(shí)驗(yàn)結(jié)果分析,傳統(tǒng)路線推薦方法與此次設(shè)計(jì)的旅游路線自動(dòng)推薦方法的對比結(jié)果如表2所示:
表2 實(shí)驗(yàn)對比結(jié)果
經(jīng)過計(jì)算得知,此次設(shè)計(jì)的方法比傳統(tǒng)方法的召回率最高高出79%,最低高出30%。因此能夠證明此次設(shè)計(jì)的旅游路線自動(dòng)推薦方法的召回率較高,說明此次設(shè)計(jì)方法為用戶推薦的路線基本能夠滿足用戶需求。因?yàn)榇舜卧O(shè)計(jì)的方法能夠有效分析用戶歷史旅游數(shù)據(jù),并且能夠分析游客的感興趣區(qū)域,從而推薦出較合理的旅游路線。而傳統(tǒng)的旅游路線方法整體召回率較低,并且召回率不穩(wěn)定,因?yàn)閭鹘y(tǒng)方法在衡量用戶之間或地點(diǎn)之間的相似性時(shí),沒有足夠的數(shù)據(jù),同時(shí),對用戶歷史數(shù)據(jù)挖掘結(jié)構(gòu)不準(zhǔn)確,從而導(dǎo)致旅游路線推薦效果較差。
通過上述實(shí)驗(yàn)?zāi)軌蜃C明此次設(shè)計(jì)的基于空間容量統(tǒng)計(jì)的生態(tài)旅游路線自動(dòng)推薦方法比傳統(tǒng)方法召回率高,能夠提高游客的滿意度。
傳統(tǒng)的生態(tài)旅游路線推薦方法存在召回率低的情況,為解決這一問題,將空間容量統(tǒng)計(jì)方法應(yīng)用到旅游路線推薦中。首先利用空間容量統(tǒng)計(jì)方法收集生態(tài)旅游數(shù)據(jù),并對這些數(shù)據(jù)聚類處理,然后,統(tǒng)計(jì)生態(tài)旅游者旅游時(shí)的地理位置數(shù)據(jù),生成旅游者軌跡信息,處理軌跡信息中的異常點(diǎn),以對生態(tài)旅游者空間行為的挖掘。最后,采用空間容量統(tǒng)計(jì)方法對旅游空間使用范圍界定,計(jì)算每個(gè)旅游場景的瞬時(shí)容量,匹配用戶感興趣路線,并對匹配完成的路線自動(dòng)評分,將評分最高的發(fā)送給旅游者,以此完成生態(tài)旅游路線的自動(dòng)推薦。實(shí)驗(yàn)對比結(jié)果表明,此次設(shè)計(jì)的方法比傳統(tǒng)方法的召回率最高高出79%,最低高出30%,因此此次設(shè)計(jì)的方法能夠滿足旅游者使用需求,具有一定的實(shí)際應(yīng)用意義。在未來的生態(tài)旅游路線自動(dòng)推薦方法中,重點(diǎn)分析經(jīng)濟(jì)、心理等因素對生態(tài)旅游推薦線路的影響。