鄧君 彭珺 孫紹丹 鞠海龍
摘要:[目的/意義]本文利用敘事圖譜化的方式對(duì)游記文本信息資源進(jìn)行有效的知識(shí)組織和挖掘,直觀、生動(dòng)地展示旅游事件知識(shí)之間的關(guān)聯(lián)與結(jié)構(gòu),為推行旅游用戶需求精準(zhǔn)化知識(shí)服務(wù)提供參考與啟示。[方法/過程]網(wǎng)絡(luò)康養(yǎng)游記文本為實(shí)驗(yàn)數(shù)據(jù)源。采用基于規(guī)則模板的順承關(guān)系與事件抽取方法,結(jié)合基于Doc2vec和K-Means的語義相似度聚類實(shí)現(xiàn)事件泛化,最后利用社會(huì)網(wǎng)絡(luò)工具構(gòu)建康養(yǎng)旅游事理圖譜對(duì)游客行為過程描繪和分析。[結(jié)果/結(jié)論]通過構(gòu)建事理圖譜能夠快速揭示康養(yǎng)旅游的熱門目的地、游客行為偏好特征以及趨勢等。根據(jù)研究結(jié)果為旅游相關(guān)機(jī)構(gòu)在康養(yǎng)行程設(shè)計(jì)上提供4類方案,并在產(chǎn)品開發(fā)、服務(wù)優(yōu)化等方面提出了建議。
關(guān)鍵詞:游記文本;旅游知識(shí)服務(wù);事理圖譜;知識(shí)組織;知識(shí)發(fā)現(xiàn)
DOI:10.3969/j.issn.1008-0821.2022.07.009
〔中圖分類號(hào)〕G25073〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2022)07-0105-09
Travelogues Knowledge Discovery Based on Travel ELG
——Take Health Tourism as an ExampleDeng Jun1Peng Jun Sun Shaodan Ju Hailong
(1.School of Business Management,Jilin University,Changchun 130012,China;
2.School of Business,Guilin University of Technology,Guilin 541000,China)
Abstract:[Purpose/Significance]This paper uses the method of narrative mapping to effectively organize and mine the knowledge resources of travelogues,visually and vividly display the association and structure of knowledge of tourism events,and provide reference and inspiration for the implementation of accurate knowledge services for tourism users needs.[Method/Process]Travelogues of health tourism were used as experimental data sources.The sequential relation and event extraction method based on rule template were adopted.Event generalization was realized by semantic similarity clustering based on Doc2vec and K-means.Finally,the social network tool was used to construct the psychological map of health tourism to describe and analyze the behavior process of tourists.[Results/Conclusion]The popular destinations,behavioral preferences and trends of tourists can be quickly revealed by constructing the causal map.According to the results of the study,four kinds of schemes are provided for tourism related institutions in the design of recreational travel,and suggestions are put forward in the aspects of product development and service optimization.
Key words:travelogues;tourism knowledge service;Event Logic Graph(ELG);knowledge organize;knowledge discovery
隨著互聯(lián)網(wǎng)的發(fā)展,旅游者越來越傾向在旅游攻略平臺(tái)上分享旅行中或旅行后的心得體會(huì),潛在旅游者可以通過瀏覽游記收集需要的信息來規(guī)劃行程路線,相關(guān)企業(yè)機(jī)構(gòu)則通過分析游記更好地獲取游客的個(gè)性化需求以優(yōu)化旅游產(chǎn)品[1]。發(fā)掘蘊(yùn)含在游記文本中的事件和事件之間順承關(guān)系信息,可以輔助其他事理關(guān)系以及隱性事件知識(shí)的發(fā)現(xiàn),從而厘清游客行為及偏好的始末,能為計(jì)劃出行者提供更為完整深入的旅游目的地信息推薦,還能讓旅游相關(guān)機(jī)構(gòu)更加高效全面地獲知游客的行為潛在偏好及特征等,游記是旅游知識(shí)服務(wù)中不可或缺的一部分。
事理圖譜是以事件作為基本知識(shí)單元、事件及事件之間事理關(guān)系和模式為知識(shí)組織形式而構(gòu)成的事理邏輯知識(shí)庫,其利用大數(shù)據(jù)技術(shù)和高效易讀的圖譜化形式對(duì)謂詞性事件短語及其內(nèi)外關(guān)系進(jìn)行挖掘和呈現(xiàn)。通過識(shí)別和構(gòu)建事件及事件之間事理關(guān)系并可視化的信息處理方法,能有效補(bǔ)充實(shí)體和實(shí)體之間關(guān)系無法表達(dá)的動(dòng)態(tài)知識(shí)[2]。
作為旅游新業(yè)態(tài)、新模式的康養(yǎng)旅游,滿足了當(dāng)前人們對(duì)健康、養(yǎng)生的多元化追求,然而當(dāng)前對(duì)于康養(yǎng)旅游產(chǎn)品開發(fā)、游客行為特征等的實(shí)證研究較少,因此,本文以康養(yǎng)旅游為實(shí)驗(yàn)對(duì)象,嘗試采用事理圖譜方法對(duì)網(wǎng)絡(luò)中的康養(yǎng)游記文本進(jìn)行知識(shí)的挖掘與分析,對(duì)文本中的旅游事件和事件之間順承關(guān)系進(jìn)行特征提取,同時(shí)結(jié)合語義聚類算法、可視化分析工具繪制出具有直觀、動(dòng)態(tài)特性的事理圖譜,以敘述模式更加生動(dòng)形象地揭示出康養(yǎng)旅游的熱門目的地行程及相應(yīng)的游客行為偏好演進(jìn)和趨勢等,為推行康養(yǎng)旅游用戶需求精準(zhǔn)化知識(shí)服務(wù)提供參考與啟示。
1相關(guān)研究
11游記文本相關(guān)研究
近年來,從網(wǎng)絡(luò)游記中獲取旅游行程信息的文獻(xiàn)越來越豐富,研究內(nèi)容主要聚焦于優(yōu)化地理信息抽取[3]、旅游信息抽取[4]等技術(shù)方法,對(duì)目的地特征及旅游實(shí)體關(guān)系等信息進(jìn)行識(shí)別抽取和排序等,為相關(guān)需求者提供參考。
在目的地特征識(shí)別和排序方面,Hao Q等[5]提出一種基于位置—主題模型(Location-Topic Model)的目的地特征摘要方法,能夠正確提取和概括旅游目的地信息,為旅游者制定出行計(jì)劃提供幫助;Xu H等[6]采用了一種頻繁序列挖掘算法(FSPM),從大量地理詞向量中探索旅游地點(diǎn)的頻繁序列關(guān)系并收集每個(gè)熱門景區(qū)的局部特征,結(jié)合相關(guān)分析識(shí)別出與該景區(qū)相關(guān)的觀光點(diǎn),最終得到熱門路線以及各景區(qū)對(duì)應(yīng)的熱門觀光點(diǎn)排序;高原等[7]則首先運(yùn)用基于文本相似度算法自動(dòng)化識(shí)別游記中蘊(yùn)含地理位置信息的景點(diǎn),再結(jié)合歷史數(shù)據(jù)統(tǒng)計(jì)和景點(diǎn)空間特征模型,實(shí)現(xiàn)自動(dòng)化景點(diǎn)信息識(shí)別和行程重構(gòu),為個(gè)人旅游者高效制定旅游路線提供幫助。
在旅游實(shí)體關(guān)系挖掘方面,Zhu Z等[8]利用實(shí)體信息抽取和語義分析技術(shù)分步提取目的地特征概念及其相關(guān)性,為每個(gè)目的地實(shí)體構(gòu)建一個(gè)具有代表性的概念網(wǎng)絡(luò),豐富了目的地的代表信息(例如景點(diǎn)、活動(dòng)和風(fēng)俗);Yuan H等[9]和Guo L等[10]通過將FSPM算法與緊湊模式挖掘算法、詞網(wǎng)絡(luò)構(gòu)建等方法相結(jié)合,不但能夠獲得熱門游覽路線和景點(diǎn)排序,還能發(fā)現(xiàn)與景點(diǎn)位置相對(duì)應(yīng)的日常旅游活動(dòng)和旅游服務(wù)點(diǎn)。此外,部分學(xué)者運(yùn)用實(shí)體信息抽取并結(jié)合詞頻統(tǒng)計(jì)、共現(xiàn)分析、語義分析和情感分析等方式,不僅可以得到熱門景點(diǎn)排序和相關(guān)特征,還能獲知與景點(diǎn)相對(duì)應(yīng)的游客情感[11-12]以及旅游形象感知等[13-14],為潛在旅游者、旅游相關(guān)企業(yè)和事業(yè)機(jī)構(gòu)提供客觀和便捷的決策依據(jù)。
以上面向網(wǎng)絡(luò)游記的信息挖掘與分析技術(shù),不但能夠?qū)崿F(xiàn)行程中地理名稱、景區(qū)和服務(wù)點(diǎn)位置信息的特征獲取和出現(xiàn)頻率,還能幫助發(fā)現(xiàn)與景點(diǎn)相關(guān)的活動(dòng)項(xiàng)目以及游客的情感特征等。然而,這些信息處理技術(shù)大多都單純地從旅游文本中的實(shí)體信息和關(guān)聯(lián)或者它們之間的次序關(guān)系、語義關(guān)系等出發(fā),僅僅通過實(shí)體以及實(shí)體之間的關(guān)系還無法實(shí)現(xiàn)對(duì)旅游過程中游客行為以及偏好發(fā)生、發(fā)展的動(dòng)態(tài)過程的呈現(xiàn)與追溯。
12事理圖譜的應(yīng)用研究
事理圖譜的結(jié)構(gòu)是一個(gè)有向有環(huán)圖,節(jié)點(diǎn)代表事件,有向邊代表事件之間的事理關(guān)系,如并列、順承和因果關(guān)系等。事理圖譜所展示的是一幅以事件為知識(shí)基本單元的一系列事件的動(dòng)態(tài)演進(jìn)[15]。近年來,學(xué)者們大多將其應(yīng)用在政治與輿情監(jiān)控領(lǐng)域的事件識(shí)別、關(guān)系抽取、可視化分析等方面。如單曉紅等[16]通過抽取與政策相關(guān)的事件及它們之間的順承和因果關(guān)系,構(gòu)建政策影響事理圖譜,分析政策與利益相關(guān)者行為以及市場變化之間的影響關(guān)系;白璐等[17]則通過制定一套面向政治領(lǐng)域的事件分類標(biāo)準(zhǔn)對(duì)公開域中的政治事件進(jìn)行識(shí)別和關(guān)系抽取,構(gòu)建面向政治領(lǐng)域的事理圖譜。在輿情監(jiān)控上,如夏立新等[18]利用事理圖譜的事件抽取和表示的特性,對(duì)網(wǎng)絡(luò)輿情事件進(jìn)行多維特征可視化摘要生成;田依林等[19]以新冠肺炎微博輿情為例,提取相關(guān)事件及因果和順承的關(guān)系,構(gòu)建網(wǎng)絡(luò)輿情事理圖譜,并對(duì)生成的輿情演化路徑進(jìn)行分析。
綜上,事理圖譜在旅游信息服務(wù)中的應(yīng)用相當(dāng)有限。事理圖譜的主要作用是挖掘并呈現(xiàn)事件以及事件之間事理關(guān)系,實(shí)現(xiàn)對(duì)事件及其起源與演進(jìn)全過程的動(dòng)態(tài)描繪與總結(jié),可見,事理圖譜方法正好契合本文對(duì)旅游行程和游客行為偏好過程的研究需要。
2研究設(shè)計(jì)
游記文本中行程事理圖譜構(gòu)建與知識(shí)發(fā)現(xiàn)共分為文本采集和預(yù)處理、順承關(guān)系和事件識(shí)別與抽取、事件泛化以及圖譜構(gòu)建和可視化分析4個(gè)流程,如圖1所示。圖1行程事理圖譜構(gòu)建與知識(shí)發(fā)現(xiàn)流程
21文本采集和預(yù)處理
本文采用網(wǎng)絡(luò)爬蟲程序收集互聯(lián)網(wǎng)中的游記文本數(shù)據(jù)。首先對(duì)數(shù)據(jù)進(jìn)行清洗、去重、去雜,去停用詞處理則根據(jù)哈工大停用詞表對(duì)文本數(shù)據(jù)中的助詞、語氣詞等進(jìn)行過濾。利用Jieba分詞對(duì)目標(biāo)文本進(jìn)行分詞分句、長短句切分等,并調(diào)用哈工大LTP工具對(duì)文本進(jìn)行詞性標(biāo)注和依存句法分析等。
22順承關(guān)系識(shí)別和事件抽取
事件及事件之間的順承關(guān)系是指一件事與另一件或多件事在發(fā)生的時(shí)間上具有先后順序。本文運(yùn)用基于句法模式和規(guī)則的人工定義模板匹配與依存句法工具相結(jié)合的順承關(guān)系和事件多元組抽取方法,可簡單有效地實(shí)現(xiàn)中文文本中關(guān)系和事件的共同提取。首先,借鑒Liu H Y[20]的思路,參考中文文本中句法模式的組成方式選取固定的順序關(guān)系連接詞,如:(其次|然后|接著|隨后|接下來|…)等,根據(jù)連接詞構(gòu)造模板并生成匹配規(guī)則。以等標(biāo)點(diǎn)符號(hào)為分隔標(biāo)記,對(duì)目標(biāo)文本進(jìn)行長句切分,對(duì)切分后的長句依次以“”等標(biāo)點(diǎn)以及“和與及且跟并”等詞為分隔標(biāo)記進(jìn)行子句切分;其次,利用構(gòu)造好的模板對(duì)切分好的長句進(jìn)行順承關(guān)系識(shí)別匹配,同時(shí)將一個(gè)長句中的子句進(jìn)行分解和詞性標(biāo)注,提取出vob謂詞性結(jié)構(gòu)的短語作為結(jié)構(gòu)化的事件表示;最后,所有順承關(guān)系和表示事件的短語依次向上匯集,得到一個(gè)文本集data={[‘id’],[‘events’]},[‘id’]為標(biāo)簽集合,[‘events’]為包含順承關(guān)系的鏈?zhǔn)绞录陶Z集合,一個(gè)id對(duì)應(yīng)一個(gè)順承關(guān)系事件鏈。
23事件泛化
考慮得到的文本集中隱含著具有相似主題關(guān)系的順承關(guān)系事件鏈,通過對(duì)事件泛化處理,可以突出重點(diǎn),便于挖掘隱性事件知識(shí)。本文采用Doc2vec模型和K-Means算法的語義相似度聚類方法實(shí)現(xiàn)事件泛化,對(duì)文檔集data生成句向量表示并聚類。第一步,先將事件集data中的id和events看成一個(gè)paragraph即句子的合集,再利用Doc2vec句向量模型分別映射生成paragraph vector和word vector向量表示Xp={xp,xp,…,xp},Xw={xw,xw,…,xw}。paragraph vector和word vector雖然維數(shù)相同,但來自兩個(gè)不同的向量空間,在訓(xùn)練過程中,paragraph id保持不變,共享著同一個(gè)paragraph vector,每個(gè)句子都有一個(gè)唯一的id,相當(dāng)于為每一個(gè)word的預(yù)測同時(shí)都考慮到了主旨,這樣一來,在進(jìn)行文本相似度計(jì)算的時(shí)候就利用了整個(gè)句子的語義。第二步,從事件集data中隨機(jī)選擇k個(gè)句子樣本作為初始質(zhì)心向量,可通過輪廓系數(shù)法選擇一個(gè)合適的k值。計(jì)算所有的句子到所有的質(zhì)心的距離,即語義相似度,最大迭代次數(shù)N,直到所有的k個(gè)質(zhì)心向量都沒有發(fā)生變化則輸出簇劃分完成聚類。
24圖譜構(gòu)建與可視化分析
順承事件鏈經(jīng)過泛化后采用Gephi社會(huì)網(wǎng)絡(luò)工具構(gòu)建可視化的事理圖譜。圖譜中包含以節(jié)點(diǎn)代表的目的地和單個(gè)事件,每兩個(gè)節(jié)點(diǎn)之間存在的單向邊代表順承關(guān)系,如:id→node1→node2→node3→node4→node5,id代表目的地,節(jié)點(diǎn)1是節(jié)點(diǎn)2之前發(fā)生的事件,節(jié)點(diǎn)3是節(jié)點(diǎn)2之后發(fā)生的事件。以此形成的順承關(guān)系事件鏈,可將游客的旅游行程路線及對(duì)應(yīng)發(fā)生的行為用可視化方式表示出來以進(jìn)行下一步的分析。
3實(shí)驗(yàn)過程
31實(shí)驗(yàn)數(shù)據(jù)選擇
在充分考慮數(shù)據(jù)的全面性、適用性以及可獲得性等因素,決定選用攜程網(wǎng)、驢媽媽和馬蜂窩網(wǎng)中的網(wǎng)絡(luò)游記作為來源數(shù)據(jù)。檢索策略是在各網(wǎng)站“攻略”二級(jí)類目下輸入“康養(yǎng)旅游”“養(yǎng)生旅游”“健康旅游”等關(guān)鍵詞搜索游記標(biāo)題,時(shí)間設(shè)置為不限。利用Web爬蟲采集每篇游記的目的地和正文,從網(wǎng)頁中獲取的游記數(shù)量分別為攜程網(wǎng)5 059篇、驢媽媽520篇和馬蜂窩網(wǎng)1 135篇,進(jìn)行數(shù)據(jù)清洗后共得到6 520篇。將所有游記文本建立成CSV格式的數(shù)據(jù)集content={[‘city’],[‘blogs’]}。
32康養(yǎng)行程事理圖譜構(gòu)建
根據(jù)22章節(jié)中提到的抽取方法分別獲得順承事件鏈events 4 057條,共涉及目的地id 337個(gè),抽取結(jié)果示例如表1所示。
由于每個(gè)地名與順承事件鏈?zhǔn)且灰粚?duì)應(yīng)的,同一地名中可包含多條事件鏈,并且這些事件鏈的內(nèi)容具有較大相似性,根據(jù)23章節(jié)中的事件泛化方法,把含有相似主旨的事件鏈聚成一類。以表1中的事件鏈為例,首先將這9條{[‘id’],[‘events’]}共同生成句向量,經(jīng)過語義相似度計(jì)算后,隱含著相似主題的事件鏈被聚成一個(gè)簇類,表示為:
0[阿壩,保定];1[日本,衡山];2[北海,安徽,北京];3[百色;埃及]
其中隱含主旨分別為:放松身心→去目的地;到戶外→看夜景;景區(qū)游玩→品嘗食物;參觀歷史古跡→游河。
以此類推,結(jié)果共生成12個(gè)聚類的簇。將經(jīng)過泛化的結(jié)果導(dǎo)入Gephi“鄰接名單”建立有序的鏈?zhǔn)椒峙溆邢驁D,構(gòu)建康養(yǎng)旅游行程事理圖譜,其中包含34 798個(gè)節(jié)點(diǎn)和43 675條有向邊。
33結(jié)果分析
331熱門行程發(fā)現(xiàn)
旅游的熱門行程是指那些旅游者高度關(guān)注、影響力大并很受歡迎的游覽行程,一般表現(xiàn)為與行程相關(guān)的地名與事件大量涌現(xiàn),反映行程的內(nèi)容反復(fù)出現(xiàn)。在游記文本中,出現(xiàn)頻次高的地名往往可以作為熱門行程的目的地;高發(fā)的事件鏈?zhǔn)菍?duì)游客行為的高度概括和凝練,是康養(yǎng)行程的核心與精髓所在。利用Gephi從康養(yǎng)行程事理圖譜中篩選出頻次大于25的高頻地名進(jìn)行觀察,如圖2所示。從圖2中可以看到,廈門和三亞的出現(xiàn)頻次最高,說明這兩個(gè)地方是目前游客前往最多、最為熱門的康養(yǎng)行程目的地;其他頻次較高的地名還包括上海、廣州、重慶和北京等。通過對(duì)這些高頻目的地的觀察可以發(fā)現(xiàn),康養(yǎng)游客的行程大多聚集于長江以南地帶,西南以及沿海城市是游客較為熱衷的行程目的地。
通過分析廈門和三亞兩地中的關(guān)鍵事件鏈,可以探知康養(yǎng)熱門目的地中的游客偏好與具體過程。運(yùn)用過濾工具從圖譜中找出“廈門”和“三亞”以及對(duì)應(yīng)的所有順承事件鏈,選擇在一定閾值范圍內(nèi)的高概率節(jié)點(diǎn)所構(gòu)成的關(guān)鍵事件鏈,如圖3、圖4所示。
圖3所展示的是廈門康養(yǎng)行程關(guān)鍵事件鏈,其中最大的幾個(gè)節(jié)點(diǎn)主要包括吃牛肉面、去鼓浪嶼、去南普陀等,通過觀察這些高發(fā)事件節(jié)點(diǎn)之間的順承關(guān)系可以發(fā)現(xiàn),前往廈門的康養(yǎng)游客行為偏好主要可分成兩類:第一類是以鼓浪嶼為中心的行程,前往鼓浪嶼后可以去吹海風(fēng)、聽濤聲;或者去菜市場買海鮮和吃海鮮;還可以先去住酒店,再喝特色奶茶、吃烤魷魚等,接著去參觀鐘樓、鋼琴博物館等。第二類是以吃牛肉為目的的行程,包括可以先去南普陀吃牛肉面、嘗小吃,再帶鹵味;還有是去吃牛肉火鍋,再喝黏米酒等。
在圖4三亞康養(yǎng)行程事件鏈中,游客最為熱門的偏好是吃海鮮,可分成兩條線路:一條是先去三亞灣放松身心,然后去春園海鮮市場買海鮮和吃海鮮;另一條是先去吃海鮮,接著買水果,然后再乘車去亞龍灣、海灘和森林公園享受下午茶。其中,在吃海鮮的同時(shí)可以選擇露天的餐廳用餐、吹海風(fēng),或者選擇室內(nèi)餐廳吃炒菜以及充滿詩情畫意的采菊火鍋。此外,從圖中還可以看到,前往三亞的康養(yǎng)游客還熱衷于前往位于三亞南端的南山景區(qū)參觀和體驗(yàn)?zāi)仙轿幕瘓鼍啊?/p>
332游客行為特征發(fā)現(xiàn)
單個(gè)地對(duì)熱門行程進(jìn)行分析,還無法獲知康養(yǎng)游客的行為特點(diǎn)。在經(jīng)過泛化處理后的康養(yǎng)行程事理圖譜中,具有相似主旨的事件鏈被聚為一類,通過對(duì)每一類中的關(guān)鍵事件鏈的分析,可以實(shí)現(xiàn)對(duì)康養(yǎng)游客行為特征的發(fā)現(xiàn)。運(yùn)用Gephi對(duì)圖譜中各節(jié)點(diǎn)進(jìn)行概率計(jì)算,再過濾去除平均度低的節(jié)點(diǎn),如圖5所示,在圖5的12個(gè)聚類簇中,同一類簇中的事件鏈主題相同,其中節(jié)點(diǎn)顏色的深淺代表了節(jié)點(diǎn)重要性的高低,以重要性最高的事件節(jié)點(diǎn)為切入點(diǎn),再通過重要事件節(jié)點(diǎn)之間的順承關(guān)系即可發(fā)現(xiàn)該類型行程的關(guān)鍵事件鏈。通過觀察,共找到關(guān)鍵事件鏈38條和相關(guān)目的地31個(gè),如表2所示。
在表2中,以安徽、銅川等為康養(yǎng)目的地的游客(類號(hào)1和2),主要表現(xiàn)為兩類行為偏好過程,即“登山→賞景”和“登山→探洞→求仙問道”相結(jié)合的康養(yǎng)體驗(yàn),游客們熱衷于前往靈山圣地以達(dá)到修養(yǎng)身心的養(yǎng)生體驗(yàn),可以坐纜車或行走于棧道上觀賞怡人風(fēng)景,感受人與自然的和諧,再到仙洞、仙頂?shù)润w會(huì)修道成仙的養(yǎng)生樂趣等。以北京、咸寧等為康養(yǎng)目的地的游客(類號(hào)3和4),以“尋古跡/游古鎮(zhèn)→感受人文歷史”是最為突出的偏好,游客前往具有歷史文化的建筑、古鎮(zhèn)等,去觀賞人文風(fēng)光,感受特色習(xí)俗,還會(huì)選擇如博物館等地方聆聽歷史感受情懷等。以廣州、武漢等為康養(yǎng)目的地的游客熱門行為是圍繞著住酒店開展的(類號(hào)5~7),主要方式可分為兩類:第一類是以酒店為出發(fā)點(diǎn),先入住酒店,接著游覽周邊的景點(diǎn)感受輕松自在的生活方式;第二類方式是以酒店為歸屬點(diǎn),游客熱衷于先到景區(qū)或目的地,再回到酒店用餐或者體驗(yàn)休閑時(shí)光,如喝咖啡、喝花茶等。以上海、麗江和三亞等為康養(yǎng)目的地的游客(類號(hào)8~10),“享受美食→游覽風(fēng)景區(qū)”是他們共同的偏好,但各有偏重,比如有的游客偏好于選擇有地方特色的食物,比如三亞吃海鮮、西安吃羊肉等,游客還注重于特色的吃法,比如在成都吃魚蘸料沒有腥味、廈門的燒仙草添加燕麥等。在以昆明、杭州等為康養(yǎng)目的地的游客中(類號(hào)11~12),“泡溫泉→調(diào)養(yǎng)生息/品嘗美食”是他們最主要的行為偏好,游客首先選擇風(fēng)景優(yōu)美的溫泉景區(qū),通過泡溫泉來滋潤身心、沐浴養(yǎng)生,接著欣賞風(fēng)景、呼吸氧吧,或者去品嘗美食,感受風(fēng)情。
綜上,可根據(jù)康養(yǎng)游客的行為歸納出幾個(gè)特征:第一,從目的地選擇上來看,游客熱衷于選擇沿海地區(qū)作為康養(yǎng)行程地,此外,具有歷史悠久、富含民族特色文化的西南部地區(qū),也是游客偏好的康養(yǎng)勝地。第二,康養(yǎng)行程的主題并不是單一的,而是多種方式的融合演進(jìn)。比如,登山的行為應(yīng)該是運(yùn)動(dòng)養(yǎng)生的一種方式,但不少游客是以求仙問道的宗教文化養(yǎng)生為最終的目的;以吃為主的飲食養(yǎng)生方式往往與泡溫泉、看風(fēng)景等生態(tài)養(yǎng)生方式前后開展;住酒店與休閑相結(jié)合的酒店養(yǎng)生方式也是游客熱衷的體驗(yàn)過程。第三,遠(yuǎn)離喧囂、探尋返璞歸真的生活態(tài)度以及能夠舒適愜意地飲食、游玩等是康養(yǎng)游客共同的特點(diǎn)
333康養(yǎng)旅游趨勢發(fā)現(xiàn)
康養(yǎng)旅游業(yè)持續(xù)健康發(fā)展的關(guān)鍵在于相關(guān)從業(yè)者需要針對(duì)市場需求而不斷創(chuàng)新產(chǎn)品和升級(jí)服務(wù)模式,旅游消費(fèi)者偏好便是影響市場需求的一個(gè)重要因素。由于游客的偏好并不是固定不變的,所以對(duì)其過程核心環(huán)節(jié)的發(fā)現(xiàn),有利于完整和全面地探測游客的潛在偏好,為相關(guān)機(jī)構(gòu)優(yōu)化康養(yǎng)旅游產(chǎn)品與服務(wù)提供啟示。利用Gephi軟件中的k-Core子圖挖掘算法能夠?qū)崿F(xiàn)康養(yǎng)旅游事理圖譜中核心關(guān)系的發(fā)現(xiàn)。該算法通常指定一個(gè)k核心度,通過去除圖中不符合核心度的頂點(diǎn),得到在圖中承擔(dān)著核心地位的子圖,子圖中每個(gè)頂點(diǎn)至少具有k的度數(shù),且所有頂點(diǎn)都至少與該子圖中的k個(gè)其他節(jié)點(diǎn)相連。核心節(jié)點(diǎn)不僅僅是度數(shù)的高低,更依靠的是該節(jié)點(diǎn)在整個(gè)圖中的重要性和傳播能力[21],因此能夠直觀追溯康養(yǎng)游客潛在偏好和趨勢,如圖6所示。
圖6中可首先看到核心圖譜中的目的地包括三亞、廈門和杭州,表明除了三亞和廈門兩個(gè)熱門康養(yǎng)目的地之外,杭州是潛在的熱門目的地。
在圖中平均度最大的核心事件節(jié)點(diǎn)是欣賞風(fēng)景,通過節(jié)點(diǎn)之間的有序有向關(guān)系,可以從圖中找出在其之前緊密相連的順序事件包括的泡溫泉、坐車、吃午飯、喝茶以及品嘗美食,同理可找到在其之后聯(lián)系最為緊密事件是去博物館、感受文化和拍照片;其中還存在較遠(yuǎn)的順序事件有吃東西、帶孩子和住酒店等。經(jīng)過對(duì)核心事件之間關(guān)系的綜合觀察,可將核心行程的環(huán)節(jié)總結(jié)為:游客傾向于選擇風(fēng)景秀麗的南方近海、沿江城市作為康養(yǎng)行程的目的地,將自然環(huán)境與文化陶冶相結(jié)合是游客追求的養(yǎng)生方式。游客青睞慢節(jié)奏的頤養(yǎng)過程,到達(dá)景區(qū)后先進(jìn)行一段時(shí)間的休閑娛樂活動(dòng)休息放松,如去泡溫泉、喝茶和吃美食等,之后才前往景區(qū)的名景、名山等景點(diǎn)進(jìn)行登山、賞景等游玩活動(dòng),最終以參觀富有人文和歷史的古跡了解與感受養(yǎng)生文化結(jié)束行程。與此同時(shí)還可以看到,游客對(duì)行程中住宿的需求特別突出,與住酒店相關(guān)的順序事件穿插于各個(gè)環(huán)節(jié)之中,而目的卻不盡相同,如有的游客為了能夠放松身心、有的游客考慮帶小孩方便,還有的游客關(guān)注酒店提供的飲食方面等,說明游客越來越注重對(duì)康養(yǎng)細(xì)節(jié)的體驗(yàn),高品質(zhì)的酒店服務(wù)是游客趨向的核心內(nèi)容之一。
4討論分析
由上述對(duì)康養(yǎng)游記文本的知識(shí)發(fā)現(xiàn)的一系列結(jié)果,可為康養(yǎng)旅游信息需求用戶提供建議和啟示??叼B(yǎng)行程設(shè)計(jì)上可分為4個(gè)主題行程:
第一,以運(yùn)動(dòng)、自然與人文養(yǎng)生相結(jié)合為主題的康養(yǎng)行程,行程設(shè)計(jì)可包括:登山→體驗(yàn)養(yǎng)生歷史→宗教養(yǎng)生,目的地可選擇北京、咸寧等的歷史傳統(tǒng)養(yǎng)生文化游;賀州、麗江等省內(nèi)的少數(shù)民族聚集地景區(qū)中具有民族特色的養(yǎng)生文化游以及以銅川、天柱山為代表的宗教養(yǎng)生游等。
第二,以溫泉養(yǎng)生為目的的生態(tài)主題游。旅游行程主要為:賞景→泡溫泉→特色餐飲。推薦目的地比如惠州、昆明和騰沖等森林溫泉和露天溫泉等特色項(xiàng)目,既能欣賞風(fēng)景,還能在泡完溫泉后品嘗地方特色美食。
第三,以飲食養(yǎng)生為主題游項(xiàng)目。行程如到三亞、廈門等沿海地帶品嘗頗具海港風(fēng)情風(fēng)味的美食,還有尋味廣州、順德等地的粵式餐飲,上海、杭州、南京等地的蘇杭菜式,以及重慶、成都等地的川式辣味等。
第四,以酒店康養(yǎng)為行程的休閑主題游,特色內(nèi)容可包括:住度假酒店→體驗(yàn)休閑項(xiàng)目→下午茶,代表目的地有麗江、長沙、珠海等,對(duì)休閑娛樂項(xiàng)目的體驗(yàn)以及觀海、看日出、賞花等自然風(fēng)光的游覽等,娛樂過后可返回酒店享受精致下午茶等。
在產(chǎn)品和服務(wù)升級(jí)上,可先把文化養(yǎng)生與生態(tài)養(yǎng)生相互融合作為未來發(fā)展的主題,在依托旅游地優(yōu)美的自然風(fēng)光的基礎(chǔ)上,深度挖掘養(yǎng)生歷史、地方特色或宗教養(yǎng)生文化等,讓傳統(tǒng)文化與良好的生態(tài)環(huán)境相結(jié)合,滿足康養(yǎng)旅游者對(duì)觀光、養(yǎng)生和求知的共同需求。其次,養(yǎng)生酒店的產(chǎn)品開發(fā)和服務(wù)提升應(yīng)作為發(fā)展的主線,為了提升景區(qū)游客感知,應(yīng)將溫泉康養(yǎng)和飲食康養(yǎng)貫穿其中;酒店選址和定位方面可選擇位置毗鄰景區(qū),房間設(shè)計(jì)上以自然主題為佳,突出景區(qū)特點(diǎn);還可劃分區(qū)域,設(shè)立功能型康養(yǎng)屋,配備不同的設(shè)施,如溫泉療養(yǎng)屋、生態(tài)或者特色飲食療養(yǎng)屋等。
5結(jié)語
本文借助事理圖譜理論與技術(shù),以康養(yǎng)游記文本為實(shí)驗(yàn)數(shù)據(jù)展開研究。首先找出了康養(yǎng)旅游的熱門目的地、熱門游客行為過程,實(shí)現(xiàn)了與行程相對(duì)應(yīng)的游客行為特征及偏好和趨勢的發(fā)掘。結(jié)果表明,運(yùn)用事理圖譜可直觀、較全面地描述旅游中的事件及事件之間的順承關(guān)系,有利于揭示康養(yǎng)旅行的熱門行程路線以及行程相對(duì)應(yīng)的游客行為的起源、發(fā)生以及發(fā)展趨勢,符合對(duì)康養(yǎng)旅游及其特殊性方面的探索需求,為旅游相關(guān)機(jī)構(gòu)提供決策依據(jù)。本文也存在不足之處,如只選擇了“康養(yǎng)旅游”進(jìn)行分析,由于與其他旅游相比特殊性較多,實(shí)驗(yàn)結(jié)果可能會(huì)有所不同。另外,本文未能按照將關(guān)鍵順序事件與其發(fā)生的具體景點(diǎn)以及體驗(yàn)感知結(jié)合起來等問題都是今后研究的方向。
參考文獻(xiàn)
[1]吳恒,陳燕翎.基于UGC文本挖掘的游客目的地選擇信息研究——以攜程蜜月游記為例[J].情報(bào)科學(xué),2017,35(1):101-105.
[2]趙軍.知識(shí)圖譜[M].北京:高等教育出版社,2018:138-140.
[3]Shi G,Barker K.Extraction of Geospatial Information on the Webfor GIS Applications[C]//IEEE International Conference on Cognitive Informatics and Cognitive Computing 2011,IEEE,2011:41-48
[4]Fujii K,Nanba H,Takezawa T,et al.Enriching Travel Guidebooks with Travel Blog Entries and Archives of Answered Questions[M].Information and Communication Technologies in Tourism 2016.Springer,Cham,2016:157-171.
[5]Hao Q,Cai R,Wang C,et al.Equip Tourists with Knowledge Mined from Travelogues[C]//Proceedings of the 19th International Conference on World Wide Web,2010:401-410.
[6]Xu H,Yuan H,Ma B,et al.Where to Go and What to Play:Towards Summarizing Popular Information from Massive Tourism Blogs[J].Journal of Information Science,2015,41(6):830-854.
[7]高原,施元磊,張蕾,等.基于游記文本的游客游覽行程重構(gòu)[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020,4(Z1):165-172.
[8]Zhu Z,Shou L,Chen K.Get Into the Spirit of a Location By Mining User-generated Travelogues[J].Neurocomputing,2016,204:61-69.
[9]Yuan H,Xu H,Qian Y,et al.Make Your Travel Smarter:Summarizing Urban Tourism Information from Massive Blog Data[J].International Journal of Information Management,2016,36(6):1306-1319.
[10]Guo L,Li Z,Sun W.Understanding Travel Destinations from Structured Tourism Blogs[C]//Proceedings of 2015 Wuhan International Conference on e-Business,2015:144-151.
[11]王昕天,汪雷.基于文本挖掘的在線旅游熱詞情報(bào)分析——以攜程網(wǎng)為例[J].情報(bào)理論與實(shí)踐,2017,40(11):105-109.
[12]呂琳露,李亞婷.游記文本中的知識(shí)發(fā)現(xiàn)與聚合——以螞蜂窩旅行網(wǎng)杭州游記為例[J].情報(bào)雜志,2017,36(7):110,176-181.
[13]瞿華,梁燕坤.基于網(wǎng)絡(luò)游記的廣州旅游目的地形象感知研究[J].廣東社會(huì)科學(xué),2017,(6):202-209.
[14]張瑛,史凱靜,劉建峰.基于網(wǎng)絡(luò)游記的大運(yùn)河文化遺產(chǎn)游客感知研究[J].地域研究與開發(fā),2020,39(4):79-85.
[15]Ding X,Li Z,Liu T,et al.ELG:An Event Logic Graph[EB/OL].https://arxiv.org/abs/1907.08015,2019-08-07.
[16]單曉紅,龐世紅,劉曉燕,等.基于事理圖譜的網(wǎng)絡(luò)輿情事件預(yù)測方法研究[J].情報(bào)理論與實(shí)踐,2020,43(10):165-170,156.
[17]白璐,周子雅,李斌陽,等.面向政治領(lǐng)域的事理圖譜構(gòu)建[J].中文信息學(xué)報(bào),2021,35(4):66-74,82.
[18]夏立新,陳健瑤,余華娟.基于事理圖譜的多維特征網(wǎng)絡(luò)輿情事件可視化摘要生成研究[J].情報(bào)理論與實(shí)踐,2020,43(10):157-164.
[19]田依林,李星.基于事理圖譜的新冠肺炎疫情網(wǎng)絡(luò)輿情演化路徑分析[J].情報(bào)理論與實(shí)踐,2021,44(3):76-83.
[20]Liu H Y.Causality Event Extraction[EB/OL].https://github.com/liuhuanyong/CausalityEventExtraction,2020-12-15.
[21]肖明.圖書館學(xué)情報(bào)學(xué)知識(shí)圖譜研究理論、方法與應(yīng)用[M].北京:中國書籍出版社,2017:154-155.
(責(zé)任編輯:郭沫含)