張學民 趙明宇
摘 要: 綜合利用旅游網站的游客評論數據,運用LDA主題模型和Python的SnowNLP模塊對所得樣本進行主題分類和情感傾向分析,從游客感知視角分析影響西塘古鎮(zhèn)旅游形象的感知因素。研究結果表明:游客對西塘古鎮(zhèn)旅游形象的感知因素有古鎮(zhèn)文化、自然風光、入口服務、飲食文化、商業(yè)化程度、公共設施6個方面。游客評論的正面情感傾向占比為78.8%,說明游客對西塘古鎮(zhèn)旅游形象的總體感知比較滿意。在西塘古鎮(zhèn)旅游形象感知因素中,游客對入口服務、商業(yè)化程度以及公共設施三個方面的滿意度明顯不足,好評率都在75%以下。西塘古鎮(zhèn)應制定合理的定價策略,改善入口服務,完善公共設施,充分發(fā)揮項目優(yōu)勢,才能在眾多古鎮(zhèn)中脫穎而出。
關鍵詞:游客評論;LDA主題模型;情感分析;西塘古鎮(zhèn) ;旅游形象
中圖分類號:F426.4? ?文獻標志碼:A? ?文章編號:1674-7356(2020)-03-0023-08
隨著我國社會的進步和經濟的發(fā)展,人們的生活水平不斷提高,帶薪節(jié)假日的增加也加快了旅游業(yè)的發(fā)展,我國已邁入全民旅游時代。在眾多旅游類型中,古鎮(zhèn)旅游憑借其燦爛的歷史文化和獨特的人文景觀吸引了大量旅游者。以古鎮(zhèn)接待旅游者人次數為例,2016年西塘古鎮(zhèn)游客接待量達到778萬人次,比2012年增加了300萬人次。2017年十一黃金周烏鎮(zhèn)接待旅游者人次數為49.9萬人次,同比增長2.68%,可見古鎮(zhèn)旅游深受游客青睞。西塘古鎮(zhèn)是江南六大古鎮(zhèn)之一,地處江浙滬三省市交界處的浙江省嘉興市嘉善縣,東臨上海,西依杭州,北靠江蘇,且與三市距離均在100公里左右,交通發(fā)達,地理區(qū)位優(yōu)勢明顯。西塘古鎮(zhèn)具有深厚的歷史文化底蘊,完好地保存著明清時期的古宅建筑,總面積達到25萬余平方米。大量居民依然在古鎮(zhèn)生活,保留著傳統(tǒng)的水鄉(xiāng)風情,因此,西塘古鎮(zhèn)有著“生活著的千年古鎮(zhèn)”的美譽。2003年,西塘古鎮(zhèn)被命名為中國歷史文化名鎮(zhèn)。2017年,西塘古鎮(zhèn)新晉為5A級旅游景區(qū),同年 11月,在第三屆中國古村鎮(zhèn)大會上被授予“2017年度最受網民喜愛的十大古村鎮(zhèn)”稱號。國內學者對西塘古鎮(zhèn)也進行了相應研究,呂麗輝和陳瑛以西塘古鎮(zhèn)為例,結合實際訪談和問卷調查,采用模糊綜合評價法對我國文化遺產地游客滿意度進行實證研究[1]。陳煒等人通過問卷調查法對西塘古鎮(zhèn)旅游服務質量進行了研究,發(fā)現游客對西塘古鎮(zhèn)旅游服務質量總體評價不高[2]。嚴銳和夏柔玥通過實地觀察法、問卷調查法和訪談調查法對西塘和周莊的商業(yè)化現象進行分析,并提出了相應的發(fā)展對策[3]。
我國旅游業(yè)的快速發(fā)展和互聯網的廣泛普及使旅游電商成為發(fā)展最快的電商領域。國家旅游局2017年8月發(fā)布的《2017年全域旅游發(fā)展報告》顯示,在眾多電商領域中,旅游電商增長速度最快。2016年,我國旅游消費規(guī)模達到5.5萬億元,其中在線旅游消費占比為20%?,F階段,一大批與旅游相關的網站快速發(fā)展,如國外網站:TripAdvisor、Priceline、Travel、Hotels、TravelZoo 等,國內網站:百度旅游網、攜程旅行網、同程旅游網、馬蜂窩、驢媽媽等。游客不僅可以通過其他人發(fā)布的景點圖片和評論了解景點信息,也能夠分享自己的旅行經驗并對景點進行點評,供其他游客參考。在這些旅游網站中,游客生成大量文本評論數據,這為旅游經營者改善旅游服務提供了重要契機。然而,旅游網站的評論數據數量龐大,評論數據質量良莠摻雜,如何在海量數據中提取有價值的信息并加以利用,成為被學術界廣泛關注的話題。
隨著網絡時代的到來,國外學者開始通過網絡數據對旅游形象進行研究。Choi等人通過對網站的評論文本數據和圖片數據進行分析,研究了澳門的旅游目的地形象[4]。Bing和Xiang通過對游客網上搜索的關鍵詞進行分析,研究語言結構與旅游目的地形象的關系[5]。K?觟ltringer和Dickinger在網絡上搜集了5 719個相關文檔,對其進行文本挖掘與分析,得到某目的地品牌形象內容[6]。Kladou和Mavragani在Trip Advisor 網上搜集了游客評論的文本數據,構建了旅游目的地形象的評估體系并對其進行評估[7]。國內學者對該領域關注較晚,尤其是對古鎮(zhèn)旅游形象的研究還較為零散。滕夢秦運用層次分析法對鳳凰古城與鎮(zhèn)遠古鎮(zhèn)的旅游效應進行評價,論證毗鄰旅游地空間替代性作用的存在[8]。孫旭通過問卷調查,對浙江古鎮(zhèn)旅游形象的游客心理認知評價進行分析,找出制約浙江古鎮(zhèn)旅游形象深度塑造和提升的關鍵問題[9]。徐薛艷等人運用VEP 實驗法來獲得上海楓涇古鎮(zhèn)旅游感知意向,但該方法受制于研究樣本數量并且依賴于主觀判斷,研究結果的可靠性和可重復性都受到考驗[10]。馬媛媛通過對到訪旅游者進行問卷調查,分析蜀河古鎮(zhèn)的旅游競爭力[11]。董癑和徐薛艷通過Web2.0圖片交互平臺進行游客旅游意象分析[12],但是數據不夠完整,研究方法以及各種條件存在局限性[13]。王懿和黃震方采用問卷調查法,調查游客對同里古鎮(zhèn)文化旅游品牌的感知情況,提出古鎮(zhèn)文化旅游品牌的營銷策略[14]。
可見,國外學者針對旅游電商平臺的游客評論文本數據有較為豐富和深入的研究,但對中國旅游電商平臺的用戶評論數據缺乏關注。國內學者在古鎮(zhèn)旅游形象領域也有相應的研究,但大多數采取問卷調查的方法。問卷調查法雖然具有效率高、方便展開研究工作的優(yōu)點,但同時也容易受到研究人員的主觀影響,問卷設計的嚴謹性以及問卷發(fā)放的科學性都會對研究結果產生較大的影響?;诖耍狙芯坎捎肔DA主題模型和情感分析算法對從旅游電商平臺爬取的游客評論文本進行分析。以游客感知為視角分析西塘古鎮(zhèn)的旅游形象,提取隱藏的文本主題信息,確定影響游客感知的關鍵因素。
一、研究流程和算法設計
(一)研究流程
旅游電商平臺的游客評論數據是由游客旅行結束后根據自身的真實感受進行的自發(fā)評論,具有較強的真實性和主觀性。由此,本研究采用文本挖掘技術對游客網絡評論文本進行挖掘和分析。
首先,利用GooSeeker(集搜客)網頁爬取軟件,以“西塘”、 “西塘古鎮(zhèn)”為關鍵詞在主要旅游電商平臺進行評論文本數據的抓取采集,并對獲取的評論數據進行分詞和清洗。其次,以采集的網絡評論數據為基礎,進行實證分析。運用Python的gensim模塊對經過數據預處理的文本數據實現LDA 主題模型建模,得到影響游客感知的關鍵因素。再次,運用Python的SnowNLP模塊對評論文本進行情感傾向分析,將評論文本劃分為正面評論和負面評論,得到游客對西塘古鎮(zhèn)旅游形象的整體情感傾向。最后,基于LDA主題模型和情感分析結果得到游客對每個感知因素的好評率,從而提出提升西塘古鎮(zhèn)旅游形象的發(fā)展對策。
(二)基于LDA模型的主題分析
1. LDA主題模型
LDA(Latent Dirichlet Allocation)主題模型是Blei在狄利克雷過程的基礎上提出的一種概率生成模型[15]。 LDA主題模型也是一種詞袋模型,同時它也是一種非監(jiān)督的機器學習技術,在進行訓練時不需要對訓練集進行人工標注。該模型認為每篇文檔包含多個不同的主題,這些主題以一定概率進行混合形成一篇文檔,而每個主題又包含多個不同的詞,這些詞以一定概率進行混合形成主題。由此,形成了服從Dirichlet分布的文檔的主題分布和主題的詞分布。LDA主題模型生成一篇文檔的過程如圖1所示,在文檔生成過程中的變量和參數如表1所示。
首先,隨機抽取每篇文檔的混合主題概率θm,θm服從先驗參數為α的Dirichlet分布。其次,隨機抽取各個詞語在主題k下出現的概率φk,φk服從先驗參數為β的Dirichlet分布。最后,根據θm抽取當前單詞所代表的主題zm,根據 p(wm, n|φk, zm, n)抽取具體的單詞 wn,以wm = {wm, n}■■代表一篇文檔m,以zm = {zm, n?代表文檔m中的每個詞匯所對應的主題。那么根據圖1所描述的LDA主題模型生成一篇文檔的過程,該模型所有變量之間的聯合概率分布可以表示為:
p(wm, zm, θm, φ|α, β) =
p(φ|β) p(wm, n | φzm, n ) p(zm, n | θm) p(θm | α)(1)
對于單個文檔wm,其概率可表示為:
p(wm |α, β) =? ? ?p(θm | α) p(?準 | β)
p(wm, n | θm,φ)dφdθm(2)
因此,整個文檔集W={wm}的生成概率可以按如下公式計算:
p(W|α, β) = ?p(wm | α, β)(3)
一篇文檔和文檔中所包含的詞匯是確定的,要根據LDA的核心理論即式(1) (2) (3)來求解文檔的主題分布和主題的詞分布中的未知變量θm和φk。一般采用變分法[16]5230、期望傳播[17]和吉布斯抽樣法[16]5229來對參數進行估計。其中,吉布斯抽樣法的原理易理解實現簡單,并且該方法的應用較為廣泛。由此,本研究選用吉布斯抽樣法進行LDA主題模型的參數計算。
2. 確定主題數量
主題模型的主題數量對最終的主題分類結果具有顯著影響,本文確定最佳主題數量的方法如下。
首先假設主題模型的主題數量為n,然后進行主題模型訓練,觀察得到的主題模型訓練結果。判斷各主題關鍵詞關聯程度強弱,若主題關鍵詞關聯程度強則增加主題數量n,若主題關鍵詞關聯程度弱則減少主題數量n,重復上述過程直到確定最佳主題數量。
(三)基于情感分析的整體評論分析
情感分析是對所獲取的評論文本數據進行語義挖掘和傾向性分析,它將評論文本數據分為正面情感評論和負面情感評論。本研究利用 Python 軟件的 SnowNLP 模塊對文本數據進行處理,SnowNLP 模塊利用樸素貝葉斯原理對數據進行訓練和預測。文本是正面傾向的概率即為P(C)與文本在類別C中的條件概率的乘積:
P = P(C)P(di | C) =
P(C)(count(di, C)/TC)(4)
公式(4)中,count(di, C)表示詞條di 在C中出現的次數,TC 表示正面文本C 包含的詞條總數,n是進行分類文本中詞組的數量。在SnowNLP 模塊中,當正面情感的概率 P ≥ 0.5時認為該評論為正面情感評論,P < 0.5時則為負面情感評論。SnowNLP 模塊會逐一計算每一條文本的正面情感概率。
本研究通過對所有游客評論進行情感分析,計算所有評論情感傾向的均值與方差。情感傾向均值體現了游客對于西塘古鎮(zhèn)旅游形象的一個整體感知水平,情感分數方差表示游客對古鎮(zhèn)形象感知的差異性水平。通過對LDA主題分類結果進行情感分析,得到不同主題分類下游客的情感傾向結果,從而挖掘提高古鎮(zhèn)旅游形象的策略。
二、數據采集和預處理
(一)數據采集
本文采用網頁爬取軟件GooSeeker(集搜客)對旅游電商平臺的游客評論文本數據進行爬取,該款工具利用Mozilla平臺的能力,只要是Firefox查詢到的信息,它都能提取。另外,在滿足數據爬取效果的基礎上其操作簡單易上手。利用GooSeeker網頁爬取軟件進行數據爬取操作后,數據默認以XML格式存放。將爬取到的XML格式的數據通過GooSeeker網頁爬取軟件的自有功能轉換為Excel數據,最終完成數據采集工作。具體游客網絡評論的數據構成如表2所示。
(二)數據預處理
1. 數據清洗
從旅游電商平臺抓取的數據內容不僅包含研究需要的文本數據,還包括那些諸如網址、表情符號等其他無價值的噪聲數據。此時,就需要利用正則表達式對噪聲數據進行過濾,去除影響文本挖掘結果的干擾信息,保留研究所需的文本數據。在對旅游電商平臺的游客評論數據進行抓取時,應注意中文編碼格式,常用的幾種中文編碼格式有:Unicode編碼、UTF-8編碼和GB2312編碼等。然后將過濾清洗好的文本數據以統(tǒng)一的中文編碼格式進行保存。
2. 中文分詞
對于上文所得到的初始文本數據并不能直接輸入 LDA 主題模型。在這些初始有效信息中仍然存在干擾詞匯影響 LDA 模型提取主題的效率,需要進一步對其進行分詞處理。在英文中,單詞與單詞之間是由空格隔開的,但漢語中的詞與詞之間并不存在分隔符,中文自身的特點就加大了分詞的難度。該領域的研究者已經研發(fā)出很多開源的中文分詞工具,常用的開源分詞工具有:盤古分詞、庖丁中文分詞、IKAnalyzer 、結巴分詞等。本研究對文本數據的挖掘與分析是通過Python語言編寫實現,由于結巴分詞是Python語言開發(fā)的中文分詞模塊,具有分詞精度高和使用簡單的特點,因此本文選用結巴分詞工具進行中文分詞。
3. 刪除停用詞
對經過分詞后的文本數據進行分析,數據中存在大量詞頻較高但并無實際含義的詞,比如“的”、“是”、 “這些”、 “那些”等,這類詞被稱為停用詞。這些詞語在大多數文檔中高頻出現,但不能對文檔的分類提供有用的信息。因此,為了提高模型效率,應當對評論文本數據的停用詞進行過濾,再進行后續(xù)的文本挖掘工作。
本文由于后續(xù)的實際分析需要將采用不同的去除停詞策略。第一種策略針對主題模型,通過網絡獲得包含常用停用詞的中文停用詞表,而結巴分詞也有著自己的停用詞詞庫,將兩者整合之后的停用詞作為新的停用詞詞庫。第二種策略針對情感分析,在第一種策略構建的停用詞詞庫中剔除情感詞、程度副詞以及否定詞,從而降低信息損失對情感分析結果的影響。
三、數據分析
(一)基于TF-IDF的詞頻分析
本文采用TF-IDF(term frequency inverse document frequency)方法來計算游客網絡評論的特征項權重。TF(Term Frequency)表示某個詞條t的出現頻率,IDF(Inverse Document Frequency)用來衡量詞條t的普遍重要性。TF-IDF的計算公式為:
TFIDF = TF × IDF(5)
運用Python的Gensim包對文本數據進行特征權重計算,最終得到評論文本詞頻權重排名前45的詞條如表3所示。
對評論文本數據運用Python中的wordcloud模塊進行詞云分析。
由詞頻權重統(tǒng)計結果我們可以看出,由于本研究在數據采集過程中以“西塘”、 “西塘古鎮(zhèn)”為關鍵詞進行數據爬取,所以“西塘”的詞頻最高為14 994?!肮沛?zhèn)”、 “水鄉(xiāng)”、 “江南”則是游客對本文研究對象的整體印象描述,說明西塘古鎮(zhèn)符合游客心目中江南水鄉(xiāng)的基本特色。除了表示本文研究對象的詞匯之外, “商業(yè)化”一詞也有較高的詞頻,旅游資源過度開發(fā)使古鎮(zhèn)的發(fā)展模式趨同,降低了游客旅游體驗的滿意度。西塘古鎮(zhèn)擁有中國酒文化博物館,更被譽為 “酒鎮(zhèn)”,所以 “酒吧”的出現頻率也很高?!靶〕浴币辉~位于詞頻排名第10位,古鎮(zhèn)的特色小吃反映了古鎮(zhèn)的飲食文化,是吸引游客的重要特色。入口服務方面的“門票”、“價格”、 “停車場”等出現頻率較高,說明游客對西塘古鎮(zhèn)的門票價格較為敏感,對入口停車場管理和交通情況都有較高的關注?!盀蹑?zhèn)”在詞頻排名中排第14位,大概是由于烏鎮(zhèn)與西塘有相似的江南古鎮(zhèn)特征,來到西塘游玩的游客會聯想到烏鎮(zhèn)并與其進行比較。在自然環(huán)境方面, “寧靜”、 “優(yōu)美”、 “安靜”是評論中比較突出的詞匯。其次,反映游客旅游體驗特征的詞匯頻次也較高,比如 “感受”、 “開心”等。從游客對自然環(huán)境以及體驗描述的詞匯來看,大部分游客對西塘古鎮(zhèn)的總體態(tài)度都是比較正面的。
(二)LDA主題模型建模
對經過數據預處理工作的評論文本進行LDA主題模型建模,采用前文提到的主題數量確定方法,確定主題個數K = 6。采取先驗值α = 0.5,β = 0.1,吉布斯抽樣的迭代次數設置為100次。最后,得到的評論文本主題分類結果如表4所示(篇幅限制,僅列出10個主題詞)。
LDA主題模型的分類結果顯示,游客對西塘古鎮(zhèn)旅游形象的感知因素有古鎮(zhèn)文化、自然風光、入口服務、飲食文化、商業(yè)化程度以及公共設施6個方面,具有多面性和復雜性。
西塘古鎮(zhèn)的門票價格,停車場的收費制度以及交通情況都包含在游客對古鎮(zhèn)入口服務方面的感知內,這些都對游客的旅游體驗產生了重要影響。從LDA模型得到的主題分類結果可以看出,烏鎮(zhèn)、周莊也都被提及,說明它們有著些許相似的古鎮(zhèn)風貌。另外, “古樸”、 “風情”等詞表現出游客對古鎮(zhèn)文化方面的感知,而“寧靜”、 “優(yōu)美”、 “小橋流水”等詞則是游客對西塘古鎮(zhèn)自然風光方面的描述。西塘古鎮(zhèn)“小橋流水人家”的自然風光和古色古香的文化氣息受到國內外游客的青睞?!敖ㄖ?、 “弄堂”、“根雕”等詞是游客對西塘古鎮(zhèn)特色建筑以及古鎮(zhèn)文化方面的感知,古鎮(zhèn)可以抓住這一特色開發(fā)特色旅游產品,營造濃厚的歷史文化氛圍。西塘古鎮(zhèn)的飲食也是游客感知評價較多的方面, “芡實”、 “臭豆腐”、 “餛飩”等多被提及。
(三)基于SnowNLP模塊的情感傾向分析
運用Python的SnowNLP模塊實現前文所述基本算法,針對總體評論語句進行情感傾向分析。對情感傾向值進行統(tǒng)計,最后得到結果如表5所示。
從表中可以看出,基于游客評論總體,情感傾向為正面的游客評論最多,占到評論總體的78.8%。積極情感傾向評論的均值為0.86,方差為0.25。消極情感傾向評論的均值0.23,方差為0.37。
按照LDA建模得出的主題分類進行情感傾向分析,得到各主題積極情感傾向占比如圖2所示。通過得到的西塘古鎮(zhèn)游客評論各主題積極情感傾向占比可知,六個主題的積極情感傾向占比均在50%以上,說明游客對西塘古鎮(zhèn)的總體態(tài)度都是比較滿意的。其中,入口服務的積極情感傾向占比最低,僅有62.78%。景區(qū)應合理調控景區(qū)票價,改進停車場管理制度,提高游客對景區(qū)入口服務方面的滿意度。另一方面,古鎮(zhèn)公共設施的好評率也在70%以下,景區(qū)應完善公共設施建設,實現古鎮(zhèn)的可持續(xù)健康發(fā)展。相較于其他主題而言,游客對西塘古鎮(zhèn)的商業(yè)化程度方面滿意度也表現出明顯不足。西塘古鎮(zhèn)的商業(yè)化程度較高,游客無法完全體驗當地的風土人情。西塘古鎮(zhèn)的飲食文化、自然風光以及古鎮(zhèn)文化好評率均在80%以上,說明西塘以其獨特的水鄉(xiāng)風貌、優(yōu)美的自然景觀以及深厚的歷史文化底蘊吸引了大量游客。
四、發(fā)展對策
(一)改善入口服務
研究結果表明,游客對入口服務的正向情感傾向比重明顯低于其他主題。景區(qū)應制定合理的定價策略,如實行差別定價策略,在景區(qū)可以接受的范圍內,相同的旅游項目對不同的游客如普通游客、兒童、70 歲以上的年老者、殘疾人、現役軍人等定義不同的價格標準。在節(jié)假日等旅游旺季,票價定為全價,但在平時如寒暑假等旅游淡季,票價就要適當下降來吸引游客。對不同購票渠道采用差別定價,給予提前預訂的網絡購票一定折扣,刺激消費。此外,景區(qū)還可將票價與旅游商品和服務相結合,如實行捆綁定價策略,與不同旅游商品進行捆綁實現優(yōu)惠定價。同時,景區(qū)可實行組合定價策略,主要針對異地游客的全面服務等。這些定價策略既能使游客享受到優(yōu)惠的旅游價格并且游玩盡興,也能確保旅游景區(qū)收入和效益的更大化。
另一方面,景區(qū)應對停車場的停車管理問題進行改進,最大限度為出行游客帶來方便,提升游客的滿意度。首先,增加停車場的綠化,將景區(qū)的標志圖案運用到停車場內標識牌、路燈桿、垃圾箱等設施,讓停車場變成景區(qū)的一道景觀。其次,加大對景區(qū)內摩托車、電瓶車、三輪車等機動車輛亂停放情況的巡查力度及整治力度,使游客能夠便捷進出。最后,適當調整停車場收費制度,做到合理收費,提升游客旅游體驗滿意度。
(二)開發(fā)特色旅游產品
通過對游客評論數據進行分析發(fā)現西塘古鎮(zhèn)商業(yè)化程度略高,傳統(tǒng)吳越文化特色產品正在被慢慢淹沒。過度的商業(yè)化,使游客很難看到古鎮(zhèn)內人民的日常生活狀態(tài),鮮有古鎮(zhèn)人民生活氛圍,就無法體驗當地的風土人情。情感分析結果顯示游客積極情感傾向占比最高的兩個主題是飲食文化和自然風光,西塘應該繼續(xù)加強和完善其優(yōu)勢項目,突出本地特色。西塘古鎮(zhèn)被譽為“酒鎮(zhèn)”,更是中國酒文化博物館的所在地,西塘黃酒也是國宴用酒之一。西塘古鎮(zhèn)可以推出體驗環(huán)節(jié),如使游客參與黃酒的釀造過程并對其進行品嘗。這些都是對當地生活體驗的一個重要內容,尤其對于北方游客來講,這些在北方不常見的生活場景一定會給游客留下深刻的印象。西塘的鎮(zhèn)花是杜鵑花,西塘古鎮(zhèn)素有“杜鵑花之鄉(xiāng)”的美稱。因此,可以在旅游旺季每年舉辦一次“西塘杜鵑花花魁賽”,鼓勵家里養(yǎng)杜鵑花的西塘人拿出家里最好的杜鵑花參加比賽,既可以為景區(qū)增添風采、吸引游客,又能為景區(qū)增加濃濃的文化氛圍。
西塘的古建筑大多依水而建,共有24座石橋和122條巷弄,具有橋多、弄多、廊棚多的特點。古鎮(zhèn)內水網密集,河道縱橫,形成“三橫一豎”的水網格局,如圖3所示。西塘古鎮(zhèn)將鎮(zhèn)內主要幾條水系作為游船線路,古鎮(zhèn)可利用游船項目對田歌進行宣傳。田歌是嘉善地區(qū)寶貴的民族音樂文化遺產,田歌又稱吳地歌曲、子夜歌,是嘉善民間流傳下來的農村民歌,主要是農民在農忙時唱的歌。將田歌開發(fā)為特色旅游產品,在游客游船時由艄公演唱,使游客可以邊游船,邊聽田歌,感受西塘古鎮(zhèn)濃郁的水鄉(xiāng)農村特色文化。此外,為田歌塑造文化背景,將其打造為有來歷、有典故的特色旅游產品,使其更有深度,從而為西塘古鎮(zhèn)營造濃厚的文化氛圍,可以開發(fā)更大的旅游市場。
(三)完善景區(qū)公共設施及管理服務
景區(qū)在開發(fā)特色旅游產品的同時還應關注景區(qū)公共設施及管理服務。首先,對核心區(qū)進出口進行改進。在景區(qū)核心區(qū)內增加局部導覽圖的數量,在景區(qū)主要交叉路口、游覽步道節(jié)點處增設導覽圖,增加景點、橋梁及文保點的景物介紹牌。在景區(qū)關鍵節(jié)點、斷頭道路、施工道路等處設置溫馨提示牌,提示牌的提示文字要做到清晰、醒目。完善景區(qū)的標識系統(tǒng),在景區(qū)核心區(qū)的進出口增加出入口的標識設置。在游客中心入口外側、旅游景點、無障礙設施及其他公共設施(如游客活動場所、餐飲場所、購物場所、急救場所、公用電話等)入口的頂部或者門側設置相應的位置標志。在旅游景點、居民客棧、購物商店和旅游廁所等設立方向指示牌。對上述標示牌增加夜景效果,便于游客夜間游覽。其次,建立景區(qū)標識系統(tǒng)巡查和維護保養(yǎng)制度。分片區(qū)或落實專人進行管理維護,及時修補破損的標識牌,增加缺失標識牌,確保標識牌無破損并且指示準確。再次,健全景區(qū)衛(wèi)生及設施管理制度,加強對清掃人員管理,全面整頓場地秩序,消除景區(qū)及緩沖區(qū)內的亂堆、亂放現象。尤其要清理和整治街區(qū)內居民生活物品,商鋪周邊的雜物以及散落在各角落的建筑垃圾等。針對景區(qū)商鋪人員以及餐廳客棧經營人員進行培訓,定期對水面進行清理,保持水質清澈,禁止居民向河內倒入泔水及生活垃圾。提高衛(wèi)生素質和服務水平,對餐廚垃圾、廢物進行科學分類、收集和處理。最后,加強對建筑的保護措施,將部分街巷破損的墻體進行維修,修復脫落墻面,保持街道景觀空間的完整和輪廓線優(yōu)美。
(四)加大宣傳力度
西塘有著得天獨厚的氣候條件和深厚的歷史文化底蘊。西塘古鎮(zhèn)地處江南魚米之鄉(xiāng),江南多雨,空氣濕潤且質量好,相對北方的干燥氣候和近年來肆虐的霧霾,南方濕潤清新的空氣會給游客帶來良好的旅游體驗。為了讓更多人認識和了解西塘,還應加大對西塘古鎮(zhèn)的宣傳力度。首先,可以利用社交軟件微信的傳播能力,經營微信公眾號,制作與西塘相關的微信表情包,使公眾產生來西塘旅游的動機和欲望,進而產生旅游的行為。其次,豐富西塘古鎮(zhèn)官網,細化網站關于西塘特色的區(qū)塊劃分,使網站內容更豐富,更具有吸引力。最后,還可邀請明星進行代言并拍攝文化宣傳片,塑造西塘古鎮(zhèn)的旅游形象,吸引游客到西塘古鎮(zhèn)旅游,感受別樣的江南風景和文化氛圍。
五、結論
本研究提出了一種基于LDA主題模型和情感傾向分析對游客評論進行挖掘的方法,從而得出影響西塘古鎮(zhèn)旅游形象的感知因素。通過對旅游電商平臺游客生成的海量數據進行分析,保證了選取樣本的客觀性和數據獲取的全面性。研究表明,游客對西塘古鎮(zhèn)的商業(yè)化程度、入口服務以及基礎設施三方面的滿意度較其他方面明顯不足,好評率均在75%以下。但從總體評論情感傾向分析結果來看,游客對西塘古鎮(zhèn)的旅游形象感知呈現積極態(tài)度,積極情感傾向占比為78.8%。另一方面,西塘古鎮(zhèn)的飲食文化、自然風光以及古鎮(zhèn)文化的好評率均在80%以上,說明西塘的飲食、古鎮(zhèn)景觀以及古鎮(zhèn)文化深受游客的青睞。因此,西塘古鎮(zhèn)應繼續(xù)加強完善優(yōu)勢項目,結合自身古鎮(zhèn)文化打造獨特的自然景觀和文化底蘊。另一方面,西塘古鎮(zhèn)應彌補其短板項目,制定合理的定價策略和保護手段,改善古鎮(zhèn)內的公共設施和服務,從而樹立良好的古鎮(zhèn)旅游形象。
本文通過對旅游電商平臺上游客的網絡評論文本進行挖掘分析,取得了一定的成果,但仍然存在不足需要進行進一步的研究。人類的情感具有復雜性和多樣性,而本文情感分析結果只有正面和負面兩個方面,沒有考慮到中性情感,因而無法對其進行全面概括。接下來嘗試將機器學習方法和基于情感詞典的方法相結合,取長補短,完善對評論文本的情感分析。本文完成了對西塘古鎮(zhèn)旅游形象的初步探索,下一步可繼續(xù)探索分析時間因子對古鎮(zhèn)旅游形象的影響以及不同類型游客視角下的西塘古鎮(zhèn)旅游形象,從而制定更加具有針對性的提升古鎮(zhèn)旅游形象的策略。
[參考文獻]
[1]? 呂麗輝,陳瑛. 我國文化遺產地游客滿意度的實證研究——以西塘古鎮(zhèn)為例[J]. 生產力研究,2016(9):81-85.
[2]? 陳煒,高翔,張萍. 基于游客感知的嘉善縣西塘古鎮(zhèn)旅游服務質量研究[J]. 廣西科技師范學院學報,2016,31(4):89-94.
[3]? 嚴銳,夏柔玥. 江南地區(qū)古鎮(zhèn)商業(yè)化現象分析及對策——以西塘、周莊為例[J]. 現代營銷(下旬刊),2017(2):130-131.
[4]? Choi S J,Lehto X Y,Morrison A M. Destination image representation on the web: content analysis of Macau travel related websites.[J]. Tourism Management,2007,28(1):118-129.
[5]? Bing P,Xiang L. The long tail of destination image and online marketing[J]. Annals of Tourism Research,2011,38(1):132-152.
[6]? K?觟ltringer C,Dickinger A. Analyzing destination branding and image from online sources: A web content mining approach[J]. Journal of Business Research,2015,68(9):1836-1843.
[7]? Kladou S,Mavragani E. Assessing destination image: An online marketing approach and the case of TripAdvisor[J]. Journal of Destination Marketing & Management,2015,4(3):187-193.
[8]? 滕夢秦. 基于空間競爭關系的古鎮(zhèn)旅游創(chuàng)新發(fā)展策略——以鳳凰古城與鎮(zhèn)遠古鎮(zhèn)為例[J]. 甘肅科技,2017,33(15):4-8.
[9]? 孫旭. 論古鎮(zhèn)旅游形象的提升與維護策略——以浙江省為例[J]. 長江大學學報(社會科學版),2015(8):66-70.
[10]? 徐薛艷,徐暢,高峻. 基于VEP實驗法的江南水鄉(xiāng)古鎮(zhèn)游客感知意象研究——以上海楓涇古鎮(zhèn)為例[J]. 地域研究與開發(fā),2017, 36(5):121-126.
[11]? 馬媛媛. 基于旅游者調查的蜀河古鎮(zhèn)旅游競爭力分析[J]. 旅游縱覽(下半月),2016(8):159-160.
[12]? 董癑,徐薛艷. 基于Web2.0圖片交互平臺的游客旅游意象分析——以楓涇古鎮(zhèn)為例[J]. 旅游論壇,2017,10(2):37-48.
[13]? 高艷,趙振斌,郭瑞斌,等. 基于圖片質性分析的太白山背包客旅游行為研究[J]. 河南科學,2015(4):679-685.
[14]? 王懿,黃震方. 基于游客感知的同里古鎮(zhèn)文化旅游品牌營銷策略研究[J]. 商業(yè)研究,2015(9):179-185.
[15]? Blei D M,Ng A Y,Jordan M I. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research,2003(3): 993-1022.
[16]? Griffiths T L,Steyvers M. Finding scientific topics.[J]. Proc National Academy of Sciences,2004,101(1):5228-5235.
[17]? Minka T,Lafferty J. Expectation-propagation for the generative aspect model[C]//Proceedings of the Eighteenth conference on Uncertainty in artificial intelligence. Morgan Kaufmann Publishers Inc.,2002: 352-359.
Tourism Image of Xitang Ancient Town Based on LDA and Sentiment Analysis
ZHANG Xuemin, ZHAO Mingyu
(School of Economics and Management, Hebei University of Technology, Tianjin 300401, China)
Abstract: This paper focuses on the tourism image perception factors of Xitang ancient town from the perspective of tourist perception through comprehensive analysis of visitors′ comments on travel services websites via LDA topic model to discover topic classification sets and via Python SnowNLP module to analyze the sentiment orientation of visitors′ comments. The results show that the tourism image perception factors of Xitang are composed of ancient town culture, natural scenery, entrance services, diet culture, commercialization degree and public facilities. The positive sentiment orientation of visitors′ comments account for 78.8%, which indicates that visitors are satisfied with the overall tourism image perception of Xitang. In terms of tourism image perception factors of Xitang, tourists′ satisfaction with entrance service, commercialization degree and public facilities is obviously insufficient, and the favorable rate is below 75%. To stand out among the numerous ancient towns, Xitang should formulate a reasonable pricing strategy, improve access services and public facilities and make full use of the advantages of the project.
Key words: visitors′ comments; LDA topic model; sentiment orientation analysis; Xitang ancient town; tourism image