国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于情感文本信息的臺(tái)州府城旅游形象感知建模與分析

2021-01-30 10:18鄭艷艷
關(guān)鍵詞:臺(tái)州景區(qū)文本

陳 盈,鄭艷艷

(臺(tái)州學(xué)院 電子與信息工程學(xué)院,浙江 臺(tái)州 318000)

1 引言

近年來,我國旅游業(yè)發(fā)展十分迅速,已逐漸成為推動(dòng)經(jīng)濟(jì)發(fā)展的重要產(chǎn)業(yè)之一。習(xí)近平同志提出了“和衷共濟(jì)、和合共生是中華民族的歷史基因,也是東方文明的精髓”[1]的全球治理之道,作為千年臺(tái)州府城,臨海傳承的人文精神中天然蘊(yùn)涵和合因子,是臺(tái)州和合文化的重要發(fā)源地。江南長城和紫陽古街保存完好,臺(tái)州府城依山就勢,俯視大江,獨(dú)具江南古城風(fēng)貌,已成功取得創(chuàng)建國家5A級(jí)旅游景區(qū)的“入場券”。

旅游目的地是旅游活動(dòng)的應(yīng)用場景,它一般遠(yuǎn)離游客來源地,其形象是旅游營銷的核心。良好的旅游目的地形象能吸引更多的潛在游客,也能使游客在實(shí)地感受后留下深刻的感知印象。隨著旅游市場的發(fā)展和游客經(jīng)歷的增長,旅游目的地的情感需求已越來越多元化。若游客的實(shí)際旅游體驗(yàn)符合其行前的期望或者超過期望,則會(huì)對(duì)旅游目的地的感知形象產(chǎn)生正向情感傾向;反之,游客可能產(chǎn)生負(fù)向情感傾向。如何提高游客的正向情感傾向,最大限度地滿足其旅游情感需求,使之產(chǎn)生良好的旅游目的地形象感知,是旅游景區(qū)或旅游城市獲得最大化效益的關(guān)鍵問題,也是旅游業(yè)發(fā)展研究中急需解決的問題[2]。為此,本文嘗試對(duì)帶有情感信息的游客評(píng)論文本進(jìn)行主題建模和情感分析,以游客視角感知臺(tái)州府城的旅游形象,以便發(fā)現(xiàn)問題并給出解決方法。

2 情感文本計(jì)算建模

2.1 計(jì)算方法

在傳統(tǒng)的旅游形象研究中,大多采用問卷調(diào)查的方法。雖然數(shù)據(jù)回收效率高,但結(jié)果的主觀因素較高,也容易受到問卷設(shè)計(jì)的科學(xué)性和問卷發(fā)放對(duì)象差異性的影響。隨著4G的廣泛應(yīng)用,通過分析網(wǎng)絡(luò)數(shù)據(jù)對(duì)旅游形象進(jìn)行研究變得可能。張珍珍等人以西安旅游形象感知為例,論證了網(wǎng)絡(luò)文本數(shù)據(jù)在研究城市感知形象方面具有可靠性與代表性[3]。李春萍等人借助軟件分析網(wǎng)絡(luò)文本,面向國內(nèi)外游客對(duì)西安回民街的評(píng)論進(jìn)行詞頻、情感分析,并基于情感形象感知打造差異化的回民街形象和營銷策略[4]。趙劉等人提取了無錫官方的宣傳形象數(shù)據(jù)與游客實(shí)地感知的形象數(shù)據(jù),對(duì)比了宣傳與感知形象的共詞分析、差異分析和情感分析,并提出實(shí)踐對(duì)策[5]。高李想等人通過抓取網(wǎng)絡(luò)文本,以桂林漓江景區(qū)為分析對(duì)象,獲取景區(qū)在游客心中的感知度,為提升和完善旅游形象提供參考[6]。徐錦雅等人以攜程網(wǎng)游客對(duì)漓江景區(qū)網(wǎng)絡(luò)點(diǎn)評(píng)為文本素材,對(duì)漓江景區(qū)影響游客滿意度的11個(gè)主要范疇展開了評(píng)價(jià),并提出相應(yīng)對(duì)策[7]。張學(xué)明等人基于LDA主題模型和游客評(píng)論數(shù)據(jù),對(duì)西塘古鎮(zhèn)的旅游形象進(jìn)行了研究[8]。此外,重慶洪崖洞[9]、山西平遙古城[10]、福建武夷山[11]、浙江烏鎮(zhèn)[12]等地也都做了旅游目的地形象感知方面的工作?;诖?,本文通過情感計(jì)算方法,對(duì)在線抓取的游客評(píng)論文本進(jìn)行分析,以游客感知為視角分析臺(tái)州府城的旅游形象,并針對(duì)影響旅游感知形象的負(fù)面因素給出針對(duì)性提升策略,優(yōu)化臺(tái)州府城旅游形象。

具體過程如圖1所示,包括數(shù)據(jù)采集并進(jìn)行文本挖掘、識(shí)別評(píng)論主題并抽取相關(guān)的觀點(diǎn)要素和分析情感傾向性并進(jìn)行結(jié)果策略探討。

圖1 基于評(píng)論文本的情感計(jì)算方法

2.2 數(shù)據(jù)采集和預(yù)處理

游客通過旅游電商平臺(tái)預(yù)訂門票、住宿,并在結(jié)束后發(fā)表點(diǎn)評(píng)進(jìn)行分享,已經(jīng)變得越來越普遍。每一條點(diǎn)評(píng)都是一位或一組游客對(duì)旅游地的評(píng)價(jià),這些評(píng)論是游客的直觀感受和切身經(jīng)歷,具有強(qiáng)烈的個(gè)人意愿和極高的真實(shí)性、可靠性。

2.2.1 數(shù)據(jù)采集

首先,在相關(guān)旅游電商平臺(tái)以“臺(tái)州府城”為關(guān)鍵詞進(jìn)行旅游景點(diǎn)搜索,利用網(wǎng)絡(luò)爬蟲進(jìn)行用戶評(píng)論抓取以獲得相應(yīng)數(shù)據(jù)。具體數(shù)據(jù)構(gòu)成如表1所示。

表1 用戶評(píng)論數(shù)據(jù)構(gòu)成

從官方平臺(tái)的好評(píng)度情況看,臺(tái)州府城的平均旅游好評(píng)度達(dá)到了95.44%(不含馬蜂窩)。實(shí)際上,游客的評(píng)論數(shù)據(jù)一般是多維度的,往往不只包含一個(gè)層面。有時(shí)候打分比較高,但實(shí)際評(píng)論文字中的情感卻是負(fù)面的。因此,并不能直接依照好評(píng)度來判斷旅游形象。另外,由于評(píng)論文本是非結(jié)構(gòu)化數(shù)據(jù),并不能直接抽取評(píng)論主題及觀點(diǎn),還需要對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理。

2.2.2 數(shù)據(jù)預(yù)處理

從平臺(tái)抓取到的數(shù)據(jù)并不全部都是可用文本,也會(huì)包含一些對(duì)研究無實(shí)際意義的表情符號(hào)、特殊符號(hào)以及不必要的停用詞、英文等。因此,需要對(duì)獲取到的評(píng)論數(shù)據(jù)進(jìn)行預(yù)處理,包括清洗、分詞和去重。

(1)數(shù)據(jù)清洗

利用正則表達(dá)式對(duì)原始數(shù)據(jù)進(jìn)行去噪,如統(tǒng)一對(duì)同一事物的不同表達(dá)方式、設(shè)置專有名詞、錯(cuò)別字處理等,過濾掉會(huì)影響文本挖掘的噪聲信息,保留真正需要的文本數(shù)據(jù)。清洗后的部分?jǐn)?shù)據(jù)如表2所示(考慮到個(gè)人隱私,此處隱去用戶名)。

表2 部分游客評(píng)論數(shù)據(jù)

(2)中文分詞

因?yàn)橹形牡脑~匯之間不存在分隔,為了將數(shù)據(jù)結(jié)構(gòu)化,還需要對(duì)獲得的初始文本數(shù)據(jù)進(jìn)行中文分詞處理。本文使用Python中的jieba庫進(jìn)行分詞。jieba分詞使用簡單且分詞精度高,此外還可構(gòu)建自定義詞典,對(duì)諸如“身份證免票”、“梅園小路”、“后山逃票”等特殊詞匯進(jìn)行準(zhǔn)確切分,以保證分詞準(zhǔn)確度。

(3)去重

經(jīng)過分詞后,中文文本數(shù)據(jù)中依然存在大量詞頻極高、但又無實(shí)際含義的詞,如“啊”“那么”“的”等,統(tǒng)稱為停止詞。停止詞并不能對(duì)特征提取和情感分析提供幫助,需對(duì)其進(jìn)行去除。

本文在后續(xù)的實(shí)際應(yīng)用中,采用了兩種停止詞去除策略。第一種是針對(duì)評(píng)論主題:將網(wǎng)絡(luò)上容易獲取到的常用中文停止詞導(dǎo)入jieba分詞,改進(jìn)jieba分詞的停止詞詞庫;第二種則是針對(duì)情感分析:在基于第一種策略構(gòu)建的新的停止詞詞庫中,刪去情感詞、否定詞和程度副詞,以便降低因?yàn)樵u(píng)論數(shù)據(jù)的信息損失而導(dǎo)致的對(duì)情感分析結(jié)果的負(fù)面影響。

3 數(shù)據(jù)分析

3.1 詞頻分析

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)新詞不斷涌現(xiàn)。在旅游形象評(píng)論中,網(wǎng)絡(luò)新詞雖然出現(xiàn)比較少,但往往更吸引眼球,讓人記憶深刻,比如“大蝦”“驢友”“木油”“稀飯”等。本文采用基于網(wǎng)絡(luò)新詞改進(jìn)的文本分類TFIDF(Term Frequency and Inverse Document Frequency,詞頻-逆文檔頻率)算法來計(jì)算游客網(wǎng)絡(luò)評(píng)論的特征詞權(quán)重[13],這種把網(wǎng)絡(luò)新詞發(fā)現(xiàn)加入文本預(yù)處理的算法,可以顯著優(yōu)化文本分類的結(jié)果。

TF-IDF表示的是TF×IDF,其歸一化的表達(dá)式為wdt=(mdt/Mt)× lg(N/nt+0.01)。其中,mdt表示特征項(xiàng)t在文本d中出現(xiàn)的次數(shù),Mt表示文本d中的詞語總數(shù),N為文本語料庫中的文本總數(shù),nt則是包含特征項(xiàng)t的文本數(shù)。

基于該表達(dá)式對(duì)預(yù)處理后的文本數(shù)據(jù)進(jìn)行特征詞權(quán)重計(jì)算,得到游客評(píng)論文本的詞頻權(quán)重排名結(jié)果。其中,排名前30的詞條如表3所示。對(duì)評(píng)論文本數(shù)據(jù)進(jìn)行詞云分析,結(jié)果如圖2所示。

表3 游客的評(píng)論文本詞頻權(quán)重統(tǒng)計(jì)

圖2 臺(tái)州府城游客評(píng)論詞云圖

3.2 感知因素分析

對(duì)經(jīng)過數(shù)據(jù)預(yù)處理的評(píng)論文本進(jìn)行評(píng)論主題及評(píng)論觀點(diǎn)的抽取,采用LDA(Latent Dirichlet Allocation)模型生成文檔主題,以確定主題的個(gè)數(shù)。LDA模型的分類結(jié)果顯示,游客對(duì)臺(tái)州府城旅游形象的感知因素包括旅游入口、商業(yè)化程度、公共服務(wù)、小吃飲食、自然風(fēng)光和府城人文等6個(gè)方面。

從分類結(jié)果看,“戚繼光”、“抗倭”、“倭寇”、“明長城”等詞的頻繁出現(xiàn)是游客對(duì)臺(tái)州府城人文歷史方面的感知,府城可以抓住該特色開發(fā)相應(yīng)產(chǎn)品,營造歷史文化氛圍。

3.3 情感傾向性分析

在游客的評(píng)論文本詞頻權(quán)重統(tǒng)計(jì)結(jié)果中提取高頻詞匯,對(duì)它們進(jìn)行共詞分析、差異分析和詞性分析,再將具有情感傾向性的詞匯分為積極、中性和消極3類。對(duì)處理后的數(shù)據(jù)進(jìn)行情感分析和情感傾向值統(tǒng)計(jì),得到結(jié)果如表4所示。

表4 游客評(píng)論文本情感傾向性統(tǒng)計(jì)

由表4可知,在游客的總體評(píng)論中,情感傾向?yàn)榉e極的游客評(píng)論最多,占到評(píng)論總數(shù)的83.80%。積極情感傾向評(píng)論的均值為0.86,方差為0.27。中性和消極情感傾向評(píng)論占比較小。

游客評(píng)論中各主題積極情感傾向性比例如圖3所示。其中,旅游入口、商業(yè)化程度和公共服務(wù)三方面的滿意度分別為66.70%、65.10%和68.80%,與小吃飲食、自然風(fēng)光和府城人文三個(gè)主題相比差距明顯,可知臺(tái)州府城當(dāng)前在該三個(gè)主題方面還明顯不足。

圖3 游客評(píng)論主題中的積極情感傾向性比例

4 發(fā)展策略

通過計(jì)算得到的臺(tái)州府城游客評(píng)論主題的積極情感傾向性比例可知,游客對(duì)各個(gè)主題的積極情感傾向性評(píng)論的占比均超過60%,說明臺(tái)州府城在游客心中的總體旅游形象是正面的,但需對(duì)三個(gè)存在差距的主題進(jìn)行相應(yīng)的改進(jìn)。

4.1 改善旅游入口服務(wù)

從消極評(píng)論中的具體文本看,有“票價(jià)65”“太貴了”“票價(jià)有點(diǎn)偏貴”“收費(fèi)這么高”等旅游入口緊密相關(guān)的詞匯??梢娋皡^(qū)應(yīng)設(shè)置合理的價(jià)格策略,如實(shí)行差別定價(jià),旺季全價(jià),淡季則適當(dāng)下??;對(duì)不同購票渠道分別定價(jià),給予提前預(yù)訂折扣等。此外,還可將票價(jià)與旅游服務(wù)結(jié)合,如提供表演、講解、特色小吃等。

另一個(gè)和旅游入口服務(wù)緊密相關(guān)的消極詞匯集的關(guān)鍵詞是“停車”。臺(tái)州府城管理方應(yīng)對(duì)停車問題進(jìn)行整體優(yōu)化設(shè)計(jì),最大限度地為外地游客提供出行便捷。一是增加停車場,在景區(qū)周邊劃出專門停車場地,做好醒目的引導(dǎo)標(biāo)識(shí),安排擺渡車,緩解景區(qū)道路擁堵;二是加大對(duì)電瓶車、三輪車等非機(jī)動(dòng)車出行規(guī)范的管理力度和對(duì)亂停車現(xiàn)象的整治力度,做到真正還路于民;三是適當(dāng)調(diào)整停車收費(fèi)額度,同樣嘗試淡旺季差異化收費(fèi)制度,提升自駕游游客的旅游體驗(yàn)。

4.2 開發(fā)特色商業(yè)產(chǎn)品

數(shù)據(jù)分析結(jié)果表明,游客對(duì)臺(tái)州府城商業(yè)化程度的正向情感傾向比重明顯低于其他主題。相對(duì)于其他商業(yè)化程度泛濫的景區(qū),臺(tái)州府城則顯得異?!肮艠恪保踔劣陔y以滿足游客的正常商業(yè)需求。過度商業(yè)化固然會(huì)使游客無法真正深入體驗(yàn)景區(qū)的原始風(fēng)貌,但商業(yè)化不足卻會(huì)導(dǎo)致無法吸引更多的游客。

從游客評(píng)論主題中的積極情感傾向性比例來看,小吃飲食和府城人文兩個(gè)主題占比最高,都有九成滿意度。臺(tái)州府城應(yīng)繼續(xù)加強(qiáng)和完善這兩個(gè)優(yōu)勢主題,進(jìn)一步突出特色,打造商業(yè)化小吃街,把景區(qū)的人文情懷作為亮點(diǎn)。因此可以嘗試將“廣文三絕”和“戚家軍”開發(fā)為特色旅游產(chǎn)品,進(jìn)行適度的商業(yè)化,打造有淵源、有典故的特色商業(yè)化產(chǎn)品,使商業(yè)化旅游有深度和厚重感,從而營造商業(yè)化背景下的特色旅游文化,擴(kuò)大市場。

4.3 提升公共服務(wù)水平

在開發(fā)特色商業(yè)產(chǎn)品的同時(shí),需要關(guān)注和提升景區(qū)的公共服務(wù)水平。在“創(chuàng)5A”行動(dòng)的引領(lǐng)下,臺(tái)州府城進(jìn)行了大面積的基礎(chǔ)設(shè)施改造,但相應(yīng)的公共服務(wù)水平顯然未能及時(shí)跟上。

從游客評(píng)論看,景區(qū)存在破損或缺失標(biāo)識(shí)牌、指示標(biāo)志脫落、建筑垃圾散落及公共衛(wèi)生差的問題。需要健全景區(qū)管理人員巡視制度,針對(duì)景區(qū)常住人口和商業(yè)從業(yè)人員進(jìn)行宣講和培訓(xùn),提高工作人員服務(wù)素養(yǎng),加強(qiáng)細(xì)節(jié)服務(wù)的水平。

此外,還需加大宣傳力度。臺(tái)州府城有極其深厚的歷史文化底蘊(yùn)和得天獨(dú)厚的自然風(fēng)光,可以利用社交媒體打造網(wǎng)紅景區(qū),塑造和優(yōu)化府城優(yōu)秀旅游形象,吸引游客感受別樣的古城風(fēng)景和文化。

5 結(jié)語

本文提出了一種針對(duì)游客評(píng)論的情感文本信息進(jìn)行建模和分析的方法,從而獲取影響臺(tái)州府城旅游形象的感知因素。通過對(duì)排名靠前的旅游電商平臺(tái)上臺(tái)州府城相關(guān)的游客評(píng)論數(shù)據(jù)的抓取和預(yù)處理,對(duì)其進(jìn)行評(píng)論主題及觀點(diǎn)的抽取和情感分析。實(shí)驗(yàn)分析表明,游客對(duì)旅游入口、特色商業(yè)以及基礎(chǔ)服務(wù)三方面滿意度不足,好評(píng)率較低。但從整體積極情感傾向性評(píng)論占比看,游客對(duì)臺(tái)州府城的旅游形象感知呈現(xiàn)積極態(tài)度。一方面,臺(tái)州府城的小吃飲食、自然風(fēng)光和府城人文三個(gè)主題的好評(píng)率均在80%以上,說明臺(tái)州府城的飲食、景觀和歷史人文深受游客喜愛。府城應(yīng)繼續(xù)深化優(yōu)勢主題,進(jìn)一步結(jié)合自身資源突出打造特色。另一方面,府城應(yīng)盡力修補(bǔ)短板,通過實(shí)施合理策略,樹立優(yōu)秀的旅游感知形象。

通過對(duì)指定景區(qū)游客評(píng)論文本的挖掘進(jìn)行情感分析,文中數(shù)據(jù)量有一定的局限性,后續(xù)將嘗試機(jī)器學(xué)習(xí)的方法進(jìn)行模型訓(xùn)練,在更大數(shù)據(jù)量的支持下,進(jìn)一步提高情感計(jì)算的精度和可靠性。并通過探索游客歸屬地、時(shí)間維度等不同視角下的旅游形象感知,深入探討更具針對(duì)性的旅游形象提升策略。

猜你喜歡
臺(tái)州景區(qū)文本
文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
云南發(fā)布一批公示 10家景區(qū)擬確定為國家4A級(jí)旅游景區(qū)
作為“文本鏈”的元電影
『摘牌』
公益活動(dòng)品牌化,讓媒體更有溫度——臺(tái)州晚報(bào)舉辦“新臺(tái)州人慈善年夜飯”活動(dòng)的實(shí)踐與思考
“摘牌”
某景區(qū)留念
基于doc2vec和TF-IDF的相似文本識(shí)別
臺(tái)州-電鍍廠老板涉嫌環(huán)境污染罪被捕
鲜城| 定远县| 南皮县| 顺义区| 仪征市| 科技| 太原市| 保亭| 平利县| 延安市| 定陶县| 黑河市| 塘沽区| 花垣县| 迁西县| 安庆市| 搜索| 罗定市| 曲沃县| 赣榆县| 长汀县| 锦屏县| 彰武县| 瑞安市| 汝南县| 保德县| 加查县| 泸州市| 商丘市| 黄冈市| 原平市| 曲松县| 保靖县| 邯郸县| 普格县| 南京市| 铜川市| 图们市| 越西县| 历史| 确山县|