国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

情感分析法在旅游研究中的應(yīng)用:回顧與展望

2023-03-06 06:19呂騰捷
旅游縱覽 2023年1期
關(guān)鍵詞:極性旅游業(yè)旅游

呂騰捷

(上??萍即髮W(xué),上海 201210)

引言

大數(shù)據(jù)的使用正迅速進(jìn)入旅游研究領(lǐng)域[1],隨著人們對(duì)實(shí)時(shí)和定制信息的需求日益增加,大數(shù)據(jù)的4個(gè)體征日益與消費(fèi)者研究緊密相關(guān),即規(guī)模性、多樣性、時(shí)效性、準(zhǔn)確性。旅游業(yè)是一個(gè)顧客體驗(yàn)對(duì)其成長(zhǎng)和聲譽(yù)至關(guān)重要的行業(yè),其服務(wù)核心是“以人為本”,即需要在體現(xiàn)人文關(guān)懷的同時(shí)把握和運(yùn)用信息網(wǎng)絡(luò)大數(shù)據(jù),配套電子設(shè)備更新升級(jí),以實(shí)現(xiàn)服務(wù)質(zhì)量的提高。大多數(shù)旅游服務(wù)現(xiàn)在通過在線預(yù)訂網(wǎng)站在互聯(lián)網(wǎng)上獲得[2]。此外,旅行是社交媒體上的主要話題之一。因此,旅游業(yè)被公認(rèn)為在線參與的第一部門是無可厚非的[3]。

基于互聯(lián)網(wǎng)的活動(dòng)都會(huì)留下數(shù)字足跡,因此有必要及時(shí)研究旅游研究者如何利用這些數(shù)據(jù)[4],以及這些新的數(shù)據(jù)是否構(gòu)成了一種新的研究范式的一部分,或包含有新的方法論,并有可能進(jìn)一步促進(jìn)我們對(duì)旅游理論的理解[5-6]。目前,在線數(shù)據(jù)源已被廣泛應(yīng)用于研究,其主要優(yōu)勢(shì)在于,海量且免費(fèi)的數(shù)據(jù)能夠?yàn)槎聪ぢ糜螛I(yè)本身,以及解讀旅游消費(fèi)群體提供嶄新視角。對(duì)比以往的研究,其重點(diǎn)更多關(guān)注商業(yè)戰(zhàn)略發(fā)展創(chuàng)新、產(chǎn)品開發(fā),以及營(yíng)銷行為等,而新的數(shù)據(jù)源的出現(xiàn)為新研究領(lǐng)域的拓展提供了先決條件[7-9]。

在旅游業(yè)這樣一個(gè)基于積極顧客情感和反饋的服務(wù)型產(chǎn)業(yè)中,游客滿意度的概念是至關(guān)重要的。滿意度作為一個(gè)理論化構(gòu)建已經(jīng)被討論和探索了很長(zhǎng)一段時(shí)間,存在著多種操作和測(cè)量的方法,其中,主要依賴于收集來的調(diào)查數(shù)據(jù)[10]。研究表明,基于調(diào)查的方法存在著成本和邏輯方面的不足,以及潛在的公式偏差。由于游客在旅行中往往投入了較多的時(shí)間、精力和其他機(jī)會(huì)成本,因此對(duì)調(diào)查問題的回應(yīng),存在積極評(píng)估傾向的內(nèi)生性問題。最終可能形成一種存在認(rèn)知偏差的結(jié)果[11-12]。針對(duì)特定問題的回答,存在受文化影響或被試偏見導(dǎo)致的結(jié)果誤差,是已有以調(diào)查為基礎(chǔ)的問題研究方法所含有的通病。此外,問卷可能只涵蓋目的地的預(yù)定方面,因而缺乏綜合性。相反,在線用戶生成內(nèi)容(User Generated Content,UGC)的可用性,以及新技術(shù)為研究者提供了一種新的方法,通過“情感分析”可以了解旅行者的感知和可能的滿意度水平[13]。情感分析,一般來說,旨在確定在線UGC中文本文檔、評(píng)論、意見或情感的整體上下文極性,因此極性可以是正的、中性的或負(fù)的。雖然這一方法與旅游業(yè)高度相關(guān),但旅游業(yè)中的情感分析才剛剛開始流行起來[14-15]。

本文的目的是回顧和批判性地考察最新的情感分析方法在旅游研究中的應(yīng)用。為了推進(jìn)對(duì)旅游特定領(lǐng)域的分析,并了解是否基于大數(shù)據(jù)的方法提供了新的研究路徑,本文圍繞這個(gè)主題提出以下問題:情感分析的主要因素和技術(shù)方法是什么?情感分析的多種方法如何被應(yīng)用在旅游的不同方面?情感分析作為一種更廣泛的大數(shù)據(jù)方法的一部分,能否成為一種改善旅游研究方法,增加旅游理論認(rèn)識(shí)的新途徑?

一、情感分析興起的背景和重要意義

(一)旅游業(yè)數(shù)字化背景下數(shù)據(jù)處理需求激增

與互聯(lián)網(wǎng)相關(guān)的技術(shù)變化,已經(jīng)將旅游業(yè)從一個(gè)實(shí)體化的和個(gè)人層面的服務(wù)行業(yè)徹底轉(zhuǎn)變成了一個(gè)數(shù)字化、全方位的旅游服務(wù)網(wǎng)絡(luò)[16]。無論是個(gè)人還是團(tuán)體旅行,從旅游計(jì)劃的形成到個(gè)性化方案的定制和選擇的各個(gè)環(huán)節(jié),個(gè)體都擁有了更多主動(dòng)權(quán)和控制力。除了依靠傳統(tǒng)的平臺(tái)與中介機(jī)構(gòu)收集和獲得信息反饋,還可以與其他擁有類似旅游經(jīng)驗(yàn)的游客建立關(guān)聯(lián),并共享在旅游及其決策中的知識(shí)和體驗(yàn)。旅行者可以通過在線平臺(tái)為其他旅行者提供意見和建議[17-18]。因此,新的互聯(lián)網(wǎng)技術(shù)賦予了那些以前無法發(fā)聲的人發(fā)聲的能力。與旅游和旅游業(yè)有關(guān)的最成功的專業(yè)平臺(tái),如愛彼迎、攜程、貓途鷹等。以貓途鷹為例,該網(wǎng)站每月大約能夠收集并記錄到3.5億個(gè)訪問者信息,產(chǎn)生超過320萬條的評(píng)論,涉及關(guān)于住宿、餐飲、景點(diǎn)等不同類型的數(shù)據(jù)。這些獨(dú)立平臺(tái)所能提供的信息,其價(jià)值和水平,在一定程度上超過了傳統(tǒng)的官方網(wǎng)站或者專業(yè)評(píng)論[19-20]。

除了專業(yè)系統(tǒng)之外,在線社交媒體,如新浪微博、百度貼吧等,在創(chuàng)建電子口碑中起著重要作用[21]。更重要的是,在線社交媒體、旅游專業(yè)網(wǎng)站和平臺(tái),以及微博呈現(xiàn)了多樣的方式來收集游客數(shù)據(jù),增加了旅游者意見反饋的豐富性和真實(shí)性[5]。雖然個(gè)體建議往往是最有影響力的旅行前決策的來源,但互聯(lián)網(wǎng)和社交媒體相對(duì)傳統(tǒng)的口碑來說總體可信度相對(duì)較高[9]。因此,近年親戚、朋友、同事以及官方數(shù)據(jù)也會(huì)從電子口碑中獲取互補(bǔ)性意見。

然而,在線信息的數(shù)量正在以非??斓乃俣仍鲩L(zhǎng),搜索、操縱和聚合這些數(shù)據(jù),以提取關(guān)于游客態(tài)度、行為和體驗(yàn)質(zhì)量的相關(guān)的有用觀點(diǎn),對(duì)旅行者、行業(yè)用戶以及學(xué)術(shù)研究人員來說都是一項(xiàng)煩瑣且耗時(shí)的任務(wù)[22]。為了更有效地分析大量數(shù)據(jù),自動(dòng)化多角度算法和機(jī)器操作系統(tǒng)的需求量不斷增加[23]。

(二)情感分析法逐漸成為旅游業(yè)研究的重要工具

以往文獻(xiàn)中,主要強(qiáng)調(diào)了使用社交媒體數(shù)據(jù)以及數(shù)據(jù)挖掘工具和程序?qū)β糜螛I(yè)研究的重要性。其中,數(shù)據(jù)收集、數(shù)據(jù)清洗、挖掘過程、結(jié)果分析和評(píng)價(jià),是大多數(shù)依靠社會(huì)媒體數(shù)據(jù)對(duì)旅游業(yè)進(jìn)行分析研究的主要步驟。

情感也可以通過自動(dòng)化的機(jī)器來建模,并且集成在各種應(yīng)用中[24]。情感分析是使用計(jì)算語言學(xué)和自然語言處理方法來分析文本并識(shí)別其主體的一種分析方法。雖然情感分析的研究可追溯到20世紀(jì)六七十年代,但近年來它才被越來越多的研究者和實(shí)踐者關(guān)注[25]。這種研究方式的興起是受多方面因素影響的,例如:網(wǎng)絡(luò)和社會(huì)媒體信息的升級(jí)[26];新技術(shù)的演進(jìn),尤其是用于文本分析的機(jī)器學(xué)習(xí)方法;新的商業(yè)模型搭建及信息應(yīng)用軟件的開發(fā)。盡管如此,情感分析與其他早期技術(shù)相比仍處于起步階段,如數(shù)據(jù)挖掘和文本摘要[27]。

本文認(rèn)為,情感分析法可以作為旅游研究的重要工具。雖然對(duì)情感分析法的相關(guān)研究回顧不能為一些具有挑戰(zhàn)性的問題提供最終答案,仍可以通過對(duì)旅游這一特定內(nèi)容的研究,進(jìn)一步探索大數(shù)據(jù)迅速發(fā)展下,傳統(tǒng)“理論-驅(qū)動(dòng)”的研究范式與“數(shù)據(jù)-驅(qū)動(dòng)”模型之間更替抑或共存關(guān)系的可能性。

二、情感分析技術(shù)及其在旅游中的應(yīng)用

(一)情感分析的定義與主要方法

近年來,基于情感取向觀點(diǎn)挖掘的研究多是圍繞居民或市場(chǎng)群體的認(rèn)知和特征展開的,并基于此來討論發(fā)布評(píng)論的內(nèi)容可信度以及動(dòng)機(jī)[15]。不同的領(lǐng)域發(fā)掘了不同的情感分析方法,也包含了少量關(guān)于該主題的文獻(xiàn)回顧式文章,但迄今為止少有以旅游業(yè)為焦點(diǎn)的文獻(xiàn)回顧。

情感分析,特別是關(guān)于客戶評(píng)論的方面,是建立在一定前提下,即通過文本所反映的信息,它可能是主觀的(即固執(zhí)己見的)或客觀的(即事實(shí))。主觀評(píng)論是基于意見、個(gè)人情感、信念和對(duì)實(shí)體或事件的判斷;而客觀的評(píng)論是基于事實(shí)、證據(jù)和可測(cè)量的觀察[14]。消費(fèi)者評(píng)論和社交媒體帖子經(jīng)常反映快樂、沮喪、失望、喜悅和其他感覺[26]。挖掘這些大量的主觀電子口碑對(duì)旅游組織尋求改善客戶管理和商業(yè)盈利能力的企業(yè)具有重要價(jià)值。

方法論上來說,情感分析是一個(gè)極性分類問題??紤]到分類數(shù)量的不同,情感極性分類可以被概念化為二元、三元或序數(shù)分類。在二元分類中,我們最初假設(shè)給定的客戶評(píng)論是主觀的。換句話說,一個(gè)二元分類假設(shè)給定的文本主要是正的或負(fù)的,所以它將給定的評(píng)論的極性相應(yīng)的為“積極的”或“消極的”[28]。有正負(fù)之分的情感二元定義取決于所處的特定應(yīng)用領(lǐng)域。例如,在旅游業(yè)中,“積極”和“消極”可能分別指的是“滿意”和“不滿意”,但仍需要進(jìn)一步的研究,將情感極性與滿意的理論建構(gòu)聯(lián)系起來[29-30]。

評(píng)論可能并不總是主觀的,因此,二進(jìn)制分類需要擴(kuò)展到包含第三個(gè)“目標(biāo)”類別的三元分類。在三元分類問題中,分類識(shí)別過程就是對(duì)客觀和主觀句子的篩選過程,提供諸如“正”“負(fù)”或“中性”的分類標(biāo)簽[31-32]。中性極性有時(shí)被解釋為正極性和負(fù)極性之間的極性。情感分析也可以通過級(jí)聯(lián)方法來處理,該方法以二元分類法為基礎(chǔ),以區(qū)分主觀和客觀評(píng)論,且二元分類能進(jìn)一步將主觀評(píng)論分為兩組,即正或負(fù)??陀^評(píng)價(jià)通常不包含那些在詞典中明確定義為正面或負(fù)面的詞[33]。它們也可能包含混合極性而沒有明確方向的觀點(diǎn)。除了簡(jiǎn)單的二元和三元分類之外,序數(shù)分類可以通過情感強(qiáng)度評(píng)定量表(如1到5顆星)來執(zhí)行[34]。

情感分析是一個(gè)多步驟的處理過程,至少包括:數(shù)據(jù)檢索、數(shù)據(jù)提取和選擇、數(shù)據(jù)預(yù)處理、特征提取、主題檢測(cè)、數(shù)據(jù)挖掘過程[35]。結(jié)合這些步驟可以形成5種不同的分析方法,包括有監(jiān)督機(jī)械學(xué)習(xí)方法、無監(jiān)督機(jī)械學(xué)習(xí)方法、基于詞典導(dǎo)向方法、語義學(xué)方法以及混合方法。

(二)聚焦旅游業(yè)的情感分析研究范式回顧

在對(duì)情感分析技術(shù)綜述的基礎(chǔ)上,下文繼續(xù)探討情感分析在旅游中的應(yīng)用。其中備受關(guān)注的問題是“與旅游相關(guān)的研究是否使用最先進(jìn)的方法?”或“是否有進(jìn)一步的機(jī)會(huì)來推進(jìn)情感分析的應(yīng)用”。

旅游研究中情感分析方法的識(shí)別[36],可以結(jié)合關(guān)鍵詞,諸如“旅游情感分析”“旅游情感數(shù)據(jù)”“酒店評(píng)論情感分析”和“谷歌評(píng)論”,這些關(guān)鍵詞已被廣泛用于搜索和檢索發(fā)表在互聯(lián)網(wǎng)上的相關(guān)論文,而不需要在其他特定學(xué)術(shù)網(wǎng)站進(jìn)行具體搜索[37-38]。

筆者進(jìn)一步研究了最近有關(guān)情感分析的文章,以提取那些涉及旅游業(yè)的參考文獻(xiàn)。旅游研究人員通常使用兩種類型的在線內(nèi)容進(jìn)行情感分析:專業(yè)網(wǎng)站(如攜程)或社交媒體帖子(如微博)獲得的旅游評(píng)論[37-38],這兩種類型的來源通常包含短文本。例如,微博允許長(zhǎng)達(dá)140個(gè)字符的評(píng)論,這樣就可以進(jìn)行句子級(jí)別的情感分析。使用手動(dòng)和自動(dòng)標(biāo)注過程對(duì)評(píng)論進(jìn)行標(biāo)注,以訓(xùn)練和評(píng)價(jià)情感分析方法。另外的文獻(xiàn)中使用的大多數(shù)數(shù)據(jù)集與酒店住宿有關(guān),而少量的研究集中在餐館和航空公司[39]。

在旅游文獻(xiàn)中廣泛采用了有監(jiān)督和無監(jiān)督的機(jī)器學(xué)習(xí)、基于詞典、語義和混合情感分析方法。例如,島田(Shimada)等人提出了一種基于簡(jiǎn)單貝耶斯分類器的無監(jiān)督機(jī)器學(xué)習(xí)方法,在句子層面上對(duì)旅游數(shù)據(jù)進(jìn)行情感分析。簡(jiǎn)單貝耶斯情感分類方法使用自動(dòng)標(biāo)記的數(shù)據(jù)進(jìn)行訓(xùn)練[35]。例如,情緒符號(hào)“笑臉”“哭臉”分別表示正向和負(fù)向的種子,以標(biāo)記用于訓(xùn)練的數(shù)據(jù),而不是單詞,如“優(yōu)”和“差”。因此,包含笑臉的評(píng)論被認(rèn)為是積極的,而那些帶有憤怒的臉的評(píng)論被歸類為消極。

一些旅游研究則是借鑒了基于詞典的方法。米索普洛(Misopoulos)使用詞匯類型的方法來評(píng)估與航空公司服務(wù)交付相關(guān)的文章的極性。研究結(jié)果揭示了航空公司客戶服務(wù)中客戶不滿意、滿意甚至高興的方面[40]。其他基于詞典的分析側(cè)重于酒店和餐廳的客戶評(píng)論。

另一些旅游研究者使用了混合方法。葉強(qiáng)(Ye Qiang)等人在研究中建議將語言分析方法與信息和術(shù)語提取方法相結(jié)合,以確定在線評(píng)論的情緒極性[41]。使用二進(jìn)制選擇關(guān)鍵字和簡(jiǎn)單貝耶斯算法幫助測(cè)量與不同旅游目的地相關(guān)的推文的情感極性[5]。

總之,一個(gè)相對(duì)廣泛的應(yīng)用領(lǐng)域存在于旅游業(yè)的研究中,主要涉及酒店和住宿。然后,無論是研究?jī)?nèi)容還是方法上,仍然存在較大差異。例如,大多數(shù)國(guó)外研究?jī)H使用英文撰寫的數(shù)據(jù)來分析情緒,但很少使用中文或其他國(guó)家語言撰寫的評(píng)論。此外,通過對(duì)以往研究回顧綜述表明,大多數(shù)旅游情緒分析是基于機(jī)器學(xué)習(xí)的方法,雖然一定數(shù)量的研究也采用了基于詞典的方法[42]。后者的主要優(yōu)點(diǎn)是不需要大量的人工標(biāo)注的文本語料作為訓(xùn)練集,而是通過創(chuàng)建一個(gè)詞典實(shí)現(xiàn)在不同領(lǐng)域的多次使用,進(jìn)而構(gòu)建情感分類的識(shí)別方法。

三、總結(jié)與未來研究展望

(一)小結(jié)與可能的挑戰(zhàn)

利用大數(shù)據(jù)和深度學(xué)習(xí)方法有助于旅游研究打破信息壁壘,有效收集和整合旅游相關(guān)數(shù)據(jù),實(shí)現(xiàn)對(duì)游客信息的多維度精準(zhǔn)分析和有效預(yù)測(cè),并從大數(shù)據(jù)的不同方面獲得更多的洞察力[43]。旅游研究可以進(jìn)一步進(jìn)入一個(gè)新的領(lǐng)域,理論驅(qū)動(dòng)的方法和數(shù)據(jù)驅(qū)動(dòng)的實(shí)踐可以相互支持,加深問題理解或現(xiàn)象解釋力,并在理論上實(shí)現(xiàn)新一維度的創(chuàng)新。

盡管理論上情感分析法很引人注目,但具體實(shí)踐中,提取和處理數(shù)據(jù)對(duì)速度的要求越來越高,加之大量數(shù)據(jù)的整合使得分析任務(wù)已經(jīng)變得非常復(fù)雜,并有必要開發(fā)基于機(jī)器的自動(dòng)化方法。本文從一般研究方法和特定旅游研究的角度進(jìn)行了綜述,考慮到文本情感分析是受讀者主觀性和語言復(fù)雜性影響的,因此對(duì)于開放領(lǐng)域的數(shù)據(jù)情感分析,仍然有一些限制和改進(jìn)空間。

(二)研究方向展望

本文的研究結(jié)論只展示了旅游情感分析走向旅游新的研究范式過程的冰山一角。

因此,在情感分析法的完善方面,未來的研究需要旅游研究者、掌握信息技術(shù)和人工智能尤其是自然語言處理方面的專家之間的密切合作,以便形成特定主題的初始詞庫,為之后旅游相關(guān)行業(yè)審閱數(shù)據(jù)庫的構(gòu)建和公開工作的順利開展奠定基礎(chǔ)。這將有助于設(shè)計(jì)一個(gè)更復(fù)雜的情感分析模型,以更好地處理評(píng)論中的隱式情感方面檢測(cè)問題。同時(shí),通過提出新的假設(shè),如發(fā)現(xiàn)滿意度與情感之間的關(guān)系,來加強(qiáng)對(duì)旅游領(lǐng)域的研究[20],尤其是通過分析旅游文本中包含的游客情感傾向,豐富作為旅游業(yè)的核心概念之一的旅游滿意度的評(píng)價(jià)方法。

猜你喜歡
極性旅游業(yè)旅游
云南出臺(tái)20條措施,加快旅游業(yè)恢復(fù)
跟蹤導(dǎo)練(四)
中國(guó)旅游業(yè)2017的風(fēng)往哪吹?
旅游
表用無極性RS485應(yīng)用技術(shù)探討
一種新型的雙極性脈沖電流源
旅游業(yè)
出國(guó)旅游的42個(gè)表達(dá)
簡(jiǎn)析1912—1928年北京的旅游業(yè)
戶外旅游十件貼身帶