国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于游記數(shù)據(jù)挖掘的旅游領域用戶畫像構建

2022-02-15 01:05羅文琦楊曉霞
旅游縱覽 2022年1期
關鍵詞:用戶畫像智慧旅游成都市

羅文琦 楊曉霞

摘 要:用戶畫像通過收集用戶的社會屬性、消費習慣、偏好體征等維度的特征進行分析、統(tǒng)計,挖掘潛在價值信息,從而抽象出用戶信息全貌。本文利用網(wǎng)絡游記及評論數(shù)據(jù),使用文本情感分析、關鍵詞提取算法等方法,構建了包含用戶基本信息、用戶偏好信息、用戶情境信息、用戶情感感知4個維度的用戶畫像,并構建了與用戶畫像耦合的景點畫像,刻畫用戶對于旅游的興趣偏好。用戶畫像為旅游企業(yè)分析用戶心理、完善景區(qū)服務提供輔助。本文以成都市著名旅游景點為例,將用戶畫像與景點畫像耦合對用戶的興趣偏好進行了分析。

關鍵詞:用戶畫像;景點畫像;智慧旅游;成都市

中圖分類號:F426.61;TP311.13 文獻標識碼:A

基金項目:國家自然科學基金項目“上下文感知的旅游信息智能推薦方法”(41771444)。

隨著時代的發(fā)展,“互聯(lián)網(wǎng)+”的模式逐漸應用于各個領域,互聯(lián)網(wǎng)與旅游業(yè)的深度融合,使得用戶可以在線進行旅游信息搜索以及旅游服務的查詢與訂購,企業(yè)利用用戶數(shù)據(jù)實現(xiàn)精準營銷,為用戶提供更個性化、更精準的使用體驗。用戶畫像,即用戶信息標簽化,通過收集用戶的社會屬性、消費習慣、偏好體征等維度的數(shù)據(jù),對用戶或產(chǎn)品特征屬性進行刻畫,并對這些特征進行分析、統(tǒng)計,挖掘潛在價值信息,從而抽象出用戶的信息全貌。

目前用戶畫像已經(jīng)廣泛地應用于電子商務、圖書館應用、旅游等領域[1-3]。學者利用調(diào)查問卷、評論、游記等數(shù)據(jù)構建旅游領域畫像。單曉紅等以在線評論數(shù)據(jù)為基礎,從用戶信息屬性、酒店信息屬性和用戶評價信息屬性3個維度構建用戶畫像模型,完成對酒店用戶特征的完整刻畫[4]。劉海鷗等基于用戶基本屬性數(shù)據(jù)、用戶行為屬性數(shù)據(jù)以及用戶情境屬性數(shù)據(jù)建立游客的用戶畫像概念模型,提出了基于用戶畫像的旅游情境化推薦模型[5]。崔春生等構建用戶畫像模型,分析用戶相似度并結合用戶情境,進行個性化推薦[6]。國外學者目前較多利用用戶發(fā)布的照片信息對其行為進行刻畫,Wang Z等基于發(fā)布照片的位置服務信息以及用戶在旅游平臺的行為信息,構建用戶與項目的異質關系模型[7]。Lyu D等基于地理標記照片獲取用戶視覺信息、訪問順序信息構建用戶旅行位置矩陣[8]。李雅美等從游記中提取地域、時間、主題、類型的特征標簽,根據(jù)用戶興趣標簽找到相似用戶群[9]。

旅游領域用戶畫像為旅游企業(yè)分析用戶心理,完善景區(qū)服務提供輔助。然而,用戶畫像在旅游領域的應用還處于初級階段,用戶決策易受多種因素影響,需要考慮用戶、景點、情境之間的相互關系,存在信息獲取隱性、數(shù)據(jù)稀疏和用戶冷啟動等問題。本文針對以上問題,以用戶游記為數(shù)據(jù)基礎設計了以用戶基本信息、用戶偏好信息、用戶情境信息、用戶情感感知4個維度組成的用戶畫像,利用景點畫像與用戶畫像建立的耦合關系,分析隱含的用戶心理,并以成都市景點為例對用戶進行了個性化偏好分析。

本文構建了包含4個維度的用戶畫像,同時建立研究區(qū)域的景點畫像,旅游領域用戶畫像概念模型如圖1所示。

(一)用戶畫像四維度

用戶基本屬性是指用戶的基礎信息類,這些屬性對用戶類型進行了初步的區(qū)分和歸類。利用標簽的方法存儲用戶ID、年齡、出行天數(shù)、出行方式、同行人員以及人均消費等信息。

用戶偏好是用戶在考量商品和服務的時候所做出的理性的具有傾向性的選擇,是用戶認知、心理感受及經(jīng)濟學權衡的綜合結果。本文使用jieba工具對游記文本進行處理,并添加自定義詞典,文本分析結果結合景點畫像中的景點分類獲得用戶對景點類型、游覽方式等偏好。

本文還提出用戶情境信息維度,用戶所處情境不同,對景點的偏好和體驗也會存在差異。用戶情境是指用戶所處的自然環(huán)境,如季節(jié)、月份、溫度等;用戶的社會經(jīng)濟情境,如社交網(wǎng)絡以及用戶的消費習慣、經(jīng)濟情況。在用戶畫像中構建用戶情境信息,有助于景區(qū)針對變化的情境要素做出相應決策。

(二)景點畫像模型

同時設定景點資源分類標簽,分為地文景觀(1)、水域風光(2)、生物景觀(3)、天象與氣候景觀(4)、遺址遺跡(5)、建筑與設施(6)、旅游商品(7)、人文活動(8)八大類;建立景點內(nèi)容分類標簽,為游覽鑒賞型(A)、知識型(B)、體驗型(C)和康樂型(D),成都市部分旅游資源分類情況如表1所示。

(三)旅游領域用戶畫像與景點畫像的耦合

本文建立的旅游領域用戶畫像由用戶畫像和景點畫像兩部分構成,景點作為旅游行為的載體,其相關信息與用戶行為、情感存在一定的耦合關系。本文將景點的分類信息映射到用戶偏好維度,分析用戶在景點類型、游覽方式上所表現(xiàn)的用戶偏好。同時景點六要素評分結果反映了以景點為中心的內(nèi)部及周邊設施的建設完善度和用戶滿意度。利用畫像之間的耦合關系,能更好地分析用戶行為與景點的聯(lián)系,為分析用戶偏好、改善景點環(huán)境提供理論支持。

(一)數(shù)據(jù)來源及預處理

本文將成都作為實驗區(qū)域,利用網(wǎng)絡爬蟲工具,爬取了攜程網(wǎng)站上成都市4 317條游記數(shù)據(jù)以及29個景點的8 820條評論數(shù)據(jù)。對游記及評論預處理保留了2 970條游記數(shù)據(jù)和20個熱門景點的7 680條評論數(shù)據(jù)。成都作為美食娛樂之都,同時擁有自然風光與人文景觀,游玩方式以美食和攝影為主。出行天數(shù)多在2~5天之內(nèi),有游記1 964條,占比65.9%。出行月份主要集中在2月、7月、10月等節(jié)假日和寒暑假時期。同行人員反映出多以親子、朋友出行為主,其占比63%。人均消費則在700~4 000元不等,消費水平受到出行方式、用戶經(jīng)濟水平等影響。

(二)景點評論TF-IDF計算結果

本文利用TF-IDF算法對處理后的20個熱門景點評論得到其旅游六要素的得分,部分實驗結果如表2所示。

(三)游記文本情感分析結果

本文選擇游覽景點大于5個的三名游客(甲、乙、丙)作為研究對象,三名游客的年齡、職業(yè)均不相同。利用Python中的SnowNLP庫進行情感分析,對三名用戶的游記內(nèi)容進行賦值(0~1),如表3所示。

用戶甲訪問的景點有春熙路、青城山、武侯祠、寬窄巷子、錦里,該用戶在住宿類的評分最低,結合景點住宿類得分,青城山景區(qū)的住宿服務需要加強。用戶乙訪問的景點有大熊貓繁育研究基地、大慈寺、春熙路、寬窄巷子、文殊院,該用戶在交通類的分值較低,該用戶游覽的景點主要集中在成都二環(huán)以內(nèi),然而大熊貓繁育研究基地與市區(qū)有一定的距離。用戶丙訪問的景點為春熙路、天府廣場、人民公園、寬窄巷子、武侯祠、文殊院、都江堰、青城山,其評分結果表現(xiàn)的綜合體驗較好,但在景區(qū)游覽方面體驗感較差,春熙路、天府廣場等由于其主要發(fā)展的是以購物、娛樂為主導的旅游商品類和人文活動類景點,在游覽性體驗方面發(fā)展較緩。同時,三名用戶的出行時間分別為2月、7月和10月,旅游出行旺季存在交通擁堵、景區(qū)接待人數(shù)達到峰值等情境,對用戶的旅游體驗造成一定程度的負面影響。用戶甲與用戶乙在景點的選擇上大多為室外鑒賞型景點,寒冷與炎熱的天氣會使得用戶在室外進行旅游活動時體感較差,從而影響旅游情感。相比之下,用戶丙在10月出行,該月份溫度宜人所以整體波動較小,旅游六要素體驗評分較高。

目前,國內(nèi)用戶畫像的研究多采用問卷調(diào)查或簡單的統(tǒng)計分析,本文將文本分析和信息挖掘技術應用于用戶畫像的研究,刻畫用戶興趣偏好,分析用戶的旅游情感,豐富了游客畫像的研究方法及工具。與以往的研究相比,本文建立了景點畫像,豐富了用戶畫像的內(nèi)涵,同時在旅游用戶畫像中加入了景點情境及用戶情境信息。從旅游企業(yè)的角度,畫像反映了游客對旅游六要素的感受,為景區(qū)建設提供建議;在游客角度,畫像涉及的情境信息可根據(jù)景區(qū)環(huán)境為用戶推薦合適的景區(qū)。

[1] 王凌霄,沈卓,李艷.社會化問答社區(qū)用戶畫像構建[J].情報理論與實踐,2018(1):129-134.

[2] 許鵬程,畢強,張晗,等.數(shù)據(jù)驅動下數(shù)字圖書館用戶畫像模型構建[J].圖書情報工作,2019(3):30-37.

[3] 孫振強,羅永龍,鄭孝遙,等.一種融合用戶情感與相似度的智能旅游路徑推薦方法[J].計算機科學,2021(增刊1):226-230.

[4] 單曉紅,張曉月,劉曉燕.基于在線評論的用戶畫像研究:以攜程酒店為例[J].情報理論與實踐,2018(4):99-104.

[5] 劉海鷗,孫晶晶,蘇妍嫄,等.基于用戶畫像的旅游情境化推薦服務研究[J].情報理論與實踐,2018(10):87-92.

[6] 崔春生,王雪,李文龍.情境環(huán)境下基于用戶畫像的旅游產(chǎn)品推薦算法研究[J].數(shù)學的實踐與認識,2019(20):122-131.

[7] WANG Z , XIAO W , Y LI, et al. LHRM: A LBS Based Heterogeneous Relations Model for User Cold Start Recommendation in Online Travel Platform[J]. Springer, Cham, 2020(11): 479-490.

[8] D LYU,L CHEN,Z XU, et al. Weighted multi-information constrained matrix factorization for personalized travel location recommendation based on geo-tagged photos[J]. Applied Intelligence,2020(3):924-938.

[9] 李雅美,王昌棟.基于標簽的個性化旅游推薦[J].中國科學技術大學學報,2017(7):547-555.

猜你喜歡
用戶畫像智慧旅游成都市
成都市青羊區(qū):推行“一網(wǎng)通辦”下的“最多跑一次”
2019年1~6月成都市經(jīng)濟運行情況
2018年1—12月成都市經(jīng)濟運行情況
把聲音的魅力發(fā)揮到極致
移動用戶畫像構建研究
大數(shù)據(jù)時代黔東南州智慧旅游開發(fā)研究
京津冀休閑產(chǎn)業(yè)協(xié)同發(fā)展研究(一)
基于微博的大數(shù)據(jù)用戶畫像與精準營銷
移動互聯(lián)網(wǎng)下手機用戶使用行為特征的研究