国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于網(wǎng)絡(luò)游記的景區(qū)游客畫像構(gòu)建研究*
——以上海迪士尼樂園為例

2020-07-30 06:41周晉名毛潤(rùn)澤
旅游研究與實(shí)踐 2020年3期
關(guān)鍵詞:畫像游記維度

周晉名,毛潤(rùn)澤

(上海師范大學(xué) 旅游學(xué)院,上海200234)

0 引言

在互聯(lián)網(wǎng)時(shí)代,“大數(shù)據(jù)”是一個(gè)熱門詞匯,它可以通過海量的數(shù)據(jù)弱化個(gè)體的干擾因素,從而體現(xiàn)出群體的共性。目前它已被廣泛應(yīng)用于醫(yī)療、金融、交通以及商業(yè)等領(lǐng)域,其中商業(yè)領(lǐng)域應(yīng)用較為成熟的是對(duì)消費(fèi)者的研究。通過大數(shù)據(jù),我們可以洞悉消費(fèi)者的共同需求,提高產(chǎn)品或服務(wù)的實(shí)用性與滿意度。但在實(shí)際的運(yùn)用中,我們發(fā)現(xiàn)大數(shù)據(jù)本身所含的信息包羅萬象,得出的結(jié)論也是高度抽象的,而企業(yè)與組織希望得到的是一個(gè)具有針對(duì)性的可參照的具體對(duì)象,“用戶畫像”也就應(yīng)運(yùn)而生,它先將用戶的每個(gè)具體信息抽象成標(biāo)簽,再利用這些標(biāo)簽將用戶的整體或典型形象具體化,從而為用戶提供更加具有針對(duì)性的服務(wù)。它還是描述用戶特征以及連接用戶需求和產(chǎn)品功能的有效工具,目前已被廣泛應(yīng)用于各個(gè)領(lǐng)域。

通過用戶畫像還可以抽象出企業(yè)的典型用戶,每一個(gè)強(qiáng)大的企業(yè)品牌背后都擁有一個(gè)價(jià)值觀一致的群體,該群體按照其典型性又分為若干個(gè)次級(jí)群體,每一個(gè)次級(jí)群體都擁有著相同或相似的行為或偏好,我們將這一次級(jí)群體的整體稱作典型用戶。刻畫典型用戶不僅可以幫助企業(yè)鎖定目標(biāo)用戶,還可以為企業(yè)發(fā)現(xiàn)潛在用戶。

游客畫像就是在用戶畫像的基礎(chǔ)上發(fā)展而來,屬于用戶畫像的一個(gè)分支,它是建立在海量數(shù)據(jù)基礎(chǔ)上借助數(shù)學(xué)建模描述游客基本情況的標(biāo)簽化畫像[1-5]。其作為景區(qū)實(shí)施目標(biāo)市場(chǎng)精準(zhǔn)定位、旅游產(chǎn)品精準(zhǔn)設(shè)計(jì)和營(yíng)銷的有效工具,目前已在景區(qū)營(yíng)銷中逐步得以應(yīng)用。相較于傳統(tǒng)的景區(qū)市場(chǎng)分析方法,游客畫像的高度可視化使其可操作性更強(qiáng)。本文基于網(wǎng)絡(luò)游記對(duì)景區(qū)游客畫像的構(gòu)建展開研究。網(wǎng)絡(luò)游記是游客記錄旅行的一種方式,游記中不僅包含游客的旅游經(jīng)歷,還包含游客在旅行中的感受,是獲取游客信息的寶貴資料。

1 相關(guān)研究述評(píng)

1.1 用戶畫像模型的構(gòu)建方式

用戶畫像模型的構(gòu)建方式多種多樣,Liana Razmerita等提出了一種基于本體的通用用戶建模架構(gòu)(Ontob UM),應(yīng)用于知識(shí)管理系統(tǒng)(KMS)的上下文中作為捕獲用戶偏好和能力的簡(jiǎn)單方式[6]。Hyoung-Rae Kim等則設(shè)計(jì)了一種分裂的層次聚類(DHC)算法,從用戶訪問的一組網(wǎng)頁(yè)中學(xué)習(xí)用戶的興趣層次結(jié)構(gòu)。首先將單詞(主題)分組為一個(gè)層次結(jié)構(gòu),然后將每個(gè)網(wǎng)頁(yè)分配給層次結(jié)構(gòu)中的節(jié)點(diǎn),以進(jìn)一步處理學(xué)習(xí)和預(yù)測(cè)興趣[7]。

在中國(guó),關(guān)于用戶畫像模型的構(gòu)建部分是參考國(guó)外的構(gòu)建方式,如鄭建興等利用目標(biāo)用戶的友鄰集,借助本體用戶模型構(gòu)建微博用戶的友鄰主題興趣集,計(jì)算更新友鄰主題興趣度,提出友鄰—用戶模型的實(shí)現(xiàn)算法[8]。也有學(xué)者結(jié)合中國(guó)本土化的特點(diǎn),提出了自己的構(gòu)建方式[9],如劉海鷗等通過對(duì)微博、QQ 群、天涯論壇、人人網(wǎng)等社交平臺(tái)的深入挖掘,從用戶基本信息、用戶行為偏好信息、用戶情景信息三個(gè)維度構(gòu)建了在線社交活動(dòng)中的用戶畫像模型,并對(duì)其信息傳播行為的時(shí)間統(tǒng)計(jì)特征進(jìn)行實(shí)證分析[10]。徐英楠在文本主題與用戶人格具有相關(guān)性結(jié)論的基礎(chǔ)上,提出了用戶人格主題的概率生成模型及其改進(jìn)模型,并在真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)[11]。許鵬程等提出數(shù)據(jù)驅(qū)動(dòng)下用戶畫像數(shù)據(jù)化→標(biāo)簽化→關(guān)聯(lián)化→可視化的驅(qū)動(dòng)主路線,從自然維度、興趣維度、社交維度,構(gòu)建多維度、多層級(jí)、立體化的用戶畫像模型[12]。董哲瑾等通過散點(diǎn)圖分析挖掘影響用戶成長(zhǎng)值的因素,借助用戶內(nèi)容數(shù)據(jù)、用戶行為數(shù)據(jù)、社交關(guān)系數(shù)據(jù),提取行為特征和相對(duì)穩(wěn)定的時(shí)間特征,改進(jìn)了COREG 算法,整合不同模型的優(yōu)勢(shì),建立了預(yù)測(cè)準(zhǔn)確度較高的模型[13]。

從上述內(nèi)容可以看出用戶畫像模型的構(gòu)建以研究目的為導(dǎo)向,并沒有統(tǒng)一的標(biāo)準(zhǔn),重點(diǎn)在于維度的劃分。目前在旅游領(lǐng)域,票務(wù)代理公司的用戶畫像一般包含個(gè)人身份信息、價(jià)值特征、行為偏好、購(gòu)票行為、其他特征這五個(gè)維度;OTA 行業(yè)的用戶畫像則一般包含個(gè)人信息、消費(fèi)特征、出游偏好、興趣特征這四個(gè)維度。本文在綜合考慮了與研究目的的契合以及數(shù)據(jù)的可獲得性的基礎(chǔ)上,確立了三個(gè)主要構(gòu)建維度:游客基本屬性、游客人格類型、游客興趣偏好。基本涵蓋上文中所提到的各個(gè)維度,游客基本屬性包括了用戶基本信息、個(gè)人身份信息等內(nèi)容;游客人格類型作為影響游客行為方式、消費(fèi)習(xí)慣、社交模式、興趣愛好的重要變量可以反映用戶行為偏好信息、價(jià)值特征等;游客興趣偏好包括了出游偏好、興趣特征等內(nèi)容。

1.2 用戶畫像的應(yīng)用研究

1996年Tom Fawcett等就曾將數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,基于受詐騙客戶的行為來構(gòu)建用戶畫像,以此檢測(cè)電話欺詐性。實(shí)驗(yàn)表明,這種方法幾乎與用于檢測(cè)欺詐的最佳手動(dòng)調(diào)整方法一樣好[14]。此后,Geyer-Schulz等又提出基于用戶隨機(jī)購(gòu)買事件行為畫像的圖書推薦服務(wù)系統(tǒng),降低了讀者文檔的搜索和評(píng)估成本,方便了圖書管理員的館藏管理[15]。Qiu L等則將用戶畫像應(yīng)用在學(xué)術(shù)圈,利用概率主題模型對(duì)提取的用戶配置文件進(jìn)行建模,構(gòu)建出學(xué)者的用戶興趣模型[16]。目前用戶畫像的應(yīng)用研究正在滲透到媒體傳播、圖書館、企業(yè)營(yíng)銷等各個(gè)領(lǐng)域[17-20]。

在旅游業(yè),用戶畫像也得到了應(yīng)用,Ravi等利用社交網(wǎng)絡(luò)的數(shù)據(jù)來完善個(gè)性化的旅行推薦系統(tǒng),使其具有更好的預(yù)測(cè)和更高的準(zhǔn)確性[21]。劉建平等通過IPA 分析加工用戶畫像的性別、年齡、應(yīng)用偏好等信息,分析用戶畫像每一標(biāo)簽的對(duì)比情況,為互聯(lián)網(wǎng)親子游的游客勾勒出了用戶畫像[22]。單曉紅等以在線評(píng)論數(shù)據(jù)為基礎(chǔ),從用戶信息屬性、酒店信息屬性和用戶評(píng)價(jià)信息屬性三個(gè)維度構(gòu)建用戶畫像模型的概念模型,并研究了三個(gè)維度之間的關(guān)聯(lián),完整刻畫了酒店用戶的特征[23]。劉海鷗等基于游客基本屬性數(shù)據(jù)、用戶行為屬性數(shù)據(jù)以及用戶情境屬性數(shù)據(jù)建立了游客畫像概念模型,提出了基于游客畫像的旅游情境化推薦模型,并設(shè)計(jì)了一個(gè)景點(diǎn)推薦測(cè)試系統(tǒng)進(jìn)行實(shí)驗(yàn)測(cè)試[24]。

從上述內(nèi)容可以看出,相對(duì)于其他行業(yè),旅游業(yè)對(duì)于用戶畫像的應(yīng)用尚處于初級(jí)階段,主要以研究用戶的性別、年齡、行為、情感傾向等基本信息為主,對(duì)于用戶數(shù)據(jù)背后的隱性信息挖掘不夠。本文在之前研究的基礎(chǔ)上,以情報(bào)學(xué)的文本分析和旅游學(xué)的旅游凝視等理論為依托,分析游客的游記文本與圖片,挖掘游客的人格類型與興趣偏好,提出了一種基于網(wǎng)絡(luò)游記構(gòu)建景區(qū)游客畫像的方法。

2 游客畫像概念模型與構(gòu)建流程

2.1 游客畫像概念模型

如上文所述,本文在構(gòu)建景區(qū)游客畫像概念模型過程中,以現(xiàn)有的研究為基礎(chǔ),在充分考慮模型與研究目的的契合性以及數(shù)據(jù)可獲得性的基礎(chǔ)上,確立了三個(gè)主要的構(gòu)建維度:游客基本屬性、游客人格類型、游客興趣愛好。

維度一:游客基本屬性

游客基本屬性是指游客的一些基本信息,如性別、年齡、學(xué)歷、收入、地域等,這些屬性反映了游客的基本情況,且不會(huì)輕易改變。在本研究中,發(fā)現(xiàn)網(wǎng)絡(luò)游記中包含以下基本信息:性別、現(xiàn)居地、出行時(shí)間、出行天數(shù)、出行方式、人均消費(fèi)等。上述信息是作為游客的標(biāo)簽在游記的內(nèi)容上方直接列出,獲取難度不大。

維度二:游客人格類型

目前游客人格類型這一維度在國(guó)內(nèi)的游客畫像構(gòu)建中尚未有文獻(xiàn)涉及,但國(guó)外早在1999年就有研究指出了人格類型與用詞偏好以及情感表達(dá)方式的相關(guān)關(guān)系,而網(wǎng)絡(luò)游記正是研究游客用詞偏好與情感表達(dá)方式的絕佳樣本。人格類型作為影響人們行為方式、消費(fèi)習(xí)慣、社交模式、興趣愛好的重要變量,在游客畫像的刻畫中是必不可少的。本文引入大五人格模型,利用游客在游記中的用詞偏好以及情感表達(dá)方式對(duì)游客人格的五大維度分別評(píng)測(cè)并加以解釋。

維度三:游客興趣偏好

游客興趣偏好是游客畫像在OTA 領(lǐng)域中最重要的一個(gè)維度,也是企業(yè)最關(guān)注的一個(gè)維度,它決定了企業(yè)的產(chǎn)品設(shè)計(jì)、營(yíng)銷策略、銷售模式以及服務(wù)的提升方式。傳統(tǒng)的游客興趣偏好是通過游客的行為數(shù)據(jù)或調(diào)查問卷分析得出,該方式的優(yōu)點(diǎn)是準(zhǔn)確度較高,針對(duì)性強(qiáng),但難點(diǎn)在于數(shù)據(jù)的收集,操作難度和成本都比較大。本文借助隱喻抽取技術(shù)(ZMET)通過分析游客在游記中上傳的照片來刻畫游客的興趣偏好。

游客畫像的概念模型如圖1所示,分為整體和典型游客畫像兩個(gè)部分。整體游客畫像是依據(jù)游客基本屬性刻畫的,而典型游客畫像是從整體游客畫像中提取而來,除基本屬性維度外,還包含人格類型和興趣偏好兩個(gè)維度。其中,游客的基本屬性對(duì)于其人格類型以及興趣偏好均有影響,如性別、客源地以及消費(fèi)能力等都會(huì)對(duì)游客的人格類型以及興趣偏好產(chǎn)生影響。游客人格類型也會(huì)對(duì)其興趣偏好產(chǎn)生影響,美國(guó)約翰·霍普金斯大學(xué)心理學(xué)教授John Holland就提出人們對(duì)教育的期望會(huì)因其人格類型的不同而有所差別,如研究型和社會(huì)型人格類型的學(xué)生更傾向于保持更高的教育期望[25]。國(guó)內(nèi)學(xué)者殷章馨等也提出不同人格特質(zhì)的游客的自拍需求也不盡相同[26]??梢姡烁耦愋褪怯绊懪d趣偏好的重要指標(biāo)之一。反之,基于De Fruyt

F等的研究[27],個(gè)人的興趣偏好也可以對(duì)其人格類型起到一定的驗(yàn)證作用,提高模型的可信度與準(zhǔn)確性。

圖1 游客畫像概念模型

2.2 游客畫像構(gòu)建流程

基于網(wǎng)絡(luò)游記的游客畫像的構(gòu)建主要分為七個(gè)步驟:第一步,確立研究對(duì)象,包括構(gòu)建該游客畫像的目的以及需要的數(shù)據(jù);第二步,收集相關(guān)數(shù)據(jù),即收集與研究對(duì)象相關(guān)的網(wǎng)絡(luò)游記;第三步,提取典型形象,主要是根據(jù)游記中提供的游客的基本信息;第四步,篩選相關(guān)游記,即每一個(gè)典型形象所包含的游記,這一步可以通過游記網(wǎng)站的自動(dòng)篩選功能來實(shí)現(xiàn);第五步,畫像素材的準(zhǔn)備,主要工作為爬取典型游客游記中的文字并匯總游記照片,文字的采集本文采用Python 自動(dòng)抓取,游記照片指的是游記中游客上傳的旅游途中拍攝的照片;第六步,游客畫像的實(shí)現(xiàn),即基本屬性采集、人格評(píng)測(cè)以及興趣偏好的分析;第七步,游客畫像可視化,借助可視化軟件對(duì)游客基本屬性、游客人格類型以及游客興趣偏好做可視化處理,完成對(duì)游客畫像的刻畫[28]。具體構(gòu)建流程如圖2所示。

圖2 基于網(wǎng)絡(luò)游記的游客畫像構(gòu)建流程

3 游客畫像模型的實(shí)現(xiàn)

3.1 數(shù)據(jù)來源與篩選

本文的數(shù)據(jù)來源主要為馬蜂窩旅游網(wǎng)的游記版塊,主要信息包含三個(gè)部分:游客基本信息(游客的性別、現(xiàn)居地、出行時(shí)間、出行天數(shù)、出行方式、人均消費(fèi)等)、游客游記正文文本以及游記中游客上傳的照片。數(shù)據(jù)的篩選主要是根據(jù)游客的基本信息以及游記的質(zhì)量,首先通過網(wǎng)站的自動(dòng)篩選功能統(tǒng)計(jì)各類基本信息分類的游記數(shù)量,從中獲取整體游客畫像并抽象出典型游客畫像,然后在篩選出的各類典型游客的游記中根據(jù)游記的質(zhì)量進(jìn)行第二次篩選,得到最終的數(shù)據(jù)源。其中用戶游記正文文本借助Python自動(dòng)抓取并利用Jieba分詞器對(duì)文本進(jìn)行預(yù)處理,借助八爪魚軟件抓取游記中的圖片。

3.2 人格類型的評(píng)測(cè)

在評(píng)測(cè)人格類型之前首先要構(gòu)建人格詞典,本文人格詞典的構(gòu)建主要分為三個(gè)部分:否定詞詞典、程度副詞詞典以及特征詞詞典。否定詞詞典參考了知網(wǎng)Hownet情感詞典,是指包括不、甭、勿、別、未、反、沒、否等這一類否定詞的詞典;程度副詞詞典也是參考知網(wǎng)Hownet情感詞典建立;特征詞是指可以用來推斷用詞者人格特征的詞,特征詞詞典是參考了知網(wǎng)Hownet情感詞典、sc-liwc詞典,并結(jié)合游記中的特征詞建立的,包含情感歷程詞、生氣詞、冠詞、應(yīng)和詞等,如表1 所示。

表1 特征詞詞典詞匯分類及示例(部分)

在完成了人格詞典的構(gòu)建后,接下來要確定人格類型評(píng)測(cè)指標(biāo)的計(jì)算方法,根據(jù)漢語的表達(dá)習(xí)慣,除了單獨(dú)的特征詞外,一般有“否定詞+特征詞”(不開心)、“程度副詞+特征詞”(很開心)、“否定詞+程度副詞+特征詞”(不是很開心)、“程度副詞+否定詞+特征詞”(很不開心)這四種搭配方式。對(duì)于單獨(dú)的特征詞,我們可以根據(jù)語言使用頻次與人格特征之間的皮爾遜相關(guān)系數(shù)計(jì)算(語言使用頻次與人格特征之間的皮爾遜相關(guān)系數(shù)參考1999年P(guān)ennebaker and

King等在研究中給出的數(shù)值);對(duì)于“否定詞+特征詞”,否定詞會(huì)改變特征詞的極性,所以要在相關(guān)系數(shù)前添加負(fù)號(hào),同時(shí)否定詞還會(huì)削弱情感強(qiáng)度,因此得分還應(yīng)除以2;對(duì)于“程度副詞+特征詞”,程度副詞會(huì)改變特征詞的強(qiáng)度,權(quán)值參考知網(wǎng)How Net詞典,但由于特征詞典側(cè)重于判斷情感傾向,而人格詞典側(cè)重于識(shí)別情感表達(dá)方式,所以本文在結(jié)合情感的具體表達(dá)方式的基礎(chǔ)上對(duì)權(quán)值做了一些調(diào)整。具體見表2。

表2 程度副詞分類及權(quán)值(部分)

對(duì)于“否定詞+程度副詞+特征詞”和“程度副詞+否定詞+特征詞”兩種搭配,由于程度副詞與否定詞位置的不同,所表達(dá)的情感也會(huì)有所不同,如:“不是很高興”和“很不高興”表達(dá)的就是不同的意思。前者表達(dá)的情感程度較為緩和,而后者表達(dá)的則是一種強(qiáng)烈的負(fù)面情感。因此,前者在計(jì)算得分時(shí),要除以2,而后者不用。綜上,五大維度的人格得分可表示為:

其中i取1,2,3,4,5,代表人格評(píng)測(cè)的五個(gè)維度;j表示的是特征詞所屬的詞匯分類,共有45類;P ij代表的是屬于j類的詞匯與i人格維度的相關(guān)系數(shù);Q j代表的是屬于j類的單獨(dú)特征詞的數(shù)量;q j代表的是屬于j類的只與否定詞搭配的特征詞的數(shù)量;w jk代表的是屬于j類的第k個(gè)特征詞前的程度副詞的權(quán)值;n j代表的是“程度副詞+特征詞”組合的數(shù)量;m j代表的是“否定詞+程度副詞+特征詞”組合的數(shù)量;o j代表的是“程度副詞+否定詞+特征詞”組合的數(shù)量。

借助以上算法計(jì)算出典型游客的五大人格維度的得分,最后對(duì)五大維度的得分進(jìn)行標(biāo)準(zhǔn)化處理,得到最終的評(píng)測(cè)結(jié)果。

3.3 圖片采集與分析

圖片采集的范圍是游記中游客上傳的照片,借助圖片采集工具采集圖片并下載至本地,依靠人工篩選出其中畫面清晰、主題明確的照片。主要步驟:第一步,借助人工識(shí)別的方法將照片中的元素提取出來,并計(jì)算每個(gè)元素出現(xiàn)的頻次,同一張照片中出現(xiàn)的相同元素按一次計(jì)算。第二步,將提取出的元素“人、物、景”分類,其界定標(biāo)準(zhǔn)如下:“人”是指游客、演職人員等,無須贅述;“物”是指游客拍攝的靜態(tài)的物品,如卡通雕塑、創(chuàng)意小商品、城堡等;“景”是指動(dòng)態(tài)場(chǎng)面的靜化,如游客的購(gòu)物場(chǎng)景、迪士尼的花車巡游、演藝節(jié)目等,雖從圖片上來看是靜止的,但明顯是動(dòng)態(tài)的活動(dòng)。第三步,以分類后的元素為起始意象,結(jié)合隱喻抽取技術(shù)(ZMET)以及游記中的文字描述,構(gòu)建游客的旅游意象層次圖。第四步,基于構(gòu)建的旅游意象層次圖,結(jié)合旅游凝視理論分析游客的興趣偏好。具體分析過程見下文對(duì)上海迪士尼樂園的實(shí)證分析,在此不做贅述。

3.4 游客畫像的生成

游客畫像分為整體游客畫像與典型游客畫像,整體游客畫像僅針對(duì)游客的基本屬性,而典型游客畫像更為精細(xì),包括游客的人格類型和興趣偏好。其中游客基本信息包含性別、現(xiàn)居地、出行時(shí)間、出行天數(shù)、出行方式以及人均消費(fèi);游客人格類型包含游客五大人格維度的評(píng)分;游客興趣偏好包含游客對(duì)上海迪士尼樂園的初始意象、連接意象以及終結(jié)意象。在完成以上信息的收集、分析以及整理后,最后利用可視化軟件將以上信息用圖表的形式直觀地表示出來,生成最終的用戶畫像。

4 上海迪士尼樂園游客畫像實(shí)證分析

基于前文提出的游客畫像模型,本文選取迪士尼樂園作為實(shí)證分析對(duì)象,數(shù)據(jù)來源于馬蜂窩旅游網(wǎng)站,刻畫上海迪士尼樂園游客畫像;分別從整體游客畫像和典型游客畫像兩個(gè)層面來刻畫,其中典型游客分為家人親戚伴游型和同學(xué)朋友伴游型兩類。

4.1 整體游客畫像

通過游客的基本信息可以從整體上刻畫游客畫像,首先通過網(wǎng)站自帶的篩選功能統(tǒng)計(jì)上海迪士尼樂園每個(gè)分類下的游記數(shù)量,其中游記總數(shù)3 166篇。各個(gè)分類統(tǒng)計(jì)結(jié)果如下:現(xiàn)居地主要集中在華東地區(qū),游記數(shù)量1 200篇,占比37.9%;出行時(shí)間除11~12月為淡季外,其余分布較為均勻,相對(duì)集中在5~8月,游記數(shù)量1 241篇,占比39.2%;出行方式多為家庭出游或與同學(xué)朋友出游,游記數(shù)量2 463篇,占比77.8%;人均花費(fèi)多在500~3 500元范圍,游記數(shù)量2 305篇,占比約72.8%;出行天數(shù)多在三天以下,游記數(shù)量2 631篇,占總數(shù)的83.1%。

由此可以刻畫出上海迪士尼樂園游客的整體游客畫像:中產(chǎn)階級(jí),來自華東的富庶地區(qū),喜歡在夏季和家人、親戚或同學(xué)朋友一同外出游玩,停留時(shí)間一般不超過三天。

4.2 典型游客畫像

典型游客畫像是從整體游客畫像中細(xì)分出來的具有普遍性和代表性的游客形象,本文選取出行方式為拆分維度,篩選出“家人親戚伴游型游客”和“同學(xué)朋友伴游型游客”兩類典型形象。選擇出行方式作為拆分維度主要是因?yàn)槌鲂蟹绞降牟煌羁逃绊懼慰偷穆糜涡袨橐约奥糜误w驗(yàn)。本文中游記的篩選主要依靠網(wǎng)站的自動(dòng)分類功能結(jié)合人工進(jìn)行篩選,以資料的完整度、游記的質(zhì)量為主要篩選標(biāo)準(zhǔn),共篩選出家人親戚伴游型游客的游記211篇,同學(xué)朋友伴游型游客的游記197篇。

4.2.1 家人親戚伴游型游客畫像

家人親戚伴游型游客的游記共有211篇,在對(duì)游記中的信息分類后,首先統(tǒng)計(jì)篩選出的游記中游客的基本屬性,統(tǒng)計(jì)結(jié)果如下:家人親戚伴游型游客主要來自華東地區(qū),占比42.7%;出行時(shí)間多集中在7月到10月,占比45.5%;人均花費(fèi)為1 515元;平均逗留2.5天。

接下來采集匯總文本內(nèi)容以及照片。文本內(nèi)容經(jīng)過剔除影響分析的專有名詞(如文本中的迪士尼樂園項(xiàng)目名稱,節(jié)目名稱等),統(tǒng)一格式等預(yù)處理后,得到共計(jì)516 394字的研究文本;照片的收集由于游客游記中的照片數(shù)量過于龐大,所以本文人工隨機(jī)挑選了游記中主題明確、元素清晰、圖文相關(guān)的照片697張。

家人親戚伴游型游客人格類型的評(píng)測(cè)利用Python編程實(shí)現(xiàn),首先將文本導(dǎo)入,然后利用Python中的Jieba分詞對(duì)原始文本數(shù)據(jù)進(jìn)行分詞處理,最后再運(yùn)算,公式在上文中都已給出。計(jì)算結(jié)果如下:外傾性維度得分184.24,神經(jīng)質(zhì)維度得分-254.19,宜人性維度得分417.70,責(zé)任心維度得分128.32,開放性維度得分-428.41,如表3所示。

表3 家人親戚伴游型游客人格類型評(píng)分

家人親戚伴游型游客興趣偏好的刻畫是基于游客在游記中上傳的照片,首先要提取出照片中的主要元素,并根據(jù)旅游凝視理論分類,計(jì)算每個(gè)元素出現(xiàn)的頻次。在采集的照片內(nèi)容元素中,“人”是指游客及演職人員等,無須贅述;“物”是指靜態(tài)的物品(如旅游紀(jì)念品,雕塑等);而“景”是指動(dòng)態(tài)過程的靜止化(如記錄花車巡游、游客體驗(yàn)項(xiàng)目過程的照片),雖然照片是靜止的,但可以合理推斷出其所記錄的是一個(gè)動(dòng)態(tài)的過程。結(jié)果如表4所示。

表4 家人親戚伴游型游客凝視元素統(tǒng)計(jì)

通過觀察可以發(fā)現(xiàn)這些元素中,游客自拍、植物綠化、門票、游客游玩、動(dòng)畫截圖的出現(xiàn)頻次較少,予以刪減;此外迪士尼樂園App截圖占5.6%,這說明該App的實(shí)用性較強(qiáng),但其不屬于意象元素,所以在繪制迪士尼樂園旅游意象層次圖時(shí)也不納入考慮。最終篩選出了10個(gè)起始意象,對(duì)照游記中關(guān)于這些元素的文字描述以及它們的基本屬性,又構(gòu)建出相應(yīng)的連接意象,最后抽象出終結(jié)意象,如圖3。

圖3 家人親戚伴游型游客迪士尼樂園旅游意象層次

分別匯總計(jì)算圖片中包含的三個(gè)終結(jié)意象元素的數(shù)量,三個(gè)終結(jié)意象元素的總數(shù)為1 146。其中,“幸福氛圍”共689 個(gè)元素,占總數(shù)的60.1%,這與其人格類型宜人性、責(zé)任心維度得分偏高相呼應(yīng);“美好享受”共923個(gè)元素,占總數(shù)的80.5%;“奇幻體驗(yàn)”占總數(shù)的29.1%(由于單個(gè)起始意象可以歸于多個(gè)終結(jié)意象,因此占比總和大于100%)。從中可以看出美好享受是家人親戚伴游型游客最關(guān)注的興趣點(diǎn),這種美好的享受不僅是視覺和味覺上的,更多是心理上的一種享受,這種享受源于對(duì)可愛、精致的喜愛以及對(duì)于夢(mèng)幻的向往;其次是幸福氛圍,幸福氛圍的營(yíng)造主要依靠家庭成員,同時(shí)迪士尼樂園演職人員的友善態(tài)度以及活動(dòng)現(xiàn)場(chǎng)的夢(mèng)幻氛圍也提升了家人親戚伴游型游客的幸福感;而奇幻體驗(yàn)并非家人親戚伴游型游客的關(guān)注焦點(diǎn),這可能與家人親戚伴游型游客的家庭角色和選擇偏好有關(guān),父母將更多的精力放在了孩子身上,而不是游樂項(xiàng)目上,在游樂項(xiàng)目的選擇上,家人親戚伴游型游客更加偏好較為平和的項(xiàng)目。

再結(jié)合上文中游客人格類型各維度的評(píng)分,依據(jù)大五人格理論,可以刻畫出上海迪士尼樂園家人親戚伴游型游客的畫像:主要來自華東地區(qū),喜歡夏秋季出行,停留2~3天,消費(fèi)能力較強(qiáng)。他們樂于助人,適應(yīng)力強(qiáng),遵守規(guī)則,喜愛參加能夠營(yíng)造幸福氛圍或帶來美好享受的集體活動(dòng)。

4.2.2 同學(xué)朋友伴游型游客畫像

同學(xué)朋友伴游型游客畫像的刻畫與前文家人親戚伴游型游客畫像基本相同,在此不做贅述,僅給出197篇游記的分析結(jié)果。

基本屬性統(tǒng)計(jì)結(jié)果:主要來自華東和華北地區(qū),占比57.4%;出行時(shí)間多集中在4月到7 月,占比42.1%;人均花費(fèi)為1 328元;平均逗留1.9天。

人格類型評(píng)測(cè)結(jié)果:外傾性維度得分164.91,神經(jīng)質(zhì)維度得分-169.15,宜人性維度得分214.09,責(zé)任心維度得分-67.18,開放性維度得分-231.96。再將以上得分做標(biāo)準(zhǔn)化處理,結(jié)果如表5所示。

表5 同學(xué)朋友伴游型游客人格類型評(píng)分

同學(xué)朋友伴游型游客的興趣偏好分析在游客意象的選擇上較家人親戚伴游型游客有幾處調(diào)整,統(tǒng)計(jì)結(jié)果見表6。

表6 同學(xué)朋友伴游型游客凝視元素統(tǒng)計(jì)

根據(jù)以上內(nèi)容,繪制出同學(xué)朋友伴游型游客迪士尼樂園旅游意象層次圖,具體見圖4。

圖4 同學(xué)朋友伴游型游客迪士尼樂園旅游意象層次

通過計(jì)算可得:元素總數(shù)為1 572個(gè),其中“融洽氛圍”意象包含546個(gè)元素,占總數(shù)的34.7%;“美好享受”意象包含1 274個(gè)元素,占總數(shù)的81.0%;“奇幻體驗(yàn)”意象包含702個(gè)元素,占總數(shù)的44.7%。從中可以看出,“美好享受”是同學(xué)朋友伴游型游客最關(guān)注的興趣點(diǎn);“奇幻體驗(yàn)”較家人親戚伴游型游客要高,占比接近半數(shù),這也與其人格類型開放性維度得分較家人親戚伴游型游客要高相呼應(yīng)。出乎意料的是,與家人親戚伴游型游客注重“幸福氛圍”不同,同學(xué)朋友伴游型游客對(duì)“融洽氛圍”的重視程度并不高,這可能是家庭關(guān)系和朋友關(guān)系親密程度不同造成的。

再結(jié)合上文中游客人格類型各維度的評(píng)分,依據(jù)大五人格理論,可以刻畫出上海迪士尼樂園同學(xué)朋友伴游型游客的畫像:主要來自華東和華北地區(qū),喜歡春夏季出行,停留1~2天,消費(fèi)能力一般;他們富于想象力,適應(yīng)力較強(qiáng),缺乏組織性,喜愛參加能夠帶來美好享受或奇幻體驗(yàn)的集體活動(dòng)。

5 結(jié)論與討論

本文提出了一種新的基于網(wǎng)絡(luò)游記的游客畫像的構(gòu)建方法,主要是根據(jù)游客的基本屬性、人格類型和興趣偏好三個(gè)維度的信息來構(gòu)建?;緦傩允峭ㄟ^游記的標(biāo)簽信息進(jìn)行統(tǒng)計(jì)分析,以此刻畫出游客的整體游客畫像并提取出典型游客;然后對(duì)典型游客的人格類型和興趣偏好展開研究,其中人格類型根據(jù)游客游記正文的文本分析來確定,依據(jù)是不同人格類型的人在用詞和情感表達(dá)上有不同的偏好;興趣偏好是通過提取游客游記照片中的元素,以旅游凝視理論和隱喻抽取技術(shù)(ZMET)為理論基礎(chǔ),分析并挖掘游客的興趣偏好。并且以上海迪士尼樂園為例刻畫了該景區(qū)的整體及典型游客畫像,針對(duì)游客畫像中體現(xiàn)出的特征,從景區(qū)營(yíng)銷、景區(qū)服務(wù)、景區(qū)管理三個(gè)方面指出了上海迪士尼樂園在經(jīng)營(yíng)管理方面需要注意的問題。

本文提出的基于網(wǎng)絡(luò)游記構(gòu)建游客畫像的方法在理論與實(shí)踐上都有一定的價(jià)值和意義。其理論意義主要表現(xiàn)在三個(gè)方面:第一,目前國(guó)內(nèi)游客畫像的研究多采用簡(jiǎn)單的統(tǒng)計(jì)分析,本文將自然語言處理技術(shù)和隱喻抽取技術(shù)應(yīng)用于游客畫像的研究,刻畫游客的人格類型和興趣偏好,豐富了游客畫像的研究方法及工具,這也是本文的創(chuàng)新點(diǎn)所在;第二,與以往的研究相比,本文將人格類型這一新維度引入到了游客畫像的研究中,豐富了游客畫像的內(nèi)涵;第三,本文以迪士尼為例展示了景區(qū)如何通過游客畫像為游客提供更好的服務(wù),拓寬了游客畫像的應(yīng)用領(lǐng)域。

本文的實(shí)踐意義包括:第一,從景區(qū)營(yíng)銷角度,刻畫游客畫像可以使旅游景區(qū)的旅游營(yíng)銷更有針對(duì)性。以迪士尼為例,依據(jù)家人親戚伴游型和同學(xué)朋友伴游型這兩個(gè)游客畫像,可以在目前推出的家庭套票與親子票的基礎(chǔ)上增加閨蜜票。第二,從景區(qū)服務(wù)角度,刻畫游客畫像可以使旅游景區(qū)的服務(wù)更加人性化。如針對(duì)來到迪士尼的家人親戚伴游型游客責(zé)任心較強(qiáng)、情緒穩(wěn)定性高的特點(diǎn),可以給予其更多的自主權(quán),包括免押租用一些兒童用品或其他輔助設(shè)備等;而對(duì)于同學(xué)朋友伴游型游客,針對(duì)該群體神經(jīng)質(zhì)維度的評(píng)分偏高的特點(diǎn),要注意照顧其在游玩過程中的情緒,如在排隊(duì)時(shí)安排演職人員與其互動(dòng),并對(duì)需要長(zhǎng)時(shí)間排隊(duì)的項(xiàng)目及時(shí)與其溝通。第三,從景區(qū)管理角度,刻畫游客畫像可以提高景區(qū)的管理效率。如針對(duì)來到迪士尼的家人親戚伴游型游客對(duì)于“美好享受”的需求要高于“奇幻體驗(yàn)”的特點(diǎn),迪士尼樂園要注意維護(hù)景區(qū)內(nèi)的衛(wèi)生環(huán)境;而對(duì)于開放性維度評(píng)分較高的同學(xué)朋友伴游型游客,該群體更富于想象力,也更有好奇心,因此可以針對(duì)該群體設(shè)置一些具有刺激性的游樂項(xiàng)目。

本文的不足之處在于文中語言使用頻次與人格特征之間的相關(guān)系數(shù)由于在國(guó)內(nèi)未找到相關(guān)研究,參考的是國(guó)外的文獻(xiàn),由于國(guó)外的文化背景與中國(guó)不同,漢語的語言結(jié)構(gòu)也與外語有所差別,因此在人格特征的評(píng)分上可能存在一定的誤差。在后續(xù)工作中將考慮以問卷為基礎(chǔ),嘗試建立一個(gè)完整的基于景區(qū)游客游記中的用詞偏好和情感表達(dá)方式推測(cè)游客人格類型的量化模型,進(jìn)一步提高景區(qū)游客畫像的精確度與準(zhǔn)確性。除此之外,本文選取網(wǎng)絡(luò)游記作為研究樣本具有一定的局限性,原因在于大多數(shù)愿意創(chuàng)作網(wǎng)絡(luò)游記的游客對(duì)上海迪士尼是持積極態(tài)度的,這就導(dǎo)致對(duì)于迪士尼景區(qū)的消極方面(如游客極度擁擠、極限運(yùn)營(yíng)、禁帶食品和搜包等)不能如實(shí)反映。但盡管如此,網(wǎng)絡(luò)游記中的景區(qū)游客畫像的刻畫對(duì)于研究實(shí)際游客市場(chǎng)輪廓仍具有重要指示意義,這類似于小說與現(xiàn)實(shí)的關(guān)系,雖然小說不是現(xiàn)實(shí),但揭示了現(xiàn)實(shí)。

猜你喜歡
畫像游記維度
威猛的畫像
理解“第三次理論飛躍”的三個(gè)維度
認(rèn)識(shí)黨性的五個(gè)重要維度
畫像
淺論詩(shī)中“史”識(shí)的四個(gè)維度
地心游記(十)只剩我一個(gè)人
尋夢(mèng)環(huán)游記
尋夢(mèng)環(huán)游記
超市游記
畫像
永宁县| 惠东县| 法库县| 兰溪市| 贵港市| 灌南县| 曲周县| 曲靖市| 秭归县| 澜沧| 婺源县| 金川县| 赤城县| 洮南市| 崇阳县| 阜新| 安新县| 右玉县| 柏乡县| 阳城县| 潞城市| 余干县| 安国市| 民丰县| 贵州省| 津市市| 阳春市| 余干县| 尚义县| 孟津县| 容城县| 长春市| 琼结县| 新巴尔虎左旗| 靖江市| 黔西县| 长宁区| 平邑县| 太和县| 通河县| 西丰县|