国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶畫像下的在線旅游行程攻略推薦方法

2019-10-21 07:31:14陳浩昕謝雅丹
科學(xué)與財(cái)富 2019年32期
關(guān)鍵詞:用戶畫像大數(shù)據(jù)

陳浩昕 謝雅丹

摘 要:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,在線旅游已擁有最大的旅游市場(chǎng),如何為龐大的用戶群描繪用戶畫像,從而推薦與之匹配的旅游服務(wù),是在線旅游企業(yè)進(jìn)行精準(zhǔn)營銷的重要技術(shù)手段。本文將構(gòu)建基于大數(shù)據(jù)的旅游用戶畫像,為在線旅游行程攻略推薦提供行之有效的可操作方法。

關(guān)鍵詞:大數(shù)據(jù);用戶畫像;在線旅游

引言

“大數(shù)據(jù)”一詞最早于2008年9月在《Nature》出版的??癇ig Date”[1]提出,一面世便受到了學(xué)術(shù)界、各國政府與各企業(yè)的廣泛關(guān)注。Google、Facebook等企業(yè)最先在大數(shù)據(jù)分析領(lǐng)域進(jìn)行了研究,根據(jù)用戶基礎(chǔ)行為數(shù)據(jù),提出了一系列算法與模型,使大數(shù)據(jù)分析可以在多個(gè)領(lǐng)域的廣泛應(yīng)用變?yōu)榭赡堋?/p>

隨著社會(huì)的發(fā)展,旅游業(yè)已成為全球經(jīng)濟(jì)中發(fā)展勢(shì)頭最強(qiáng)勁和規(guī)模最大的產(chǎn)業(yè)之一。如何將大數(shù)據(jù)與旅游發(fā)展相結(jié)合,是在線旅游企業(yè)的研究重點(diǎn)。本文將基于大數(shù)據(jù)下用戶畫像,給予在線旅游行程攻略推薦的幾種方法。

1基于在線旅游軟件的獨(dú)特用戶畫像構(gòu)建

用戶畫像一詞,最早由Alan Cooper在《軟件創(chuàng)新之路》(1988)一書中提出。他認(rèn)為,用戶畫像是根據(jù)用戶人口統(tǒng)計(jì)信息、社交關(guān)系、偏好習(xí)慣和消費(fèi)行為等信息而抽象出來的標(biāo)簽化畫像,是真實(shí)用戶的綜合原型[2]。傳統(tǒng)的基于用戶畫像的旅游情景化推薦,將基層用戶數(shù)據(jù)輸出為用戶畫像標(biāo)簽,采取協(xié)同過濾方法,結(jié)合用戶情景信息建立了不同景點(diǎn)的推薦模型。

但旅游行程攻略不同于簡單的景點(diǎn),需要對(duì)用戶(推薦主體)與行程(被推薦對(duì)象)進(jìn)行標(biāo)簽化,再進(jìn)行標(biāo)簽間的相關(guān)性分析。由于用戶畫像是基于大數(shù)據(jù)技術(shù)的實(shí)際應(yīng)用,在構(gòu)建用戶畫像前,就必須建立相關(guān)的基層數(shù)據(jù)庫。

1.1建立用戶畫像的數(shù)據(jù)庫:DMP

DMP(Data Management Platform),即數(shù)據(jù)管理平臺(tái),是一個(gè)全面的數(shù)據(jù)收集、加工、整合的平臺(tái),是對(duì)大數(shù)據(jù)的一個(gè)分析工具。其核心是通過平臺(tái)層的相關(guān)性算法,通過分析用戶的個(gè)體數(shù)據(jù)、行為數(shù)據(jù)等基層數(shù)據(jù),將用戶的信息、偏好等轉(zhuǎn)換成數(shù)據(jù)標(biāo)簽,再將數(shù)據(jù)標(biāo)簽進(jìn)行劃分和整合,形成一個(gè)個(gè)的用戶群特征,最終輸出為可視化的分析結(jié)果。

利用建立的DMP平臺(tái),互聯(lián)網(wǎng)企業(yè)便可建立自己的數(shù)據(jù)庫與標(biāo)簽庫,根據(jù)構(gòu)建的算法與邏輯來計(jì)算出一系列用戶標(biāo)簽,建立自己的用戶畫像與用戶群。因此標(biāo)簽庫的整理與建立工作是構(gòu)建用戶畫像模型的基礎(chǔ)。

1.2在線旅游用戶畫像標(biāo)簽庫的構(gòu)建

這里我們初步以構(gòu)建靜態(tài)標(biāo)簽庫和動(dòng)態(tài)標(biāo)簽庫的方式構(gòu)建在線旅游用戶的用戶畫像。

1.2.1靜態(tài)標(biāo)簽庫

靜態(tài)標(biāo)簽?zāi)軌蛲ㄟ^用戶提供的信息、能夠獲取的基本信息和通過外部渠道獲取的信息,如用戶實(shí)名制信息、地理位置信息等。靜態(tài)標(biāo)簽庫精確性較高但表征性不明顯,只能給用戶興趣做一個(gè)初步判斷,比如年輕的都市女性,往往有較高的消費(fèi)能力,在推薦策略上可以推薦高規(guī)格的一些內(nèi)容。

①默認(rèn)采集的設(shè)備信息 =(用戶手機(jī)型號(hào),聯(lián)網(wǎng)方式,用戶IP地址與MAC地址,語言,地理位置)

②用戶的基本信息=(用戶的虛擬ID,姓名,性別,電話,生日,身份證號(hào),所屬單位,郵箱,職業(yè))

值得一提的是,用戶關(guān)聯(lián)的網(wǎng)絡(luò)信息,如微信、QQ、微博、支付寶等相關(guān)賬號(hào),應(yīng)作為關(guān)聯(lián)信息而不是靜態(tài)標(biāo)簽進(jìn)入數(shù)據(jù)信息系統(tǒng)之中。

1.2.2動(dòng)態(tài)標(biāo)簽

與靜態(tài)標(biāo)簽相對(duì)的動(dòng)態(tài)標(biāo)簽可以分為兩類:一級(jí)標(biāo)簽是支配用戶行為的淺層特征,二級(jí)標(biāo)簽是決定用戶行為背后的深層邏輯,即具有向量特征的結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)集[3]。

1.2.2.1動(dòng)態(tài)標(biāo)簽庫一級(jí)標(biāo)簽

一級(jí)標(biāo)簽是根據(jù)淺層用戶行為信息簡單總結(jié)得出的標(biāo)簽,取決于用戶點(diǎn)擊、搜索某關(guān)鍵詞的頻率。關(guān)鍵詞的標(biāo)簽庫在添加被推薦對(duì)象時(shí)往往可以通過上傳者、編輯、審查手動(dòng)添加。因此,只需給出評(píng)估旅游行程攻略的幾個(gè)維度,就可作為關(guān)鍵詞庫,與一級(jí)標(biāo)簽一一對(duì)應(yīng)。

旅游行程攻略關(guān)鍵詞庫=(旅游目的地,交通方式,時(shí)間因素,點(diǎn)擊量,酒店品質(zhì),價(jià)格水平,目標(biāo)群體,休閑程度,旅途風(fēng)格,特征)

在構(gòu)建旅游行程關(guān)鍵詞庫之后,便可根據(jù)用戶點(diǎn)擊、瀏覽的關(guān)鍵詞頻率來建立動(dòng)態(tài)標(biāo)簽庫一級(jí)標(biāo)簽:

一級(jí)標(biāo)簽=(自我評(píng)定信息,會(huì)員屬性,瀏覽與點(diǎn)擊,喜愛與收藏,喜歡與討厭,主動(dòng)搜索或多次點(diǎn)擊的內(nèi)容,關(guān)注的內(nèi)容)

1.2.2.2動(dòng)態(tài)標(biāo)簽庫二級(jí)標(biāo)簽

建立二級(jí)標(biāo)簽的目的,是根據(jù)標(biāo)簽將用戶歸納、總結(jié)到某個(gè)理想化的“虛擬人格”中,最終建立用戶畫像模型。在建立二級(jí)標(biāo)簽庫之前,需要根據(jù)人格理論建立理想化的虛擬人格,再利用基于相關(guān)性分析的一級(jí)標(biāo)簽所屬關(guān)鍵詞來評(píng)定虛擬人格幾個(gè)方面的相關(guān)特質(zhì),建立用戶的二級(jí)標(biāo)簽。

人格特質(zhì)模型中運(yùn)用較為廣泛的是“大五人格”理論模型,在多次實(shí)驗(yàn)中體現(xiàn)了穩(wěn)定性(Goldberg,1981[4];Peabody,1987[5]),可以作為衡量人格特質(zhì)的基礎(chǔ)依據(jù)。國內(nèi)學(xué)者張雨青、林微等證明“大五模型”在中國同樣具有適用性[6]。

在參考五大人格量表之后,本文分別在神經(jīng)質(zhì)(Neuroticism)、外向性(Extraversion)、開放性(Openness)、宜人性(Agreeableness)、責(zé)任感(Conscientiousness)五個(gè)維度分別選取了六個(gè)下屬特質(zhì),作為旅游者虛擬人格構(gòu)建的30個(gè)特質(zhì),并在此基礎(chǔ)上建立旅游者虛擬人格的測(cè)量模型。

神經(jīng)質(zhì):N1平靜——焦慮、N2隨和——易怒、N3心態(tài)開朗——易受打擊、N4健談自信——敏感害羞、N5自制力強(qiáng)——沖動(dòng)、N6勇敢——脆弱

外向性:E1消極疏遠(yuǎn)——積極熱情、E2孤僻獨(dú)處——熱鬧合群、E3靦腆被動(dòng)——自信果決、E4緩慢——急迫、E5謹(jǐn)慎傳統(tǒng)——冒險(xiǎn)刺激、E6嚴(yán)肅——活潑樂觀

宜人性:A1猜忌悲觀——信任他人、A2精明虛偽——坦誠率真、A3自私勢(shì)利——熱心慷慨、A4攻擊性強(qiáng)——恭順克己、A5傲慢自負(fù)——謙遜謙卑、A6理性冷靜——友好熱心

開放性:O1理性現(xiàn)實(shí)——充滿幻想、O2審美疲乏——藝術(shù)敏感、O3情感遲鈍——情緒敏感、O4守舊傳統(tǒng)——求新求異、O5思辨力弱——思路開闊、O6尊崇權(quán)威——挑戰(zhàn)傳統(tǒng)

責(zé)任感:C1自卑——自信、C2雜亂無序——高效條例、C3不負(fù)責(zé)的——可信賴的、C4沒有目標(biāo)——有抱負(fù)的、C5容易放棄——高度自律、C6沖動(dòng)草率——深思熟慮

由于數(shù)據(jù)計(jì)算基于定量關(guān)系,在構(gòu)建用戶虛擬人格時(shí),以上列舉的30個(gè)特質(zhì)都必須轉(zhuǎn)化成數(shù)值進(jìn)行分析。每位用戶的初始特質(zhì)分?jǐn)?shù)為0,不同的一級(jí)標(biāo)簽為該指數(shù)加分或減分,數(shù)值大小由基于相關(guān)性分析得到的相關(guān)性系數(shù)的大小來確定。最終形成一個(gè)位于(-100,100)區(qū)間內(nèi)的分?jǐn)?shù)。當(dāng)分?jǐn)?shù)位于(-100,-50)或(50,100)的區(qū)間內(nèi)時(shí),系統(tǒng)將會(huì)將此特質(zhì)決定的二級(jí)標(biāo)簽打在用戶身上,成為構(gòu)建用戶畫像的一個(gè)特質(zhì)標(biāo)簽。

當(dāng)一級(jí)標(biāo)簽的數(shù)量足夠多時(shí),就可以精準(zhǔn)地描繪用戶的某個(gè)特征;當(dāng)各特征值足夠多的時(shí)候,就會(huì)將用戶歸納到一個(gè)“虛擬人格”中,系統(tǒng)就可以為此一類用戶精準(zhǔn)推送內(nèi)容或廣告。

1.3構(gòu)建用戶畫像與標(biāo)簽庫算法的計(jì)算核心——相關(guān)性分析

利用Python計(jì)算兩數(shù)組間相關(guān)性是其中的一個(gè)方法:當(dāng)用戶點(diǎn)擊了一個(gè)帶有多個(gè)關(guān)鍵詞的詞條,以各個(gè)關(guān)鍵詞的點(diǎn)擊量與其他點(diǎn)擊了該詞條用戶帶有的各標(biāo)簽頻率關(guān)系做相關(guān)性分析,就可以選出相應(yīng)的標(biāo)簽為此用戶添加:

①建立數(shù)組:首先,根據(jù)各關(guān)鍵詞的點(diǎn)擊量與其他點(diǎn)擊了該詞條用戶帶有的各標(biāo)簽頻率建立兩個(gè)數(shù)組

print(a)>> [A1,B1,C1……]

print(b)>> [A2,B2,C2……]

②期望

由于兩數(shù)組中數(shù)據(jù)一般為離散型隨機(jī)變量,因此采用離散型隨機(jī)變量公式:

③離散度:即標(biāo)準(zhǔn)差與方差,同樣采用離散型隨機(jī)變量公式。

④協(xié)方差與相關(guān)系數(shù)

接下來開始計(jì)算兩組數(shù)據(jù)的相關(guān)性,一般采用相關(guān)系數(shù)來描述兩組數(shù)據(jù)的相關(guān)性。

協(xié)方差:

相關(guān)系數(shù):

同樣,除了利用Python計(jì)算相關(guān)性關(guān)系外,也可使用NumPy計(jì)算協(xié)方差矩陣相關(guān)系數(shù)、使用pandas計(jì)算協(xié)方差與相關(guān)系數(shù)、利用SPSS軟件分析變量間的相關(guān)性關(guān)系[7]等方法來實(shí)現(xiàn)算法構(gòu)建。

2基于用戶畫像的旅游行程攻略推薦方法

2.1針對(duì)單個(gè)攻略的推薦方法

由于被推薦對(duì)象是單個(gè)的文本內(nèi)容,對(duì)于分析其關(guān)鍵詞與目標(biāo)群體特質(zhì)相對(duì)簡單,因此采用基于內(nèi)容的推薦方法?;趦?nèi)容的推薦算法是一種擴(kuò)展的信息過濾技術(shù)[8]:

傳統(tǒng)的基于內(nèi)容的推薦方法只能根據(jù)用戶畫像標(biāo)簽進(jìn)行文本相似度計(jì)算給出敏感程度高的資源。由于沒有將用戶的虛擬人格融入到推薦方法中,不能預(yù)測(cè)用戶的興趣趨向。因此在本文研究中,將加入目標(biāo)群體與虛擬人格之間的特質(zhì)標(biāo)簽,以減少該方法的缺陷。

假設(shè)參與推薦的推薦主體為用戶群U,每位用戶已被賦予的標(biāo)簽集合為T。被推薦對(duì)象為內(nèi)容C,被推薦對(duì)象已被賦予的關(guān)鍵詞為集合K,目標(biāo)群體為u1(u1∈U)。

通過相關(guān)性分析計(jì)算K與T中各標(biāo)簽的相關(guān)性系數(shù)P、u1的人格特質(zhì)數(shù)值與T數(shù)值的相關(guān)性系數(shù)Q,將計(jì)算得出的兩數(shù)值P、Q通過權(quán)重計(jì)算得出最終指數(shù)I,指數(shù)I即為每位用戶對(duì)該被推薦對(duì)象的敏感指數(shù)。然后設(shè)立一闕值It,將此內(nèi)容推送給敏感指數(shù)I≥It的用戶。最后比較目標(biāo)群體的平均指數(shù)Ii與It之間的大小關(guān)系,反復(fù)調(diào)整闕值It,最終確立It的大小。

2.2針對(duì)單個(gè)用戶的推薦方法

在建立了用戶畫像與虛擬人格之后,用戶帶有大量的標(biāo)簽與信息可供計(jì)算分析,面對(duì)資源庫中海量的資源,傳統(tǒng)的基于內(nèi)容的推薦法不能適應(yīng)用戶多變的性格特質(zhì),也不能挖掘用戶的未知領(lǐng)域。因此,當(dāng)針對(duì)單個(gè)用戶的推薦方法時(shí),目前使用范圍最廣泛、使用次數(shù)最多的協(xié)同過濾推薦法是一種優(yōu)先選擇。也就是,我們可以運(yùn)用基于用戶的協(xié)同過濾推薦算法和基于資源的協(xié)同過濾的推薦算法。

2.2.1基于用戶的協(xié)同過濾算法

假設(shè)用戶A的一級(jí)標(biāo)簽為集合T1,包含n1個(gè)一級(jí)標(biāo)簽,二級(jí)標(biāo)簽為集合K1;用戶B的一級(jí)標(biāo)簽為集合T2,包含n2個(gè)一級(jí)標(biāo)簽,二級(jí)標(biāo)簽為集合K2。

T1∩T2=T∩,T∩中包含的標(biāo)簽數(shù)量記為n∩,α= n∩/n1,β=n∩/n2。

根據(jù)構(gòu)建虛擬人格時(shí)所構(gòu)建的30個(gè)特質(zhì),集合K1、K2各包含30個(gè)數(shù)值。因此數(shù)集K1、K2可以根據(jù)1.3中給出的相關(guān)性分析進(jìn)行計(jì)算,得到的相關(guān)性系數(shù)記為η。

若α≥β≥75%,則稱用戶A與用戶B為興趣相似用戶,且用戶A為用戶B的興趣類型用戶;若η≥75%,則稱用戶A與用戶B為人格相似用戶。

在為用戶A推薦項(xiàng)目資源時(shí),可以推薦其興趣相似用戶B喜愛的項(xiàng)目;在預(yù)測(cè)A喜愛的項(xiàng)目資源時(shí),可以推薦其人格相似用戶B喜愛的項(xiàng)目。

2.2.2基于項(xiàng)目的協(xié)同過濾算法

假設(shè)用戶A喜歡的項(xiàng)目為C1,C1包含的關(guān)鍵詞集合為K1,包含m1個(gè)關(guān)鍵詞,關(guān)鍵詞能夠決定的特質(zhì)數(shù)值的集合為U1;存在項(xiàng)目C2,C2包含的關(guān)鍵詞集合為K2,包含m2個(gè)關(guān)鍵詞,關(guān)鍵詞能夠決定的特質(zhì)數(shù)值集合為U?2。

K1∩K2=K∩,K∩中包含的標(biāo)簽數(shù)量記為m∩,α= m∩/m1,β=m∩/m2。

根據(jù)構(gòu)建虛擬人格時(shí)所構(gòu)建的30個(gè)特質(zhì),集合U1、U?2共包含30個(gè)數(shù)值。因此數(shù)集U1、U?2可以根據(jù)1.3中給出的相關(guān)性分析進(jìn)行計(jì)算,得到的相關(guān)性系數(shù)記為η。

若α≥β≥75%,則稱項(xiàng)目C1與項(xiàng)目C2為內(nèi)容相似項(xiàng)目,且項(xiàng)目C1為項(xiàng)目C2的內(nèi)容類型項(xiàng)目;若η≥75%,則稱項(xiàng)目C1與項(xiàng)目C2為目標(biāo)群體相似項(xiàng)目。

在為用戶A推薦項(xiàng)目資源時(shí),可以將與項(xiàng)目C1內(nèi)容相似的項(xiàng)目C2推薦給用戶;在預(yù)測(cè)A喜愛的項(xiàng)目資源時(shí),可以將與項(xiàng)目C1人格相似的項(xiàng)目C2推薦給用戶。

3結(jié)束語

本文基于大數(shù)據(jù)下的用戶畫像,構(gòu)建了在線旅游虛擬人格模型,為個(gè)性化旅游行程攻略推薦提供了方法。首先,根據(jù)用戶行為數(shù)據(jù)、用戶基本屬性構(gòu)建用戶靜態(tài)標(biāo)簽、動(dòng)態(tài)標(biāo)簽與虛擬人格,然后結(jié)合推薦內(nèi)容的關(guān)鍵詞,利用多種算法進(jìn)行相關(guān)性分析,最后根據(jù)基于內(nèi)容、用戶、項(xiàng)目等被推薦對(duì)象給出了不同的推薦方法。在一定程度上為解決在線旅游企業(yè)旅游行程攻略解決了實(shí)際性問題,對(duì)于其他領(lǐng)域構(gòu)建網(wǎng)絡(luò)虛擬人格也提供了思路。

參考文獻(xiàn):

[1]Bigdata.Nature,2008,455(7209):1-136

[2]Alan Copper,劉瑞挺. 軟件創(chuàng)新之路[M].北京: 電子工業(yè)出版社,2001.

[3]謝康,吳記,肖靜華:基于大數(shù)據(jù)平臺(tái)的用戶畫像與用戶行為分析. 中國信息化 2018-03-10

[4]Goldberg,L. R. Developing taxonomy of trait-descriptive terms[J] Problems with languageimprecision;New directions for methodology of social and behavioral seienee,1981,9:43-65.

[5]Peabody,D. Selectingrepresentative trait adjectives[J]. Journal of personality and SocialPsychology,1987,52:59-1

[6]張雨青,林微,陳仲庚:家長對(duì)子女人格特點(diǎn)的自由描述明[J].心理學(xué)報(bào),1995,3:281-286.

[7]孫逸敏:利用 SPSS 軟件分析變量間的相關(guān)性1008—3588(2007)02 -0120 -04

[8]Di Jiaqi, Wang Nihong. Incremental collaborative filtering algorithm based on GridGIS [J]. Computer Science,2013,40(12):219-222.

[9]陶俊, 張寧. 基于用戶興趣分類的協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2011, 20(5):55-59.

作者簡介:

陳浩昕,男(2000,4——),山西太原人,成都信息工程大學(xué),2017級(jí)旅游管理本科生在校學(xué)生,研究方向:旅游管理。

謝雅丹(指導(dǎo)教師)女,(1979,8——),四川自貢人,成都信息工程大學(xué),博士,講師,研究方向:文化遺產(chǎn)與旅游開發(fā);智慧旅游;會(huì)展旅游。

猜你喜歡
用戶畫像大數(shù)據(jù)
貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
把聲音的魅力發(fā)揮到極致
中國廣播(2017年1期)2017-02-21 13:40:10
移動(dòng)用戶畫像構(gòu)建研究
基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營銷
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
移動(dòng)互聯(lián)網(wǎng)下手機(jī)用戶使用行為特征的研究
一種基于內(nèi)容的新聞推薦系統(tǒng)實(shí)例
类乌齐县| 大厂| 金阳县| 阿城市| 内江市| 陆川县| 遂宁市| 治县。| 太原市| 嘉黎县| 加查县| 桂阳县| 探索| 台安县| 年辖:市辖区| 张家港市| 揭阳市| 宜良县| 凤山县| 三穗县| 河池市| 花垣县| 河南省| 丹东市| 石河子市| 三原县| 乐山市| 抚远县| 北京市| 通城县| 紫阳县| 和龙市| 佛坪县| 额济纳旗| 兴业县| 大英县| 莎车县| 博野县| 呼伦贝尔市| 奈曼旗| 昆山市|