国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型

2019-02-20 02:07徐濤張繼水盧敏
現(xiàn)代電子技術(shù) 2019年4期

徐濤 張繼水 盧敏

關(guān)鍵詞: 共同出行關(guān)系; 潛在出行意圖; 航線需求; Gibbs采樣; 旅客價(jià)值; RFM模型

中圖分類號(hào): TN964?34; TP399 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)04?0143?05

A passenger value discovery model based on potential trip purposes

XU Tao1,2, ZHANG Jishui1,2, LU Min1,2,3

(1. College of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China;

2. Information Technology Research Base of Civil Aviation Administration of China, Civil Aviation University of China, Tianjin 300300, China;

3. Key Laboratory of Machine Intelligence and Advanced Computing, Sun Yat?sen University, Guangzhou 510275, China)

Abstract: How to identify passengers with different values is an important issue that the airlines are faced with their targeted marketing. The trip purposes of passengers are concealed in the massive passenger trip data. In the current passenger value evaluation methods, passengers are regard as independent individuals, and only passengers′ trip data is used to calculate passengers′ values, which ignores the influence of passengers′ potential trip motivations on passengers′ values. Aiming at this status quo, a passenger value discovery model based on potential trip purposes is proposed. In the model, Gibbs sampling is used to resolve passengers′ potential trip purposes influenced by passengers′ joint travel relationship. The passengers′ future airline demands are calculated according to the distribution of passengers′ potential trip purposes. The passengers′ values are obtained by combining passengers′ history flight booking frequencies and airlines′ market occupancy of air routes. The experimental results show that the passenger value discovery model based on the potential trip purposes can effectively identify passengers′ values.

Keywords: joint travel relationship; potential trip purpose; airline demand; Gibbs sampling; passenger value; RFM model

0 ?引 ?言

隨著我國(guó)經(jīng)濟(jì)高速增長(zhǎng)和國(guó)民收入普遍提高,航空旅行逐步成為一種大眾化的出行方式。如何識(shí)別不同旅客的價(jià)值是航空公司爭(zhēng)奪優(yōu)質(zhì)旅客資源急需解決的重要問(wèn)題。

傳統(tǒng)的旅客價(jià)值度量方法有次數(shù)法、里程法以及RFM(Recency Frequency Monetry)模型。次數(shù)法和里程法分別通過(guò)累計(jì)旅客乘機(jī)次數(shù)和乘機(jī)里程度量旅客價(jià)值;RFM模型則是通過(guò)旅客最近一次乘機(jī)日期、旅客乘機(jī)頻次、旅客乘機(jī)花費(fèi)金額三個(gè)指標(biāo)加權(quán)度量旅客個(gè)體的價(jià)值。Chen Sien等通過(guò)乘機(jī)往返關(guān)系推斷旅客的SOW(Share of Wallet),提出利用乘機(jī)頻率、消費(fèi)金額、艙位級(jí)別、旅客影響力4個(gè)維度計(jì)算旅客價(jià)值[1]。這些方法僅利用旅客個(gè)體的歷史出行數(shù)據(jù),計(jì)算旅客當(dāng)前實(shí)際產(chǎn)生的價(jià)值,把每一個(gè)旅客當(dāng)作彼此不相關(guān)聯(lián)的獨(dú)立實(shí)體。然而,在現(xiàn)實(shí)生活中,旅客基于一定的潛在出行意圖出行,潛在出行意圖客觀存在且被所有旅客共享,可以通過(guò)大規(guī)模旅客出行數(shù)據(jù)得到民航旅客出行背后隱藏的潛在出行意圖。另一方面,具有共同出行關(guān)系的旅客之間的潛在出行意圖相互影響,準(zhǔn)確發(fā)現(xiàn)旅客潛在出行意圖分布為預(yù)測(cè)旅客未來(lái)航線需求提供了依據(jù)。因此,旅客價(jià)值計(jì)算不能忽略旅客潛在出行意圖和旅客關(guān)系的影響。

近些年,隨著網(wǎng)絡(luò)購(gòu)物的蓬勃發(fā)展,用戶的消費(fèi)意圖分析應(yīng)運(yùn)而生。消費(fèi)意圖分析是指用戶通過(guò)文本內(nèi)容或行為表達(dá)出對(duì)某一產(chǎn)品或服務(wù)產(chǎn)生的購(gòu)買意愿,圍繞消費(fèi)意圖分析可分為基于文本內(nèi)容的消費(fèi)意圖分析和基于用戶偏好的消費(fèi)意圖分析[2]。

針對(duì)民航旅客訂票數(shù)據(jù)集PNR(Passenger Name Record),沒(méi)有明確的文本觸發(fā)詞如“想去”表達(dá)旅客出行愿望,因此旅客潛在出行意圖發(fā)現(xiàn)不同于一般的基于文本內(nèi)容的顯示消費(fèi)意圖分析。白露等利用詞項(xiàng)查詢圖中查詢和查詢間的相互關(guān)系來(lái)影響查詢中單詞的產(chǎn)生方式,從而達(dá)到建模查詢意圖的目的[3]。王晶晶等利用LDA(Latent Dirichlet Allocation)模型發(fā)現(xiàn)城市交通旅客出行意圖,根據(jù)旅客出行意圖將旅客分類[4],但是沒(méi)有考慮旅客共同出行關(guān)系對(duì)旅客潛在出行意圖的影響;Lin Youfang等通過(guò)旅客共同出行關(guān)系構(gòu)建社交網(wǎng)絡(luò)并生成基于社交網(wǎng)絡(luò)的新特征,利用這些特征能夠推斷旅客群體的出行意圖,但不能發(fā)現(xiàn)相同群體內(nèi)不同旅客間出行意圖的差別[5]。

不同旅客間潛在出行意圖分布不同,可以用來(lái)發(fā)現(xiàn)旅客未來(lái)航線需求,從而挖掘富有價(jià)值的旅客群體。旅客歷史出行航線記錄與旅客潛在出行意圖的對(duì)應(yīng)關(guān)系為旅客潛在出行意圖發(fā)現(xiàn)提供了可能。彭艦等提出基于潛在出行意圖的民航旅客移動(dòng)模型,將旅客潛在出行意圖轉(zhuǎn)化為各航線的吞吐量分布,通過(guò)分析影響航線吞吐量的因素,得到大量旅客群體的潛在出行意圖的具體描述[6],但沒(méi)有進(jìn)一步發(fā)現(xiàn)旅客潛在出行意圖對(duì)旅客價(jià)值的影響。

針對(duì)以上問(wèn)題,本文提出一種基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型。并將旅客共同出行關(guān)系引入潛在出行意圖發(fā)現(xiàn),通過(guò)旅客潛在出行意圖分布來(lái)計(jì)算旅客未來(lái)航線需求,再結(jié)合旅客歷史乘機(jī)信息和航線信息得到旅客價(jià)值。一方面,旅客共同出行關(guān)系豐富了大量低頻出行旅客的出行信息;另一方面,通過(guò)旅客個(gè)體的潛在出行意圖分布可以預(yù)測(cè)旅客未來(lái)對(duì)所有航線的需求。因此,基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型仍然適用于數(shù)據(jù)稀疏的潛在高價(jià)值旅客。

1 ?相關(guān)工作

主題模型在自然語(yǔ)言處理領(lǐng)域受到廣泛關(guān)注,其核心思想是將主題看成單詞的概率分布,通過(guò)詞在文檔級(jí)別的共現(xiàn)信息抽取出語(yǔ)義相關(guān)的主題集合,并將單詞空間的文檔變換到主題空間[7]。LDA(Latent Dirichlet Allocation)模型是一個(gè)基于文檔獨(dú)立,單詞獨(dú)立的概率生成模型。LDA圖模型如圖1所示。

圖1中:α,β是LDA模型的超參數(shù),[α]反映了隱含主題間的相對(duì)強(qiáng)弱;[β]表示不同主題下單詞出現(xiàn)的概率;[θ]表示每個(gè)文檔的主題分布;[z]是基于多項(xiàng)式分布從[θ]中選擇某一主題的概率;[N]表示文檔包含單詞[w]的總數(shù);M表示文檔集合包含M篇文檔。LDA模型假設(shè)文檔生成包含兩個(gè)過(guò)程:每篇文檔抽取自身主題分布[p(θα)];根據(jù)主題分布抽取主題[p(zθ)],并基于主題產(chǎn)生單詞w。

目前針對(duì)LDA模型的擴(kuò)展主要包括對(duì)參數(shù)的擴(kuò)展,面向特定任務(wù)的擴(kuò)展以及引入上下文信息[7]。LDA模型假設(shè)主題概率分布服從Dirichlet分布,沒(méi)有對(duì)主題之間相關(guān)性進(jìn)行刻畫。然而真實(shí)語(yǔ)料中,不同主題間存在相關(guān)性的現(xiàn)象很普遍。針對(duì)此類改進(jìn)有層級(jí)LDA,CTM(Correlated Topic Model)等;LDA 模型不僅適用于語(yǔ)言處理領(lǐng)域,還可以解決涉及分類、圖像處理、情感分析等領(lǐng)域的問(wèn)題;通過(guò)破壞LDA模型可交換性假設(shè),學(xué)者們提出了RTM(Relational Topic Model)[8]模型,HTMM(Hidden Topic Markov Model)模型等。

利用LDA模型思想進(jìn)行民航旅客價(jià)值發(fā)現(xiàn),則需要將每條航線看作單詞;每位旅客歷史出行航線記錄構(gòu)成一篇文檔,所有旅客的歷史出行航線記錄文檔構(gòu)成語(yǔ)料庫(kù);旅客歷史出行航線記錄文檔的隱含主題即為潛在出行意圖。

同時(shí),民航旅客訂票數(shù)據(jù)集中有大量低頻出行旅客,此類旅客出行頻次低,歷史記錄少,具有長(zhǎng)尾分布特性,其所對(duì)應(yīng)的歷史出行航線記錄文檔為短文本。LDA模型無(wú)法有效挖掘短文本隱含主題,將旅客共同乘機(jī)關(guān)系引入潛在意圖發(fā)現(xiàn)模型,可以豐富短文本信息。

2 ?基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型

民航旅客價(jià)值受旅客歷史乘機(jī)頻率,旅客未來(lái)航線需求以及航空公司航線市場(chǎng)占有率三方面因素影響。未來(lái)航線需求與歷史航線需求不同,對(duì)于旅客歷史出行中沒(méi)有乘坐過(guò)的航線,旅客未來(lái)對(duì)該航線的需求不會(huì)恒為0。為了預(yù)測(cè)旅客未來(lái)航線需求,將旅客在出行中持有的出行目的或動(dòng)機(jī)定義為旅客潛在出行意圖,大量民航旅客群體的潛在出行意圖在民航網(wǎng)絡(luò)中表現(xiàn)為各航線的吞吐量分布[6]。

2.1 ?旅客價(jià)值發(fā)現(xiàn)模型

記[c]表示特定航空公司,[r]表示航線,R表示航空公司[c]開(kāi)辟的航線集合且[R={1,2,…,V}],有M位旅客,[ui]表示第i位旅客,z表示旅客潛在出行意圖,K個(gè)潛在出行意圖。旅客[ui]的價(jià)值可以表示為:

[P(uic)=p(ui)r=1Vp(rui)·p(cr)] ? (1)

式中:[p(ui)]為旅客[ui]歷史乘機(jī)頻率,且

[p(ui)=旅客ui歷史乘機(jī)頻次所有旅客歷史乘機(jī)頻次之和] ? ?(2)

[p(cr)]為航空公司c的航線r市場(chǎng)占有率,且

[p(cr)=航空公司c在航線r上開(kāi)辟航班數(shù)國(guó)內(nèi)所有航空公司在航線r上開(kāi)辟航班總數(shù)] ? (3)

[prui]為旅客未來(lái)對(duì)航線r的潛在需求,即旅客ui基于不同潛在出行意圖z選擇某條航線r的概率,且

[prui=Kprzpzui] (4)

所有旅客的潛在出行意圖分布[pzui]構(gòu)成矩陣[θM×K],所有潛在出行意圖下航線的分布[prz]構(gòu)成矩陣[φK×V]。無(wú)法直接從已知的旅客出行航線數(shù)據(jù)中得出[θ]和[φ],因此引入旅客潛在出行意圖發(fā)現(xiàn)方法來(lái)計(jì)算旅客未來(lái)航線需求。

2.2 ?旅客潛在出行意圖發(fā)現(xiàn)方法

旅客潛在出行意圖發(fā)現(xiàn)基于如下的假設(shè):

1) 旅客[ui]有[Nui]條歷史出行航線記錄,旅客[ui]的第n([n≤Nui])條歷史出行航線記錄[rui,n]([rui,n∈R])基于某種潛在出行意圖[zui,n]。

2) 具有共同出行關(guān)系的旅客間出行意圖分布相似。這兩條假設(shè)簡(jiǎn)單直觀,且符合旅客實(shí)際出行。同LDA主題模型類似,采用航線的吞吐量分布表達(dá)潛在出行意圖,旅客的每一次出行都是產(chǎn)生于某種潛在出行意圖,具體的出行航線蘊(yùn)含了該潛在出行意圖。

此外,旅客潛在出行意圖受旅客間關(guān)系的影響。旅客共同出行活動(dòng)體現(xiàn)了旅客間關(guān)系:共同出行次數(shù)越多的旅客,可能存在某種社會(huì)關(guān)系,其潛在出行意圖分布越相似。而在民航出行中,一些旅客可能互不認(rèn)識(shí),但是具有共同訂票記錄,這樣的旅客間出行意圖分布彼此獨(dú)立,相似性較小。

為了區(qū)分這種虛假的共同出行關(guān)系,根據(jù)民航旅客出行規(guī)律,做如下假設(shè):

1) 在一定時(shí)間內(nèi),旅客[ui]和旅客[uj]在一次10人以上大團(tuán)共同出行。這樣的旅客間共同出行關(guān)系為虛假的共同出行關(guān)系[lui,uj=0],旅客間潛在出行意圖分布差異較大。

2) 在一定時(shí)間內(nèi),旅客[ui]和旅客[uj]在一次10人以內(nèi)的小團(tuán)旅行中出現(xiàn)。小團(tuán)旅行中的旅客基本上是互相認(rèn)識(shí)的熟人,因此,認(rèn)為旅客[ui]和旅客[uj]共同出行關(guān)系是真實(shí)的共同出行關(guān)系[lui,uj=1],旅客間潛在出行意圖分布越相似。

記:

[zui=1Nuikzui,k]

用“[?]”表示兩個(gè)向量的Hadmard乘積。[zui?zuj]度量旅客潛在出行意圖的相似性,[η]是一個(gè)K維向量,[υ]是截距系數(shù)。在傳統(tǒng)lDA模型中引入函數(shù)[8]:

[P(lui,uj=1)=exp(ηT(zui?zuj)+υ)] ? ? (5)

刻畫旅客共同出行關(guān)系對(duì)潛在出行意圖的影響。此時(shí),根據(jù)觀測(cè)到的旅客[ui]與旅客[uj]間共同出行關(guān)系[lui,uj],利用改進(jìn)后的LDA模型,發(fā)現(xiàn)旅客潛在出行意圖。

旅客潛在出行意圖發(fā)現(xiàn)需要求解參數(shù)[θ,φ],即每位旅客的潛在出行意圖分布以及不同潛在出行意圖下航線的吞吐量分布。

利用Collapsed Gibbs Sampling進(jìn)行潛在出行意圖序列的采樣。記所有旅客歷史出行航線記錄構(gòu)成出行航線記錄文檔[r]。

該文檔每條歷史出行航線記錄的潛在出行意圖構(gòu)成向量[z],每次采樣該文檔中第d條航線歷史記錄[rd]的潛在出行意圖[zd],而保持其他分量的值不變。

為了便于Gibbs求解公式的推導(dǎo),引入符號(hào):[rd]表示去除第d條航線歷史記錄后的出行航線記錄文檔,[zd]表示去除第d條航線歷史記錄所對(duì)應(yīng)的潛在出行意圖后的潛在出行意圖向量;[t(i)k]表示所有旅客歷史出行記錄中航線i(i=1,2,…,V)被分配潛在出行意圖k的次數(shù);[n(k)ui]表示旅客[ui]的歷史出行航線記錄中屬于潛在出行意圖k的歷史出行航線記錄個(gè)數(shù);[Nuj:lui,uj=0]表示與旅客[ui]共同出行關(guān)系[lui,uj=0]的旅客[uj]集合大小。

旅客潛在出行意圖發(fā)現(xiàn)Gibbs采樣公式如下:

[p(zd=xzd,rd,rd,l,α,β,η,υ)∝(n(x)ui,d+α)t(rd)x,d+βr=1Vt(r)x,d+Vβ· ? ? ? ? ? ? ? ?exp1NuiPerc(uj,x)· ? ? ? ? ? ? ? ?1-expk=1K(n(k)uiPerc(uj,k))Nui·Nuj:lui,uj=0+υNui·Nuj:lui,uj=0] ? (6)

且[Perc(uj,x)=ηx·uj:lui,uj=0n(x)ujNuj]。

得到每條歷史出行航線記錄的潛在出行意圖后,計(jì)算[θui,x]和[φx,r],且:

[θui,x=n(x)ui+αk=1Kn(k)ui+Kα] ? ? ? ? ?(7)

[φx,r=t(r)x+βr=1Vt(r)x+Vβ] (8)

[prui=x=1Kθui,xφx,r] ? ? ? ?(9)

根據(jù)式(9)得到旅客未來(lái)航線需求,再代入式(1)就可以計(jì)算出旅客對(duì)于航空公司的價(jià)值。

3 ?實(shí)驗(yàn)結(jié)果與分析

3.1 ?數(shù)據(jù)預(yù)處理

實(shí)驗(yàn)采用中國(guó)民航訂票系統(tǒng)中2010年1月—2011年12月某航空公司的PNR旅客訂票數(shù)據(jù)集。根據(jù)2010年旅客訂票數(shù)據(jù)發(fā)現(xiàn)旅客共同出行關(guān)系,通過(guò)旅客價(jià)值發(fā)現(xiàn)模型得到2010年數(shù)據(jù)集中的高價(jià)值旅客,并用2011年數(shù)據(jù)集作為驗(yàn)證集進(jìn)行驗(yàn)證。

3.2 ?評(píng)價(jià)指標(biāo)

通過(guò)不同旅客價(jià)值發(fā)現(xiàn)模型計(jì)算得到2010年數(shù)據(jù)集中的高價(jià)值旅客集合,統(tǒng)計(jì)2011年旅客真實(shí)乘機(jī)次數(shù)得到真實(shí)高價(jià)值旅客集合,比較這兩個(gè)集合的相似性與差異性來(lái)驗(yàn)證本文所提模型的有效性。采用常用的比較兩個(gè)集合A和B之間的相似性與差異性的Jaccard 距離[J(A,B)]來(lái)評(píng)價(jià)實(shí)驗(yàn)效果。計(jì)算方法如下:

[J(A,B)=A?BA?B=A?BA+B-A?B]

3.3 ?模型參數(shù)設(shè)置

對(duì)于旅客價(jià)值發(fā)現(xiàn),超參數(shù)[α]取經(jīng)驗(yàn)值[9?10]為[50K]。[β]是航線r上的平滑參數(shù),當(dāng)[β=0]時(shí),得到的潛在出行意圖完全依賴數(shù)據(jù)集,導(dǎo)致過(guò)度擬合。為了更好地預(yù)測(cè)旅客未來(lái)航線需求,適當(dāng)增大[β]取值避免矩陣[φ]過(guò)于稀疏,選取[β=1,2]。用k表示旅客潛在出行意圖的數(shù)目,無(wú)法直接觀測(cè)。為了獲得最優(yōu)K值,采用余弦距離度量不同出行意圖的相似度,當(dāng)出行意圖間的平均相似度最小時(shí),分類最好,對(duì)應(yīng)的K值最優(yōu)。取不同步長(zhǎng)不同K值分別進(jìn)行旅客出行意圖平均相似度實(shí)驗(yàn)如圖2,圖3所示,可知當(dāng)旅客潛在出行意圖個(gè)數(shù)K=4時(shí),旅客出行意圖平均相似度最小。不同出行意圖下航線吞吐量分布不同,截取不同潛在出行意圖下吞吐量分布最高的前10條航線如表1所示。

3.4 ?實(shí)驗(yàn)比較

分別用次數(shù)法、里程法以及基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型計(jì)算得到2010年旅客價(jià)值排名前N的旅客集合。再統(tǒng)計(jì)得到2011年旅客真實(shí)價(jià)值有序表,截取真實(shí)價(jià)值降序表排名前N的旅客集合,比較這兩個(gè)集合的Jaccard 距離。實(shí)驗(yàn)結(jié)果如圖4所示。

由圖4可見(jiàn),當(dāng)N=2 000時(shí),基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型Jaccard 距離為0.842 469,明顯高于次數(shù)法和里程法。即使當(dāng)N=10 000時(shí),基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型Jaccard 距離為0.534 348,而次數(shù)法和里程法中效果最好的次數(shù)法僅為0.508 296。這是由于里程法和次數(shù)法僅考慮單一因素計(jì)算旅客價(jià)值,沒(méi)有考慮旅客未來(lái)航線需求所引起的旅客價(jià)值變化。而基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型利用Gibbs采樣準(zhǔn)確發(fā)現(xiàn)旅客共同出行關(guān)系影響下的旅客潛在出行意圖,通過(guò)潛在出行意圖分布得到旅客未來(lái)航線需求。綜合考慮了旅客歷史乘機(jī)次數(shù)、航空公司航線市場(chǎng)占有率以及旅客未來(lái)航線需求計(jì)算旅客價(jià)值。

4 ?結(jié) ?語(yǔ)

通過(guò)提出基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型,將潛在出行意圖轉(zhuǎn)化為所有航線的吞吐量分布,并將旅客共同出行關(guān)系引入潛在出行意圖發(fā)現(xiàn)模型,預(yù)測(cè)旅客未來(lái)航線需求。旅客價(jià)值計(jì)算不局限于單一旅客的出行數(shù)據(jù),同時(shí)基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型還包含了由于旅客未來(lái)航線需求的增長(zhǎng)而帶來(lái)的價(jià)值變化。實(shí)驗(yàn)結(jié)果表明,選取旅客價(jià)值降序表排名前2 000的旅客集合,基于潛在出行意圖的旅客價(jià)值發(fā)現(xiàn)模型比次數(shù)法的Jaccard 距離提高了0.078 8。

注:本文通訊作者為張繼水。

參考文獻(xiàn)

[1] CHEN Sien, ZHU Jianping, XIE Qichang, et al. Understanding airline passenger behavior through PNR, SOW and Webtrends data analysis [C]// Proceedings of 1st International Conference on Big Data Computing Service and Applications. Redwood: IEEE, 2015: 323?328.

[2] 付博,劉挺.社會(huì)媒體中用戶的隱式消費(fèi)意圖識(shí)別[J].軟件學(xué)報(bào),2016,27(11):2843?2854.

FU Bo, LIU Ting. Implicit user consumption intent recognition in social media [J]. Journal of software, 2016, 27(11): 2843?2854.

[3] 白露,郭嘉豐,曹雷,等.基于查詢意圖的長(zhǎng)尾查詢推薦[J].計(jì)算機(jī)學(xué)報(bào),2013,36(3):636?642.

BAI Lu, GUO Jiafeng, CAO Lei, et al. Long tail query recommendation based on query intent [J]. Chinese journal of computers, 2013, 36(3): 636?642.

[4] WANG Jingjing, CHEN Xi, CHEN Zhihong, et al. Cluster algorithm based on LDA model for public transport passengers′ trip purpose identification in specific area [C]// Proceedings of International Conference on Intelligent Transportation Engineering. Singapore: IEEE, 2016: 186?192.

[5] LIN Youfang, WAN Huaiyu, JIANG Rui, et al. Inferring the travel purposes of passenger groups for better understanding of passengers [J]. IEEE transactions on intelligent transportation systems, 2015, 16(1): 235?243.

[6] 彭艦,由明陽(yáng),黃飛虎,等.基于潛在出行意圖的民航旅客移動(dòng)模型[J].工程科學(xué)與技術(shù),2017,49(6):107?113.

PENG Jian, YOU Mingyang, HUANG Feihu, et al. Civil Aviation passenger mobility model based on the potential trip purpose [J]. Advanced engineering sciences, 2017, 49(6): 107?113.

[7] 徐戈,王厚峰.自然語(yǔ)言處理中主題模型的發(fā)展[J].計(jì)算機(jī)學(xué)報(bào),2011,34(8):1423?1436.

XU Ge, WANG Houfeng. The development of topic models in natural language processing [J]. Chinese journal of computers, 2011, 34(8): 1423?1436.

[8] CHANG J, BLEI D M. Relational topic models for document networks [C]// Proceedings of the 12th International Conference on Artificial Intelligence and Statistics. Florida: JMLR, 2009: 81?88.

[9] 曹建平,王暉,夏友清,等.基于LDA的雙通道在線主題演化模型[J].自動(dòng)化學(xué)報(bào),2014,40(12):2877?2886.

CAO Jianping, WANG Hui, XIA Youqing, et al. Bi?path online topic evolution model based on LDA [J]. Acta Automatica Sinica, 2014, 40(12): 2877?2886.

[10] 郭藍(lán)天,李揚(yáng),慕德俊,等.一種基于LDA主題模型的話題發(fā)現(xiàn)方法[J].西北工業(yè)大學(xué)學(xué)報(bào),2016,34(4): 698?702.

GUO Lantian, LI Yang, MU Dejun, et al. A LDA model based topic detection method [J]. Journal of Northwestern Polytechnical University, 2016, 34(4): 698?702.