国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于旅客社交網(wǎng)絡(luò)中的家庭出行預(yù)測

2016-03-24 02:43:51張玉桃
現(xiàn)代計算機 2016年8期
關(guān)鍵詞:家庭成員旅客社交

張玉桃

(北京交通大學(xué)計算機與信息技術(shù)學(xué)院,北京 100044)

基于旅客社交網(wǎng)絡(luò)中的家庭出行預(yù)測

張玉桃

(北京交通大學(xué)計算機與信息技術(shù)學(xué)院,北京 100044)

家庭是客運市場最常見的消費單元之一。如果能夠?qū)彝卧谖磥硪欢螘r間是否出行做出準(zhǔn)確的預(yù)測,將有助于客運、旅游等相關(guān)行業(yè)為家庭旅客提供個性化的服務(wù)和相關(guān)產(chǎn)品推薦。預(yù)測一個家庭在未來一段時間是否會出行是一個分類問題。構(gòu)建家庭的人口統(tǒng)計學(xué)特征、歷史行為特征以及預(yù)測時間窗口特征作為分類屬性,使用多種分類算法進行家庭出行的預(yù)測。還構(gòu)建基于共同出行關(guān)系的旅客社交網(wǎng)絡(luò),通過構(gòu)建家庭成員的社交網(wǎng)絡(luò)屬性來進一步描述家庭特征。在一個旅客歷史數(shù)據(jù)集上進行實驗,取得了較好的效果。

旅客社交網(wǎng)絡(luò);家庭出行;行為預(yù)測

0 引言

家庭是社會的基本單位,也是客運領(lǐng)域中最常見的出行消費單元之一。由于家庭出行受到時間、經(jīng)濟等多種因素的影響,因此家庭出行呈現(xiàn)出不確定。如果能夠準(zhǔn)確地預(yù)測出家庭在一個時間段內(nèi)是否出行,將有助于客運、旅行社、酒店等服務(wù)行業(yè)為家庭提供個性化的出行服務(wù)或產(chǎn)品推薦[1]。例如客運公司可以為家庭預(yù)留相鄰座位以提高旅客的滿意度;旅行社可以根據(jù)家庭的出行習(xí)慣為家庭推薦適合的旅行線路等。此外,本研究還可以為相關(guān)組織或者政府提供決策支持。例如當(dāng)?shù)卣梢詤⒖记皝砺糜蔚募彝ツJ剑ǚ蚱蘼糜?、親子旅游)來開發(fā)相應(yīng)的旅游產(chǎn)品,完善基礎(chǔ)設(shè)施[2]和調(diào)整目的地意象(Destination Image)[3]等以促進當(dāng)?shù)亟?jīng)濟發(fā)展。

與此同時,客運企業(yè)信息化水平的提高使得其積累的海量旅客信息和歷史出行信息得以有效利用,為我們從中發(fā)現(xiàn)家庭的出行特征提供了有效地途徑,為預(yù)測家庭出行提供了充分的條件。我們從旅客的歷史出行記錄中提取了旅客間的共同出行關(guān)系,構(gòu)建了旅客社交網(wǎng)絡(luò)。圖1給出一個簡單的旅客社交網(wǎng)絡(luò)及家庭團體示例,括號中的文字分別代表對應(yīng)旅客的性別(F代表女、M代表男)、年齡和出行總次數(shù),邊上數(shù)字代表旅客間共同出行次數(shù),紅色實線代表家庭關(guān)系,藍色點線代表同事關(guān)系,綠色虛線代表朋友關(guān)系。該圖反映了旅客社交網(wǎng)絡(luò)中的旅客間關(guān)系以及家庭內(nèi)部關(guān)系。

圖1 一個簡單的旅客社交網(wǎng)絡(luò)及家庭團體示例

1 基本思想

Smart和Neale[4]認(rèn)為家庭旅游就是屬于家庭行為的一種,而家庭旅游行為是為了創(chuàng)造一種家庭觀念,也就是說擁有一種作為統(tǒng)一的、穩(wěn)定的和有愛的家庭的共同認(rèn)知。Nick Johns和Szilvia Gyimóthy[5]以后現(xiàn)代家庭旅游經(jīng)歷為研究對象,將家庭旅游定義為由家庭成員共同參與,并在度假過程中相互影響的活動。Peercy和McCleary[6]則認(rèn)為,近年來由于家庭結(jié)構(gòu)的變化,部分家庭旅游是由(外)祖父母與孫子(女)同行,有部分家庭旅游是由一對夫婦與孩子及(外)祖父母三代同行,有的是父母雙方帶孩子出游或父母單方(單親父母)與孩子同行。綜合以上研究,本文設(shè)定,家庭出行是指由全部或部分家庭成員參與的,從出發(fā)地向目的地移動的交通行為。

只有預(yù)測一個時間段內(nèi)的家庭出行才有實際意義。因此,要預(yù)測家庭出行,首先要確定預(yù)測時間窗口。本研究將選取一個月為預(yù)測時間窗口。即給定一個當(dāng)前日期,利用當(dāng)前日期之前一年的歷史出行記錄來預(yù)測未來一個月內(nèi)家庭是否會出行。

把家庭出行預(yù)測問題定義為一個傳統(tǒng)的分類問題。我們構(gòu)造了一系列的特征屬性來描述家庭,包括家庭人口統(tǒng)計學(xué)特征(例如家庭人口數(shù)、不同年齡段的小孩個數(shù)等)、家庭歷史出行特征(例如家庭出行次數(shù)、累計出行里程等)、家庭成員歷史出行特征(例如家庭成員出行次數(shù)、家庭成員節(jié)假日出行次數(shù)等)、預(yù)測時間窗口特征(例如是否有節(jié)假日、節(jié)假日長度等)等,然后利用這些特征訓(xùn)練分類器。然而,僅僅利用以上這些特征屬性對家庭出行進行預(yù)測是遠遠不夠的。因為不同的家庭在一些特征上的表現(xiàn)是相似的。

因此,我們從旅客歷史出行信息中提取旅客間的共同出行關(guān)系,構(gòu)建一種特定類型的大規(guī)模旅客社交網(wǎng)絡(luò)。該網(wǎng)絡(luò)可以在某種程度上反映旅客之間的社會關(guān)系。我們利用旅客間的社會關(guān)系來設(shè)計描述不同家庭的特征屬性。一個家庭的出行在一定程度上可能會受到在周圍社會關(guān)系的影響,而且關(guān)系強度不同,影響效果也不同。

2 問題定義

本節(jié)中,我們將給出一些必要的定義,并對要研究的問題形式化。

定義1:旅客社交網(wǎng)絡(luò)旅客社交網(wǎng)絡(luò)用于表示旅客間的關(guān)系和強度??梢苑柣癁镚={V,E},其中,V表示所有節(jié)點的集合,pi表示一個旅客,且pi∈V;E表示網(wǎng)絡(luò)中所有的邊的集合,每條邊代表旅客間的社會關(guān)系。

定義2:家庭旅客網(wǎng)絡(luò)中的家庭是指同屬于一個社會家庭的部分或者全部旅客集合??梢远x如下:CF=(VF,EF),其中VF是家庭成員集合,且VF∈V;EF家庭成員間關(guān)系的集合,且EF∈E。

定義3:旅客個體屬性及出行記錄集合家庭旅客出行記錄集合是家庭旅客出行信息總和??梢苑柣癁镽P={V,AV,AVH},其中,V表示所有旅客個體的集合;AV表示旅客個體自身屬性的集合,例如年齡、性別等;AVH表示旅客歷史出行記錄的結(jié)合,例如歷史出行次數(shù)、累計出行里程等。

定義4:家庭屬性及出行記錄集合家庭出行記錄集合是指家庭中兩個或兩個以上的旅客出行的家庭出行信息總和??梢苑柣癁镽F={CF,AC,ACH},其中,CF表示家庭的集合;AC表示家庭自身屬性的集合,例如家庭人口數(shù),各年齡段小孩的個數(shù)等;ACH表示家庭歷史出行記錄的結(jié)合,例如家庭歷史出行次數(shù),累計出行里程等。

與德國漢斯-賽德爾基金會等國外機構(gòu)就土地整理與空間規(guī)劃問題進行國際研討,達成青州市南張樓區(qū)域發(fā)展項目執(zhí)行協(xié)議。圖為德國專家為南張樓村題詞。

問題1:如何預(yù)測家庭在未來的一個時間窗口是否出行:在構(gòu)建了旅客社交網(wǎng)絡(luò)G={V,E}之后,可以獲得家庭出行特征屬性集A={AB,AG,W},其中AB表示家庭的基本屬性集合,包括家庭人口數(shù)、各個年齡階段的小孩個數(shù)等的自然屬性,也包括飛行次數(shù),飛行里程等的歷史行為屬性等;AG表示家庭中旅客網(wǎng)絡(luò)關(guān)系屬性集合,包括家庭旅客與其他旅客間關(guān)系、家庭旅客所在社交網(wǎng)絡(luò)結(jié)構(gòu)等。W表示預(yù)測時間窗口的屬性,包括是否有節(jié)假日,節(jié)假日的長度等。根據(jù)特征屬性值,我們可以設(shè)計預(yù)測家庭是否出行的函數(shù),通過計算函數(shù)值來預(yù)測家庭是否會出行(函數(shù)結(jié)果只有兩種取值,0為不出行,1為出行),其預(yù)測函數(shù)如下:

為了方便后續(xù)描述,表1列出了本文所用的相關(guān)記號。

3 方法

要解決家庭出行預(yù)測這個分類問題,需要構(gòu)建家庭的特征屬性來描述家庭。首先構(gòu)造家庭的基本屬性,包括人口統(tǒng)計學(xué)特征,家庭人口單人出行特征,家庭出行特征和預(yù)測時間窗口特征。由于基本屬性不能全面準(zhǔn)確描述不同類型的家庭,我們構(gòu)造了旅客社交網(wǎng)絡(luò),來構(gòu)建家庭的網(wǎng)絡(luò)屬性,更加全面地對旅客團體進行描述。

表1 本文用到的記號

民客運商的旅客信息系統(tǒng)中記錄了旅客的所有歷史出行記錄。每條記錄記載了一個旅客組g一起購票和出行事實。我們根據(jù)出行記錄中的旅客共同購票和出行行為,構(gòu)建旅客社交網(wǎng)絡(luò),該網(wǎng)絡(luò)從某個側(cè)面反映了旅客之間的真實社會關(guān)系。

給定一個出行記錄集合S={gn},我們通過從每個旅客組gn中抽取共同出行關(guān)系來得到旅客社交網(wǎng)絡(luò)G=(V,E),如算法1所示。

算法1:構(gòu)建旅客社交網(wǎng)絡(luò)

(1)基本屬性

基本屬性集的特征屬性屬于實際存在的事實,我們通過分析不同性質(zhì)的家庭可能存在的客觀差異,結(jié)合社會學(xué)相關(guān)方面的知識,構(gòu)造出家庭人口統(tǒng)計學(xué)特征、家庭成員歷史行為特征、家庭歷史行為特征以及時間窗口特征四個方面的特征屬性。

人口統(tǒng)計學(xué)特征是基于旅客的靜態(tài)屬性(比如年齡、性別、籍貫、姓氏等)的統(tǒng)計特征,表2列出了影響家庭出行的部分人口統(tǒng)計學(xué)特征。

表2 部分人口統(tǒng)計學(xué)特征

我們構(gòu)造了一系列家庭成員歷史出行行為特征,如表3所示。

對于家庭整體的歷史出行行為,構(gòu)造了如表4所示的特征。

表3 部分家庭成員旅行特征

表4 家庭整體旅行特征

時間窗口特征用來反映要預(yù)測的時間段的特點,如是否有節(jié)假日,節(jié)假日的天數(shù)以及旺季淡季等,如表5所示。

表5 部分預(yù)測時間窗口特征

(2)網(wǎng)絡(luò)屬性

本文中考慮了幾種常見的邊的網(wǎng)絡(luò)結(jié)構(gòu)特征,其形式化描述如表6所示。

表6 基于網(wǎng)絡(luò)的特征

分類算法是解決分類問題的方法,通過對已知類別訓(xùn)練集的分析,從中發(fā)現(xiàn)分類規(guī)則,以此預(yù)測新數(shù)據(jù)的類別。單一的分類方法主要包括:決策樹、貝葉斯、決策表等;另外還有用于組合單一分類方法的集成學(xué)習(xí)算法,如Bagging算法等。

本文我們將使用C4.5決策樹、隨機森林、貝葉斯網(wǎng)絡(luò)、DecisionTable和Bagging五種傳統(tǒng)分類算法進行家庭在預(yù)測時間窗口內(nèi)的出行預(yù)測。

4 實驗

家庭的出行預(yù)測可以應(yīng)用于多種交通領(lǐng)域。我們從某客運商采集一個旅客歷史出行數(shù)據(jù)集對家庭出行進行預(yù)測。

我們采集的數(shù)據(jù)集包含家庭旅客信息和家庭信息兩個部分。其中家庭旅客信息包括家庭旅客匿名ID、性別和年齡等;家庭信息包括家庭ID、家庭人口數(shù)、家庭出行時間等。其中含有4510名旅客,1510個家庭。

給定一個當(dāng)前日期和一個預(yù)測時間窗口,我們使用前一年的出行記錄,預(yù)測家庭在預(yù)測時間窗口內(nèi)是否會出行。我們標(biāo)注了16832個樣本,其中正樣本14739個,負(fù)樣本2093個。

在實驗中,我們采用邏輯回歸和隨機森林的分類方法。分類過程中進行十重交叉驗證。分別用準(zhǔn)確率、召回率指標(biāo)對兩種方法進行評測。設(shè)TP、TN、FP和FN分別表示正確預(yù)測家庭出行的家庭數(shù)量、正確預(yù)測家庭不出行的家庭數(shù)量、錯誤預(yù)測家庭出行的家庭數(shù)量以及錯誤預(yù)測家庭不出行的家庭數(shù)量,則:

實驗結(jié)果列舉如下:

表7 各種分類方法分類結(jié)果

由以上的實驗結(jié)果可以看出,使用貝葉斯網(wǎng)絡(luò)分類準(zhǔn)確率為78.4%,使用決策表分類的準(zhǔn)確率為88.7%(提高了10.3%),為了更好地比較幾種方法的分類效果,圖2分別給出了它們的ROC曲線,從圖中可以明顯看出在預(yù)測家庭出行問題上,決策表分類算法要優(yōu)于其他幾種分類方法。

5 結(jié)語

本文提出了一種依靠數(shù)據(jù)挖掘中分類手段來預(yù)測家庭是否出行的方法。通過旅客出行記錄中家庭旅客出行信息以及家庭出行歷史數(shù)據(jù),構(gòu)建分類的特征屬性。為了更加全面的描述家庭,本文還通過旅客歷史記錄,構(gòu)建了旅客社交網(wǎng)絡(luò),利用該網(wǎng)絡(luò)反映的旅客間關(guān)系,構(gòu)建了反映旅客出行關(guān)系的網(wǎng)絡(luò)屬性?;谶@些屬性,在一個旅客歷史數(shù)據(jù)集上做了實驗。實驗結(jié)果表明,我們所提出的方法可以有效地預(yù)測旅客社交網(wǎng)絡(luò)中的家庭是否出行。

圖2 分類方法ROC曲線

[1]R.Nicole,J.Carlson,P.J.Rosenberger.Factors Affecting Group-Oriented Travel Intention to Major Events[J].Journal of Travel Tourism Marking,2012,29(2):185-204.

[2]S.I.So,X.Y.Lehto.The Situation Influence of Travel Group Composition:Contrasting Japanese Family Travelers with Other Travel Parties[J].Journal of Travel Tourism Marketing,2007,20:79-91

[3]S.Pike,C.Ryan.Destination Positioning Analysis Through a Comparison Of Cognitive,Affective,Conative Perceptions[J].Journal of Travel Research,2004,42:333-342.

[4]Neale B,Smart C.Agents or Dependants:Struggling to Listen to Children in Family Law and Family Research[M].Centre for Research on Family,Kinship&Childhood,Department of Sociology and Social Policy,University of Leeds,1998.

[5]Johns N,Gyimóthy S.Postmodern Family Tourism at Legoland[J].Scandinavian Journal of Hospitality and Tourism,2003,3(1):3-23.

[6]Peercy M A,Mccleary K W.The Impact of the Year-Round School Calendar on the Family Vacation:An Exploratory Case Study[J]. Journal of Hospitality&Tourism Research,2011,35(2):147-170.

[7]Zalatan A.Wives Involvement in Tourism Decision Processes[J].Annals of Tourism Research,1998,25(4):890-903.

[8]Iso-Ahola S E.Toward A Social Psychological Theory Of Tourism Motivation:A Rejoinder[J].Annals of tourism research,1982,9(2): 256-262.

[9]X.Y.Lehto,Y.-C.Lin,Y.Chen.Family Vacation Activities and Family Cohesion[J].Journal of Travel&Tourism Marketing,2012,29: 835-850.

[10]María José Barlés-Arizón,Elena Fraj-Andrés,Eva Martínez-Salinas.Family Vacation Decision Making:The Role of Woman[J].Journal of Travel&Tourism Marketing,2013,30:873-890.

[11]Y.Lin,H.Wan,R.Jiang,Z.Wu,X Jia.Inferring the Travel Purposes of Passenger Groups for Better Understanding of Passengers[J]. IEEE Transactions on Intelligent Transportation System,2014.DOI:10.1109/TITS.2014.2329422.

[12]D.Jensen,J.Neville,and B.Gallagher.Why Collective Inference Improves Relational Classification[J].Proc.10th SIGKDD,2004,pp. 593-598

[13]S.A.Macskassy and F.Provost.Classification in Networked Data:A Toolkit and a Univariate Case Study[J].Mach.Learn.Res.vol.8. pp.935-983,2007.

[14]R.Kumar,J.Novak,and A.Tomkins.Structure and Evolution of Online Social Networks[J].Proc.12th SIGKDD,2006,pp.611-617.

[15]A.Mislove,M.Marcon,K.P.Gummadi,P.Druschel,and B.Bhattacharjee.Measurement and Analysis of Online Social Networks[J]. Proc.in 7th IMC,2007,pp.29-42.

Predicting the Family Travels Based on Passenger Social Networks

ZHANG Yu-tao

(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044)

Family passenger groups are one of the most popular travel consumption units in the passenger transportation market.If we can make an accurate forecast that if a family will travel over the next period of time,it will help the passenger transportation,tourism and other related industries to provide personalized products or services for families.Family travel prediction is defined as a classification problem. The solution is constructing family’s demographic characteristics,historical behavior characteristics and predicting time window features for a classifier to forecast family travels.We also construct passenger social networks by extracting co-travel relations between passengers from their historical travel records and generate the social network features of family members to further describe the family characteristics.Experiments on a historical passenger travel data set show the efficiency of our method.

Passenger Social Networks;Family Travel;Travel Prediction

1007-1423(2016)08-0025-06

10.3969/j.issn.1007-1423.2016.08.005

張玉桃(1990-),女,山東泰安人,碩士,研究方向為數(shù)據(jù)挖掘、機器學(xué)習(xí)

2015-12-30

2016-02-28

猜你喜歡
家庭成員旅客社交
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
非常旅客意見簿
社交距離
家庭成員的排序 決定孩子的格局
海峽姐妹(2019年7期)2019-07-26 00:50:48
你回避社交,真不是因為內(nèi)向
文苑(2018年17期)2018-11-09 01:29:28
我是人
故事大王(2018年3期)2018-05-03 09:55:52
論蔡和森、李富春革命家庭成員赴法勤工儉學(xué)之原因
湖湘論壇(2016年2期)2016-12-01 04:22:52
給小旅客的禮物
空中之家(2016年1期)2016-05-17 04:47:43
老年人受家庭成員侵害維權(quán)體制改革新論
常德市| 齐齐哈尔市| 滨海县| 灵山县| 蕲春县| 德清县| 耿马| 华池县| 扎囊县| 马鞍山市| 连南| 丘北县| 曲麻莱县| 合水县| 铜山县| 文登市| 大关县| 喀喇| 水城县| 台南市| 翁牛特旗| 怀宁县| 保靖县| 汝州市| 溧水县| 麦盖提县| 泸西县| 梅州市| 德安县| 康平县| 张掖市| 黄骅市| 睢宁县| 蓝田县| 蕲春县| 肃宁县| 华容县| 古浪县| 图木舒克市| 鹿邑县| 衡东县|