国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于貝葉斯網(wǎng)絡(luò)的出行者目的地選擇行為建模與應(yīng)用

2015-08-17 07:55高晶鑫雋志才倪安寧
系統(tǒng)管理學(xué)報(bào) 2015年1期
關(guān)鍵詞:行者命中率效用

高晶鑫 ,雋志才,倪安寧

(1.上海交通大學(xué) 安泰經(jīng)濟(jì)與管理學(xué)院,上海 200052;2.上海交通大學(xué) 船舶與海洋工程學(xué)院,上海 200240)

出行目的地選擇研究是基于活動(dòng)的出行行為預(yù)測(cè)模型研究中的重要組成部分,也是從非集計(jì)層面進(jìn)行交通需求分析的研究重點(diǎn)。20世紀(jì)70年代以來,國(guó)內(nèi)外關(guān)于非集計(jì)行為模型的理論研究取得了很大的進(jìn)展,逐步邁向?qū)嵱没A段。目前,國(guó)內(nèi)外非集計(jì)模型在交通領(lǐng)域的研究和應(yīng)用主要還集中于方式劃分、停車行為、路徑選擇、旅游交通、目的地選擇集合確定、數(shù)據(jù)調(diào)查和參數(shù)標(biāo)定等內(nèi)容。而關(guān)于城市居民出行目的地選擇模型的研究還相對(duì)較少,在目前大部分交通規(guī)劃項(xiàng)目中,集計(jì)層面的出行分布模型仍然占主導(dǎo)地位,目的地非集計(jì)選擇模型應(yīng)用沒有得到有效推廣。然而,由于非集計(jì)行為模型自身的特點(diǎn)和優(yōu)勢(shì),隨著對(duì)目的地選擇模型研究的深入,它作為集計(jì)分布模型的代替或補(bǔ)充,將會(huì)越來越多地被應(yīng)用到工程實(shí)踐中去。本文即是從非集計(jì)層面,應(yīng)用貝葉斯網(wǎng)絡(luò)學(xué)習(xí)方法,對(duì)目的地選擇模型進(jìn)行實(shí)證研究,為目的地選擇模型的推廣和應(yīng)用進(jìn)行積極的探索。

1 目的地選擇模型簡(jiǎn)介

1.1 離散選擇模型

離散選擇模型最初由MacFadden在1974年提出,并對(duì)Logit模型進(jìn)行了詳細(xì)的描述與分析,形成了離散選擇模型的理論體系[1]。而離散選擇模型是以隨機(jī)效用理論為前提展開分析的,隨機(jī)效用理論作為非集計(jì)行為模型的理論基石,它是以概率論為基礎(chǔ),用來解決多方案選擇問題。隨機(jī)效用理論來源于古典微觀經(jīng)濟(jì)消費(fèi)理論,在經(jīng)濟(jì)學(xué)中,效用的定義有多種。簡(jiǎn)單的說,效用是指消費(fèi)者從消費(fèi)選擇中獲得的愉快,或者需求得到的滿足。在交通問題中如果將出行者的選擇行為視為和消費(fèi)行為具有相類似的原理,那么就可以將效用理論適用于交通問題中的選擇行為。離散選擇模型基于如下假設(shè):

(1)決策者n將在J個(gè)選項(xiàng)中進(jìn)行選擇,無論他選擇哪一個(gè)選項(xiàng)都可以獲得一定水平的效用。決策者,從選項(xiàng)j中獲得的效用稱為Ujn其中,j=1,2,…,J。此效用為決策者自己感知的效用。

(2)由于決策者進(jìn)行的是效用最大化的選擇,故行為模型為決策者n選擇選項(xiàng)i,當(dāng)且僅當(dāng)Uin>Ujn,?j≠i效用最大。

1.2 時(shí)空棱鏡模型

時(shí)空棱鏡是Haigerster[2]提出的時(shí)間地理理論中的重要概念之一,它著重研究在時(shí)間和空間限制下人行為的可能性。時(shí)空棱鏡可通過可視化和數(shù)量確定在一定時(shí)間限制下哪些空間位置的活動(dòng)場(chǎng)所是可達(dá)的。GIS能夠表示實(shí)際復(fù)雜的城市環(huán)境,如城市交通網(wǎng)絡(luò)結(jié)構(gòu)和城市活動(dòng)場(chǎng)所位置的空間分布及其屬性特征,這為操作時(shí)空棱鏡和活動(dòng)目的地的選擇研究提供了便利。

1.3 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)

貝葉斯網(wǎng)絡(luò)學(xué)習(xí)是指通過分析數(shù)據(jù)而獲得貝葉斯網(wǎng)的過程,它包括參數(shù)學(xué)習(xí)和結(jié)構(gòu)學(xué)習(xí)兩方面。參數(shù)學(xué)習(xí)是指已知網(wǎng)絡(luò)結(jié)構(gòu),確定網(wǎng)絡(luò)參數(shù);結(jié)構(gòu)學(xué)習(xí)則是既要確定網(wǎng)絡(luò)結(jié)構(gòu),又要確定網(wǎng)絡(luò)參數(shù)。

結(jié)構(gòu)學(xué)習(xí)一般分兩步討論,即模型選擇和模型優(yōu)化。模型選擇要回答的問題是用何種準(zhǔn)則來評(píng)判不同模型結(jié)構(gòu)之間的優(yōu)劣,而模型優(yōu)化則是要尋找最優(yōu)的模型結(jié)構(gòu)。確定貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的方法是[3]:①選定一組刻畫問題的隨機(jī)變量{X1,X2,…,Xn},隨機(jī)變量即為貝葉斯網(wǎng)絡(luò)中的節(jié)點(diǎn);②選擇一個(gè)變量順序a=〈X1,X2,…,Xn〉;③從 一個(gè)空?qǐng)DG出發(fā),按照順序a逐個(gè)將變量加入圖G中;④在加入變量Xi時(shí),G中的變 量中包 括X1,X2,…,Xi-1。結(jié)構(gòu)學(xué)習(xí)常用的方法有K2算法、爬山法和SEM算法等。由于K2算法在結(jié)構(gòu)學(xué)習(xí)過程中對(duì)數(shù)據(jù)依賴性較低,能夠很好地對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析擬合,本文采用K2算法。

用K2算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)是由Cooper等提出的,并證明了在無約束多項(xiàng)分布、參數(shù)獨(dú)立、采用Dirichlet先驗(yàn)分布和數(shù)據(jù)完整的前提下,參數(shù)向量可以獨(dú)立地更新,數(shù)據(jù)的邊界似然正好等于每一個(gè)i-j節(jié)點(diǎn)對(duì)的邊界似然的乘積。用K2算法學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的基本思想是:先定義一種評(píng)價(jià)網(wǎng)絡(luò)結(jié)構(gòu)模型優(yōu)劣的測(cè)度函數(shù),再?gòu)囊粋€(gè)空網(wǎng)絡(luò)開始,根據(jù)事先確定的節(jié)點(diǎn)次序,選擇使后驗(yàn)結(jié)構(gòu)概率最大的節(jié)點(diǎn)作為該節(jié)點(diǎn)的父節(jié)點(diǎn),依次遍歷完所有的節(jié)點(diǎn),逐步為每一個(gè)變量添加最佳父節(jié)點(diǎn)。

貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)實(shí)質(zhì)上是在已知網(wǎng)絡(luò)結(jié)構(gòu)的條件下,來學(xué)習(xí)每個(gè)節(jié)點(diǎn)的概率分布表。早期貝葉斯網(wǎng)的概率分布表是由專家知識(shí)指定的,然而這種僅憑專家經(jīng)驗(yàn)指定的方法與觀測(cè)數(shù)據(jù)產(chǎn)生較大的偏差。當(dāng)前比較流行的方法是從數(shù)據(jù)中學(xué)習(xí)這些參數(shù)的概率分布,這種數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法具有很強(qiáng)的適應(yīng)性。

貝葉斯網(wǎng)絡(luò)構(gòu)建是通過研究居民活動(dòng)出行決策行為的一般規(guī)律,建立活動(dòng)出行決策行為分析的貝葉斯置信網(wǎng),分析活動(dòng)出行諸多影響因素之間的相互關(guān)系,并分析各影響因素對(duì)活動(dòng)出行決策影響強(qiáng)度和次序,貝葉斯網(wǎng)絡(luò)構(gòu)建的方法主要包括:

(1)利用已經(jīng)獲取的居民出行RP與SP調(diào)查數(shù)據(jù)及路網(wǎng)仿真數(shù)據(jù),應(yīng)用基于活動(dòng)的出行行為分析理論,分析居民的日活動(dòng)安排、出行時(shí)間、方式和路徑選擇的一般規(guī)律,生成備選分析因素集,包括活動(dòng)出行決策行為集和影響因素集2個(gè)集合。

(2)應(yīng)用貝葉斯決策理論,初始化貝葉斯網(wǎng)絡(luò),建立節(jié)點(diǎn)集;分析活動(dòng)出行決策之間的相互作用關(guān)系及各影響因素與決策行為之間的因果關(guān)系,應(yīng)用啟發(fā)式搜尋方法和搜索評(píng)分方法,形成有向連接集,并不斷優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)造有向連接圖。

(3)為各條有向連接添加表示節(jié)點(diǎn)間概率依賴關(guān)系的條件概率分布,形成條件概率集。

(4)基于搜索評(píng)分方法,逐步優(yōu)化生成貝葉斯置信網(wǎng)。

本文即是應(yīng)用K2算法進(jìn)行貝葉斯網(wǎng)絡(luò)學(xué)習(xí)對(duì)城市居民出行目的地選擇行為進(jìn)行分析和預(yù)測(cè)。

2 基于貝葉斯網(wǎng)絡(luò)的目的地選擇流程設(shè)計(jì)

結(jié)合貝葉斯網(wǎng)絡(luò)學(xué)習(xí)理論方法,本文提出一種貝葉斯網(wǎng)絡(luò)學(xué)習(xí)與仿真方法組合的目的地選擇預(yù)測(cè)仿真流程。出行者目的地選擇行為的預(yù)測(cè)仿真流程中,由于其目的地有多種選擇枝,選擇模型的建立較為困難。因此,本文將目的地選擇流程分為3個(gè)階段。具體的流程框架如圖1所示。

2.1 出行備選目的地集合分層

依據(jù)時(shí)空棱鏡約束理論,分析出行者在給定時(shí)間窗約束下的空間約束情況,將備選小區(qū)集合進(jìn)行分層處理。以出行小區(qū)為對(duì)象,統(tǒng)計(jì)該小區(qū)為出行起點(diǎn)的數(shù)據(jù),按到目的地的各備選小區(qū)出行數(shù)從高至低的順序排列,累計(jì)出行頻數(shù),達(dá)到閾值為出行總數(shù)85%的所有小區(qū)入選第1層選擇集合,其余小區(qū)作為第2層備選小區(qū)選擇集合。

圖1 基于貝葉斯網(wǎng)絡(luò)目的地選擇流程設(shè)計(jì)圖

2.2 目的地選擇貝葉斯網(wǎng)絡(luò)分析

對(duì)于第1層備選小區(qū)集合,建立貝葉斯網(wǎng)絡(luò)模型,分析影響目的地選擇因素,根據(jù)貝葉斯參數(shù)學(xué)習(xí)所得的條件概率表確定選擇枝概率。對(duì)于第2層備選小區(qū)集合,由于各個(gè)備選小區(qū)的被選頻數(shù)較少,故采用經(jīng)驗(yàn)分布擬合方法,確定各選擇枝選擇概率。

2.3 目的地選擇仿真檢驗(yàn)與調(diào)整

將數(shù)據(jù)處理階段整理的備選集合分層數(shù)據(jù)讀至仿真系統(tǒng)作為仿真輸入部分。根據(jù)貝葉斯網(wǎng)絡(luò)模型和經(jīng)驗(yàn)概率分布模型,仿真出行者目的地選擇。根據(jù)對(duì)數(shù)概率公式求得各個(gè)選擇枝的選擇概率,并得出集計(jì)層面目的地選擇命中率。分析模型標(biāo)定命中率與仿真命中率,若差異不顯著,則可以按照模型標(biāo)定階段所表述的方法,大規(guī)模處理剩余小區(qū)的個(gè)人出行目的地選擇;若差異較大,需要重新構(gòu)建效用模型進(jìn)行調(diào)整。

目的地選擇模型的建立就是為了能夠?qū)Τ鲂姓叩哪康牡剡x擇情況進(jìn)行分析預(yù)測(cè),只有具有較高的命中率,該模型才具有實(shí)際應(yīng)用的意義和價(jià)值。

命中率的計(jì)算可以從個(gè)人選擇層面和小區(qū)總體選擇層面分別予以分析計(jì)算。個(gè)人選擇層面命中率的定義如下:

首先,將標(biāo)定出的參數(shù)和對(duì)應(yīng)的變量代入概率公式,求的每個(gè)選擇枝的概率Pm。令

式中:HitR和HitRi分別表示全體命中率和選擇枝i的命中率;Jn為個(gè)人n的選擇枝數(shù)目;Ni為選擇枝i的總體樣本數(shù)目。當(dāng)命中率達(dá)到80%時(shí),既可以認(rèn)為模型預(yù)測(cè)效果取得了比較好的結(jié)果[11-12]。

3 模型應(yīng)用

3.1 目的地選擇集合確定

以2008年吉林市居民出行調(diào)查中的出行者非通勤活動(dòng)為數(shù)據(jù)源,從劃分的90個(gè)交通小區(qū)中選取非通勤活動(dòng)出行次數(shù)最多的第57小區(qū)(交通小區(qū)編號(hào)為57)建立模型,該小區(qū)實(shí)際非通勤活動(dòng)出行的目的地小區(qū)選擇范圍以及出行次數(shù)等相關(guān)信息,如表1所示。

表1 第57小區(qū)實(shí)際非通勤出行活動(dòng)目的地小區(qū)選擇信息表 %

由表1數(shù)據(jù)可得,出行次數(shù)在15次以上的8個(gè)目的地小區(qū)所有出行次數(shù)之和占57小區(qū)所有非通勤活動(dòng)出行總量的88.01%,而其他56個(gè)目的地小區(qū)的所有出行僅占出行總量的11.99%,并且有近30個(gè)目的地小區(qū)出行量?jī)H為1次。因此,本文選取表1中的8個(gè)目的地小區(qū)作為57小區(qū)的目的地選擇集合,應(yīng)用貝葉斯網(wǎng)絡(luò)學(xué)習(xí)預(yù)測(cè)該目的地選擇集合所包含的1 064次非通勤活動(dòng)出行。

3.2 變量定義

貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法要求數(shù)據(jù)節(jié)點(diǎn)都取離散值,首先要對(duì)居民出行數(shù)據(jù)進(jìn)行離散化預(yù)處理。將數(shù)值屬性的值域劃分為不相交的若干子區(qū)間,每個(gè)子區(qū)間對(duì)應(yīng)一個(gè)離散值,最后將原始數(shù)據(jù)轉(zhuǎn)換為離散值。數(shù)值離散化算法要求能夠自動(dòng)確定從連續(xù)型屬性到離散型屬性的對(duì)應(yīng)關(guān)系[9]。

居民出行數(shù)據(jù)節(jié)點(diǎn)離散條件如表2所示。

3.3 基于貝葉斯網(wǎng)絡(luò)的目的地選擇模型建立

根據(jù)K2算法,結(jié)合離散化初始數(shù)據(jù),建立目的地選擇影響因素貝葉斯網(wǎng)絡(luò)如圖2所示。

3.4 離散選擇模型對(duì)比分析

出行者目的地選擇要受到出行者的個(gè)人屬性、目的地小區(qū)屬性以及出行特征的影響[7-8],本模型中所選取的變量如表3所示。

提取出行數(shù)據(jù)中的相關(guān)變量,應(yīng)用Stata 10.0統(tǒng)計(jì)分析軟件對(duì)變量進(jìn)行處理,進(jìn)行回歸分析[9]?;貧w以第1個(gè)選擇枝作為效用基礎(chǔ)項(xiàng)進(jìn)行模型標(biāo)定。模型標(biāo)定的結(jié)果如表4所示。

由表4模型標(biāo)定結(jié)果可見,所有的變量回歸的T值的絕對(duì)值都在1.96以上,達(dá)到了95%的置信度,而且模型的優(yōu)度比系數(shù)為0.524 5,該系數(shù)達(dá)到0.2以上即可認(rèn)為模型具有較高的精度[10]。分析模型變量以及變量參數(shù),可以得到如下結(jié)論:

表2 各屬性變量定義

圖2 目的地選擇影響因素貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖

表3 C-Logit模型變量定義表

(1)對(duì)照表3、4中的變量變化可知,并不是所有的影響因素對(duì)出行者目的地選擇決策具有顯著影響。尤其是目的地小區(qū)屬性,小區(qū)總體可達(dá)性、小區(qū)就業(yè)可達(dá)性、OD小區(qū)間距離以及小區(qū)土地面積等屬性均對(duì)出行者目的地選擇決策的影響均不顯著。主要原因是這些屬性均與小區(qū)就業(yè)人數(shù)具有較高的相關(guān)性,因此在模型標(biāo)定過程中存在共線性問題而將變量刪除。

表4 模型參數(shù)標(biāo)定結(jié)果

(2)出行者出行方式影響因素對(duì)目的地選擇具有顯著的影響,參照?qǐng)D1目的地小區(qū)分布圖,由表4參數(shù)模型標(biāo)定結(jié)果分析得,選擇步行作為出行方式的出行者更愿意選擇本小區(qū)出行或者臨近小區(qū)出行,而選擇小汽車等出行方式出行的出行者更愿意在較大范圍內(nèi)選擇目的地小區(qū)。

(3)個(gè)人屬性也是影響出行者目的地選擇決策的顯著因素,年齡越小的出行者越愿意選擇較遠(yuǎn)的小區(qū)出行,而男性出行者比女性出行者更愿意選擇較遠(yuǎn)的小區(qū)作為目的地。

(4)出行者在做出目的地選擇時(shí),面對(duì)不同的選擇枝會(huì)受到不同的影響因素的影響,而并不是對(duì)于所有的選擇枝都考慮相同的影響因素,并且同一個(gè)影響因素在不同的選擇枝下對(duì)出行者的決策影響也不一定是相同方向的,這主要由于出行者對(duì)同一個(gè)影響因素在不同的選擇枝下所產(chǎn)生的影響有不同理解。

3.4 模型預(yù)測(cè)效果驗(yàn)證

根據(jù)式(3)中命中率的計(jì)算方法,當(dāng)命中率達(dá)到80%時(shí),既可以認(rèn)為模型預(yù)測(cè)效果取得了比較好的結(jié)果[11-12]。求得本文所建立的目的地選擇模型的命中率如表5所示。

表5 個(gè)人選擇層面目的地選擇模型命中率 %

由表5可知,除基礎(chǔ)效用選擇枝的命中率接近80%以外,本文建立的目的地選擇模型各選擇枝及整體命中率都達(dá)到了80%以上,并具有相對(duì)較高的命中率。

4 結(jié)語(yǔ)

(1)本文沒有應(yīng)用傳統(tǒng)的集計(jì)分析方法,而是從非集計(jì)層面,結(jié)合2008年某城市居民出行調(diào)查中的出行者非通勤活動(dòng)數(shù)據(jù),建立基于條件固定效用的目的地選擇模型,并對(duì)模型變量進(jìn)行解釋說明與參數(shù)標(biāo)定。

(2)通過模型標(biāo)定得出了影響出行者進(jìn)行非通勤活動(dòng)目的地選擇決策的重要因素,并通過命中率指標(biāo)對(duì)模型的預(yù)測(cè)效果進(jìn)行分析,驗(yàn)證了本文建立的目的地選擇模型具有較高的預(yù)測(cè)精度,從而提高了該模型的實(shí)際應(yīng)用價(jià)值。

(3)但本文研究仍存在許多不足之處,如對(duì)出行者出行方式的考慮不夠全面,沒有考慮各個(gè)目的地小區(qū)用地性質(zhì)對(duì)出行者目的地選擇決策的影響,及對(duì)出行者的選擇是基于效用最大化的完全理性假設(shè)的可靠性分析仍需要進(jìn)一步研究和探討。

猜你喜歡
行者命中率效用
做“兩個(gè)確立”的忠實(shí)踐行者
基于文獻(xiàn)回顧的罰球命中率與軀干穩(wěn)定性影響因素研究
逆行者
Cлово месяца
最美逆行者
小學(xué)美術(shù)課堂板書的四種效用
夜夜“奮戰(zhàn)”會(huì)提高“命中率”嗎
2015男籃亞錦賽四強(qiáng)隊(duì)三分球進(jìn)攻特點(diǎn)的比較研究
投籃的力量休斯敦火箭
納米硫酸鋇及其對(duì)聚合物的改性效用