国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ST-DCGAN的時(shí)序交通流量數(shù)據(jù)補(bǔ)全

2020-08-03 10:05:40袁瑤瑤牛瑞丞梁文韜李晉源
關(guān)鍵詞:交通流量時(shí)序流量

袁瑤瑤,康 雁,李 浩,牛瑞丞,梁文韜,李晉源

云南大學(xué) 軟件學(xué)院,昆明 650500

1 引言

近年來(lái),隨著共享經(jīng)濟(jì)和智慧城市的發(fā)展,一系列新型時(shí)序城市數(shù)據(jù)應(yīng)運(yùn)產(chǎn)生,如出租車(chē)軌跡數(shù)據(jù)、共享單車(chē)軌跡、人群流量行為等[1]。利用車(chē)載GPS實(shí)時(shí)對(duì)當(dāng)前車(chē)輛采集的軌跡數(shù)據(jù)不僅記錄當(dāng)前車(chē)輛的經(jīng)緯度、時(shí)間、速度、方向以及載客信息[2],同時(shí)也反映了城市人群流量的特點(diǎn)。如何從歷史軌跡數(shù)據(jù)中獲取有價(jià)值的信息,已成為海內(nèi)外學(xué)者關(guān)注的熱點(diǎn)[3]。

現(xiàn)實(shí)生活中,對(duì)出租車(chē)進(jìn)行軌跡數(shù)據(jù)實(shí)時(shí)采集時(shí),會(huì)因?yàn)檐?chē)載GPS的暫時(shí)故障、地區(qū)偏遠(yuǎn)、區(qū)域新建、施工或者人為的處理錯(cuò)誤使得收集的區(qū)域交通流量數(shù)據(jù)是不完整的。數(shù)據(jù)缺失通常包括三種,完全隨機(jī)缺失、隨機(jī)缺失和非隨機(jī)缺失。完全隨機(jī)缺失指的是缺失數(shù)據(jù)是隨機(jī)發(fā)生的,與自身和其他變量之間沒(méi)有關(guān)系;隨機(jī)缺失指缺失數(shù)據(jù)與數(shù)據(jù)集中無(wú)缺失數(shù)據(jù)的取值有關(guān);非隨機(jī)缺失指缺失數(shù)據(jù)同時(shí)與數(shù)據(jù)集中無(wú)缺失數(shù)據(jù)和自身的取值有關(guān),由于交通流量數(shù)據(jù)變化之間是相互影響的,缺失流量數(shù)據(jù)受到其他無(wú)缺失流量數(shù)據(jù)的影響,所以交通流量數(shù)據(jù)的缺失屬于隨機(jī)缺失,包括隨機(jī)點(diǎn)的流量數(shù)據(jù)缺失(圖1(a)、(b))和集中區(qū)域的流量數(shù)據(jù)缺失,論文主要討論集中區(qū)域的中心流量數(shù)據(jù)缺失(圖1(c))和邊緣流量數(shù)據(jù)缺失(圖1(d))[4-8],灰色方塊表示缺失數(shù)據(jù)。

圖1 交通流量數(shù)據(jù)缺失方式

交通流量缺失數(shù)據(jù)的補(bǔ)充,對(duì)實(shí)現(xiàn)智能交通、城市規(guī)劃、環(huán)境和能源的管理有重要意義。最近,GAN模型在生產(chǎn)高質(zhì)量的圖像上顯示出強(qiáng)大的生產(chǎn)能力[9-10],基于該思想,本文將交通流量數(shù)據(jù)的缺失補(bǔ)全看成數(shù)據(jù)生成的問(wèn)題,提出基于時(shí)空特征的ST-DCGAN缺失交通流量數(shù)據(jù)補(bǔ)全,本模型有以下創(chuàng)新點(diǎn):

(1)ST-DCGAN是融合了交通流量時(shí)間相關(guān)性和空間相關(guān)性的DCGAN網(wǎng)絡(luò),將歷史數(shù)據(jù)放到多個(gè)通道中,有效地融合DCGAN的補(bǔ)全特性和交通流量的時(shí)空相關(guān)性。

(2)模型中引入了基于交通流量的補(bǔ)全損失和判別損失作為新的目標(biāo)函數(shù),同時(shí)考慮補(bǔ)全流量圖片的局部相似和全局相似。

(3)引入Mask二值掩碼,模擬任意區(qū)域流量缺失情況,生成缺失流量數(shù)據(jù)時(shí)只需設(shè)置相應(yīng)的掩碼區(qū)域范圍,不需重復(fù)訓(xùn)練網(wǎng)絡(luò),最終達(dá)到流量補(bǔ)全,提高了補(bǔ)全精度,擴(kuò)展了GAN的應(yīng)用。

2 相關(guān)研究

時(shí)序數(shù)據(jù)缺失是數(shù)據(jù)處理普遍存在的問(wèn)題。它對(duì)實(shí)驗(yàn)效果質(zhì)量和結(jié)果穩(wěn)定性的影響較大,是進(jìn)行數(shù)據(jù)挖掘之前所要考慮的首要問(wèn)題。目前國(guó)內(nèi)外時(shí)序缺失數(shù)據(jù)處理的方法包括有補(bǔ)全法和刪除法,由于刪除法可能刪除有價(jià)值的信息,導(dǎo)致實(shí)驗(yàn)結(jié)果的誤差[11-13],所以補(bǔ)全法日益受到重視。對(duì)于時(shí)序交通缺失流量數(shù)據(jù)的補(bǔ)全方法主要包括基于統(tǒng)計(jì)學(xué)方法、基于機(jī)器學(xué)習(xí)方法。

2.1 基于統(tǒng)計(jì)學(xué)方法的數(shù)據(jù)補(bǔ)全

基于統(tǒng)計(jì)學(xué)方法的數(shù)據(jù)補(bǔ)全主要包括均值補(bǔ)全法、最大值補(bǔ)全法、期望值最大法,以及指數(shù)平滑法等[5,14]。文獻(xiàn)[5]總結(jié)常用的交通流量修補(bǔ)方法以及優(yōu)缺點(diǎn),為交通流量數(shù)據(jù)缺失補(bǔ)全提供理論依據(jù)。文獻(xiàn)[14]對(duì)交通流量缺失數(shù)據(jù)處理方法比較分析,并利用美國(guó)加州I-880高速公路交通流數(shù)據(jù)的實(shí)驗(yàn)結(jié)果驗(yàn)證,得到基于指數(shù)平滑法和相鄰車(chē)道數(shù)據(jù)加權(quán)平均法的缺失值修復(fù)結(jié)果最優(yōu)。

2.2 基于機(jī)器學(xué)習(xí)方法的數(shù)據(jù)補(bǔ)全

隨著計(jì)算機(jī)科學(xué)技術(shù)和人工智能的發(fā)展,利用機(jī)器學(xué)習(xí)預(yù)測(cè)對(duì)時(shí)序交通流量缺失數(shù)據(jù)補(bǔ)全方法逐漸被應(yīng)用,文獻(xiàn)[15]提出基于最小二乘支持向量機(jī)的交通流時(shí)間序列數(shù)據(jù)修補(bǔ)模型,并將其與RBF神經(jīng)網(wǎng)絡(luò)模型和非線(xiàn)性回歸模型比較。文獻(xiàn)[16]提出了一種基于聚類(lèi)分析的最鄰近補(bǔ)全算法(GMKNN)對(duì)缺失流量數(shù)據(jù)補(bǔ)全。文獻(xiàn)[17]結(jié)合了最小二乘法的局部修補(bǔ)模型和最大熵的交通狀態(tài)概率分布估計(jì)模型提出一種自適應(yīng)的權(quán)重兩階段缺失交通流量數(shù)據(jù)修補(bǔ)組合模型,實(shí)驗(yàn)結(jié)果表明該方法能夠減少隨機(jī)因素對(duì)交通流量變化的干擾。目前大多數(shù)據(jù)補(bǔ)全方法達(dá)到了對(duì)缺失流量補(bǔ)全的效果,但在補(bǔ)全缺失數(shù)據(jù)時(shí)忽略了交通流量變化的時(shí)空特征,特別是當(dāng)流量數(shù)據(jù)連續(xù)缺失或者路況復(fù)雜時(shí),很難獲得準(zhǔn)確的插值填充缺失的流量數(shù)據(jù),算法的補(bǔ)全效果很差[18]。

2.3 基于GAN網(wǎng)絡(luò)的數(shù)據(jù)補(bǔ)全

近年來(lái),生成對(duì)抗網(wǎng)絡(luò)被廣泛應(yīng)用在缺失人臉圖片的補(bǔ)全,并取得了很好的效果[19-22],文獻(xiàn)[19]提出基于深層生成網(wǎng)絡(luò)的語(yǔ)義修復(fù)模型,并在CelebA、The SVHN和Stanford Cars dataset數(shù)據(jù)集上得到了很好的驗(yàn)證。文獻(xiàn)[20]提出一種使用深度生成模型有效完成面部補(bǔ)全算法,模型通過(guò)定義一個(gè)重建損失,兩個(gè)對(duì)抗損失和語(yǔ)義解析損失確保補(bǔ)全面部缺失的真實(shí)性。文獻(xiàn)[21]提出了基于GAN的多上下文生成對(duì)抗網(wǎng)絡(luò),使網(wǎng)絡(luò)自適應(yīng)地學(xué)習(xí)不同層次損壞圖像的特點(diǎn)并從多角度補(bǔ)全缺失圖片區(qū)域。文獻(xiàn)[22]提出基于上下文編碼器GAN網(wǎng)絡(luò)直接對(duì)圖片缺失區(qū)域進(jìn)行生成,實(shí)驗(yàn)結(jié)果表明該網(wǎng)絡(luò)能很好地預(yù)測(cè)圖片缺失信息。目前基于GAN網(wǎng)絡(luò)的缺失時(shí)序數(shù)據(jù)補(bǔ)全逐漸成為下一個(gè)研究熱點(diǎn),如文獻(xiàn)[23]提出利用GAN網(wǎng)絡(luò)對(duì)含有大量缺失值的多變量時(shí)間序列進(jìn)行缺失值補(bǔ)全。文獻(xiàn)[24]提出基于生成對(duì)抗網(wǎng)絡(luò)的路網(wǎng)交通流量數(shù)據(jù)補(bǔ)全方法,利用GAN網(wǎng)絡(luò)分析實(shí)現(xiàn)對(duì)路網(wǎng)二維信息圖缺失部分的補(bǔ)全。

3 ST-DCGAN數(shù)據(jù)補(bǔ)全

相比較傳統(tǒng)的交通流量缺失數(shù)據(jù)補(bǔ)全模型,由于交通流量時(shí)空特征,即某時(shí)刻某區(qū)域交通流量的變化受其他時(shí)刻流量變化以及該區(qū)域周?chē)范瘟髁孔兓挠绊慬25],本文使用ST-DCGAN網(wǎng)絡(luò)模型結(jié)合交通流量的時(shí)空特性和DCGAN網(wǎng)絡(luò)。

3.1 ST-DCGAN模型

GAN模型的思想來(lái)自于博弈論[26],模型定義判別器和生成器,通過(guò)最大最小博弈過(guò)程優(yōu)化網(wǎng)絡(luò)的參數(shù),其中判別器希望學(xué)習(xí)真實(shí)樣本的分布,對(duì)生成器輸出的樣本判斷為假;生成器希望生成的樣本盡可能與真實(shí)樣本相似,使得判別器判斷不出來(lái),優(yōu)化過(guò)程公式如下:

公式(1)表示優(yōu)化判別器,公式(2)表示優(yōu)化生成器,其中Pdata是真實(shí)樣本的概率分布,Pz是生成器G(z)從輸入隨機(jī)概率分布的采樣,z為潛在空間的隨機(jī)編碼分布[27-28]。

ST-DCGAN模型中DCGAN網(wǎng)絡(luò)結(jié)合GAN和CNN,將生成器和判別器用兩個(gè)改變結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)代替,利用網(wǎng)絡(luò)對(duì)缺失流量數(shù)據(jù)補(bǔ)全時(shí),將流量圖片看作是從一個(gè)高維概率分布中的采樣,當(dāng)生成器從隨機(jī)噪聲分布中選擇的概率分布不同時(shí),就會(huì)產(chǎn)生不同的流量圖像,判別器通過(guò)學(xué)習(xí)真實(shí)流量圖片的特征從而對(duì)生成器生成的圖片進(jìn)行判斷,目的是生成的假圖片盡可能地接近真實(shí)的流量圖片。訓(xùn)練好的ST-DCGAN模型可以學(xué)習(xí)流量圖片的整個(gè)數(shù)據(jù)集的分布特征以及流量數(shù)據(jù)之間的隱式關(guān)系[29-30],ST-DCGAN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

為了能夠抽取交通流量時(shí)間維度上的相關(guān)性,本文將輸入流量圖片的通道數(shù)設(shè)置為3,代表某時(shí)刻T與相鄰時(shí)刻T-1和T+1的流量圖片,設(shè)置不同的輸入通道數(shù),實(shí)驗(yàn)結(jié)果表明當(dāng)輸入的流量通道為3時(shí),能更好地抽取流量圖片時(shí)間維度上的相關(guān)性,其中判別網(wǎng)絡(luò)(D)和生成網(wǎng)絡(luò)(G)訓(xùn)練過(guò)程的參數(shù)變化如表1所示。

圖2 ST-DCGAN網(wǎng)絡(luò)結(jié)構(gòu)圖

表1 判別網(wǎng)絡(luò)和生成網(wǎng)絡(luò)訓(xùn)練過(guò)程參數(shù)變化

3.2 模型目標(biāo)函數(shù)

實(shí)驗(yàn)引入Mask二值掩碼模擬交通流量數(shù)據(jù)的缺失,其中Mask掩碼是與輸入圖片大小相同的0,1矩陣。為了找到最佳的z分布使生成器補(bǔ)全的流量圖片更加接近真實(shí)圖片,ST-DCGAN網(wǎng)絡(luò)要確保補(bǔ)全圖片局部真實(shí)性以及圖片全局的一致性。定義ST-DCGAN目標(biāo)函數(shù)由兩部分組成[19-22]。

(1)補(bǔ)全損失:第一部分盡量使得真實(shí)流量圖片X未缺失流量與生成器輸出的補(bǔ)全圖片對(duì)應(yīng)部分流量數(shù)據(jù)相近,此時(shí)認(rèn)為生成器對(duì)圖片缺失部分的補(bǔ)全效果很好,定義補(bǔ)全損失Lcorrelation()z如下:

(2)判別損失:為了使得補(bǔ)全的圖片與真實(shí)的圖片整體相似,判別器需要對(duì)生成器輸出的補(bǔ)全圖片進(jìn)行判定,將生成器的輸出作為判別器的輸入,定義公式判別損失Ldiscriminate()z如下:

其中,D(G(z) )是判別器對(duì)生成器補(bǔ)全的圖片進(jìn)行判斷,生成器希望生成的補(bǔ)全圖片盡量真實(shí),從而使得判別器判斷錯(cuò)誤。

其中,m是控制補(bǔ)全損失和判別損失的比例函數(shù),實(shí)驗(yàn)的目的是通過(guò)最小化Lloss()z,得到最佳的補(bǔ)全缺失分布z,公式如下:

此時(shí)網(wǎng)絡(luò)生成的補(bǔ)全圖像Xcomplete表達(dá)Xcomplete公式如下:

3.3 算法流程

基于ST-DCGAN的時(shí)序交通流量數(shù)據(jù)補(bǔ)全算法流程如下。

算法輸入:區(qū)域T-1時(shí)刻、T時(shí)刻和T+1時(shí)刻大小為32×32×3的流量圖。

算法輸出:缺失區(qū)域補(bǔ)全流量均方根誤差(RMSE)。

步驟1區(qū)域流量圖像化。

將TaxiBJ數(shù)據(jù)集進(jìn)行圖像化處理生成32×32×3的流量圖像,將GPS獲取的城市人流量數(shù)據(jù)映射到流量圖像網(wǎng)格中,網(wǎng)格中的像素點(diǎn)對(duì)應(yīng)某區(qū)域某時(shí)刻的實(shí)際流量數(shù)據(jù)。

步驟2構(gòu)造ST-DCGAN網(wǎng)絡(luò)算法結(jié)構(gòu)。

南方鄉(xiāng)土建筑營(yíng)造技藝思考中依據(jù)建筑“原”形,劃分營(yíng)造之“圈”,梳理營(yíng)造之“流”,解析營(yíng)造之“變”是對(duì)于整體性研究的總體框架。對(duì)鄉(xiāng)土營(yíng)造技藝研究來(lái)說(shuō),回答關(guān)于源流變遷的問(wèn)題有助于理清營(yíng)造的發(fā)展脈絡(luò)、科學(xué)劃分區(qū)系、積極傳承工藝;對(duì)鄉(xiāng)土建筑的保護(hù)來(lái)講,辨析譜系源流、選取合理的修復(fù)保護(hù)材料、工藝等有理論指導(dǎo)及參考作用;對(duì)建筑史研究而言,深入研究南方鄉(xiāng)土建筑的整體技藝有助于定義南方地區(qū)營(yíng)造在宏大背景下的地位與作用,完善對(duì)其營(yíng)造技藝的認(rèn)知。

訓(xùn)練判別器,學(xué)習(xí)真實(shí)流量數(shù)據(jù)概率分布pdata,訓(xùn)練生成器從輸入隨機(jī)噪聲分布[0,1]中生成潛在空間概率分布pz,使得pz盡可能地接近pdata。在tensorflow環(huán)境下運(yùn)行ST-DCGAN,利用卷積操作和反卷積操作獲取交通流量數(shù)據(jù)的時(shí)空特征。

步驟3定義Mask二值掩碼。

定義三種不同類(lèi)型的Mask掩碼,與真實(shí)流量圖進(jìn)行矩陣運(yùn)算,模擬交通流量的數(shù)據(jù)缺失。

步驟4數(shù)據(jù)補(bǔ)全。

利用步驟3處理好的缺失數(shù)據(jù)流量圖作為步驟2構(gòu)造的ST-DCGNA網(wǎng)絡(luò)輸入,最終找到使生成器補(bǔ)全的流量圖片更加接近真實(shí)流量圖片的概率分布。

步驟5結(jié)束。

算法終止。

4 實(shí)驗(yàn)結(jié)果與分析

4.1 實(shí)驗(yàn)數(shù)據(jù)

TaxiBJ開(kāi)源數(shù)據(jù)集:利用北京TaxiBJ開(kāi)源數(shù)據(jù)集,該數(shù)據(jù)集包括34 000多輛出租車(chē)的軌跡數(shù)據(jù),每半個(gè)小時(shí)統(tǒng)計(jì)一次流量的變化情況,一共有22 459張可以用的時(shí)間間隔[25],實(shí)驗(yàn)過(guò)程中數(shù)據(jù)描述如表2(實(shí)驗(yàn)數(shù)據(jù)下載網(wǎng)址:https://github.com/lucktroy/DeepST/tree/master/data/TaxiBJ)。

表2 實(shí)驗(yàn)數(shù)據(jù)描述表

4.2 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)細(xì)節(jié):實(shí)驗(yàn)過(guò)程中,利用離差標(biāo)準(zhǔn)化將流量數(shù)據(jù)映射到[0,1],目的是可以最大程度地降低數(shù)據(jù)值對(duì)結(jié)果的影響;設(shè)置迭代次數(shù)為100次,學(xué)習(xí)率為0.000 2,采用Adam作為優(yōu)化函數(shù);判別器利用Sigmoid作為最后輸出的激活函數(shù),輸出值在[0,1]之間,目的是對(duì)當(dāng)前的輸入進(jìn)行真假圖片的判斷;生成器利用tanh作為最后輸出的激活函數(shù),保持所有的取值都在[?1,1]區(qū)間內(nèi)。

模型評(píng)估函數(shù):實(shí)驗(yàn)通過(guò)均方根誤差(RMSE)來(lái)測(cè)試模型,公式定義如下:

其中xi表示一個(gè)batch中第i個(gè)實(shí)際的交通流量圖,x?i表示神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值,n是測(cè)試模型的總次數(shù)。

4.3 實(shí)驗(yàn)對(duì)比

實(shí)驗(yàn)用熱力圖表示北京開(kāi)源TaxiBJ數(shù)據(jù)集的分布情況,在熱力圖中黃色越亮表明某時(shí)刻該區(qū)域流量數(shù)據(jù)越大。流量圖片的隨機(jī)缺失率表示某時(shí)刻缺失流量數(shù)據(jù)的概率,實(shí)驗(yàn)設(shè)置流量圖片的隨機(jī)缺失率由小到大分別為0.1、0.2和0.4,實(shí)驗(yàn)分別與基于統(tǒng)計(jì)學(xué)方法、機(jī)器學(xué)習(xí)方法和GAN網(wǎng)絡(luò)方法對(duì)比。

(1)與基于統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法對(duì)比

其中圖3表示基于統(tǒng)計(jì)學(xué)方法的最大值補(bǔ)全法和平均值補(bǔ)全法的補(bǔ)全流量圖,其中Input、Mask和Complete分別表示真實(shí)的流量圖片,模擬缺失的流量圖片和不同方法補(bǔ)全的流量圖片。

從圖3補(bǔ)全流量圖可以看出,隨著流量數(shù)據(jù)缺失率的增加,最大值補(bǔ)全法和平均值補(bǔ)全法補(bǔ)全圖片與真實(shí)流量圖片相差很大,這是因?yàn)楝F(xiàn)實(shí)生活中城市區(qū)域是由不同的功能模塊組成的,比如辦公區(qū)、休閑娛樂(lè)區(qū)、學(xué)校區(qū)域、住宅區(qū)域等,不同區(qū)域在不同的時(shí)間段的流量差別很大且相互影響,比如在辦公區(qū)域的人流量變化主要集中在工作日的上班早高峰以及下班晚高峰,而此時(shí)休閑娛樂(lè)區(qū)的人流量相對(duì)較少,到了夜晚,休閑娛樂(lè)區(qū)域的受到辦公區(qū)、學(xué)校區(qū)域和住宅區(qū)域人流量的涌入流量增加,如果此時(shí)利用區(qū)域最大流量數(shù)據(jù)或者平均流量數(shù)據(jù)補(bǔ)全某區(qū)域缺失流量,會(huì)因?yàn)椴荒艹槿〔煌瑫r(shí)刻交通流量變化特點(diǎn)和遠(yuǎn)近區(qū)域流量相關(guān)性,導(dǎo)致補(bǔ)全圖片與真實(shí)流量圖片相差很大。

實(shí)驗(yàn)同時(shí)對(duì)比不同缺失率下機(jī)器學(xué)習(xí)方法Linear Regression(LR)、Random Forest Regressor(RFR)、Ada-Boost Regressor回歸(ABR)、線(xiàn)性SVR回歸(LSVR)、嶺回歸(Ridge)、Gradient Boosting Regressor回歸(GBR)、KNN方法以及文獻(xiàn)[8]對(duì)時(shí)序缺失數(shù)據(jù)補(bǔ)全的粗粒度插值方法(CG-ST-2SMR)對(duì)缺失流量數(shù)據(jù)的補(bǔ)全RMSE的變化,實(shí)驗(yàn)結(jié)果如表3及圖4。

從表3的RMSE變化可以看出,ST-DCGAN網(wǎng)絡(luò)優(yōu)于其他對(duì)比方法,并且在缺失率0.1時(shí),RMSE為0.019 9,網(wǎng)絡(luò)補(bǔ)全效果最好。其次是Gradient Boosting Regressor方法,Boosting是機(jī)器學(xué)習(xí)中典型的將若干個(gè)弱學(xué)習(xí)器提升為強(qiáng)學(xué)習(xí)器的集成學(xué)習(xí)方法,Gradient Boosting Regressor在使用Boosting的基礎(chǔ)上讓損失函數(shù)在其梯度下降方向上下降,從而不斷改進(jìn)模型[31]。

(2)與GAN網(wǎng)絡(luò)補(bǔ)全方法對(duì)比

利用GAN網(wǎng)絡(luò)的生成思想對(duì)時(shí)序缺失數(shù)據(jù)補(bǔ)全逐漸受到學(xué)者們的關(guān)注,實(shí)驗(yàn)對(duì)比近年來(lái)基于GAN網(wǎng)絡(luò)對(duì)時(shí)序缺失數(shù)據(jù)的補(bǔ)全方法[23-24],在不同缺失率下GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)對(duì)缺失流量補(bǔ)全效果如圖5。

圖3 (a) 缺失率0.1時(shí)最大值補(bǔ)全流量圖

圖3 (b) 缺失率0.1時(shí)平均值補(bǔ)全流量圖

圖3 (c) 缺失率0.2時(shí)最大值補(bǔ)全流量圖

圖3 (d) 缺失率0.2時(shí)平均值補(bǔ)全流量圖

圖3 (e) 缺失率0.4時(shí)最大值補(bǔ)全流量圖

圖3 (f) 缺失率0.4時(shí)平均值補(bǔ)全流量圖

表3 不同缺失率RMSE變化表

圖4 不同缺失率RMSE變化圖

圖5 (a) 缺失率0.1GAN網(wǎng)絡(luò)和ST-DCGAN補(bǔ)全流量圖

圖5 (b) 缺失率0.2GAN網(wǎng)絡(luò)和ST-DCGAN補(bǔ)全流量圖

圖5 (c) 缺失率0.4GAN網(wǎng)絡(luò)和ST-DCGAN補(bǔ)全流量圖

從補(bǔ)全結(jié)果可以看出,隨著流量數(shù)據(jù)缺失率的增加,GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)補(bǔ)全效果逐漸變差,GAN網(wǎng)絡(luò)在缺失率為0.1時(shí),補(bǔ)全圖片與真實(shí)流量圖片最相似,缺失率為0.4時(shí),GAN網(wǎng)絡(luò)補(bǔ)全效果最差。相較于GAN網(wǎng)絡(luò),雖然流量圖片缺失率在增加,ST-DCGAN網(wǎng)絡(luò)生成的補(bǔ)全圖片與真實(shí)流量圖片仍有很大的相似度。這是因?yàn)槔肎AN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)對(duì)缺失流量數(shù)據(jù)補(bǔ)全時(shí)需要學(xué)習(xí)大量真實(shí)流量數(shù)據(jù),隨著流量圖片缺失率的增加,可供GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)學(xué)習(xí)的存在流量數(shù)據(jù)變小。

從表4不同缺失率下GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)RMSE變化可以看出,ST-DCGAN網(wǎng)絡(luò)優(yōu)于GAN網(wǎng)絡(luò),其中0.1缺失率RMSE超越GAN網(wǎng)絡(luò)50.49%,0.2缺失率RMSE超越GAN網(wǎng)絡(luò)48.69%,0.4缺失率RMSE超越GAN網(wǎng)絡(luò)52.99%。其原因是ST-DCGAN網(wǎng)絡(luò)在GAN網(wǎng)絡(luò)的基礎(chǔ)上添加了深度卷積網(wǎng)絡(luò)結(jié)構(gòu)并改變GAN網(wǎng)絡(luò)的目標(biāo)函數(shù),使得網(wǎng)絡(luò)能更好地學(xué)習(xí)真實(shí)流量數(shù)據(jù)樣本集的時(shí)空特征分布。

表4 不同缺失率GAN和ST-DCGAN網(wǎng)絡(luò)RMSE變化表

除了隨機(jī)點(diǎn)的流量缺失,現(xiàn)實(shí)生活中由于地區(qū)偏遠(yuǎn)、區(qū)域新建、施工可能造成集中區(qū)域流量缺失,實(shí)驗(yàn)分別對(duì)GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)在集中邊緣區(qū)域和中心區(qū)域流量缺失補(bǔ)全效果進(jìn)行探討,RMSE變化如表5、圖6所示。

表5 集中區(qū)域流量缺失RMSE變化表

圖6 GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)集中區(qū)域流量缺失RMSE

從表5 RMSE變化可以看出,ST-DCGAN網(wǎng)絡(luò)補(bǔ)全效果優(yōu)于GAN網(wǎng)絡(luò),邊緣缺失補(bǔ)全時(shí)超越GAN網(wǎng)絡(luò)56%,中心缺失補(bǔ)全時(shí)超越GAN網(wǎng)絡(luò)54%。其中GAN網(wǎng)絡(luò)和ST-DCGAN網(wǎng)絡(luò)集中區(qū)域缺失流量補(bǔ)全時(shí)中心區(qū)域缺失補(bǔ)全優(yōu)于邊緣區(qū)域,其原因是網(wǎng)絡(luò)對(duì)中心區(qū)域流量缺失補(bǔ)全時(shí),可學(xué)習(xí)的四周存在流量數(shù)據(jù)相較于邊緣區(qū)域更加充足,網(wǎng)絡(luò)可更好地學(xué)習(xí)周?chē)嬖诹髁繑?shù)據(jù)分布特征從而對(duì)缺失流量數(shù)據(jù)進(jìn)行補(bǔ)全。

5 結(jié)束語(yǔ)

本文針對(duì)基于統(tǒng)計(jì)學(xué)補(bǔ)全法、基于機(jī)器學(xué)習(xí)補(bǔ)全法以及傳統(tǒng)的GAN網(wǎng)絡(luò)交通缺失流量數(shù)據(jù)補(bǔ)全的不足,提出一種基于ST-DCGAN的時(shí)序交通流量數(shù)據(jù)補(bǔ)全方法。該方法結(jié)合DCGAN網(wǎng)絡(luò)和交通流量的時(shí)空特性,能更好地抽取交通流量數(shù)據(jù)在時(shí)間維度上和遠(yuǎn)近區(qū)域上的相關(guān)性,通過(guò)對(duì)比實(shí)驗(yàn)可以看出本文的方法優(yōu)于所比較的模型,但仍有很大的提升空間,如何更好地抽取交通流量數(shù)據(jù)時(shí)間維度上的相關(guān)性是下一步工作的重點(diǎn)。

猜你喜歡
交通流量時(shí)序流量
時(shí)序坐標(biāo)
冰墩墩背后的流量密碼
玩具世界(2022年2期)2022-06-15 07:35:36
基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
張曉明:流量決定勝負(fù)!三大流量高地裂變無(wú)限可能!
尋找書(shū)業(yè)新流量
出版人(2020年4期)2020-11-14 08:34:26
基于XGBOOST算法的擁堵路段短時(shí)交通流量預(yù)測(cè)
基于GA-BP神經(jīng)網(wǎng)絡(luò)的衡大高速公路日交通流量預(yù)測(cè)
一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:08
基于復(fù)合卡和ETC的交通流量采集研究
MLFF系統(tǒng)在交通流量控制中的應(yīng)用
普定县| 嘉荫县| 石泉县| 香港 | 冕宁县| 沙湾县| 罗源县| 剑川县| 蛟河市| 淮北市| 东辽县| 龙口市| 六枝特区| 大宁县| 铜陵市| 高邮市| 滨海县| 定襄县| 和顺县| 张北县| 乐至县| 扶绥县| 无为县| 昆山市| 建平县| 澄江县| 沐川县| 五台县| 云浮市| 崇文区| 兴文县| 平顺县| 长岛县| 竹溪县| 尼勒克县| 运城市| 延吉市| 舞钢市| 江门市| 安义县| 五寨县|