摘 要:隨著交通網(wǎng)絡(luò)的不斷擴展和智能化技術(shù)的快速發(fā)展,在高速公路系統(tǒng)中會產(chǎn)生大量的機電狀態(tài)數(shù)據(jù),包括車流量、車速、車道占有率等。這些數(shù)據(jù)來自不同的傳感器和監(jiān)測設(shè)備,具有異構(gòu)性和多樣性。為了更好地管理和維護高速公路系統(tǒng),本研究提出了一種基于數(shù)據(jù)關(guān)聯(lián)視角的高速公路多源機電狀態(tài)融合管理方法。該方法建立數(shù)據(jù)關(guān)聯(lián)模型,將不同源的機電狀態(tài)數(shù)據(jù)進行融合,以提高數(shù)據(jù)的準確性和可靠性。試驗結(jié)果表明,該方法在高速公路系統(tǒng)的機電狀態(tài)管理方面取得了顯著的效果。
關(guān)鍵詞:高速公路;機電設(shè)備;多源數(shù)據(jù)融合
中圖分類號:U 412" 文獻標志碼:A
高速公路系統(tǒng)是現(xiàn)代交通網(wǎng)絡(luò)的重要組成部分,其安全和高效運行對社會經(jīng)濟發(fā)展至關(guān)重要[1]。隨著交通流量的不斷增加和用戶需求的多樣化,高速公路系統(tǒng)中產(chǎn)生的機電狀態(tài)數(shù)據(jù)也越來越豐富。然而,這些數(shù)據(jù)來自不同的傳感器和監(jiān)測設(shè)備,存在異構(gòu)性和多樣性,給數(shù)據(jù)管理和維護帶來了一定的挑戰(zhàn)。因此,開發(fā)一種能夠融合多源機電狀態(tài)數(shù)據(jù)的管理方法,提高數(shù)據(jù)的準確性和可靠性,對高速公路系統(tǒng)運行和維護至關(guān)重要。
1 數(shù)據(jù)預(yù)處理
1.1 噪聲清洗
采用聚類方式對遠離期望值的數(shù)據(jù)點的數(shù)據(jù)進行清洗,可以將數(shù)據(jù)點分為不同的簇群,然后針對每個簇群進行分析和處理,可以使用聚類算法,例如K-means算法,將數(shù)據(jù)點聚類成多個簇群[2]。將遠離期望值的數(shù)據(jù)點劃分為離群點,并進行相應(yīng)處理,例如移除或進行修正。通過計算其他正常數(shù)據(jù)的平均值,將該平均值應(yīng)用于缺失數(shù)據(jù)點,可以盡量保持數(shù)據(jù)的一致性和完整性。對存在時間差的數(shù)據(jù),可以采用正則匹配對數(shù)據(jù)進行過濾。正則匹配是一種基于規(guī)則的文本匹配方法,可以根據(jù)預(yù)設(shè)的模式匹配數(shù)據(jù)中的特定部分。通過設(shè)定匹配規(guī)則,可以篩選符合要求的數(shù)據(jù),剔除不符合要求的數(shù)據(jù),從而保留符合時間差要求的數(shù)據(jù)。這樣可以保證數(shù)據(jù)的準確性和一致性,同時提高數(shù)據(jù)分析的可靠性。
1.2 數(shù)據(jù)壓縮
主成分分析是一種常用的降維技術(shù),通過線性變換將原始數(shù)據(jù)轉(zhuǎn)換為一組新的變量,這些新的變量被稱為主成分。主成分是原始數(shù)據(jù)中的線性組合,它們捕捉了原始數(shù)據(jù)中最大的方差,盡量保留了原始數(shù)據(jù)的信息。通過主成分分析,可以保留最重要的主成分,而舍棄次要的主成分[3]。這樣可以降低數(shù)據(jù)的維度,從而對數(shù)據(jù)進行壓縮??梢愿鶕?jù)方差解釋率來確定保留的主成分數(shù)量,方差解釋率表示每個主成分所占總方差的比例。選擇解釋總方差較大的主成分,可以保留較多的信息,同時降低數(shù)據(jù)的維度。
1.3 數(shù)據(jù)轉(zhuǎn)換
歸一化是將數(shù)據(jù)映射到指定范圍內(nèi)的常用方法,可以使用公式(1)進行歸一化處理。
歸一化后的值=(xi-xmin)/(xmax-xmin)×(Ml-Mr)+Mr
(1)
反歸一化是將歸一化后的數(shù)據(jù)恢復(fù)到原始范圍內(nèi)的方法,可以使用公式(2)進行反歸一化處理。
反歸一化后的值=(歸一化后的值-Mr)/(Ml-Mr)×(xmax-xmin)+xmin (2)
式中:歸一化后的值為經(jīng)過歸一化處理后的值;Mr為映射的最左端;Ml為映射的最右端;xmin為數(shù)據(jù)的最小值;xmax為數(shù)據(jù)的最大值。
以50min內(nèi)某收費站出站口車輛加速度為例,進行歸一化試驗分析。在歸一化試驗中,需要對采集的車輛加速度數(shù)據(jù)進行處理,使其具有相同的量綱和范圍。常用的歸一化方法有最小-最大歸一化和Z-score歸一化。最小-最大歸一化是將原始數(shù)據(jù)線性轉(zhuǎn)換到[0,1]。對每個數(shù)據(jù)點來說,將其減去數(shù)據(jù)集中的最小值,再除以最大值和最小值之間的差,這樣可以將數(shù)據(jù)映射到0~1,保留了原始數(shù)據(jù)的相對大小和順序。對每個數(shù)據(jù)點來說,將其減去數(shù)據(jù)集的均值,再除以數(shù)據(jù)集的標準差。這樣可以使數(shù)據(jù)的均值為0,方差為1,使數(shù)據(jù)分布更加符合正態(tài)分布。當進行歸一化試驗分析時,比較歸一化前后的加速度仿真結(jié)果。通過對比兩者的變化情況,評估歸一化對數(shù)據(jù)的影響。如果歸一化后的仿真結(jié)果更加穩(wěn)定和可靠,且能夠更好地反映車輛加速度的特征,那么歸一化是有效的。相反,如果歸一化后的結(jié)果出現(xiàn)明顯異?;蚴д?,就需要重新評估歸一化的方法或數(shù)據(jù)處理的步驟。歸一化前后某收費站出站口車輛加速度仿真結(jié)果如圖1所示,能夠明顯看出歸一化后的車輛加速度明顯下降。
2 多源數(shù)據(jù)融合處理
面向多源設(shè)備狀態(tài)數(shù)據(jù)的融合處理方案如圖2所示。該方案利用時空關(guān)聯(lián)的同構(gòu)多源數(shù)據(jù)融合。同構(gòu)數(shù)據(jù)指的是具有相似的數(shù)據(jù)結(jié)構(gòu)和特征的數(shù)據(jù),這些數(shù)據(jù)通常來自不同的傳感器或測量設(shè)備。通過分析這些同構(gòu)數(shù)據(jù)之間的時空關(guān)系,可以將它們進行融合,得到更完整和一致的信息[4]。該方案采用基于神經(jīng)網(wǎng)絡(luò)的異構(gòu)多源數(shù)據(jù)融合。異構(gòu)數(shù)據(jù)指的是具有不同數(shù)據(jù)結(jié)構(gòu)和特征的數(shù)據(jù),這些數(shù)據(jù)來自不同的領(lǐng)域或類型。神經(jīng)網(wǎng)絡(luò)是一種強大的模型,可以學(xué)習(xí)和捕捉數(shù)據(jù)之間的復(fù)雜關(guān)系。通過利用神經(jīng)網(wǎng)絡(luò)的能力,可以將異構(gòu)數(shù)據(jù)進行融合,以獲得更全面的信息。通過將時空關(guān)聯(lián)的同構(gòu)多源數(shù)據(jù)融合和基于神經(jīng)網(wǎng)絡(luò)的異構(gòu)多源數(shù)據(jù)融合相結(jié)合,該方案能夠充分利用不同數(shù)據(jù)源的優(yōu)勢,并解決多源數(shù)據(jù)融合中的異構(gòu)性和復(fù)雜性問題。
2.1 基于時空關(guān)聯(lián)的同構(gòu)多源數(shù)據(jù)融合
同構(gòu)數(shù)據(jù)加權(quán)結(jié)構(gòu)如圖3所示。首先,利用時間關(guān)聯(lián)度分析,可以對同一時間段內(nèi)的不同傳感器數(shù)據(jù)進行比較和評估。通過計算數(shù)據(jù)之間的相似性和相關(guān)性來確定它們之間的關(guān)聯(lián)程度??梢詫⑤^弱關(guān)聯(lián)度的數(shù)據(jù)剔除,以減少對數(shù)據(jù)融合結(jié)果的影響。其次,通過設(shè)定權(quán)值系數(shù),可以對不同傳感器數(shù)據(jù)進行加權(quán)處理[5]??梢愿鶕?jù)傳感器的可靠性、準確性和重要性設(shè)定權(quán)值系數(shù)。具有較高可靠性和準確性的傳感器可以被賦予較高的權(quán)值,以增加其在數(shù)據(jù)融合中的貢獻。這樣可以使融合結(jié)果更加準確和可靠,同時也考慮了不同傳感器的特點和優(yōu)勢。最后,通過加權(quán)數(shù)據(jù)融合方式,將經(jīng)過篩選和加權(quán)處理后的數(shù)據(jù)進行融合。加權(quán)數(shù)據(jù)融合可以根據(jù)設(shè)定的權(quán)值系數(shù)對不同傳感器數(shù)據(jù)進行加權(quán)平均或加權(quán)求和,得到最終的融合結(jié)果。
動態(tài)時間規(guī)整算法(DTW)是一種用來比較兩個時間序列相似性的方法。通過在時間軸上對齊兩個序列的數(shù)據(jù)點,找到使兩個序列之間距離最小的對應(yīng)關(guān)系。
初始化一個二維矩陣,大小為(m+1)×(n+1),其中m為Vi(t)的長度,n為Uj(t)的長度。將矩陣的第一行和第一列初始化為無窮大的值,表示初始狀態(tài)下兩個序列之間的距離為無窮大。從矩陣的(1,1)位置開始,計算每個位置的值。對矩陣中的每個位置(i,j),計算距離d=||Vi(t)[i]-Uj(t)[j]||,其中||·||為歐氏距離。在(i,j)位置的值等于d加上(i-1,j)位置、(i,j-1)位置和(i-1,j-1)位置中的最小值,即矩陣中前一步的最小路徑和。最終得到的矩陣右下角的值即為兩個序列之間的最小距離。根據(jù)動態(tài)時間規(guī)整算法得到的矩陣,可以得到兩個序列之間的最小距離。EM表示極大似然估計值。設(shè)d為某一時刻傳感器間距,根據(jù)歐氏距離計算公式,可以得到公式(3)。
d= sqrt(EM)" (3)
利用動態(tài)時間規(guī)整算法和歐氏距離計算設(shè)備間距,從而對某收費站不同加速度傳感器設(shè)備數(shù)據(jù)序列進行分析和應(yīng)用。
設(shè)d為某一時刻傳感器間距,指數(shù)函數(shù)量化時空關(guān)聯(lián)度是一種對設(shè)備間距進行標準化預(yù)處理的方法。通過使用指數(shù)函數(shù)來量化設(shè)備間距,使較大的間距得到較小的量化值,較小的間距得到較大的量化值。如公式(4)所示。
si,j = exp(-λ × di,j)" (4)
式中:si,j為量化后的設(shè)備間距;di,j為設(shè)備間距;λ為指數(shù)函數(shù)的參數(shù),用于控制量化效果。通過公式(4),可以對設(shè)備間距進行標準化預(yù)處理,從而提取設(shè)備間距的時空關(guān)聯(lián)度信息。
以某收費站出站口為例,感應(yīng)線圈可以實時獲取車輛通過的信息,這些數(shù)據(jù)對交通管理和規(guī)劃具有重要意義。為了對這些數(shù)據(jù)進行融合處理,將采用兩種常用的方法進行對比試驗。首先,使用平均值法進行數(shù)據(jù)融合。平均值法是一種簡單直接的融合方法,將所有采樣的車流量數(shù)據(jù)的平均值作為最終結(jié)果。對60min內(nèi)每隔5min采樣得到的25個車流量數(shù)據(jù)進行平均計算,得到平均值融合結(jié)果。其次,采用自適應(yīng)加權(quán)法進行數(shù)據(jù)融合。自適應(yīng)加權(quán)法考慮到不同時間段或不同車流量數(shù)據(jù)的重要性和權(quán)重,最后,對數(shù)據(jù)進行加權(quán)處理,得到融合結(jié)果。在試驗中,將根據(jù)車流量數(shù)據(jù)的大小和變化情況,設(shè)定不同的權(quán)重系數(shù)進行加權(quán)計算,得到自適應(yīng)加權(quán)融合結(jié)果。融合處理方法結(jié)果對比情況如圖4所示。
從圖4可以看出,與平均值方法相比,基于時空關(guān)聯(lián)的融合方法能夠更好地捕捉數(shù)據(jù)的變化趨勢和時序特征。采用平均值方法對多個數(shù)據(jù)進行平均處理,忽略了數(shù)據(jù)之間的時序關(guān)系,導(dǎo)致數(shù)據(jù)喪失平滑化和信息。而基于時空關(guān)聯(lián)的方法考慮到數(shù)據(jù)在時間和空間上的關(guān)聯(lián)性,能夠更好地反映實際數(shù)據(jù)的變化規(guī)律,從而更接近真實數(shù)據(jù)。與自適應(yīng)加權(quán)方法相比,基于時空關(guān)聯(lián)的融合方法能夠更好地處理數(shù)據(jù)之間的相關(guān)性和權(quán)重分配。自適應(yīng)加權(quán)方法通過設(shè)定權(quán)重系數(shù),對不同數(shù)據(jù)進行加權(quán)處理,確定權(quán)重系數(shù)存在主觀性和固定性的問題。而基于時空關(guān)聯(lián)的方法通過分析數(shù)據(jù)之間的關(guān)聯(lián)程度和相似性,動態(tài)地調(diào)整權(quán)重,更合理地進行數(shù)據(jù)融合,從而縮小了誤差。
2.2 基于神經(jīng)網(wǎng)絡(luò)的異構(gòu)多源數(shù)據(jù)
預(yù)處理流量觀測值:若fi為距離t時刻最近一個時刻的流量觀測值;f為數(shù)據(jù)平均值,則計算預(yù)處理流量觀測值如公式(5)所示。
fi' = fi/f" (5)
式中:fi'為預(yù)處理后的流量觀測值。
基于神經(jīng)網(wǎng)絡(luò)的多源異構(gòu)數(shù)據(jù)融合方法能夠充分利用各個源數(shù)據(jù)的信息,提取數(shù)據(jù)的全局特征和局部特征,同時通過注意力機制網(wǎng)絡(luò)對數(shù)據(jù)進行加權(quán)處理和特征提取。
試驗收集了某收費站出口的車流量、車輛速度和車道占有率3個指標的數(shù)據(jù)。這些數(shù)據(jù)是通過傳感器、監(jiān)控設(shè)備和車輛識別系統(tǒng)等收集而來的,具有一定的真實性和可靠性。真實數(shù)據(jù)與模型預(yù)測數(shù)據(jù)仿真結(jié)果如圖5所示。
通過多次迭代和優(yōu)化,得到了最佳的BP神經(jīng)網(wǎng)絡(luò)模型。預(yù)測結(jié)果可以與真實數(shù)據(jù)進行對比,評估預(yù)測的準確性和誤差。為了更加直觀地評估預(yù)測結(jié)果的準確性,利用Matlab軟件進行仿真。將真實數(shù)據(jù)、BP神經(jīng)網(wǎng)絡(luò)預(yù)測數(shù)據(jù)和本文預(yù)測數(shù)據(jù)進行可視化比較,可以觀察它們之間的差異和相似性。在對比分析中,發(fā)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)的實際值與預(yù)測值在后期存在較大的誤差,誤差明顯大于本文提出的多源異構(gòu)數(shù)據(jù)融合方法,進一步驗證了本文方法的有效性和優(yōu)越性。
3 結(jié)語
本研究基于數(shù)據(jù)關(guān)聯(lián)視角,提出了一種高速公路多源機電狀態(tài)融合管理方法,旨在提高數(shù)據(jù)的準確性和可靠性。通過建立數(shù)據(jù)關(guān)聯(lián)模型,將來自不同源的機電狀態(tài)數(shù)據(jù)進行融合,本方法能夠更好地理解和分析高速公路系統(tǒng)的機電狀態(tài)。試驗結(jié)果表明,本方法在高速公路系統(tǒng)的機電狀態(tài)管理方面取得了顯著的效果。
參考文獻
[1] 李斌,鄭鳳飛,劉春芽.高速公路多源機電運維數(shù)據(jù)統(tǒng)一接入方法探究[J].中國交通信息化,2022(10):130-133.
[2] 王賽賽,高鵬.融合降雨數(shù)據(jù)的高速公路行駛速度預(yù)測[J].物聯(lián)網(wǎng)技術(shù),2021,11(3):43-50.
[3] 何剛,尹紫紅,廖知勇,等.高速公路BIM+GIS多源數(shù)據(jù)集成與融合探析[J].科學(xué)技術(shù)創(chuàng)新,2021(15):4.
[4] 黃海政.高速公路隧道機電設(shè)備安裝工程施工技術(shù)研究[J]. 工程機械與維修,2024 (4): 86-88.
[5] 吳志峰.探討高速公路機電設(shè)備智能化管理策略[J].中國設(shè)備工程,2022(6):2.