范時(shí)梟+張金輝+張其林
摘要: 結(jié)合機(jī)器學(xué)習(xí)方法對(duì)結(jié)構(gòu)健康監(jiān)測(cè)系統(tǒng)采集的原始數(shù)據(jù)進(jìn)行初步的自動(dòng)化分析,以達(dá)到降低進(jìn)一步分析的計(jì)算量、提高分析子系統(tǒng)精度的目的.以上海中心和蘭州西站監(jiān)測(cè)系統(tǒng)為背景,利用機(jī)器學(xué)習(xí)方法研究數(shù)據(jù)異常識(shí)別問(wèn)題,優(yōu)化數(shù)據(jù)分析預(yù)警子系統(tǒng).使用單變量特征選擇提取利于識(shí)別的特征向量, 對(duì)比分析在結(jié)構(gòu)健康監(jiān)測(cè)中各類支持向量機(jī)(Support Vector Machine,SVM)的優(yōu)劣,組合利用不同SVM的優(yōu)勢(shì)減少異常數(shù)據(jù)的漏報(bào)和誤報(bào).該方法已被應(yīng)用于上海中心和蘭州西站的結(jié)構(gòu)健康監(jiān)測(cè)系統(tǒng)中.
關(guān)鍵詞: 結(jié)構(gòu)健康監(jiān)測(cè); 數(shù)據(jù)識(shí)別; 單變量特征選擇; 支持向量機(jī); 主成分分析; 機(jī)器學(xué)習(xí); 數(shù)據(jù)降維
中圖分類號(hào): TU312.3 文獻(xiàn)標(biāo)志碼: B
0 引 言
自20世紀(jì)70年代以來(lái),結(jié)構(gòu)健康監(jiān)測(cè)逐步進(jìn)入土木工程領(lǐng)域,使結(jié)構(gòu)維護(hù)、預(yù)警、狀態(tài)評(píng)估具有較可靠的指導(dǎo).隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,監(jiān)測(cè)系統(tǒng)也應(yīng)運(yùn)而生.[1-2]在結(jié)構(gòu)損傷識(shí)別和預(yù)警問(wèn)題上,國(guó)內(nèi)外學(xué)者先后將神經(jīng)網(wǎng)絡(luò)算法[3-4]、模糊理論[5]、小波分析[6]和遺傳算法[7]等運(yùn)用于分析預(yù)警子系統(tǒng)中.但是,大型建筑結(jié)構(gòu)健康監(jiān)測(cè)產(chǎn)生的數(shù)據(jù)量巨大,以上海中心為例,應(yīng)布置400多個(gè)測(cè)量點(diǎn)位,其中頻率100 Hz的動(dòng)態(tài)點(diǎn)位超過(guò)150個(gè),每天產(chǎn)生數(shù)十GB數(shù)據(jù)量,若直接將數(shù)據(jù)應(yīng)用于結(jié)構(gòu)模態(tài)識(shí)別計(jì)算分析,進(jìn)行損傷識(shí)別,其計(jì)算量十分驚人.現(xiàn)階段,普遍采用方法的是利用定值的信號(hào)閾值進(jìn)行數(shù)據(jù)篩選,結(jié)合人工定時(shí)選取某段時(shí)間數(shù)據(jù)進(jìn)行計(jì)算分析,因此效率較低且易漏報(bào)和誤報(bào)異常數(shù)據(jù).進(jìn)行初步的數(shù)據(jù)異常識(shí)別有助于縮小分析范圍、降低計(jì)算負(fù)荷.曾有學(xué)者針對(duì)橋梁結(jié)構(gòu)提出數(shù)據(jù)異常診斷方法,但經(jīng)過(guò)上海中心監(jiān)測(cè)數(shù)據(jù)測(cè)試發(fā)現(xiàn)此方法對(duì)于建筑結(jié)構(gòu)效果不佳.本文旨在對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行第一層的異常識(shí)別,提供對(duì)內(nèi)的預(yù)警,降低分析子系統(tǒng)的計(jì)算壓力.
1 特征向量降維方法
監(jiān)測(cè)數(shù)據(jù)的統(tǒng)計(jì)特征眾多,采用一定的數(shù)據(jù)降維方法處理后可得到正常數(shù)據(jù)與異常數(shù)據(jù)之間差別更明顯的統(tǒng)計(jì)特征,即對(duì)異常識(shí)別來(lái)說(shuō)更有效的特征值,便于數(shù)據(jù)分類.同時(shí),特征向量維度降低,進(jìn)一步分析時(shí)計(jì)算量將顯著降低.本文對(duì)比主成分分析(Principal Component Analysis,PCA)法[8]與單變量特征選擇(Univariate Feature Selection,UFS)法[9]2種方法,結(jié)合實(shí)際數(shù)據(jù)分析其在結(jié)構(gòu)健康監(jiān)測(cè)中進(jìn)行特征向量降維的優(yōu)劣.
1.1 主成分分析法
PCA法將數(shù)據(jù)矩陣
[WTHX]X[WTBX]的行視為來(lái)自p個(gè)隨機(jī)變量x的觀測(cè)值,降低
[WTHX]X[WTBX]的維度主要通過(guò)線性組合實(shí)現(xiàn),將n維特征向量映射到k維上(k 1.2 單變量特征選擇法 UFS法能夠?qū)γ恳粋€(gè)特征進(jìn)行測(cè)試,衡量該特征與響應(yīng)變量之間的關(guān)系,根據(jù)得分去掉可分性不好的特征.分類問(wèn)題可采用方差分析對(duì)特征進(jìn)行打分. 方差分析用于2個(gè)及2個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn),其將總的試驗(yàn)數(shù)據(jù)的波動(dòng)分為反映因素水平改變引起的波動(dòng)和反映隨機(jī)因素引起的波動(dòng),然后進(jìn)行比較判斷. 2 數(shù)據(jù)識(shí)別方法 利用統(tǒng)計(jì)學(xué)習(xí)的分類方法,依據(jù)監(jiān)測(cè)數(shù)據(jù)特征值向量對(duì)每段監(jiān)測(cè)數(shù)據(jù)進(jìn)行分類,可達(dá)到識(shí)別異常數(shù)據(jù)的目的.[10] 2.1 支持向量機(jī)原理 支持向量機(jī)(Support Vector Machine,SVM)[11]是一種二分類模型,其基本模型是定義在特征空間上的間隔最大線性分類器.SVM的目標(biāo)便是尋找所有可將2類數(shù)據(jù)分離的超平面中基于支持向量幾何間隔最大的一個(gè),為約束最優(yōu)化的問(wèn)題.實(shí)際數(shù)據(jù)常常不會(huì)是完全線性可分的,若去掉少量點(diǎn)后能變?yōu)榫€性可分的數(shù)據(jù)集即線性近似可分,可使用松弛變量,并引入懲罰參數(shù)C>0,使原問(wèn)題的間隔最大化變?yōu)檐涢g隔最大化.對(duì)于完全線性不可分?jǐn)?shù)據(jù),引入核技巧可使其成為實(shí)質(zhì)上的非線性分類器. 2.2 非線性分類SVM 動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)的數(shù)據(jù)種類繁多,且在建筑施工或使用過(guò)程中獲得的監(jiān)測(cè)數(shù)據(jù)受各種外部因素的干擾,常產(chǎn)生非線性分類問(wèn)題,即不存在一個(gè)超平面可將2類數(shù)據(jù)分離或近似分離,需使用非線性分類器進(jìn)行分類.對(duì)于此類問(wèn)題,核心的求解思路為利用非線性變換使原空間的2類點(diǎn)映射到新空間,使問(wèn)題在新空間中變?yōu)榫€性分類問(wèn)題,常采用核技巧來(lái)實(shí)現(xiàn). 2.3 一類SVM 一類SVM[12]與前文中所述普通二分類SVM的不同之處在于其只有一類數(shù)據(jù),2類數(shù)據(jù)間的幾何間隔便不存在了.一類SVM的基本思路是將數(shù)據(jù)映射到高維特征空間,使其具有更好的聚集性,在特征空間中找到一個(gè)使數(shù)據(jù)與坐標(biāo)原點(diǎn)幾何間隔最大的超平面. 3 工程應(yīng)用 3.1 數(shù)據(jù)采集與預(yù)處理 本文中使用的數(shù)據(jù)分別為由上海中心結(jié)構(gòu)健康監(jiān)測(cè)系統(tǒng)采集的臺(tái)風(fēng)前后建筑頂端處風(fēng)速數(shù)據(jù)以及由蘭州西站結(jié)構(gòu)健康監(jiān)測(cè)系統(tǒng)采集的地震前后網(wǎng)架某處加速度數(shù)據(jù).2套系統(tǒng)均采用B/S結(jié)構(gòu)建設(shè),使 用Node.js結(jié)合Mongodb數(shù)據(jù)庫(kù)編寫,以達(dá)到實(shí)時(shí)、快速存取大量數(shù)據(jù),便捷查看、調(diào)用數(shù)據(jù)的目的.為達(dá)到分析處理每日海量的監(jiān)測(cè)數(shù)據(jù)和實(shí)時(shí)分析數(shù)據(jù)、查看結(jié)果的目的,本文數(shù)據(jù)分析程序主體使用Node.js編寫.2015年13號(hào)臺(tái)風(fēng)蘇迪羅過(guò)境前后上海中心風(fēng)速時(shí)程圖見(jiàn)圖1, 2015年4月15日甘肅省地震前后蘭州西站加速度時(shí)程圖見(jiàn)圖2. 觀察圖1中的風(fēng)速時(shí)程圖,雖然臺(tái)風(fēng)過(guò)境時(shí)風(fēng)速數(shù)據(jù)整體數(shù)值比臺(tái)風(fēng)過(guò)境后更大,但由于風(fēng)速數(shù)據(jù)波動(dòng)較大,所以2類數(shù)據(jù)有大量交叉點(diǎn).此種情況下簡(jiǎn)單利用閾值進(jìn)行數(shù)據(jù)識(shí)別則效果比較差.為定量展示本文數(shù)據(jù)識(shí)別方法在真實(shí)環(huán)境中復(fù)雜情況下的識(shí)別效果,將風(fēng)速數(shù)據(jù)以臺(tái)風(fēng)過(guò)境時(shí)的圖1a和
1b的所有數(shù)據(jù)作為異常數(shù)據(jù),以過(guò)境后圖1c和1d的所有數(shù)據(jù)作為正常數(shù)據(jù),測(cè)試本文的識(shí)別方法對(duì)于2類數(shù)據(jù)的識(shí)別準(zhǔn)確率.
同樣,加速度數(shù)據(jù)以地震作用時(shí)正段數(shù)據(jù)作為異常類數(shù)據(jù),即圖2中500~640 s及2 480~2 540 s這2段數(shù)據(jù),剩余所有數(shù)據(jù)作為正常數(shù)據(jù).
對(duì)采集的數(shù)據(jù)首先進(jìn)行小波閾值降噪,閾值計(jì)算采用斯坦無(wú)偏風(fēng)險(xiǎn)計(jì)算方法.信號(hào)采集頻率為100 Hz,以10 s信號(hào)為一個(gè)樣本,每小時(shí)360個(gè)樣本,每個(gè)樣本包含1 000個(gè)信號(hào)數(shù)據(jù),2種分類器的學(xué)習(xí)集和測(cè)試集樣本量
每個(gè)樣本提取均值、最大值、最小值、峰值、整流均值、標(biāo)準(zhǔn)差、偏度、峰度、均方根、波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、頻率中心、均方根頻率和頻率標(biāo)準(zhǔn)差共15個(gè)特征值組成特征向量.特別指出,均值主要用于描述信號(hào)的穩(wěn)定分量,均方根值主要用于描述振動(dòng)信號(hào)的能量,峰值指標(biāo)、脈沖指標(biāo)主要用于檢測(cè)信號(hào)中的沖擊.[13]
3.2 2種降維方法對(duì)比分析
3.2.1 PCA法降維
上海中心風(fēng)速數(shù)據(jù)前3個(gè)主成分組成的特征向量空間分布見(jiàn)圖3a,3個(gè)主成分累計(jì)貢獻(xiàn)率為88%;蘭州西站加速度數(shù)據(jù)前3個(gè)主成分組成的特征向量空間分布見(jiàn)圖3b,3個(gè)主成分累計(jì)貢獻(xiàn)率為81%;圖中灰色點(diǎn)為異常數(shù)據(jù),黑色點(diǎn)為正常數(shù)據(jù).
從圖3來(lái)看,對(duì)于這2種監(jiān)測(cè)數(shù)據(jù),使用PCA
法處理數(shù)據(jù)后未能保持較好的可分性.初步分析是由于PCA法的核心是尋找特征空間中最大方差的線性組合以達(dá)到降低向量維度的目的,這是基于最大方差理論認(rèn)為此方向保留的信息最多,然而當(dāng)實(shí)際不同類別的區(qū)別信息保留于最小方差方向時(shí),其并未將數(shù)據(jù)分類考慮在內(nèi).
3.2.2 UFS法降維
上海中心風(fēng)速數(shù)據(jù)得分前三名的特征值組成特征向量的空間分布見(jiàn)圖4a;蘭州西站加速度數(shù)據(jù)得分前三名的特征值組成特征向量的空間分布見(jiàn)圖4b;圖中灰色點(diǎn)為異常數(shù)據(jù),黑色點(diǎn)為正常數(shù)據(jù).
從圖4來(lái)看,使用UFS方法選擇出的特征向量具有很好的可分性.對(duì)比不同特征值得分,在保證數(shù)據(jù)可分的同時(shí)盡量保留較多的信息,最終選擇得分前八名的特征值.風(fēng)速數(shù)據(jù)取均值、均方根、最小值、峰值指標(biāo)、脈沖指標(biāo)、最大值、波形指標(biāo)、偏度,加速度數(shù)據(jù)取均方根頻率、頻率中心、整流均值、標(biāo)準(zhǔn)差、均方根、最大值、峰值和最小值.
3.3 2種SVM的異常識(shí)別效果分析
從數(shù)據(jù)中可以看出,普通二分類SVM的整體分
類錯(cuò)誤率較低,錯(cuò)誤集中在漏報(bào)上.一類SVM的整體錯(cuò)誤率較高,其中以正常樣本為學(xué)習(xí)集時(shí)易出現(xiàn)誤報(bào),以異常樣本為學(xué)習(xí)集時(shí)易出現(xiàn)漏報(bào).當(dāng)以正常集為學(xué)習(xí)集時(shí),一類SVM比普通二分類SVM誤報(bào)率更高、漏報(bào)率更低.
3.4 基于支持向量的異常識(shí)別方法改進(jìn)
在建筑結(jié)構(gòu)健康監(jiān)測(cè)中,誤報(bào)導(dǎo)致檢修成本提高、干擾正常使用等問(wèn)題,漏報(bào)可能會(huì)導(dǎo)致建筑物舒適性差、甚至危及人身或財(cái)產(chǎn)安全.將2種方法結(jié)合:第一步,學(xué)習(xí)集采用正常數(shù)據(jù),預(yù)設(shè)類別為正常,對(duì)測(cè)試數(shù)據(jù)進(jìn)行一類SVM分類;第二步,分類結(jié)果為異常的再用普通二分類SVM進(jìn)行分類.分類結(jié)果見(jiàn)表5.對(duì)比前2種方法單獨(dú)使用,結(jié)果顯示其錯(cuò)誤率下降,漏報(bào)率與誤報(bào)率均為最優(yōu)結(jié)果.
4 結(jié) 論
本文采用機(jī)器學(xué)習(xí)方法,提出對(duì)建筑結(jié)構(gòu)健康監(jiān)測(cè)數(shù)據(jù)進(jìn)行初步識(shí)別的新方法,并將其在上海中心和蘭州西站的B/S監(jiān)測(cè)數(shù)據(jù)系統(tǒng)中編程實(shí)現(xiàn).
在數(shù)據(jù)特征向量的提取與選擇上,分析常用PCA法在監(jiān)測(cè)數(shù)據(jù)特征提取中使不同數(shù)據(jù)混合不利于分類的問(wèn)題,并與UFS法對(duì)比后,選擇利于識(shí)別異常數(shù)據(jù)的特征向量.
在使用SVM進(jìn)行數(shù)據(jù)分類時(shí),分析2種SVM分類方法運(yùn)用在監(jiān)測(cè)數(shù)據(jù)分類中的效果,結(jié)合運(yùn)用2種SVM進(jìn)行數(shù)據(jù)處理的有效方法,組合利用二者的優(yōu)勢(shì)使異常識(shí)別的漏報(bào)和誤報(bào)減少.
采用這種數(shù)據(jù)初步識(shí)別辦法,降低分析子系統(tǒng)運(yùn)算壓力,并且減少分析系統(tǒng)遺漏地震、臺(tái)風(fēng)、儀器故障及其他問(wèn)題導(dǎo)致的數(shù)據(jù)異常的可能,對(duì)優(yōu)化改進(jìn)結(jié)構(gòu)預(yù)警系統(tǒng)有一定意義.
參考文獻(xiàn):
[1]
李慧, 周文松, 歐進(jìn)萍, 等. 大型橋梁結(jié)構(gòu)智能健康監(jiān)測(cè)系統(tǒng)集成技術(shù)研究[J]. 土木工程學(xué)報(bào), 2006, 39(2): 46-52. DOI: 10.3321/j.issn:1000-131X.2006.02.010.
LI H, ZHOU W S, OU J P, et al. A study on system integration technique of intelligent monitoring systems for soundness of long-span bridges[J]. China Civil Engineering Journal, 2006, 39(2): 46-52. DOI: 10.3321/j.issn:1000-131X.2006.02.010.
[2] 李惠, 鮑躍全, 李順龍, 等. 結(jié)構(gòu)健康監(jiān)測(cè)數(shù)據(jù)科學(xué)與工程[J]. 工程力學(xué), 2015, 32(8): 1-7. DOI: 10.6052/j.issn.1000-4750.2014.08.ST11.
LI H, BAO Y Q, LI S L, et al. Data science and engineering for structural health monitoring[J]. Engineering Mechanics, 2015, 32(8): 1-7. DOI: 10.6052/j.issn.1000-4750.2014.08.ST11.
[3] AVCI E, SENGUR A, HANBAY D. An optimum feature extraction method for texture classification[J]. Expert Systems with Applications, 2009, 36(3): 6036-6043. DOI: 10.1016/j.eswa.2008.06.076.
[4] AVCI E, TURKOGLU I. An intelligent diagnosis system based on principle component analysis and ANFIS for the heart valve diseases[J]. Expert Systems with Applications, 2009, 36(2): 2873-2878. DOI: 10.1016/j.eswa.2008.01.030.
[5] 李瀟, 楊國(guó)安, 吳貞煥, 等. 基于聲發(fā)射信號(hào)模糊函數(shù)綜合相關(guān)系數(shù)的海洋平臺(tái)各類損傷識(shí)別方法[J]. 機(jī)械工程學(xué)報(bào), 2014, 50(22): 1-9. DOI: 10.3901/JME.2014.22.001.
LI X, YANG G A, WU Z H, et al. Damage identification method of offshore platforms by ambiguity function integrated correlation coefficient of the acoustic emission signals[J]. Journal of Mechanical Engineering, 2014, 50(22): 1-9. DOI: 10.3901/JME.2014.22.001.
[6] 鐘儒勉, 宗周紅, 鄭沛娟, 等. 基于節(jié)點(diǎn)曲率和小波分析的梁式橋多尺度損傷識(shí)別[J]. 振動(dòng)與沖擊, 2015, 34(12): 108-114. DOI: 10.13465/j.cnki.jvs.2015.12.019.
ZHONG R M, ZONG Z H, ZHEN P J, et al. Damage identification method of girder bridge based on nodal curvatures and wavelet analysis[J]. Journal of Vibration and Shock, 2015, 34(12): 108-114. DOI: 10.13465/j.cnki.jvs.2015.12.019.
[7] 傅大寶, 葉肖偉, 倪一清, 等. 基于遺傳算法和有限混合分布的應(yīng)力譜多模態(tài)建模[J]. 工程力學(xué), 2014, 31(5): 172-179. DOI: 10.6052/j.issn.1000-4750.2012.12.0949.
FU D B, YE X W, NI Y Q, et al. Multi-modal modelling of stress spectrum using genetic algorithm and finite mixture distributions[J]. Engineering Mechanics, 2014, 31(5): 172-179. DOI: 10.6052/j.issn.1000-4750.2012.12.0949.
[8] 朱軍華, 余嶺. 基于頻響函數(shù)的結(jié)構(gòu)健康監(jiān)測(cè)主成分分析法[J]. 振動(dòng)與沖擊, 2011, 30(5): 111-115. DOI: 10.3969/j.issn.1000-3835.2011.05.023.
ZHU J H, YU L. A PCA-based algorithm for structural health monitoring using frequency response functions[J]. Journal of Vibration and Shock, 2011, 30(5): 111-115. DOI: 10.3969/j.issn.1000-3835.2011.05.023.
[9] DROTR P, GAZDA J, SMKAL Z. An experimental comparison of feature selection methods on two-class biomedical datasets[J]. Computers in Biology and Medicine, 2015, 66: 1-10. DOI: 10.1016/j.compbiomed.2015.08.010.
[10] 袁慎芳, 梁棟, 高寧, 等. 基于結(jié)構(gòu)健康監(jiān)測(cè)系統(tǒng)的橋梁數(shù)據(jù)異常診斷研究[J]. 電子科技大學(xué)學(xué)報(bào), 2013, 42 (1): 69-74. DOI: 10.3969/j.issn.1001-0548.2013.01.016.
YUAN S F, LIANG D, GAO N, et al. The bridge data diagnosis research based on structural health monitoring system[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 69-74. DOI: 10.3969/j.issn.1001-0548.2013.01.016.
[11] 丁世飛, 齊丙娟, 譚紅艷. SVM理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報(bào), 2011, 40(1): 1-10. DOI: 10.3969/j.issn.1001-0548.2011.01.001.
DING S F, QI B J, TAN H Y. An overview on theory and algorithm of support vector machines[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 1-10. DOI: 10.3969/j.issn.1001-0548.2011.01.001.
[12] 吳定海, 張培林, 任國(guó)全, 等. 基于支持向量的單類分類方法綜述[J]. 計(jì)算機(jī)工程, 2011, 37(5): 187-189. DOI: 10.3969/j.issn.1000-3428.2011.05.063.
WU D H, ZHANG P L, REN G Q, et al. Review of one-class classification method based on support vector[J]. Computer Engineering, 2013, 37(5): 69-74. DOI: 10.3969/j.issn.1000-3428.2011.05.063.
[13] 趙志宏. 基于振動(dòng)信號(hào)的機(jī)械故障特征提取與診斷研究[D]. 北京: 北京交通大學(xué), 2012.