王魯明,李再幃,趙彥旭,路宏遙,何越磊
(1. 上海工程技術(shù)大學城市軌道交通學院,上海 201620;2. 中鐵二十一局集團有限公司,甘肅 蘭州 730070)
雙塊式無砟軌道是中國高鐵軌道主要結(jié)構(gòu)形式之一,累計已鋪設1萬余公里。隨著軌道結(jié)構(gòu)服役時間的不斷增加,其服役性能日益惡化,需要建立結(jié)構(gòu)性能參數(shù)監(jiān)測系統(tǒng),以便及時有效地確定無砟軌道結(jié)構(gòu)服役狀態(tài)?,F(xiàn)場生產(chǎn)實踐表明:西北某高鐵所采用19.5 m 單元板道床結(jié)構(gòu)受外界環(huán)境影響顯著,灌注于道床板間伸縮縫的高分子材料,易于出現(xiàn)脫離、失效等結(jié)構(gòu)病害[1]。因此,為了保證雙塊式無砟軌道結(jié)構(gòu)服役狀態(tài),有必要對雙塊式無砟道床板間位移進行有效監(jiān)測,以便制定合理的無砟軌道養(yǎng)護維修策略。目前,無砟軌道結(jié)構(gòu)位移監(jiān)測主要有接觸式和非接觸式2種方法。接觸式方法通常利用軌道結(jié)構(gòu)上布線、打孔等工序來實現(xiàn)傳感器固定,已應用于部分高鐵軌道監(jiān)測中[2?4],但此種方法相比于非接觸式安裝較為復雜,對安裝人員要求較高,同樣也有破壞軌道結(jié)構(gòu)表面,測點無法重復利用的問題。非接觸式則需要在線路結(jié)構(gòu)旁安裝光學感光元件,通過相應的數(shù)字圖像處理方法實現(xiàn)無砟軌道位移測量,由于此種方法無須對軌道結(jié)構(gòu)進行施工作業(yè),避免了接觸式方法存在的缺點,已初步應用于位移監(jiān)測中。苗壯等[5]通過在道旁布設攝像單元實現(xiàn)了軌道板層間位移的測量;魏秀琨等[6]給出了機器視覺在軌道檢查各個方面具體應用的現(xiàn)狀;閔永智等[7-9]則利用單目視覺系統(tǒng)結(jié)合靶面特征幾何信息實現(xiàn)了無砟道床結(jié)構(gòu)沉降的有效監(jiān)測。這些研究中對于測量目標的定位與提取往往采用套用灰度模板,并輔助人工標記的方法進行,此類方法對于拍攝圖像質(zhì)量不佳以及測量目標位移過大時,無法實現(xiàn)目標定位,且操作較為繁瑣,圖像處理速度較慢。目前基于深度學習實現(xiàn)目標定位技術(shù)已開始應用于軌道領域,尤其是在軌道結(jié)構(gòu)部件定位方面取得了良好的效果[10-14],但此類算法目前尚無應用于位移測量的先例,將其直接應用于位移測量尚存在諸多問題,如對于不同光照條件、不同拍攝角度等情況的適用性不強,精度也不能滿足要求等。因此在進行位移測量時,對于有標靶的無砟軌道目標圖像,研究可用于位移測量的基于深度學習目標追蹤算法,實現(xiàn)感興趣區(qū)域(Re‐gion of interest,ROI)的自動有效提取是必要的?;诖?,本文提出一種基于Faster R-CNN(Faster Re‐gions with CNN)的ROI區(qū)域自動提取方法。根據(jù)雙塊式無砟道床板間縱向相對位移監(jiān)測特點,利用人工標靶圖片作為基礎,基于Keras 深度學習庫對樣本集進行有針對性的圖像數(shù)據(jù)增強,豐富樣本類型,建立適用于西北地區(qū)復雜環(huán)境的人工標靶數(shù)據(jù)集。另外對Faster R-CNN 算法模型進行優(yōu)化,提高對于小目標檢測的精度與效率,可自動識別人工標靶在圖片中的位置,對ROI 區(qū)域進行快速準確提取,最后基于機器視覺測量技術(shù)得到無砟道床板間縱向相對位移,為無砟軌道位移測量、結(jié)構(gòu)狀態(tài)檢測打下基礎,對保障高鐵列車安全運行具有實際意義。
本文所量測對象為雙塊式無砟道床板間縱向相對位移,圖1 為基本檢測原理,點P(X,Y,Z)為固定在軌道結(jié)構(gòu)上的人工標靶的中心坐標,在無砟道床側(cè)方向路基上安裝攝像機,定時獲取包含標靶的圖片,該標靶中心在圖像坐標系中坐標為p(u,v),Oc為攝像機光心。
圖1 道床板間縱向相對位移測量原理Fig.1 Measurement principle of longitudinal relative displacement between ballast slabs
為了有效地獲取P點坐標,需要將圖像坐標映射到軌道坐標,有:
其中:Zc為人工標靶到攝像機光心之間的距離在光軸上的投影長度,在測量過程中是已知的;M為參數(shù)矩陣,其值為:
式中:第1 個矩陣為內(nèi)參數(shù)矩陣,F(xiàn)x,F(xiàn)y分別為圖像平面中x,y方向的等效焦距,Cx,Cy分別為光軸與像面焦點在圖像平面中x,y方向的圖像坐標;第2個矩陣為外參數(shù)矩陣,R,T分別為3×3旋轉(zhuǎn)矩陣和3×1平移矩陣[5]。
在視覺測量模型中,標記點中心坐標單位是像素(pixel),道床板間縱向相對位移單位是mm,需要通過標定將像素單位轉(zhuǎn)換為長度單位。初始標定中,將已知2個圓心距離的標定板固定于道床板上,若忽略外界環(huán)境因素,設2 個圓心(中心坐標(x1,y1)和(x0,y0))的實際距離為L,則標定系數(shù)k為:其中:j表示第j個圓形標記點,取1~4,n表示第n張圖像。
根據(jù)上述原理,現(xiàn)給出無砟道床板間相對位移有效測量計算流程,如圖3所示。
圖3 無砟道床板間縱向相對位移測量流程Fig.3 Measurement process of longitudinal relative displacement between bed plates of ballastless track
Step 1:基于圖像增強技術(shù)擴充樣本數(shù)量,標注無砟道床板圖片建立數(shù)據(jù)集,結(jié)合Faster R-CNN 網(wǎng)絡結(jié)構(gòu)進行位移檢測模型的訓練;
Step 2:在檢測模型訓練完成后,輸入待檢測圖片,自動提取目標ROI區(qū)域;
第三,充分利用互聯(lián)網(wǎng)和新興媒體,開通多層次、多渠道的營銷網(wǎng)絡,加大互聯(lián)網(wǎng)促銷力度,形成直銷和代理相結(jié)合的特色營銷渠道。
Step 3:對ROI 區(qū)域圖像進行處理,如二值化、濾波降噪、提取標定圓等,利用式(4)計算無砟道床板間縱向相對位移。
圖2 標記點的位移測量Fig.2 Displacement measurement of marked points
鑒于西北地區(qū)無砟道床板服役環(huán)境的復雜性,風雨雷電等因素影響顯著,由于前期測試中僅有少量圖片樣本,而通常為了實現(xiàn)樣本有效提取,避免算法中過擬合問題,作為目標識別的深度學習樣本數(shù)量要求至少為2 000 個。所以,本文基于Keras 深度學習庫[8?9],對樣本集進行有針對性的圖像數(shù)據(jù)增強,使之適用于西北地區(qū)復雜環(huán)境中拍攝的變化較大圖片,建立適用于西北地區(qū)環(huán)境的樣本庫。根據(jù)圖1中無砟道床板間縱向相對位移測量特點,由于測量對象中目標方向的改變不會影響識別結(jié)果,可以通過對現(xiàn)有無砟道床板圖片樣本集進行采用翻轉(zhuǎn)和旋轉(zhuǎn)方法,生成新的無砟道床板圖片樣本庫,使其滿足目標檢測樣本數(shù)量要求。
這里采用以TensorFlow 平臺作為后端,通過調(diào)用內(nèi)嵌的Keras圖像數(shù)據(jù)增強Image Data Genera‐tor軟件包,建立圖像生成迭代器,經(jīng)過樣本試算,令旋轉(zhuǎn)最大角度為30°,亮度參數(shù)為0.1~5,可將現(xiàn)有700 余張采樣樣本,擴展為樣本數(shù)量為5 622的樣本庫,滿足了深度學習對于樣本數(shù)量的要求。在此基礎上,進行數(shù)據(jù)集的構(gòu)建,利用手工框選定位圖像中標靶位置,并標注目標檢測所需數(shù)據(jù),如圖4 所示。將標注信息保存為xml 文件,然后使用TensorFlow 平臺將xml 文件轉(zhuǎn)為二進制數(shù)據(jù)TFrecord文件,以便后續(xù)進行數(shù)據(jù)處理。
圖4 圖像標注Fig.4 Image annotation
本文參考了原始的Faster R-CNN 算法模型,對模型進行優(yōu)化,提高對于本文使用的人工標靶一類小目標檢測的精度與效率。然后基于優(yōu)化的Faster R-CNN模型對無砟道床板間縱向相對位移測量圖像中人工標靶ROI 區(qū)域進行目標檢測。主要思路是先通過CNN 中卷積層對任意一張原始圖像進行特征映射圖提?。辉俳?jīng)過區(qū)域建議網(wǎng)絡(Re‐gional proposal net,RPN)中softmax 激活函數(shù)計算映射圖中每個特征點的概率,生成若干候選域;最后利用綜合卷積層提取特征映射圖與候選域,進行感興趣區(qū)域池化提取候選特征圖,通過分類和邊框回歸,精確標記圖中的人工標靶。本文所用Faster R-CNN模型如圖5所示,具體方法如下。
圖5 Faster R-CNN模型結(jié)構(gòu)Fig.5 Faster R-CNN model structure
Step 1:利用CNN 網(wǎng)絡卷積層進行位移圖像特征提取,采用VGG16 模型,具體參數(shù)為13 個卷積層、13個ReLu激活層以及4個池化層。
Step 3:用3×3 卷積核滑窗對特征圖進行搜索,然后利用softmax 激活函數(shù)計算映射圖中每個特征點的概率P,提取概率前300 的區(qū)域作為目標ROI 候選域。
Step 4:將交并比IoU(Intersection over Union)作為衡量ROI候選域準確度的指標:
A 和B 為2 個候選域面積。利用IoU 作為指標修正原始目標ROI 候選區(qū)域的邊框,從而獲取真實的ROI區(qū)域。
為了驗證所提方法的有效性,本文在某250 km/h的雙塊式無砟軌道線路上安裝了基于Am‐link-Temolin 的道床板間縱向相對位移監(jiān)測系統(tǒng),可實現(xiàn)24 h 在線監(jiān)測;其中,人工標靶粘貼于道床板側(cè)表面,材質(zhì)為氧化鋁,表面光滑且垂直于地面,一般情況下不會受到污染;必要時也可通過更換新的人工標記點或更新后續(xù)圖像的樣本集來保證測量系統(tǒng)長期監(jiān)測的準確性;攝像單元采用CMOS傳感器,鏡頭分辨率為400萬像素,圖片分辨率為2 560×1 440。設備安裝和人工標靶如圖6所示,攝像單元拍攝圖像如圖7所示。
圖6 監(jiān)測設備現(xiàn)場安裝情況Fig.6 Monitoring equipment installation on site
圖7 現(xiàn)場拍攝圖像Fig.7 Live images
采用前文所提算法,采用基于python3.6 的TensorFlow平臺,TensorFlow版本為1.3.0,系統(tǒng)環(huán)境為64 位Windows10,利用Faster R-CNN 模型對實際無砟道床板間縱向相對位移檢測圖像進行識別??紤]到標靶大小固定,實踐中將RPN 網(wǎng)絡的批處理尺寸固定為256;同時,為使網(wǎng)絡模型更加全面、減小過擬合,設置隨機失活值為0.5;模型訓練時設置最大迭代次數(shù)為20 000 次,優(yōu)化器為Adam,權(quán)值衰減系數(shù)為0.000 5,學習率為0.001。結(jié)果如圖8 所示,圖中98%,99%即準確率,意味著正確檢出樣本的概率,可直觀反映模型的效果。
圖8 目標檢測效果Fig.8 Target detection rendering
為評價檢測結(jié)果,這里采用召回率(Recall,R)、準確率(Precision,P)以及多類別平均準確率(mean Average Precision,mAP)3 個指標[8]進行說明。召回率R是指檢出樣本占所有樣本的比例;準確率P是指檢出中正確樣本的占檢出樣本的比例;mAP值是多類別AP(Average Precision)值的平均值,AP值越大模型效果越好,反之越差。
本文所用方法在經(jīng)過20 000 次迭代之后的召回率R為99.16%(成功檢測出2 790 個,未檢測出21 個)樣本檢出結(jié)果如圖9 所示,準確率P為98.91%(正確檢測2 761 個,錯誤檢測29 個);未檢測出及錯誤檢測的主要原因是訓練使用的樣本集中缺少與之相近的樣本圖像,這也是本文算法可改進的地方,可通過增加樣本集數(shù)量、提高樣本集多樣性、增加訓練次數(shù)等減少此類情況;另外由于個別圖像拍攝時的環(huán)境惡劣等客觀原因?qū)е聢D像質(zhì)量較差,也可能導致無法識別人工標靶。mAP值為0.891 2,模型綜合素質(zhì)較好。這說明基于Faster R-CNN 的ROI 區(qū)域自動提取算法可以實現(xiàn)無砟道床板間縱向相對位移測量中靶點ROI 區(qū)域的準確提取。
圖9 樣本檢出結(jié)果Fig.9 Sample test results
為驗證本文所用的機器視覺位移測量方法的準確性,設備在現(xiàn)場安裝之前,先設計進行了室內(nèi)相關試驗,確定方法的測量精度進而證實其有效性。經(jīng)過對比試驗,最終確定參數(shù)為鏡頭與標靶距離5 m,人工標靶邊長60 mm,標記圓直徑18 mm,鏡頭使用M12 標準50 mm 長焦距鏡頭,夜間補光采用功率3 W 的LED 燈珠作為光源,左右傾角為0°。通過試驗設備精確控制標靶位移,單次位移值1 mm,共計10 次,總位移為10 mm。使用本文機器視覺位移測量方法計算標靶位移變化,分析測量精度,結(jié)果如表1所示。
表1 測量位移與實際位移對比Table 1 Comparison of measured displacement and actual displacement
由表1 可知,本文方法在測量1 mm 位移時誤差均小于1.5%,即0.015 mm,在誤差的允許范圍之內(nèi),且精度較高,滿足無砟道床板間縱向相對位移測量需求。
為驗證本文方法效果,將現(xiàn)有常用目標識別算法YOLO v3[10],SSD[11],F(xiàn)ast R-CNN 算法[12-13]進行比較,其中,YOLO v3 模型根據(jù)文獻[10]在Darknet-53 網(wǎng)絡結(jié)構(gòu)基礎上添加1 個步長為2 的卷積核,增加4 組殘差組件,采用K-means 聚類的方法來確定先驗框參數(shù);SSD 模型根據(jù)文獻[11]以Densenet 網(wǎng)絡結(jié)構(gòu)為基礎,對19×19 分辨率的特征圖采用卷積核為2×2,步長為2 的轉(zhuǎn)置卷積參數(shù),對38×38 分辨率的特征圖采用卷積核為3×3,步長為2,擴充邊緣為1 的轉(zhuǎn)置卷積參數(shù)。Fast R-CNN模型參數(shù)與文獻[12]保持一致。
將2.1 中數(shù)量為5 622 的樣本庫,輸入以上幾種常用目標識別算法模型中進行訓練;經(jīng)20 000次迭代之后,結(jié)果圖10和圖11所示。
圖10 目標檢測結(jié)果對比Fig.10 Comparison of target detection results
圖11 不同算法的mAP值隨迭代次數(shù)變化情況Fig.11 mAP values of different algorithms vary
由圖10 可知,本文方法準確率最高,計算效率較好,滿足實際監(jiān)測的需求;基于Fast R-CNN的檢測方法檢測準確率較高,但是計算速度最慢;SSD 算法將目標檢測任務轉(zhuǎn)換成回歸問題,降低計算量提高了計算效率,但檢測準確性較低;YO‐LO v3 模型具有最快的處理速度,但其檢測精度最低。
對比分析圖11 可知,在前5 000 次迭代過程中不同算法的mAP值均提升較快、后趨于平穩(wěn),本文方法、Fast R-CNN,SSD,YOLO v3 的mAP值分別為0.891 2,0.869 7,0.832 6 和0.808 1,說明本文方法在模型整體性上有一定優(yōu)勢,可有效提高非接觸式無砟道床板間相對位移測量的準確度與效率,具有實用價值。
1) 基于Faster R-CNN 模型的靶點ROI 自動提取算法召回率R為99.16%,準確率P為98.91%,相對位移測量誤差均小于1.5%,在誤差的允許范圍之內(nèi),精度較高,可以有效地滿足無砟道床板間縱向相對位移測量中精度和準確率的要求。
2) 與其他的提取ROI 區(qū)域算法相比,本文所提方法在模型準確性和整體精度上具有一定優(yōu)勢,計算速度上稍顯不足,但實踐經(jīng)驗表明可滿足無砟道床板間相對位移監(jiān)測需求。
3) 建議高速鐵路無砟軌道結(jié)構(gòu)位移監(jiān)測中采用非接觸式測量方法,進一步深化非接觸式位移測量核心算法研究。