夏毅敏 ,李清友 ,鄧朝輝 ,龍 斌 ,姚 捷
(1. 中南大學高性能復雜制造國家重點實驗室,湖南 長沙 410083;2. 中南大學機電工程學院,湖南 長沙 410083;3. 中鐵第四勘察設計院集團有限公司,湖北 武漢 430063;4. 中國鐵建重工集團股份有限公司,湖南 長沙 410100)
隨著山區(qū)地下工程[1]的發(fā)展,隧道施工過程中精準、快速地進行巖性識別可以為采用正確圍巖支護[2]方式減少時間消耗,避免造成隧道塌方,是施工安全方面關注的重點. 目前施工現(xiàn)場依據(jù)現(xiàn)場施工人員經驗、實驗室力學實驗、理論分析與現(xiàn)場聲波測試等方法對圍巖特性進行檢測識別[3],其中巖石巖性是支護時機與支護方法選取的影響因素之一[4],因此,有必要對巖石巖性快速準確的識別方法開展研究.
目前,學者們針對巖石特征的提取方法開展了大量研究,其中采用圖像處理技術提取隧道巖石表面特征的方法被大量應用:Wei等[5]提出了一種將K均值聚類與概率神經網絡相結合的方法應用于巖石薄片圖像中,實現(xiàn)巖石孔隙紋理識別自動化;羅佳等[6]利用裂縫具有方向性與連續(xù)性等特征,提出了一種基于自適用閾值和連通域標記的隧道裂縫提取方法;劉燁等[7]提出一種結合圖像顏色空間與形態(tài)學梯度進行巖石自動分類方法.
近些年來,隨著卷積神經網絡在圖像識別領域的使用[8],深度學習的優(yōu)越性也逐漸體現(xiàn),其利用多層網絡處理數(shù)據(jù)從而達到提取特征的目的[9]. 在語義識別、圖像識別[10]、物體檢測等方面,深度學習識別模型都得到廣泛應用:侯進等[11]提出一種基于深度學習的多特征復合神經網絡框架. 基于深度學習進行巖石圖像自動識別的研究越來越多:白林等[12]基于卷積神經網絡構建巖石識別深度學習模型,有效提取巖石的礦物成分特征,說明了深度學習方法對于巖石識別的有效性;徐述騰等[13]設計有針對性的Unet卷積神經網絡模型,提取了礦相顯微鏡下礦石礦物的深層特征信息,實現(xiàn)鏡下礦石礦物智能識別與分類;Imamverdiyev等[14]通過研究巖石的巖性特征,開發(fā)一種基于深度學習的井中地質相分類的有效模型來進行巖相分類;Zhang等[15]采用了5種方法對含有12個標簽的2206張地質圖片進行了識別對比,表明基于深度學習模型的遷移學習方法可以有效地提取小地質結構數(shù)據(jù)的特征,在地質結構圖像分類中具有較強的魯棒性;結合深度學習模型與遷移學習方法[16]能夠在保證準確度與速度的情況下大幅度減小研究難度[17],使用遷移學習方法擴大了圖像識別的應用領域,張野等[18]將遷移學習應用于巖石圖像的自動巖性識別和分類,并有效識別了花崗巖、千枚巖和角礫巖;Li等[19]通過遷移學習訓練了砂巖的顯微圖像,并獲得了砂巖薄切片的高精度顯微圖像分類模型;Wang等[20]采用模型遷移方法實現(xiàn)了對野外巖石圖像的識別與分類.
本文以隧道中常見的片麻巖、花崗巖、石灰?guī)r、大理巖、凝灰?guī)r、砂巖等6類主要巖石為研究對象組建圖像數(shù)據(jù)集,基于輕量級深度卷積神經網絡模型MobileNet V2[21]進行改進,采用模型遷移學習訓練方法,得到一種適用于隧道巖石巖性識別模型,具有識別速度快、模型小等特點,能在離線條件下對施工過程中采集到的巖石圖像進行巖性快速識別.
深度卷積神經網絡模型的核心卷積結構在圖像特征提取能力上具有強大的優(yōu)勢,為了提高識別精度,深度卷積神經網絡模型的結構設計總體往更深、更寬的趨勢發(fā)展,隨著模型深度與寬度的擴增,模型參數(shù)與體積也大幅度地提升. 在隧道施工中,為了滿足離線條件下有限資源的移動端設備中使用深度神經網絡模型對巖石巖性進行識別,必須優(yōu)化網絡結構,降低網絡參數(shù)量以減少對計算和存儲資源的占用,深度可分離式卷積[22](depthwise separable convolution)結構能夠在保證精度的情況下大幅度降低卷積計算參數(shù)量.
深度可分離式卷積結構將標準的卷積網絡分解成深度卷積和逐點卷積,深度卷積將濾波器(卷積核組)應用于每個輸入通道,使用大小為1 × 1的卷積核進行逐點卷積來組合深度卷積的輸出.
假設模型輸入圖片尺寸為Dk×Dk,通道數(shù)為M,輸出通道數(shù)為N,采用尺寸大小為Df×Df的卷積核進行卷積,如圖1所示為標準卷積結構,參數(shù)計算量為Lt,經計算可得
如圖2所示為深度可分離式卷積結構,參數(shù)計算量分為兩部分,深度卷積Ld與逐點卷積Lp,經計算可得
兩部分參數(shù)計算量進行求和可得深度分離式卷積結構的參數(shù)計算量為
圖1 標準卷積結構Fig. 1 Standard convolution structure
圖2 深度可分離式卷積結構Fig. 2 Structure of depthwise separable convolution
將標準卷積與深度可分離式卷積的參數(shù)計算量比較可得
由于圖片尺寸Dk×Dk遠大于輸出通道數(shù)N,可近似認為深度可分離式卷積結構相比標準卷積結構參數(shù)計算量減少了N倍.
傳統(tǒng)的機器學習模式如圖3(a)所示,給定的不同任務之間具有相似性情況下,也必須針對不同的任務建立相應的學習系統(tǒng),遷移學習模式如圖3(b)所示,學習系統(tǒng)將從源任務中學習到的知識遷移到目標任務的學習系統(tǒng)中,極大地減輕了模型訓練難度,并發(fā)揮了不同數(shù)據(jù)之間的相似性[23]. 在實際深度神經網絡模型訓練中,由于大量隧道巖石數(shù)據(jù)的收集與標定難度、硬件設施條件等問題,使得無法從零開始訓練巖石巖性識別模型,通過使用模型遷移訓練方法,對MobileNet V2模型進行改進,并在所建巖石數(shù)據(jù)集上進行訓練,得到適用于隧道巖石數(shù)據(jù)集的識別模型.
圖3 傳統(tǒng)學習與遷移學習Fig. 3 Traditional learning and transfer learning
圖4是識別模型訓練與識別過程的整體框架,首先,準備隧道巖石數(shù)據(jù)集,并在訓練前進行數(shù)據(jù)增廣處理;其次,改進預先訓練過的基礎模型,并在巖石數(shù)據(jù)集上進行遷移訓練,得到巖石識別模型;最后,加載識別模型,對未參與訓練的測試圖像數(shù)據(jù)進行識別,得到識別結果. 該方法突出了基于輕量級網絡模型MobileNet V2進行改進后并訓練得到巖石識別模型,以及完成巖石識別的各個過程.
圖4 模型訓練與識別流程Fig. 4 Model training and identification process
基于課題組在隧道施工工程方面的研究基礎,前往多個隧道工程進行實地調研與現(xiàn)場拍攝取材,對隧道圍巖主要巖石類型花崗巖、片麻巖、大理巖、凝灰?guī)r、砂巖、石灰?guī)r的圖像樣本共采集1860張,為了避免訓練過程中出現(xiàn)樣本不均衡現(xiàn)象,每種巖石類型樣本數(shù)量上保持一致性,為310張,確保樣本數(shù)量均衡,其中每類巖石訓練集為195張,驗證集65張,測試集50張,樣本分布均為隨機抽取分布.
實驗中為提高模型訓練效果,在訓練前采用圖像旋轉、水平偏移、豎直偏移、圖像剪切、圖像縮放、翻轉等處理方式進行了數(shù)據(jù)增強,同時對每張圖像樣本的像素值除以自身標準差以完成樣本標準化,原始數(shù)據(jù)圖像大小都在5 MB以下,部分樣本圖像如圖5所示.
圖5 巖石樣本圖像示例Fig. 5 Rock sample image examples
巖石類圖像數(shù)據(jù)集與大型數(shù)據(jù)集相比,類之間的差異性較小,巖石巖性識別是巖石細粒度分類的一個實例. 在本文巖石識別分類研究中,以輕量級網絡模型MobileNet V2為基礎模型,模型結構如表1所示,主要包括17個可分離式卷積模塊,結構如圖6所示,首先通過逐點卷積提升輸入數(shù)據(jù)維度,減少數(shù)據(jù)丟失,之后進行深度可分離式卷積,最后采用逐點卷積進行數(shù)據(jù)降維輸出,同時使用殘差網絡[24]處理,減少卷積過程中梯度消失問題,并在每次卷積后都進行了歸一化與激活處理,整個卷積過程數(shù)據(jù)維度呈現(xiàn)中間寬,兩端窄的形式,用較少的計算量得到較好的性能.
表 1 MobileNet V2基礎結構Tab. 1 MobileNet V2 basic structure
圖6 MobileNet V2深度可分離式卷積結構Fig. 6 MobileNet V2 depthwise separable convolution structure
基礎模型在ImageNet數(shù)據(jù)集上進行預訓練得到了預訓練權重后,移除可分離式卷積模塊后密集連接分類器部分,根據(jù)巖石數(shù)據(jù)集種類搭建新的密集連接分類器進行代替,改進的模型結構如表2所示.
表2中,虛線框內為新建分類器,添加了輸出維度為1024的Dense層與Relu激活函數(shù)fRelu(?),其函數(shù)表達式如式(6)所示,具有使數(shù)據(jù)收斂快的優(yōu)點. 并在Dense層之后添加了Dropout層,設置參數(shù)為0.5,意味著在訓練過程中每次進行參數(shù)更新時會隨機關閉50%的神經元,使得一個神經元的出現(xiàn)不依賴另一個神經元,防止數(shù)據(jù)過擬合,提高模型泛化能力. 最后添加一個輸出維度為6的Dense層與Softmax分類函數(shù),讓輸出結果類別與實際數(shù)據(jù)集類別相統(tǒng)一.
式中:x為模型上一層參數(shù)的計算輸出值.
表2 改進的模型結構Tab. 2 Improved model structure
訓練過程中以本文研究的巖石數(shù)據(jù)為模型輸入,基礎模型其他所有層進行凍結不參與訓練,僅作為特征提取器對輸入圖像進行特征提取,并將提取的特征作為新密集連接分類器的輸入,迭代次數(shù)設置為10,優(yōu)化函數(shù)采用隨機梯度下降法,學習率為0.001,每次迭代隨機選擇32張圖像,每迭代36步進行模型評估,通過交叉熵驗證損失,同時在訓練過程中對精度進行監(jiān)測,先通過特征提取的遷移訓練,訓練分類器部分的參數(shù)權重,使基礎模型適應新的巖石數(shù)據(jù)集. 訓練過程在存儲容量為24 GB的NVIDIA Quadro P6000顯卡上進行,單步訓練時間為3 s.
基于fine-tune的遷移訓練方法在模型結構上與特征提取的訓練方法一致,但參與訓練的層數(shù)更多,如表3中虛線框所示. 在本文研究中,在對新建密集分類器參數(shù)進行訓練后,為了提取不同巖石的類別特征,開放基礎模型的bottleneck17部分,并在訓練過程中對學習率(learning rate)、批樣本數(shù)量(batch size)、優(yōu)化器參數(shù)、權重衰減系數(shù)等超參數(shù)進行選擇與微調,根據(jù)訓練效果對比,迭代次數(shù)設置為1000,一個迭代循環(huán)訓練36次,采用隨機梯度下降法,學習率降低至0.0001,衰減系數(shù)為10?6,動量參數(shù)設置為0.9,每次迭代隨機選擇32張樣本數(shù)量,每迭代36步進行模型評估,通過交叉熵驗證損失,同時在訓練過程中對精度進行監(jiān)測,訓練結束后獲得巖石巖性識別模型.
表3 基于fine-tune的遷移訓練Tab. 3 Transfer training based on fine-tune
圖7顯示了訓練過程中1000次迭代中的損失和精度變化趨勢. 損失在400次迭代后開始收斂,并在800次迭代后開始穩(wěn)定,損失接近于0,訓練精度在200次迭代后開始收斂,在迭代600次后呈現(xiàn)穩(wěn)定狀態(tài),接近99%,驗證數(shù)據(jù)集精度在82%~87%波動,訓練結果模型大小僅為28.3 MB.
圖7 訓練中訓練精度、驗證精度及損失變化Fig. 7 Training accuracy,verification accuracy and loss changes during training
為了驗證訓練模型的魯棒性及性能,在訓練數(shù)據(jù)集中對每類巖石隨機選取30張圖片共180張圖片作為測試對象,每次從中挑選30張,共測試6次,同時采用精確率(P)、召回率(R)、綜合評價指標(F1)作為測試結果評估指標對各類巖石識別情況進行評估,計算方法如式(7)~(9).
式中:Tp為屬于某類巖石同時識別為該類巖石的樣本數(shù)量;Fp為不屬于某類巖石同時識別為該類巖石的樣本數(shù)量;Fn為屬于某類巖石同時未識別為該類巖石的樣本數(shù)量.
各項評價指標計算結果如表4所示,訓練集每類巖石圖片識別結果中各項評價指標都達到了93%以上,均值都達到97%以上,說明模型具有很好的魯棒性.
表 4 訓練集各項評價指標Tab. 4 Index values for training set evaluation
訓練過程中驗證集的精度在82%到87%之間波動,為了更好地驗證模型的泛化能力,使用未參與模型訓練的測試數(shù)據(jù)集中的圖片樣本來進行測試,即測試模型對全新的圖像是否具有良好的識別能力,測試集樣本數(shù)量每類巖石各50張,識別結果如表5所示,為了更全面地評估測試集識別結果,對精確率、召回率與綜合評價指標等參數(shù)進行計算,結果如表6所示.
根據(jù)表中數(shù)據(jù),片麻巖、石灰?guī)r、砂巖3類巖石的精確率與召回率呈現(xiàn)相反的趨勢,說明在所有正負樣本數(shù)據(jù)中,模型對砂巖正樣本的識別準確程度高,對石灰?guī)r與大理巖的正樣本識別準確程度低,凝灰?guī)r巖與大理巖的召回率較高,說明模型能夠對實際為正樣本的凝灰?guī)r、大理巖識別為正樣本的概率高. 為了能綜合評估模型對各類巖石的識別效果,得出綜合評價指標值,明顯得出凝灰?guī)r識別效果最佳,大理巖、花崗巖識別效果好,石灰?guī)r識別效果最低.
表5 測試集圖片識別結果Tab. 5 Recognition results for testing set images 張
表 6 測試集各項評價指標Tab. 6 Index values for testing set evaluation
雖然對各個類別的精確率、召回率與綜合評價指標進行了測試計算,但由于本文分類類別屬于多分類,因此采用機器學習理論中的宏平均(macroaverage)作為總體評估指標對測試結果進行評估. 宏平均是先對每一個類別計算指標值,然后再對所有類求算數(shù)平均值,計算如式(10)~(12).
式中:Pi、Ri、F1i和Pmacro、Rmacro、F1macro分別為精確率、召回率、綜合評價指標的類別值和宏平均值.
根據(jù)表6結果,由式(10)~(12)計算得精確率、召回率、綜合評價指標的宏平均值分別為0.868、0.853、0.853.
整體來看,模型對測試集識別結果各項評估參數(shù)均值均在85%以上,說明模型具有較好的泛化能力,對實際圍巖類巖石圖像具有極好的識別能力.
為了驗證采用輕量級深度卷積神經網絡模型進行巖性識別分類方法的優(yōu)勢,采用卷積神經網絡VGG16模型和機器學習方法中SVM (support vector machine)分類模型[25]對相同巖石數(shù)據(jù)集進行識別分類,以平均識別精度與單張識別時間為對比指標,實驗結果比較如表7所示.
表7 實驗結果對比Tab. 7 Comparison of experimental results
經對比測試可知,SVM模型平均識別精確率低于0.8. 此外,相比于SVM模型,改進的MobileNet V2模型無需進行單獨的圖像預處理與特征提取,將圖像特征提取與識別分類集為一體,提高了識別精確率,降低了模型訓練難度與時間. 相比于卷積神經網絡模型VGG16,改進的MobileNet V2模型在保持模型性能的前提下降低了模型訓練參數(shù),提高了模型識別速度. 因此與傳統(tǒng)機器學習分類模型和卷積神經網絡模型相比,改進的MobileNet V2模型,同時采用模型遷移學習進行訓練的方法有更高的識別精確率與更快的識別速度.
針對隧道施工過程中巖石巖性的準確、快速識別問題,基于輕量級深度卷積神經網絡模型進行改進并采用模型遷移訓練方法進行識別分類,得到以下結論:
1) 基于自身搭建的隧道巖石圖像數(shù)據(jù)集,通過改進的輕量級深度卷積神經網絡模型分類器,采用模型遷移訓練方法能夠解決隧道巖石巖性識別問題.
2) 改進輕量級深度卷積神經網絡模型,同時采用模型遷移學習進行訓練的方法在識別速率與識別精度上比傳統(tǒng)卷積神經網絡與傳統(tǒng)機器學習分類方法效果更優(yōu).
3) 模型識別精度與巖石圖像數(shù)據(jù)集自身特征具有關聯(lián)性,對于特征明顯易于分辨的凝灰?guī)r、花崗巖、大理巖等識別效果更好.
致謝:感謝長沙市科技計劃重大專項(kq1703022)與中南大學研究生自主創(chuàng)新項目(2018zzts459)的經費支持.