王志祥, 李建閣
(1.長(zhǎng)安大學(xué) 公路學(xué)院, 陜西 西安 710064; 2.廣東華路交通科技有限公司, 廣東 廣州 510420)
苯乙烯-丁二烯-苯乙烯嵌段共聚物(SBS)改性瀝青路面有效減少了車轍、坑槽、裂縫等早期病害的出現(xiàn)[1-2],增加了1~2 a使用壽命,提高了服務(wù)水平,因此SBS改性瀝青的研究及應(yīng)用備受青睞[3-4].SBS用量的劇增,導(dǎo)致了其價(jià)格上漲,以次充好、缺斤短兩的現(xiàn)象偶有發(fā)生,使改性瀝青中SBS的含量及其性能無法保證.傳統(tǒng)評(píng)價(jià)SBS含量的方法主要基于改性瀝青的儲(chǔ)存穩(wěn)定性,對(duì)其針入度、延度、軟化點(diǎn)和黏度等物理性能進(jìn)行測(cè)試,但該測(cè)試方法耗時(shí)長(zhǎng)、準(zhǔn)確性和重現(xiàn)性較差[5-6];采用熒光顯微鏡定量檢測(cè)SBS含量,準(zhǔn)確性較低[7];化學(xué)滴定方法雖然能夠測(cè)試改性瀝青中SBS的含量,但耗時(shí)長(zhǎng)達(dá)2h,并且會(huì)釋放有毒氣體,危害試驗(yàn)人員身體健康[8];通過傅里葉變換紅外光譜(FTIR)儀測(cè)定改性瀝青的紅外譜圖[9],基于特征峰與SBS含量的線性相關(guān)性,建立不同SBS含量改性瀝青標(biāo)準(zhǔn)曲線,可以測(cè)定改性瀝青中SBS的含量[10],但是其制樣的均勻性難以保證,紅外光譜峰的識(shí)別與提取、數(shù)據(jù)處理繁瑣且復(fù)雜,這給改性瀝青中SBS含量的測(cè)定帶來了困難[11].深度神經(jīng)網(wǎng)絡(luò)(DNN)在精準(zhǔn)預(yù)測(cè)方面具有顯著優(yōu)勢(shì)[12].基于DNN,本文提出了改性瀝青中SBS含量的預(yù)測(cè)模型(DNN模型),旨在精準(zhǔn)預(yù)測(cè)改性瀝青中SBS的含量,提升瀝青的質(zhì)量,改善瀝青路面的使用品質(zhì).
瀝青采用Shell-70#基質(zhì)瀝青(BA),其性能指標(biāo)見表1.改性劑為韓國(guó)LG411星型SBS與LG501線型SBS的混合物,二者摻配比(1)文中涉及的比值、用量、含量等均為質(zhì)量比或質(zhì)量分?jǐn)?shù).為1∶1;SBS顆粒色澤光亮,粒度均勻,雜質(zhì)含量較少,無明顯黏聚性,其性能指標(biāo)見表2.根據(jù)工程經(jīng)驗(yàn),采用工業(yè)硫磺穩(wěn)定劑(用量為瀝青質(zhì)量的2‰)增強(qiáng)SBS與瀝青之間的黏聚力,確保改性瀝青的儲(chǔ)存穩(wěn)定性.
表1 基質(zhì)瀝青的性能指標(biāo)
表2 SBS的性能指標(biāo)
采用配備ZnSe ATR附件的Controls Cary 630型FTIR,測(cè)試溫度控制在20℃左右,光譜范圍為4000~650cm-1,波數(shù)精度高于0.005cm-1,掃描次數(shù)為32次,分辨率為4cm-1.
圖1 基質(zhì)瀝青及SBS改性瀝青的紅外光譜圖
2.1.1降噪
制備7種SBS改性瀝青和1種基質(zhì)瀝青的FTIR測(cè)試樣品,每種樣品30個(gè),共得到240個(gè)樣本.對(duì)其進(jìn)行FTIR測(cè)試,得到240個(gè)FTIR圖譜特征數(shù)據(jù),并進(jìn)行DNN訓(xùn)練與測(cè)試.FTIR圖譜采用Savitzky-Golay過濾器進(jìn)行平滑預(yù)處理,減少噪聲干擾[14-15],同時(shí)對(duì)異常光譜進(jìn)行剔除,得到227個(gè)有效FTIR圖譜.隨機(jī)抽取180個(gè)有效FTIR圖譜作為DNN訓(xùn)練樣本,樣本編號(hào)為1~180,剩余的47個(gè)有效FTIR圖譜作為DNN測(cè)試樣本,樣本編號(hào)為1~47.
2.1.2降維
每個(gè)FTIR圖譜均包含900個(gè)特征(維度),227個(gè)圖譜共有227×900個(gè)特征.采用奇異值分解算法對(duì)特征值數(shù)據(jù)的主成分進(jìn)行降維,將輸入數(shù)據(jù)轉(zhuǎn)換成1組線性無關(guān)的特征值和相應(yīng)的特征向量[16].在保留能夠代表原始數(shù)據(jù)95%以上特征的前提下進(jìn)行降維,最終得到227×512個(gè)特征數(shù)據(jù).
將降噪+降維后的數(shù)據(jù)作為DNN訓(xùn)練和測(cè)試樣本的數(shù)據(jù)庫(kù),其樣本信息見表3.表3中,N為數(shù)據(jù)預(yù)處理后的數(shù)據(jù)數(shù)量,Ntrain為用來訓(xùn)練的數(shù)據(jù)數(shù)量,Ntest為用來測(cè)試的數(shù)據(jù)數(shù)量.
表3 數(shù)據(jù)庫(kù)樣本信息
為保證神經(jīng)元直接快速并準(zhǔn)確傳遞有效信息,對(duì)DNN結(jié)構(gòu)進(jìn)行設(shè)計(jì),建立的DNN結(jié)構(gòu)體系見圖2.由圖2可見:DNN由輸入層、輸出層和11個(gè)隱藏層組成,隱藏層從第2層到第12層依次排列,以提高學(xué)習(xí)的深度和模型表達(dá)能力;隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)分別設(shè)置為512、256、256、128、128、64、64、32、32、16和16,以提高計(jì)算機(jī)的處理效率,加快優(yōu)化速度;同1層神經(jīng)元之間沒有聯(lián)系,但它們與下1個(gè)相鄰層的每個(gè)神經(jīng)元完全相連;將式(1)中SBS改性瀝青FTIR數(shù)據(jù)的特征向量X導(dǎo)入到包含512個(gè)神經(jīng)元的輸入層中;X(k)為X中的1個(gè)元素,為第k個(gè)樣本FTIR數(shù)據(jù)的特征向量,k=1,2,3,…,m,m為樣本數(shù);根據(jù)輸入值X,由式(3)計(jì)算得出SBS含量的輸出特征向量Y.
圖2 DNN結(jié)構(gòu)體系
X=(X(1),X(2),…,X(k),…,X(m))T
(1)
(2)
(3)
(4)
(5)
為避免在DNN的反向傳播過程中出現(xiàn)梯度消失現(xiàn)象,提高計(jì)算速度和精度,同時(shí)降低DNN參數(shù)的依賴性與過度擬合的概率,采用ReLU(梯度總是0或1)作為激活函數(shù)[17]:
f(x)=ReLU(x)=max(0,x)
(6)
式中:x表示輸入值;f(x)表示輸出值.
2.4.1損失函數(shù)
DNN訓(xùn)練通常采用損失函數(shù)J,使DNN模型輸出特征向量Y的預(yù)測(cè)值與事先已知的用來監(jiān)督預(yù)測(cè)模型的并和預(yù)測(cè)值相對(duì)應(yīng)的真實(shí)值y(目標(biāo)值)無限接近.用均方誤差(MSE)作為損失函數(shù)J,并以MSE作為模型預(yù)測(cè)精度的評(píng)價(jià)指標(biāo),MSE值越小,模型預(yù)測(cè)精度越高.MSE的計(jì)算公式為:
(7)
2.4.2學(xué)習(xí)方法
學(xué)習(xí)在DNN訓(xùn)練中起著關(guān)鍵作用.學(xué)習(xí)過程為:首先將預(yù)處理后的數(shù)據(jù)以矩陣的形式輸入到DNN中,進(jìn)行無監(jiān)督學(xué)習(xí),該過程為前向傳播中的特征學(xué)習(xí),權(quán)重和偏差特征向量的初始值用于訓(xùn)練第1層并生成用于訓(xùn)練第2層的特征向量數(shù)據(jù);依次利用產(chǎn)生的特征向量數(shù)據(jù)對(duì)下1層進(jìn)行訓(xùn)練,直到最后1層完成訓(xùn)練后,得到各層相應(yīng)的權(quán)重和偏差特征向量數(shù)據(jù);最后對(duì)數(shù)據(jù)標(biāo)記后進(jìn)行監(jiān)督學(xué)習(xí),以調(diào)整DNN參數(shù)的權(quán)重和偏差特征向量.依據(jù)損失函數(shù),采用小批量隨機(jī)梯度下降法對(duì)每次迭代的參數(shù)進(jìn)行更新,設(shè)置batch size為20,參數(shù)更新如式(8)、(9)所示.
(8)
(9)
2.4.3初始化、規(guī)范化和歸一化
(10)
式中:ninput和noutput分別為輸入、輸出層連接的神經(jīng)元個(gè)數(shù).
為了降低DNN訓(xùn)練過程中過擬合出現(xiàn)的概率,常采dropout對(duì)DNN進(jìn)行規(guī)范化,在每次迭代中,隨機(jī)隱藏一半的神經(jīng)元,在正向和反向傳播中,隱藏的神經(jīng)元都不會(huì)被激活.
通過批量歸一化,固定輸入層數(shù)據(jù),優(yōu)化求解過程,確保梯度穩(wěn)定,加快收斂速度和學(xué)習(xí)速度,防止梯度消失.特征向量X與矩陣特征值Z之間的關(guān)系為:
(11)
式中:μ、σ分別為特征向量X中批量數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差;γ、β分別為由DNN訓(xùn)練得到的尺度因子和位移因子;ζ為平滑因子,為無窮小的數(shù)字,防止除數(shù)為零.
2.4.4DNN模型的效率
本文使用的計(jì)算機(jī)處理器為Inter(R)core(TM) i7-8700 CPU@3.20GHz,顯卡類型為Nvidia Geforce GTX 10708G GPU.通過CPU加速對(duì)DNN進(jìn)行訓(xùn)練,前向傳播學(xué)習(xí)和后向反饋學(xué)習(xí)時(shí)間分別為8.22、25.37s.
DNN測(cè)試的目的是分析預(yù)測(cè)模型準(zhǔn)確性.采用測(cè)試樣本進(jìn)行DNN測(cè)試,若測(cè)試樣本的均方誤差小于訓(xùn)練樣本,說明模型預(yù)測(cè)準(zhǔn)確性較好;否則,應(yīng)重新調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)及其參數(shù),直至測(cè)試樣本的均方誤差小于訓(xùn)練樣本為止.
其他條件相同,以MSE作為評(píng)價(jià)指標(biāo),研究了降噪+降維、僅降維、僅降噪3種數(shù)據(jù)預(yù)處理對(duì)DNN模型預(yù)測(cè)精度的影響,結(jié)果見表4.
表4 數(shù)據(jù)預(yù)處理對(duì)DNN模型預(yù)測(cè)精度的影響
由表4可見,對(duì)比沒有經(jīng)過數(shù)據(jù)預(yù)處理的DNN模型預(yù)測(cè)精度,僅降維預(yù)處理使MSE降低了6%左右,而僅降噪預(yù)處理使MSE降低了64%,降維+降噪預(yù)處理的綜合作用使MSE降低了70%,因此數(shù)據(jù)的降維、降噪等預(yù)處理對(duì)建立較為精確、魯棒性較好的預(yù)測(cè)模型有重要的作用.
對(duì)訓(xùn)練樣本集設(shè)置不同的迭代次數(shù)(Nlit),研究其對(duì)模型預(yù)測(cè)精度的影響,結(jié)果見圖3.由圖3可見:隨著訓(xùn)練樣本集的迭代次數(shù)從100次增加到3000 次,DNN模型的MSE逐漸減小,從3.338減小到0.057;前1800次迭代,MSE波動(dòng)較為明顯,單次的迭代不一定使神經(jīng)網(wǎng)絡(luò)向目標(biāo)方向發(fā)展,但是整體趨向目標(biāo),通過反復(fù)迭代,調(diào)整權(quán)重和偏差,使網(wǎng)絡(luò)逐漸穩(wěn)定;當(dāng)?shù)螖?shù)從1800次增加到2100 次,MSE緩慢下降,保持穩(wěn)定在0.057;當(dāng)?shù)螖?shù)從2100次增加到3000次,MSE呈現(xiàn)小幅度波動(dòng).考慮訓(xùn)練速度,迭代次數(shù)選擇2100次.
圖3 迭代次數(shù)對(duì)DNN模型預(yù)測(cè)精度的影響
對(duì)數(shù)據(jù)進(jìn)行降維+降噪處理,迭代次數(shù)為2100次.訓(xùn)練樣本與測(cè)試樣本wSBS的預(yù)測(cè)值(PV)與目標(biāo)值(TV)見圖4、5.由圖4可見:訓(xùn)練樣本的預(yù)測(cè)值在目標(biāo)值附近小幅波動(dòng);樣本編號(hào)為100之前,預(yù)測(cè)值與目標(biāo)值基本呈現(xiàn)正偏差狀態(tài);樣本編號(hào)在100之后,預(yù)測(cè)值與目標(biāo)值出現(xiàn)負(fù)偏差,且呈小幅波動(dòng)整體穩(wěn)定狀態(tài).由圖5可見:測(cè)試樣本的預(yù)測(cè)值在目標(biāo)值附近小幅波動(dòng),wSBS的預(yù)測(cè)值穩(wěn)定在目標(biāo)值附近.
圖4 訓(xùn)練樣本的預(yù)測(cè)值與目標(biāo)值
圖5 測(cè)試樣本的預(yù)測(cè)值與目標(biāo)值
為進(jìn)一步評(píng)價(jià)DNN模型的擬合優(yōu)度,將訓(xùn)練樣本集和測(cè)試樣本集中SBS改性瀝青的wSBS預(yù)測(cè)平均值與目標(biāo)值進(jìn)行相關(guān)性分析,結(jié)果見圖6.由圖6 可見,wSBS預(yù)測(cè)值的平均值與目標(biāo)值相關(guān)系數(shù)R2達(dá)到0.9989,而測(cè)試樣本預(yù)測(cè)值的平均值與目標(biāo)值相關(guān)性更好,R2達(dá)到0.9996,這也說明了DNN模型的準(zhǔn)確性和適用性,通過預(yù)測(cè)平均值的計(jì)算,可以使預(yù)測(cè)值逼近目標(biāo)值.
圖6 不同SBS含量的預(yù)測(cè)值的平均值與目標(biāo)值的相關(guān)性分析
(12)
由表5可見:DNN模型的預(yù)測(cè)平均值與目標(biāo)值線性相關(guān)系數(shù)R2為0.9989,模型預(yù)測(cè)精度優(yōu)于SCM和RFM模型;對(duì)于同一目標(biāo)值wSBS=4.7%的樣本,RFM模型精度優(yōu)于SCM模型,而DNN模型具有更高的精度,達(dá)到98.756%.一方面,說明了DNN模型可以準(zhǔn)確預(yù)測(cè)不局限于預(yù)測(cè)模型訓(xùn)練集中的wSBS(3.0%、3.5%、4.0%、4.5%、5.0%、5.5%、6.0%),且能預(yù)測(cè)wSBS為3.0%~6.0%區(qū)間任意含量值;另一方面,也說明了DNN模型的預(yù)測(cè)值更逼近目標(biāo)值,wSBS目標(biāo)值為4.3%、5.1%的樣本測(cè)試結(jié)果具有相同的結(jié)論;wSBS目標(biāo)值4.3%、4.7%、5.1%的樣本測(cè)試精度中,wSBS=4.7%的樣本測(cè)試精度最高,測(cè)試結(jié)果最為精確.
表5 3種預(yù)測(cè)模型預(yù)測(cè)精度比較
為了驗(yàn)證DNN模型的敏感性與適用性,選擇不同品牌和標(biāo)號(hào)的基質(zhì)瀝青(Shell-70#、韓國(guó)SK-70#、新加坡IRPC-90#)、SBS(LG411、LG501、LCY3501、LCY3411)制備不同wSBS的SBS改性瀝青,按照本文所述方法測(cè)試其FTIR圖譜,同時(shí)用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)修正的DNN模型,對(duì)一定數(shù)量樣本的驗(yàn)證集進(jìn)行測(cè)定及精度評(píng)價(jià),結(jié)果見表6.
表6 不同改性瀝青SBS含量結(jié)果
由表6可見:DNN模型能夠準(zhǔn)確預(yù)測(cè)不同基質(zhì)瀝青和SBS改性瀝青中的SBS含量,且其預(yù)測(cè)值與目標(biāo)值差值均在0.10%的范圍內(nèi),精度最低為97.78%,最高為98.75%.由此可見,DNN模型具有很好的敏感性和適用性,能用于準(zhǔn)確預(yù)測(cè)不同種類的SBS改性瀝青中SBS含量.
(1)在進(jìn)行深度神經(jīng)網(wǎng)絡(luò)(DNN)訓(xùn)練之前,對(duì)數(shù)據(jù)進(jìn)行降噪和降維等預(yù)處理,可以提高DNN模型的預(yù)測(cè)精度;相比于沒有進(jìn)行數(shù)據(jù)預(yù)處理,經(jīng)過預(yù)處理的DNN模型的均方誤差MSE降低了70%.
(2)訓(xùn)練樣本集的MSE值最終保持在0.057,目標(biāo)值與預(yù)測(cè)值接近,DNN模型具有良好的準(zhǔn)確性.DNN模型對(duì)SBS改性瀝青中SBS含量的預(yù)測(cè)精度在97%以上,高于標(biāo)準(zhǔn)曲線法和隨機(jī)森林法.
(3)基于DNN改性瀝青中SBS含量預(yù)測(cè)模型對(duì)不同基質(zhì)瀝青與SBS改性瀝青中SBS含量預(yù)測(cè)具有較好的敏感性和適用性.