方正,王仁彬,陳思媛
(廈門大學(xué) 航空航天學(xué)院,福建 廈門 361101)
目前對廢舊塑料的回收常常是很多種類混合在一起,而混合塑料難以滿足再生產(chǎn)需求[1]。因此,對廢舊塑料進行識別分類,有利于實現(xiàn)資源再利用,并解決廢舊塑料污染問題[2-3]。
傳統(tǒng)的塑料識別方法分為物理識別法和化學(xué)鑒別法。物理識別法準(zhǔn)確度較差,化學(xué)鑒別法操作復(fù)雜,且易造成污染[4]。新興的塑料識別方法為光譜分析法,包括近紅外光譜、熒光光譜、激光誘導(dǎo)擊穿光譜等[5-10]。 X射線吸收光譜由于其譜線簡單、分析含量范圍廣、靈敏度及準(zhǔn)確度高的特點,在環(huán)保、催化、醫(yī)學(xué)和藥學(xué)等領(lǐng)域均獲得發(fā)展[11-12]。
本文采集了多種常見塑料及工程塑料樣本的X射線吸收光譜,并結(jié)合主成分分析和基于遺傳算法優(yōu)化的誤差反向傳播(GA-BP)神經(jīng)網(wǎng)絡(luò)實現(xiàn)對塑料的自動分類識別。
15種常見塑料和工程塑料,見表1。樣本為直徑30 mm、長度50 mm的圓柱體。
X射線光譜檢測系統(tǒng)[13],自建,主要組成為X射線管、CdTe探測器、高壓電源等基本元件,其整體結(jié)構(gòu)見圖1;KYW800型X射線管(陽極靶材料為鎢(74W));X-123型CdTe探測器(能量分辨率為 850 eV(FWHM)@122 keV,57Co);XRB 100 W高壓電源(工控主機IPC-610機型)。實驗相關(guān)的參數(shù)設(shè)置:X射線管電壓60 kV,管電流10 μA,燈絲電流 1 000 mA,探測器通道數(shù)設(shè)置為512,采集時間60 s。
表1 15種常見塑料和工程塑料的編號與名稱Table 1 The number and name of the 15 kinds ofcommon plastics and engineering plastics
圖1 X射線吸收光譜儀示意圖Fig.1 Schematic diagram of X-ray absorption spectrometer
X射線吸收光譜(XAS)的產(chǎn)生原理是X射線穿過一定厚度的物質(zhì)時,會發(fā)生散射和吸收現(xiàn)象,從而使得光譜的強度減弱,具體減弱的程度是由所含原子的種類和數(shù)目即物質(zhì)的性質(zhì)所決定。其穿過樣本前后的強度變化情況滿足下式[14]:
I=I0e-μd
(1)
其中,I0表示X射線入射光譜的強度,I表示X射線出射光譜的強度,由X射線探測器直接采集得到,μ表示吸收系數(shù),d為樣品厚度。
X射線吸收光譜即指在不同能量X射線下的吸收系數(shù)的變化趨勢,由式(1)可得X射線吸收光譜的計算公式:
(2)
因此在實驗過程中,首先在不放置樣本的情況下采集X射線管的發(fā)射光譜,即X射線入射光譜。然后將樣本放置在X射線管與探測器中間,采集得到X射線出射光譜。通過公式(2)的計算便得到對應(yīng)X射線吸收光譜,對每種樣本采集100組數(shù)據(jù)。每次采集過程中樣本被X射線穿透的位置都不相同。
對計算得到的X射線吸收光譜進行0-1歸一化處理。0-1歸一化處理作為一種常見的數(shù)據(jù)處理方法,可以消除儀器誤差,并可以使神經(jīng)網(wǎng)絡(luò)算法更快的運行。
X射線探測器采集到的譜線經(jīng)過預(yù)處理之后的光譜見圖2,圖中橫坐標(biāo)為X射線能量,縱坐標(biāo)為X射線吸收系數(shù)。圖中8~12 keV內(nèi)的三個波峰皆是由于X射線管陽極靶材料的特征X射線被樣本吸收引起,三個波峰的能量值分別為8.396,11.333,13.111 keV。
圖2 預(yù)處理后的各樣本X射線吸收光譜Fig.2 X-ray absorption spectra of samples after pretreatment
由圖2可知,塑料樣品的光譜之間的差異明顯,對于PPR、PVC、PTFE、PVDF、PSU、ABS這6種塑料樣品,可以比較明顯的和其它樣品區(qū)分。對于另外9種塑料,則無法直接準(zhǔn)確的識別。
主成分分析(PCA)是一種常見的降低信息維度的方法,可以將多個變量進行線性變換從而提取特征向量,也就是將具有一定相關(guān)性的多個向量重新組合,構(gòu)成一組線性無關(guān)的特征向量,且這組特征向量可以盡可能地保留原始變量的信息,成為新的綜合指標(biāo)作為后續(xù)神經(jīng)網(wǎng)絡(luò)模型的輸入[15-16]。因此采用PCA方法提取塑料樣品光譜的特征。
首先對圖2中的光譜進行PCA計算,得到的各主成分的貢獻率見表2,其中前三個主成分的貢獻率累計達到99.38%,可以代表原光譜絕大部分的信息。因此采用這三個主成分作為特征向量代替原有的光譜數(shù)據(jù)作為后續(xù)神經(jīng)網(wǎng)絡(luò)模型的輸入。
表2 利用PCA提取特征后各主成分的貢獻率Table 2 Contribution of principal components obtained byusing PCA to extract features
誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò)是由一層輸入層、一層或多層隱含層、一層輸出層構(gòu)成的一種典型的多層前向型神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)模擬人腦神經(jīng)組織,具有生物神經(jīng)系統(tǒng)的基本特征,具有非線性映射能力、自學(xué)習(xí)、學(xué)習(xí)速度快、分類精度高等優(yōu)點[17]。因此首先采用BP神經(jīng)網(wǎng)絡(luò)塑料樣品光譜的特征進行識別。
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置為3-8-15-12-1三隱含層的結(jié)構(gòu),輸入層神經(jīng)元個數(shù)為3,輸出層神經(jīng)元個數(shù)為1,三個隱含層的神經(jīng)元個數(shù)分別為8、15、12。神經(jīng)網(wǎng)絡(luò)中的每個神經(jīng)元都有N個權(quán)值參數(shù)(N為上一層神經(jīng)元的個數(shù))和1個閾值參數(shù),權(quán)值和閾值皆采用隨機初始化。實驗共采集 15種塑料的1 500組數(shù)據(jù),其中1 200組為訓(xùn)練集,作為網(wǎng)絡(luò)的訓(xùn)練,另外300組作為測試集,用于對模型準(zhǔn)確率進行校驗。在1 200組訓(xùn)練集中,有20組作為驗證集用于模型訓(xùn)練過程中的模型評估。因為神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和初始閾值是隨機產(chǎn)生的,為避免該隨機因素導(dǎo)致的誤差,本實驗進行10次分類測試,并對網(wǎng)絡(luò)的初始權(quán)值、初始閾值和分類正確率進行記錄,分類正確率見圖3。
圖3 利用BP神經(jīng)網(wǎng)絡(luò)進行塑料分類的正確率Fig.3 Accuracy of plastic classification using BP neural network
由圖3可知,由于BP神經(jīng)網(wǎng)絡(luò)的隨機性,導(dǎo)致訓(xùn)練可能收斂于局部極小值,從而分類正確率的波動較大,最高達到98.29%,最低達到84.98%,穩(wěn)定性較差。
為了解決BP神經(jīng)網(wǎng)絡(luò)存在的識別穩(wěn)定性較差的問題,本實驗將利用遺傳算法(GA)對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行選擇、交叉和變異并代入原網(wǎng)絡(luò)中,建立基于遺傳算法優(yōu)化的誤差反向傳播(GA-BP)神經(jīng)網(wǎng)絡(luò)模型,提高分類準(zhǔn)確性。遺傳算法的基本步驟見圖4,過程主要包括編碼、適應(yīng)度函數(shù)的計算、選擇、交叉和變異[18]。
圖4 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的步驟Fig.4 The step of using genetic algorithm to optimize BP neural network
在上述設(shè)置的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,權(quán)值和閾值的個數(shù)總數(shù)為372個,因此使用遺傳算法對這372個參數(shù)的初始值進行優(yōu)化。遺傳算法的參數(shù)設(shè)置見表3。
在保持同上述10次分類時網(wǎng)絡(luò)結(jié)構(gòu)與初始權(quán)值和初始閾值相同的情況下,再利用GA-BP神經(jīng)網(wǎng)絡(luò)進行10次分類識別計算,計算結(jié)果見圖5。
表3 優(yōu)化過程中遺傳算法的參數(shù)設(shè)置Table 3 Parameters setting of geneticalgorithm in optimization process
由圖5可知,優(yōu)化后的GA-BP神經(jīng)網(wǎng)絡(luò)分類正確率基本保持在95%以上,且無明顯波動,可更好地實現(xiàn)樣本分類。結(jié)果表明GA-BP神經(jīng)網(wǎng)絡(luò)收斂性較好,具有更加穩(wěn)定的性能,可更好地應(yīng)用于塑料樣本的分類識別中。
目前實驗的缺陷在于所選用的樣本均為標(biāo)準(zhǔn)的均勻材質(zhì)的塑料,沒有對混合型塑料進行實驗。因此在后續(xù)的實驗中,計劃針對混合塑料樣本使用計算機斷層掃描(CT)的方法[19]對光譜進行重建,以達到更加全面的塑料分類效果。
針對包括ABS、PA6、PE、PVDF等共15種塑料的X射線吸收光譜建立自動識別方法。利用X射線吸收光譜無損檢測裝置對15種塑料樣本的X射線吸收光譜進行采集。然后對光譜數(shù)據(jù)進行預(yù)處理、主成分分析計算,提取原始光譜數(shù)據(jù)的3個特征,并分別利用BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)進行分類。實驗結(jié)果表明,利用遺傳算法可以緩和BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中出現(xiàn)的局部極小值問題,使分類性能更加穩(wěn)定。這對進一步的提升塑料分類效果具有重要的指導(dǎo)意義。