韓曉爽,劉德慶,欒曉寧,郭金家,劉永信,鄭榮兒*
1. 中國海洋大學(xué)光學(xué)光電子實驗室,山東 青島 266100 2. 內(nèi)蒙古大學(xué)電子信息工程學(xué)院,內(nèi)蒙古 呼和浩特 010021
基于激光誘導(dǎo)時間分辨熒光的原油識別方法研究
韓曉爽1, 2,劉德慶1,欒曉寧1,郭金家1,劉永信2,鄭榮兒1*
1. 中國海洋大學(xué)光學(xué)光電子實驗室,山東 青島 266100 2. 內(nèi)蒙古大學(xué)電子信息工程學(xué)院,內(nèi)蒙古 呼和浩特 010021
在柴油、汽油、重質(zhì)燃料油等成品油和原油等溢油油源的區(qū)分方面,熒光光譜結(jié)合模式識別手段得到了廣泛的應(yīng)用。傳統(tǒng)的三維熒光光譜分析方法雖然能夠獲得溢油樣品豐富的成分信息,但難以適應(yīng)現(xiàn)場應(yīng)用的要求,目前還停留在實驗室檢測的階段。發(fā)展適用于現(xiàn)場應(yīng)用的原油識別方法,對于海洋溢油污染的快速響應(yīng)與處理意義重大。面向激光雷達的需要,發(fā)展了一種基于激光誘導(dǎo)時間分辨熒光手段、結(jié)合支持向量機(SVM)模型的原油識別方法,從時間和波長兩個不同維度出發(fā),通過對時間窗口和波長范圍的選取進行優(yōu)化,獲得了理想的油種識別準(zhǔn)確率。實驗結(jié)果表明通過選取ICCD探測延時為54~74 ns可以將分類正確率從全譜線數(shù)據(jù)的83.3%提高到88.1%。通過選取波長范圍為387.00~608.87 nm的譜線數(shù)據(jù),可將疑似油種的分類正確率從全譜線數(shù)據(jù)的84%提高到100%。激光熒光雷達在實際工作中,受波浪、運載平臺晃動等因素的影響,探測延時會出現(xiàn)一定的波動。本文介紹的分類識別方法通過時間和波長兩個維度的篩選,更加適用于現(xiàn)場探測數(shù)據(jù)的識別,并進一步凸顯了原油時間分辨熒光光譜特征,為疑似油種分類識別過程中數(shù)據(jù)量的壓縮提供了重要依據(jù)。
原油; 時間分辨熒光; 支持向量機; 數(shù)據(jù)縮減
海上溢油污染是當(dāng)今全球海洋污染最嚴(yán)重的問題之一,船舶漏油、水下油井井噴等方式都會造成嚴(yán)重的水域污染及財產(chǎn)損失、人體健康損害,近年來受到了越來越多的關(guān)注。針對日益嚴(yán)峻的海洋溢油問題,準(zhǔn)確快速地鑒別溢油來源將為選擇適當(dāng)?shù)囊缬晚憫?yīng)措施提供重要科學(xué)依據(jù),也是解決溢油事故中各類責(zé)任糾紛的需要。
在目前眾多的海洋溢油探測手段中,激光熒光雷達是最有發(fā)展前途的技術(shù)手段之一。加拿大環(huán)境技術(shù)中心研制的SLEAF系統(tǒng),美國NASA與NOAA聯(lián)合研制的AOL系統(tǒng)[1]是目前成熟的面向海洋溢油檢測的系統(tǒng),中國海洋大學(xué)也研制了一套多通道激光雷達溢油檢測系統(tǒng)[2-3]。在不同油種的識別方面,激光熒光遙感手段具有明顯優(yōu)勢[4]。在柴油、汽油、重質(zhì)燃料油等成品油和原油等溢油油源的辨別方面,熒光光譜結(jié)合模式識別手段,如主成分分析(principal component analysis, PCA)[5-7]、人工神經(jīng)網(wǎng)絡(luò)[8]、平行因子分析(parallel factor analysis, PARAFAC)[9]、軟獨立建模分析(soft independent modelling of class analogy, SIMCA)[10]等得到了廣泛應(yīng)用。盡管上述模式識別手段與激發(fā)-發(fā)射光譜矩陣相互結(jié)合,獲得了比較理想的油種識別效果,但傳統(tǒng)熒光光譜探測方法難以適應(yīng)現(xiàn)場應(yīng)用對探測距離和效率的要求,目前還停留在實驗室研究階段。此外,在現(xiàn)場探測中波浪、運載平臺晃動會導(dǎo)致激光雷達的探測延時出現(xiàn)波動,還有實驗結(jié)果表明探測延時的變化還會導(dǎo)致熒光光譜峰位的移動,這使得區(qū)分原本輪廓相似的原油光譜更為困難。因此,發(fā)展適合于激光雷達的原油識別方法至關(guān)重要。
針對六種不同類型原油樣品的時間分辨熒光光譜,在結(jié)合支持向量機(support vector machines, SVM)模型的基礎(chǔ)上發(fā)展了一種面向激光雷達探測數(shù)據(jù)的油種識別方法,為激光誘導(dǎo)熒光技術(shù)應(yīng)用于海洋溢油現(xiàn)場探測提供支持。
1.1 儀器與樣品制備
采用實驗室搭建的時間分辨熒光實驗裝置[11],激發(fā)光源為Nd∶YAG脈沖激光器輸出的三倍頻激光(355 nm),光譜儀采用Andor公司的SR-303i型,光柵刻痕數(shù)150 l·mm-1,可實現(xiàn)的光譜分辨率為0.1 nm。ICCD采用Andor公司的DH720-18F-03型,其外觸發(fā)由激光器的調(diào)Q脈沖提供,用于觸發(fā)ICCD電子快門實現(xiàn)光譜數(shù)據(jù)采集。采集光譜的延時范圍為48~102 ns,步長為1 ns。
實驗所用樣品為勝利油田“渤601”、“埕北305”、“史138”、“坨167”、“鄭369”和“鄭氣3”六個井區(qū)的原油,樣品經(jīng)正己烷(色譜純)萃取后配制為0.5g·L-1的溶液并裝在比色皿中。
1.2 數(shù)據(jù)分析
SVM應(yīng)用核函數(shù)的展開定理,通過一定的非線性映射將樣本從低維的樣本空間映射到一個高維的特征空間(Hilbert空間),使得在特征空間中可以應(yīng)用線性方法解決樣本空間中高度非線性的回歸和分類問題,即實現(xiàn)了數(shù)據(jù)的線性化,適用于本質(zhì)上是非線性的分類問題以及樣本集較小的情況。由于樣品溶液中的熒光猝滅、原油復(fù)雜成分之間的相互作用、儀器的噪聲以及基線漂移等現(xiàn)象,光譜數(shù)據(jù)中帶有明顯的非線性特性,采用SVM可以獲得良好的分類結(jié)果。
考慮到樣本集較小,在模型的訓(xùn)練中均采用了交叉驗證的方法,即選取訓(xùn)練集中某一個為測試樣本,其余為訓(xùn)練樣本進行測試,再依次更換測試樣本直到所有的樣本都經(jīng)過循環(huán)。
本文選用LIBSVM工具箱實現(xiàn)SVM模型的建立,輸入未經(jīng)降維的原始光譜數(shù)據(jù),核函數(shù)選用徑向基函數(shù)(Radial Basis Function, RBF),懲罰系數(shù)c和gamma參數(shù)g的選取采用網(wǎng)格搜索法,即確定c和g的取值范圍與步進間隔大小,然后依次取值,使得訓(xùn)練集識別率最高的參數(shù)設(shè)定為最佳參數(shù),再進行檢測集的驗證。
為了選取光譜特征明顯、便于區(qū)分的波長范圍和延時區(qū)間,將時間分辨光譜數(shù)據(jù)分別降維為: 不同延時下的一系列發(fā)射光譜和不同波長下熒光強度隨時間的演化,并分別對這兩組數(shù)據(jù)進行分析。
2.1 光譜數(shù)據(jù)及預(yù)處理
六種原油的時間分辨光譜ICCD延時均設(shè)置為48~102 ns,間隔為1 ns,波長范圍為275.54~843.17 nm。圖1為實驗獲得的“渤601”原油樣品的典型時間分辨光譜,選取275.54~691.98 nm范圍內(nèi)的光譜進行分析,以避免激發(fā)光(355 nm)的二級衍射對熒光光譜數(shù)據(jù)造成的干擾。對樣品熒光的時間分辨光譜進行觀察時,發(fā)現(xiàn)當(dāng)熒光從最大強度開始衰減時,原油熒光光譜峰位存在紅移現(xiàn)象。這在一定程度上反映出原油中各熒光組分熒光衰減速率存在差異,或者存在熒光組分之間的能量傳遞[11]。實驗所用所有樣品的時間分辨光譜信息如表1所示,其中熒光時域半高寬(FWHM)采用高斯線型擬合的方式獲得。
Fig.1 Time-resolved fluorescence spectra of Bo601 crude oil sample
Table 1 Characteristic parameters of crude oil samples
2.2 不同延時下的發(fā)射光譜(時間篩選)
根據(jù)ICCD延時不同,可以將時間分辨光譜降維為一系列355 nm波長激發(fā)下的發(fā)射光譜,譜型隨延時的變化具有規(guī)律性。為取得具有代表性的分類結(jié)果,針對每種原油,從50 ns起每間隔3 ns選取一個譜線作為檢測集對分類模型進行驗證,其余時間點的譜線作為訓(xùn)練集對模型進行訓(xùn)練。光譜譜線在進行強度歸一化預(yù)處理后輸入分類模型。由于每種原油的延時為48~102 ns,共有55個譜線,因此訓(xùn)練集包含譜線樣本222個,檢測集包含譜線108個。在分類識別問題中,屬于樣本集較小的情況,同時考慮到在時間篩選的過程中需要不斷縮減樣本集中譜線的數(shù)量,樣本集中樣本個數(shù)進一步縮小,同樣屬于樣本集較小的情況,適合采用SVM模型進行訓(xùn)練與檢測。
由于六種原油樣品的輪廓相似且譜峰范圍相互重疊(見表1),分類模型受到了干擾。選取參數(shù)c和g分別為18 820.27和0.000 49時,訓(xùn)練集交叉驗證的正確率最高,為82.4%(如圖2所示)。此時檢測集的分類正確率為83.3%,全譜的識別結(jié)果如表2所示。
Fig.2 Grid search on c and g parameters for SVM model
Table 2 SVM classification results for different delays
觀察處理結(jié)果發(fā)現(xiàn)在不同的延時區(qū)間內(nèi)各油種的分類正確率差異很大,以正確率最低的“史138”和“鄭氣3”為例,ICCD延時為48~83 ns時,正確率分別為83.3%和91.7%; ICCD延時為84~102 ns時,正確率僅為50%和16.7%。因此,合理選擇延時區(qū)間可以提高分類準(zhǔn)確率。
經(jīng)過多次選擇最終確定取訓(xùn)練集與測試集樣本延時區(qū)間均為54~74 ns,經(jīng)過時間篩選后“渤601”原油樣品的時間分辨光譜如圖3所示,此時分類正確率提升為88.1%,具體的識別結(jié)果見表3所示。
Fig.3 Time-resolved fluorescence spectra of Bo601 crude oil sample after delay selection
Table 3 SVM classification results with delay selection
由于訓(xùn)練集譜線樣本數(shù)目的減少,SVM算法不能準(zhǔn)確提取出區(qū)分于其余種類的特征,“埕北305”和“鄭氣3”的分類正確率有所下降,但整體正確率有所提升。此外,當(dāng)ICCD延時為54~74 ns時,對應(yīng)的是時間分辨光譜強度最高的時刻,這段時間內(nèi)各油種的光譜特征最為明顯,易于區(qū)分。
2.3 不同波長下的熒光強度變化(波長篩選)
將時間分辨熒光光譜降維為各發(fā)射波長下強度隨時間變化的譜線。每種原油的波長范圍為275.54~691.98 nm,從每10個譜線中選取一個作為檢測集,其余作為訓(xùn)練集,由于每種原油包含750個譜線,因此訓(xùn)練集包含譜線樣本4 050個,檢測集包含譜線樣本450個, 對全譜的分類結(jié)果見表4所示。
Table 4 SVM classification results for different wavelength
同樣,在不同的波長范圍內(nèi)各油種的分類正確率差異很大,經(jīng)過多次選擇最終確定取訓(xùn)練集與測試集樣本波長范圍為387.00~608.87 nm,經(jīng)過波長篩選后的“渤601”原油樣品時間分辨光譜如圖4所示,該波長范圍對應(yīng)的時間分辨光譜熒光信號較強。此時分類結(jié)果最好,識別率為100%。
Fig.4 Time-resolved fluorescence spectra of Bo601 crude oil sample after wavelength selection
將時間分辨熒光光譜從兩個不同的方向拆分為一系列二維光譜,針對這兩組不同的譜線數(shù)據(jù),分別采用SVM模型對勝利油田“渤601”、“埕北305”、“史138”、“坨167”、“鄭369”、“鄭氣3”六個井區(qū)的原油進行識別,并通過時間篩選和波長篩選方法提高了分類正確率。篩選后采用的ICCD延時和波長范圍對應(yīng)的時間分辨光譜信號較強,可作為原油時間分辨光譜的特征范圍,為今后時間分辨光譜的分類工作中原始數(shù)據(jù)的壓縮提供參考?;诩す饫走_的溢油探測,包括現(xiàn)場波浪、平臺晃動造成的延時波動的證實,以及激光熒光雷達數(shù)據(jù)的處理與油種識別,將是下一步工作的努力方向。
[1] Brown C E, Fingas M F. Marine Pollution Bulletin, 2003, 47(9): 477.
[2] LI Xiao-long, ZHAO Chao-fang, QI Min-jun, et al(李曉龍, 趙朝方, 齊敏珺, 等). Periodical of Ocean University of China(中國海洋大學(xué)學(xué)報), 2010, (8): 145.
[3] ZHAO Chao-fang, LI Xiao-long, MA You-jun(趙朝方, 李曉龍, 馬佑軍). Infrared and Laser Engineering(紅外與激光工程), 2011, 40(7): 1263.
[4] Leifer I, Lehr W J, Beatty D S, et al. Remote Sensing of Environment, 2012, 124: 185.
[5] Brown C E, Fingas M F. Marine Pollution Bulletin, 2003, 47(9): 477.
[6] Li J, Fuller S, Cattle J, et al. Analytica Chimica Acta, 2004, 514(1): 51.
[7] Brown C E, Marois R, Fingas, et al. International Oil Spill Conference, 2001. 917.
[8] LIN Bin, AN Ju-bai(林 彬,安居白). Marine Environmental Science(海洋環(huán)境科學(xué)), 2004, 23(1): 47.
[9] Christensen J H, Hansen A B, Mortensen J, et al. Analytical Chemistry, 2005, 77(7): 2210.
[10] Alostaz M, Biggar K, Donahue R, et al. Journal of Environmental Engineering and Science, 2008, 7(3): 183.
[11] LIU De-qing, LUAN Xiao-ning, HAN Xiao-shuang, et al (劉德慶, 欒曉寧, 韓曉爽, 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2015, 35(6): 1582.
*Corresponding author
Discrimination of Crude Oil Samples Using Laser-Induced Time-Resolved Fluorescence Spectroscopy
HAN Xiao-shuang1, 2, LIU De-qing1, LUAN Xiao-ning1, GUO Jin-jia1, LIU Yong-xin2, ZHENG Rong-er1*
1. Optics and Optoelectronics Laboratory, Ocean University of China, Qingdao 266100, China 2. College of Electronic Information Engineering, Inner Mongolia University, Huhhot 010021, China
The Laser-induced fluorescence spectra combined with pattern recognition method has been widely applied in discrimination of different spilled oil, such as diesel, gasoline, and crude oil. However, traditional three-dimension fluorescence analysis method, which is not adapted to requirement of field detection, is limited to laboratory investigatio ns. The development of oil identification method for field detection is significant to quick response and operation of oil spill. In this paper, a new method based on laser-induced time-resolved fluorescence combined with support vector machine (SVM) model was introduced to discriminate crude oil samples. In this method, time-resolved spectra data was descended into two dimensions with selecting appropriate range in time and wavelength domains respectively to form a SVM data base. It is found that the classification accurate rate increased with an appropriate selection. With a selected range from 54 to 74 ns in time domain, the classification accurate rate has been increased from 83.3% (without selection) to 88.1%. With a selected wavelength range of 387.00~608.87 nm, the classification accurate rate of suspect oil was improved from 84% (without selection) to 100%. Since the detection delay of fluorescence lidar fluctuates due to wave and platform swing, the identification method with optimizing in both time and wavelength domains could offer a better flexibility for field applications. It is hoped that the developed method could provide some useful reference with data reduction for classification of suspect crude oil in the future development.
Crude oil; Time-resolved fluorescence; Support vector machines; Data reduction
Oct. 31, 2014; accepted Feb. 25, 2015)
2014-10-31,
2015-02-25
國家自然科學(xué)基金項目(41406111)和國家海洋局海洋遙測工程技術(shù)研究中心創(chuàng)新青年基金項目(2013003)資助
韓曉爽,1990年生,內(nèi)蒙古大學(xué)信息科學(xué)與工程學(xué)院碩士研究生 e-mail: xiaoshuanghan@126.com *通訊聯(lián)系人 e-mail: rzheng@ouc.edu.cn
O433.4
A
10.3964/j.issn.1000-0593(2016)02-0445-04