李雪瑩, 李宗民, 侯廣利, 邱慧敏, 呂紅敏, 陳光源, 范萍萍*
1. 中國(guó)石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院, 山東 青島 266580 2. 中國(guó)石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 山東 青島 266580 3. 齊魯工業(yè)大學(xué)(山東省科學(xué)院), 山東省科學(xué)院海洋儀器儀表研究所, 山東 青島 266061 4. 山東科技大學(xué)海洋科學(xué)與工程學(xué)院, 山東 青島 266590
海洋沉積物是大氣圈、 水圈、 生物圈和巖石圈相互作用的介質(zhì)和載體, 記錄了海陸變遷、 沉積環(huán)境變化等過(guò)程的詳細(xì)信息[1]。 海洋系統(tǒng)中碳的含量非常豐富, 經(jīng)過(guò)一系列的碳循環(huán), 碳信息最終記錄在沉積物中。 海洋沉積物中碳的變化是銜接海洋生態(tài)系統(tǒng)的過(guò)去與未來(lái)的信息橋梁, 揭示了海洋生態(tài)過(guò)程變化規(guī)律[2]。 因此開(kāi)展海洋沉積物碳含量的研究, 對(duì)掌握海洋生態(tài)系統(tǒng)碳循環(huán)規(guī)律, 研究全球碳循環(huán), 研究對(duì)氣候變化的響應(yīng)和反饋有著重要的作用。
傳統(tǒng)的測(cè)試方法費(fèi)時(shí)、 費(fèi)力。 目前碳含量分析可以使用元素分析儀測(cè)定, 但仍需烘干、 粉碎等前處理。 光譜技術(shù)是一種快速、 無(wú)損的測(cè)量方法, 已經(jīng)應(yīng)用于業(yè)、 化工、 食品等多個(gè)領(lǐng)域[3-4]。 在土壤養(yǎng)分含量分析中, 也取得了一定的成果[5-6]。 可見(jiàn)-近紅外光譜包含大量的物質(zhì)信息, 主要反映了樣品的O—H, C—H等官能團(tuán)的種類和數(shù)量。 通過(guò)算法和分析獲得樣品特征光譜信息并解譯, 測(cè)定其含量。 目前沉積物碳含量檢測(cè)的研究多為針對(duì)湖泊沉積物, 而對(duì)海洋沉積物碳含量的研究較少, 海洋沉積物的成分更為復(fù)雜, 在分析上更有難度, Jacq等利用短波紅外高光譜影像建立法國(guó)布爾吉湖巖芯沉積物樣本碳偏最小二乘回歸模型, 預(yù)測(cè)相關(guān)系數(shù)r為0.95[7]。
以青島鰲山灣海洋潮間161份沉積物為樣品, 分別采用海洋光學(xué)QE65000光譜儀和AVANTES光纖光譜儀AvaSpec-ULS2048采集沉積物可見(jiàn)-近紅外光譜。 將兩種光譜儀測(cè)得的光譜進(jìn)行多光譜融合, 分別采用偏最小二乘回歸和BP神經(jīng)網(wǎng)絡(luò)建立沉積物碳含量模型。 多光譜融合通過(guò)將多個(gè)光譜數(shù)據(jù)結(jié)合一起, 獲得比單一光譜更豐富的信息, 有利于對(duì)物質(zhì)進(jìn)行分析。 將多光譜融合模型預(yù)測(cè)結(jié)果與單一光譜沉積物碳含量預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。 對(duì)多光譜融合后的光譜進(jìn)行特征波長(zhǎng)篩選, 尋找沉積物碳的特征波段, 建立準(zhǔn)確度更高的沉積物碳模型, 實(shí)現(xiàn)對(duì)沉積物碳的快速測(cè)定。
采樣地點(diǎn)為青島鰲山灣海洋潮間帶兩個(gè)地點(diǎn)的沉積物樣品S1和S2, 共計(jì)161個(gè)沉積物樣品。 采樣深度為0~10 cm,每個(gè)采樣點(diǎn)間隔10 m。 潮間帶沉積物組成以黏土和粉砂為主。 將采集的樣品風(fēng)干研磨后, 過(guò)60目篩, 分成兩部分, 分別用于碳含量分析和光譜采集。 沉積物碳含量采用重鉻酸鉀氧化法測(cè)定, S1和S2的碳含量見(jiàn)表1。
表1 沉積物碳(g·kg-1)含量統(tǒng)計(jì)表Table 1 The statistical results of carbon (g·kg-1)content in soil samples
沉積物光譜1采用海洋光學(xué)QE65000光譜儀搭配DH-2000-BAL型光譜采集樣品的反射光譜, 光譜采樣間隔為1 nm, 積分時(shí)間600 ms, 譜區(qū)范圍200~1 000 nm。 光譜儀和光源通過(guò)Y型光纖連接, Y型光纖探頭依靠支架固定, 將樣品放在自制樣品盒中, 探測(cè)樣品的反射光譜。 每個(gè)樣品測(cè)定5次光譜反射率, 取平均值作為這個(gè)樣品的反射光譜。 由于光譜的前段和后端受噪聲影響, 因此沉積物光譜1反射取220~980 nm, 如圖1(a)所示。
沉積物光譜2采用AVANTES光纖光譜儀AvaSpec-ULS2048, 譜曲范圍160~1 100 nm, 采用同樣的方法測(cè)得光譜能量值, 見(jiàn)圖1(b)。
圖1 沉積物光譜1和沉積物光譜2Fig.1 The spectra 1 and spectra 2 of sediment samples
多光譜圖像融合是將在空間上存在冗余或互補(bǔ)的圖像數(shù)據(jù), 按照一定的規(guī)則進(jìn)行處理, 從而得到比單一圖像更準(zhǔn)確的信息[8]。 多光譜融合通過(guò)將多個(gè)光譜數(shù)據(jù)結(jié)合一起, 獲得比單一光譜更豐富的信息, 有利于對(duì)物質(zhì)進(jìn)行分析。 兩種光譜儀的波段均為200~1 000 nm, 但包含的具體信息有所差異。 將這兩個(gè)光譜儀的光譜數(shù)據(jù)融合處理, 獲取更多更全的光譜信息, 能夠更加完整的表征樣品的信息。
由于光譜儀1獲取的是光譜反射率, 而光譜儀2獲取的是光譜能量值, 因此先將兩個(gè)光譜儀的光譜數(shù)據(jù)歸一化處理, 然后再將光譜儀1和光譜儀2的光譜混合在一起, 得到多光譜融合光譜。 融合光譜具備光譜儀1和光譜儀2的所有光譜值, 主要集中在220~980 nm。 因此, 多融合光譜包括了更多的光譜信息。
偏最小二乘回歸(PLSR)是將相關(guān)分析、 多元線性回歸和主成分的優(yōu)點(diǎn)集合在一起, 在計(jì)算過(guò)程中同時(shí)考慮自變量(光譜數(shù)據(jù))和因變量矩陣(化學(xué)參考值)對(duì)建模效果的影響,能夠較好地處理數(shù)據(jù)多重共線性、 因子結(jié)果不確定性和數(shù)據(jù)非正態(tài)分布等問(wèn)題[9]。 通過(guò)降維運(yùn)算得到潛在變量, 達(dá)到消除無(wú)用信息的目的。 在已知光譜數(shù)據(jù)和化學(xué)值數(shù)據(jù)的基礎(chǔ)上, 通過(guò)偏最小二乘回歸建立相關(guān)模型, 實(shí)現(xiàn)對(duì)未知樣品的預(yù)測(cè)。 該方法是目前最常用的化學(xué)計(jì)量學(xué)建模方法之一。
BP神經(jīng)網(wǎng)絡(luò)(BPNN)是一種基于誤差反向傳播算法的多層前向神經(jīng)網(wǎng)絡(luò), 通過(guò)反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小[10]。 反向傳播神經(jīng)網(wǎng)絡(luò)運(yùn)行過(guò)程分為兩個(gè)部分: 一是正向計(jì)算過(guò)程, 從樣本中選取信息, 從輸入層通過(guò)隱含層計(jì)算出各單元的輸出值; 二是誤差反向過(guò)程, 誤差由輸出層計(jì)算, 隱含層各元素的誤差逐層計(jì)算, 并修改前一層的權(quán)重值。
采用順序分類劃分建模集和檢驗(yàn)集, 以PLSR建立光譜儀1、 光譜儀2、 多光譜融合的海洋沉積物碳含量光譜模型, 模型評(píng)價(jià)結(jié)果見(jiàn)表2。
表2 海洋沉積物碳含量光譜模型評(píng)價(jià)結(jié)果-PLSRTable 2 Model evaluation of carbon contentdetection in marine sediments-PLSR
同樣采用順序分類劃分建模集和檢驗(yàn)集, 以BPNN分別建立光譜儀1、 光譜儀2、 多光譜融合的海洋沉積物碳含量光譜模型, 模型評(píng)價(jià)結(jié)果見(jiàn)表3。
表3 海洋沉積物碳含量光譜模型評(píng)價(jià)結(jié)果-BPNNTable 3 Model evaluation of carbon contentdetection in marine sediments-BPNN
由表3可知, 采用BPNN建立碳含量模型的建模集的評(píng)價(jià)結(jié)果與PLSR建模結(jié)果一致, 依次為光譜儀1、 多融合光譜、 光譜儀2。 而檢驗(yàn)集的評(píng)價(jià)結(jié)果有所差異, 評(píng)價(jià)效果最好的為多融合光譜,R2和RPD值均略高于光譜儀1的值, 分別為0.814和2.235, 可用于沉積物碳含量的定量分析。
采用PLSR建模來(lái)尋找沉積物碳的特征波段。 多融合光譜的波段范圍取180~1 100 nm, 每間隔100 nm作為一個(gè)光譜波段, 以PLSR建立各光譜波段沉積物碳模型評(píng)價(jià)結(jié)果見(jiàn)表4。
表4 海洋沉積物各光譜波段碳含量光譜模型評(píng)價(jià)結(jié)果Table 4 Model evaluation of carbon content detections inmarine sediments for various spectral bands
表5 海洋沉積物碳含量光譜模型評(píng)價(jià)結(jié)果(530~780 nm到630~780 nm)
圖2(a) 多光譜融合560~790 nm擬合結(jié)果-PLSRFig.2(a) Fitting results of multispectral fusion in 560~790 nm range-PLSR
圖2(b) 多光譜融合560~790 nm擬合結(jié)果-BPNNFig.2(b) Fitting results of multispectral fusion in 560~790 nm range-BPNN
表6 海洋沉積物碳含量光譜模型評(píng)價(jià)結(jié)果(560~730 nm到660~830 nm)
在光譜儀1、 光譜儀2、 多光譜融合全波段建立模型中, BPNN的模型效果均優(yōu)于PLSR結(jié)果。 由于BPNN是一種非線性的學(xué)習(xí)機(jī)制, 數(shù)據(jù)越多, 學(xué)習(xí)能力越強(qiáng), 建立的模型越好; 而PLSR是一種線性的建模方法, 數(shù)據(jù)量越大, 出現(xiàn)的數(shù)據(jù)冗余會(huì)對(duì)模型結(jié)果又一定的影響。 在多融合光譜全波段BPNN模型中, 其結(jié)果優(yōu)于兩種單光譜儀, 多融合光譜數(shù)據(jù)量更大, 所含有信息更多, 更有利于BPNN學(xué)習(xí)和訓(xùn)練, 因此得到更好的預(yù)測(cè)結(jié)果。
在尋找海洋沉積物碳最優(yōu)波段中, 通過(guò)嘗試不同波段的評(píng)價(jià)結(jié)果, 獲得了沉積物碳的特征波段, 在560~790 nm。 多融合光譜560~790 nm波段中包含了兩種單光譜儀該波段的全部信息, 含有的光譜更加豐富, 能夠表征更多的沉積物碳的信息。 采用多融合光譜特征波段建立的海洋沉積物碳模型結(jié)果優(yōu)于各單光譜儀全波段和多融合光譜全波段的模型結(jié)果。 因此采用多融合光譜特征波段建立海洋沉積物碳含量模型, 能夠提高海洋沉積物碳含量的預(yù)測(cè)結(jié)果。