周昆鵬,劉雙碩,崔 健,張紅娜,畢衛(wèi)紅,唐 維
1. 內(nèi)蒙古民族大學(xué)工學(xué)院,內(nèi)蒙古 通遼 028000 2. 燕山大學(xué)信息科學(xué)與工程學(xué)院,河北省特種光纖與光纖傳感重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004
光譜分析方法因其具有快速、綠色、無損等諸多優(yōu)點(diǎn),已在多領(lǐng)域得到廣泛的應(yīng)用,如食品[1]、醫(yī)藥衛(wèi)生[2]、生命安全[3]、環(huán)境監(jiān)測[4]等,基于光譜法的水質(zhì)參數(shù)檢測技術(shù)[5-6]也是其典型應(yīng)用,如紫外-可見(UV-Vis)吸收光譜法[7]、近紅外(NIR)光譜法[8]和熒光(fluorescence)光譜法[9]等。 其中,UV-Vis方法最為常見,采用NIR法檢測水質(zhì)還處于實(shí)驗(yàn)室研究階段,而熒光法目前主要用于檢測水體中的溶解有機(jī)物(DOM)。
通過采集水樣的熒光發(fā)射光譜,結(jié)合相關(guān)的化學(xué)計量學(xué)算法對水樣的COD濃度值進(jìn)行分析,最終得出了基于熒光發(fā)射光譜對水質(zhì)COD檢測的方法,該方法檢測速度快、綠色環(huán)保、無二次污染,具有較強(qiáng)的應(yīng)用價值。
實(shí)驗(yàn)樣本分為COD標(biāo)準(zhǔn)溶液和實(shí)際水樣兩類。 其中,不同濃度的COD標(biāo)準(zhǔn)溶液20份,其最低濃度為2.5 mg·L-1,最高濃度為100 mg·L-1; 另在不同的區(qū)域采集實(shí)際水樣63份,實(shí)際水樣均取自湖泊、河流等地表水源,采集實(shí)際水樣后在室溫下靜置30分鐘,取上層液體進(jìn)行實(shí)驗(yàn)。
熒光光譜采集設(shè)備采用日本Hitachi公司的F-7000型熒光分光光度計,其分辨率可達(dá)1 nm,波長準(zhǔn)確度為±1 nm,狹縫(光譜通帶)為1~20 nm,其采用的色散單元為光柵,光源為150 W的氙燈。 實(shí)際水樣的化學(xué)需氧量采用DRB200消解器和DR6000分光光度計(HACH公司,美國)進(jìn)行標(biāo)準(zhǔn)化測量。
1.3.1 熒光光譜的采集與處理
將F-7000熒光光譜儀的光電倍增管電壓設(shè)置為700 V,以5 nm為采樣間隔在200~400 nm的激發(fā)波長(EX)范圍內(nèi)采集熒光發(fā)射光譜,發(fā)射光譜范圍為EM=220~600 nm,間隔為2 nm。
由于三維熒光采集過程中存在比較強(qiáng)的散射峰(主要為瑞利散射和拉曼散射),對特征峰會造成干擾,必須去除以提高檢測精度、減小誤差[10]。 某實(shí)際水樣去除散射峰后的三維熒光光譜圖如圖1所示。
圖1 某實(shí)際水樣去散射后的三維熒光光譜圖
去除干擾峰后發(fā)現(xiàn),在EX=275 nm激發(fā)波長處的熒光發(fā)射光譜變化最為明顯,275/350 nm的激發(fā)/發(fā)射波長對所對應(yīng)的特征峰的熒光強(qiáng)度最強(qiáng)。 因此將每組實(shí)驗(yàn)樣本的三維光譜數(shù)據(jù)在EX=275 nm處進(jìn)行熒光發(fā)射光譜的提取,得到一組基于發(fā)射熒光(發(fā)射波長-熒光強(qiáng)度)光譜數(shù)據(jù)。 為了保證光譜數(shù)據(jù)的準(zhǔn)確性,在光譜采集過程中將每一份實(shí)驗(yàn)樣本采集三次光譜求均值后得到最終光譜數(shù)據(jù)進(jìn)行數(shù)學(xué)模型的建立。
1.3.2 實(shí)際水樣COD的理化值測量
為提高實(shí)際水樣化學(xué)需氧量檢測的準(zhǔn)確性,減小檢測誤差,采用快速消解分光光度法測量時將包括參比試劑在內(nèi)的各水樣進(jìn)行平行雙樣測量。 測量完成后,將各測量結(jié)果求均值后作為最終檢測值。 經(jīng)測定,在實(shí)驗(yàn)室環(huán)境下得到63份實(shí)驗(yàn)水樣的COD理化值的范圍為0.64~44.5 mg·L-1。
對于COD標(biāo)準(zhǔn)液樣本和實(shí)際水樣的熒光發(fā)射光譜數(shù)據(jù)進(jìn)行建模時,均采用基于PCR算法和PLS算法對水質(zhì)COD濃度進(jìn)行定量建模,為了驗(yàn)證建模方法的有效性和準(zhǔn)確性,對實(shí)驗(yàn)樣本進(jìn)行如下處理:
(1)在20組COD標(biāo)準(zhǔn)液的熒光光譜數(shù)據(jù)中隨機(jī)抽取15組作為校正集數(shù)據(jù)建立模型,其余5組數(shù)據(jù)作為檢驗(yàn)集數(shù)據(jù)對校正模型的準(zhǔn)確性進(jìn)行驗(yàn)證。
(2)在63組水樣的熒光光譜數(shù)據(jù)中隨機(jī)抽取48組作為校正集數(shù)據(jù),剩余15組作為檢驗(yàn)集數(shù)據(jù)。
(3)兩類實(shí)驗(yàn)樣本的熒光發(fā)射光譜范圍均為325~450 nm。
分別對COD標(biāo)準(zhǔn)液的熒光發(fā)射光譜的校正集數(shù)據(jù)基于PCR算法和PLSR算法建立模型。 經(jīng)比較,PCR算法和PLSR算法的主成分?jǐn)?shù)分別取8和5時,兩類模型的效果最優(yōu)。 建模結(jié)果如圖2所示,圖中R2為決定系數(shù)(又稱擬合優(yōu)度),其決定了相關(guān)的密切程度。
圖2 COD標(biāo)準(zhǔn)液數(shù)據(jù)的PCR和PLSR建模結(jié)果
從表1可知,檢驗(yàn)集樣本COD值的取值范圍為7.5~90 mg·L-1,且基于PCR和PLSR方法處理的數(shù)據(jù)結(jié)果誤差都不超過10%,因此兩種建模方法均能較好的對COD標(biāo)準(zhǔn)液的熒光發(fā)射光譜數(shù)據(jù)進(jìn)行模型的建立,且PLS法處理的數(shù)據(jù)所建立的模型更加精確。 經(jīng)過重復(fù)性實(shí)驗(yàn)驗(yàn)證,個別預(yù)測結(jié)果誤差較大的原因是由于配制標(biāo)準(zhǔn)溶液過程中引入了誤差,或在采集樣品光譜時比色皿表面潔凈程度不同而引入了誤差。
由于實(shí)際水樣的組分較為復(fù)雜,因此得到的光譜數(shù)據(jù)也存在不少干擾。 先采用S-G平滑處理算法將提取出的實(shí)際水樣的熒光發(fā)射光譜數(shù)據(jù)進(jìn)行平滑處理,處理后的譜線變得平滑但不改變譜線的整體變化趨勢。 平滑處理后,將校正集數(shù)據(jù)進(jìn)行PCR和PLSR建模,確定主成分?jǐn)?shù)的方法采用的是目前在諸多方法中最常用的預(yù)測殘差平方和(PRESS)的方法,PRESS越小,所得的模型的預(yù)測能力越好。 PCR和PLSR算法的主成分?jǐn)?shù)/隱含變量和PRESS的關(guān)系如圖3所示。
表1 COD標(biāo)準(zhǔn)液的預(yù)測值對比
由圖3可知,兩種算法的主成分(PC)數(shù)目均設(shè)為1~10,對于PLSR方法而言,PRESS在達(dá)到最低后又開始上升,且在主成分?jǐn)?shù)為6時達(dá)到了最小值。 表明了此后加入的主成分是與樣品無關(guān)的噪聲主成分,使得模型產(chǎn)生了過擬合,從而使模型的預(yù)測能力變?nèi)酢?/p>
圖3 PRESS與主成分?jǐn)?shù)/隱含變量的關(guān)系
通過比較確定PLS與PCR的主成分?jǐn)?shù)分別為6和7。 在此基礎(chǔ)上所得校正模型的效果如圖4所示,采用交叉驗(yàn)證方法對校正模型進(jìn)行預(yù)測效果的檢驗(yàn)。
有一小部分預(yù)測值遠(yuǎn)離真實(shí)值,說明熒光光譜的采集過程中引入了一定的誤差。 此外,實(shí)際水樣COD理化值檢測過程中也可能引入誤差,從而造成化學(xué)測量值與實(shí)際值之間出現(xiàn)較大的偏差。
為了驗(yàn)證模型效果,將檢驗(yàn)集的15組熒光發(fā)射光譜數(shù)據(jù)分別代入兩模型中進(jìn)行預(yù)測檢驗(yàn),得到的基于PCR和PLSR模型的實(shí)際水樣COD的預(yù)測值如表2所示。
圖4 實(shí)際水樣光譜數(shù)據(jù)的PCR和PLSR模型效果對比
表2 實(shí)際水樣的檢驗(yàn)集COD預(yù)測結(jié)果
為了檢驗(yàn)本研究所建模型的預(yù)測效果,重新配制COD標(biāo)準(zhǔn)溶液和采集地表水樣本,實(shí)驗(yàn)室環(huán)境下分別采用標(biāo)準(zhǔn)方法和實(shí)際水樣的PLSR模型對實(shí)驗(yàn)水樣的COD進(jìn)行檢測,進(jìn)而得到水質(zhì)COD標(biāo)準(zhǔn)化驗(yàn)值和熒光發(fā)射光譜數(shù)據(jù)的PLSR模型預(yù)測分析值的比較結(jié)果,如表3所示。
圖5 實(shí)際水樣檢驗(yàn)集的預(yù)測結(jié)果
表3 本方法與傳統(tǒng)方法的檢測效果對比
由表3可知,基于熒光發(fā)射光譜預(yù)測模型所得的水質(zhì)COD預(yù)測值與標(biāo)準(zhǔn)方法所得化驗(yàn)值相比能較好的反映出各水樣COD的變化情況。 對于COD標(biāo)準(zhǔn)溶液樣本,預(yù)測值的相對誤差稍大,原因?yàn)轭A(yù)測模型選用的是基于實(shí)際水樣的熒光發(fā)射光譜數(shù)據(jù)的PLSR模型,而相對于實(shí)際水樣,標(biāo)準(zhǔn)液水樣所含物質(zhì)單一,采集到的譜線變化規(guī)律可能不同于實(shí)際水樣的譜線變化規(guī)律,因此在預(yù)測過程中可能出現(xiàn)預(yù)測誤差稍大的現(xiàn)象。
此外,對于COD濃度為400 mg·L-1的標(biāo)準(zhǔn)溶液而言,預(yù)測值出現(xiàn)了較大的偏差,這是由于標(biāo)準(zhǔn)溶液的濃度效應(yīng)導(dǎo)致了熒光強(qiáng)度降低,使得熒光強(qiáng)度值與實(shí)驗(yàn)水樣的COD濃度值不再呈現(xiàn)線性關(guān)系。 對于實(shí)際水樣來說,預(yù)測值可以較好的反映出水質(zhì)COD的變化情況,且與標(biāo)準(zhǔn)理化值相比具有相對誤差較小,這說明基于熒光發(fā)射光譜數(shù)據(jù)所建PLSR模型具有較好的預(yù)測能力。
基于熒光發(fā)射光譜數(shù)據(jù)的PLSR模型具有較高的預(yù)測能力和較強(qiáng)的適應(yīng)性,可以快速、準(zhǔn)確的檢測出水質(zhì)COD。
分別以COD標(biāo)準(zhǔn)溶液和實(shí)際水樣為研究對象,分別建立和驗(yàn)證了基于單激發(fā)波長下熒光發(fā)射光譜數(shù)據(jù)的PCR和PLSR模型,針對特定水樣,將不同模型的預(yù)測效果進(jìn)行了對比。 得到如下結(jié)論:
(1)通過實(shí)驗(yàn)證明了PCR和PLSR方法用于建立水質(zhì)COD的熒光發(fā)射光譜數(shù)據(jù)模型的可行性; 表明兩類模型均可以合理表征熒光強(qiáng)度與水質(zhì)COD濃度之間的關(guān)系,且PLSR模型的預(yù)測效果更優(yōu)。
(2)本方法可用于檢測有機(jī)污染物濃度較低的水體,有機(jī)物濃度較高時采用本文方法時檢測誤差會變大。
(3)本方法利用特定激發(fā)波長下的熒光發(fā)射光譜進(jìn)行COD分析,較三維熒光光譜(EEM)更加簡單易行,可為水質(zhì)COD的光學(xué)分析方法提供一種新的思路。
(4)實(shí)際水體組分和所處環(huán)境復(fù)雜,對建模型的適應(yīng)性、水體含有熒光敏感物質(zhì)時及熒光光譜受水體環(huán)境影響對預(yù)測模型干擾有待進(jìn)一步探討。