祝 瑋,楊瑞芳,趙南京,殷高方,肖 雪,劉建國(guó),劉文清
1. 中國(guó)科學(xué)技術(shù)大學(xué)環(huán)境科學(xué)與光電技術(shù)學(xué)院,安徽 合肥 230026 2. 中國(guó)科學(xué)院合肥物質(zhì)科學(xué)研究院,安徽光學(xué)精密機(jī)械研究所,環(huán)境光學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230031
來(lái)自自然和人為來(lái)源的多環(huán)芳烴(PAHs)幾乎存在于所有自然水環(huán)境中[1-2]。它們是有毒有害的有機(jī)污染物,對(duì)動(dòng)物和人具有引發(fā)突變和致癌的威脅[3-4]。因此對(duì)實(shí)際水體中多環(huán)芳烴的快速現(xiàn)場(chǎng)監(jiān)測(cè)十分重要?;瘜W(xué)色譜法是一種理想的測(cè)量多環(huán)芳烴的方法,但是有比較耗費(fèi)時(shí)間和耗費(fèi)金錢(qián)的樣品前處理,包括分析物的提純和預(yù)先濃縮[5-6]。目前化學(xué)色譜法的替代方法是三維熒光光譜技術(shù)(TFST)[7-8]。TFST具有較高的靈敏度,是一種很有前途的快速、 無(wú)損地現(xiàn)場(chǎng)監(jiān)測(cè)水生環(huán)境中熒光多環(huán)芳烴的技術(shù)[9-10]。它同時(shí)測(cè)量多環(huán)芳烴的激發(fā)和發(fā)射矩陣來(lái)獲取各多環(huán)芳烴的熒光光譜信息,可作為區(qū)分不同種類(lèi)多環(huán)芳烴[11]的特征指紋。然而由于部分多環(huán)芳烴的結(jié)構(gòu)相近和自然水樣的成分復(fù)雜,以致造成熒光峰重疊和未知熒光組分的干擾導(dǎo)致三維熒光光譜缺乏一定的選擇性,阻礙了其直接識(shí)別水中多環(huán)芳烴污染的實(shí)用性。因此,成分光譜提取成為多環(huán)芳烴三維熒光光譜分析的主要研究熱點(diǎn)之一,并發(fā)展了包括平行因子分析(PARAFAC)在內(nèi)的多種多維分辨率方法[12-14]。
平行因子分析是當(dāng)前應(yīng)用最廣泛的分析方法之一,它將三維熒光光譜數(shù)據(jù)組直接分解為相對(duì)濃度分?jǐn)?shù),激發(fā)光譜和發(fā)射光譜,從而獲得底層熒光組分[15-17]。通過(guò)對(duì)多環(huán)芳烴[18]的激發(fā)和發(fā)射光譜與標(biāo)準(zhǔn)熒光光譜的比對(duì),可以實(shí)現(xiàn)組分的定性識(shí)別。以上所引的研究工作都是試驗(yàn)混合物的數(shù)量大于或至少等于純組分的數(shù)量的情況。但在實(shí)際應(yīng)用中,樣品數(shù)量過(guò)多是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。因此,從較少檢測(cè)的樣品中提取和識(shí)別更多的組分,即多組分三維熒光光譜的欠定分解,具有實(shí)際意義。在光譜分析領(lǐng)域?qū)η范ǚ纸獾难芯肯鄬?duì)較少[19-20]。PARAFAC可以從較少的樣品中回收更多的成分。但是,由于一些信號(hào)的熒光發(fā)射較弱,對(duì)于過(guò)少的樣品,它可能會(huì)給出不準(zhǔn)確的結(jié)果。奇異值分解(singular value decomposition, SVD)是一種有效的去噪工具,可以實(shí)現(xiàn)信號(hào)與噪聲之間的無(wú)偏微分[21-22]。奇異值分解去噪的基本原理是保留奇異值顯著的奇異分量。受此啟發(fā),利用SVD對(duì)微弱熒光信號(hào)的高亮進(jìn)行了研究。
這里提出了一種基于奇異值分解(SVD)和PARAFAC的欠定分解方法。該方法通過(guò)選取有效奇異值重構(gòu)觀測(cè)樣品的激發(fā)發(fā)射矩陣結(jié)構(gòu),解決了微弱熒光信號(hào)的突出問(wèn)題。根據(jù)奇異值的特點(diǎn),確定激勵(lì)發(fā)射矩陣的最優(yōu)結(jié)構(gòu)作為信號(hào)的新的偽樣本。將觀測(cè)樣品與新樣品結(jié)合,利用PARAFAC得到純組分光譜。最后,通過(guò)回收光譜與標(biāo)準(zhǔn)光譜的比較,識(shí)別出污染物成分。以多環(huán)芳烴為例,從兩種多環(huán)芳烴混合物的觀測(cè)光譜中成功地恢復(fù)了6種純組分熒光光譜,并利用相似系數(shù)進(jìn)一步評(píng)價(jià)其組分識(shí)別的效率。
作為一種三線性算法,三維PARAFAC可以對(duì)三維陣列進(jìn)行如下分解(Bro 1997; Nikolajsen等2003年)[15,23]
i=1,…,I;j=1,…,J;k=1,…,K
(1)
式(1)中,x(i,j,k)是i樣品的一系列尺寸為J×K(發(fā)射波長(zhǎng)j,激發(fā)波長(zhǎng)k)的激發(fā)-發(fā)射矩陣“疊加”而產(chǎn)生的三維矩陣x(I×J×K)的元素。其中I為樣本數(shù),J為發(fā)射波長(zhǎng),K為激發(fā)波長(zhǎng),F(xiàn)為因子數(shù),每個(gè)F對(duì)應(yīng)一個(gè)平行因子分量。aif為第i個(gè)樣品中f組分的相對(duì)濃度,bjf和ckf分別為f組分在λj波長(zhǎng)處的發(fā)射和檢測(cè)波長(zhǎng)λk處的波長(zhǎng)激發(fā)。將aif,bjf和ckf的所有元素收集到三個(gè)加載矩陣A,B和C中,分別對(duì)應(yīng)濃度分?jǐn)?shù)矩陣,就可以計(jì)算出相應(yīng)的發(fā)射光譜和激發(fā)光譜。
開(kāi)始的SVD過(guò)程將數(shù)據(jù)矩陣G分解為三個(gè)矩陣UM×N,SN×N和VN×N
G=USVT
(2)
式(2)中,VT是矩陣V的轉(zhuǎn)置,SN×N是一個(gè)對(duì)角矩陣,其對(duì)角元素為奇異值。利用s的s G=USVT (3) 奇異值分解通過(guò)分析有意義或不顯著的奇異值/向量,將有價(jià)值的信號(hào)從噪聲中分離出來(lái)。 實(shí)驗(yàn)以蒽(AN)、 菲(PHE)、 芘(PY)、 芴(FLU)、 苊(ACE)和熒蒽(FLA)這六種多環(huán)芳烴(PAHs)為分析對(duì)象。不僅因?yàn)樗鼈兊墓庾V重疊較廣,而且熒光強(qiáng)度差異較大。在相同濃度下,AN,PY和FLU的熒光強(qiáng)度相對(duì)于PHE,ACE和FLA較強(qiáng),F(xiàn)LA為最弱的熒光發(fā)射。以去離子水為背景制備樣品組,其中AN, PHE, PY, FLU, ACE和FLA的濃度分別為 2/4/6/10/3/9 μg·L-1 (X1) 7/3/1/2/5/4 μg·L-1 (X2) 1/2/3/5/7/10 μg·L-1 (X3) 8/5/2/7/1/3 μg·L-1 (X4) 3/6/9/4/10/8 μg·L-1 (X5) 9/8/7/9/3/2 μg·L-1 (X6) 以此來(lái)驗(yàn)證算法的有效性。 每次測(cè)試對(duì)由兩個(gè)樣本組成的一組樣本進(jìn)行帶奇異值或不帶奇異值的三維PARAFAC分解。通過(guò)比較PARAFAC模型的計(jì)算譜與純組分溶液標(biāo)準(zhǔn)譜的相似程度,使用相似系數(shù)來(lái)評(píng)價(jià)譜圖的分辨性能。計(jì)算得到的光譜與標(biāo)準(zhǔn)光譜之間的相似系數(shù)根據(jù)方程(4)(Tucker 1951〈A Method for Synthesis of Factor Analysis Studies〉)計(jì)算 (4) 式(4)中,x為計(jì)算得到的光譜向量,s為標(biāo)準(zhǔn)光譜向量。系數(shù)r反映了計(jì)算得到的光譜與標(biāo)準(zhǔn)光譜的相似程度。r值越大,計(jì)算譜x與標(biāo)準(zhǔn)譜s的相似度越高,通常認(rèn)為相似性系數(shù)小于0.8的成分識(shí)別不成功。 首先對(duì)第一個(gè)實(shí)驗(yàn)數(shù)據(jù)集(X1和X2)采用直接三線性分解的三維PARAFAC分解進(jìn)行擬合,根據(jù)式(1)進(jìn)行初始化。在運(yùn)行PARAFAC之前,需要確定組分?jǐn)?shù)。所有樣品都是通過(guò)在去離子水中加入6個(gè)不同比例的熒光多環(huán)芳烴制備而成。預(yù)測(cè)組分?jǐn)?shù)需要大于等于添加的多環(huán)芳烴的種類(lèi)數(shù),所以選擇6,7,8和9為可行的組分?jǐn)?shù)。圖1給出了6個(gè)分量重建的發(fā)射和激發(fā)光譜與對(duì)應(yīng)的6~9個(gè)分量的標(biāo)準(zhǔn)光譜的相似系數(shù)。FLA和ACE的激發(fā)光譜(Ex)或發(fā)射光譜(Em)相似系數(shù)均小于0.80,成分?jǐn)?shù)為6; PHE和FLA的相似系數(shù)低于0.80,成分?jǐn)?shù)為7; FLA和ACE的相似系數(shù)低于0.80,成分?jǐn)?shù)為8; FLA和ACE的相似系數(shù)低于0.80,成分?jǐn)?shù)為9。 為了提高PARAFAC對(duì)兩個(gè)樣本光譜的分辨性能,可以再構(gòu)造兩個(gè)偽樣本;構(gòu)造偽樣本的原則是,當(dāng)累積貢獻(xiàn)率首次大于99.9%時(shí),相對(duì)應(yīng)的奇異值視為強(qiáng)信號(hào),而將此奇異值前的所有奇異值設(shè)為零,具體方法如下: (1)對(duì)于每個(gè)被測(cè)樣本,按照式(2)計(jì)算奇異值; (2)奇異值的累積貢獻(xiàn)率計(jì)算如式(5) R(i)=(A(1)2+…+A(i)2)/(A(1)2+…+A(N)2) i=1,…,N (5) (3)為了提高微弱熒光信號(hào)的分辨率,根據(jù)式(3)重新構(gòu)造新的樣本,將第i奇異值設(shè)為0。 其中A(i)為第i個(gè)奇異值。N是奇異值的個(gè)數(shù)。當(dāng)R(i)的幅值首次大于99.9%時(shí),對(duì)應(yīng)的第i個(gè)奇異值視為強(qiáng)信號(hào)。 表1 樣本集X1和X2的前8個(gè)奇異值累積貢獻(xiàn)率Table 1 The first 8 cumulative contribution rates of singular values for the first set samples X1 and X2 圖2 樣本集X1,X2和兩個(gè)偽樣本提取出的六組分(PHE/PY/AN/FLA/FLU/ACE)發(fā)射光譜/激發(fā)光譜(藍(lán)線) 以及相應(yīng)的組分?jǐn)?shù)為8的標(biāo)準(zhǔn)光譜(紅線) 第一個(gè)樣本集的奇異值累積貢獻(xiàn)率列于表1。將樣本X1的前6個(gè)奇異值設(shè)為零,樣本X2的前5個(gè)奇異值設(shè)為零,其余奇異值分別構(gòu)成兩個(gè)新的對(duì)角矩陣。根據(jù)式(3)重構(gòu)兩個(gè)偽樣本。在每次測(cè)試中,將兩個(gè)觀察樣本和兩個(gè)新的偽樣本一起作為PARAFAC算法的輸入。圖2給出組分?jǐn)?shù)為8的PARAFAC雙向提取的發(fā)射和激發(fā)光譜。可以看出,雙向提取的發(fā)射光譜和激發(fā)光譜與相應(yīng)的標(biāo)準(zhǔn)光譜吻合得很好,特別是PY,AN,F(xiàn)LA,F(xiàn)LU和ACE的發(fā)射光譜,以及PHE,PY,AN,F(xiàn)LU和ACE的激發(fā)光譜。計(jì)算提取的發(fā)射光譜和激發(fā)光譜與6個(gè)組分對(duì)應(yīng)的標(biāo)準(zhǔn)光譜的相似系數(shù),均在0.85以上(圖3)??梢?jiàn),構(gòu)建新的奇異值偽樣本提高了弱熒光多環(huán)芳烴組分光譜的分辨能力和微弱信號(hào)的分解與放大特性。 圖3 可行組分?jǐn)?shù)設(shè)置從6到9下樣本集X1,X2和兩個(gè)偽樣本中的六種不同組分激發(fā)/發(fā)射光譜和標(biāo)準(zhǔn)光譜比對(duì)的相似系數(shù) 然后根據(jù)Eq.(1)對(duì)第二個(gè)樣本集X3和X4的實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行三維PARAFAC分解擬合。圖4給出了提取的6個(gè)組分的發(fā)射和激發(fā)光譜與對(duì)應(yīng)的6~9個(gè)組分設(shè)置下的標(biāo)準(zhǔn)光譜的相似系數(shù),其相似系數(shù)均小于0.80。根據(jù)Eq.(3)構(gòu)造兩個(gè)新的偽樣本。通過(guò)設(shè)置X3的前6個(gè)奇異值和樣本X4的前5個(gè)奇異值為0;將四個(gè)樣品(X3, X4和兩個(gè)新的偽樣本)輸入到PARAFAC算法和設(shè)置組分?jǐn)?shù)為9。提取的發(fā)射和激發(fā)光譜與對(duì)應(yīng)的標(biāo)準(zhǔn)光譜的相似系數(shù)均在0.81以上(圖5)。表2為樣本集X3和X4的前8個(gè)奇異值累積貢獻(xiàn)率。 表2 樣本集X3和X4的前8個(gè)奇異值累積貢獻(xiàn)率Table 2 The first 8 cumulative contribution rates of singular values for the first set samples X3 and X4 圖4 可行組分?jǐn)?shù)設(shè)置從6到9下樣本集X3,X4中的六種不同組分激發(fā)/發(fā)射光譜和標(biāo)準(zhǔn)光譜比對(duì)的相似系數(shù) 圖5 可行組分?jǐn)?shù)設(shè)置從6到9下樣本集X3,X4和兩個(gè)偽樣本中的六種不同組分激發(fā)/發(fā)射光譜和標(biāo)準(zhǔn)光譜比對(duì)的相似系數(shù) 圖6為最后一組樣品X5和X6,組分?jǐn)?shù)為6~9,采用三維PARAFAC分解提取的六組分PAHs的結(jié)果。PHE,F(xiàn)LA和ACE的相似系數(shù)均小于0.80。以同樣的方式構(gòu)造兩個(gè)新樣品通過(guò)設(shè)置樣本X5的前6個(gè)和X6的前5個(gè)奇異值為0(表3),PARAFAC的分析結(jié)果由圖7中給出。提取的發(fā)射光譜和激發(fā)光譜及其對(duì)應(yīng)的標(biāo)準(zhǔn)光譜的相似性系數(shù)均在0.81以上,表明PARAFAC耦合奇異值分解可以提高兩個(gè)觀測(cè)樣品對(duì)熒光強(qiáng)度較弱的多環(huán)芳烴的檢測(cè)能力。表3為樣本集X5和X6的前8個(gè)奇異值累積貢獻(xiàn)率。 為了從兩個(gè)樣品中識(shí)別出更多的組分,提出了一種基于SVD和三維PARAFAC的方法。通過(guò)奇異值分解對(duì)混合樣品的每一個(gè)三維熒光光譜進(jìn)行分析,并根據(jù)奇異值的累積貢獻(xiàn)率構(gòu)建新的偽樣本來(lái)突出微弱的熒光信號(hào)。結(jié)合偽樣品,采用三維PARAFAC實(shí)現(xiàn)了兩個(gè)樣品水中多環(huán)芳烴重疊熒光光譜的欠定盲分離。從兩個(gè)樣品中成功提取了6種(PHE/PY/AN/FLA/FLU/ACE)多環(huán)芳烴的源光譜,通過(guò)比較提取的發(fā)射/激發(fā)光譜與對(duì)應(yīng)的標(biāo)準(zhǔn)光譜的相似性系數(shù)實(shí)現(xiàn)成分識(shí)別。解析光譜與標(biāo)準(zhǔn)發(fā)射/激發(fā)光譜的相似性均在0.80以上。本研究為促進(jìn)激發(fā)發(fā)射熒光光譜技術(shù)在水體多環(huán)芳烴監(jiān)測(cè)中的應(yīng)用提供了潛在的科學(xué)價(jià)值。 表3 樣本集X5和X6的前8個(gè)奇異值累積貢獻(xiàn)率Table 3 The first 8 cumulative contribution rates of singular values for the first set samples X5 and X6 圖6 可行組分?jǐn)?shù)設(shè)置從6到9下樣本集X5,X6中的六種不同組分激發(fā)/發(fā)射光譜和標(biāo)準(zhǔn)光譜比對(duì)的相似系數(shù) 圖7 可行組分?jǐn)?shù)設(shè)置從6到9下樣本集X5,X6和兩個(gè)偽樣本中的六種不同組分激發(fā)/發(fā)射光譜和標(biāo)準(zhǔn)光譜比對(duì)的相似系數(shù)2 實(shí)驗(yàn)和結(jié)果討論
3 結(jié) 論