江亮亮, 羅小剛, 侯長(zhǎng)軍, 錢 燁, 霍丹群
(重慶大學(xué) 生物工程學(xué)院生物流變科學(xué)與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,重慶 400044)
及時(shí)準(zhǔn)確檢測(cè)出Cr6+含量至關(guān)重要[1,2]。納米金顆粒(gold nanoparticles,Au-NPs)因其獨(dú)特的光譜特性、較高的面容比和易于表面功能化被用作一種常用的檢測(cè)受體[3,4],將Au-NPs修飾到紙基上可實(shí)現(xiàn)重金屬離子的精確檢測(cè)[5~7]。本實(shí)驗(yàn)室的郭建峰等人[7]采用紙基納米金實(shí)現(xiàn)了Cr6+的濃度檢測(cè),具有檢測(cè)限低、快速、穩(wěn)定、特異性高等優(yōu)點(diǎn)。但在基于紙基納米金的Cr6+的檢測(cè)中,如何由反應(yīng)特征值自動(dòng)進(jìn)行濃度識(shí)別是一個(gè)亟待解決的問(wèn)題。
近年來(lái),采用人工神經(jīng)網(wǎng)絡(luò)[8]、模糊推理[9]、支持向量機(jī)[10,11]、獨(dú)立分量分析和主分量分析[12,13]等智能信息處理算法進(jìn)行濃度識(shí)別取得了長(zhǎng)足進(jìn)步。本文針對(duì)紙基納米金檢測(cè)Cr6+的特點(diǎn),采用支持向量回歸(support vector regression,SVR)實(shí)現(xiàn)濃度識(shí)別,并與多項(xiàng)式非線性回歸識(shí)別和反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)識(shí)別效果進(jìn)行對(duì)比,結(jié)果表明:基于SVR的濃度識(shí)別精度更高,能夠取得更好的識(shí)別結(jié)果。
Au-NPs在較高的消光系數(shù)(108~1010(mol/L)-1cm-1)下具有很強(qiáng)的表面等離子共振吸收(surface plasmon resonance,SPR)效應(yīng)[14],發(fā)生肉眼可辨的顏色變化,可作為一種檢測(cè)比色傳感器。按文獻(xiàn)[15]所述方式,將牛血清蛋白(bovine serum albumin,BSA)添加到納米金溶液中,配成BSA-Au-NPs溶液。再按文獻(xiàn)[8]所述方式制備涂有TiO2的纖維素紙基(silanization-titanium dioxide modified filter paper,STCP),該紙基上附著巰基和氨基,確保Au-NPs顆粒不易脫落。然后將BSA-Au-NPs溶液滴加到STCP上,用去離子水清洗后烘干,制成紙基納米金(BSA-Au-NPs/STCP)。最后將紙基放入混有HBr的待測(cè)溶液中水浴后取出烘干,采集紙基圖像,實(shí)驗(yàn)紙基較對(duì)照紙基的顏色變化程度即可表征Cr6+的濃度。其化學(xué)變化原理如式(1),紙基與Cr6+反應(yīng)后,Au-NPs顆粒的數(shù)量和粒徑減少,導(dǎo)致顏色變淺,顏色變化程度與Cr6+濃度呈正相關(guān)
(1)
圖1 紙基納米金制備及檢測(cè)
SVR[10]是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化和統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,其具有理論嚴(yán)謹(jǐn)、全局優(yōu)化、訓(xùn)練效率高和泛化性能好等優(yōu)點(diǎn)。
(2)
采用Lagrange乘子法對(duì)其進(jìn)行優(yōu)化,并引入核函數(shù)將原始樣本點(diǎn)映射到高維特征空間,其對(duì)偶問(wèn)題為
(3)
1)給定訓(xùn)練樣本集T={(x1,y1),(x2,y2),…,(xl,yl)}∈(X,Y),其中xi∈X=Rn,yi∈Y=R,i=1,2,…,l;
2)選擇適當(dāng)?shù)膮?shù)ν,C和核函數(shù)K(xi,xj);
(4)
反應(yīng)組紙基與對(duì)照組紙基的顏色差為分析所需的特征信息,為實(shí)現(xiàn)紙基納米金檢測(cè)Cr6+離子的濃度識(shí)別,選取25組實(shí)驗(yàn)數(shù)據(jù),如表1所示。
表1 紙基納米金的Cr6+檢測(cè)實(shí)驗(yàn)數(shù)據(jù)
各濃度紙基的顏色信息減去濃度為0時(shí)的紙基顏色信息即為顏色的變化程度,此時(shí)樣本數(shù)據(jù)包含濃度、R分量變化值ΔR,G分量變化值ΔG,B分量變化值ΔB,共24組數(shù)據(jù),n=24,其中ΔR,ΔG,ΔB為自變量,濃度為因變量。
數(shù)據(jù)歸一化效果對(duì)預(yù)測(cè)結(jié)果有較大影響,選用全序列法實(shí)現(xiàn)數(shù)據(jù)歸一化
(5)
將歸一化數(shù)據(jù)中的2/3作為訓(xùn)練集進(jìn)行訓(xùn)練,1/3作為測(cè)試集進(jìn)行驗(yàn)證。具體選擇方式為從第3個(gè)數(shù)據(jù)開(kāi)始,每間隔2個(gè)數(shù)據(jù)抽取1個(gè)數(shù)據(jù)作為測(cè)試集,余下的數(shù)據(jù)作為訓(xùn)練集,此時(shí)訓(xùn)練集共計(jì)16組數(shù)據(jù),測(cè)試集共計(jì)8組數(shù)據(jù)。
采用6—折交叉驗(yàn)證,在給定ε=0.001的前提下,懲罰系數(shù)C的取值范圍為2-10~210,核函數(shù)參數(shù)g的取值范圍為2-10~210,ν的取值范圍為2-20~20,均以指數(shù)變動(dòng)0.2作為步長(zhǎng),通過(guò)C,g,ν的不同取值,找出交叉校驗(yàn)誤差最小時(shí)對(duì)應(yīng)的那一組參數(shù)即為最優(yōu)參數(shù),RBF核函數(shù),Sigmod核函數(shù)和多項(xiàng)式核函數(shù)的c,g,ν分別為85.289 3,5.076 2,0.283 1;147.199 3,0.020 6,0.856 3;50.231 2,10.442 9,0.703 2。
采用訓(xùn)練集以不同核函數(shù)及對(duì)應(yīng)的最優(yōu)參數(shù)對(duì)模型進(jìn)行訓(xùn)練,將擬合結(jié)果分別投影到R空間、G空間和B空間進(jìn)行展示??芍琑BF核的ν-SVR模型擬合的回歸數(shù)據(jù)與原始數(shù)據(jù)重合率最高,擬合效果最好如圖2所示。3種不同內(nèi)核的模型的相關(guān)性R2分別為RBF核函數(shù)為0.997 5,Sigmod核函數(shù)為0.911 7,多項(xiàng)式核函數(shù)為0.969 3。
圖2 RBF核函數(shù)對(duì)應(yīng)的ν-SVR模型對(duì)訓(xùn)練集的擬合效果
可知,RBF核函數(shù)的模型擬合效果明顯優(yōu)于Sigmod核函數(shù)和多項(xiàng)式核函數(shù),表明RBF核函數(shù)的模型其訓(xùn)練精度較高,訓(xùn)練效果較好。因此,ν-SVR模型的最優(yōu)參數(shù)為:選用RBF核函數(shù),且C=85.289 3,g=5.076 2,ν=0.283 1。以最優(yōu)參數(shù)完成模型訓(xùn)練,即可對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。
為驗(yàn)證ν-SVR模型對(duì)濃度的識(shí)別效果,采用相同的訓(xùn)練集和測(cè)試集,與多項(xiàng)式非線性回歸識(shí)別方法和BP神經(jīng)網(wǎng)絡(luò)識(shí)別方法進(jìn)行對(duì)比,如表2。
表2 測(cè)試集預(yù)測(cè)結(jié)果 μmol·L-1
平均相對(duì)誤差(average relative error,ARE)表征了預(yù)測(cè)濃度與真實(shí)濃度之間的誤差大小,有
(6)
可知,ν-SVR模型對(duì)測(cè)試集的識(shí)別ARE為6.603 1 %、多項(xiàng)式非線性回歸的識(shí)別ARE為13.608 2 %、BP神經(jīng)網(wǎng)絡(luò)的識(shí)別ARE為30.084 1 %,其中,ν-SVR模型的識(shí)別ARE最低,識(shí)別精度最高,識(shí)別效果最好。即采用ν-SVR模型可實(shí)現(xiàn)紙基納米金檢測(cè)Cr6+濃度的精確識(shí)別。
本文將SVR應(yīng)用到當(dāng)前的研究熱點(diǎn)即,紙基納米金檢測(cè)中,對(duì)Cr6+濃度進(jìn)行預(yù)測(cè),根據(jù)最終的識(shí)別結(jié)果對(duì)比分析,相較多項(xiàng)式回歸分析、BP神經(jīng)網(wǎng)絡(luò),SVR具有更高的預(yù)測(cè)精度和較強(qiáng)的泛化能力,對(duì)紙基納米金的檢測(cè)研究具有重要理論價(jià)值和應(yīng)用前景。