国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPA-LSSVM的混合農(nóng)藥殘留熒光檢測建模方法

2022-11-15 06:53王曉燕季仁東卞海溢楊玉東蔣喆臻馮小濤徐江宇
南京理工大學學報 2022年5期
關(guān)鍵詞:波長光譜向量

王曉燕,季仁東,韓 月,卞海溢,楊玉東,蔣喆臻,馮小濤,徐江宇

(淮陰工學院 江蘇省湖泊環(huán)境遙感技術(shù)工程實驗室,江蘇 淮安 223001)

農(nóng)藥殘留是影響生態(tài)環(huán)境及食品安全的重要因素,目前針對農(nóng)藥殘留的檢測主要應(yīng)用氣相色譜法[1]、高效液相色譜方法[2]、色譜-質(zhì)譜聯(lián)用方法[3]、免疫分析方法[4]、酶抑制方法[5]、生物傳感器方法[6]以及光譜方法等[7,8]。熒光檢測屬于光譜方法中的一種,它具有檢測速度快、靈敏度高、操作簡便等優(yōu)點,常用于農(nóng)藥殘留的檢測及分析[9,10]。

農(nóng)藥殘留的定量分析通常應(yīng)用偏最小二乘法[11](Partial least square,PLS)、支持向量機方法[12]以及神經(jīng)網(wǎng)絡(luò)[13]等方法,其中,偏最小二乘法是化學計量學中應(yīng)用最廣泛的校正方法之一,其綜合了主成分分析和典型相關(guān)分析的優(yōu)勢,在基于光譜對農(nóng)藥殘留的定量分析中具有較好的預(yù)測性能。支持向量機方法通過應(yīng)用結(jié)構(gòu)風險最小化原理提高模型的泛化能力,能夠較好地解決小樣本問題,它通過非線性變換將原始變量映射到高維特征空間,并在高維空間中進行線性處理,從而避免出現(xiàn)維數(shù)災(zāi)難問題[14,15]。

目前,針對混合農(nóng)藥殘留的定量分析中,PLS方法仍是主流方法,文獻[16]基于表面增強拉曼光譜應(yīng)用PLS方法對臍橙表面的混合農(nóng)藥(亞胺硫磷和樂果)進行檢測分析,獲得了較好的含量預(yù)測結(jié)果。文獻[17]基于熒光光譜采用神經(jīng)網(wǎng)絡(luò)方法對速滅威和西維因兩種成分的混合農(nóng)藥進行定量分析,并分別比較了全光譜和遺傳算法獲取特征光譜兩種情況下的預(yù)測性能,結(jié)果顯示,遺傳算法優(yōu)選出特征波長后對應(yīng)的BP神經(jīng)網(wǎng)絡(luò)模型具有更高的預(yù)測精度。文獻[18]基于熒光光譜研究4種成分混合農(nóng)藥的含量預(yù)測,應(yīng)用支持向量機方法在全波長情況下對各成分進行了定量分析。在農(nóng)藥殘留的熒光檢測及分析建模中,支持向量機方法結(jié)合全光譜往往能夠取得較高的分析精度,但基于全波段的支持向量機模型也存在訓練時間長、運算復雜、冗余度高等不足。若首先針對熒光光譜進行特征選擇,優(yōu)選出較顯著的特征波長點,然后基于特征光譜建立支持向量機模型,則可大大加快訓練速度,獲得更加簡單實用的特征光譜模型。

本文提出了一種基于連續(xù)投影算法(Successive projections algorithm,SPA)和最小二乘支持向量機(Least squares support vector machines,LSSVM)的分析方法,用于混合農(nóng)藥殘留的含量預(yù)測。應(yīng)用連續(xù)投影方法優(yōu)選出熒光特征波長,并基于最小二乘支持向量機方法建立多組分定量分析模型,以期獲得優(yōu)于傳統(tǒng)偏最小二乘方法的預(yù)測精度。

1 SPA-LSSVM算法原理

1.1 連續(xù)投影算法

在光譜分析中應(yīng)用SPA方法選擇特征波長的原理為:首先將原始波長中的某一個波長點選中,然后分別計算出該波長在其它剩余未被選中波長上的投影,再將其中投影向量最大的波長點篩選到特征波長組合中,依次共篩選完成所需個數(shù)的特征波長后結(jié)束計算[19,20]。

若將光譜屬性矩陣記為XM×J(M為樣本數(shù),J為波長個數(shù)),Xk(0)代表初始波長向量,需要篩選的特征波長個數(shù)設(shè)為N,則SPA的實現(xiàn)步驟為

(1)在迭代開始前(n=1),任選一個光譜屬性矩陣X中的某一列向量xj,記作Xk(0);

(2)將其它未被選中的波長變量集合記為set,set={j,1≤j≤J,j?{k(0),k(1),…,k(n-1)}};

(3)按照如式(1)計算當前向量xk(n-1)對set集合中的剩余列向量xj投影

j∈set

(1)

(4)獲取最大投影值Pxj所對應(yīng)的波長k(n),則k(n)=arg(max(‖pxj‖)),j∈set;

(5)將最大投影值Pxj作為下次迭代時的初始值,即:xj=Pxj,j∈set;

(6)令n=n+1,若n

(7)直到n=N,循環(huán)結(jié)束,最終提取出的特征波長位置為{k(n),n=0,1,…,N-1}。

對應(yīng)于每一個初始k(0)和N,在循環(huán)一次后計算出交叉驗證集對應(yīng)的均方根誤差,其中均方根誤差最小值所對應(yīng)的k(n)即為篩選出的特征變量組合。本文應(yīng)用SPA算法從原始熒光光譜中篩選出與樣本濃度關(guān)系最為顯著的少數(shù)幾個波長點作為特征光譜,基于特征光譜回歸建模能夠減少計算量,進一步提高模型的訓練速度。

1.2 最小二乘支持向量機

最小二乘支持向量機方法將傳統(tǒng)支持向量機(Support vector machine,SVM)的不等式約束轉(zhuǎn)變?yōu)榈仁郊s束,將SVM所對應(yīng)的二次規(guī)劃問題轉(zhuǎn)換成了線性方程組的求解[21,22],其簡化了計算且訓練速度明顯快于傳統(tǒng)支持向量機方法。

LSSVM用于回歸時,其損失函數(shù)定義為誤差的二次項,對應(yīng)如下優(yōu)化問題

s.t.:yk=wTφ(xk)+b+ekk=1,…,N

(2)

式中:誤差e類似于SVM問題中的松弛變量,參數(shù)γ與懲罰變量的意義相同,作為權(quán)重用于平衡尋找最優(yōu)超平面和偏差量最小這兩個因素。

應(yīng)用拉格朗日方法求解上述優(yōu)化問題可得

b+ek-yk}

(3)

式中:αk,k=1,…,N,為拉格朗日乘子。根據(jù)優(yōu)化條件,分別對w、b、ek、αk求導,即

(4)

可得:

αk=γek

wTφ(xk)+b+ek-yk=0k=1,…,N

(5)

將其轉(zhuǎn)化為如下線性方程組的求解

(6)

式中:核矩陣Ωkl=φ(xk)Tφ(xl)=K(xk,xl),k,l=1,…,N。

求解上述方程組可得LSSVM的回歸函數(shù)為

(7)

1.3 SPA-LSSVM算法流程

本文提出了將連續(xù)投影算法與最小二乘支持向量機方法相結(jié)合,用于對混合農(nóng)藥殘留的定量分析。實現(xiàn)流程如圖1所示。

圖1 SPA-LSSVM算法流程

對應(yīng)的算法步驟為:

(1)獲取樣品光譜信息,將原始光譜屬性矩陣記為XM×J(M為樣本數(shù),J為波長個數(shù));

(2)應(yīng)用連續(xù)投影算法,從XM×J對應(yīng)的全波長中優(yōu)選出特征波長點,記為Kn(1≤n≤N);

(3)將Kn對應(yīng)的特征光譜屬性矩陣XM×N作為最小二乘支持向量機的模型輸入,樣品濃度作為模型輸出,訓練回歸模型;

(4)訓練完成后即可獲得LSSVM回歸函數(shù),用于對未知樣品的含量預(yù)測。

2 試驗與分析

2.1 檢測過程

分別配制濃度均為0.1 mg/mL的滅蠅胺、異丙甲草胺、克菌丹、噻蟲嗪標準溶液各100 mL,放置備用。從標準溶液中量取不同的4種農(nóng)藥進行混合并搖勻,共配制完成156個四組分混合農(nóng)藥測試樣本,應(yīng)用LS55熒光光度計檢測每個混合溶液的熒光光譜,設(shè)置儀器采樣間隔為0.5 nm,波長范圍為300~500 nm,激發(fā)波長為280 nm,狹縫寬度為6.0 nm。

2.2 樣本數(shù)據(jù)集

試驗樣本共156個,每個樣本的熒光光譜中共有401個波長,波長范圍為300~500 nm,波長間隔為0.5 nm。4組分混合農(nóng)藥樣本的熒光光譜如圖2(b)所示。圖2(a)為4種農(nóng)藥各自對應(yīng)的熒光光譜,其中,異丙甲草胺的熒光峰位于334 nm,滅蠅胺、克菌丹兩者的熒光峰均為340 nm,噻蟲嗪對應(yīng)的熒光峰在350 nm處,由此可見各組分之間有較嚴重的光譜重疊。

圖2 農(nóng)藥熒光光譜

將混合農(nóng)藥熒光光譜對應(yīng)的屬性矩陣記作X(156,401),則156代表樣本個數(shù),401代表300~500 nm光譜范圍內(nèi)的采樣點個數(shù)。樣本濃度矩陣可記作y(156,4),共4列,分別對應(yīng)4種農(nóng)藥的濃度。從試驗樣本中隨機抽取102組作為訓練集,剩余54組作為測試集。將數(shù)據(jù)集導入MATLAB平臺后,基于LSSVM方法建立四組分混合農(nóng)藥的回歸模型并測試驗證。

2.3 SPA-LSSVM模型建立過程

SPA-LSSVM模型的建立過程如圖3所示。獲得四組分混合農(nóng)藥的熒光光譜后,首先,對光譜進行平滑、歸一化預(yù)處理,分別以每種農(nóng)藥的濃度為因變量,混合農(nóng)藥樣本對應(yīng)的熒光強度為自變量,應(yīng)用SPA算法優(yōu)選出每種農(nóng)藥對應(yīng)的特征波長,共獲得4組不同的特征波長組合,每組特征波長表示其位置處的熒光強度對該種農(nóng)藥的濃度變化最為顯著,為了獲得較全面的熒光屬性且不漏掉較顯著的熒光波長,對四組特征波長取其合集作為該混合農(nóng)藥所對應(yīng)的特征波長點;然后,應(yīng)用LSSVM方法進行模型訓練,其中模型輸入為特征波長處的熒光強度,模型輸出對應(yīng)4種組分的濃度值;最后,對模型預(yù)測性能進行測試,并與傳統(tǒng)PLS方法分析對比。

圖3 SPA-LSSVM模型建立過程

2.4 模型性能評價

模型評價主要通過決定系數(shù)(相關(guān)系數(shù)的平方,R2)、校正均方根誤差(Root mean square error for calibration,RMSEC)、預(yù)測均方根誤差(Root mean square error for prediction,RMSEP)等參數(shù)對本文的SPA-LSSVM方法及傳統(tǒng)PLS方法性能進行對比,決定系數(shù)、均方根誤差的計算式如下

(8)

3 結(jié)果與討論

3.1 SPA優(yōu)選特征波長

以混合農(nóng)藥對應(yīng)的401個波長處熒光強度為自變量,以每種農(nóng)藥的濃度為因變量,應(yīng)用SPA算法分別優(yōu)選出4種農(nóng)藥對應(yīng)的特征波長點,算法中的特征維數(shù)范圍設(shè)置為:1~20,其篩選出的特征波長結(jié)果如圖4所示。其中,滅蠅胺對應(yīng)11個特征波長點,說明這11個波長處的熒光強度對滅蠅胺濃度變化較為顯著。異丙甲草胺、克菌丹、噻蟲嗪對應(yīng)的特征波長個數(shù)分別為:11、8和14。由圖4可知,4種農(nóng)藥優(yōu)選出的特征波長個數(shù)雖然不一致,但其大部分重合或者非常接近,本文將4種結(jié)果求合集作為最終的SPA特征波長優(yōu)選結(jié)果,共獲得25個特征波長,其分布如圖5所示。

圖4 4種農(nóng)藥對應(yīng)的SPA特征波長分布

圖5 混合農(nóng)藥殘留SPA特征波長分布圖

由圖5可知,合集中的25個特征波長點分布于300~500 nm的整個區(qū)間,在特征峰340 nm處比較集中。尤其在光譜趨勢發(fā)生顯著變化的位置,均對應(yīng)特征波長點。

3.2 LSSVM模型結(jié)果

以SPA算法所優(yōu)選出25個特征波長處的混合農(nóng)藥熒光強度作為輸入,應(yīng)用LSSVM方法訓練多回歸模型。模型參數(shù)設(shè)置如下:核函數(shù)選用徑向基核函數(shù)(Radial basis function,RBF),其表達式為K(xi,xj)=exp(-g‖xi-xj‖2),參數(shù)g的取值大小影響模型的分類精度;以網(wǎng)格搜索法優(yōu)化LSSVM參數(shù),即分別針對懲罰因子和核函數(shù)參數(shù)設(shè)定搜索范圍,在指定區(qū)間內(nèi)實現(xiàn)參數(shù)的尋優(yōu);另外,設(shè)置5折交叉驗證。模型訓練完成后分別對訓練集、測試集進行測試驗證,結(jié)果如圖6和圖7所示。

由圖6可知,訓練集的模型測試結(jié)果較為理想,除了噻蟲嗪對應(yīng)的決定系數(shù)稍低,其他3種農(nóng)藥對應(yīng)的決定系數(shù)均大于0.9。圖7中的測試集驗證結(jié)果整體低于訓練集,異丙甲草胺中有個別樣本點對應(yīng)的測試誤差較大,其他3種農(nóng)藥對應(yīng)的模型決定系數(shù)均大于0.8。

3.3 傳統(tǒng)PLS模型結(jié)果

為驗證SPA-LSSVM方法的優(yōu)越性,應(yīng)用傳統(tǒng)PLS方法對該四組分混合農(nóng)藥進行回歸分析,針對訓練集、測試集分別進行測試驗證,結(jié)果如圖8和圖9所示。

由圖8和圖9可知,PLS方法對應(yīng)的訓練集預(yù)測精度稍優(yōu)于測試集。以滅蠅胺農(nóng)藥為例,其訓練集對應(yīng)的均方根誤差(RMSEC)為0.003 6 mg/mL,優(yōu)于測試集的均方根誤差(RMSEP)0.005 5 mg/mL;訓練集對應(yīng)的決定系數(shù)為0.939 2,也優(yōu)于測試集對應(yīng)的0.912 8。其余3種農(nóng)藥,均表現(xiàn)出類似的性能測試結(jié)果。

圖6 訓練集SPA-LSSVM回歸結(jié)果

圖7 測試集SPA-LSSVM回歸結(jié)果

圖8 訓練集PLS回歸結(jié)果

圖9 測試集PLS回歸結(jié)果

3.4 SPA-LSSVM與PLS、SVR方法的性能對比

為了驗證SPA-LSSVM方法性能的優(yōu)越性,在同等試驗條件下,基于全波長對該混合農(nóng)藥進行了支持向量機方法的回歸分析,分別將SPA-LSSVM、SVR、PLS 3種模型結(jié)果列于表1中。

由表1可知,針對訓練集,SPA-LSSVM對應(yīng)的4種農(nóng)藥校正均方根誤差RMSE均低于PLS方法,且其決定系數(shù)R2均高于PLS;將其與SVR模型結(jié)果進行對比,發(fā)現(xiàn)除了噻蟲嗪之外,其他3種農(nóng)藥的含量預(yù)測結(jié)果均顯示SPA-LSSVM方法的性能更優(yōu)。對測試集來說,前兩種農(nóng)藥(滅蠅胺、異丙甲草胺)對應(yīng)的SPA-LSSVM性能參數(shù)稍低于PLS方法,而后兩種農(nóng)藥(克菌丹、噻蟲嗪)則是SPA-LSSVM方法所對應(yīng)的預(yù)測精度更高,再將其與SVR模型結(jié)果進行對比,發(fā)現(xiàn)除了編號為2的農(nóng)藥(異丙甲草胺)對應(yīng)的預(yù)測結(jié)果相接近,其余3種農(nóng)藥均顯示SPA-LSSVM具有更優(yōu)的預(yù)測性能。

為了更加顯著地對比SPA-LSSVM、SVR、PLS方法的預(yù)測性能,將各項模型參數(shù)曲線繪制于圖10中。

顯然,綜合訓練集、測試集兩者的測試結(jié)果可知,SPA-LSSVM方法的預(yù)測性能更優(yōu)??梢奡PA方法能夠有效優(yōu)選出混合農(nóng)藥熒光光譜中的特征波長點,且這些波長處對應(yīng)的熒光強度與各成分的濃度之間具有較顯著的關(guān)系,故基于這些特征波長點訓練完成的LSSVM模型更具優(yōu)越性。另外,相比傳統(tǒng)PLS方法以及基于全波長的SVR方法,SPA-LSSVM不僅預(yù)測性能更優(yōu),且其因為只有25個特征波長作為輸入,使得對應(yīng)的模型形式更加簡單,且訓練速度大大加快。

表1 SPA-LSSVM、SVR、PLS方法性能參數(shù)

圖10 SPA-LSSVM、SVR、PLS方法性能參數(shù)對比

4 結(jié)論

本文提出一種基于SPA-LSSVM的多組分混合農(nóng)藥殘留熒光檢測分析方法。這種方法首先應(yīng)用SPA算法優(yōu)選出特征波長,有效消除了熒光光譜間的相關(guān)性,然后基于LSSVM方法訓練定量分析模型,并分別對訓練集、測試集進行模型測試,結(jié)果表明這種方法的預(yù)測性能優(yōu)于傳統(tǒng)PLS方法。這說明連續(xù)投影算法方法能夠有效篩選出混合農(nóng)藥的特征熒光光譜,且應(yīng)用最小二乘支持向量機模型對其中的多組分進行定量分析時,具有較高的預(yù)測精度。本文對SPA-LSSVM方法的有效性進行了分析驗證。

猜你喜歡
波長光譜向量
基于三維Saab變換的高光譜圖像壓縮方法
向量的分解
聚焦“向量與三角”創(chuàng)新題
日本研發(fā)出可完全覆蓋可見光波長的LED光源
向量垂直在解析幾何中的應(yīng)用
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
星載近紅外高光譜CO2遙感進展
RP—HPLC波長切換法同時測定坤泰膠囊中6個成分的含量
便攜式多用途光波波長測量儀
苦味酸與牛血清蛋白相互作用的光譜研究
曲麻莱县| 大竹县| 新田县| 长春市| 渭源县| 徐闻县| 通化市| 榕江县| 浙江省| 弥渡县| 遵化市| 新泰市| 错那县| 兴海县| 北宁市| 肇源县| 灯塔市| 彰武县| 固安县| 股票| 毕节市| 莲花县| 深水埗区| 泽州县| 镇沅| 云浮市| 灌南县| 安西县| 湖北省| 平山县| 怀化市| 鸡西市| 汝城县| 高台县| 昌江| 公主岭市| 富宁县| 金华市| 嘉荫县| 长海县| 韩城市|