国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于優(yōu)化支持向量機(jī)的玉米淀粉含量估計(jì)

2022-10-21 12:19馮惠妍
科學(xué)技術(shù)創(chuàng)新 2022年27期
關(guān)鍵詞:預(yù)處理光譜淀粉

馮惠妍

(黑龍江八一農(nóng)墾大學(xué),黑龍江 大慶 163319)

淀粉是目前重要的可再生工業(yè)原料,我國(guó)玉米淀粉約占總產(chǎn)量的80%[1],可以通過(guò)化學(xué)計(jì)量方法,將玉米用0.3%的亞硫酸浸漬后,進(jìn)行破碎、過(guò)篩、沉淀等工序制成和獲得含量。而結(jié)合近紅外光譜技術(shù)不需要破壞樣品,可獲取樣品的光譜信息,通過(guò)光譜分析可實(shí)現(xiàn)對(duì)樣品的定性判斷和定量分析。近紅外光譜技術(shù)已被廣泛應(yīng)用在農(nóng)產(chǎn)品檢測(cè)中。文獻(xiàn)[2]結(jié)合主成分分析,建立了不同種類淀粉的定性判別模型和基于PLS建立了淀粉混合物的預(yù)測(cè)模型;文獻(xiàn)[3]研究了近紅外光譜結(jié)合支持向量機(jī)檢測(cè)甘薯粉絲摻假木薯淀粉和玉米淀粉的可行性。因此結(jié)合近紅外光譜技術(shù),分析近紅外光譜數(shù)據(jù),實(shí)現(xiàn)對(duì)玉米淀粉含量的有效估計(jì)具有重要實(shí)際應(yīng)用意義。本研究基于玉米近紅外光譜數(shù)據(jù),以玉米淀粉含量指標(biāo)為研究對(duì)象,擬首先使用多種數(shù)據(jù)預(yù)處理方法及其組合方法進(jìn)行光譜的預(yù)處理,利用主成分分析算法PCA 進(jìn)行光譜數(shù)據(jù)特征提取的基礎(chǔ)上,再結(jié)合使用粒子群優(yōu)化PSO 算法,實(shí)現(xiàn)對(duì)支持向量回歸算法中的重要參數(shù),懲罰因子C 和核函數(shù)參數(shù)gamma 的參數(shù)尋優(yōu),以此構(gòu)建一個(gè)優(yōu)化SVR 的玉米淀粉的回歸預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)玉米淀粉含量的有效預(yù)測(cè)估計(jì)。

1 數(shù)據(jù)準(zhǔn)備

公開的玉米近紅外光譜數(shù)據(jù)包括80 個(gè)玉米樣品,波長(zhǎng)范圍為1 100-2 498 nm,間隔2 nm(700 個(gè)通道),數(shù)據(jù)列中包括指標(biāo)淀粉含量值,其最大值66.4 720、最小值62.8 260、平均值64.6 956 以及標(biāo)準(zhǔn)差0.81 559。

光譜預(yù)處理在大多數(shù)情況下可以改善預(yù)測(cè)結(jié)果,但是有時(shí)使用源光譜也可產(chǎn)生很好的結(jié)果[4],因此本文首先考慮使用源光譜建立模型。文中選擇使用的光譜 預(yù) 處 理 方 法 有 源 光 譜、SNV、SNV+SG、MSC、MSC+SNV、FD MSC+SNV+FD[5]。

高維的光譜數(shù)據(jù)增加了構(gòu)建模型的難度和復(fù)雜度,通常需要從高維的數(shù)據(jù)中提取出數(shù)據(jù)特征,研究使用主成分分析PCA 提取出數(shù)據(jù)主成分[6],簡(jiǎn)化了數(shù)據(jù)規(guī)模為后續(xù)建模做準(zhǔn)備。

數(shù)據(jù)進(jìn)行特征提取后,使用SPXY(Sample set Partitioning based on joint X-Y distance)算法以4:1的比例劃分訓(xùn)練集和預(yù)測(cè)集。

2 建模及模型評(píng)價(jià)

2.1 建模

支持向量機(jī)(Support Vector machine,SVM)是一種基于統(tǒng)計(jì)學(xué)理論的機(jī)器學(xué)習(xí)算法,由Cortes 和Vapnik 于1995 年提出,算法嘗試尋找具有最大間隔的超平面來(lái)區(qū)分不同類別的樣本,其中間隔定義為不同類別的樣本到分類超平面的距離。目前該算法思想已廣泛應(yīng)用于分類和回歸問(wèn)題中,并且大多數(shù)情況下運(yùn)行效果相對(duì)較優(yōu)[7]。支持向量回歸(Support Vector Regression,SVR)是使用SVM 來(lái)擬合曲線,做回歸分析??紤]研究使用的光譜數(shù)據(jù)的非線性和RBF(Radial Basis Function)實(shí)現(xiàn)分類問(wèn)題的實(shí)驗(yàn)效果成功[8],本研究選擇RBF 作為SVR 的核函數(shù),RBF 核函數(shù)有兩個(gè)重要的參數(shù):C 和gamma,不同參數(shù)所建模型的預(yù)測(cè)能力不同,可以選擇網(wǎng)格搜索實(shí)現(xiàn)參數(shù)優(yōu)化,但是耗時(shí)長(zhǎng),因此本文選擇粒子群優(yōu)化算法進(jìn)行SVM的2 個(gè)重要參數(shù)尋優(yōu)。

粒子群算法(Particle Swarm Optimization)是由美國(guó)社會(huì)心理學(xué)家J.Kennedy 和電氣工程師R.Eberhart于1995 年共同提出[9]。算法的基本思想受到許多對(duì)鳥類的群體行為進(jìn)行建模與仿真研究結(jié)果的啟發(fā)。算法的主要步驟:

(1) 隨機(jī)初始化D 維空間中的每個(gè)粒子的位置x 和速度v。

(2) 計(jì)算粒子適應(yīng)度值F:選擇模型預(yù)測(cè)的預(yù)測(cè)值與真實(shí)值之間的RMSE 作為適應(yīng)度值F。

(3) 更新每個(gè)個(gè)體最優(yōu)值和全局最優(yōu)值。

(4) 更新粒子的速度和位置。

圖1 基于PSO 算法優(yōu)化SVR 的玉米淀粉預(yù)測(cè)模型

2.2 模型評(píng)價(jià)

為了評(píng)價(jià)所建立模型的預(yù)測(cè)性能,本文采用三種評(píng)估方法:均方根誤差(Root mean square error,RMSE),RMSE 越小說(shuō)明模型預(yù)測(cè)精度越高;決定系數(shù)(coefficient of determination,R2)值越接近1,模型穩(wěn)定性越好;預(yù)測(cè)相對(duì)分析誤差RPD[10],Chang 等提出的相對(duì)分析誤差評(píng)判等級(jí):RPD≥2 時(shí),模型具有很好的預(yù)測(cè)效果,屬A 類模型,可用于定量預(yù)測(cè);1.4≤RPD<2時(shí),模型有一定的預(yù)測(cè)效果,屬B 類模型,可用于粗略的預(yù)測(cè);RPD<1.4 時(shí),模型的預(yù)測(cè)效果較差,屬C 類模型,不能用于定量預(yù)測(cè)[11]。

3 實(shí)驗(yàn)結(jié)果

SVM 算法中參數(shù)C 和gamma 的設(shè)置范圍[0.1,100],PSO 算法中慣性權(quán)重的最大值0.9,最小值0.4,迭代次數(shù)設(shè)置為100,粒子個(gè)數(shù)分別設(shè)置為20、30、40、50、60??紤]PSO 算法可陷入局部最優(yōu),文中采用重復(fù)執(zhí)行20 次取最好結(jié)果為最終的預(yù)測(cè)結(jié)果。不同預(yù)處理方法時(shí),模型的預(yù)測(cè)結(jié)果如下:

(1) 源光譜時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖2 所示。從圖2 中可以得出,當(dāng)25 維度特征提取時(shí),粒子個(gè)數(shù)設(shè)置為50 時(shí)預(yù)測(cè)集的RMSE最小,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表1 所示,其中粒子個(gè)數(shù)50 時(shí)訓(xùn)練集的RMSE 為0.4732,R2為0.7075,預(yù)測(cè)集的RMSE 為0.3292,R2為0.6084,RPD 為1.6504>1.4,預(yù)測(cè)模型具有一定的預(yù)測(cè)效果。

圖2 源光譜時(shí)模型的預(yù)測(cè)RMSE

表1 降維25、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(2) SNV 預(yù)處理時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖3 所示。從圖3 中可以得出,當(dāng)10 維度特征提取時(shí),粒子個(gè)數(shù)設(shè)置為50 時(shí)預(yù)測(cè)集的RMSE最小,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表2 所示,其中粒子個(gè)數(shù)50 時(shí)訓(xùn)練集的RMSE 為0.1657,R2為0.9628,預(yù)測(cè)集的RMSE 為0.2044,R2為0.8853,RPD 為3.05>2,預(yù)測(cè)模型具有很好的預(yù)測(cè)效果。

圖3 SNV 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表2 降維10、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(3) SNV+SG 預(yù)處理時(shí),SG 選取平滑點(diǎn)數(shù)為7,多項(xiàng)式次數(shù)為3。PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE如圖4 所示。從圖4 中可以得出,當(dāng)10 維度特征提取時(shí),粒子個(gè)數(shù)設(shè)置為50 時(shí)預(yù)測(cè)集的RMSE 最小,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表3 所示,其中粒子個(gè)數(shù)50 時(shí)訓(xùn)練集的RMSE 為0.1681,R2為0.9617,預(yù)測(cè)集的RMSE 為0.2047,R2為0.8850,RPD 為3.0466>2,預(yù)測(cè)模型具有很好的預(yù)測(cè)效果。

圖4 SNV+SG 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表3 降維10、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(4) MSC 預(yù)處理時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖5 所示。從圖5 中可以得出,當(dāng)10 維度特征提取時(shí),各粒子數(shù)設(shè)置時(shí)預(yù)測(cè)集的RMSE 幾乎相等,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表4 所示,其中粒子個(gè)數(shù)50 時(shí)訓(xùn)練集的RMSE 為0.1754,R2為0.9583,預(yù)測(cè)集的RMSE 為0.2037,R2為0.8861,RPD 為3.0611>2,預(yù)測(cè)模型具有很好的預(yù)測(cè)效果。

圖5 MSC 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表4 降維10、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(5) MSC+SNV 預(yù)處理時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖6 所示。從圖6 中可以得出,當(dāng)10維度特征提取時(shí),各粒子數(shù)設(shè)置時(shí)預(yù)測(cè)集的RMSE 幾乎相等,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表5 所示,其中粒子個(gè)數(shù)60 時(shí)訓(xùn)練集的RMSE為0.1754,R2為0.9583,預(yù)測(cè)集的RMSE 為0.2036,R2為0.8863,RPD 為3.0631>2,預(yù)測(cè)模型具有很好的預(yù)測(cè)效果。

圖6 MSC+SNV 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表5 降維10、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(6) FD 預(yù)處理時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖7 所示。從圖7 中可以得出,當(dāng)10 維度特征提取時(shí),各粒子數(shù)設(shè)置時(shí)預(yù)測(cè)集的RMSE 幾乎相等,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表6 所示,其中粒子數(shù)60 時(shí)訓(xùn)練集的RMSE 為0.6470,R2為0.4393,預(yù)測(cè)集的RMSE 為0.4014,R2為0.5095,RPD 為1.4747。預(yù)測(cè)模型具有一定的預(yù)測(cè)效果,但是預(yù)測(cè)精度和模型的穩(wěn)定性相對(duì)不高。

圖7 FD 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表6 降維10、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

(7) MSC+SNV+FD 預(yù)處理時(shí),PCA 各維度時(shí)模型的預(yù)測(cè)RMSE 及各維度時(shí)PSO 算法設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)RMSE 如圖8 所示。從圖8 中可以得出,當(dāng)45 維度特征提取時(shí),有最小的預(yù)測(cè)RMSE,不同粒子數(shù)時(shí)的訓(xùn)練集和預(yù)測(cè)集的運(yùn)行結(jié)果,如表7 所示,其中粒子數(shù)40 時(shí)訓(xùn)練集的RMSE 為0.2329,R2為0.9261,預(yù)測(cè)集的RMSE 為0.2718,R2為0.7625,RPD為2.1196。預(yù)測(cè)模型的預(yù)測(cè)效果良好,但是預(yù)測(cè)模型的預(yù)測(cè)精度和模型的穩(wěn)定性相對(duì)不高。

圖8 MSC+SNV+FD 預(yù)處理時(shí)模型的預(yù)測(cè)RMSE

表7 降維45、不同粒子數(shù)時(shí)模型的運(yùn)行結(jié)果

4 結(jié)論

本文基于玉米光譜數(shù)據(jù),結(jié)合粒子群優(yōu)化算法,優(yōu)化支持向量回歸模型中的參數(shù)C 和gamma,建立了一個(gè)用于玉米淀粉含量預(yù)測(cè)的預(yù)測(cè)模型。實(shí)驗(yàn)對(duì)比不同預(yù)處理和PSO 算法中設(shè)置不同粒子數(shù)時(shí)的預(yù)測(cè)效果,從實(shí)驗(yàn)結(jié)果得出結(jié)論如下。

(1) 預(yù)處理方法中,選擇SNV,SNV+SG、MSC、MSC+SNV、MSC+SNV+FD 的預(yù)處理后建立的模型的預(yù)測(cè)效果均高于未進(jìn)行預(yù)處理,即使用源數(shù)據(jù)時(shí)建立的預(yù)測(cè)模型的預(yù)測(cè)效果;而基于FD 的預(yù)處理方法建立的預(yù)測(cè)模型不理想,這也就說(shuō)明針對(duì)本文的光譜數(shù)據(jù),選用合適的預(yù)處理方法有助于提升模型的預(yù)測(cè)精度。

(2) 使用PSO 進(jìn)行SVR 建模的參數(shù)優(yōu)化時(shí),不同的粒子個(gè)數(shù)設(shè)置影響模型的預(yù)測(cè)效果。進(jìn)行MSC和MSC+SNV 預(yù)處理時(shí)的模型預(yù)測(cè)結(jié)果優(yōu)于預(yù)處理是SNV、SNV+SG 和MSC+SNV+FD 時(shí)的預(yù)測(cè)結(jié)果。其中MSC+SNV 預(yù)處理時(shí),PCA 主成分10 時(shí),PSO 的粒子數(shù)為60 時(shí),預(yù)測(cè)模型最優(yōu)。

因此,針對(duì)玉米近紅外光譜數(shù)據(jù)集,文中提出的PSO 優(yōu)化SVR 的建模方法能夠有效的預(yù)測(cè)玉米淀粉含量。

猜你喜歡
預(yù)處理光譜淀粉
基于三維Saab變換的高光譜圖像壓縮方法
從人工合成淀粉說(shuō)開去
預(yù)處理對(duì)醫(yī)用外科口罩用熔噴布顆粒過(guò)濾性能的影響
煤炭礦區(qū)耕地土壤有機(jī)質(zhì)無(wú)人機(jī)高光譜遙感估測(cè)
手術(shù)器械預(yù)處理在手術(shù)室的應(yīng)用
污泥預(yù)處理-厭氧消化體系的能源經(jīng)濟(jì)性評(píng)價(jià)
基于3D-CNN的高光譜遙感圖像分類算法
為什么粥涼了更稠
污泥預(yù)處理及其在硅酸鹽制品中的運(yùn)用
淀粉裹多了肉會(huì)老
南城县| 镇巴县| 达拉特旗| 逊克县| 尚义县| 且末县| 即墨市| 阿克陶县| 漳平市| 龙州县| 科技| 松原市| 文登市| 揭阳市| 蓬溪县| 山阳县| 天峨县| 灵宝市| 舞阳县| 普宁市| 安溪县| 望奎县| 舒兰市| 三河市| 左贡县| 溆浦县| 辽阳县| 永胜县| 界首市| 南木林县| 汝城县| 洛扎县| 宜兰县| 突泉县| 余江县| 梧州市| 柳州市| 公安县| 明光市| 广饶县| 调兵山市|