彭勤 高士 彭佳紅
摘要:病害智能預(yù)測(cè)識(shí)別在農(nóng)業(yè)信息化領(lǐng)域起著重要的作用,也是一實(shí)用性很強(qiáng)的應(yīng)用技術(shù)?;跈C(jī)器學(xué)習(xí)中的支持向量機(jī)SVM分類技術(shù),對(duì)豆類病害特征屬性進(jìn)行分類與豆類作物斑病進(jìn)行智能識(shí)別。結(jié)果表明,支持向量機(jī)SVM建立的識(shí)別模型準(zhǔn)確率為93.27%,能夠輔助豆類作物的生產(chǎn)與科學(xué)管理。
關(guān)鍵詞:豆類作物;支持向量機(jī);病害
中圖分類號(hào):TP18? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)24-0210-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 概述
隨著國(guó)內(nèi)豆類作物產(chǎn)量需求的提高與計(jì)算機(jī)智能識(shí)別技術(shù)的迅速發(fā)展,豆類作物病害的智能識(shí)別及預(yù)防越來越受到大家的關(guān)注。病害預(yù)測(cè)識(shí)別是一門實(shí)用性很強(qiáng)的科學(xué)應(yīng)用技術(shù),在農(nóng)業(yè)信息化領(lǐng)域起著重要的作用。
支持向量機(jī)SVM(Support Vector Machine)是一種監(jiān)督性的機(jī)器學(xué)習(xí),主要運(yùn)用于數(shù)據(jù)的分類和回歸分析,同時(shí)SVM也稱最大間隔分類器[1],其最大間隔分類器原理如圖1所示。
超平面K1、K2、K3都能將數(shù)據(jù)類進(jìn)行分別。但基于二分法健壯性約束,K2分割平面是最魯棒性的。
在樣本分類空間中,線性支持向量機(jī)的分割超平面方程[2]表示如下:
[wT?x+b=0;]
其中w為超平面的法向量[3],b表示測(cè)試原點(diǎn)到超平面的偏移量,當(dāng)測(cè)試數(shù)據(jù)可以被超平面分割時(shí),就需要選擇魯棒值最高的分割超平面。而“最大間隔”的平面尋找即選擇支持向量平面之間能平分距離的平面。支持向量的平面可以表示為:
[-1≤wT?x+b≤1;]
由此可以得出兩個(gè)支持向量平面之間的距離γ為2b或2/||w||[4]。因此,平面間隔之間最大,則||w||取最小即可。所以取兩端值是最好的,如圖2所示。
2 豆類病害SVM識(shí)別
基于網(wǎng)絡(luò)爬蟲技術(shù)獲取了豆類病害樣本數(shù)據(jù)401條,對(duì)于豆類病害將其分成斑類病害與非斑類病害兩類。病害癥狀的描述為顏色、斑形狀、斑部位等,對(duì)原始數(shù)據(jù)進(jìn)行數(shù)值化見表1。
利用SVM算法組件對(duì)樣本數(shù)據(jù)預(yù)測(cè)識(shí)別[6,7],模型如圖3所示。
其中,sjjy-1為原始數(shù)據(jù)表,a、b、c、d、e為特征列,f為標(biāo)簽列;線性支持向量機(jī)的正例懲罰因子設(shè)置為1.0,負(fù)例懲罰因子設(shè)置為1.0,收斂系數(shù)設(shè)置為0.001,計(jì)算的核心數(shù)自動(dòng)調(diào)優(yōu),每個(gè)核心的內(nèi)存也自動(dòng)調(diào)優(yōu)。通過訓(xùn)練學(xué)習(xí)建立最優(yōu)二分類預(yù)測(cè)模型;xyg.sjjy-2為檢驗(yàn)數(shù)據(jù)表(取原始數(shù)據(jù)表的前100行),只有特征列;輸入預(yù)測(cè)模型“預(yù)測(cè)-2”進(jìn)行預(yù)測(cè)。將預(yù)測(cè)結(jié)果輸入到表“sjjy_jg-1”,即表2。
結(jié)果表明,SVM建立的識(shí)別模型準(zhǔn)確率為93.27%,錯(cuò)誤率為6.73%。
3 結(jié)束語
豆類作物產(chǎn)量是我國(guó)農(nóng)作物產(chǎn)量的核心之一,保證豆類作物產(chǎn)量的持續(xù)提升是國(guó)家關(guān)注的重點(diǎn),而豆類病害是制約豆類作物產(chǎn)量的重要因素之一,影響著豆類作物的生產(chǎn)和質(zhì)量。本文基于機(jī)器學(xué)習(xí)中的支持向量機(jī)SVM分類技術(shù)對(duì)豆類作物的斑病進(jìn)行智能識(shí)別,能夠輔助豆類作物的生產(chǎn)與科學(xué)管理。
參考文獻(xiàn):
[1] 曹正鳳. 隨機(jī)森林算法優(yōu)化研究[D]. 北京:首都經(jīng)濟(jì)貿(mào)易大學(xué), 2014.
[2] 劉東啟,陳志堅(jiān),徐銀,等.面向不平衡數(shù)據(jù)分類的復(fù)合SVM算法研究[J].計(jì)算機(jī)應(yīng)用研究,2018(4).
[3] 葉明全,高凌云,萬春圓.基于人工蜂群和SVM的基因表達(dá)數(shù)據(jù)分類[J].山東大學(xué)學(xué)報(bào):工版,2018,48(3):1-8.
[4] 潘曙光,劉香,唐圣學(xué), 等.基于網(wǎng)格搜索的改進(jìn)SVM模擬電路故障診斷方法[J].微電子學(xué),2018,48(1):108-114.
[5] 朱劉影,楊思春.基于SVM的地理試題自動(dòng)分類[J].計(jì)算機(jī)應(yīng)用研究,2018(9):1-2.
[6] 湯榮志, 段會(huì)川, 孫海濤. SVM訓(xùn)練數(shù)據(jù)歸一化研究[J]. 山東師范大學(xué)學(xué)報(bào):自然科學(xué)版, 2016, 12(15): 114-117.
[7] Huang Shujun,Cai Nianguang,Pacheco Pedro Penzuti,et al. Applications of Support Vector Machine (SVM) Learning in Cancer Genomics[J]. Cancer genomics & proteomics,2018,15(1):67-145.
【通聯(lián)編輯:謝媛媛】