劉金明,謝秋菊,王 雪,馬鐵民
(黑龍江八一農(nóng)墾大學(xué)信息技術(shù)學(xué)院,黑龍江 大慶 163319)
基于GSA-SVM的畜禽舍廢氣監(jiān)測缺失數(shù)據(jù)恢復(fù)方法
劉金明,謝秋菊,王 雪,馬鐵民
(黑龍江八一農(nóng)墾大學(xué)信息技術(shù)學(xué)院,黑龍江 大慶 163319)
針對畜禽舍內(nèi)廢氣監(jiān)測過程中因傳感器故障等原因造成部分監(jiān)測數(shù)據(jù)缺失的問題,將遺傳模擬退火算法與支持向量機相結(jié)合,提出一種基于GSA-SVM的缺失數(shù)據(jù)恢復(fù)方法。該方法綜合考慮畜禽舍廢氣監(jiān)測值對應(yīng)的時間、空間和環(huán)境等多種影響因素,建立支持向量機回歸預(yù)測模型對缺失的監(jiān)測數(shù)據(jù)進行恢復(fù)性估算;為獲得更好的預(yù)測結(jié)果,使用遺傳模擬退火算法對模型參數(shù)進行優(yōu)化。以氨氣濃度數(shù)據(jù)的恢復(fù)為例,隨機選取某養(yǎng)殖場3 d的監(jiān)測數(shù)據(jù)驗證。結(jié)果表明,缺失數(shù)據(jù)估算最大相對誤差為6.69%,平均相對誤差為1.87%,估算數(shù)據(jù)與監(jiān)測數(shù)據(jù)誤差很小,可有效對缺失性數(shù)據(jù)進行恢復(fù),為畜舍廢氣監(jiān)測提供可行數(shù)據(jù)恢復(fù)處理方法。
遺傳模擬退火算法;支持向量機;畜禽舍;廢氣監(jiān)測;數(shù)據(jù)恢復(fù)
網(wǎng)絡(luò)出版時間2015-4-30 14:32:00 [URL]http://www.cnki.net/kcms/detail/23.1391.S.20150430.1432.008.html
劉金明,謝秋菊,王雪,等.基于GSA-SVM的畜禽舍廢氣監(jiān)測缺失數(shù)據(jù)恢復(fù)方法[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2015,46(5):95-101.
Liu Jinming,Xie Qiuju,Wang Xue,et al.Method of missing data recovery of waste gases monitoring in animal buildings based on GSA-SVM[J].Journal of Northeast Agricultural University,2015,46(5):95-101.(in Chinese with English abstract)
畜禽飼養(yǎng)過程中產(chǎn)生的各種有害氣體,對畜禽健康生長和食品安全產(chǎn)生影響[1-2]。因此,連續(xù)可靠地監(jiān)測養(yǎng)殖場內(nèi)廢氣濃度[3],精確計算廢氣排放量,對分析各種有害氣體排放規(guī)律和影響因素[4],采取有效措施控制和處理有害氣體有重要意義。在生豬飼養(yǎng)過程中,為分析畜禽舍內(nèi)有害氣體排放規(guī)律,需在畜禽舍內(nèi)安裝多種有害氣體濃度檢測傳感器,實時監(jiān)測其濃度,將監(jiān)測數(shù)據(jù)保存到上位機的數(shù)據(jù)庫中供相關(guān)人員查看、分析。然而,畜禽舍內(nèi)復(fù)雜環(huán)境可導(dǎo)致傳感器漂移或損壞,造成監(jiān)測數(shù)據(jù)偏差或錯誤[5-6]。監(jiān)測過程中采集到的廢氣濃度數(shù)據(jù)在傳輸過程中,也可能由于線路問題導(dǎo)致失真或丟失。為保證監(jiān)測數(shù)據(jù)完整性和準(zhǔn)確性,需要對缺失廢氣濃度監(jiān)測數(shù)據(jù)進行恢復(fù)。但畜禽舍內(nèi)廢氣濃度與時間、空間和環(huán)境等多種因素相關(guān),各因素之間存在相互作用,是復(fù)雜的非線性系統(tǒng),使用線性插值方法進行缺失數(shù)據(jù)恢復(fù)誤差較大。朱偉興等提出使用神經(jīng)網(wǎng)絡(luò)進行廢氣監(jiān)測缺失數(shù)據(jù)處理,取得較好估算結(jié)果[5-6]。但神經(jīng)網(wǎng)絡(luò)存在局部極小值問題,容易出現(xiàn)過學(xué)習(xí)。
支持向量機(Support vector machine,SVM)是基于小樣本統(tǒng)計學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小化原則的機器學(xué)習(xí)方法[7],具有良好泛化能力,彌補神經(jīng)網(wǎng)絡(luò)不足,能有效處理各種非線性問題,廣泛用于各種回歸預(yù)測問題的求解[8-9]。SVM相關(guān)參數(shù)選取直接關(guān)系到SVM預(yù)測精度,采用網(wǎng)格搜索方法進行SVM參數(shù)尋優(yōu)時,尋優(yōu)步長設(shè)置較小時才可能獲得較好尋優(yōu)效果,但需要大量計算時間。因此,學(xué)者提出基于粒子群算法(Particle swarm opti?mization,PSO)[10-11]、遺傳算法(Genetic algorithm, GA)[12-13]等智能算法對SVM參數(shù)進行優(yōu)化。其中,GA有較強魯棒性和全局優(yōu)化搜索能力,適用于SVM參數(shù)尋優(yōu)問題求解,但存在早熟問題,在進化后期搜索效率較低。因此,本文將模擬退火算法(Simulated annealing algorithm,SA)的退溫思想和Metropolis判別準(zhǔn)則引入GA的種群進化過程中,構(gòu)建遺傳模擬退火算法(Genetic simulated annealing algorithm,GSA)克服標(biāo)準(zhǔn)GA的早熟問題,提高其后期優(yōu)化搜索能力,使用GSA對SVM參數(shù)進行尋優(yōu),提出一種基于GSA-SVM預(yù)測模型的畜禽舍廢氣監(jiān)測缺失數(shù)據(jù)恢復(fù)方法。
1.1 GSA-SVM理論基礎(chǔ)
GA和SA都是優(yōu)秀的智能計算方法[14]。GA是一種具有高度非線性映射、自適應(yīng)和自組織功能的智能全局優(yōu)化算法,廣泛用于各種組合優(yōu)化問題求解,但其存在容易過早收斂和進化后期搜索效率低缺點。SA計算過程簡單,魯棒性強,選優(yōu)能力強,適用于求解復(fù)雜非線性優(yōu)化問題,但其性能對初值依賴性強、全局搜索最優(yōu)解的能力差。將二者相結(jié)合形成GSA混合算法,可利用SA 為GA提供更加多樣性搜索空間,有效避免陷入局部最優(yōu);GA選擇、交叉和變異操作為SA提供新解,增強SA爬山能力;SA算子得到的解有選擇地為GA提供新種群,提高GA收斂速度,使混合算法在較短時間內(nèi)得到近似全局最優(yōu)解。
SVM非線性回歸基本思想是利用非線性變換將原問題映射到高維特征空間的線性問題上,并在該空間中進行線性回歸,而這種非線性變換通過定義適當(dāng)?shù)膬?nèi)積函數(shù)實現(xiàn)。在高維特征空間中,線性問題中的內(nèi)積運算可用核函數(shù)代替,常用有線性核函數(shù)、多項式核函數(shù)、徑向基(Radial basis function,RBF)核函數(shù)、Sigmoid核函數(shù)等。在選定核函數(shù)基礎(chǔ)上,SVM預(yù)測模型參數(shù)選取對預(yù)測精度影響很大。結(jié)合交叉驗證的網(wǎng)格搜索算法是比較常用的SVM參數(shù)優(yōu)化方法,但其耗時且性能有待提高。GSA具有全局搜索能力強、收斂速度快優(yōu)勢,能直接依據(jù)SVM預(yù)測值與真實值的誤差在編碼后的種群中搜索SVM最優(yōu)參數(shù),通過選擇、交叉、變異和模擬退火選擇復(fù)制等操作在指定范圍內(nèi)隨機地進行SVM參數(shù)尋優(yōu)。經(jīng)過若干代遺傳進化后,得到適應(yīng)度最佳的個體即可作為SVM預(yù)測模型最優(yōu)參數(shù)。
1.2 SVM輸入輸出確定及處理
為實現(xiàn)對缺失的廢氣監(jiān)測數(shù)據(jù)進行恢復(fù)性估算,綜合考慮畜禽舍內(nèi)廢氣濃度與時間、空間和環(huán)境等多種因素的關(guān)系,建立SVM多輸入單輸出預(yù)測模型,對某一時刻廢氣監(jiān)測缺失數(shù)據(jù)進行恢復(fù)。多個輸入包括:缺失數(shù)據(jù)采樣點前一時刻廢氣濃度監(jiān)測數(shù)據(jù)、相鄰采樣點相鄰采樣時刻廢氣濃度變化量,以及缺失數(shù)據(jù)采樣點處對應(yīng)環(huán)境溫度、相對濕度和風(fēng)速監(jiān)測值。輸出為缺失數(shù)據(jù)采樣點廢氣濃度估算值。通過長時間連續(xù)監(jiān)測數(shù)據(jù)對SVM進行訓(xùn)練,得到模型保存輸入自變量與輸出因變量之間非線性映射關(guān)系,成為缺失數(shù)據(jù)估算器。當(dāng)出現(xiàn)監(jiān)測數(shù)據(jù)缺失時,只需取相應(yīng)數(shù)據(jù)輸入SVM預(yù)測模型,即可完成缺失數(shù)據(jù)的恢復(fù)性估算。但在使用輸入輸出數(shù)據(jù)對SVM進行訓(xùn)練和預(yù)測前,應(yīng)對數(shù)據(jù)進行歸一化處理,公式如下:
式中,y為歸一化后的數(shù)據(jù),x為歸一化前的監(jiān)測數(shù)據(jù),xmax為監(jiān)測數(shù)據(jù)最大值,xmin為監(jiān)測數(shù)據(jù)最小值,ymax為設(shè)定的歸一化后數(shù)據(jù)最大值,ymin為設(shè)定的歸一化后數(shù)據(jù)最小值。若xmax與xmin大小相等,即監(jiān)測到某一數(shù)據(jù)相同,直接設(shè)定y=ymin。通過多次測試后發(fā)現(xiàn),將輸入自變量的歸一化區(qū)間設(shè)定為[-1,1],將輸出因變量的歸一化區(qū)間設(shè)定為[0,1],SVM預(yù)測模型估算效果最佳。
1.3 SVM核函數(shù)選取
SVM核函數(shù)建立原始樣本空間到特征空間的一個隱式映射,其基本思想是將原始空間中線性不可分問題轉(zhuǎn)化為高維特征空間中線性可分問題。在利用SVM解決回歸預(yù)測問題時,選擇恰當(dāng)?shù)暮撕瘮?shù)是影響SVM預(yù)測精度的重要因素。王霞等研究可知,在求解非線性多因素預(yù)測問題時,RBF核函數(shù)SVM預(yù)測模型表現(xiàn)明顯優(yōu)勢,預(yù)測精度最高[15]。因此,本文采用RBF核函數(shù)作為SVM預(yù)測模型核函數(shù),計算公式如下:
1.4 SVM參數(shù)GSA尋優(yōu)
SVM預(yù)測模型參數(shù)選取對預(yù)測精度影響大,本文采用K折交叉驗證結(jié)合GSA對SVM預(yù)測模型的參數(shù)進行優(yōu)化,待優(yōu)化參數(shù)包括懲罰參數(shù)C、核函數(shù)參數(shù)γ和不敏感損失函數(shù)參數(shù)ε。
1.4.1 編碼和種群初始化
利用GSA對SVM進行參數(shù)尋優(yōu)時,采用的編碼方式為二進制實數(shù)編碼。SVM的3個參數(shù)C、γ 和ε對應(yīng)染色體的3個基因,每個基因編碼成k位二進制數(shù)。
染色體結(jié)構(gòu)如圖1所示。
圖1染色體結(jié)構(gòu)Fig.1 Structure of chromosome
其中,二進制序列a1a2…ak為參數(shù)C編碼基因,二進制序列b1b2…bk為參數(shù)γ的編碼基因,二進制序列c1c2…ck為參數(shù)ε的編碼基因。以參數(shù)C的編碼基因a1a2…ak為例,其對應(yīng)的實數(shù)解碼公式為:
式中,[U1,U2]為參數(shù)C的取值范圍,k為單個基因的二進制碼長,本文取k=20,則染色體碼長為60位。
在進行種群初始化時,隨機產(chǎn)生一個N×M的二元矩陣即可,其中N為初始種群中染色體數(shù)量,M為染色體碼長。
1.4.2 適應(yīng)度函數(shù)設(shè)計
本文采用K折交叉驗證結(jié)合GSA對SVM參數(shù)進行最優(yōu)化,而SVM預(yù)測模型的目的是預(yù)測值與實際值誤差盡量小,可直接把K折交叉驗證均方誤差(Mean squared error,MSE)作為目標(biāo)函數(shù)。結(jié)合溫度參數(shù)對適應(yīng)度函數(shù)定義如下:
式中,f(x)為當(dāng)前染色體的目標(biāo)函數(shù)值,fmin為當(dāng)前代種群中最小目標(biāo)函數(shù)值,t為當(dāng)前代溫度值。
結(jié)合溫度參數(shù)設(shè)計適應(yīng)度函數(shù),算法在高溫時計算的適應(yīng)度值差異較小,有效避免個別優(yōu)良個體充斥整個種群造成早熟;而低溫時優(yōu)良個體具有相對更大的適應(yīng)度函數(shù)值,易遺傳給下一代,加快算法搜索速度。
1.4.3 遺傳操作設(shè)計
GA遺傳操作包括選擇、交叉和變異3種。選擇操作采用結(jié)合最優(yōu)保留策略的賭輪選擇方法,交叉操作采用單點交叉,變異操作采用多位變異。
1.4.4 初溫確定及退溫操作
初溫確定采用t0=Kδ的形式,其中K是正整數(shù),δ=fmax-fmin,fmax和fmin為初始種群中最大和最小目標(biāo)函數(shù)值。
退溫操作采用tn+1=αtn的形式,其中0<α<1,α決定降溫速度。
1.4.5 鄰域解的構(gòu)建
依據(jù)算法編碼方式,鄰域解的構(gòu)建采用多位變異策略,具體方案為:分別在當(dāng)前染色體3個基因中隨機選取一位進行位變異。
1.4.6 狀態(tài)接收函數(shù)
將每一代經(jīng)GA遺傳操作后的種群作為模擬退火算法種群,對種群中每個染色體構(gòu)建鄰域解后進行基于Metropolis判別準(zhǔn)則的選擇復(fù)制。假設(shè)為染色體i構(gòu)造鄰域解j,令Δf=fit(j)-fit(i),若Δf≥0,則接受鄰域解j到下一代種群;若Δf<0,則生成隨機數(shù)r∈[0,1],當(dāng)r<exp(Δf/tn)時,仍接受鄰域解j到下一代種群;否則,將原染色體i復(fù)制到下一代種群中。
采用此選擇復(fù)制策略,在高溫時接受劣質(zhì)解能力較強,保證種群多樣性,避免早熟,低溫時優(yōu)良染色體更易遺傳給下一代,加快算法收斂速度。
1.5 SVM缺失數(shù)據(jù)預(yù)測
在完成SVM 參數(shù)尋優(yōu)后,可將優(yōu)化后參數(shù)C、γ、ε和訓(xùn)練集帶入訓(xùn)練函數(shù)進行訓(xùn)練,進而建立SVM預(yù)測模型,然后再使用測試集對該預(yù)測模型進行測試評價,完成缺失監(jiān)測數(shù)據(jù)恢復(fù)性估算。在使用該預(yù)測模型進行恢復(fù)性估算時,測試集每個樣本中前一時刻的廢氣濃度監(jiān)測數(shù)據(jù)這個屬性應(yīng)是上一樣本的廢氣濃度估算值,即由前一時刻估算值結(jié)合當(dāng)前時刻的其他屬性預(yù)測當(dāng)前時刻值,是一個典型時間序列預(yù)測問題。
運用GSA-SVM預(yù)測模型進行缺失數(shù)據(jù)恢復(fù)估算具體流程見圖2。
圖2 缺失數(shù)據(jù)恢復(fù)流程Fig.2 Flowchart of missing data recovery
2.1 數(shù)據(jù)來源
本文以美國印第安納北部某畜禽養(yǎng)殖場連續(xù)監(jiān)測3 d氨氣濃度歷史數(shù)據(jù)處理為例,對缺失數(shù)據(jù)恢復(fù)方法進行評測。其中,氨氣濃度和環(huán)境參數(shù)等相關(guān)監(jiān)測數(shù)據(jù)采樣1次·h-1,3 d共計72組數(shù)據(jù)樣本。測試系統(tǒng)時,以前48個樣本作為訓(xùn)練集,后24個樣本作為測試集。經(jīng)預(yù)處理后的部分數(shù)據(jù)樣本如表1所示。
表1 部分試驗數(shù)據(jù)Table 1 Some experimental data
2.2 相關(guān)參數(shù)設(shè)定
運用K折交叉驗證結(jié)合GSA對SVM預(yù)測模型進行參數(shù)最優(yōu)化時,相關(guān)參數(shù)設(shè)定包括:種群規(guī)模為20,遺傳代數(shù)為50,初始溫度參數(shù)K為100,退溫系數(shù)α為0.8,懲罰參數(shù)C、核函數(shù)參數(shù)γ和不敏感損失函數(shù)參數(shù)ε尋優(yōu)范圍分別是[0,100]、[0,100]和[0.001,1],交叉概率0.7,變異概率0.7/M(M為染色體碼長),采用5折交叉驗證。測試得到最佳預(yù)測模型對應(yīng)SVM參數(shù)尋優(yōu)結(jié)果為:C為30.7696,γ為0.1062,ε為0.0353。參數(shù)尋優(yōu)進化過程如圖3所示。
圖3 參數(shù)尋優(yōu)過程Fig.3 Optimization process of parameters
由圖3可知,在進化前期(高溫時)GSA求得的平均目標(biāo)函數(shù)值與最佳目標(biāo)函數(shù)值差異較大,而進化后期(低溫時)平均目標(biāo)函數(shù)值更接近最佳目標(biāo)函數(shù)值。原因在于GSA結(jié)合溫度參數(shù)設(shè)計適應(yīng)度函數(shù),引入基于Metropolis判別準(zhǔn)則的選擇復(fù)制策略。在高溫時,不同染色體對應(yīng)適應(yīng)度函數(shù)值差異較小,接受劣質(zhì)解能力較強,保證種群相對多樣性,有效避免早熟;在低溫時,優(yōu)良染色體具有更大適應(yīng)度函數(shù)值,遺傳給下一代,加快算法收斂速度。
2.3 仿真結(jié)果分析
將參數(shù)C、γ、ε和訓(xùn)練集帶入訓(xùn)練函數(shù)進行訓(xùn)練后得到SVM預(yù)測模型,對應(yīng)訓(xùn)練結(jié)果見圖4。
圖4 訓(xùn)練集回歸擬合結(jié)果Fig.4 Regression results of training set
由圖4可知,GA-SVM預(yù)測模型能很好擬合訓(xùn)練集,其MSE為0.0009。
采用訓(xùn)練好的SVM預(yù)測模型對測試集進行測試驗證時,針對這個時間序列預(yù)測問題,沒有采用MSE作為評價標(biāo)準(zhǔn),而是采用相對誤差對預(yù)測結(jié)果進行評價。通過多次測試,得到最佳預(yù)測模型對應(yīng)的測試集回歸擬合結(jié)果為:最大相對誤差為6.69%,最小相對誤差為0.03%,平均相對誤差為1.87%。測試集回歸擬合結(jié)果如圖5所示。
圖5 測試集回歸擬合結(jié)果Fig.5 Regression results of test set
為測試GSA-SVM預(yù)測模型在缺失數(shù)據(jù)恢復(fù)方面的性能和效率,本文與BP神經(jīng)網(wǎng)絡(luò)方法、網(wǎng)格搜索參數(shù)尋優(yōu)SVM(簡稱網(wǎng)格-SVM)和遺傳算法參數(shù)尋優(yōu)SVM(簡稱GA-SVM)三種預(yù)測模型的回歸預(yù)測精度進行對比。在Win7 64位系統(tǒng)下,使用MATLAB R2012b和LibSVM-3.1工具箱對各預(yù)測模型進行評測。硬件設(shè)備中CPU為Xeon E1230v2,內(nèi)存容量為8 GB。不同回歸預(yù)測模型預(yù)測效率和性能對比結(jié)果如表2所示。
表2 不同模型預(yù)測結(jié)果對比Table 2 Comparison of predict results with different models
由表2可知,三種SVM預(yù)測模型的執(zhí)行時間明顯少于BP神經(jīng)網(wǎng)絡(luò),且三種SVM預(yù)測模型平均相對誤差均小于BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,說明SVM預(yù)測模型在回歸問題求解方面具有優(yōu)勢。而GSASVM模型與其他SVM預(yù)測模型相比,雖然執(zhí)行時間稍高,但其最大相對誤差、最小相對誤差和平均相對誤差均最小,說明GSA-SVM預(yù)測精度最高,實現(xiàn)效率和性能統(tǒng)一,預(yù)測效果最好。其中GA-SVM和GSA-SVM為多次測試保存的最佳預(yù)測結(jié)果。在進行實際缺失數(shù)據(jù)恢復(fù)時,只需保存多次測試獲得的最佳預(yù)測模型,并用此模型對后續(xù)出現(xiàn)缺失數(shù)據(jù)進行恢復(fù)性估算。
在進行各種SVM預(yù)測模型仿真測試時發(fā)現(xiàn),除網(wǎng)格-SVM能夠獲得固定預(yù)測結(jié)果外,使用GA 和GSA兩種智能算法優(yōu)化SVM 參數(shù)得到的C、γ和ε差異較大,每種算法多次測試結(jié)果不同,雖然對應(yīng)訓(xùn)練集擬合結(jié)果均很好,但相應(yīng)測試集回歸擬合結(jié)果差異較大,GA-SVM和GSA-SVM兩種預(yù)測模型100次測試得到總平均相對誤差分別為2.78% 和2.49%,小于BP神經(jīng)網(wǎng)絡(luò)和網(wǎng)格-SVM兩種預(yù)測模型預(yù)測誤差??梢奊SA-SVM預(yù)測模型恢復(fù)性估算精度最高,可滿足畜禽舍內(nèi)有害氣體排放規(guī)律分析需要。
通過綜合考慮畜禽舍內(nèi)廢氣濃度與時間、空間和環(huán)境等多種因素關(guān)系,建立GSA-SVM回歸預(yù)測模型,對廢氣監(jiān)測缺失數(shù)據(jù)進行恢復(fù)性估算。通過估算數(shù)據(jù)與監(jiān)測數(shù)據(jù)對比試驗研究表明,缺失數(shù)據(jù)估算的平均相對誤差為1.87%,與BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法、網(wǎng)格和GA參數(shù)尋優(yōu)SVM預(yù)測方法相比,增強傳感器之間的數(shù)據(jù)互補性,提高監(jiān)測系統(tǒng)可靠性,為準(zhǔn)確計量養(yǎng)殖場某一段時間內(nèi)連續(xù)排放的廢氣總量,分析畜禽舍內(nèi)廢氣排放規(guī)律,采取有效措施對畜禽排放有害氣體進行控制和處理提供依據(jù)。
[1]謝秋菊,蘇中濱,劉佳薈,等.基于L-M優(yōu)化算法的豬舍氨氣濃度預(yù)測模型研究[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2014,45(10):74-79.
[2]高玉紅,孫新勝,曹玉鳳,等.密閉肉牛舍冬季有害氣體的日變化和垂直分布規(guī)律研究[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2013,44(11): 143-146.
[3] Heber A J,Ni J Q,Lim T T,et al.Quality assured measurements of animal building emissions:Gas concentrations[J].Journal of the Air and Waste Management Association,2006,56(10):1472-1483.
[4] Bottcher R W,Keener K M,Munilla R D,et al.Dust and odor emission from tunnel ventilated swine buildings in North Carolina and comparison of different odor evaluation methods[J].Applied Engineering in Agriculture,2004,20(3):343-347.
[5] 朱偉興,李麗,龐敏.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)融合在廢氣測量中的應(yīng)用[J].中國安全科學(xué)學(xué)報,2007,17(6):162-165.
[6] 黃建清,朱偉興,李麗.BP神經(jīng)網(wǎng)絡(luò)在廢氣測量中的應(yīng)用[J].農(nóng)機化研究,2009,31(4):191-195.
[7] Vapnik V N.The nature of statistical learning theory[M].New York:Springger,2000.
[8] 都平平.基于支持向量機的綜合地質(zhì)環(huán)境評價研究[J].采礦與安全工程學(xué)報,2012,29(4):555-558.
[9] 戴棟,黃筱婷,代州,等.基于支持向量機的輸電線路覆冰回歸模型[J].高電壓技術(shù),2013,39(11):2822-2828.
[10] 劉偉,王建平,劉長虹,等.基于粒子群尋優(yōu)的支持向量機番茄紅素含量預(yù)測[J].農(nóng)業(yè)機械學(xué)報,2012,43(4):143-147.
[11] 單亞鋒,孫朋,徐耀松,等.基于PSO-SVM的煤巖聲發(fā)射源定位預(yù)測[J].傳感技術(shù)學(xué)報,2013,26(3):402-406.
[12]劉希亮,趙學(xué)勝,陸峰,等.基于GA-SVM的露天礦拋擲爆破拋擲率預(yù)測[J].煤炭學(xué)報,2012,37(12):1999-2005.
[13] 陳偉根,滕黎,劉軍,等.基于遺傳優(yōu)化支持向量機的變壓器繞組熱點溫度預(yù)測模型[J].電工技術(shù)學(xué)報,2014,29(1):44-51.
[14] 賀小亮,畢義明.基于模擬退火遺傳算法的編隊對地攻擊火力分配建模與優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2014,36(5):900-904.
[15]王霞,王占岐,金貴,等.基于核函數(shù)支持向量回歸機的耕地面積預(yù)測[J].農(nóng)業(yè)工程學(xué)報,2014,30(4):204-211.
Method of missing data recovery of waste gases monitoring in animal buildings based on GSA-SVM
LIU Jinming,XIE Qiuju,WANG Xue,MA Tiemin(School of InformationTechnology,Heilongjiang BayiAgricultural University,Daqing Heilongjiang 163319,China)
In order to solve the data missing problem caused by sensor faults during the waste gas monitoring in animal buildings,a method for missing data recovery was presented based on support vector machine(SVM)combined with genetic simulated annealing algorithm(GSA).Multiple factors that influenced monitoring values of the waste gas in animal buildings,such as temporal,spatial and environmental,were considered to established a SVM regression prediction model to estimate the missing data of the waste gas monitoring.Meanwhile,to obtain a better prediction accuracy,model parameters were optimized by the GSA.The data processing of the ammonia concentration was taken as an example,monitoring data of 3 d were randomly selected in a farm to test the presented model in this paper.The results showed that there was a very little error between the estimated data and monitoring data,the maximal relative error was 6.69%, the average relative error was 1.87%.It was an effective method for missing data recovery and a practical way of data processing for waste gases monitoring in animal buildings.
genetic simulated annealing algorithm(GSA);support vector machine(SVM);animal buildings;waste gas monitoring;data recovery
TP183
A
1005-9369(2015)05-0095-07
2014-11-13
黑龍江省青年科學(xué)基金項目(QC2013C065)
劉金明(1981-),男,講師,碩士,研究方向為計算機在農(nóng)業(yè)中的應(yīng)用。E-mail:jinmingliu2008@126.com