李名偉,夏曉蒙,朱慶輝,劉 鶴,黃東巖,王 剛
基于熱裂解和電子鼻的土壤全氮檢測(cè)方法及特征優(yōu)化
李名偉,夏曉蒙,朱慶輝,劉 鶴,黃東巖※,王 剛
(1. 吉林大學(xué)生物與農(nóng)業(yè)工程學(xué)院,長(zhǎng)春 130022;2. 吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)春 130022)
土壤氮是作物生長(zhǎng)發(fā)育所必需的營(yíng)養(yǎng)元素,也是衡量土壤肥力特征的重要指標(biāo)。為快捷準(zhǔn)確測(cè)定土壤全氮含量,該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測(cè)方法。采用10種不同類(lèi)型的氣體傳感器構(gòu)建傳感器陣列,并對(duì)其進(jìn)行了不同濃度甲烷、氯乙烯和氨氣等標(biāo)準(zhǔn)氣體的響應(yīng)測(cè)試試驗(yàn)。使用馬弗爐裂解土壤樣本得到裂解氣體,采用氣體傳感器陣列檢測(cè)裂解氣體的響應(yīng)曲線。提取響應(yīng)曲線的平均值(mean)、方差值(vav)、最大梯度值(mgv)、最大值(max)、響應(yīng)面積值(rav)、第8秒的瞬態(tài)值(8)和平均微分系數(shù)(mdc)7個(gè)特征構(gòu)建121×10×7(121為土壤樣本,10為傳感器數(shù)量,7為特征)的特征空間,采用GA-BP特征優(yōu)化方法將特征降至33維,形成121×33的特征空間。GA-BP算法優(yōu)化結(jié)果表明,構(gòu)建的傳感器陣列對(duì)該文檢測(cè)方法無(wú)冗余影響,其中傳感器TGS826、TGS2603、TGS2611和TGS2600對(duì)新特征空間的構(gòu)建貢獻(xiàn)最大,特征mean、mgv、rav、8和mdc是反映該文檢測(cè)方法與土壤全氮含量?jī)?nèi)在關(guān)系的重要特征。采用反向傳播神經(jīng)網(wǎng)絡(luò)算法(BPNN)、偏最小二乘回歸算法(PLSR)和反向傳播神經(jīng)網(wǎng)絡(luò)與偏最小二乘回歸結(jié)合算法(PLSR-BPNN)建立特征空間與土壤全氮含量的預(yù)測(cè)模型,使用決定系數(shù)(2)、均方根誤差(RMSE)和相對(duì)分析誤差(RPD)作為模型性能指標(biāo)。建模結(jié)果表明,PLSR、BPNN和PLSR-BPNN模型的2分別為0.91、0.81和0.93,RMSE分別為0.25、0.37和0.22,RPD分別為3.24、2.19和3.79,PLSR-BPNN模型擁有最高的2和RPD,最小的RMSE。結(jié)果表明,土壤熱解氣體與土壤全氮含量之間存在較高的相關(guān)性,采用該文檢測(cè)方法建立的PLSR-BPNN模型可以實(shí)現(xiàn)土壤全氮含量的準(zhǔn)確預(yù)測(cè)。
土壤;全氮;傳感器;熱裂解;電子鼻;特征優(yōu)化;模式識(shí)別
土壤是植物養(yǎng)分的主要來(lái)源,是作物生長(zhǎng)發(fā)育的重要影響因素[1]。土壤養(yǎng)分的含量決定了作物的生長(zhǎng)狀況,而土壤氮元素是土壤養(yǎng)分的重要組成部分,是決定作物營(yíng)養(yǎng)水平的關(guān)鍵因素,影響著作物的生長(zhǎng)情況、作物品質(zhì)以及產(chǎn)量[2-3]。根據(jù)土壤氮的豐缺程度進(jìn)行科學(xué)施肥,是作物優(yōu)質(zhì)高產(chǎn)的基礎(chǔ)[4]。然而,為了獲得高產(chǎn),盲目高劑量施肥,導(dǎo)致肥料分配不均、利用率低,不僅造成經(jīng)濟(jì)損失,還會(huì)嚴(yán)重污染環(huán)境[5]。因此,準(zhǔn)確、快速、低成本地獲取土壤氮素含量及其變化,對(duì)促進(jìn)精準(zhǔn)農(nóng)業(yè)發(fā)展,保護(hù)自然生態(tài)環(huán)境均具有重要意義。
測(cè)定土壤全氮含量的化學(xué)方法,如凱氏定氮法和杜馬斯燃燒定氮法,雖然可以精確測(cè)量土壤中的全氮含量,但存在費(fèi)工費(fèi)時(shí)、所用試劑有腐蝕性等不足[6-7]。近紅外光譜技術(shù)因?yàn)榭焖佟o(wú)污染和無(wú)損等優(yōu)勢(shì),被廣泛應(yīng)用于土壤全氮含量測(cè)定[8-11]。然而,土壤全氮的近紅外光譜測(cè)定方法受土壤質(zhì)地、土壤水分和氧化鐵等因素的影響[12-13]。熱裂解氣相色譜質(zhì)譜聯(lián)用技術(shù)(Pyrolysis gas chromatography-mass spectrometry,Py-GC/MS)具有快速、靈敏、需樣量少等優(yōu)點(diǎn),被廣泛應(yīng)用于聚合物科學(xué)、微生物學(xué)、生物工程及地球化學(xué)等領(lǐng)域[14-17]。Becker等[18]利用Py-GC/MS技術(shù)對(duì)乞力馬扎羅山沿3 400 m海拔樣帶的火山土中有機(jī)質(zhì)的構(gòu)成進(jìn)行了詳細(xì)分析。陳秋宇等[19]采用Py-GC/MS研究高寒草原土壤有機(jī)質(zhì)的指紋差異,將熱解產(chǎn)物進(jìn)行定性定量分析,并分為:芳烴、烷基類(lèi)化合物、含氮化合物等。Py-GC/MS技術(shù)可以準(zhǔn)確且定性定量的分析出土壤所含的各種養(yǎng)分,但存在設(shè)備購(gòu)置成本高、需要專(zhuān)業(yè)人員操作、不能專(zhuān)用于檢測(cè)土壤全氮和耗時(shí)費(fèi)工等缺點(diǎn),難以實(shí)現(xiàn)大批土壤樣本全氮含量的快速測(cè)量。
電子鼻是由選擇性的氣體傳感器陣列和適當(dāng)?shù)哪J阶R(shí)別算法組成的電子儀器,可以實(shí)現(xiàn)對(duì)簡(jiǎn)單和復(fù)雜氣味的識(shí)別,已被廣泛應(yīng)用于環(huán)境質(zhì)量檢測(cè)、醫(yī)療分析和食品安全檢測(cè)等領(lǐng)域[20-24]。電子鼻在土壤中的應(yīng)用主要集中于土壤特性和土壤有機(jī)質(zhì)檢測(cè)等方面。Lavanya等[25]利用電子鼻對(duì)土壤中黃腐酸和腐殖酸的芳香度進(jìn)行測(cè)定,實(shí)現(xiàn)了對(duì)兩種成分的檢測(cè)。Bieganowski等[26]研究了土壤的含水率對(duì)電子鼻信號(hào)的影響,利用電子鼻實(shí)現(xiàn)了土壤水分的評(píng)估。Zhu等[27-28]利用人工嗅覺(jué)系統(tǒng)實(shí)現(xiàn)了土壤有機(jī)質(zhì)含量檢測(cè),構(gòu)建了偏最小二乘回歸算法(Partial Least Squares Regression,PLSR)、反向傳播神經(jīng)網(wǎng)絡(luò)算法(Back Propagation Neural Network,BPNN)和支持向量回歸(Support Vector Regression,SVR)3種模型,預(yù)測(cè)性能最高的SVR模型2為0.91。
綜上所述,該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測(cè)方法。利用熱裂解技術(shù)實(shí)現(xiàn)少量土壤樣本的快速裂解,使其產(chǎn)生大量裂解氣體,將裂解氣體通入氣體傳感器陣列中得到傳感器響應(yīng)曲線。提取響應(yīng)曲線的平均值、方差值、最大梯度值、最大值、響應(yīng)面積值、第8秒的瞬態(tài)值和平均微分系數(shù)7個(gè)特征構(gòu)建電子鼻特征空間,采用GA-BP神經(jīng)網(wǎng)絡(luò)算法(Genetic Algorithm - Back Propagation neural network)將特征空間進(jìn)行優(yōu)化降維,得到最優(yōu)特征組成電子鼻特征空間。最后,采用BPNN、PLSR和PLSR-BPNN算法(Partial Least Squares Regression - Back Propagation Neural Network)建立新特征空間與土壤全氮含量的預(yù)測(cè)模型,從而利用熱裂解和電子鼻技術(shù)實(shí)現(xiàn)對(duì)土壤全氮含量的快捷、準(zhǔn)確和低成本檢測(cè)。
研究區(qū)域位于吉林省,屬于東北地區(qū)中部,與俄羅斯、朝鮮接壤,地處東北亞地理中心位置。為使采集的土壤樣本盡可能反映出吉林省不同地區(qū)土壤全氮的變化,分別在研究區(qū)域的121個(gè)采樣點(diǎn)各采集土壤樣本1份,如圖1所示。采樣點(diǎn)選擇耕地、林地等土壤類(lèi)型特征明顯,地形相對(duì)平坦、植被覆蓋良好的地點(diǎn),遠(yuǎn)離坡腳、洼地、田邊、城鎮(zhèn)和公路等。
由于土壤的不均一性,導(dǎo)致相同地塊土壤全氮含量也不盡相同,為盡可能得到土壤樣本在原位的實(shí)際狀態(tài),每個(gè)采樣點(diǎn)按照S形路線采集16份土壤樣本,采集0~20 cm的淺層土壤。將采集的16份土樣攪拌混合,除去動(dòng)植物殘?bào)w、石塊等,每個(gè)采樣點(diǎn)按照四分法保留1 kg土樣。依據(jù)試驗(yàn)實(shí)際的需要,將土樣置于室內(nèi)通風(fēng)陰干后,用木棍研細(xì)并使之通過(guò)1 mm(18目)的篩網(wǎng)。將處理完的土樣分為兩份,分別用于凱氏定氮法和該文檢測(cè)法測(cè)定土壤樣本全氮含量[29-30]。
該研究所采用裝置為基于熱裂解和電子鼻的土壤全氮含量檢測(cè)系統(tǒng),如圖2所示。該系統(tǒng)由熱裂解爐、裂解室(由真空法蘭和石英管組成)、氣體傳感器陣列(安裝在封閉的反應(yīng)室)、信號(hào)處理電路、NI數(shù)據(jù)采集卡、筆記本電腦、PWM調(diào)速模塊和真空泵組成。
熱裂解爐采用Thermo Fisher Scientific公司生產(chǎn)的Lindberg/Blue M Mini-Mite管式爐,用于裂解土壤樣本。石英舟用于盛放土壤樣本被放置在石英管中央,真空法蘭和石英管組成裂解室,使土壤樣本在密封狀態(tài)下完成裂解。氣體傳感器陣列是電子鼻系統(tǒng)的核心組成部分,可以對(duì)土壤的裂解氣體產(chǎn)生特異性響應(yīng)。根據(jù)土壤裂解后的產(chǎn)物[18-19],選擇了費(fèi)加羅公司生產(chǎn)的10種氧化物半導(dǎo)體式氣體傳感器組成傳感器陣列,其具體名稱(chēng)和參數(shù)如表1所示。信號(hào)轉(zhuǎn)換電路可以為氣體傳感器陣列供電,并將傳感器產(chǎn)生的電阻信號(hào)轉(zhuǎn)換成電壓信號(hào)。數(shù)據(jù)采集卡為國(guó)家儀器(National Instruments,NI)公司生產(chǎn)的多功能I/O設(shè)備USB-6210,通過(guò)杜邦線與信號(hào)轉(zhuǎn)換電路連接,實(shí)現(xiàn)對(duì)傳感器數(shù)據(jù)的采集,并將采集的數(shù)據(jù)通過(guò)USB數(shù)據(jù)線傳輸至電腦的LabVIEW檢測(cè)程序中顯示、存儲(chǔ)。采用真空泵實(shí)現(xiàn)整個(gè)系統(tǒng)的氣路循環(huán),并通過(guò)PWM調(diào)速模塊調(diào)節(jié)真空泵的流速。
表1 氣體傳感器型號(hào)及參數(shù)
系統(tǒng)工作時(shí),稱(chēng)取2 g土壤樣本放入石英舟中,并將其置入裂解室的中央位置,關(guān)閉真空法蘭,使裂解室處于密封狀態(tài),設(shè)置裂解溫度為400 ℃,裂解時(shí)間為3 min,開(kāi)始土壤樣本的裂解。裂解室、反應(yīng)室和真空泵通過(guò)橡膠管連接,形成密閉的氣路。裂解完成后,啟動(dòng)LabVIEW檢測(cè)程序,打開(kāi)真空法蘭,開(kāi)啟并設(shè)置真空泵的流量為1 L/min,使裂解室內(nèi)的裂解氣體進(jìn)入裝有傳感器陣列的反應(yīng)室,傳感器陣列采集裂解氣體的響應(yīng)數(shù)據(jù),時(shí)間為60 s,采集頻率為10 Hz。數(shù)據(jù)采集完成后,取下真空法蘭兩端的橡膠管,打開(kāi)熱裂解爐,取出石英管和石英舟并將其清洗和干燥;開(kāi)啟并設(shè)置真空泵的流量為3 L/min,用潔凈的空氣清洗反應(yīng)室和聯(lián)通管道,清洗時(shí)間為2 min,完成一次土壤樣本數(shù)據(jù)的采集,其余樣本數(shù)據(jù)的采集重復(fù)上述過(guò)程。
基于熱裂解和電子鼻的土壤全氮含量檢測(cè)系統(tǒng)搭建完成后,為測(cè)試氣體傳感器陣列對(duì)不同氣體的響應(yīng)狀況,該研究進(jìn)行了傳感器陣列響應(yīng)測(cè)試試驗(yàn)。試驗(yàn)裝置由多種標(biāo)準(zhǔn)氣體、氣體傳感器陣列、信號(hào)處理電路、NI數(shù)據(jù)采集卡和筆記本電腦組成,如圖3所示,標(biāo)準(zhǔn)氣體的類(lèi)型和參數(shù)如表2所示。
表2 標(biāo)準(zhǔn)氣體類(lèi)型及參數(shù)
測(cè)試時(shí),啟動(dòng)筆記本電腦中編寫(xiě)的LabVIEW程序,通過(guò)NI數(shù)據(jù)采集卡獲得氣體傳感器陣列在潔凈空氣中的響應(yīng)曲線,采集時(shí)間為10 s;然后,打開(kāi)標(biāo)準(zhǔn)氣體的閥門(mén),使標(biāo)準(zhǔn)氣體以1 L/min的流速通入安裝傳感器陣列的反應(yīng)室,通氣時(shí)間為20 s;接著,將反應(yīng)室用止氣夾密封,采集3 min;最后,以2.50 L/min的流速用真空泵抽取干凈的空氣清洗反應(yīng)室中標(biāo)準(zhǔn)氣體殘留,時(shí)間為1 min,完成一次氣體傳感器陣列響應(yīng)測(cè)試,每種標(biāo)準(zhǔn)氣體進(jìn)行3次測(cè)試試驗(yàn),取平均值。
從傳感器陣列的響應(yīng)曲線中提取合適的特征,有利于建立泛化能力強(qiáng)、決定系數(shù)高的預(yù)測(cè)關(guān)系模型。該研究提取平均值(Mean value,mean)、方差值(Variance value,vav)、最大梯度值(Maximun gradient value,mgv)、最大值(Maximum value,max)、響應(yīng)面積值(Response area value,rav)、第8秒的瞬態(tài)值(8)和平均微分系數(shù)(Mean differential coefficient value,mdc),這7個(gè)特征構(gòu)建特征空間,特征空間包含了傳感器陣列響應(yīng)數(shù)據(jù)的瞬態(tài)值、穩(wěn)定值、離散度、總體強(qiáng)度和變化速率等信息,能夠表征氣體傳感器的響應(yīng)曲線。
1)平均值(mean)。平均值是氣體傳感器所有響應(yīng)數(shù)據(jù)的平均,反映了該氣體傳感器對(duì)裂解氣體的平均響應(yīng)特征。
式中X為傳感器數(shù)據(jù)的第個(gè)數(shù)據(jù),為傳感器數(shù)據(jù)中最大值所對(duì)應(yīng)的時(shí)間,為傳感器數(shù)據(jù)的總數(shù)量。
2)方差值(vav)。方差用來(lái)計(jì)算每一個(gè)變量與總體均數(shù)之間的差異,用方差值來(lái)表示不同傳感器響應(yīng)的離散程度。
3)最大梯度值(mgv)。最大梯度值為氣體傳感器響應(yīng)的最大值與初始值的斜率,可以表示響應(yīng)信號(hào)變化的快慢。
式中imax為傳感器數(shù)據(jù)中的最大值,0為傳感器數(shù)據(jù)的初始值。
4)最大值(max)。最大值是傳感器響應(yīng)強(qiáng)度大小最直觀的體現(xiàn)。
5)響應(yīng)面積值(rav)。響應(yīng)面積值是氣體傳感器響應(yīng)曲線與采集時(shí)間的面積,反映了該氣體傳感器對(duì)裂解氣體的總體響應(yīng)結(jié)果。
6)第8秒的瞬態(tài)值(8)。瞬態(tài)值表達(dá)了傳感器對(duì)不同裂解氣體的不同瞬態(tài)行為,包含了比穩(wěn)態(tài)更多的可用信息。土壤裂解氣體在傳感器陣列的響應(yīng)是先快速上升,然后慢慢趨近于穩(wěn)定。快速上升時(shí)間主要為前15 s,傳感器響應(yīng)強(qiáng)度區(qū)別最大的是第8秒的瞬態(tài)響應(yīng)值,所以選擇8作為特征。
7)平均微分系數(shù)(mdc)。平均微分系數(shù)可以全面反映傳感器動(dòng)態(tài)響應(yīng)過(guò)程的整體信息,體現(xiàn)了氣體傳感器對(duì)裂解氣體響應(yīng)的重要信息。
式中X1為傳感器數(shù)據(jù)的第1個(gè)數(shù)據(jù)。
該研究共采集了121份土壤樣本,傳感器陣列由10個(gè)氣體傳感器組成,提取每個(gè)傳感器響應(yīng)曲線的7個(gè)特征,因此,組合成一個(gè)121×10×7的電子鼻特征空間。各特征與特征編號(hào)的對(duì)應(yīng)關(guān)系如表3所示。
表3 各特征與特征編號(hào)的對(duì)應(yīng)關(guān)系
由于提取的特征量綱不同,會(huì)造成數(shù)量級(jí)大的特征在建模中所占比重較大,不利于構(gòu)建精準(zhǔn)的預(yù)測(cè)模型。為消除數(shù)量級(jí)、量綱對(duì)建模的影響,該研究采用-score標(biāo)準(zhǔn)化方法對(duì)提取的特征進(jìn)行歸一化處理。
遺傳算法是模擬達(dá)爾文生物進(jìn)化論中自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過(guò)程的計(jì)算模型,是一種通過(guò)模擬自然進(jìn)化過(guò)程搜索最優(yōu)解的方法。首先,根據(jù)實(shí)際需求產(chǎn)生初始種群,利用適用度表明個(gè)體的優(yōu)劣性,然后從群體中選擇優(yōu)良個(gè)體,通過(guò)交叉、突變實(shí)現(xiàn)“適者生存”的自然選擇,產(chǎn)生比以前更適應(yīng)環(huán)境的新種群,直到滿(mǎn)足一定的終止條件,得出最優(yōu)選擇。為了除去冗余信息、分析出各個(gè)傳感器對(duì)電子鼻系統(tǒng)的貢獻(xiàn)度,該研究采用GA-BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行特征優(yōu)化、降維。具體的過(guò)程如圖4所示
圖4中,灰色矩形框中為神經(jīng)網(wǎng)絡(luò)算法部分。首先,創(chuàng)建一個(gè)種群大小為50,個(gè)體長(zhǎng)度為70(傳感器提取的特征10×7)的隨機(jī)種群。然后,對(duì)個(gè)體的染色體進(jìn)行二進(jìn)制編碼,使每條染色體上的每個(gè)位點(diǎn)基因?qū)?yīng)一個(gè)特征載體。在每個(gè)基因中,“1”表示特征參與BPNN建模,“0”表示不參與建模。
選取遺傳個(gè)體對(duì)應(yīng)的特征,用于BPNN模型。利用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,以誤差平方和的倒數(shù)作為適應(yīng)度函數(shù)進(jìn)行驗(yàn)證。適應(yīng)度較高的個(gè)體遺傳到下一代的概率相對(duì)較大。適應(yīng)度函數(shù)為
為建立一個(gè)可以精準(zhǔn)預(yù)測(cè)土壤全氮含量的模型,需要將歸一化處理的電子鼻特征空間劃分為訓(xùn)練集和測(cè)試集兩部分,訓(xùn)練集用來(lái)擬合數(shù)據(jù)樣本,訓(xùn)練模型的參數(shù),減少模型的泛化誤差,使模型能夠具有較高的可靠性,進(jìn)而實(shí)現(xiàn)預(yù)測(cè)未知土壤樣本的能力;而測(cè)試集用以預(yù)測(cè)未知土樣的全氮含量,并借助不同的評(píng)價(jià)指標(biāo)評(píng)估模型的預(yù)測(cè)性能。該研究為劃分出合理的訓(xùn)練集和測(cè)試集,采用Kennard-Stone方法將訓(xùn)練集和測(cè)試集設(shè)置為7∶3。
為提高該研究檢測(cè)方法的檢測(cè)性能,采用PLSR、BPNN和PLSR-BPNN三種算法建立電子鼻特征空間與土壤全氮含量之間的預(yù)測(cè)關(guān)系模型,以找出最優(yōu)的土壤全氮含量預(yù)測(cè)模型。
偏最小二乘回歸分析方法是一種將主成分分析、多元線性分析和典型相關(guān)分析結(jié)合在一起的多變量回歸分析方法。PLSR與最小二乘法相比,具有可實(shí)現(xiàn)數(shù)據(jù)降維、信息整合和提取對(duì)模型有最佳解釋信息的主成分等優(yōu)點(diǎn),可有效精簡(jiǎn)裂解氣體響應(yīng)曲線的自變量和去除冗余噪聲,篩選出對(duì)土壤全氮含量解釋性最佳的綜合變量;與主成分分析法相比,克服了其對(duì)自變量解釋較強(qiáng),因變量解釋不足的問(wèn)題[31-32]。PLSR模型預(yù)測(cè)精度主要受主成分因子(Principal Component Factor,PCF)數(shù)量的影響,合適的PCF數(shù)量可有效利用氣體傳感器陣列的信息和濾除噪聲,也可有效提高模型的泛化能力。該研究采用留一交叉驗(yàn)證法確定模型中PCF的數(shù)量,并通過(guò)交叉驗(yàn)證均方根誤差(Root Mean Square Error of Cross-Validation,RMSECV)來(lái)評(píng)估PCF的數(shù)量對(duì)PLSR模型預(yù)測(cè)性能的影響。
反向傳播神經(jīng)網(wǎng)絡(luò)算法是一種典型的多層前向型神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層和輸出層組成,主要應(yīng)用于有導(dǎo)師學(xué)習(xí)的回歸預(yù)測(cè)和分類(lèi)。輸入層由數(shù)據(jù)中提取的特征組成,隱含層中的神經(jīng)元多采用S型傳遞函數(shù),輸出層的神經(jīng)元多采用線性傳遞函數(shù)。BPNN的精髓是將網(wǎng)絡(luò)輸出與期望輸出之間的誤差歸為權(quán)值和閾值的“過(guò)錯(cuò)”,通過(guò)反向傳播把誤差“分?jǐn)偂苯o各個(gè)神經(jīng)元的權(quán)值和閾值,其指導(dǎo)思想是權(quán)值和閾值的調(diào)整要沿著誤差函數(shù)下降最快的方向(負(fù)梯度方向)。隱含層神經(jīng)元個(gè)數(shù)對(duì)BPNN模型的預(yù)測(cè)性能影響較大,過(guò)少或過(guò)多的隱含層神經(jīng)元個(gè)數(shù)直接導(dǎo)致BPNN模型出現(xiàn)欠擬合和過(guò)擬合現(xiàn)象,因此需要選擇合適的隱含層神經(jīng)元個(gè)數(shù)。目前沒(méi)有精確的公式計(jì)算隱含層的神經(jīng)元數(shù)目,但可以根據(jù)經(jīng)驗(yàn)公式來(lái)確定其范圍
土壤裂解氣體與土壤全氮含量的相互關(guān)系復(fù)雜,電子鼻特征空間與土壤全氮含量之間存在線性和非線性的內(nèi)在聯(lián)系。若將PLSR模型的線性回歸能力和BPNN模型的非線性映射能力結(jié)合起來(lái)組成PLSR-BPNN模型,可充分利用2種算法的優(yōu)點(diǎn),以提高該研究檢測(cè)方法的預(yù)測(cè)性能。該文采用并聯(lián)方式將PLSR和BPNN模型組合在一起,分別對(duì)2種模型進(jìn)行建模,將得到的預(yù)測(cè)結(jié)果加權(quán)組合,并通過(guò)模型有效度得到合適的加權(quán)系數(shù),最終實(shí)現(xiàn)PLSR-BPNN模型的建立和檢測(cè)數(shù)據(jù)的輸出,如圖 5所示。
為了評(píng)估土壤全氮含量預(yù)測(cè)模型的性能和可靠性,該研究采用均方根誤差(Root Mean Square Error,RMSE)、決定系數(shù)(2)和相對(duì)分析誤差(Residual Prediction Deviation,RPD)作為模型預(yù)測(cè)性能的評(píng)價(jià)指標(biāo)。RMSE是模型預(yù)測(cè)值和實(shí)際值之間誤差,RMSE越小,表明模型的預(yù)測(cè)性能越好。2用以表示模型的預(yù)測(cè)準(zhǔn)確性,其范圍為0~1,2越接近1表明模型的準(zhǔn)確性和擬合效果越好。RPD是樣本標(biāo)準(zhǔn)差與均方根誤差的比,用以進(jìn)一步衡量建立模型的預(yù)測(cè)性能。當(dāng)RPD≥2.50時(shí),表明模型具有極好的定量預(yù)測(cè)能力;當(dāng)2≤RPD<2.50時(shí),表明模型具有較好的定量預(yù)測(cè)能力;當(dāng)1.40≤RPD<2時(shí),表明模型可粗略估算樣品含量;當(dāng)RPD<1.40時(shí),表明模型無(wú)法對(duì)樣品含量進(jìn)行預(yù)測(cè)。
采用凱氏定氮法測(cè)量121個(gè)土壤樣本的全氮含量,結(jié)果如表4所示,采用Kennard-Stone方法設(shè)置訓(xùn)練集和測(cè)試集之比為7∶3,即訓(xùn)練集和測(cè)試集各有85和36個(gè)樣本。在訓(xùn)練集中,土壤全氮含量為0.20~3.95 g/kg,平均值為1.54 g/kg,標(biāo)準(zhǔn)差為0.68 g/kg,變異系數(shù)為44.05%,偏度為1.01 g/kg,峰度為2.00 g/kg;而測(cè)試集中,土壤全氮含量為0.35~4.10 g/kg,平均值為1.70 g/kg,標(biāo)準(zhǔn)差為0.82 g/kg,變異系數(shù)為48.12%,偏度為1.36 g/kg,峰度為2.43 g/kg。研究區(qū)域中采集的土壤全氮含量和樣本變異系數(shù)變化趨勢(shì)較大,有利于提高模型的預(yù)測(cè)能力[34]。測(cè)試集中土壤全氮含量的范圍完全覆蓋了訓(xùn)練集中土壤全氮含量的范圍,有利于提高模型的泛化能力。
3.2.1 甲烷響應(yīng)測(cè)試結(jié)果
該研究按照1.3節(jié)試驗(yàn)方法進(jìn)行了氣體傳感器陣列的響應(yīng)測(cè)試試驗(yàn),得到圖6不同濃度甲烷對(duì)傳感器陣列影響的曲線。圖6中,甲烷幾乎不能使傳感器S1、S2和S5產(chǎn)生任何響應(yīng),傳感器S6響應(yīng)曲線呈下降趨勢(shì),且不同濃度甲烷對(duì)其響應(yīng)的影響不明顯;其余傳感器皆對(duì)不同濃度的甲烷氣體有明顯響應(yīng),且隨著甲烷濃度的增加,傳感器的響應(yīng)曲線呈明顯上升趨勢(shì)。
表4 土壤樣本的全氮含量及分析
3.2.2 氯乙烯響應(yīng)測(cè)試結(jié)果
不同濃度氯乙烯對(duì)傳感器陣列影響,如圖7所示。圖7中,傳感器S5對(duì)氯乙烯氣體沒(méi)有響應(yīng),其余傳感器對(duì)氯乙烯響應(yīng)明顯,且隨著氯乙烯濃度依次增大,傳感器相應(yīng)強(qiáng)度也依次增大,傳感器的響應(yīng)時(shí)間明顯縮短,可以更快達(dá)到穩(wěn)定狀態(tài)。
3.2.3 氨氣響應(yīng)測(cè)試結(jié)果
圖8為傳感器陣列對(duì)兩種濃度氨氣的響應(yīng)曲線。從圖8中可以看出,傳感器S10對(duì)氨氣幾乎沒(méi)有響應(yīng),低濃度氨氣幾乎不能使傳感器S5產(chǎn)生響應(yīng),但隨著氨氣濃度的增加,傳感器響產(chǎn)生較明顯的響應(yīng);其余傳感器對(duì)氨氣均有響應(yīng),且隨著氨氣濃度的增大,傳感器的響應(yīng)強(qiáng)度明顯增強(qiáng)。
從氣體傳感器陣列對(duì)不同濃度、種類(lèi)標(biāo)準(zhǔn)氣體的測(cè)試試驗(yàn)中可以看出,甲烷不能使傳感器TGS826、TGS2602產(chǎn)生響應(yīng),傳感器TGS821只對(duì)高濃度氨氣響應(yīng),傳感器TGS2612對(duì)氨氣幾乎沒(méi)有響應(yīng)。其余傳感器對(duì)不同濃度的氯乙烯、氨氣皆有響應(yīng)且響應(yīng)結(jié)果不同,且隨著標(biāo)準(zhǔn)氣體濃度的增大傳感器陣列的響應(yīng)強(qiáng)度也隨之增大,響應(yīng)時(shí)間縮短,可以更快達(dá)到穩(wěn)定狀態(tài);不同濃度的甲烷對(duì)傳感器陣列的影響不同于上述情況,高濃度甲烷提高了傳感器的響應(yīng)強(qiáng)度,但同時(shí)提高了其響應(yīng)時(shí)間,反而低濃度甲烷可以更快達(dá)到穩(wěn)定狀態(tài)。響應(yīng)測(cè)試試驗(yàn)結(jié)果表明氣體傳感器陣列具有較高的特異性和一定的交叉敏感性,為基于熱裂解和電子鼻的土壤全氮含量檢測(cè)系統(tǒng)的組建奠定了基礎(chǔ)。
采用GA-BP算法對(duì)訓(xùn)練集降維優(yōu)化,設(shè)置種群大小為50,個(gè)體長(zhǎng)度為70,輸出條件設(shè)為100次迭代。適應(yīng)度函數(shù)演化曲線如圖9a所示。從圖9a中可以看出,迭代36次后,最佳適應(yīng)度值保持不變,此時(shí)電子鼻特征空間達(dá)到了最佳的降維效果。在這種情況下,篩選出的最優(yōu)特征編號(hào)為1、6、7、8、10、14、16、18、25、26、27、29、30、31、33、36、39、41、44、45、47、49、50、51、52、53、54、56、61、66、67、68、69,即特征由70維降到了33維。優(yōu)化后所形成的電子鼻特征空間為121×33(樣本數(shù)121×特征數(shù)33),因總樣本數(shù)固定,僅減少了特征,因此劃分的訓(xùn)練集和測(cè)試集不變。電子鼻特征空間的數(shù)據(jù)箱型可視化圖,如圖9b所示。
從圖9b中可以看出,7個(gè)特征參數(shù)對(duì)特征空間的貢獻(xiàn)依次為:rav>mdc=8=mean=mgv>max>vav,分別提供了6、5、5、5、5、4和3特征,特征max和vav維數(shù)貢獻(xiàn)相對(duì)較小,特征rav、mdc、8、mean和mgv是體現(xiàn)電子鼻系統(tǒng)與土壤全氮含量?jī)?nèi)在聯(lián)系的重要特征。
此外,圖9b還可以看出,對(duì)于電子鼻特征空間的構(gòu)成,傳感器貢獻(xiàn)的特征維數(shù)也不同。傳感器S6提供了6維特征,傳感器S1提供了5特征,傳感器S7、S9提供了4維特征,其余傳感器提供特征相對(duì)較少,尤其是傳感器S2僅提供了1維特征。該研究所用氣體傳感器對(duì)新特征空間的構(gòu)成均有貢獻(xiàn),表明組建的傳感器陣列對(duì)基于熱裂解和電子鼻的土壤全氮含量檢測(cè)方法均有作用,沒(méi)有冗余,且傳感器TGS826、TGS2603、TGS2611和TGS2600對(duì)構(gòu)建電子鼻特征空間的貢獻(xiàn)最大。
3.4.1 PLSR模型的建立
PLSR模型的預(yù)測(cè)性能受主成分因子(Principal component factor,PCF)數(shù)目的影響,適合的PCF數(shù)目可有效提高模型的預(yù)測(cè)和泛化能力。該研究采用40個(gè)主成分因子和留一交叉驗(yàn)證法尋找合適的PCF數(shù)量,通過(guò)RMSECV驗(yàn)證模型的可靠性,得到圖10所示PCF和RMSECV的關(guān)系圖。從圖10中可以看出,在PCF數(shù)量在19~25的時(shí)候,均方根誤差較小,而較少的PCF數(shù)量可以降低模型的復(fù)雜性、避免出現(xiàn)過(guò)擬合現(xiàn)象,因此該研究采用19個(gè)PCF建立了PLSR預(yù)測(cè)模型。
采用19個(gè)PCF和電子鼻特征空間的訓(xùn)練集建立PLSR預(yù)測(cè)模型,并采用測(cè)試集的未知樣本對(duì)模型的預(yù)測(cè)性能進(jìn)行驗(yàn)證,如圖11所示。建立PLSR模型訓(xùn)練集的2=0.91,RMSE=0.21,RPD=3.28(圖11a),測(cè)試集的2=0.91,RMSE=0.25,RPD=3.2(圖11b)。模型預(yù)測(cè)結(jié)果表明,采用PLSR算法建立的土壤全氮預(yù)測(cè)模型,其訓(xùn)練集和測(cè)試集的2大于0.91,RMSE小于0.25,RPD大于3.23,模型具有極好的定量預(yù)測(cè)能力和較好的泛化能力。
3.4.2 BPNN模型的建立
該研究采用MATLAB 9.7.0.1190202(R2019b)軟件中的神經(jīng)網(wǎng)絡(luò)工具箱建立BPNN預(yù)測(cè)模型。在BPNN模型的建立中,采用tansig函數(shù)作為隱含層的傳遞函數(shù),采用線性函數(shù)purelin作為輸出層的傳遞函數(shù),采用newff函數(shù)創(chuàng)建神經(jīng)網(wǎng)絡(luò)。設(shè)置學(xué)習(xí)率為0.01,設(shè)置目標(biāo)誤差為0.001,將訓(xùn)練迭代次數(shù)設(shè)置為1 000,將訓(xùn)練集用train函數(shù)帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,最后利用sim函數(shù)將已經(jīng)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真預(yù)測(cè)。
BPNN建模中,隱含層神經(jīng)元個(gè)數(shù)直接影響著模型的預(yù)測(cè)性能。為了選擇合適的神經(jīng)元數(shù)量,根據(jù)公式(7)將其取值設(shè)置為7~16,選取程序運(yùn)行20次對(duì)應(yīng)訓(xùn)練集和測(cè)試集決定系數(shù)的最小值、最大值和平均值作為評(píng)價(jià)指標(biāo),得到表5所示結(jié)果。從表5中可以看出,神經(jīng)元數(shù)量為14時(shí),BPNN模型訓(xùn)練集2的最小值、最大值和平均值均為最高,但測(cè)試集2的3個(gè)指標(biāo)均不如神經(jīng)元數(shù)量為12時(shí)建立的BPNN模型,說(shuō)明神經(jīng)元數(shù)量的增多出現(xiàn)了過(guò)擬合現(xiàn)象,影響模型的泛化能力。因此,BPNN模型參數(shù)確定為33-12-1(33個(gè)輸入量,12個(gè)隱含層神經(jīng)元,1個(gè)輸出量),其訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果如圖 12所示。
表5 神經(jīng)元數(shù)量對(duì)BPNN模型預(yù)測(cè)性能影響
模型預(yù)測(cè)結(jié)果表明,建立BPNN模型的訓(xùn)練集2=0.93,RMSE=0.18,RPD=3.69(圖12a),測(cè)試集的2=0.81,RMSE=0.37,RPD=2.19(圖12b),模型在訓(xùn)練集中具有較高的準(zhǔn)確性和擬合效果,但在測(cè)試集中2和RPD均有大幅下降。表明BPNN算法建立的土壤全氮預(yù)測(cè)模型出現(xiàn)了過(guò)擬合現(xiàn)象,模型在泛化能力上有所不足。
3.4.3 PLSR-BPNN模型的建立
由上文建立的PLSR和BPNN模型預(yù)測(cè)結(jié)果可以看出,PLSR模型具有不錯(cuò)的定量預(yù)測(cè)和泛化能力,但其預(yù)測(cè)準(zhǔn)確性有待提高。BPNN模型在訓(xùn)練集擁有不錯(cuò)的準(zhǔn)確性,但在測(cè)試集中預(yù)測(cè)性能有明顯下降,說(shuō)明模型的泛化能力不足。為提高建立模型的準(zhǔn)確性和泛化能力,該研究將PLSR和BPNN模型結(jié)合,建立了PLSR-BPNN算法的土壤全氮預(yù)測(cè)模型,PLSR算法的主成分因子為19,BPNN算法隱含層神經(jīng)元數(shù)目為12,得到如圖13所示PLSR-BPNN模型訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果。
從圖13看出,PLSR-BPNN算法建立的預(yù)測(cè)模型,其訓(xùn)練集的2=0.94,RMSE=0.17,RPD=3.90(圖13a),測(cè)試集的2=0.93,RMSE=0.22,RPD=3.79(圖13b)。PLSR-BPNN模型訓(xùn)練集和測(cè)試集的2>0.93,RPD>3.79,表明模型具有精確定量分析能力和較強(qiáng)的泛化能力。
為提高該研究檢測(cè)方法的檢測(cè)精度,采用PLSR、BPNN和PLSR-BPNN三種算法分別對(duì)電子鼻特征空間的訓(xùn)練集和測(cè)試集進(jìn)行測(cè)試,以找出最優(yōu)的關(guān)系模型。從圖11a、12a、13a可以看出,在PLSR、BPNN、PLSR-BPNN三個(gè)訓(xùn)練集的預(yù)測(cè)模型中,PLSR-BPNN模型的預(yù)測(cè)效果最好(2和RPD最大,RMSE最小),BPNN次之,PLSR最差。但3個(gè)模型的2均大于0.91,RPD均大于3.28,表明3個(gè)模型在訓(xùn)練集中具有極好的定量分析能力。
將測(cè)試集分別帶入已經(jīng)訓(xùn)練完成的BPNN、PLSR和PLSR-BPNN模型中,得到圖11b、12b、13b中的預(yù)測(cè)結(jié)果。為了進(jìn)行更直接的比較,在表6中列出了模型測(cè)試集的預(yù)測(cè)性能。從測(cè)試集的預(yù)測(cè)性能對(duì)比中可以看出(表 6),3個(gè)模型的2均大于0.81,RMSE<0.37,表明所有模型均有較好的土壤全氮含量預(yù)測(cè)能力。但從RPD的指標(biāo)來(lái)看,BPNN算法建立的預(yù)測(cè)模型具有較好的定量預(yù)測(cè)能力,而PLSR和PLSR-BPNN模型均具有極好的定量預(yù)測(cè)能力,且PLSR-BPNN模型比PLSR模型的2提升2.20%,RPD提升16.98%,RMSE減少12.00%。建模結(jié)果表明,PLSR-BPNN算法建立的土壤全氮預(yù)測(cè)模型,可有效提高PLSR模型的預(yù)測(cè)準(zhǔn)確性,解決BPNN模型泛化能力不足等問(wèn)題,為土壤全氮的測(cè)量提供一種可靠的關(guān)系模型。其原因是土壤全氮含量與電子鼻特征空間存在一定程度的線性和非線性關(guān)聯(lián),PLSR-BPNN模型可以分別彌補(bǔ)PLSR和BPNN模型在非線性和線性關(guān)系的不足,從而建立更為準(zhǔn)確的土壤全氮預(yù)測(cè)模型。
表6 模型測(cè)試集預(yù)測(cè)性能對(duì)比
測(cè)定土壤全氮的傳統(tǒng)方法存在費(fèi)工費(fèi)時(shí)、所用試劑有腐蝕性等不足;土壤全氮的近紅外光譜測(cè)定方法受土壤質(zhì)地、土壤水分和氧化鐵等因素的影響;Py-GC/MS方法存在設(shè)備購(gòu)置成本高、不能專(zhuān)用于測(cè)定土壤全氮和耗時(shí)費(fèi)工等缺點(diǎn),難以實(shí)現(xiàn)大批土壤樣本全氮含量的快速測(cè)量。該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測(cè)方法,該方法具有成本低、方便快捷和準(zhǔn)確性高等優(yōu)勢(shì),但土壤裂解、傳感器檢測(cè)和洗氣共需要6 min的時(shí)間,因此不能實(shí)現(xiàn)車(chē)載田間土壤全氮含量的實(shí)時(shí)測(cè)量。
該文采用模式識(shí)別算法建立裂解氣體響應(yīng)曲線所選取特征與土壤全氮的關(guān)系模型,并用2、RMSE和RPD三個(gè)指標(biāo)對(duì)模型的準(zhǔn)確性進(jìn)行評(píng)估。模式識(shí)別的基本原理是用計(jì)算統(tǒng)計(jì)的方法根據(jù)樣本的特征將樣本劃分到一定的類(lèi)別中。文中采用熱裂解和電子鼻技術(shù)實(shí)現(xiàn)原始數(shù)據(jù)的獲??;提取傳感器陣列響應(yīng)數(shù)據(jù)的特征組成特征空間,并利用GA-BP算法對(duì)其優(yōu)化降維,完成特征的提取與選擇。該文選取的特征與土壤全氮含量存在緊密的聯(lián)系,目前對(duì)相關(guān)機(jī)理的研究比較初步,土壤裂解氣體的成分不能完全確定,且不同樣本間存在異質(zhì)性,因此不能完全揭示特征與土壤全氮含量的內(nèi)在規(guī)律。采用訓(xùn)練集的新特征空間與對(duì)應(yīng)土壤全氮含量對(duì)學(xué)習(xí)機(jī)器進(jìn)行訓(xùn)練,依據(jù)統(tǒng)計(jì)規(guī)律性和模式識(shí)別算法建立特征與土壤全氮的數(shù)學(xué)模型;用建立的模型對(duì)測(cè)試集的未知樣本進(jìn)行土壤全氮含量預(yù)測(cè)。結(jié)果表明,PLSR、BPNN和PLSR-BPNN三種模式識(shí)別算法的預(yù)測(cè)結(jié)果較為準(zhǔn)確,說(shuō)明土壤裂解氣體與土壤全氮含量存在內(nèi)在規(guī)律,且該文選取的特征可有效表達(dá)兩者間的統(tǒng)計(jì)規(guī)律性。
該研究提出了一種基于熱裂解和電子鼻的土壤全氮含量檢測(cè)方法。利用熱裂解技術(shù)實(shí)現(xiàn)土壤樣本快速裂解,采用電子鼻完成裂解氣體響應(yīng)數(shù)據(jù)采集,最后利用模式識(shí)別實(shí)現(xiàn)土壤全氮含量準(zhǔn)確預(yù)測(cè)。
1)采用GA-BP算法對(duì)模式識(shí)別中構(gòu)建的特征空間進(jìn)行優(yōu)化,減少了冗余信息。結(jié)果表明,構(gòu)建的傳感器陣列對(duì)該研究無(wú)冗余影響,其中傳感器TGS826、TGS2603、TGS2611和TGS2600對(duì)特征空間的構(gòu)建貢獻(xiàn)最大,特征響應(yīng)面積值、平均微分系數(shù)、第8秒的瞬態(tài)值、平均值和最大梯度值是反映該研究方法與土壤全氮含量?jī)?nèi)在關(guān)系的重要特征。
2)對(duì)構(gòu)建的氣體傳感器陣列進(jìn)行了標(biāo)準(zhǔn)氣體的響應(yīng)測(cè)試。結(jié)果表明,傳感器陣列對(duì)不同濃度的甲烷、氯乙烯和氨氣皆有響應(yīng)且響應(yīng)結(jié)果不同,且隨著標(biāo)準(zhǔn)氣體濃度的增大氣體傳感器陣列的響應(yīng)強(qiáng)度也隨之增強(qiáng)。
3)對(duì)比分析了PLSR、BPNN和PLSR-BPNN算法在此研究中的檢測(cè)性能。結(jié)果表明,三種模型均有準(zhǔn)確預(yù)測(cè)土壤全氮含量的能力,PLSR-BPNN模型擁有最高的2和RPD,最小的RMSE。PLSR-BPNN模型在測(cè)試集中2=0.93,RMSE=0.22,RPD=3.79。
[1] 郭澎濤,李茂芬,羅微,等. 基于多源環(huán)境變量和隨機(jī)森林的橡膠園土壤全氮含量預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(5):194-202.
Guo Pengtao, Li Maofen, Luo Wei, et al. Prediction of soil total nitrogen for rubber plantation at regional scale based on environmental variables and random forest approach[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 194-202. (in Chinese with English abstract)
[2] 周鵬,楊瑋,李民贊,等. 基于灰度關(guān)聯(lián)-極限學(xué)習(xí)機(jī)的土壤全氮預(yù)測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(S1):271-276.
Zhou Peng, Yang Wei, Li Minzan, et al. Soil total nitrogen content prediction based on gray correlation-extreme learning machine[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017,48(S1): 271-276. (in Chinese with English abstract)
[3] Chen C, Dong D M, Li Z W, et al. A novel soil nutrient detection method based on combined ATR and DRIFT mid-infrared spectra[J]. Analytical Methods, 2016, 9(3): 528-533.
[4] Ren G X, Wei Z Q, Fan P P, et al. Visible/near infrared spectroscopy method applied research in wetland soil nutrients rapid test[J]. IOP Conference Series Earth and Environmental Science, 2019, 344: 012123.
[5] Li H Y, Jia S Y, Le Z C. Quantitative analysis of soil total nitrogen using hyperspectral imaging technology with extreme learning machine[J]. Sensors, 2019, 19(20): 4355.
[6] 宋琦. 我國(guó)幾種土壤的有機(jī)氮組成和性質(zhì)的研究[J]. 土壤學(xué)報(bào),1988,25(1):95-100.
Song Qi. Study on composition and property of organic nitrogen in several soils of China[J]. Acta Pedologica Sinica, 1988, 25(1): 95-100. (in Chinese with English abstract)
[7] 秦琳,黃世群,仲伶俐,等. 杜馬斯燃燒法和凱氏定氮法在土壤全氮檢測(cè)中的比較研究[J]. 中國(guó)土壤與肥料,2020(4):258-265.
Qin Lin, Huang Shiqun, Zhong Lingli, et al. Comparison of Dumas combustion and Kjeldahl methods for determining total nitrogen content in soil[J]. Soil and Fertilizer Sciences in China, 2020(4): 258-265. (in Chinese with English abstract)
[8] 侯云鵬,韓立國(guó),孔麗麗,等. 不同施氮水平下水稻的養(yǎng)分吸收,轉(zhuǎn)運(yùn)及土壤氮素平衡[J]. 植物營(yíng)養(yǎng)與肥料學(xué)報(bào),2015,21(4):836-845.
Hou Yunpeng, Han Liguo, Kong Lili, et al. Nutrient absorption, translocation in rice and soil nitrogen equilibrium under different nitrogen application doses[J]. Journal of Plant Nutrition and Fertilizer, 2015, 21(4): 836-845. (in Chinese with English abstract)
[9] 張娟娟,田永超,姚霞,等. 基于近紅外光譜的土壤全氮含量估算模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(12):183-188.
Zhang Juanjuan, Tian Yongchao, Yao Xia, et al. Estimating model of soil total nitrogen content based on near-infrared spectroscopy analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(12): 183-188. (in Chinese with English abstract)
[10] 王海江,劉凡,YUNGER John A,等. 不同粒徑處理的土壤全氮含量高光譜特征擬合模型[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2019,50(2):195-204.
Wang Haijiang, Liu Fan, YUNGER John A, et al. Fitting model of soil total nitrogen content in different soil particle sizes using hyperspectral analysis[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(2): 195-204. (in Chinese with English abstract)
[11] Nie P C, Dong T, He Y, et al. The effects of drying temperature on nitrogen concentration detection in calcium soil studied by NIR spectroscopy[J]. Applied Sciences-Basel, 2018, 8(2): 269.
[12] He Y, Xiao S P, Nie P C, et al. Research on the Optimum Water Content of Detecting Soil Nitrogen Using Near Infrared Sensor[J]. Sensors, 2017, 17(9): 2045.
[13] Stoner E R, Baumgardner M F. Characteristic variations in reflectance of surface soils[J]. Soil Science Society of America Journal, 1981, 45(6): 1161-1165.
[14] al Sandouk-Lincke N A, Schwarzbauer J, Hartkopf-Froeder C, et al. The effect of different pyrolysis temperatures on organic microfossils, vitrain and amber-A comparative study between laser assisted- and Curie Point-pyrolysis-gas chromatography/mass spectrometry[J]. Journal of Analytical & Applied Pyrolysis, 2014, 107: 211-223.
[15] De La Rosa J M, Faria S R, Varela M E, et al. Characterization of wildfire effects on soil organic matter using analytical pyrolysis[J]. Geoderma, 2012, 191: 24-30.
[16] Kim Y, Oh J I, Lee S S, et al. Decontamination of petroleum-contaminated soil via pyrolysis under carbon dioxide atmosphere[J]. Journal of Cleaner Production, 2019, 236: 117724.
[17] Girona-Garcia A, Badia-Villas D, Jimenez-Morillo N T, et al. Changes in soil organic matter composition after Scots pine afforestation in a native European beech forest revealed by analytical pyrolysis (Py-GC/MS)[J]. Science of the Total Environment, 2019, 691: 1155-1161.
[18] Becker J N, Dippold M A, Hemp A, et al. Ashes to ashes: Characterization of organic matter in Andosols along a 3400?m elevation transect at Mount Kilimanjaro using analytical pyrolysis[J]. Catena, 2019, 180: 271-281.
[19] 陳秋宇,吳應(yīng)琴,雷天柱,等. 基于Py-GC-MS/MS技術(shù)的高寒草原土壤有機(jī)質(zhì)不同組分指紋特征研究[J]. 生態(tài)學(xué)報(bào),2018,38(8):2864-2873.
Chen Qiuyu, Wu Yingqin, Lei Tianzhu, et al. Study on the fingerprints of soil organic components in alpine grassland based on Py-GC-MS/MS Technology[J]. Acta Ecologica Sinica, 2018, 38(8): 2864-2873. (in Chinese with English abstract)
[20] 路鵬,吳世新,戴志鋒,等. 基于電子鼻和GIS 的大型生活垃圾堆肥廠惡臭污染源測(cè)定[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(17):235-242.
Lu Peng, Wu Shixin, Dai Zhifeng, et al. Determination of odour emission at compost plant based on electronic nose and GIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(17): 235-242. (in Chinese with English abstract)
[21] Wilson A D. Review of electronic-nose technologies and algorithms to detect hazardous chemicals in the environment[J]. Procedia Technology, 2012(1): 453-463.
[22] Schnabel R M, Bounmans M L L, Smolinska A, et al. Electronic nose analysis of exhaled breath to diagnose ventilator-associated pneumonia[J]. Respiratory Medicine, 2015, 109(11): 1454-1459.
[23] 徐賽,陸華忠,周志艷,等. 基于電子鼻的果園荔枝成熟階段監(jiān)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(18):240-246.
Xu Sai, Lu Huazhong, Zhou Zhiyan, et al. Electronic nose monitoring mature stage of litchi in orchard[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(18): 240-246. (in Chinese with English abstract)
[24] Tozlu B H, Okumus H I. A new approach to automation of black tea fermentation process with electronic nose[J]. Automatika, 2018, 59(3/4): 373-381.
[25] Lavanya S, Narayanan B D S, Murthy V K, et al. Indicative extent of humic and fulvic acids in soils determined by electronic nose[J]. Computers and Electronics in Agriculture, 2017, 139: 198-203.
[26] Bieganowski A, Jaromin-Glen K, Guz L, et al. Evaluating soil moisture status using an e-nose[J]. Sensors, 2016, 16(6): 886.
[27] Zhu L T, Jia H L, Chen Y B, et al. A novel method for soil organic matter determination by using an artificial olfactory system[J]. Sensors, 2019, 19(15): 3417.
[28] 朱龍圖,李名偉,夏曉蒙,等. 基于人工嗅覺(jué)系統(tǒng)的土壤有機(jī)質(zhì)檢測(cè)方法研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2020,51(3):171-179.
Zhu Longtu, Li Mingwei, Xia Xiaomeng, et al. Soil organic matter detection method based on artificial olfactory system[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(3): 171-179. (in Chinese with English abstract)
[29] Stafilov T, Spiric Z, Glad M, et al. Study of nitrogen pollution in the Republic of North Macedonia by moss biomonitoring and Kjeldahl method[J]. Journal of Environmental Science and Health Part A-Toxic, 2020, 55(6): 759-764.
[30] Silva T E, Detmann E, Franco M O, et al. Evaluation of digestion procedures in Kjeldahl method to quantify total nitrogen in analyses applied to animal nutrition[J]. Acta Scientiarum: Animal Sciences, 2016, 38(1): 45-51.
[31] 楊越超,趙英俊,秦凱,等. 黑土養(yǎng)分含量的航空高光譜遙感預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(20):94-101.
Yang Yuechao, Zhao Yingjun, Qin Kai, et al. Prediction of black soil nutrient content based on airborne hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(20): 94-101. (in Chinese with English abstract)
[32] 于雷,洪永勝,周勇,等. 高光譜估算土壤有機(jī)質(zhì)含量的波長(zhǎng)變量篩選方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(13):95-102.
Yu Lei, Hong Yongsheng, Zhou Yong, et al. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(13): 95-102. (in Chinese with English abstract)
Method for detecting soil total nitrogen content and characteristic optimization based on pyrolysis and electronic nose
Li Mingwei, Xia Xiaomeng, Zhu Qinghui, Liu He, Huang Dongyan※, Wang Gang
(1.,,130022,; 2.,,,130022,)
Soil nitrogen as an essential nutrient element is one of the most important indexes to measure soil fertility for crop growth and development. In this research, a new detection was proposed to quickly accurately determine the soil total nitrogen (STN) content using pyrolysis and electronic nose. Ten types of gas sensors were used to construct the sensor arrays. A response test was carried out under the different concentrations of methane, vinyl chloride, and ammonia standard gas. The test results showed that there were significant differences in responses of the sensor array to the types and the concentration, where the response intensity increased with the increase of the standard gas concentration. The sensor array also presented a high specificity and cross-sensitivity during data detection. Furthermore, the pyrolysis gas was obtained from the soil samples using the muffle furnace, further to detect the response curve using the gas sensor array. After that, a 121×10×7 feature space (121 soil samples, 10 number of sensors, and 7 eigenvalues) was constructed to extract the mean (mean), variance (vav), the maximum gradient (mgv), the maximum (max), response area (rav), the eighth of the second transient (8), and mean differential coefficient (mdc) of the response curve. A genetic algorithm and neural network model (GA-BP) feature optimization was used to reduce the eigenvalue to 33 dimensions, forming a new feature space of 121×33. More importantly, there was no redundant effect of the constructed sensor array on the new detection. Specifically, the sensors of TGS826, TGS2603, TGS2611, and TGS2600 contributed the most to the construction of the new feature space. Themean,mgv,rav,8andmdcwere the important features to represent the internal relationship between the detection and STN content. The prediction model of feature space and STN content was then established using a back propagation neural network (BPNN), partial least squares regression (PLSR), and a combination of a back propagation neural network and partial least squares regression (PLSR-BPNN). The coefficient of determination (2), root mean square error (RMSE), and residual prediction deviation (RPD) were used as the indicators of the model. As such, the2of PLSR, BPNN and PLSR-BPNN models were 0.91, 0.81, and 0.93, respectively, where the RMSE were 0.25, 0.37, and 0.22, while the RPD were 3.24, 2.19, and 3.79, respectively. The predicted performance of the test sets demonstrated that the2values of the three models were all greater than 0.81, and the RMSE<0.37, indicating that all the models presented the better prediction ability of STN content. However, both PLSR and PLSR-BPNN models presented a much better ability of quantitative prediction than that of the BPNN, from the perspective of RPD indicators. The2of the PLSR-BPNN model increased by 2.90%, the RPD increased by 16.94%, and the RMSE was reduced by 14.48%, compared with the PLSR model. Therefore, the PLSR-BPNN prediction model can be expected to effectively improve the prediction accuracy of the PLSR model for the better generalization ability of the BPNN model, indicating a reliable relationship model for the STN measurement. The reason was that there was a certain degree of linear and nonlinear correlation between the STN content and characteristic space of the electronic nose. The PLSR-BPNN model greatly contributed to the strength of the nonlinear and linear relationship between the PLSR and BPNN model. Consequently, a more accurate PLSR-BPNN model was established to accurately predict the STN content. There was also a high correlation between the soil pyrolysis gas and STN content.
soil; total nitrogen; sensor; pyrolysis; electronic nose; feature optimization; pattern recognition
2021-10-29
2021-12-08
吉林省科技發(fā)展計(jì)劃項(xiàng)目(20200502007NC)
李名偉,博士生,研究方向?yàn)檗r(nóng)業(yè)機(jī)械自動(dòng)化。Email:lmw271314@163.com
黃東巖,教授,博士生導(dǎo)師,研究方向?yàn)楸Wo(hù)性耕作技術(shù)及其智能農(nóng)機(jī)裝備。Email:cchdy760829@sina.com
10.11975/j.issn.1002-6819.2021.24.009
S158.2;TP212.9
A
1002-6819(2021)-24-0073-12
李名偉,夏曉蒙,朱慶輝,等. 基于熱裂解和電子鼻的土壤全氮檢測(cè)方法及特征優(yōu)化[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(24):73-84. doi:10.11975/j.issn.1002-6819.2021.24.009 http://www.tcsae.org
Li Mingwei, Xia Xiaomeng, Zhu Qinghui, et al. Method for detecting soil total nitrogen content and characteristic optimization based on pyrolysis and electronic nose[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(24): 73-84. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.24.009 http://www.tcsae.org