国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于不同建模方法的土壤pH值無人機遙感影像反演

2022-07-29 07:04:14丁鳴鳴邵光成
江蘇農業(yè)科學 2022年14期
關鍵詞:共線性回歸系數(shù)反射率

王 羿, 丁鳴鳴, 何 菁, 邵光成

(1.河海大學農業(yè)科學與工程學院,江蘇南京 210098; 2.南京市水務局,江蘇南京 210036;3.南京市水利建筑工程檢測中心有限公司,江蘇南京 210036)

土壤酸堿性是判斷作物生長和預測作物產量的重要因素,土壤酸性或堿性物質的輸入會導致土壤理化性質的改變,從而影響土壤肥力,對作物生長發(fā)育產生抑制作用。同時土壤pH值與土壤養(yǎng)分的轉化息息相關,土壤過酸或過堿都會導致其物理化學性質變差,造成土壤和植物的抗逆性減弱,抵御旱澇等自然災害能力下降,生產能力降低。因此,及時、有效、準確、大面積的土壤pH值估算對于精準農業(yè)的實施有著很重要的意義。傳統(tǒng)的土壤酸堿度一般采用化學分析法測定,這種方法雖然可以準確反映農田中土壤酸堿度的狀況,但其時效性差,由于樣本量限制,很難大尺度評估土壤酸堿度問題。搭載多光譜傳感器的無人機不僅能夠實現(xiàn)大規(guī)模、大數(shù)據(jù)采集,且其低成本,高時效、非接觸的優(yōu)勢為獲取土壤理化指標指導農業(yè)生產提出有效解決對策。在搭建好光譜分析模型后,無人機只需采集光譜,即可對當?shù)赝寥纏H值進行定性定量分析預測。目前,通過光譜反演土壤理化指標已成為一種可靠并有效的方法,并取得了一定的進展,但不同預測算法反演模型精度和適用條件也各不相同。國內外學者已從反演模型的選擇、光譜數(shù)據(jù)預處理構建光譜指數(shù)等多個角度對土壤理化指標開展大量研究,以期能夠提高模型的預測精度和適用性?;诙喙庾V反演的方法主要有統(tǒng)計分析和機器學習2種類型,統(tǒng)計分析是利用土壤理化指標與光譜數(shù)據(jù)的相關關系建立回歸模型,主要方法有多元線性回歸(MLR)、偏最小二乘法回歸(PLSR)等,機器學習是通過訓練樣本建立光譜數(shù)據(jù)與土壤指標關系模型,包括BP神經網(wǎng)絡(BPNN)、支持向量機(SVR)、隨機森林(RF)等算法。陳思明等采用多元逐步線性回歸(MLSR)、BP神經網(wǎng)絡(BPNN)和支持向量機(SVM)3種方法對濕地土壤有機質含量進行多光譜反演,通過引入最佳指數(shù)(OIF指數(shù))法提取敏感波段,最終采用支持向量機(SVM)建模方法將確定系數(shù)提高0.124,降低0.106,模型精度得到提高。王凱龍等比較主成分回歸(PCA)、偏最小二乘回歸(PLSR)以及BP神經網(wǎng)絡模型(BPNN)對土壤pH值的反演精度,發(fā)現(xiàn)采用PCA與PLSR方法獲得的主成分作為BP神經網(wǎng)絡輸入變量的建模方法能夠明顯提高模型的精度與預測能力。趙靜等分別采用普通克里格法、多元線性回歸克里格法、遙感反演方法以及地理加權回歸克里格法預測寧夏回族自治區(qū)石嘴山市城市土壤有機碳的空間分布,將地理要素加入到預測算法中,為多光譜遙感反演的普適性提供依據(jù)。上述研究通過不同反演方法或改進算法均提高了不同指標的模型預測精度,但對于最適宜土壤pH值的反演模型研究尚少,且對于光譜變量之間共線性問題并未討論。因此,以江蘇省南京市江寧區(qū)淳化街道農田的60個樣本作為研究對象,分別采用多元逐步線性回歸(MLSR)、BP神經網(wǎng)絡模型(BPNN)、LASSO回歸對于土壤pH值進行多光譜反演,對3種模型精度及適用條件進行評價,以期尋找出最適宜土壤pH值的反演模型,為快速準確土壤pH值指標反演提供理論依據(jù)。

1 材料與方法

1.1 研究區(qū)概況

研究區(qū)位于江蘇省南京市江寧區(qū)淳化街道前橋頭村農田(中心坐標為31°54′N、119°4′E),研究區(qū)為亞熱帶季風氣候,全年平均氣溫15 ℃,降水量1 069 mm,無霜期233 d。土壤質地為黏棕土,土壤pH值總體呈中性。研究區(qū)面積約為6 000 m,地形南高北低、西高東低。

1.2 土壤樣本的采集和處理

樣本采集于2021年4月29日,經前期采用無人機調查后,選取1塊未種植作物的田塊作為研究區(qū),無人機采集時間為11:00—14:00,并在研究區(qū)開展同步樣本采集,隨機采集60份土壤樣本,樣本分布均勻覆蓋整個研究區(qū)域,采集過程中全程同步采用GARMIN品牌的eTrex 221x的GPS記錄樣本位置信息,為提高定位精度,同一點位置信息記錄 3~5次,取平均值作為最終結果,每個點位采集土壤表層(0~30 cm)土壤樣本約50 g。收集的土壤樣本采用密封袋封裝,帶回實驗室后剔除雜物和石塊,將樣本自然風干,過1 mm篩,取10 g土壤樣本按照水土比為2.5 ∶1配制土壤浸提液,振蕩 30 min 后靜置180 min,采用電極法測定土壤pH值,將電極插入試樣懸濁液中,待數(shù)值穩(wěn)定后讀取記錄土壤溶液pH值,樣本pH值分布基本情況見表1。

表1 土壤pH值含量統(tǒng)計特征

1.3 多光譜數(shù)據(jù)獲取

飛行前規(guī)劃航線飛行任務,拍攝圖像為正射影像(相機垂直于地面),試驗當天天氣晴朗無云。本試驗采用大疆精靈4多光譜無人機,為提高定位精度,采用網(wǎng)絡實時差分定位(RTK)輔助定位,可將定位精度提升到水平方向±0.1 m、垂直方向±0.1 m(表2)。

表2 飛行平臺及傳感器主要性能參數(shù)

1.4 數(shù)據(jù)預處理

多光譜影像數(shù)據(jù)導出后采用Agisoft PhotoScan軟件對6個波段圖像進行拼接校正,地理參考坐標系統(tǒng)采用WGS84,得到研究區(qū)拼接圖像后,由于各波段之間位置信息存在誤差,需要進行地理配準消除各波段地理誤差,將波段圖像地理對齊。采用ENVI5.3對各波段影像進行地理配準后進行圖層疊加,對疊加好的影像進行輻射定標,計算出環(huán)境入射光照度,后采用FLASSH大氣校正模型對各波段光譜進行大氣校正,消除大氣和光照對土壤反射率的影響,將各波傳感器記錄的DN值轉換為反射率信息。根據(jù)土壤取樣點的GPS位置信息構建感興趣區(qū),以感興趣區(qū)范圍內地物的光譜平均反射率作為該取樣點土壤表層光譜反射率,得到60個土壤樣本對應的5個波段光譜信息。采用SPSS 26、Matlab 17a進行建模分析,Origin 2018進行圖形繪制,ENVI 5.3進行反演制圖。

2 模型的構建與評價

2.1 LASSO回歸算法

套索(LASSO)算法由Robert Tibshirani于1996年首次提出,是一種從最小二乘法原理出發(fā)的收縮估計方法。它通過構造1個懲罰函數(shù)得到1個較精煉的模型,使得它壓縮一些回歸系數(shù),即通過限制回歸系數(shù)絕對值之和小于某個常數(shù)的約束條件,使殘差和平方最小化,從而提高模型精度,因此保留了子集收縮的優(yōu)點,是一種處理具有復共線性數(shù)據(jù)的有偏估計。使用懲罰值越大,進一步估計會使縮小值越趨近于0。通過調整懲罰值,可將系數(shù)矩陣整體變小,起到特征選擇的作用。LASSO估計為

式中:表示懲罰值;表示響應變量(因變量);表示數(shù)據(jù)樣本自變量;為回歸系數(shù)。

2.2 BP神經網(wǎng)絡模型(BPNN)

BP神經網(wǎng)絡模型通過模擬人腦學習的過程,能夠學習和存儲大量的輸入-輸出模式映射關系,訓練過程是由信號的正向傳播與誤差的反向傳播共同組成的,最終使輸出模型的誤差平方和最小,建立土壤pH值與多光譜反射率動態(tài)模型。

2.3 多元逐步線性回歸(MLSR)

多元逐步線性回歸是反演模型中經常使用的一種預測模型的方法,是將多個波段光譜反射率作為自變量,多波段進行最優(yōu)組合共同預測或估計土壤屬性的線性建模方法。即建立土壤pH值與多個波段光譜反射率之間的回歸模型,多元線性回歸為

=+++…+-1-1+。

式中:表示土壤pH值;表示對應波段光譜反射率,=1,2,3,…,-1,本研究-1=5;表示回歸系數(shù);表示隨機誤差項。

本研究分別將土壤pH值作為因變量,將5個多光譜波段反射率作為自變量進行多元逐步線性回歸分析,即逐步回歸事先設定光譜波段反射率進入、剔除的標準,按照自變量對因變量作用的顯著程度,由大到小逐個引入模型,對于因變量不顯著的變量也可能不引入回歸模型,每向模型引入1個新的變量,同時考察原來在模型中的自變量是否還存在統(tǒng)計學意義,直至回歸模型中只存在對因變量影響顯著的自變量,回歸結束,最后所得模型即為最優(yōu)回歸模型。

2.4 模型驗證與評價

模型檢驗通過確定系數(shù)、均方根誤差、值、方差膨脹因子(VIF)進行模型的評價,并討論各模型的適用性,最終選取最適宜土壤pH值的反演建模方法。其中,反映因變量的全部變異能夠通過回歸關系被自變量解釋的比例,越接近于1,表明回歸關系越穩(wěn)定,模型精度越高。為回歸系統(tǒng)的擬合標準差,是衡量預測值與實測值參數(shù),E越小,表明實測值與真實值誤差越小,預測效果越好。檢驗為聯(lián)合假設檢驗,值越大,表明模型越顯著,擬合程度越好,當置信區(qū)間為95%,對應值<0.05時,可以認為組間存在顯著差異,假設成立。方差膨脹因子VIF是衡量共線性問題的指標,范立新等認為,≥5或≥10時,可認為自變量間存在嚴重的共線性,模型自變量間存在重疊部分,VIF過大,會使模型對于普遍性解釋不足,實際應用存在問題。

3 結果與分析

3.1 多元逐步線性回歸(MLSR)分析

以多光譜反射率作為自變量,土壤pH值為因變量,采用多元逐步線性回歸方法進行建模。由表3可知,基于全波段模型的明顯高于單波段或組合敏感波段模型的,回歸模型的與多光譜反射率輸入量成正比,表明土壤pH值與5個波段均存在相關關系,值均小于0.05,表明自變量參數(shù)模型獨立性較強。由表4可知,各波段VIF均大于10,表明各波段間均存在共線性問題,且0.65、0.73 μm 波段VIF遠遠大于其他波段,存在嚴重共線性問題。

表3 MLSR模型中各參數(shù)值

表4 MLSR共線性分析結果

多元逐步回歸模型為

=-19807+28451+85256-187374+95802+4202。

式中:表示土壤pH值;分別表示0.45、0.56、0.65、0.73、0.84 μm波段光譜反射率。

3.2 BP神經網(wǎng)絡模型分析

以全波段反射率為自變量,土壤pH值為因變量,45組數(shù)據(jù)作為樣本,其中80%數(shù)據(jù)作為訓練集,10%作為驗證集,驗證集目的是衡量網(wǎng)絡泛化,決定網(wǎng)絡是否終止訓練,10%作為測試集,選取2層BP神經網(wǎng)絡,設置隱含層節(jié)點函數(shù)為sigmoid,輸出層節(jié)點函數(shù)為線性,經過反復測試,最終設定5個隱層神經元,選用Levenberg-Marquardt訓練算法。訓練模型見圖1。

經過反復訓練得到BPNN模型,輸出土壤pH值預測值與實測值, 由圖2可知, 經過15次迭代后模型收斂,其中,第9次訓練結果精度最高,=0.896,=0.314,訓練模型內部達到最優(yōu)。將訓練結果應用到外部驗證集時=0.704,=0.351,表明模型應用精度不夠理想。

3.3 LASSO回歸模型分析

LASSO回歸模型通過設定懲罰值,降低自變量維度來解決模型共線性問題,懲罰值越接近0,模型結果接近多元線性回歸,采用ERIC準則進行驗證,LASSO回歸結果表明,懲罰值設定越小,回歸系數(shù)越大,模型越大,越小,模型精度越高,但懲罰值設定太小不能解決自變量共線性問題,需要通過調整懲罰值大小來平衡模型精度與共線性問題,壓縮模型回歸系數(shù),使參數(shù)更符合實際情況。

本研究分別設置懲罰值為0.01、0.015、0.019進行建模,建模結果見圖3、表5。使模型既滿足精度又解決共線性問題,增大懲罰值將回歸系數(shù)不斷壓縮,盡可能減少自變量共線問題,并保證、參數(shù)在精度范圍。經過測試,最終選擇設定懲罰值為0.019時的結果作為LASSO回歸最終模型,該模型將0.65 μm紅光波段回歸系數(shù)壓縮到0,其他回歸系數(shù)進一步壓縮,可以很好地解決自變量間的共線性問題。

表5 LASSO模型匯總

3.4 結果與分析

綜上述分析可知,單從和等2個角度對模型精度進行評價不能滿足模型實際應用的要求,實際應用存在問題。采用BPNN方法構建的模型在驗證時,由于模型解釋變異性不足,導致模型應用中變化過大(圖4-d)。MLSR模型與均表現(xiàn)較平穩(wěn),但由于0.65、0.73 μm波段的回歸系數(shù)遠大于其他變量回歸系數(shù),會導致模型穩(wěn)定性不足,易受到2個波段影響,且在實際應用中出現(xiàn)不符合實際情況的表現(xiàn),因此不選用MLSR與BPNN方法構建的模型。LASSO回歸方法構建模型可以消除MLSR模型回歸系數(shù)相差較大以及BPNN模型訓練集不足的問題,最終選用LASSO回歸模型進行反演及制圖,采用決策樹對土壤pH值分布進行分類(3種建模方法比較結果見表6及圖4,經決策樹分類統(tǒng)計后,分類統(tǒng)計結果見圖5,土壤pH值反演及決策樹分類圖見圖6)。夏子書等認為,土壤養(yǎng)分有效性的最高值大多出現(xiàn)在土壤pH值6.5~7.5之間,經過分類統(tǒng)計,研究區(qū)92.5%土壤的pH值分布在6.5~7.5,0.064%土壤的pH值分布在7.5~8.0之間,其余土壤pH值分布均小于0.05%(圖5),說明研究區(qū)土壤pH值較均勻,適宜作物生長。反演效果符合實際情況,未出現(xiàn)異常點,表明基于該方法進行土壤pH值的反演準確可行。

表6 建模方法比較

4 討論與結論

研究結果表明,土壤pH值與0.45 μm藍光波段、0.73 μm紅邊波段呈負相關,且與0.73 μm紅邊波段相關性最大,其余波段與土壤pH值為正相關關系。3種建模方法的均在0.6之上,表明土壤pH值與0.45、0.56、0.65、0.73、0.84 μm等5個波段存在相關關系,這與王凱龍等的研究結果相同。

采用MLSR、BPNN、LASSO回歸3種建模方法對土壤pH值進行預測, 發(fā)現(xiàn)多元逐步線性回歸模型=0.776,=0.432,從數(shù)學模型角度達到不錯精度,但由于多光譜自變量之間存在嚴重的共線性問題,0.65、0.73 μm波段的VIF分別為822.821、1 213.727,遠遠大于其他波段值,因此存在嚴重共線性問題,波段間存在數(shù)據(jù)重疊,回歸模型的估計值極不穩(wěn)定,對自變量的變化非常敏感,這是由于研究區(qū)下墊面為農田,導致下墊面屬性較單一,建模集差異性較小,過于均勻的土壤對作物生長有利,但對模型構建不利,這也是模型對土壤pH值差異較大的區(qū)域解釋性不足等問題的原因,因此采用MLSR構建的模型無法應用到實際中。神經網(wǎng)絡模型的=0.896,=0.314,訓練模型的精度是所述模型中最好的,但將模型應用到訓練集以外的15組數(shù)據(jù)中進行驗證時,模型的=0.704,該值的降幅為0.192,大于其他2個模型,說明訓練集數(shù)據(jù)量不足以解釋該模型的變異,也表明神經網(wǎng)絡對局部的擬合能達到最優(yōu),這與齊琳的研究結果一致,如需將模型應用到實際中,還需對8模型進行大量的數(shù)據(jù)訓練,提高模型對變異的解釋能力。LASSO回歸算法通過調整懲罰值將共線性強自變量回歸系數(shù)進行壓縮或去除以解決模型的共線性問題,最終模型=0.618、=0.430,將0.65 μm波段回歸系數(shù)壓縮到0,0.73 μm波段回歸系數(shù)從-187.374壓縮到-48.058,并保證模型的預測精度。綜上,對應懲罰值為0.019下的LASSO回歸模型為該區(qū)域最適宜土壤pH值反演的模型。

土壤pH值與0.45、0.73 μm波段光譜反射率呈負相關,與0.56、0.65、0.84 μm波段光譜反射率呈正相關。5個波段MLSR建模方法=0.776,=0.432,但土壤光譜反射率0.45~0.84 μm波段間VIF均大于10,存在多元共線性問題,0.65、0.73 μm 波段VIF分別為822.821、1 213.727,與其他波段存在嚴重的共線性問題,該模型對土壤pH值解釋性不足。BPNN模型建模集預測精度最高,(建模集)=0.896,(建模集)=0.314,但將模型應用到驗證集數(shù)據(jù)時(驗證集)=0.704,相較于其他2種建模方法,降幅偏大,BPNN建模方法能達到局部最優(yōu),但由于樣本量限制,模型解釋變異性不足,還需經過大量數(shù)據(jù)訓練。LASSO回歸方法=0.618,=0.430,回歸系數(shù)將MLSR模型回歸系數(shù)整體壓縮,將0.65 μm波段回歸系數(shù)壓縮為0,0.73 μm波段回歸系數(shù)從-187.374壓縮到-48.058,壓縮系數(shù)同時保證建模精度,LASSO回歸模型為該區(qū)域土壤pH值與多光譜最適宜的建模方法。經過預測,研究區(qū)92.6%的土壤pH值分布在6.5~7.5之間,土壤pH值較均勻,適宜作物生長。

猜你喜歡
共線性回歸系數(shù)反射率
影響Mini LED板油墨層反射率的因素
近岸水體異源遙感反射率產品的融合方法研究
海洋通報(2022年4期)2022-10-10 07:40:26
具有顏色恒常性的光譜反射率重建
銀行不良貸款額影響因素分析
科學與財富(2021年3期)2021-03-08 10:56:02
文氏圖在計量統(tǒng)計類課程教學中的應用
——以多重共線性內容為例
不完全多重共線性定義存在的問題及其修正建議
多元線性回歸的估值漂移及其判定方法
電導法協(xié)同Logistic方程進行6種蘋果砧木抗寒性的比較
化學腐蝕硅表面結構反射率影響因素的研究*
電子器件(2017年2期)2017-04-25 08:58:37
多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
枞阳县| 佛山市| 安平县| 温州市| 伊金霍洛旗| 讷河市| 五家渠市| 盐池县| 永平县| 鄂托克前旗| 惠水县| 南和县| 永泰县| 滕州市| 内黄县| 贺兰县| 昆山市| 临江市| 巴彦淖尔市| 朝阳市| 碌曲县| 泸西县| 广汉市| 衡阳县| 孙吴县| 达日县| 济阳县| 鸡西市| 奉节县| 馆陶县| 博白县| 灯塔市| 湄潭县| 高青县| 大竹县| 山阴县| 卢湾区| 东明县| 青田县| 通州市| 化隆|