白青華,殷雪蓮,2,王 靜,張 潔,褚 超,李學軍
(1甘肅省張掖市氣象局,甘肅張掖 734000;2張掖國家氣候觀象臺,甘肅張掖 734000)
日光溫室是北方地區(qū)進行反季節(jié)蔬菜生產(chǎn)的主要設施,日光溫室主要熱量來源是太陽能,通常以不加溫的方式進行蔬菜等作物的栽培,因此室內(nèi)的溫度環(huán)境受當?shù)氐奶鞖鈿夂驐l件影響較大。地處河西走廊中部地區(qū)的甘肅省甘州區(qū)冬季低溫期天氣寒冷,日光溫室低溫凍害時有發(fā)生,是制約當?shù)囟驹O施農(nóng)業(yè)發(fā)展的主要因素之一。農(nóng)業(yè)氣象服務部門具有室內(nèi)外氣象觀測資料的積累,因此根據(jù)室內(nèi)外氣象要素研究探索當?shù)厝展鉁厥业蜏仡A測模型在溫室低溫災害防御中有重要的現(xiàn)實意義。
日光溫室內(nèi)外環(huán)境要素相互關系的研究已有不少,根據(jù)環(huán)境氣象要素采用統(tǒng)計分析法進行預測模擬日光溫室內(nèi)溫度等環(huán)境要素,回歸線性建模是較為常用的一種方法[1],張磊等[2]分析了寧南山區(qū)日光溫室內(nèi)、外的最低氣溫的變化關系,建立了溫室內(nèi)最低氣溫的線性回歸模型;戴明晶[3]建立了4種不同天氣情況下日光溫室低溫預報的線性回歸模型。關于溫室低溫預測的多元線性回歸分析模型,忽略了線性回歸分析中自變量存在的多重共線性對模型穩(wěn)定性的影響。多重共線性使參數(shù)的最小二乘方差很大,各回歸系數(shù)的符號可能出現(xiàn)錯誤的現(xiàn)象,其系數(shù)對樣本數(shù)據(jù)的微小變化可能變得敏感[4]。處理共線性的方法常有主成分回歸、嶺回歸、神經(jīng)網(wǎng)絡模擬法等,李寧等[5]應用主成分回歸分析的方法,建立了日光溫室內(nèi)最低溫度預報模型;金志鳳等[6]構建了BP 神經(jīng)網(wǎng)絡模型,進行了楊梅大棚內(nèi)氣溫預測。關于嶺回歸分析模型在日光溫室低溫預測中的應用目前還未見報道,嶺回歸是一種專用于共線性數(shù)據(jù)分析的有偏估計回歸方法,本研究在選取預測因子進行共線性診斷的基礎上,首次應用嶺回歸分析的方法構建日光溫室低溫預測模型,探索嶺回歸模型在日光溫室低溫預測中的模擬效果,創(chuàng)新日光溫室低溫環(huán)境要素模擬方法,同時為當?shù)亻_展溫室低溫預測和服務提供依據(jù)。
觀測溫室位于甘肅省甘州區(qū)黨寨鎮(zhèn)(100.29° E,38.53°N)內(nèi),當?shù)貧鉁刈畹驮路轂?2月和次年1月,歷年平均氣溫分別為-7.3、-9.1℃。日光溫室坐北朝南,東西長80 m,跨度9 m,溫室墻體為夯土墻體,溫室前屋面采用聚氯乙烯薄膜覆蓋,棚膜外覆蓋保溫被,根據(jù)天氣情況每日早晚揭蓋保溫被,溫室頂部設置通風口,冬季根據(jù)溫室內(nèi)溫度狀況一般午間進行通風。溫室內(nèi)種植作物為茄子。
溫室內(nèi)環(huán)境要素數(shù)據(jù)采集應用富景天策(北京)氣象科技有限公司的“智慧園丁”設施農(nóng)業(yè)監(jiān)控系統(tǒng),型號為SSR-ZGB-003。監(jiān)測系統(tǒng)安裝于溫室中部,室內(nèi)溫度為距地面1.5 m處的溫度,日光溫室外的溫度等數(shù)據(jù)資料來自張掖市氣象局甘州區(qū)氣象觀測數(shù)據(jù)資料。
選取2019年12月—2020年1月的數(shù)據(jù)資料中的9個氣象要素作自變量,溫室內(nèi)最低溫度作因變量,首先在進行自變量間的相關分析和多重共線性診斷的基礎上,應用嶺回歸分析的方法建立日光溫室低溫預測的回歸模型。利用2018 年12 月—2019 年1 月的實測數(shù)據(jù)資料與模型預測值進行模型精度檢驗。
1.2.1 預測因子的選取 選取2019 年12 月—2020 年1月當?shù)刈罾湓路莸臍庀筚Y料,通過相關分析選取與溫室內(nèi)低溫顯著相關的氣象觀測要素作為預測因子,包括室外最高氣溫(TMax)、最低氣溫(TMin),前1日的室外平均氣溫(TMean-1)、最高氣溫(TMax-1)和最低氣溫(TMin-1)以及前1 日的溫室內(nèi)的最高溫度(Tmax-1)、最低溫度(Tmin-1)和平均溫度(Tmean-1)。天氣狀況影響溫室接受的輻射量,影響溫室內(nèi)溫度[7],為了區(qū)分室外天氣狀況,同時將總云量(N)也選作預測因子。
1.2.2 多重共線性診斷 多元線性回歸分析中,由于多個自變量間相互作用和影響,往往存在共線性關系。所謂共線性,是指2 個或多個自變量間存在高度相關關系。共線性造成的主要后果是自變量對預測變量的估計不可靠,因此多元線性回歸分析中有必要進行共線性診斷。自變量間的相關系數(shù)矩陣可作為多重共線性的初步判斷依據(jù),再結合容忍度(TOL)和方差膨脹因子(VIF)作為診斷多個自變量間共線性的嚴重程度[8]。當自變量容忍度(TOL)小于0.1,方差膨脹因子(VIF)大于5(或大于10)時,表明自變量間存在嚴重的多重共線性。
1.2.3 嶺回歸模型的建立 嶺回歸,又稱脊回歸,是對不適定問題進行回歸分析時經(jīng)常使用的一種正則化方法,是對最小二乘回歸的一種補充,嶺回歸通過損失無偏性來換取高的數(shù)值穩(wěn)定性,從而得到較高的計算精度。根據(jù)已選定的預測因子組成觀測陣X和日光溫室低溫觀測向量Y,當自變量存在共線性時,即∣XTX∣≈0,假設XTX加一個正常數(shù)矩陣kI(k>0,I為單位矩陣)[9],得到嶺回歸的估計量如式(1)所示。
將式中y的各分量作為k的函數(shù),當k在[0,+∞]變化時,在平面直角坐標系繪出嶺跡圖[10]。嶺跡圖可直觀體現(xiàn)出各自變量因子對變量的相互作用關系,根據(jù)嶺跡圖得到各預測因子的系數(shù)后建立嶺回歸模型。
1.2.4 預測模型檢驗 通過模型預測值與實測值的比較進行模型的應用精度檢驗,本研究采用了3 個評價指標:預測值與實測值的絕對誤差(≤3℃)的準確率[1]和決定系數(shù)(R2)、均方根誤差(RMSE)[11],R2越接近1,表明模型吻合度越高,RMSE越小,表明模型偏差越小。
1.2.5 數(shù)據(jù)處理 采用DPS9.05數(shù)據(jù)處理系統(tǒng)進行共線性診斷和嶺回歸分析等數(shù)據(jù)處理,運用相關分析和多元線性回歸等統(tǒng)計方法進行數(shù)據(jù)分析。
日光溫室內(nèi)部最低氣溫除與室外大氣環(huán)境的溫度有關外,根據(jù)溫室溫度的日變化[12]可知,溫室的最低氣溫出現(xiàn)于清晨揭簾前,主要受到前一日氣象因子的影響,日光溫室的基礎氣溫對次日揭簾前的溫度具有決定性作用。因此選取當日室外最高、最低氣溫(TMax、TMin)的同時,選取了前1日溫室最高、最低和平均溫度(Tmax-1、Tmin-1、Tmean-1)以及前1日室外平均、最高和最低氣溫(TMean-1、TMax-1、TMin-1)作為預測因子。由表1可見,當天最高、最低氣溫(TMax、TMin)與溫室內(nèi)日最低氣溫(Tmin)極顯著相關,以當天最低氣溫對溫室最低氣溫(Tmin)影響最為明顯,溫室的基礎氣溫(包含Tmax-1、Tmin-1、Tmean-1)和決定溫室基礎氣溫的室外溫度(TMean-1、TMax-1、TMin-1)對溫室低溫(Tmin)的影響也表現(xiàn)出顯著的正效應。天氣狀況影響溫室接受的太陽輻射量,影響溫室內(nèi)溫度[7],通過表1分析,當日總云量(N)與溫室最低氣溫(Tmin)也有一定程度的相關性,將總云量(N)也作為預測因子,區(qū)分室外天氣狀況同時,提高預測模型的穩(wěn)定性。
表1 日光溫室低溫及預測因子間的相關系數(shù)
從表1溫室低溫(Tmin)與各預測氣象因子的相關性分析表明,可以對日光溫室最低氣溫用這些預測因子作為自變量進行多元線性回歸建模預測。表1還顯示出各預測因子之間存在不同程度的相關性,推斷所選預測因子之間存在多重共線性問題。
進一步將上述多個預測因子作自變量,溫室低溫(Tmin)作因變量建立多元線性回歸方程,進行多重共線性診斷。表2顯示了用最小二乘法構建溫室最低氣溫(Tmin)的回歸方程參數(shù)估計及預測因子的共線性統(tǒng)計量。檢驗結果顯示回歸方程的R2=0.9302,預測因子TMax、N、TMean-1、TMax-1、TMin-1、Tmax-1、Tmin-1的偏回歸系數(shù)均未通過統(tǒng)計學檢驗,其對日光溫室低溫的作用在α=0.05水平上不顯著,不具備統(tǒng)計學意義。自變量TMax、N、TMax-1、TMin-1的偏回歸系數(shù)符號為負值,與相關分析的結果不一致。結合共線性統(tǒng)計量亦看出,TMean-1、TMax-1、TMin-1、Tmin-1的容忍度小于0.1,方差膨脹因子(VIF)均大于10。綜合上述分析,選取的預測因子間存在較強的多重共線性問題,可采用嶺回歸分析方法建立模型。
表2 最小二乘多元線性回歸參數(shù)估計及共線性統(tǒng)計量
將所選9個預測因子和溫室低溫(Tmin)用DPS軟件做嶺回歸分析,以嶺參數(shù)k為橫軸,以各預測因子的標準回歸系數(shù)估計值為縱軸,得到關于k的嶺跡圖[13-14]。由圖1可看出,當k值從0變化到1時,各溫室低溫預測因子的標準回歸系數(shù)均隨嶺參數(shù)k的增大而趨于穩(wěn)定。在嶺跡圖上,當k=0.2時,各預測因子的回歸系數(shù)開始趨于穩(wěn)定,取嶺參數(shù)為0.2時的模型標準化組合作為日光溫室低溫(Tmin)的預測模型,如式(2)所示。
圖1 嶺回歸分析的嶺跡圖
該預測模型R2=0.9105,略小于最小二乘模型,F(xiàn)=22.5976,P=0.0001 高度顯著,擬合效果較好。嶺回歸模型中各預測因子的回歸系數(shù)的符號均為正值,這與相關分析的實際情況吻合,各預測變量的系數(shù)較為合理。表明當預測因子變量存在共線性時,應用嶺回歸分析的方法建立的模型能夠克服共線性的影響,同時保留全面的預測因子信息,保證了模型的穩(wěn)定性,能更有效準確地對日光溫室低溫進行分析預測。將標準化方程轉化得到日光溫室低溫的最終預測模型,如式(3)所示。
為了驗證模型的實際應用效果,選擇未參與建模的2018 年12 月—2019 年1 月溫室內(nèi)外氣象要素觀測資料進行驗證,構建模型的資料不參與驗證。圖2 通過日光溫室低溫模型預測值與實測值比較可看出,當?shù)赜^測溫室最低溫度約從12月20日后開始下降,至次年1月10日溫室低溫總體維持較低水平,之后溫室低溫開始回升,模型預測值與實測值二者變化趨勢趨于一致。通過比較模型預測值與實測值的絕對誤差[1],小于1、2、3℃的準確率(≤1℃、≤2℃、≤3℃)分別為87.1%,95.2%,98.4%。進一步結合圖3 可看出模型預測值與實測值之間存在較好的線性擬合關系,通過計算預測值與實測值間R2為0.8543,RMSE為0.7849℃。綜上,嶺回歸預測模型應用檢驗效果良好,模型準確度較高,可以應用于當?shù)厝展鉁厥业牡蜏仡A測。
圖2 日光溫室低溫預測值與實測值比較
圖3 日光溫室最低氣溫的預測值與實測值線性關系
(1)應用嶺回歸分析的方法構建日光溫室低溫預測模型是可行的。日光溫室內(nèi)外環(huán)境要素之間大多相互作用、相互影響,本研究篩選的日光溫室預測因子間存在較嚴重的共線性問題,嶺回歸法處理自變量間的共線性效果較好[15],應用嶺回歸構建的日光溫室低溫預測模型全面保留了自變量信息,使模型的穩(wěn)定性更好,模型通過了統(tǒng)計學檢驗,并進行實際驗證后準確率高,預測值與實測值之間擬合度高,模型偏差小,精度較高,適于當?shù)赝愋腿展鉁厥议_展低溫預測。
(2)針對不同類型的預測模型,模型構建方法的選擇十分重要,當自變量間存在多種共線性時直接利用普通最小二乘法構建的日光溫室低溫預測模型,使一些自變量回歸系數(shù)的符號正負號倒置,無法通過統(tǒng)計顯著性檢驗,降低了回歸模型的應用價值。嶺回歸分析是一種專門用于共線性數(shù)據(jù)分析的有偏估計方法[16],嶺回歸使得回歸系數(shù)的符號趨于合理,更符合實際,這一點在本研究中也得到了驗證。嶺回歸模型在構建過程中嶺參數(shù)k的取值具有主觀靈活性,對模型的影響較為關鍵[9],但這種人為機動性有利于發(fā)揮定性與定量的有機結合[16],只要嶺參數(shù)k取值合理,嶺回歸在解決日光溫室自變量間的多重共線性問題會發(fā)揮出獨特的作用,取得較好的預測效果。
(3)預測因子的選取在一定程度上影響模型的精度,在預測因子選取時既要考慮對模型精度的影響,還要考慮模型的實際適用性,基于氣象要素預測日光溫室內(nèi)低溫,本研究通過相關性分析篩選出9 個因子對溫室低溫進行預測,其中除總云量外,其他預測因子與溫室低溫均顯著相關,該模型將天氣狀況(晴天、陰天、多云)影響因子(總云量N)考慮納入模型,在實際應用中不再區(qū)分天氣狀況分別建模,而是將不同天氣條件下的溫室低溫預測統(tǒng)一于一個模型,在進行溫室低溫預測時不用根據(jù)天氣狀況分別建模和計算,簡化了模型計算過程,可操作性強,該模型利用當?shù)貧庀笠赜^測資料結合天氣預報中的最高和最低溫度可對日光溫室低溫作出預測。
(4)日光溫室保溫性能影響因素較多[17],對于特定溫室,種植戶通風,保溫被揭蓋等常規(guī)管理中人為因素對溫室蓄熱保溫量也有一定影響。本研究在資料選擇方面篩選了12 月1 日至次年1 月的觀測資料進行建模,一方面是因為根據(jù)甘州區(qū)歷年天氣資料發(fā)現(xiàn)該時段是當?shù)匾荒曛袦囟茸畹蜁r期,另一方面,種植戶在低溫期為了盡量保證溫室較高的熱量狀況,最大程度地做到溫室內(nèi)保溫蓄熱,種植戶根據(jù)外界天氣條件,適時通風、按時揭蓋保溫被等,預防低溫對溫室作物的不利生長影響,在此低溫期間種植戶采取的溫度管理調控措施在時間和要求上相對嚴格和精細。在不同外界溫度條件下由于溫室保溫管理要求和精細化程度不一致而造成對溫室低溫影響程度也不一樣,篩選同處于低溫期的資料建模,考慮到溫室溫度管理在時間和措施上一致性強,人為管理因素對溫室低溫的影響程度差異性相對較小,故選擇該時期資料建模是合理的。通過模型檢驗也看出該模型精度較高,適于開展當?shù)氐蜏仄诘臏厥业蜏仡A測和服務。由于氣候條件、溫室結構、種植管理習慣等因素的差異,對于其他地區(qū)溫室,還需根據(jù)特定的溫室類型,選擇適合的預測因子和與之相對應的預測方法建模進行低溫預測和開展設施農(nóng)業(yè)氣象服務。