鄭世健,付 聰,2,萬博雨,劉知貴
(1.西南科技大學(xué)信息工程學(xué)院,四川 綿陽 621000;2.中國工程物理研究院電子工程研究所,四川 綿陽 621000)
在室內(nèi)環(huán)境中,空氣速度、溫濕度等參數(shù)的優(yōu)化對(duì)室內(nèi)事物或人具有重要意義[1]。例如:在圖書館[2],良好的室內(nèi)環(huán)境可以保證讀者的健康和舒適性;在溫室[3],良好的室內(nèi)環(huán)境可以促進(jìn)作物的生長(zhǎng)和成活率。為了評(píng)估這些參數(shù)的詳細(xì)分布,一般采用兩種主要方法:計(jì)算流體力學(xué)(CFD)數(shù)值模擬和現(xiàn)場(chǎng)測(cè)量。CFD模擬方法的精確度極大的依賴于建模的精細(xì)程度和迭代計(jì)算模型的準(zhǔn)確程度,與現(xiàn)實(shí)的環(huán)境存在明顯差異。雖然現(xiàn)場(chǎng)測(cè)量耗時(shí)和耗財(cái),但數(shù)據(jù)更可靠。此外,即使在數(shù)值模擬中,也常需要一定數(shù)量的實(shí)驗(yàn)數(shù)據(jù)來驗(yàn)證計(jì)算結(jié)果,因此,現(xiàn)場(chǎng)測(cè)量是一種最好的方式。
目前,室內(nèi)空氣參數(shù)分布的現(xiàn)場(chǎng)測(cè)量方式主要有利用光學(xué)和點(diǎn)式測(cè)量。光學(xué)測(cè)量方法采用粒子條紋測(cè)速、粒子跟蹤測(cè)速等光學(xué)測(cè)速技術(shù),以獲取和處理被測(cè)粒子的反射信號(hào)來測(cè)量空氣分布,該方法可以確定局部場(chǎng)中的空氣速度分布。然而受環(huán)境空間中物體的影響較大。采用點(diǎn)式傳感器測(cè)量空氣參數(shù),如熱電偶、風(fēng)速計(jì)和氣體采樣器等。與光學(xué)方法相比,由于傳感器可以靈活的部署在測(cè)量的空間中,點(diǎn)式測(cè)量方法更適用于復(fù)雜的空間。這種測(cè)量方式只能測(cè)量單點(diǎn)的空氣參數(shù),而空間中空氣參數(shù)是一個(gè)變化的域場(chǎng),僅僅使用一個(gè)單點(diǎn)數(shù)據(jù)來反映整體情況,容易造成區(qū)域?yàn)?zāi)難。為了描述整體空間變化情況,學(xué)者使用空間插值的方法進(jìn)行模擬,以獲取整個(gè)區(qū)域內(nèi)環(huán)境因子的總體分布情況??臻g插值方法[4]主要包括地理統(tǒng)計(jì)方法和確定性方法。不同的研究尺度、環(huán)境要素和目的決定了使用不同的插值方法會(huì)產(chǎn)生不同的效果。董志南等人[5]在風(fēng)場(chǎng)的插值研究中針對(duì)反距離權(quán)重插值、全局多項(xiàng)式插值、局域多項(xiàng)式插值、最近鄰域法插值、徑向基函數(shù)插值、普通克里金插值6 種空間插值方法進(jìn)行比較,表明反距離權(quán)重插值在風(fēng)場(chǎng)研究重要優(yōu)于其他幾種方法;丁卉等人[6]基于環(huán)境監(jiān)測(cè)站的空氣污染物濃度數(shù)據(jù),采用反距離加權(quán)、規(guī)則樣條函數(shù)和克里金插值函數(shù)分別分析了不同空氣污染物、不同季節(jié)的空間插值效果,表明克里金法能夠得到最優(yōu)的插值精度,但空間分布上過渡平滑性欠佳;楊順華等人[7]利用地理加權(quán)回歸克里金和回歸克里金對(duì)土壤有機(jī)質(zhì)進(jìn)行對(duì)比分析,得出地理加權(quán)回歸克里金方法對(duì)于土壤有機(jī)質(zhì)的局部模擬效果優(yōu)于回歸克里金的方法。
以上研究針對(duì)不同環(huán)境要素、不同研究尺度等情況,適宜的插值方法也不盡相同。調(diào)研發(fā)現(xiàn):空間插值方法在降雨量時(shí)空分布、土壤和地區(qū)氣候時(shí)空變化方面應(yīng)用較為廣泛,在室內(nèi)有限空間區(qū)域濕度場(chǎng)研究較少,且大部分都是選中特定某種插值方法進(jìn)行應(yīng)用,而系統(tǒng)的比較不同插值方法效果的研究較少。本文以英特爾伯克利實(shí)驗(yàn)區(qū)域?yàn)槔?,?duì)室內(nèi)濕度監(jiān)測(cè)數(shù)據(jù)進(jìn)行研究分析,觀測(cè)數(shù)據(jù)分布特征;利用6種空間插值方法對(duì)其進(jìn)行空間插值估算;且使用交叉驗(yàn)證法和其他一些參數(shù)對(duì)插值結(jié)果分析。
英特爾伯克利實(shí)驗(yàn)室整體面積約為1 260 m2,具體的空間布局和傳感器分布圖如圖1所示。使用的環(huán)境傳感器為帶有防風(fēng)雨板的Miaca2Dot傳感器(溫度、濕度、光照、電壓),通過在TinyOS平臺(tái)構(gòu)建的TinyDB網(wǎng)絡(luò)處理系統(tǒng)進(jìn)行收集和處理。最終得到室內(nèi)54個(gè)環(huán)境傳感器的濕度數(shù)據(jù)進(jìn)行研究。
圖1 實(shí)驗(yàn)室傳感器分布圖Fig.1 Laboratory sensor distribution map
試驗(yàn)基礎(chǔ)數(shù)據(jù)來源于英特爾伯克利研究實(shí)驗(yàn)室2004年2月28日至4月5日部署的54個(gè)傳感器采集的公共數(shù)據(jù)集。本文提取2004年3月份的檢測(cè)數(shù)據(jù)作為試驗(yàn)基礎(chǔ)數(shù)據(jù),所獲取的數(shù)據(jù)信息主要包括54個(gè)傳感器的地理位置信息及空氣溫濕度數(shù)據(jù)。地理位置信息主要是以實(shí)驗(yàn)室右上角為原點(diǎn)建立的直角坐標(biāo)系來描述的。
(1)反距離權(quán)重插值。反距離權(quán)重插值法[8](Inverse Distance Weighting,IDW)是通過計(jì)算未測(cè)量點(diǎn)附近點(diǎn)測(cè)量值的加權(quán)平均來進(jìn)行插值。其中權(quán)重的大小是根據(jù)空間自相關(guān)原理來確定的,插值誤差對(duì)空間位置有著較強(qiáng)的依賴關(guān)系。一般表達(dá)式為:
(1)
式中:Z(S0)為S0處的預(yù)測(cè)值;N為預(yù)測(cè)點(diǎn)使用的樣點(diǎn)的數(shù)量;λi為計(jì)算時(shí)用的權(quán)重;Z(Si)是在Si處獲得的真實(shí)值;P為指數(shù)值;di0是插值點(diǎn)S0與周圍已知點(diǎn)Si之間的距離。
(2)徑向基函數(shù)插值。徑向基函數(shù)插值法[9](Radial Basis Function,RBF)要求插值表面必須經(jīng)過每個(gè)已知樣點(diǎn)。徑向基函數(shù)包括5種基本函數(shù):線性函數(shù)、薄板樣條曲面函數(shù)、多項(xiàng)式函數(shù)、高斯曲面函數(shù)和立方體曲面函數(shù)。本文選取薄板樣條曲面函數(shù)模型進(jìn)行試驗(yàn)。
(3)普通克里金插值。普通克里金插值法[10, 11](Ordinary Kriging,OK)是建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎(chǔ)上的,在有限區(qū)域內(nèi)對(duì)區(qū)域變量的取值進(jìn)行無偏最優(yōu)估計(jì)的一種方法。使用該方法需要先計(jì)算樣本變異函數(shù);再根據(jù)變異函數(shù)選取變異理論模型,變異函數(shù)理論模型有球狀、指數(shù)、高斯、冪函數(shù)和空洞效應(yīng)5種模型,具體選擇何種模型是由樣本變異函數(shù)決定;最后對(duì)未知點(diǎn)進(jìn)行估計(jì)[12]。一般表達(dá)式為:
(2)
式中:Z(S0)為S0處的預(yù)測(cè)值;Z(Si)是在Si處獲得的真實(shí)值;λi為計(jì)算時(shí)用的權(quán)重,該系數(shù)是通過對(duì)樣本變異函數(shù)計(jì)算得到的。
(4)協(xié)同克里金插值。協(xié)同克里金法[13](Coordinative Ordinary Kriging,COK)是一種多變量估值方法,在普通克里金方法上,考慮不同變量之間的相關(guān)性,來提高估值的精度。該方法的關(guān)鍵是計(jì)算變量之間的協(xié)變異函數(shù),一般表達(dá)式為:
γ12(h)=E{[v1(x+h)-v1(x)] [v2(x+h)-v2(x)]}
(3)
(4)
式中:vi(x)表示vi在x處的值;γ12(h)表示變異函數(shù)值;V(x0)為xi處的插值預(yù)測(cè)值;V(x1i)為各個(gè)點(diǎn)空氣濕度;V(x2i)在為各處的空氣溫度;λi為計(jì)算時(shí)用的權(quán)重,該系數(shù)是由協(xié)變異函數(shù)[式(3)]計(jì)算得到的。
(5)時(shí)空克里金插值。時(shí)空克里金法[14](Spatio-temporal Ordinary Kriging,STOK)是對(duì)普通空間克里金插值的時(shí)間維度擴(kuò)展,為了處理時(shí)空數(shù)據(jù),普通克里金法使用的固定模型不通用,需修改空間模型。本文采用的空間模型為時(shí)空分離模型,具體形式如下:
γ(hS,hT)=γS(hS)+γT(hT)+γST(hST)
(5)
式中:γS(hS)、γT(hT)和γST(hST)分別為空間、時(shí)間和時(shí)空變異函數(shù);hS、hT和hST分別為空間、時(shí)間和時(shí)空的距離。
其中,時(shí)空距離考慮了時(shí)空幾何異向比率φ,故:
(6)
(6)時(shí)空-協(xié)克里金插值。時(shí)空-協(xié)克里金法(Spatio-temporal and Coordinative Ordinary Kriging,ST-COK)是以協(xié)同區(qū)域化變量理論為基礎(chǔ),將其擴(kuò)展到時(shí)間領(lǐng)域,探究同一時(shí)空域的多元時(shí)空結(jié)構(gòu)現(xiàn)象的方法。其插值公式可以表示為:
(7)
式中:Z1(s,t)0為時(shí)空點(diǎn)(s,t)0處的空氣濕度;Z1(s,t)1i和Z2(s,t)2j為各個(gè)點(diǎn)的空氣濕度和溫度值;λ1i和λ2j為各個(gè)主輔變量的權(quán)重系數(shù)。
時(shí)空協(xié)變異函數(shù)是該方法的關(guān)鍵,它描述各個(gè)變量之間交叉的時(shí)空連續(xù)性。由于實(shí)際計(jì)算中,一般的計(jì)算方法較為復(fù)雜,因此使用一種新的變量方法來簡(jiǎn)化上述計(jì)算過程[15]。新的表達(dá)式為:
(8)
新變量是將統(tǒng)一時(shí)空位置上的兩個(gè)變量的屬性值之和作為該位置的屬性值,從而簡(jiǎn)化計(jì)算復(fù)雜度。然后,通過新變量變異系數(shù)與原始數(shù)據(jù)變異系數(shù)和協(xié)變異函數(shù)之間關(guān)系得出時(shí)空協(xié)變異函數(shù),具體關(guān)系如下:
(9)
為驗(yàn)證不同插值方法在研究區(qū)域的預(yù)測(cè)精度,本文采用交叉驗(yàn)證法來檢驗(yàn)插值結(jié)果。在所研究區(qū)域樣本中,假設(shè)某一樣本點(diǎn)值未知,通過剩余樣本點(diǎn)值對(duì)其進(jìn)行插值預(yù)測(cè),利用預(yù)測(cè)的估計(jì)值與實(shí)測(cè)值的誤差來評(píng)價(jià)。本文主要采用平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRE)和均方根誤差(RMSE)[16]。其中,平均絕對(duì)誤差反應(yīng)模擬值的誤差范圍,平均相對(duì)誤差則反應(yīng)模擬值對(duì)于觀測(cè)值的準(zhǔn)確度,均方根誤差反應(yīng)模擬值的靈敏度和極值情況。MAE、MRE和RMSE是插值精度的度量,其越小則說明插值方法越精確。此外,本文還針對(duì)每種插值方法計(jì)算其觀測(cè)值和模擬值的平均值、標(biāo)準(zhǔn)差及相關(guān)系數(shù),以便于更全面的描述其插值結(jié)果的誤差情況。
(10)
(11)
(12)
為了直觀分析不同方法插值結(jié)果,本文以英特爾伯克利實(shí)驗(yàn)室數(shù)據(jù)集中2月28日至3月28日的一個(gè)月濕度數(shù)據(jù)為例,根據(jù)不同方法插值得到濕度的空間分布圖如圖2所示,對(duì)比6種方法空間分布圖的直觀效果。
從圖2可知,每種方法都能從整體上反映出室內(nèi)濕度的大致變化情況:總體呈現(xiàn)由左至右濕度逐漸增加,梯度變化較為明顯,不同插值方法所得結(jié)果在曲線平滑程度以及局部地區(qū)的空間分布存在一定差異:IDW法和RBF法的插值結(jié)果出現(xiàn)了明顯的“牛眼”,且圖像平滑性差;COK法、STOK法和OK法得到圖像較為平滑,其中COK法與STOK法更能體現(xiàn)具體的細(xì)節(jié)。所以采用COK和STOK法對(duì)室內(nèi)濕度插值,能夠更加有效地避免出現(xiàn)誤差,結(jié)果也比IDW、RBF和OK法更精確。本文基于協(xié)同克里金和時(shí)空克里金插值法的基礎(chǔ)上,將兩者優(yōu)勢(shì)進(jìn)行結(jié)合形成ST-COK法,在上圖中顯示該方法也能夠得到平滑圖像和真實(shí)反應(yīng)濕度的局部變化。
本文利用IDW、RBF、OK、STOK、 COK 和ST-COK插值方法,依次進(jìn)行插值。其中,克里金使用了3種不同半變異模型(球形、指數(shù)和三次多項(xiàng)式)進(jìn)行試驗(yàn),協(xié)同克里金采用高斯模型,IDW采用三次指數(shù)模型,RBF法使用薄板樣條模型。形成的濕度場(chǎng)誤差分析結(jié)果如表1所示。
表1 6種插值方法的誤差指標(biāo)Tab.1 Error indicators for 6 interpolation methods
由表1可知,不同插值法的交叉驗(yàn)證結(jié)果表明:實(shí)測(cè)結(jié)果與預(yù)測(cè)結(jié)果均有顯著相關(guān)。就平均絕對(duì)誤差而言,ST-COK的預(yù)測(cè)誤差范圍最小,使用三次多項(xiàng)式的OK法的預(yù)測(cè)誤差最大,其余幾種方法基本接近,介于兩者之間;從平均相對(duì)誤差方面來看,整體波動(dòng)很小,表明各種方法插值得到的數(shù)據(jù)可信度較高;從均方根誤差的數(shù)值分布來看,ST-COK的方法要優(yōu)于其他幾種方法,表明該方法更接近觀測(cè)值數(shù)據(jù)。整體來看,ST-COK方法無論是在反應(yīng)預(yù)測(cè)靈敏度與反應(yīng)接近觀測(cè)值情況都要優(yōu)于其他幾種方法,主要是由于其充分考慮了數(shù)據(jù)間的時(shí)空相關(guān)與屬性相關(guān)的特點(diǎn)。
圖2 基于不同方法的室內(nèi)濕度場(chǎng)空間插值結(jié)果Fig.2 Spatial interpolation results of indoor humidity field based on different methods
為了更加詳細(xì)的描述各種插值方法的預(yù)測(cè)結(jié)果的真實(shí)情況,本文還選取了觀測(cè)值與模擬值的極值、平均值、標(biāo)準(zhǔn)差以及相關(guān)系數(shù)等幾種參數(shù)作為進(jìn)一步誤差分析的數(shù)據(jù)。
表2 6種插值法的預(yù)測(cè)值與觀測(cè)值比較 Tab.2 Comparison of observations and predicted values of 6 interpolation methods
由表2知,在極值方面,幾種改進(jìn)的克里金方法預(yù)測(cè)出的極值與觀測(cè)值較為接近,在反應(yīng)極值方面具有較大的優(yōu)勢(shì);在平均值方面,每種算法預(yù)測(cè)的結(jié)果與觀測(cè)值很接近,其中STOK的方法最優(yōu);在標(biāo)準(zhǔn)差方面,ST-COK方法最為接近觀測(cè)值;在相關(guān)系數(shù)方面,每種算法預(yù)測(cè)值與觀測(cè)值的相關(guān)系數(shù)都在0.8以上,表明模擬出的濕度場(chǎng)與真實(shí)情況較為接近,其中ST-COK方法的相關(guān)程度最高。故從整體方面來考慮,ST-COK方法在刻畫真實(shí)空間濕度場(chǎng)方面具有較好的能力。
本文使用物聯(lián)網(wǎng)與空間插值結(jié)合的室內(nèi)濕度場(chǎng)模擬方法,避免了基于流體力學(xué)的建模精細(xì)程度高的問題??梢酝ㄟ^利用大量實(shí)時(shí)采集數(shù)據(jù)來插值得到整個(gè)室內(nèi)的濕度場(chǎng)分布情況,為相關(guān)部門的研究提供參考數(shù)據(jù)與決策支持。
(1)從不同插值法空間分布圖來看,IDW方法與RBF方法能夠突出濕度場(chǎng)的局部變化,但是圖像不平滑,特別是在濕度變化的邊界會(huì)出現(xiàn)明顯的線條。OK、COK、STOK和ST-COK得到的圖像較為平滑,其中ST-COK方法可以更突出濕度場(chǎng)的局部變化,也相對(duì)的比較平滑。
(2)根據(jù)交叉驗(yàn)證結(jié)果的分析,基于球形模型的OK方法與ST-COK方法模擬出的值誤差范圍最??;幾種方法模擬出的值準(zhǔn)確度相差不大,其中IDW方法模擬值的準(zhǔn)確度最低;ST-COK方法的靈敏度在幾種方法中是最優(yōu)的。
(3)根據(jù)觀測(cè)值與模擬值的相關(guān)系數(shù)、均值和標(biāo)準(zhǔn)差等幾個(gè)參數(shù)分析。COK、STOK與ST-COK在反映極值方面和平滑作用具有顯著優(yōu)勢(shì),而IDW與RBF在這兩方面略顯不足;ST-COK方法模擬值與觀測(cè)值相關(guān)性最好,表明模擬結(jié)果的變化與觀測(cè)的變化具有一定的密切程度。
綜上所述,對(duì)于室內(nèi)小尺度的濕度場(chǎng)模擬來說,ST-COK方法整體上要優(yōu)于其余幾種方法。這是由于該方法充分考慮了數(shù)據(jù)間的相關(guān)聯(lián)度,從多個(gè)方面來約束預(yù)測(cè)數(shù)據(jù)的范圍。盡管這種方法能夠得到較好的模擬值,但需要的計(jì)算較為復(fù)雜,耗費(fèi)大量的運(yùn)算時(shí)間。此外,影響插值結(jié)果的準(zhǔn)確性與傳感器位置和數(shù)量具有較大的聯(lián)系,這些問題有待進(jìn)一步研究。