劉媛媛,劉洪偉,霍風(fēng)霖,劉業(yè)森
(1. 中國水利水電科學(xué)研究院,北京 100038;2. 北京市水務(wù)局,北京 100038)
近年來,在我國由于暴雨引發(fā)的內(nèi)澇已經(jīng)成為影響城市生產(chǎn)生活運轉(zhuǎn)的重要問題[1]。尤其是隨著城市規(guī)模的快速擴大,人口和經(jīng)濟活動變得越來越集中,內(nèi)澇災(zāi)害所造成的損失也被成倍放大,暴雨內(nèi)澇對我國城市建設(shè)和運行的影響也越來越明顯[2]。據(jù)不完全統(tǒng)計,2010年1—8月底,我國遭受洪澇災(zāi)害的縣級以上城市已經(jīng)超過了200座,其中大多數(shù)為暴雨內(nèi)澇[3]。住建部2010年對32個省的351個城市內(nèi)澇情況的調(diào)研結(jié)果顯示,自2008年,62%的被調(diào)研城市都發(fā)生過不同程度的積水內(nèi)澇[4],“逢大雨必澇”已成為目前我國城市的通病。在極端天氣多發(fā)、“逢大雨必澇”的背景下,城市內(nèi)澇風(fēng)險管理工作的水平亟待進一步提高。
城市內(nèi)澇的風(fēng)險管理依賴于準確的降雨預(yù)報,當(dāng)前降雨預(yù)報的主要工具是數(shù)值天氣預(yù)報模式,然而由于受整個學(xué)科水平的限制,要想在暴雨來臨前對城市雨量及其時空分布進行精準預(yù)報十分困難,因此在實際工作中,降雨的數(shù)值預(yù)報可用性并不強。目前城市內(nèi)澇的風(fēng)險管理,更多的是依賴科學(xué)的市政工程措施和基于預(yù)案的應(yīng)急管理手段??茖W(xué)的工程措施與管理手段離不開對當(dāng)?shù)乇┯陼r空分布特征的深入了解,尤其是對降雨動態(tài)變化特征的深入了解。掌握短歷時強降水時空分布特征和規(guī)律,在暴雨到來之前,根據(jù)歷史規(guī)律提前預(yù)估降雨的動態(tài)發(fā)展趨勢,即可根據(jù)歷史上已出現(xiàn)過的內(nèi)澇災(zāi)情預(yù)判不同地區(qū)的內(nèi)澇風(fēng)險,從而對內(nèi)澇的風(fēng)險管理具有重要意義。
城市內(nèi)澇積水的具體情況與暴雨雨強和時空變化特征有直接關(guān)系[5],在匯流歷時內(nèi)平均雨強相同的條件下,雨峰在中部或后部的雨型比均勻形雨型的洪峰大30%以上[6]。傳統(tǒng)的暴雨時空分布研究,主要針對單站(代表站)的雨型開展。Pilgrim等[7]提出的雨型與實際降雨過程較為相似,其將雨峰時段放在出現(xiàn)可能性最大的位置上,雨峰時段在總雨量中的比例取各場降雨雨峰所占比例的平均值,再根據(jù)平均值由小到大的次序確定降雨強度從大到小的順序,最后計算各時段內(nèi)各場次降雨量占總降雨量百分比的平均值,代入確定的順序中,由此得出雨型。Keifer等[8]根據(jù)強度-歷時-頻率關(guān)系得到了一種不均勻的設(shè)計雨型——芝加哥雨型,該雨型中任何歷時內(nèi)的雨量等于設(shè)計雨量。Huff[9]通過研究美國伊里諾斯州的暴雨,將整個降雨歷時平均分成4部分,依據(jù)降雨峰值出現(xiàn)的4個時段位置,將降雨劃分為4種雨型。對每一類雨型,設(shè)計多種不同頻率的分配過程。這些針對單站(代表站)的降雨雨型長期以來得到了廣泛的應(yīng)用,但令人遺憾的是,它們不能體現(xiàn)降雨過程在時間、空間上動態(tài)變化的綜合特征。尤其大城市地區(qū),熱力、動力環(huán)境均存在明顯的空間分異,傳統(tǒng)的單站(代表站)暴雨雨型就更不能滿足分析降雨時空分布特征的要求,很難對城市內(nèi)澇積水風(fēng)險的精細化管理形成有效支撐。
近十幾年來,人工智能(Artificial Intelligence,AI)技術(shù)在計算機視覺、自然語言處理、機器翻譯、醫(yī)學(xué)成像、醫(yī)療信息處理、機器人與控制生物信息等領(lǐng)域已取得長足進展[10],尤其在醫(yī)療診斷[11]、無人駕駛等方面,表現(xiàn)不俗,而在圖像識別、語音識別等方面,AI更是超過人腦,識別的準確性更高。機器學(xué)習(xí)(Machine Learning,ML)是AI的核心組成部分,是實現(xiàn)人工智能的主要途徑。機器學(xué)習(xí)的核心是讓計算機自動“學(xué)習(xí)”的各類算法,可以幫助計算機對大量樣本數(shù)據(jù)進行分析并獲得規(guī)律,然后利用規(guī)律對未知數(shù)據(jù)進行分類或預(yù)測。機器學(xué)習(xí)已在許多領(lǐng)域引發(fā)了歷史性的革命,在氣象災(zāi)害識別預(yù)測上也已得到了較好的應(yīng)用[12]。同時,隨著降雨數(shù)據(jù)采集和傳輸?shù)陌l(fā)展,降雨數(shù)據(jù)更加豐富?;诖罅拷涤陿颖緮?shù)據(jù),利用機器學(xué)習(xí)技術(shù)對降雨的時空分布特征進行提取,成為可能。
本文將機器學(xué)習(xí)引入到暴雨時空分布研究中,提出針對超大城市短歷時強降雨時空分布模式研究方法。區(qū)別于傳統(tǒng)的針對單站降雨雨型分析的方法,本文以整個研究范圍內(nèi)所有雨量站為研究對象,利用機器學(xué)習(xí)算法,提取出研究區(qū)域短時強降雨時空動態(tài)分布特征,可為城市降雨方案設(shè)計、城市內(nèi)澇風(fēng)險分析等提供借鑒與參考。
2.1 方法流程強降雨范圍、暴雨主要落區(qū)移動路徑、降雨量變化、最強時段出現(xiàn)時間等,都是暴雨的時空分布特征,了解這些特征,對于有針對性地防范暴雨對城市的沖擊有重要意義。本文將這些降雨的時空特征用高維數(shù)組進行表達,利用機器學(xué)習(xí)算法,提取短時強降雨的時空分布特征。主要步驟如下:(1)數(shù)據(jù)采集和質(zhì)量控制:對歷史短歷時強降雨數(shù)據(jù)進行質(zhì)量控制,剔除不合理的數(shù)據(jù)。(2)降雨過程結(jié)構(gòu)化:首先劃分降雨場次,將連續(xù)的降雨資料劃分為若干暴雨場次,并從中篩選出暴雨過程,作為研究樣本;其次從時間維度和空間維度構(gòu)建數(shù)組,將一場暴雨過程數(shù)字化。(3)聚類分析,特征提?。豪脵C器學(xué)習(xí)算法,對歷史降雨樣本集進行聚類分析和特征提取。
2.2 降雨過程結(jié)構(gòu)化對各場次降雨,從時間維度和空間維度構(gòu)建高維數(shù)組。將一場降雨過程中每時段的降雨,用矩陣的方式描述。一場降雨有n個時段,就有n個矩陣。歷史暴雨樣本集中就有N場雨,那就有N個這樣的高維矩陣。該高維矩陣包含這次降雨過程的時間特征和空間特征。
基于該方法,建立降雨過程樣本集Ω ,實現(xiàn)了多場次降雨的結(jié)構(gòu)化描述,見下式:
式中:Ω為歷史暴雨樣本集,包括N個暴雨場次;Qi為第i次降雨過程;xstm為第s個雨量站tm時刻的降雨量,s=1,2,3,…,S,tm=1,2,3,…,m,S為雨量站個數(shù),m為時段數(shù)。
2.3 動態(tài)聚類分析本文所用的動態(tài)聚類算法屬于人工智能技術(shù)中常見的經(jīng)典聚類算法,是無監(jiān)督的學(xué)習(xí)算法。動態(tài)聚類分析[13]的基本思想是:通過迭代尋找r個聚類的一種劃分方案,使得用這r個聚類的均值來代表相應(yīng)各類樣本時,所得的總體誤差最小。即通過該算法,將總體樣本集劃分為r個子集,使得各子集內(nèi)的樣本近似,而各子集之間的樣本不同。再提取各子集的均值,得到屬于該子集的降雨特征。
分析時,先隨機選擇r個樣本點,也就是r個降雨過程作為r個子集的初始聚類中心,計算所有樣本與這r個初始聚類中心的距離,并把樣本劃分到與之距離最近的那個中心所在的子集中,使所有的樣本根據(jù)距離,自動聚集到各個子集中,從而得到初始分類類型數(shù)以及初始子集。計算各子集所有樣本的均值,得到新一代的聚類中心,再次計算所有樣本與新的聚類中心的距離,自動聚集,得到新的聚類中心,計算各子集所有樣本的均值。不斷迭代,并比較第p代和第p+1代聚類中心,如果相差在范圍之內(nèi),則認為計算收斂,從而得到最終的子集及各子集的聚類中心。
該聚類方法收斂速度快,容易解釋,聚類效果較好,適用于高維數(shù)據(jù)。但是該方法的聚類結(jié)果受初始聚類中心選擇的影響較大。因此本文在迭代收斂后,通過與實際雨量空間特征不斷的比較分析,判斷子集數(shù)和初始子集中心是否合理,調(diào)整子集數(shù)以及子集的初始中心,以此反復(fù)進行聚類的迭代運算,直至確定合理的雨量空間分布特征類型數(shù)和聚類中心。計算步驟如下:
(1)分析的樣本集為Ω={Q1,Q2,…,QN},M為最大迭代次數(shù),r為初始劃分的子集數(shù),C={C1,C2,…,Cr}為r個子集。初始時Cj=?,j=1,2,…,r;
(2)從Ω 中隨機選取r個樣本,作為初始r個子集的各中心向量(0為迭代計算次數(shù));
(3)對于n=1,2,…,N,計算樣本Q(iQi∈ Ω)與每個聚類中心Zj={z1,z2,…,zr}的距離如果則Qi∈Cj。更新Cj=Cj∪Qi;
(4)對于j=1,2,…,r,對Cj中的所有樣本點,重新計算中心向量
(6)輸出各子集C={C1,C2,…,Cr}以及各子集的均值
3.1 資料處理北京作為超大規(guī)模城市,最近30年經(jīng)歷了快速的城市化進程,同時內(nèi)澇問題加劇。北京市主汛期(6—8月)降雨集中,汛期突發(fā)的強降雨基本占了全年降水量的大部分[14]。這種集中型的極端降雨,是北京嚴重城市內(nèi)澇災(zāi)害的主要誘因。尤其2011年“6·23”與2012年“7·21”特大暴雨,北京全市發(fā)生了嚴重的洪澇災(zāi)害,并造成了重大人員傷亡和財產(chǎn)損失。2016年“7·20”暴雨,雖然降雨量與“7·21”暴雨相當(dāng),但歷時較長,雨強減半,危害較輕,可見雨型時空分布有顯著影響。
本文選取北京市水文總站提供的2004—2016 年北京城區(qū)14 個氣象站(如圖1 所示),夏季(6—8月)5 min間隔降雨監(jiān)測數(shù)據(jù)。在實際的監(jiān)測降雨數(shù)據(jù)中,可能會受監(jiān)測設(shè)備或者人為影響,出現(xiàn)非常不合理的數(shù)據(jù),導(dǎo)致不能分析出合理的結(jié)果,或者根本不會出結(jié)果。因此在做分析之前,需要對實際的監(jiān)測降雨數(shù)據(jù)進行質(zhì)量控制,剔除不合理的數(shù)據(jù)。質(zhì)量控制的標準如下:(1)單站5 min降雨量超過10 mm,且孤立存在,該站前后時間都沒有降雨,則認為是不合理的記錄;(2)某站5 km×5 km范圍內(nèi)的雨量站監(jiān)測數(shù)據(jù)為0,而該站5 min降雨量超過10 mm,則認為是不合理的記錄。
對于單站不合理的記錄,利用該站5 km×5 km范圍內(nèi)雨量站差值結(jié)果,代替該站不合理的記錄。
將質(zhì)量控制后的數(shù)據(jù)進行場次劃分,篩選出短歷時強降雨過程作為樣本。首先,根據(jù)北京城區(qū)降雨的特點,連續(xù)超過2h5min 降雨量小于0.1 mm,則認為無有效降雨,按照這個規(guī)則劃分降雨場次。根據(jù)北京城區(qū)的暴雨藍色預(yù)警指標:1h降雨量達30 mm以上或6h降雨量達50 mm以上[15],篩選出暴雨過程。按照上述標準和流程,在2004—2016年間,共篩選出強降雨過程89場,將場次降雨劃分為12個時段,構(gòu)建高維數(shù)組樣本庫。
圖1 氣象站分布
3.2 結(jié)果分析本文基于機器學(xué)習(xí)算法,提取北京城區(qū)夏季短歷時強降雨的時空分布特征。經(jīng)分析,北京夏季短歷時強降雨過程可分為3 類:第一類,暴雨中心自西北山區(qū)向城中心區(qū)移動;第二類,暴雨中心自西南經(jīng)城區(qū),向東北方向移動;第三類,暴雨集中在城區(qū),基本不發(fā)生移動。
這3類降雨模式的雨量格局及發(fā)展過程存在明顯差異,為了進行直觀對比,以各站點各時段的降雨量為權(quán)重,計算了這3類降雨各時段的雨量重心點,結(jié)果見圖2。圖2中,分別用不同顏色的正方形、圓形、三角形代表這3 類降雨t1~t12 時段的雨量重心點。從總體位置來看,第一類、第二類、第三類的重心點分別偏西北、西南、東南。從暴雨中心移動過程來看,第一類明顯由西北向城區(qū)移動,第二類主要自西南地區(qū)向北部和城中心區(qū)移動,第三類基本集中在城中心區(qū)。其中第一類的暴雨過程,暴雨中心移動的距離較長,而第三類的暴雨過程,降雨比較集中,暴雨中心基本不發(fā)生移動。
圖2 不同類型降雨重心點時空變化對比
各類型降雨模式不同時刻的雨量分布格局,見圖3—圖5。圖中色塊表示各時刻降雨空間分布情況。
(1)第一類降雨。如圖3所示。該類型降雨的時空分布特征為:降雨從西北部山區(qū)向城區(qū)中心區(qū)和城區(qū)東部擴散。降雨一開始都集中在西北部山區(qū),城區(qū)其余各站基本沒有降雨。而后降雨量逐漸分散,各站都有降雨發(fā)生,屬于該類型的暴雨占統(tǒng)計樣本數(shù)的31.8%。出現(xiàn)這類過程時,北京通常位于東移低渦前部的動力不穩(wěn)定區(qū)域,高空大尺度低渦自西北向東移動,當(dāng)近地層水汽條件配合時,即會自西北向東南出現(xiàn)強降水。2011年“6·23”大暴雨就屬于該類型,該場大暴雨自西北部山區(qū)逐漸向城中心區(qū)移動,西北部地區(qū)降雨量較大[16],符合第一類降雨的時空分布規(guī)律。
圖3 第一類降雨時空分布
(2)第二類降雨。如圖4所示。該類型降雨的時空分布特征為:主要降雨都集中在城區(qū)南部和西南部地區(qū),逐漸向北部和城中心區(qū)擴散。屬于該類型降雨占樣本總數(shù)的13.7%,出現(xiàn)這種降雨時,北京通常處于槽前的西南暖濕氣流里,或是位于偏南低空急流前部激發(fā)的強對流中,其本質(zhì)是暖區(qū)強降水,因為濕度和對流不穩(wěn)定條件好,降水強度大。
圖4 第二類降雨時空分布
(3)第三類降雨。如圖5所示。該類型降雨的時空分布特征為:主要降雨集中在城區(qū)中心區(qū)和東部、南部地區(qū),基本不發(fā)生移動,降雨集中。該類型降雨占樣本總數(shù)的54.6%。為北京城區(qū)夏季主要降雨類型,基本發(fā)生在午后到傍晚。2004年“7·10”特大暴雨就是屬于該類型的典型暴雨過程。本次暴雨中心位于城區(qū)中部和西部。城區(qū)平均降雨量為81 mm,而全市平均降雨量23 mm。市級報汛站中最大點天安門站降雨量達到106 mm[17],符合該類型降雨的時空分布規(guī)律。屬于該類型的暴雨過程,主要是受城市“雨島效應(yīng)”影響造成的,多為局地性降水。
圖5 第三類降雨時空分布
綜上所述,北京城區(qū)汛期短時強降雨過程時空分布特征可以歸為三種類型,這三種類型的降雨時空分布特征與屬于該類的實際降雨過程基本符合,而且這三種類型降雨時空分布特征,均有相應(yīng)物理機制的解釋。
深入了解城市暴雨動態(tài)變化的特征規(guī)律,掌握短歷時強降水時空分布特征,是科學(xué)應(yīng)對暴雨引發(fā)的積澇等次生災(zāi)害的先決條件,而傳統(tǒng)的以點帶面的方法,不能很好地分析暴雨動態(tài)變化特征,無法滿足提高城市內(nèi)澇風(fēng)險管控水平的需求。本文將機器學(xué)習(xí)算法引入到降雨時空分布特征的研究中,實現(xiàn)了暴雨時空分布的特征提取,將北京城區(qū)的汛期短時強降雨過程分為3種類型:(1)降雨自西北部山區(qū)移動到城中心區(qū),逐漸擴散到城區(qū);(2)降雨集中在城區(qū)西南部地區(qū),逐漸向北部和城中心區(qū)擴散,北部山區(qū)基本無降雨;(3)降雨集中在城區(qū)中心區(qū)和東部地區(qū),基本不發(fā)生移動。經(jīng)機器學(xué)習(xí),提取出的各降雨模式的時空分布規(guī)律,與屬于各模式的實際降雨過程基本相符,并且有各自對應(yīng)的降雨形成的不同物理機制。當(dāng)然也應(yīng)看到,本文僅以北京城區(qū)14個站2004—2016年的降雨資料為分析樣本提取的降雨時空分布特征,可能具有一定的隨機性和不確定性,對于全北京市域的特點還未很好把握,有待進一步深入開展。未來可收集整理更大范圍、更長序列的降雨資料,進一步補充完善數(shù)據(jù)樣本,從更大范圍探討降雨過程的變化特征,以得到更加全面完整的分析結(jié)果。