韓樂瓊 何曉鳳 張雪松 肖擎曜 陳 笑
1 北京玖天氣象科技有限公司,北京 100081 2 華風氣象傳媒集團,北京 100081 3 中廣核風電有限公司,北京 100070
提 要: 以如東海上風電場升壓站激光雷達測風資料為基礎,提出了一種強風事件識別方法,設計并比較了三種預報強風事件識別方案?;跊Q策樹和一元線性回歸方法,分別開展了針對強風事件的訂正方法研究。結果發(fā)現(xiàn):三種預報強風事件識別方案中,等分位閾值方案明顯更優(yōu),事件命中率達到76.1%,匹配時長命中率達到87.6%;采用消偏閾值方案和等分位閾值方案預報的強風事件時長會更接近觀測強風事件時長;等分位閾值方案識別的事件基本可以覆蓋到各次觀測強風事件的全程;兩個訂正模型相對于模式預報都有一定提升與改進,其中決策樹比一元線性回歸模型更優(yōu),其平均絕對誤差、相對誤差和均方根誤差明顯更小。
風是對多行業(yè)生產安全有直接影響的基本氣象要素,準確的近地層風速預報對企業(yè)提質增效保安全具有重要的作用。隨著數(shù)值天氣預報(numerical weather prediction,NWP)技術的快速發(fā)展,基于NWP的風速預報產品越來越多地應用于各行各業(yè)的生產決策、重大活動的氣象保障中。在港口氣象災害風險評估方面,一些研究采用模式風場預報產品作為驅動,模擬了風暴潮及其增水過程的水位變化,并基于此開展了災害性天氣下港口的氣象災害風險評估(曹越男等,2014;閆麗鳳等,2008)。針對易受大風天氣影響的重大室外賽事活動,國內外基于不同數(shù)值預報產品開展了較多的賽場風速預報及訂正技術研究,致力于提高區(qū)域模式的風速預報,為重大賽事提供氣象保障(王令等,2008;陳超君等,2012;Kiktev et al,2015;楊璐等,2022;邱貴強等,2023;劉郁鈺等,2023)。
隨著新能源行業(yè)的興起,NWP在風能資源精細化評估和氣候模擬中也開始發(fā)揮重要作用,國內外在該方向均有大量研究成果與工程實踐。一些學者基于數(shù)值預報產品研究了我國近海風能資源高分辨率模擬方法,分析了近海風能資源分布狀況,部分研究側重于評估NWP產品在不同區(qū)域的風速預報能力,為區(qū)域風能模式預報的業(yè)務化應用奠定了基礎(周榮衛(wèi)等,2010;何曉鳳等,2014;申華羽等,2020);國外學者也利用NWP產品采用動力降尺度方法或著眼于提高某類天氣事件的預報能力來評估局地風能資源(Gioli et al,2014;Storm et al,2009);還有許多學者分別基于不同NWP產品開展了在各地風能預報中的實踐工作(李艷等,2009;Traiteur et al,2012;Cheng and Steenburgh,2015;劉郁玨等,2019;Liu et al,2021)。
雖然現(xiàn)階段不同的NWP風速產品廣泛應用于各行各業(yè)并起到了一些效果,但是因NWP的初值準確性、物理過程參數(shù)化方案的近似性、求解過程的近似和截斷處理、地形與實際情況的偏差等,均會導致近地層風速的預報結果存在較大偏差,為企業(yè)用戶做決策帶來較大的困擾。鑒于這種情況,多位學者開展了基于局地觀測數(shù)據的預報風速訂正技術研究,部分學者利用傳統(tǒng)線性方法進行統(tǒng)計訂正(常蕊等, 2013; 肖擎曜等,2017),通過多種試驗設計提高了局地風速的預報能力;也有部分學者通過對同一風電場運用多種方法做訂正試驗,研究傳統(tǒng)線性方法和機器學習方法的表現(xiàn)差異(江瀅等,2013;Bédard et al,2013)。此外,還有許多學者采用諧波分析、向量機方法、K近鄰法、卡爾曼濾波、均生函數(shù)法、線性回歸法、相似分析法等方法(戚雙斌等,2009;程興宏等,2012;Lin et al,2015;Zjavka,2015;丁煌等,2013;張鐵軍等,2018;王彬濱等,2016;王在文等,2019;楊程等,2019)開展了風速預報訂正方法研究與應用。這些工作顯著減小了預報誤差中的系統(tǒng)性偏差,對預報產品精度的提升起到了積極作用,但是對于降低強風時段的預報誤差效果有限。
此外,不同的企業(yè)生產場景對風速有不同的閾值要求,比如風速超過10 m·s-1時可能威脅海上施工的作業(yè)安全,風速超過25 m·s-1時部分風力發(fā)電機組需要停機等。對特定企業(yè)而言,最關注的是影響其生產安全的風速區(qū)間內的風速預報能力,當預報風速值接近該閾值時,由于預報不確定性的存在,企業(yè)往往最難決策,因此對超過閾值的事件出現(xiàn)與否的預報準確性提出了很高的要求,而對其他風速段預報準確性的要求反而并不那么高。這種情況下,需要面向特定生產場景定義普適性的強風事件,并將這類事件從預報序列中剝離出來有針對性的進行訂正,才能更好地將其應用于企業(yè)實際生產中。
本文首先基于海上風電安全施工對風速的具體要求,應用滑動平均函數(shù),提出了一種影響海上施工安全的持續(xù)性強風事件識別方法,并在充分評估、分析風速預報產品強風預報能力的基礎上,結合實況與預報數(shù)據,基于所提出的強風識別方法的關鍵參數(shù),設計了三種預報識別方案,并評估比較了三種預報強風事件,隨后基于決策樹和一元線性回歸方法,分別開展了針對上述強風事件的訂正方法研究。
本文觀測數(shù)據源自江蘇省南通市如東縣近海某風電場激光雷達測風資料(以下簡稱如東站),激光雷達安裝于該風電場的海上升壓站,其距離海平面35 m,選用激光雷達10 m高度層風速觀測序列,故觀測點距離平均海面的實際高度約為45 m。觀測資料采集期為2018年1月1日至12月31日,為了與模式預報輸出風速時間對應,提取了每個整點時刻的10 min平均風速觀測數(shù)據,并對觀測風速做極值質量控制、僵值質量控制和均一性檢驗等,最后根據檢驗結果剔除了異常值和缺測數(shù)據。
本文預報資料來自GDFS(Grid Data Forecast System)(陳笑等,2018)。GDFS是基于多模式預報產品的集成預報系統(tǒng)(以下簡稱模式),其空間分辨率為0.025°×0.025°,時間分辨率為1 h,預報時效為72 h,每天起報2次。該模式基于全國7萬多個自動站實時觀測資料和ECMWF、CMA-MESO、RMAPS_Wind等多個業(yè)務化數(shù)值預報系統(tǒng)的預報產品,通過動態(tài)誤差權重法實現(xiàn)了集成預報。本文直接采用該模式每天08時起報的50 m高度層的前24 h預報風速數(shù)據開展研究。鑒于海上的下墊面較光滑,風速的空間變化在一定范圍內較小,故未對格點數(shù)據做插值,而是直接選用距離觀測地點最近的模式格點數(shù)據,并將觀測資料與該格點的預報數(shù)據進行逐時匹配。
根據海上施工作業(yè)經驗, 10 m·s-1是影響施工安全的重要風速閾值,連續(xù)超過該閾值的強風過程會導致施工無法進行,因此認為連續(xù)幾個小時平均風速超過10 m·s-1即為一次海上安全施工高影響持續(xù)性強風事件,通過以下具體流程識別強風事件。
首先對風速序列做滑動窗口為5 h的滑動平均,公式如下:
(1)
對滑動平均后得到的新序列做判斷,當風速超過給定風速閾值(針對本文研究的影響海上施工安全的持續(xù)性強風事件,觀測強風事件閾值為10 m·s-1),定義為一個強風時次。當強風時次連續(xù)出現(xiàn)大于等于3 h,則記為一次強風事件。第一個強風時次為強風事件的開始時間,最后一個強風時次為結束時間??紤]到兩次強風事件相距較近時,小風窗口太短無法完成施工,因此將后一次事件開始時間與前一次事件結束時間的差小于等于3 h的兩次強風事件合并為一次強風事件。
為開展本文研究工作,首先需在風速的觀測和預報序列中識別出強風事件,再開展特征分析和后續(xù)訂正技術研究。
首先嚴格根據上文定義,從觀測數(shù)據中進行海上觀測強風事件識別,結果顯示2018年該海上風電場區(qū)域共出現(xiàn)觀測強風事件71次,總時長為1374 h,事件平均時長約為19.35 h。
從預報風速序列中識別強風事件時,首先需要了解模式預報風速的基本情況。統(tǒng)計結果顯示,如東站2018年風速觀測均值為7.01 m·s-1,預報均值為6.29 m·s-1,預報比觀測系統(tǒng)性偏小0.72 m·s-1,預報與觀測的相關性較高,相關系數(shù)達到0.86,表明預報能較好地反映出實際風速的波動轉折。從逐時預報誤差的頻率和累計頻率統(tǒng)計(圖1a)可以看出,如東站預報偏小的頻率明顯大于預報偏大的頻率,預報偏小占67.4%,頻率峰值對應的誤差范圍為偏小0.5~1 m·s-1,偏小2 m·s-1以上達20.6%。針對本文研究側重的強風段,篩選出觀測風速大于等于10 m·s-1的相對強風時次,提取出對應時次的預報,可計算得到強風段誤差分布情況(圖1b),強風段預報偏小頻率達94.1%,頻率峰值對應的誤差范圍偏小2~2.5 m·s-1,且偏小2 m·s-1以上的達到58.9%,即強風時段預報偏小的情況更為明顯。
圖1 2018年如東站(a)所有時段和(b)觀測風速≥10 m·s-1時段的預報與觀測風速的誤差頻率和累計頻率分布Fig.1 Distribution of frequency and cumulative frequency of wind speed error forecast and observed during (a) all time periods and (b) periods with observed wind speed ≥10 m·s-1 at Rudong Station in 2018
基于模式預報風速總體偏小且強風時段顯著偏小的特征,對預報風速序列進行強風事件識別時,開展了三種敏感性識別方案的對比,以得到與實況強風事件匹配度更高的預報強風事件,這對于后續(xù)開展訂正非常重要。模式閾值方案(以下簡稱模式法):基于上文定義的強風事件閾值(10 m·s-1)和式(1)對預報風速序列進行直接識別,將該方案識別結果稱為模式強風事件;消偏閾值方案(以下簡稱消偏法):將模式預報的原始風速進行系統(tǒng)性偏差簡單訂正,即對逐時預報均加上預報與觀測的誤差均值(0.72 m·s-1)后,再采用10 m·s-1閾值和式(1)做強風事件識別,將該方案識別結果稱為消偏強風事件;等分位閾值方案(以下簡稱等分位法):考慮到觀測和預報的強風時段在各自的整個時段內占比是近似的,首先對觀測的滑動平均序列由小到大排序,計算出觀測閾值10 m·s-1處的累計頻率值(82.4%),再提取模式預報風速的滑動平均序列由小到大排列后累計頻率82.4%處對應風速值(8.5 m·s-1),將該值作為預報強風事件閾值(如圖2所示),再結合式(1)進行強風事件識別,將該方案識別結果稱為等分位強風事件。
強風事件評估方法:對持續(xù)時間不超過20 h的觀測強風事件,其時間范圍內任意時刻識別到預報強風事件,則記為一次命中,否則記為一次漏報;若該次觀測強風事件持續(xù)時間超過20 h,則要求二者的交集時長大于等于5 h才記為一次命中,否則記為一次漏報。將與觀測強風事件無交集的預報強風事件記為一次空報。事件命中率定義為命中次數(shù)除以觀測強風事件總數(shù),以百分率表示。各方案預報與觀測事件逐時匹配時長:即預報與觀測同為大風事件的時刻累計值。其匹配時長命中率定義為匹配時長除以總的觀測大風事件時長(1374 h)。
基于觀測強風事件和三種識別方案得到的預報強風事件開展了效果評估,由表1可見:模式法與觀測強風事件的匹配較差,命中事件僅為28次,命中率為39.4%,漏報較多;消偏法將命中率提高到了54.9%;等分位法明顯更優(yōu),命中事件為54次,相比模式法增加命中26次,命中率提高到76.1%。但是隨著命中率的提高,消偏法和等分位法的空報也略有增加:模式法空報為1次,消偏法和等分位法空報分別增加到了8次和9次。從事件總時長來看,模式法、消偏法和等分位法的總時長分別為692、1039和1401 h,與1年內的觀測強風事件總時長相比分別表現(xiàn)為偏少682 h、偏少335 h和偏多27 h,等分位法識別的強風事件總時長明顯更接近觀測。
表1 2018年如東站三種方案識別得到的預報強風事件評估Table 1 Assessment of forecast gale events identified by three schemes at Rudong Station in 2018
此外,對各方案預報與觀測事件逐時匹配時長對比得出:模式法為625 h,消偏法為911 h,等分位法為1203 h,匹配時長命中率分別為45.5%、66.3%、87.6%,即對觀測事件漏報的時長分別為749、463和171 h。而各方案空報事件的時長:模式法為14 h,消偏法為47 h,等分位法為87 h??梢娤ê偷确治环ㄗR別的強風事件雖然相比模式法增加了約2 d的空報,但是匹配時長分別增加了約12 d和24 d。
針對各月的強風事件,分析后發(fā)現(xiàn)各方案空報和漏報情況在同季節(jié)的各月間近似,因此從四個季節(jié)中分別選取了季節(jié)內觀測強風事件最多的月份構成了典型月份(分別為4、7、10、12月)做進一步分析。圖3給出了四個典型月份中,觀測強風事件及三種方案得到的預報強風事件的各月分布情況。由圖3可見,雖然消偏法和等分位法識別的預報強風事件會增加少量空報,但是二者能明顯減少模式漏報;模式法識別的強風事件時長相對于同期觀測普遍偏短,采用消偏法和等分位法識別的預報強風事件時長會更接近觀測;消偏法容易漏報影響時間較短的強風事件,而采用等分位法能有效提高這類影響時間較短的強風事件的命中率;并且對比預報和觀測的各次事件的起止時間,等分位法基本可以覆蓋到各次強風事件的全程。因此等分位法識別的預報強風事件起止時間可為海上施工作業(yè)災害預警的發(fā)布和解除提供有效參考。
圖3 2018年四個典型月份如東站觀測及三種方案預報的強風事件分布Fig.3 Distribution of observed and forecast gale events by three schemes at Rudong Station in 2018
在四個典型月份中7月和10月存在空報事件。圖4b給出了6月30日00時至7月31日23時觀測和預報時序,可看到7月1日的空報,是因為6月30日至7月1日模式預報的大風段滯后于觀測大風,觀測大風段結束于6月30日14時,而預報風速14時才開始高于8 m·s-1,在采用消偏法和等分位法后,等分位法的預報大風事件開始于12時,命中了觀測大風事件的后半段,而消偏法的預報大風事件開始于16時,沒有命中大風事件;但是因為預報風速滯后的原因,等分位法預報大風事件的結束時間為7月1日01時,導致了1日的短暫空報。7日的空報則是該段預報與觀測反向,表現(xiàn)為預報風速在波峰而觀測相對在波谷,預報的相對大風時段提前了一些,導致了預報風速的整體偏大。其中7日的觀測平均風速為7.19 m·s-1,而預報平均為10.23 m·s-1,預報偏高了3.04 m·s-1,這導致三個方法均出現(xiàn)了不同時間長度的空報。對10月的觀測和預報時序圖分析(圖4c),11日的預報風速非常接近觀測風速,預報和觀測風速平均分別為8.30 m·s-1和8.37 m·s-1,預報風速略偏小,消偏法加上誤差均值后風速增加,從而出現(xiàn)了短暫空報,而等分位法因為降低了閾值出現(xiàn)了相對較長的空報。上述兩種空報的成因共性不強,且兩類空報事件在整個資料時間段內相對較少,因此難以直接通過總結模式風速預報的特征來消除空報。在實際業(yè)務運用時,針對此類大風事件,可能需要考慮當前天氣型的影響,做人工修正。
圖4 2018年(a)4月、(b)7月和(c)10月如東站的觀測和預報風速Fig.4 The observed and forecast wind speeds at Rudong Station in (a) April, (b) July, (c) October of 2018
消偏法和等分位法預報的強風事件雖能有效增加命中,減少漏報,但是由于模式原始風速預報的固有問題,仍然存在一些強風事件無法被預報出來(如圖3b,7月15—17日的觀測強風事件),且存在一些預報強風事件相對觀測強風事件時長偏短的現(xiàn)象(如圖3a,4月20—23日的觀測強風事件)。分析對應月份的時序圖(圖4a,4b),可看到上述提到漏報時段的風速預報波動與觀測相似,但是峰值風速預報明顯偏小,其中4月20日、21日的單日均值分別偏小2.6 m·s-1和2.9 m·s-1,7月15日、16日、17日的單日均值分別偏小2.11、2.6和2.12 m·s-1,這種顯著偏小導致了預報事件的時長偏短或漏報的情況。
基于三種預報強風事件識別方案研究的結果分析,運用等分位法識別到的強風事件從開始時間、結束時間、持續(xù)時長、命中率、時長匹配等各方面都最接近觀測強風事件,其起止時間可為海上施工作業(yè)災害預警的發(fā)布和解除提供有效參考。因此,下文基于等分位法識別的預報強風事件開展預報強風事件的強度訂正方法研究。
首先根據等分位強風事件的時間段提取觀測及模式預報風速數(shù)據,并按照事件發(fā)生的先后順序依次重構成新的觀測強風序列和預報強風序列(以下簡稱為強風序列集)??紤]到平均風速是一個連續(xù)性的變量,某時刻的風速與其之前和之后時刻的風速均有密切關聯(lián),對強風序列集采用如下方法重構樣本集:
對強風序列集內某時刻i的觀測風速yi,找到對應時刻前后6 h內(i-6,i-5,…,i,i+1,…,i+6)共13個預報風速構成預報因子集xi(k),其中i=1,2,…,n為時序(n也為樣本總數(shù));k=1,2,…,13為因子序號,k=1時,對應i-6時刻的預報風速,k=13時,對應i+6時刻的預報風速,以此類推。將上述變量合并即可構建出樣本集D={(x1(k),y1),(x2(k),y2),…,(xi(k),yi),…,(xn(k),yn)},其中xi(k)=(xi(1),xi(2),…,xi(13))。隨后選取樣本集前80%時序的數(shù)據作為訓練樣本,剩下的20%時序數(shù)據作為獨立檢驗樣本,再分別采用了一元線性回歸和決策樹兩種訂正方法基于訓練樣本段構建了訂正模型,并用獨立檢驗樣本段的數(shù)據進行訂正和檢驗。
一元線性回歸是通過尋找自變量與因變量的最小離差平方和來得到數(shù)據最優(yōu)函數(shù)解的方法(黃嘉佑,2000)。在本研究中,將因變量設置為觀測風速yi,通過對前述樣本集xi(k)與yi計算線性相關后,選擇相關性最高的xi(8)(其相關系數(shù)為0.72)做為自變量,假定二者存在下述的一元線性統(tǒng)計關系式[式(2),其為回歸理想模型],利用樣本集中的數(shù)據對該關系式進行估計,得到的估計方程即為一元線性回歸方程[式(3)]。
yi=β0+β1xi(8)+ei
(2)
(3)
式(3)需要滿足使得全部的觀測風速與訂正風速的離差平方和(Q)達到最小,即:
(4)
將式(3)代入式(4)并展開,根據最小二乘法即可解出方程組的系數(shù)。本研究中解出來的一元線性方程如下:
(5)
決策樹是一種樹結構,是近年來機器學習方法中基本的分類與回歸方法?;貧w決策樹主要指CART(classification and regression tree)算法,其由Breiman et al(1984)提出。針對連續(xù)值,其是通過誤差平方和來度量和劃分葉節(jié)點的一種算法。算法本質是將樣本時段的特征空間根據當前誤差平方和最小的條件來劃分成左右兩個結點,兩個結點分別以同一個特征變量的值作條件劃分,依次對劃分出的每個結點的結果接著進行劃分,即得到若干個單元,每一個劃分單元有一個特定的輸出。在檢驗時段的數(shù)據應用中,只要按照特征將其歸到某個單元,便能得到對應的訂正輸出值。
本研究針對上文中定義的訓練數(shù)據集D={(x1(k),y1),(x2(k),y2),…,(xi(k),yi),…,(xn(k),yn)},其中xi(k)為不同的特征變量,k的取值為1,2,3,…,13,分別表示對應觀測時刻往前6 h至往后6 h 的預報風速。在決策樹CART算法中對上述由所有特征變量組成的特征空間采用遍歷當前集合中所有特征變量的所有取值的方法進行劃分,根據誤差平方和最小化原則選擇其中最優(yōu)的一個作為切分點。如第一輪劃分,對訓練集中的某一個特征變量xi(k)給出一個s值,將xi(k)作為切分變量,s作為切分點,即可將D根據s劃分為兩個區(qū)域R1(k,s)和R2(k,s),即R1(k,s)={(xi(k),yi)|xi(k)≤s},R2(k,s)={(xi(k),yi)|xi(k)>s}。該s的取值要使得當前兩個區(qū)域的誤差平方和最小,即滿足式(6):
(6)
本文的決策樹回歸模型其本質可看作是模型根據輸入預報的多特征變量的風速與對應的觀測風速,總結每一次輸入的13個風速預報點的變化曲線與對應觀測的特征,通過對各個特征變量的閾值劃分將預報風速劃分為不同的天氣型,并給出了判斷不同天氣型的逐級關鍵切分變量和切分點,因此在讀入新的預報風速序列時,可根據預報風速值確定對應天氣型,最終得到該類天氣型下的訂正結果。
3.3.1 評估指標
針對兩種訂正方法在強風事件中訂正性能的評估,整體定量評估方面采用平均絕對誤差(MAE)、相對誤差(RE)、均方根誤差(RMSE)三個方法定義檢驗指標,如式(7)~式(9):
(7)
(8)
(9)
3.3.2 綜合評價
上述獨立檢驗樣本時段包含300個樣本,其中觀測風速均值為11.91 m·s-1,模式預報風速均值為10.15 m·s-1。經過一元線性回歸和決策樹訂正后的風速均值分別為10.98 m·s-1和11.23 m·s-1??梢妰煞N訂正方法均能有效減少均值誤差,使得訂正風速均值更接近觀測均值。由表2的模式預報及兩種訂正方法的風速檢驗結果可見,MAE從模式預報的1.97 m·s-1變?yōu)?.43 m·s-1(一元線性回歸)和1.31 m·s-1(決策樹),分別減小了0.54 m·s-1和0.66 m·s-1;訂正后RE雖然仍然偏小,但是偏小程度明顯降低,從模式預報的-14.7%變?yōu)?7.81%(一元線性回歸)和-5.71%(決策樹);此外,RMSE也明顯減小。無論是從MAE、RE或RMSE來看,經過兩種訂正方法訂正后的風速預報效果相對于模式風速預報效果都有一定提升與改進,其中決策樹模型比一元線性回歸模型更優(yōu)。
表2 2018年如東站的模式原始預報和兩種訂正方法的效果評估Table 2 The effect comparison of forecasted by model and corrected wind speeds by two methods at Rudong Station in 2018
從整個檢驗樣本時段的時序圖來看(圖5),在每個強風事件的波峰處,模式預報的風速均是明顯偏小于觀測的,經過兩種方法訂正后,風速均有一定增加,且基本在每個強風事件的波峰處一元線性回歸法訂正風速的誤差均高于決策樹訂正風速的誤差,比觀測風速偏小相對較多。
圖5 2018年如東站強風序列集檢驗時段觀測、模式預報、兩種訂正方法的風速時序變化Fig.5 Temporal variation of observed, forecasted by model and corrected by two methods wind speeds in gale event test periods at Rudong Station in 2018
部分波峰處(如序號1~15和94~100)決策樹訂正后風速偏大于觀測,是因為建模樣本相對較少,供模型學習分類的歷史事件不足,導致一些天氣型未學習到,將輸入的新時序作為類似于7月12—14日觀測出現(xiàn)較長的強風事件中,對預報風速明顯偏小的天氣型進行訂正,導致訂正相對實況偏大。
3.3.3 最強強風事件評價
從檢驗時段中,以觀測風速的最大值為條件篩選出了最強強風事件(2018年11月16日05時至17日05時的強風事件)。圖6給出了這次強風事件的時序圖,該次強風事件因為東亞大槽東移,地面冷鋒南壓,帶來一股股強冷空氣形成大風降溫事件??梢钥吹?6日05—10時風速較大,為12~18 m·s-1,此為該次事件的第一個波峰,隨后風速逐漸回落到10 m·s-1左右再次增大,18—22時為第二個波峰,風速約為12~14 m·s-1,此后回落到最低7 m·s-1左右。模式預報出了第一個波峰,但是模式預報的波峰風速明顯小于實況,可能是因為該觀測站位于近海,從陸地到海洋的下墊面變化使得風力增強,而模式對地形變化的刻畫能力不足導致了誤差,且模式對第二個波峰幾乎沒有體現(xiàn),一元線性回歸訂正后也僅僅是增加了風速值,整體形態(tài)和模式預報一致,沒有預報出第二個波峰,而決策樹訂正后的風速序列能明顯看出兩個波峰,如上文所述,決策樹可看作是通過建模時段輸入的預報風速序列學習劃分不同天氣型,從而根據新的預報風速序列判斷對應天氣型的過程,此處決策樹模型學習到了出現(xiàn)雙波峰的天氣型,因此增大了第二個波峰處的訂正風速,從而訂正出第二個波峰。
圖6 2018年11月16日05時至17日05時如東站的觀測、模式預報兩種訂正方法的風速對比Fig.6 Comparison of observed, forecasted by model and corrected by two methods wind speeds at Rudong Station from 05:00 BT 16 to 05:00 BT 17 November 2018
此外,從這次事件的風速最大值來看:觀測風速最大值為16.81 m·s-1(7級),模式預報風速為12.82 m·s-1(6級),一元線性回歸訂正風速為13.68 m·s-1(6級),決策樹訂正風速為15.62 m·s-1(7級),模式預報和一元線性回歸訂正的風速均明顯低于觀測風速,誤差分別為3.99 m·s-1和3.13 m·s-1,而決策樹訂正的風速將誤差縮小到1.19 m·s-1。從最大強度和序列形態(tài)上看,決策樹訂正后的風速都更接近觀測,適合用作海上施工作業(yè)中的強風預警。
在業(yè)務化應用時,可以首先對預報風速采用等分位法識別強風事件,若識別到強風事件,則對強風事件對應時間段的預報風速采用上述決策樹模型做訂正,并替換模式預報的該時間段風速,其余非強風事件時段的預報風速則采用原始模式預報風速。
針對海上施工作業(yè)對氣象條件的要求,本文定義了一種持續(xù)性強風事件識別方法。利用GDFS模式資料,采用實況與預報相結合的方法,設計并比較了三種預報強風識別方案,根據評估結果選出了最優(yōu)識別方案。在其基礎上,采用一元線性回歸和決策樹方法對預報強風事件的風速序列進行訂正,并開展了整體訂正效果評估和典型過程訂正效果分析,得到了以下結論:
(1) 與原始模式預報相比,消偏法和等分位法均能夠有效提高預報強風事件的識別命中率,而等分位閾值方案更優(yōu),其識別命中率達到76.1%,匹配時長命中率達87.6%。
(2)采用消偏法和等分位法均能增加識別強風事件的時長、減少漏報,其中等分位法識別的預報強風時長與觀測非常接近,且能明顯增加對影響時間較短的觀測強風事件的命中率。
(3)采用等分位法識別的強風事件基本可以覆蓋到各次觀測強風事件的全程,有利于精準給出強風預警的開始和結束時間。
(4)一元線性回歸和決策樹模型都能一定程度上減少強風事件中風速預報的誤差,其中決策樹相比一元線性回歸模型更優(yōu)。
(5)從最大強度和序列形態(tài)上看,由決策樹訂正后的風速比一元線性回歸訂正后的風速更接近實況。
本文研究了海上觀測的持續(xù)性強風事件特征并分析了模式的預報表現(xiàn),給出了影響海上施工安全的持續(xù)性強風事件的識別方法及基于敏感性參數(shù)的預報強風識別方案和預報序列強度的訂正方法,有效改進了強風事件預報能力,但仍然存在一些強風事件漏報或預報事件相對觀測事件的時長偏短的現(xiàn)象。此外,因為資料時長較短,做決策樹訂正建模時,數(shù)據相對較少且部分天氣型未學習到,會導致部分訂正偏大,未來可考慮引入風向因子并增加資料時長,根據觀測強風事件進行分類,從而歸納不同風向的強風事件,再構建訂正模型,嘗試進一步降低漏報和減少空報。另外,本文只采用了一個模式對一個海上觀測點的數(shù)據做研究,得到的預報強風事件識別方案仍有一些局限性。對于其他模式預報,若預報本身與觀測風速的相關性太差,可能難以通過上述方法來提高預報強風事件的預報能力。此外,在中國各海域的強風特征也不盡相同,所以識別方法和訂正方法有待進一步研究。