班友康 梁 云 雷冠軍
(1.中水三立數(shù)據(jù)技術股份有限公司,安徽 合肥 230000;2.華北水利水電大學,河南 鄭州 450045)
翁文波院士研究指出洪水的發(fā)生時間有可公度性,而且可公度性原理可用于旱澇、地震等自然災害的預報,從而發(fā)展成為預測論??晒确椒ㄟ\用于洪水災害的預報,主要從兩個方面展開:一是基于可公度方法尋找序列的周期進行預報;二是基于預報年的可公度數(shù)進行預報。周期性分析可運用概周期的特征,構建可公度網(wǎng)絡結構對未來進行預報。可公度理論是對數(shù)據(jù)規(guī)律的一種挖掘和表述,至今尚無理論推導和證明。隨著數(shù)據(jù)序列的延長,可公度數(shù)會相應增加,如何基于可公度數(shù)對事件發(fā)生的時間進行預報,是可公度理論的關鍵問題?;谌⑽逶?、七元的可公度數(shù)信息,進一步挖掘數(shù)據(jù)中隱藏的規(guī)律。彭高輝采用關聯(lián)規(guī)則挖掘的方法對可公度數(shù)進行再判定,預報結果的正確率得到較大的提高。李文龍選用東北地區(qū)洪災年份、豐滿水庫豐水年份為樣本,基于可公度方法能夠預測出2013年為大洪水年,然而由于所列舉的其他未來年份的可公度式與2013年的式子排序接近,對其他年份的判定和選擇缺乏可行的方法。彭卓越運用點面結合的方法選用五類不同的樣本對松花江流域2017年的大洪水年進行預報,其根據(jù)預報年份三元可公度式的個數(shù)判定未來易發(fā)大洪水的年份[1-4]。
目前,已有的可公度法單純基于三元可公度數(shù)的計算結果進行分析,三元、五元、七元可公度數(shù)涉及多元指標,如何基于多元可公度數(shù)對極端經(jīng)流年進行預報,尚未見諸相關研究。本文基于三元、五元、七元點面結合可公度計算結果,引入Topsis-模糊綜合評判的方法對預報年份可公度性排序進行分析,綜合分析同一事件的多元可公度特征,研究預報年可公度數(shù)的規(guī)律,提高預報結論的準確率[5-6]。
點面結合法基于可公度信息預測基本原理,根據(jù)單個站點(點)和流域(面)歷史水文數(shù)據(jù),分別計算單個站點(點)和流域(面)的可公度性,通過綜合分析對流域極端徑流年進行預報[7]。
可公度信息預報技術基本原理可表達如下:
(1)
式中:{t}?{s},即預報年份不出現(xiàn)在可公度公式;It為整數(shù);l為構成可公度式的元素個數(shù)。
必須有兩個及以上的可公度公式來驗證可公度公式,上述可公度值排列為一個單調(diào)遞增的集合:
{Xs1,Xs2,…,Xsm}
(2)
若是其滿足:
|Xsm-Xs1|≤ε
(3)
當ε=0時說明該樣本是完全可公度的;若ε>0,則該ΔX為[-ε,ε]區(qū)間可公度灰周期??晒裙絺€數(shù)m值越大,ε值越小,其預報精度越高。
其中適合外推預報的模型有三種:三元可公度模型、五元可公度模型、七元可公度模型,分別為基于三個、五個、七個樣本年中的因子對未來進行預報。
Topsis-模糊綜合評判法是在Topsis-余弦法的基礎上,采用Topsis法確定權重,用模糊綜合評判法進行評價的方法[8]。Topsis法用是基于歸一化后的原始數(shù)據(jù)矩陣,找出所提出方案中的最優(yōu)方案與最劣方案,進而計算出所要評價的對象與最優(yōu)方案和最劣方案間的距離,從而計算出所要評價的對象與最優(yōu)方案的相對接近程度大小。
簡要計算步驟如下:設有n個評價對象,m個評價指標,則原有數(shù)據(jù)形式如下:
(4)
a.指標數(shù)據(jù)趨同化處理。
b.趨同化后數(shù)據(jù)的無量綱化處理與Topsis-余弦法相同,在此只對權重的計算和模糊綜合評判進行分析。
c.構造加權系數(shù)矩陣:
(5)
(6)
(7)
確定出各指標的權重θ1,θ2,…,θn,以它們?yōu)橹鲗窃貥嬙鞂蔷仃嚘?,其他元素?。則,加權系數(shù)矩陣為
(8)
d.確定最優(yōu)方案和最劣方案。最優(yōu)方案每列中的最大值組成向量為z+,最劣方案每列中的最小值組成向量為z-。
f.利用Topsis定權的模糊綜合評判模型。將Z轉置并歸一化得到各評價指標的評判矩陣為
(9)
則由正負理想解確定的綜合評向量分別為
w+=z+V,w-=z-V
(10)
歸一化綜合評判向量,得到各向量組合的隸屬度,基于最大隸屬度原則,得到所評價對象的綜合排序。
可以全流域范圍內(nèi)的大洪水年份和待預報地區(qū)臨近點的極端徑流年為樣本,對流域極端來水年份進行預報。極端徑流年有極端豐水年和極端枯水年兩類,極端豐水年的極端枯水特征一定最不顯著[9]。改進點面結合可公度預報方法思路如下:
a.在可公度性分析的基礎上,運用Topsis-模糊綜合評判法綜合分析各個樣本系列的三元、五元、七元可公度數(shù),確定其相應排序[10]。
b.基于點面結合可公度計算結構,將點樣本和面樣本的排序,運用Topsis-模糊綜合評判法綜合分析確定豐水年的排序。
c.基于點面結合可公度計算結構,根據(jù)點樣本和面樣本的排序,運用Topsis-模糊綜合評判法綜合分析確定枯水年的排序。
d.綜合預報站點的極端豐水年排序、極端枯水年排序的補集,運用Topsis-模糊綜合評判法進行綜合評判,預報極端徑流可能發(fā)生的年份。
基于改進的點面結合可公度法的計算步驟如下:
a.首先對樣本系列的可公度性進行檢驗,分析統(tǒng)計樣本年的概周期。
b.基于可公度性基本原理,基于所選流域或控制站點的特豐樣本、特枯樣本計算預報年的三元、五元、七元可公度數(shù)。
c.基于綜合評判法分別對特豐水年、特枯水年的可公度數(shù)進行綜合排序;對特豐水年排序、樣本容量-特枯水年排序進行綜合評判,分析流域極端徑流年的綜合排序。
收集整理東北地區(qū)、豐滿水庫、白山水庫、云峰水庫、鏡泊湖水庫歷史徑流系列,得到研究所需樣本數(shù)據(jù)。
表1給出了東北地區(qū)、豐滿水庫、白山水庫、云峰水庫、鏡泊湖水庫可公度計算結果。由表可知,東北地區(qū)歷史徑流序列涉及松花江和遼河流域,因子特性存在不同的可公度性。東北地區(qū)15年序列具有21年、25年的概周期。對于1856年、1957年、1962年、1981年、1998年,與其他因子的組合不存在嚴格的可公度性。白山水庫11個樣本的極端樣本特征顯著性好。豐滿水庫年概周期是2年、5年,說明挑選的樣本存在非單一的概周期值,需基于多個概周期進行預報。云峰水庫具有較好的可公度性,概周期為5年和2年。鏡泊湖水庫具有較好的可公度性,概周期為3年和2年。
表1 可公度計算結果
對東北地區(qū)洪災樣本、豐滿水庫及其鄰近流域的4類樣本進行分析,可知其來水量的特征值均具有不完全的可公度性,樣本可公度性的概周期不唯一??晒确椒ㄊ乔螽惙椒?,單憑樣本年份進行加減確定的只能是可能發(fā)生的年份,三元、五元、七元可公度數(shù)前幾位存在不一致的情況,需要綜合對多元可公度計算結果進行綜合評判。
2.2.1 特豐水年可公度數(shù)計算結果與分析
根據(jù)東北地區(qū)、白山水庫、豐滿水庫、云峰水庫、鏡泊湖水庫的樣本數(shù)據(jù),以2000—2018年為預報年,將已有的樣本年中的2000年后的樣本值除去,分別計算出2000—2018年的五個樣本中的可公度數(shù),見表2。由表可知,三元可公度數(shù)最大值重合的年份只有東北地區(qū)的2004年和云峰水庫的2004年;最小值重合的年份只有云峰水庫的2011年和鏡泊湖水庫的2011年。東北地區(qū)、白山水庫、豐滿水庫、云峰水庫以及鏡泊湖水庫的極豐、豐水年的年份并不一致,不能僅基于三元可公度數(shù)進行判別。五元可公度數(shù)分析結果表明,最大值年份均不重合,位于2000—2005年區(qū)間范圍內(nèi)的年份較多;最小值年份均不重合,位于2016—2018年區(qū)間范圍內(nèi)的較多。七元可公度數(shù)分析結果表明,白山水庫的可公度數(shù)波動較小,其他可公度數(shù)變化較大,最大值在2001年的概率較大,最小值在2018年的概率較大。
表2 可公度數(shù)計算結果特征值
2.2.2 特枯水年可公度數(shù)計算結果與分析
以松花江流域特枯水年為樣本,對其可公度性進行分析可知,豐滿水庫特枯水年的可公度性較好。而對于1989年、1997年,二者缺乏其他由因子共同構成的可公度集合。基于可公度的方法對其預報年的可公度數(shù)進行計算,見表2。分析可知,可公度數(shù)最大值年為2001年,最小值年為2015年,若是由可公度數(shù)大的年份其發(fā)生極端事件的概率大的原則來判斷,2001年發(fā)生特枯水年的概率最大,2015年發(fā)生特枯水年的概率最小。實際徑流數(shù)據(jù)表明松花江流域2015年是特枯水年,2001年是平水年,與可公度方法的計算結果不一致,需要綜合三元、五元、七元可公度數(shù)綜合分析預報極端徑流年狀況。
本次研究選用的站點是松花江流域及主要控制站點,對每個站點進行三元、五元、七元可公度數(shù)計算分析,可得其各自對應預報年份的豐枯排序。運用點面結合可公度法,可對五個樣本的預報年排序進行綜合評判,得到預報年的豐枯排序結果。
若特豐水年發(fā)生的概率最大,則其特枯水年發(fā)生的概率最小,將特豐水年的排序和特枯水年排序的補集(樣本容量-特枯水年排序)進行綜合評判,最終排序結果為松花江流域未來發(fā)生特豐水年或是大水年的排序,其排序越靠前,則其發(fā)生特豐水年可能性越大[11]。
由圖1可知,如果將東北地區(qū)、白山水庫、豐滿水庫、云峰水庫、鏡泊湖水庫的可公度計算結果的前五位值作為松花江流域的極端徑流年,由于樣本的可公度元在二、三、五的較多,越靠前的年份可公度數(shù)比越靠后的大,因而無法判別。運用Topsis-模糊綜合評判的方法對三元、五元、七元的可公度數(shù)進綜合分析,結果見表3。由表3可知,豐水年靠前的年份中只有東北地區(qū)對應的2013年、豐滿水庫對應的2005年和鏡泊湖水庫對應的2005年,其余前五位的年份多為枯水年。根據(jù)豐滿水庫特枯水年樣本系列,對2000—2018年進行預報,其前五位中枯水年有4個,也局限于年份靠前的樣本中。通過增強樣本鄰近年份的可公度數(shù)進行預報,較遠年份的可公度數(shù)較小。
圖1 Topsis-模糊綜合評價排序結果(排序值越小,排序越靠前)
表3 不同站點的綜合排序前五位來水特征
對特豐水年、特枯水年排序的補集進行綜合評判,能夠有效地將離樣本年較遠且排位靠前的特豐水年的概率進行放大,同時進一步綜合檢驗鄰近年是否會發(fā)生特豐水年。對于特豐水年排位靠前,且特枯水年排位靠后的年份,發(fā)生特豐水和大水年的概率較大,反之亦然。由綜合評判分析結果可知,2005年豐水年得到了保留,同時對2013年、2010年特豐水年的可能性進行了放大,預報結果存在誤差使得2015年的特枯水年、2002年的枯水年進入了前五位。2002年和2005年進入前五位,說明該方法對于臨近年份的特征能夠加以保留;2010年、2013年進入前五位,說明該方法對未來年份的特征能夠進行放大。其進入前五位的年份中,包含2個特豐水年,1個豐水年,預報準確率為60%。綜合評判方法能夠挖掘可公度數(shù)中蘊藏的信息,提高極端徑流預報的準確率。
由上述分析可知,僅基于三元、五元、七元可公度數(shù)對未來的年份進行預報,其臨近年份的可公度數(shù)較大?;跇O端豐水年和極端枯水年綜合評判的方法,對于極端豐水年顯著、極端枯水年不顯著的特性進行放大,評判出易發(fā)生極端徑流的年份。從豐滿水庫綜合評判結果來看, 2013年、2010年特豐水年排在1、3位,2005年豐水年排在第4位,說明該方法能夠對極端豐水年進行有效識別。而2015年為特枯水年排在第2位,2002年為特枯水年排在第5位,說明該方法依然存在虛報現(xiàn)象。
本文針對如何綜合利用多元可公度方法提高極端徑流年預報準確率的問題,從預報年可公度數(shù)基本規(guī)律分析與挖掘的角度,運用Topsis-模糊綜合評價法對點面結合可公度法進行改進,在點面結合可公度數(shù)計算的基礎上,綜合三元、五元、七元可公度數(shù),結合極端豐水特征和極端枯水特征,預報極端徑流年。該方法提高了極端徑流年預報的準確率,但是依然存在虛報的情況,需要結合其他尺度的預報因子對預報年特征進一步判別。