蔡蓉蓉,張紅武,卜海磊,張 宇
(1. 清華大學(xué)水沙科學(xué)與水利水電工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100084;2. 鄭州清大水利工程技術(shù)咨詢有限公司,河南鄭州 450003)
黃河流域的徑流主要來(lái)自內(nèi)蒙古自治區(qū)托克托縣河口鎮(zhèn)以上,泥沙主要來(lái)源于河口鎮(zhèn)以下至陜西潼關(guān)之間,水沙異源[1],且黃河歷來(lái)“水少沙多,水沙關(guān)系不協(xié)調(diào)”,加上下游洪災(zāi)頻發(fā)[2-3],下游河段淤積嚴(yán)重,成為舉世聞名的“地上懸河”。1960 年代以來(lái),黃河下游洪水漫灘機(jī)遇減少,泥沙主要淤積在主槽及嫩灘,形成“二級(jí)懸河”[4]。下游水沙條件大為改變后,一些河段“二級(jí)懸河”發(fā)展迅速[5],“二級(jí)懸河”形勢(shì)依然嚴(yán)峻[6],河道治理仍面臨挑戰(zhàn)。河床的沖淤變形與水沙組合(徑流量與輸沙量組合)類型密切相關(guān),研究黃河的水沙組合類型有助于深入了解黃河水沙特點(diǎn)、進(jìn)一步揭示河床沖淤變形規(guī)律,對(duì)判斷未來(lái)的水沙情勢(shì)及制定黃河未來(lái)治理方略大有裨益。
黃河水沙變化研究,一直是制定黃河治理開發(fā)方案的基礎(chǔ)和難點(diǎn),也是技術(shù)界關(guān)注與爭(zhēng)論的焦點(diǎn),尤其自1980 年代以來(lái),有關(guān)部門先后圍繞該問(wèn)題開展相關(guān)項(xiàng)目的科學(xué)研究,取得了一系列成果[7]。特別地,有學(xué)者利用經(jīng)驗(yàn)或理論方法,利用實(shí)測(cè)水沙資料對(duì)黃河的水沙關(guān)系展開了有關(guān)研究。尹學(xué)良認(rèn)為大水期黃河河槽發(fā)生沖刷、小水期發(fā)生淤積,提出山東段黃河河槽的沖淤分界流量在1800 m3/s左右[8]。邰淑彩借鑒并改進(jìn)了劉善均研究水文站典型水沙年的方法,與劉善均[9]認(rèn)為河流的水量和沙量一般呈正相關(guān)關(guān)系不同,邰淑彩[10]認(rèn)為黃河的水量和沙量可呈現(xiàn)出非正相關(guān)關(guān)系,她仍將水(沙)豐隸屬度及其均值作為分類依據(jù),利用閾值β(水沙大年下限)、a(水沙中年界限)、α(水沙小年上限),對(duì)渭河華縣站的水文泥沙年資料進(jìn)行分類并選取了包括小水大沙年在內(nèi)的典型水沙年。目前,黃河水沙情勢(shì)已發(fā)生改變[7],沙量銳減。實(shí)測(cè)資料表明,黃河中游潼關(guān)站年輸沙量已由年均16億t(1919—1959年)銳減至不足3億t(2000—2018年)。信忠保等學(xué)者[11]認(rèn)為退耕還林還草工程使植被恢復(fù)可能是導(dǎo)致相應(yīng)區(qū)域產(chǎn)沙量顯著下降的重要原因。馬麗梅、趙躍中、蔣觀滔等學(xué)者[12-14]的研究也給出了類似結(jié)論,都表明植被覆蓋面積不斷恢復(fù)是黃河沙量銳減的重要原因。由于黃河問(wèn)題的復(fù)雜性與研究的重要性,“十三五”期間,國(guó)家重點(diǎn)研發(fā)計(jì)劃首批設(shè)立“黃河流域水沙變化機(jī)理與趨勢(shì)預(yù)測(cè)”項(xiàng)目(2016YFC0402400),對(duì)黃河水沙關(guān)系及水沙變化機(jī)理繼續(xù)展開深入研究。
近年來(lái),以人工神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)方法在水科學(xué)研究中得到了廣泛應(yīng)用[15],有學(xué)者已將神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于降雨、徑流預(yù)報(bào)及模擬等研究中[16],這為研究黃河水沙關(guān)系提供了新的方法。自組織映射(Self-Organizing Map,SOM)模型作為一種典型的神經(jīng)網(wǎng)絡(luò)模型,具有聚類、模式識(shí)別等眾多功能,如伊璇等[17]利用該模型進(jìn)行了滇池流域的分類和無(wú)資料區(qū)的徑流模擬。鑒于黃河中游潼關(guān)站來(lái)沙量基本能反映黃土高原的侵蝕量及產(chǎn)沙強(qiáng)度[18],同時(shí)考慮到由于黃河支流伊洛、沁河的匯入及三門峽水庫(kù)與小浪底水庫(kù)的攔截作用,潼關(guān)站與花園口站相比,年徑流量一般偏小,年輸沙量一般偏大,可以說(shuō)潼關(guān)站水沙條件更為不利。本文選取潼關(guān)站為代表站,利用該站的實(shí)測(cè)水沙資料,基于自組織映射-K均值聚類耦合方法(以下簡(jiǎn)稱SOM-K法),對(duì)該站的水沙組合進(jìn)行分類,揭示出不同階段各水沙組合類型的變化規(guī)律,為深入了解黃河中下游潼關(guān)以下河段水沙變化特點(diǎn)提供參考。
2.1 SOM模型Kohonen參考人腦神經(jīng)元的特性,于1982年提出SOM模型[19]。SOM是一種無(wú)監(jiān)督學(xué)習(xí)模型,可將復(fù)雜的高維輸入數(shù)據(jù)通過(guò)非線性映射反映到低維(一般是二維)網(wǎng)格,并保留數(shù)據(jù)的拓?fù)潢P(guān)系,從而對(duì)輸入數(shù)據(jù)進(jìn)行有效聚類[19]。SOM 模型由輸入層和可代表網(wǎng)格拓?fù)浣Y(jié)構(gòu)的輸出層組成,輸入(出)層由存放輸入(出)向量的神經(jīng)元組成,通常情況下,輸出神經(jīng)元以二維網(wǎng)格的形式排列,每一個(gè)輸入神經(jīng)元與每一個(gè)輸出神經(jīng)元間通過(guò)權(quán)值向量連接(圖1)[20]。
圖1 SOM模型結(jié)構(gòu)
在利用SOM 模型進(jìn)行聚類分析前,需明確距離度量方法,數(shù)據(jù)初始化、數(shù)據(jù)訓(xùn)練所采用的算法類型,確定SOM 模型的網(wǎng)絡(luò)尺寸、網(wǎng)格及映射類型、鄰域類型、訓(xùn)練次數(shù)等參數(shù)。實(shí)踐中一般使用歐氏距離作為距離度量方法,采用隨機(jī)初始化方法(random initialization)進(jìn)行數(shù)據(jù)初始化[21]。批量訓(xùn)練(batch training)算法中每次將所有數(shù)據(jù)向量輸入模型,順序訓(xùn)練(sequential training)算法中每次僅輸入一個(gè)數(shù)據(jù)向量[22],前者可節(jié)省計(jì)算時(shí)間,更適用于實(shí)際[21]。輸出層神經(jīng)元數(shù)量確定方法沒(méi)有統(tǒng)一的標(biāo)準(zhǔn):Melssen 等[23]認(rèn)為,輸出層神經(jīng)元數(shù)量應(yīng)大于所期望聚類組數(shù)的2 倍并遠(yuǎn)小于輸入數(shù)據(jù)的樣本數(shù);Lin等[24]認(rèn)為輸出層神經(jīng)元數(shù)量應(yīng)盡可能大以確保得到最大的分類;Abrahart等[25]及Parasuraman 等[26]采用反復(fù)試驗(yàn)(trial and error)的方法選取輸出層神經(jīng)元數(shù)量;亦可根據(jù)樣本數(shù)量n采用公式m=5 n 確定輸出層神經(jīng)元數(shù)量m[22],并根據(jù)輸入數(shù)據(jù)協(xié)方差矩陣最大兩個(gè)特征值的比例確定網(wǎng)格的邊長(zhǎng)比[27]。為便于可視化,網(wǎng)格類型(grid shape)一般采用六邊形(hexagonal),映射類型(map shape)一般定為片狀(sheet)[27]。在水資源領(lǐng)域使用SOM 模型時(shí),一般選擇高斯(Gaussian)鄰域函數(shù)[15]。使用順序訓(xùn)練算法時(shí),為使結(jié)果收斂,訓(xùn)練次數(shù)應(yīng)至少是輸出層神經(jīng)元數(shù)量的500倍[27]。本文利用mean quantization error(QE)與topographic error(TE)度量SOM模型的聚類效果,QE代表輸入向量與獲勝神經(jīng)元的平均距離,TE代表數(shù)據(jù)中第一獲勝神經(jīng)元與第二獲勝神經(jīng)元不相鄰的比例。QE和TE越小,說(shuō)明SOM模型的運(yùn)算結(jié)果越好,但對(duì)于小尺寸網(wǎng)格TE并非決定性因素[28]。
2.2 K均值聚類法K均值聚類法是一種尋找輸入數(shù)據(jù)集中未知子類的無(wú)監(jiān)督學(xué)習(xí)方法,旨在將輸入數(shù)據(jù)劃分到指定數(shù)量的類中,使類內(nèi)差異盡可能小而類間差異盡可能大[29-30]。
K均值聚類法的算法步驟如下:(1)確定想要得到的輸入數(shù)據(jù)集的子類數(shù)K;(2)為每個(gè)輸入向量隨機(jī)分配一個(gè)1至K的編號(hào)作為該輸入向量的初始子類;(3)將各子類中輸入向量的均值向量作為相應(yīng)子類的類中心;(4)計(jì)算每個(gè)輸入向量與各子類類中心的距離,將每個(gè)輸入向量分配到距離其最近的類中心所在的子類中;(5)計(jì)算調(diào)整后新類的類中心,重復(fù)步驟(4),直至迭代結(jié)束或者子類類中心沒(méi)有任何變化[30]。K均值聚類法得到的可能是局部最優(yōu)解,所得結(jié)果依賴于步驟(2)中輸入向量的類別初始化情況,因此,必須多次運(yùn)行步驟(2)—(5),選擇一個(gè)最優(yōu)的情況[30]。
2.3 SOM-K法SOM模型具有自組織性,算法簡(jiǎn)單,但SOM模型網(wǎng)絡(luò)收斂時(shí)間過(guò)長(zhǎng)[31]。K均值聚類法效率較高,但聚類結(jié)果依賴于所選取的初始聚類中心,容易陷入局部最優(yōu)情況造成聚類效果不佳[31-32]。K均值聚類法處理噪聲數(shù)據(jù)的能力遜于SOM模型[33]。黃河徑流量與輸沙量數(shù)據(jù)變幅較大,變化規(guī)律十分復(fù)雜,為了取得較好的聚類效果,本文使用自組織映射-K均值聚類耦合方法,即SOM-K法進(jìn)行分析:將原始數(shù)據(jù)(矩陣尺寸n×b,n代表樣本數(shù)量,b代表特征個(gè)數(shù),考慮年徑流量及年輸沙量時(shí)b=2)輸入SOM模型得到輸出結(jié)果,該輸出結(jié)果(矩陣尺寸a×b,a為SOM模型輸出層神經(jīng)元數(shù)量)表示SOM模型對(duì)于原始數(shù)據(jù)矩陣的學(xué)習(xí)結(jié)果,將其作為K均值聚類法的輸入數(shù)據(jù)進(jìn)行訓(xùn)練,最終得到聚類結(jié)果。本文利用MATLAB SOM Toolbox 工具箱[34]實(shí)現(xiàn)SOM 模型,使用MATLAB R2017a 中的kmeans函數(shù)實(shí)現(xiàn)K均值聚類。
黃河發(fā)源于青藏高原巴顏喀拉山北麓,在山東省東營(yíng)市墾利區(qū)流入渤海,全長(zhǎng)約5464 km,流域面積約75萬(wàn)km2[2](圖2)。以內(nèi)蒙古自治區(qū)托克托縣河口鎮(zhèn)與河南省滎陽(yáng)市廣武鎮(zhèn)桃花峪為分界點(diǎn)將黃河分為上中下游三段。黃河上游長(zhǎng)約3472 km,流域面積約占總流域面積的51.3%;中游長(zhǎng)約1224 km,流域面積約占總流域面積的45.7%;下游長(zhǎng)約768 km,流域面積約占總流域面積的3.0%[2]。
圖2 黃河流域示意圖
本文利用1919—2018 年及1987—2018 年黃河中游潼關(guān)站的年徑流量及年輸沙量數(shù)據(jù)(均為日歷年數(shù)據(jù),其中潼關(guān)2018年輸沙量包括1億多噸萬(wàn)家寨等水庫(kù)排沙量,取為3.7億t),分別構(gòu)造水沙數(shù)據(jù)矩陣,矩陣維度分別為100行(即100年)2列(年徑流量,年輸沙量)及32行2列,基于SOM-K法進(jìn)行年尺度水沙組合類型分類。由于潼關(guān)站早期實(shí)測(cè)數(shù)據(jù)匱乏,1919—1951年采用陜縣站數(shù)據(jù)。年徑流量及年輸沙量數(shù)據(jù)單位不同,數(shù)量級(jí)上存在較大差異,故本文使用標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)標(biāo)準(zhǔn)化公式為:
式中:Xst為標(biāo)準(zhǔn)化后的數(shù)據(jù);為數(shù)據(jù)的平均值;σ為數(shù)據(jù)的標(biāo)準(zhǔn)差。
4.1 1919—2018年潼關(guān)站水沙組合分類將歐氏距離作為距離度量方法,選取隨機(jī)初始化方法、批量訓(xùn)練算法、六邊形網(wǎng)格形狀、片狀映射結(jié)構(gòu)、高斯鄰域函數(shù)配置SOM模型,訓(xùn)練次數(shù)選為輸出層神經(jīng)元數(shù)量的500倍。綜合多方面考慮,結(jié)合Melssen等提出的方法與反復(fù)試驗(yàn)法確定輸出層神經(jīng)元數(shù)量。根據(jù)前人經(jīng)驗(yàn),黃河的水沙組合可分為沙多水多、沙多水中、沙多水少、沙中水多、沙中水中、沙中水少、沙少水多、沙少水中及沙少水少9類,故輸出層神經(jīng)元數(shù)量宜大于18;由于輸入數(shù)據(jù)樣本數(shù)較少,且“遠(yuǎn)小于”的概念較為模糊,本文認(rèn)為輸出層神經(jīng)元數(shù)量上限取為樣本數(shù)的1/2 即可。將輸出層最大邊長(zhǎng)定為10,結(jié)合上述兩條原則,訓(xùn)練1919—2018年百年數(shù)據(jù)時(shí)共選取39組輸出層神經(jīng)元網(wǎng)格尺寸(表1)。每一種尺寸的SOM模型均進(jìn)行500次訓(xùn)練,選擇QE最小的一次結(jié)果作為各尺寸的最終結(jié)果。通過(guò)比較不同尺寸SOM模型的結(jié)果,將輸出層神經(jīng)元網(wǎng)格尺寸選為3×10,輸出層神經(jīng)元數(shù)量為30,該尺寸下500次訓(xùn)練的部分QE結(jié)果如表2所示(QE的最小值加粗表示)。
表1 輸出層神經(jīng)元網(wǎng)格尺寸(39組)
表2 部分試驗(yàn)QE結(jié)果(輸出層神經(jīng)元網(wǎng)格尺寸:3×10)
SOM模型的可視化聚類結(jié)果如圖3所示,W代表徑流量,Ws代表輸沙量,TG代表潼關(guān)站,兩個(gè)3×10六邊形拓?fù)浣Y(jié)構(gòu)代表兩個(gè)變量的標(biāo)準(zhǔn)化值分布,標(biāo)準(zhǔn)化值越大,六邊形顏色越深。采用K均值聚類法將SOM模型的結(jié)果分為4大類,使用輪廓值(silhouette value)[35]評(píng)價(jià)聚類效果。輪廓值在-1到1之間,如果大多數(shù)輸入向量擁有較大的輪廓值,可以認(rèn)為聚類結(jié)果是合理的,如果大多數(shù)輸入向量擁有較小或者為負(fù)數(shù)的輪廓值,表明聚類不合理,分得的子類數(shù)目可能過(guò)多或過(guò)少[35]。本次聚類效果如圖4所示,大多數(shù)輸入向量擁有較大的輪廓值,將輸入數(shù)據(jù)集分為4個(gè)子類是合理的。
圖3 SOM模型可視化聚類結(jié)果(1919—2018年數(shù)據(jù))
圖4 聚類效果圖(1919—2018年數(shù)據(jù))
潼關(guān)站4個(gè)子類的年徑流量及年輸沙量分布如圖5所示,依據(jù)各子類的年徑流量均值及年輸沙量均值將4個(gè)子類依次命名為沙少水中類型、沙多水多類型、沙多水中類型及沙中水中類型,各水沙組合的年徑流量均值及年輸沙量均值如表3 所示。值得注意的是,水沙組合類型中的“多”、“中”,“少”并非絕對(duì)的概念,而是與研究時(shí)期有關(guān)的相對(duì)值。
圖5 潼關(guān)站4個(gè)子類的年徑流量及年輸沙量分布(1919—2018年數(shù)據(jù))
表3 潼關(guān)站4種類型的水沙均值及出現(xiàn)頻率(1919—2018年數(shù)據(jù))
4種類型的出現(xiàn)頻率如表3所示,沙少水中類型出現(xiàn)頻率最大,為42%,沙多水多類型出現(xiàn)頻率仍有20%。周恩來(lái)總理曾指出“水土保持是根治開發(fā)黃河的基礎(chǔ)”[36],據(jù)《黃河水土保持志》記載,黃河流域的水土保持群眾運(yùn)動(dòng)在1958—1960年進(jìn)入高潮[37],張含英[38]認(rèn)為1960年是水土保持工作中具有決定意義的一年,劉瑞龍[39]在這一年提出必須大抓黃河中上游的水土保持工作,可以說(shuō)1960年是水土保持工作達(dá)到高潮并具有重要意義的一年。劉家峽及龍羊峽水庫(kù)分別建成于1968年10月及1986年10月[40],龍劉水庫(kù)的修建使黃河干流的水沙條件發(fā)生不小的改變[41]。1998 年特大洪水后朱镕基總理提出要“封山植樹、退耕還林”[42],國(guó)務(wù)院發(fā)出緊急通知,2000 年前要對(duì)毀林開墾的林地實(shí)現(xiàn)全部還林[43]。劉家峽水庫(kù)為不完全年調(diào)節(jié)水庫(kù),龍羊峽水庫(kù)雖為多年調(diào)節(jié)水庫(kù)改變了黃河上游的年際水量[44],但龍劉水庫(kù)聯(lián)合運(yùn)用主要影響徑流年內(nèi)分配,且黃河沙量主要來(lái)源于中游,潼關(guān)站年水沙量受龍劉水庫(kù)影響較小,故僅將1960 年及2000 年作為時(shí)間節(jié)點(diǎn)將1919—2018 年分為3 個(gè)階段:第1 階段為水土保持運(yùn)動(dòng)達(dá)到高潮前(1919—1960 年);第2 階段為水土保持運(yùn)動(dòng)達(dá)到高潮后至實(shí)施退耕還林前(1961—1999年);第3階段為實(shí)施退耕還林后(2000—2018年)。如表4所示,沙少水中類型主要在實(shí)施退耕還林后的時(shí)期出現(xiàn),在3 個(gè)階段中的出現(xiàn)頻率相對(duì)增加,這與現(xiàn)有認(rèn)識(shí)相符,說(shuō)明本文方法可將水沙類型正確分類;沙多水多及沙多水中類型出現(xiàn)在實(shí)施退耕還林前的時(shí)期,在3 個(gè)階段中的出現(xiàn)頻率相對(duì)減少;沙中水中類型在3 個(gè)階段中的出現(xiàn)頻率先增后減。1986 年以來(lái)黃河年徑流量及年輸沙量大幅度減少[45],這一點(diǎn)亦可通過(guò)水沙組合分類結(jié)果看出:1986 年后潼關(guān)站有利于下游河道輸沙的大水類型的出現(xiàn)幾率明顯減少(表5)??紤]到黃河水沙條件在1986年后的顯著變化,需將1986 年后潼關(guān)站的年徑流量及輸沙量數(shù)據(jù)進(jìn)行單獨(dú)分類,以明確黃河水沙條件發(fā)生顯著變化后潼關(guān)站水沙組合類型的變化。
表4 4種類型在3個(gè)階段中的出現(xiàn)頻數(shù)(頻率)(1919—2018年數(shù)據(jù))
表5 1986年后4種類型分別出現(xiàn)的頻率
4.2 1987—2018年潼關(guān)站水沙組合分類將輸出層最大邊長(zhǎng)定為10,訓(xùn)練1987—2018年的數(shù)據(jù)時(shí)共選取14組輸出層神經(jīng)元網(wǎng)格尺寸(表6)。每一種尺寸的SOM模型均進(jìn)行500次訓(xùn)練,選擇QE最小的一次結(jié)果作為各尺寸的最終結(jié)果。通過(guò)比較不同尺寸SOM模型的結(jié)果,將輸出層神經(jīng)元網(wǎng)格尺寸選為5×2,輸出層神經(jīng)元數(shù)量為10,該尺寸下500次訓(xùn)練的部分QE 結(jié)果如表7所示(QE 的最小值加粗表示)。
SOM模型的可視化聚類結(jié)果如圖6所示。采用K均值聚類法將SOM模型的結(jié)果分為2大類,本次聚類效果如圖7所示,大多數(shù)輸入向量擁有較大的輪廓值,將輸入數(shù)據(jù)集分為2個(gè)子類是合理的。
表6 輸出層神經(jīng)元網(wǎng)格尺寸(14組)
表7 部分試驗(yàn)QE結(jié)果(輸出層神經(jīng)元網(wǎng)格尺寸:5×2)
圖6 SOM模型可視化聚類結(jié)果(1987—2018年數(shù)據(jù))
圖7 聚類效果圖(1987—2018年數(shù)據(jù))
潼關(guān)站2個(gè)子類的年徑流量及年輸沙量分布如圖8所示。同樣地,依據(jù)各子類的年徑流量均值及年輸沙量均值將2個(gè)子類分別命名為沙中水中類型及沙少水中類型,各類型的年徑流量均值及年輸沙量均值的出現(xiàn)頻率如表8所示。
采用4.1 節(jié)中的處理方法,將1987—2018 年根據(jù)時(shí)間節(jié)點(diǎn)2000 年分為1987—1999 年及2000—2018年2個(gè)階段,2種類型在2個(gè)階段中的出現(xiàn)頻數(shù)(頻率)如表9所示??梢钥闯?,沙中水中類型的出現(xiàn)頻率相對(duì)減少,沙少水中類型的出現(xiàn)頻率相對(duì)增加。
圖8 潼關(guān)站2個(gè)子類的年徑流量及年輸沙量分布(1987—2018年數(shù)據(jù))
表8 潼關(guān)站2種類型的水沙均值及出現(xiàn)頻率(1987—2018年數(shù)據(jù))
表9 2種類型在2個(gè)階段中的出現(xiàn)頻數(shù)(頻率)(1987—2018年數(shù)據(jù))
4.3 結(jié)果討論比較表4及表9的結(jié)果,發(fā)現(xiàn)使用1919—2018年百年數(shù)據(jù)分析時(shí),沙中水中類型的出現(xiàn)頻率先增后減,而使用1987—2018年數(shù)據(jù)分析時(shí),該類型的出現(xiàn)頻率相對(duì)減少。給出百年數(shù)據(jù)分析結(jié)果中4種類型在1919—1960年、1961—1986年、1987—1999年及2000—2018年中的出現(xiàn)頻數(shù)(頻率),如表10所示,沙中水中類型在1987—1999年及2000—2018年出現(xiàn)頻率相對(duì)減少,與表9結(jié)果相符,而在1919—1960年及1961—1986年出現(xiàn)頻率明顯增加,使得從百年尺度上看沙中水中類型的出現(xiàn)頻率先增后減。
表10 4種類型在各時(shí)期中的出現(xiàn)頻數(shù)(頻率)(1919—2018年數(shù)據(jù))
確定水利工程的設(shè)計(jì)及校核洪水時(shí)往往采用洪水頻率分析成果,目前我國(guó)選用皮爾遜Ⅲ型曲線作為未知的洪水總體頻率曲線線型[46],從而根據(jù)擬合曲線確定出設(shè)計(jì)洪水成果,例如將曲線上P=0.1%時(shí)的洪峰流量視為尚未發(fā)生過(guò)的千年一遇洪水洪峰流量。將水沙組合類型中出現(xiàn)頻率最大的一組水沙組合(最高頻水沙組合)下的徑流量及輸沙量視為水沙組合類型特征值,參考洪水頻率分析方法中使用頻率分析成果確定未發(fā)生過(guò)洪水的思路,認(rèn)為此特征值可能較接近未來(lái)實(shí)際情況。4.1節(jié)與4.2 節(jié)的分析表明,兩種時(shí)間尺度(1919—2018 年與1987—2018 年)下出現(xiàn)頻率最大的水沙組合類型(均為沙少水中類型)對(duì)應(yīng)的年徑流量均值及年輸沙量均值分別為249 億m3及5.3 億t 與211.2 億m3及3.1億t,此種差異產(chǎn)生的原因主要是時(shí)間尺度不同造成潛在分類閾值不同,即不同的時(shí)間尺度上對(duì)于黃河水沙豐度的衡量標(biāo)準(zhǔn)也是動(dòng)態(tài)變化的。由王遠(yuǎn)見等學(xué)者的研究成果[47],黃河源區(qū)1959—2017年的年降雨量有顯著的增加趨勢(shì),由靳少波等學(xué)者的研究成果[44],2007—2016年唐乃亥以上14站平均降雨量較1967—2016年多年均值增加6.2%,鑒于近些年降雨量有所增加的趨勢(shì),綜合4.1節(jié)與4.2節(jié)結(jié)果,為留有一定安全余地,黃河中下游潼關(guān)以下河段年徑流量特征值宜選用1919—2018年分析成果,即249億m3。劉曉燕等學(xué)者的研究成果[48]表明,1980年代后,龍門、咸陽(yáng)、張家山、河津及狀頭等水文斷面以上地區(qū)單位降雨產(chǎn)沙量(產(chǎn)沙強(qiáng)度)明顯降低,考慮到黃河流域通過(guò)水土保持措施使得沙量明顯減少且基本不會(huì)大幅度增加的事實(shí),表明未來(lái)潼關(guān)以下自然狀況下,實(shí)際年輸沙量一般不會(huì)超過(guò)表9 與表10 中2000—2018 年階段沙少水中類型的年輸沙量均值2.4 億t。綜合兩節(jié)結(jié)果,黃河中下游潼關(guān)以下河段年輸沙量特征值選用1987—2018年分析成果即可,即3.1億t。此外,值得注意的是,1987年后沙中水中類型的出現(xiàn)頻率超過(guò)30%,為留有一定安全余地,如為在黃河中下游修建水庫(kù)時(shí)留出充足的淤積庫(kù)容,應(yīng)將沙中水中類型年輸沙量均值7.9 億t(約為8 億t)亦考慮在內(nèi),作為黃河干流修建大型工程及下游治理方案論證的沙量特征值。鑒于問(wèn)題的復(fù)雜性,黃河中下游潼關(guān)以下河段水量和沙量特征值的確定有待進(jìn)一步深入研究。
本文利用自組織映射-K均值聚類耦合方法對(duì)黃河中游潼關(guān)水文站1919—2018年的年徑流量及年輸沙量數(shù)據(jù)進(jìn)行分析,將潼關(guān)站的水沙組合分為沙多水多、沙多水中、沙中水中及沙少水中4 種類型。沙少水中類型的出現(xiàn)頻率最大,為42%,沙多水多類型的出現(xiàn)頻率仍有20%。將研究時(shí)段分為水土保持運(yùn)動(dòng)達(dá)到高潮前(1919—1960年)、水土保持運(yùn)動(dòng)達(dá)到高潮后至實(shí)施退耕還林前(1961—1999年)及實(shí)施退耕還林后(2000—2018年)3個(gè)階段,發(fā)現(xiàn)沙少水中類型主要在實(shí)施退耕還林后的時(shí)期出現(xiàn),在3個(gè)階段中的出現(xiàn)頻率相對(duì)增加;沙多水多及沙多水中類型出現(xiàn)在實(shí)施退耕還林前的時(shí)期,在3個(gè)階段中的出現(xiàn)頻率相對(duì)減少;沙中水中類型在3個(gè)階段均有出現(xiàn),出現(xiàn)頻率先增后減。
考慮到近期黃河水沙條件的顯著變化,利用自組織映射-K 均值聚類耦合方法對(duì)1986 年后(1987—2018年)潼關(guān)站的年徑流量及年輸沙量數(shù)據(jù)進(jìn)行分析,將潼關(guān)站的水沙組合分為沙中水中及沙少水中2 種類型,沙少水中類型的出現(xiàn)頻率為65.625%。將研究時(shí)段分為1987—1999 年及2000—2018年2個(gè)階段,發(fā)現(xiàn)沙少水中類型出現(xiàn)頻率相對(duì)增加,沙中水中類型出現(xiàn)頻率相對(duì)減少,與百年分類結(jié)果的差異體現(xiàn)出黃河水沙變化的復(fù)雜性。
基于自組織映射-K均值聚類耦合方法的潼關(guān)站水沙組合分類可較好地反映出實(shí)測(cè)水沙特性,有助于深入了解黃河中下游水沙變化特點(diǎn),潼關(guān)站水沙組合特征值亦可為黃河中下游水沙變化研究提供參考。