李志新,賴志琴,龍?jiān)颇旃鸷?/p>
(貴州理工學(xué)院土木工程學(xué)院,貴陽 550003)
水資源合理配置是為了保障經(jīng)濟(jì)社會(huì)可持續(xù)發(fā)展以及水資源可持續(xù)利用,在一定范圍內(nèi),根據(jù)有效、公平和可持續(xù)的原則,按照市場經(jīng)濟(jì)規(guī)律進(jìn)行資源配置,通過科學(xué)合理的調(diào)節(jié)需求與供給關(guān)系、維護(hù)和改善生態(tài)環(huán)境等途徑,在區(qū)域或用水部門間對水源進(jìn)行的調(diào)配活動(dòng),在提高經(jīng)濟(jì)社會(huì)效益方面具有重要意義。
在水資源配置中,影響因素眾多,且其互相影響、制約機(jī)制非常復(fù)雜,表現(xiàn)形式多樣,水資源配置模型很難充分反映這些不確定因素的影響以及決策者的偏好,因此,為提高優(yōu)化配置成果的實(shí)用性,探索水資源配置評價(jià)的模型與方法具有重要的意義。
水資源配置評價(jià)需要對水資源優(yōu)化配置后的各項(xiàng)效應(yīng)進(jìn)行衡量,由于各項(xiàng)效應(yīng)都對應(yīng)多項(xiàng)指標(biāo),每個(gè)指標(biāo)可劃分為多個(gè)等級,故其評價(jià)屬于多指標(biāo)評價(jià)問題,其方法應(yīng)采用綜合評價(jià)的方法[1,2]。在評價(jià)實(shí)踐中,常用的綜合評價(jià)法有聚類分析、判別分析、主成分分析、灰色關(guān)聯(lián)評價(jià)、層次分析、模糊綜合評價(jià)等等方法,通過以上方法相關(guān)研究取得了一定的成果,但這些方法也存在一些缺陷:模糊綜合評價(jià)法極值作用過大,按隸屬度最大進(jìn)行級別確定,由此得到的評價(jià)結(jié)果可信度較低,結(jié)果易失真,而且在隸屬函數(shù)確定時(shí),其主觀任意性較大,從而使得評價(jià)結(jié)果排序趨同,評價(jià)結(jié)果無法充分反映客觀實(shí)際情況;在采用灰色關(guān)聯(lián)評價(jià)、聚類分析方法時(shí),構(gòu)建的白化函數(shù)模式通用性較差,如按最大隸屬度評價(jià)時(shí),由于評價(jià)對象類別不同,從而使評價(jià)結(jié)果有多解;在確定評價(jià)指標(biāo)權(quán)重方面,常用層次分析法或者德爾斐法,該類方法確定權(quán)重主觀性較大,不能充分利用指標(biāo)的已知信息,使評價(jià)結(jié)果可信度降低[3,4]。
神經(jīng)網(wǎng)絡(luò)模式識(shí)別是神經(jīng)網(wǎng)絡(luò)在模式識(shí)別領(lǐng)域的具體應(yīng)用,通過建立神經(jīng)網(wǎng)絡(luò)對已有分類標(biāo)簽的目標(biāo)輸出數(shù)據(jù)進(jìn)行訓(xùn)練,然后對完成訓(xùn)練的網(wǎng)絡(luò)輸入預(yù)測數(shù)據(jù),進(jìn)行該數(shù)據(jù)的分類,該方法具有較強(qiáng)的非線性映射、自適應(yīng)、自學(xué)習(xí)能力、且魯棒性和容錯(cuò)性也較好,是處理如水資源配置評價(jià)這類多指標(biāo)復(fù)雜系統(tǒng)綜合評價(jià)問題最為有效的途徑之一。當(dāng)前國內(nèi)外許多領(lǐng)域利用神經(jīng)網(wǎng)絡(luò)模式識(shí)別對數(shù)據(jù)進(jìn)行分類預(yù)測,取得了有價(jià)值的成果。Kartzas等[5]用神經(jīng)網(wǎng)絡(luò)識(shí)別研究了臭氧空氣污染以及大氣參數(shù)之間的互相關(guān)系;R.Xing等[6]基于LM算法的神經(jīng)網(wǎng)絡(luò)模式識(shí)別構(gòu)建了空氣質(zhì)量預(yù)報(bào)模型,其對城市空氣質(zhì)量預(yù)報(bào)得到了高精度的預(yù)測結(jié)果;蔣志方等采用神經(jīng)網(wǎng)絡(luò)模式識(shí)別方法對空氣質(zhì)量變化規(guī)律進(jìn)行了分析和預(yù)測;蓋美等基于模糊模式識(shí)別方法對海域水質(zhì)環(huán)境進(jìn)行了分析研究;陳守煜等構(gòu)建了模糊模式識(shí)別模型對空氣潔凈度進(jìn)行評價(jià)。上述研究結(jié)果有一定的參考性,但各個(gè)模型及相應(yīng)數(shù)據(jù)信息具體特點(diǎn)各異,因而在預(yù)測應(yīng)用上存在一定的局限性。因此,本文基于模式識(shí)別神經(jīng)網(wǎng)絡(luò),提出了水資源配置評價(jià)指標(biāo)及分級標(biāo)準(zhǔn),構(gòu)建了水資源配置綜合評價(jià)模型,并結(jié)合實(shí)例應(yīng)用,利用神經(jīng)網(wǎng)絡(luò)模式識(shí)別的方法對全國各省級行政區(qū)水資源配置情況進(jìn)行了綜合評價(jià)與分析。
本文模式是描述客觀世界事物的一種數(shù)學(xué)模型,通過模式識(shí)別可對外界信息進(jìn)行綜合思維、判斷,從而做出決策。模式識(shí)別對事物對象的特征屬性進(jìn)行,根據(jù)算法判定對象類別,并使識(shí)別結(jié)果盡量與實(shí)際相符,模式識(shí)別包含通過特征和屬性(系統(tǒng)的輸入輸出數(shù)據(jù)對)來描述的事物對象的數(shù)學(xué)模型,由兩個(gè)過程組成:設(shè)計(jì)過程和實(shí)現(xiàn)過程。在設(shè)計(jì)過程中,利用相當(dāng)數(shù)量的訓(xùn)練集樣本來對分類器進(jìn)行設(shè)計(jì);然后再利用完成訓(xùn)練的分類器對測試集樣本進(jìn)行分類,即實(shí)現(xiàn)過程[7,8]。
本模型構(gòu)建時(shí)模式識(shí)別神經(jīng)網(wǎng)絡(luò)為兩層前饋網(wǎng)絡(luò),其結(jié)構(gòu)如圖1所示,即一個(gè)含激活函數(shù)sigmod的隱含層,以及帶有多分類函數(shù)softmax的輸出層,如隱含層神經(jīng)元數(shù)量滿足條件,通過該多分類函數(shù)可以對任意給定的向量進(jìn)行分類。
圖1 模式識(shí)別神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖Fig.1 pattern recognition neural network topology diagram
常見的邏輯回歸、SVM等常用于解決二分類問題,對于多分類問題,理論上也可以用邏輯回歸或SVM,如將多個(gè)二分類來組成多分類,但本研究中水資源配置綜合評價(jià)屬于多分類場景問題,且其分類類別為互斥性質(zhì),不宜采用上述分類器,因此本文提出另外一種方式即softmax分類器來處理多分類。softmax的函數(shù)如下:
(1)
一般代價(jià)函數(shù)常使用方差代價(jià)函數(shù)即均方誤差MSE。在通過梯度下降,更新權(quán)值和偏置值時(shí),因?yàn)閟igmoid激活函數(shù)的飽和性質(zhì),導(dǎo)致該代價(jià)函數(shù)的導(dǎo)數(shù)在輸入值較大時(shí)變得極小,則其權(quán)值及偏置值更新非常緩慢,幾近中止[9,10]。
因此,本文為避免此問題,代價(jià)函數(shù)改用交叉熵函數(shù),即:
(1-y(i))log[1-hθ(x(i))]
(2)
計(jì)算J(θ)對第j個(gè)參數(shù)分量θj的偏導(dǎo)得:
(3)
式中:m為樣本組數(shù)(x(i),y(i))為第i組數(shù)據(jù)及其對應(yīng)的類別標(biāo)記,x(i)為包括偏置項(xiàng)在內(nèi)的一個(gè)多維向量,y(i)則為表示類別的一個(gè)數(shù)。此即代價(jià)函數(shù)對參數(shù)權(quán)重的梯度,然后進(jìn)行優(yōu)化。
由于水資源配置的實(shí)質(zhì)在于尋求抑制需求和增加供給之間的平衡,因此其評價(jià)應(yīng)基于水資源的現(xiàn)狀配置,按照公平、合理及高效的原則,從社會(huì)、經(jīng)濟(jì)、效率、生態(tài)以及水資源的開發(fā)利用等幾個(gè)方面,對水資源在生產(chǎn)、生活及生態(tài)用水方面的滿足度和配置合理性進(jìn)行分析,同時(shí)對現(xiàn)狀及規(guī)劃配置對應(yīng)的效益分別進(jìn)行綜合評價(jià),從而判斷現(xiàn)狀配置及規(guī)劃配置條件下的合理性。而在綜合評價(jià)過程中,必須先構(gòu)建一個(gè)科學(xué)合理的評價(jià)指標(biāo)體系,在此基礎(chǔ)上才能進(jìn)行配置合理性的判斷以及比較擇優(yōu)??紤]到水資源配置須充分反映社會(huì)、經(jīng)濟(jì)、效率、生態(tài)及水資源的開發(fā)利用等多方面的影響,本文在參考相關(guān)文獻(xiàn)的基礎(chǔ)上[10,11],選取了13個(gè)評價(jià)指標(biāo),作為構(gòu)建本模型所需的水資源配置評價(jià)指標(biāo)及分級標(biāo)準(zhǔn)體系,見表1。每個(gè)指標(biāo)都量化地劃分為11個(gè)等級,按照優(yōu)劣順序排序,從1級依次到11級。
表1 水資源配置評價(jià)指標(biāo)及分級標(biāo)準(zhǔn)Tab.1 water resource allocation evaluation index and grading standard
2.2.1 訓(xùn)練、驗(yàn)證、測試集設(shè)計(jì)
本文在整個(gè)指標(biāo)體系的每個(gè)級別對應(yīng)的分級標(biāo)準(zhǔn)閾值區(qū)間,通過隨機(jī)內(nèi)插方法共組合生成300組樣本,因此共組合生成涵蓋11個(gè)等級3300組總樣本數(shù)量;然后同樣也采取隨機(jī)分配的方式,按照各占總樣本數(shù)量70%、15%、15%的比例又將其劃分為訓(xùn)練集、驗(yàn)證集及測試集三類樣本,其中訓(xùn)練集樣本在訓(xùn)練過程中輸入到網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)在完成初始化之后,根據(jù)輸出值與標(biāo)注值之間的誤差不斷進(jìn)行權(quán)值和偏置值的調(diào)整;驗(yàn)證集樣本不直接參與到上述的訓(xùn)練調(diào)整,主要用于測度在訓(xùn)練過程中網(wǎng)絡(luò)泛化能力的表現(xiàn),在泛化能力停止改進(jìn)時(shí)就停止訓(xùn)練,從而防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練中發(fā)生過擬合現(xiàn)象,導(dǎo)致泛化能力的下降;測試集樣本對訓(xùn)練過程不施加影響,而是在訓(xùn)練期間及訓(xùn)練后,作為獨(dú)立于訓(xùn)練的樣本數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)的性能進(jìn)行測試、分析及評價(jià)。
2.2.2 評價(jià)模型設(shè)計(jì)
本文基于模式識(shí)別神經(jīng)網(wǎng)絡(luò)構(gòu)建水資源配置評價(jià)模型,網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)如上圖1所示。該模型以上表2中的各評價(jià)指標(biāo)值為輸入向量,因此輸入層向量維數(shù)相應(yīng)地確定為13;隱含層神經(jīng)元數(shù)目則根據(jù)Kolmogorv定理結(jié)合試錯(cuò)方法,對比分析確定為16;以各個(gè)等級對應(yīng)的期望輸出作為輸入向量,共11個(gè)評價(jià)等級,因此輸出層神經(jīng)元數(shù)目相應(yīng)確定為11,輸出值為一向量,其維數(shù)也相應(yīng)為11,而每個(gè)標(biāo)注樣本的期望輸出同樣為維數(shù)11的向量,但由于神經(jīng)網(wǎng)絡(luò)最后一層為softmax分類層,故要求每個(gè)期望輸出向量的各元素均為0,除了其標(biāo)注等級對應(yīng)位置的元素值為1外。如標(biāo)注等級為1,期望輸出向量則為[1 0 0 0 0 0 0 0 0 0 0]’,注等級為11,則為[0 0 0 0 0 0 0 0 0 0 1]’,其余依次類推。神經(jīng)網(wǎng)絡(luò)主要訓(xùn)練參數(shù)設(shè)置:最大的訓(xùn)練輪回為1 000次,設(shè)置最小目標(biāo)為1.0×10-6,同時(shí)將網(wǎng)絡(luò)泛化能力開始下降設(shè)置為訓(xùn)練結(jié)束條件之一,當(dāng)驗(yàn)證樣本產(chǎn)生的誤差開始出現(xiàn)增加即停止。
2.2.3 模型性能評價(jià)指標(biāo)
對網(wǎng)絡(luò)模型性能評價(jià)選用誤判百分率PE和交叉熵CE兩個(gè)評價(jià)指標(biāo)。誤判百分率衡量網(wǎng)絡(luò)模型對樣本的誤判率,其最小值為0表示沒有錯(cuò)誤分類,最大值為100%表示全部錯(cuò)判;交叉熵值較小表示更好的分類性能,如為零則意味著沒有誤差。誤判百分率PE及交叉熵CE表達(dá)式如下:
(4)
式中:n為錯(cuò)誤分類判別錯(cuò)誤樣本數(shù);N為進(jìn)行分類判別樣本總數(shù)。
(1-yi) log(1-y_predictedi)]
(5)
式中:yi為第i個(gè)樣本期望值;y_predictedi為第i個(gè)樣本預(yù)測值。
2.2.4 模型訓(xùn)練及測試實(shí)驗(yàn)結(jié)果分析
本文通過隨機(jī)內(nèi)插方法共組合生成3 300組樣本數(shù)量,并采取隨機(jī)分配的方式,按照各占總樣本數(shù)量70%、15%、15%的比例又將其劃分為訓(xùn)練集、驗(yàn)證集及測試集三類樣本,即分別為2310、495、495組,訓(xùn)練集用以調(diào)整網(wǎng)絡(luò)權(quán)值偏置值、驗(yàn)證集在訓(xùn)練中起到防止過擬合作用,可適時(shí)終止訓(xùn)練、測試集則獨(dú)立測試網(wǎng)絡(luò)模型的性能。主要通過誤判百分率和交叉熵值等兩個(gè)指標(biāo)并以混淆矩陣圖和交叉熵誤差動(dòng)態(tài)變化圖等形式對模型訓(xùn)練及測試實(shí)驗(yàn)結(jié)果進(jìn)行分析?;煜仃噲D和交叉熵誤差動(dòng)態(tài)變化圖分別如圖3所示。
圖3 訓(xùn)練及測試實(shí)驗(yàn)結(jié)果混淆矩陣圖Fig.3 obfuscation matrix diagram for training and testing experimental results
圖3包含了訓(xùn)練集、驗(yàn)證集、測試集和全體樣本等實(shí)驗(yàn)混淆矩陣,混淆矩陣橫坐標(biāo)為實(shí)際標(biāo)定類別共11類,縱坐標(biāo)為模型輸出判定類別共11類,從圖3中可以看出,訓(xùn)練集、驗(yàn)證集、測試集和全體樣本實(shí)驗(yàn)中,模型輸出判定類別與實(shí)際標(biāo)定類別全部符合,誤判百分率PE=0,沒有發(fā)生分類誤判現(xiàn)象;圖4交叉熵誤差動(dòng)態(tài)變化圖則顯示,隨著訓(xùn)練過程的進(jìn)行,交叉熵誤差不斷趨于減小,直到達(dá)到規(guī)定最小目標(biāo)誤差,并沒有發(fā)生嚴(yán)重震蕩;訓(xùn)練集和驗(yàn)證集誤差動(dòng)態(tài)變化基本吻合一致,交叉熵誤差最后分別為2.81×10-7、3.07×10-7,測試集交叉熵誤差動(dòng)態(tài)變化趨勢也與之基本一致,其值最后為1.31×10-6,表明訓(xùn)練過程中沒有發(fā)生過擬合現(xiàn)象。由此可見,本文基于模式識(shí)別神經(jīng)網(wǎng)絡(luò)而構(gòu)建的評價(jià)模型模擬精度較高,且泛化能力較好,可用以水資源配置綜合評價(jià),故本文在此基礎(chǔ)上,進(jìn)一步將本模型實(shí)際應(yīng)用于對全國各省級行政區(qū)水資源配置綜合評價(jià)的實(shí)例分析。
圖4 交叉熵誤差動(dòng)態(tài)變化圖Fig.4 dynamic change diagram of cross entropy error
全國各省級行政區(qū)水資源配置實(shí)例分析,采用的評價(jià)數(shù)據(jù)來源參考相關(guān)文獻(xiàn)[10,11],見表2所示。
采用本文構(gòu)建的模型對上述省級行政區(qū)水資源配置進(jìn)行評價(jià),根據(jù)上述評價(jià)指標(biāo)相應(yīng)的數(shù)據(jù),輸入到模型進(jìn)行模擬計(jì)算,利用softmax多分類器直接實(shí)現(xiàn)各行政區(qū)水資源配置等級的劃分,然后對評價(jià)等級進(jìn)行定性的描述分析,評價(jià)結(jié)果見表3。
通過對表3中結(jié)果的分析有如下結(jié)論:
(1)模式識(shí)別神經(jīng)網(wǎng)絡(luò)模型對全國各省級行政區(qū)的水資源配置的評價(jià)總體情況是:其評價(jià)等級基本都在3~9級之間,依次對應(yīng)為“合理”、“較合理”及“不合理”等定性評價(jià),基于同等的標(biāo)準(zhǔn),對各地的水資源配置情況有一個(gè)較客觀而合理的反映,對于水資源管理實(shí)踐具有一定的指導(dǎo)參考價(jià)值。以上對各地水資源配置情況定性和定量的評價(jià)分析表明,基于模式識(shí)別神經(jīng)網(wǎng)絡(luò)構(gòu)建的水資源配置模型,性能精度較高,方法合理可行。
表2 各省行政區(qū)評價(jià)指標(biāo)值Tab.2 evaluation index value of provincial administrative region
(2)本文以定量評價(jià)等級1~2級對應(yīng)“最合理”定性評價(jià)描述、3~5級對應(yīng)“合理”、6~7級對應(yīng)“較合理”、8~9級對應(yīng)“不合理”。綜合評價(jià)結(jié)果顯示:江蘇、江西、廣西、遼寧、上海、湖南、廣東、海南、貴州、陜西、青海、寧夏及新疆等地配置情況合理;北京、天津、山西、吉林、浙江、安徽、福建、湖北、四川、云南及甘肅等地配置較合理;河北、內(nèi)蒙古、黑龍江、山東、河南、重慶及西藏等地配置不合理。上述各地水資源配置情況評價(jià)出現(xiàn)差距究其原因,與水資源相對的豐裕程度及經(jīng)濟(jì)發(fā)展情況都有一定關(guān)聯(lián),突出表現(xiàn)在缺水率(%)、水功能達(dá)標(biāo)率(%)、用水GDP、開發(fā)利用率(%)等評價(jià)指標(biāo)達(dá)標(biāo)情況較差,從而嚴(yán)重制約了相應(yīng)地區(qū)水資源配置整體合理性,通過大力解決其配置中公平性欠缺、經(jīng)濟(jì)高效合理性不夠、與生態(tài)協(xié)調(diào)較差等薄弱環(huán)節(jié)問題,其水資源配置合理性可得到進(jìn)一步提高。
表3 全國各省級行政區(qū)水資源配置綜合評價(jià)Tab.3 comprehensive evaluation of water resources allocation in various provincial administrative regions of China
本文在分析了當(dāng)前水資源配置評價(jià)的各種方法及其存在的問題,基于神經(jīng)網(wǎng)絡(luò)模式識(shí)別的特點(diǎn)和原理,構(gòu)建了模式識(shí)別神經(jīng)網(wǎng)絡(luò)水資源配置評價(jià)模型,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)采用了適于水資源配置評價(jià)分級要求的多分類函數(shù)softmax為輸出層,代價(jià)函數(shù)以交叉熵函數(shù)代替均方差MSE,解決了模型訓(xùn)練可能出現(xiàn)緩慢甚至中止的問題;在綜合相關(guān)研究成果的基礎(chǔ)上,提出了水資源配置13個(gè)評價(jià)指標(biāo)、11個(gè)分級及相應(yīng)分級標(biāo)準(zhǔn),為水資源配置合理性判斷及比較擇優(yōu),構(gòu)建了一個(gè)科學(xué)合理的評價(jià)指標(biāo)體系基礎(chǔ);水資源配置評價(jià)模型采用的訓(xùn)練集、驗(yàn)證集及測試集等數(shù)據(jù)源于在分級標(biāo)準(zhǔn)臨界值之間隨機(jī)內(nèi)插而得到,并以誤判百分率及交叉熵等作為模型性能評價(jià)指標(biāo)。訓(xùn)練及測試實(shí)驗(yàn)情況表明,訓(xùn)練集、驗(yàn)證集及測試集交叉熵誤差分別為2.81×10-7、3.07×10-7、1.31×10-6,且無過擬合現(xiàn)象,模式識(shí)別神經(jīng)網(wǎng)絡(luò)水資源配置評價(jià)模型精度性能較高、分類能力優(yōu)良;在此基礎(chǔ)上,將該模型應(yīng)用于實(shí)例分析,對各省級行政區(qū)水資源配置情況進(jìn)行評價(jià)分級,總體情況其評價(jià)等級基本都在3~9級之間,依次對應(yīng)為“合理”、“較合理”及“不合理”等定性評價(jià),評價(jià)結(jié)果信息較為客觀合理反映了各地水資源配置總體情況;通過差距原因分析,提出了制約地區(qū)水資源配置合理性的突出因素:缺水率、水功能達(dá)標(biāo)率、用水GDP及開發(fā)利用率等,并提出了進(jìn)一步改進(jìn)配置合理性的建議措施;評價(jià)結(jié)果進(jìn)一步表明模型應(yīng)用于水資源配置評價(jià)實(shí)踐中的合理可行性。
□