李 昂,水西霞,員佳慧,李 嫣
(1.華北水利水電大學(xué),河南 鄭州 450046;2.三門峽市陜州區(qū)計劃節(jié)約用水管理中心,河南 三門峽 472000;3.中建七局總承包公司河南分公司,河南 鄭州 450012)
水質(zhì)評價是解決水體污染和保護水環(huán)境的基礎(chǔ)[1],客觀有效的評價結(jié)果能為水資源利用和改善水環(huán)境等工程措施提供科學(xué)支撐,對水源地防污治理、保障飲用水源安全有重大意義[2]。支持向量機是20世紀末提出的一種分類器,屬于統(tǒng)計學(xué)的分支。隨著模式識別中最大邊距決策邊界的理論研究發(fā)展、基于松弛變量的規(guī)劃問題求解技術(shù)和VC維的提出,支持向量機得到極大的發(fā)展,目前被廣泛地應(yīng)用在各個領(lǐng)域用來解決分類或回歸問題。模糊綜合指數(shù)法可以用來判斷受多個模糊因素影響的事物或事件的總體性質(zhì),優(yōu)點在于能定量地反映系統(tǒng)綜合屬性。本文利用分類支持向量機、回歸支持向量機和模糊綜合指數(shù)法對云南省文山州13個飲用水水源地進行水質(zhì)綜合評價,并比較評價結(jié)果的合理性,為相關(guān)水利工作者在進行水質(zhì)評價時提供更好的選擇。
文山壯族苗族自治州(如圖1所示),地處我國西南邊陲云南省的東南部,總面積約為3.2萬km2,區(qū)內(nèi)水系交錯,地形復(fù)雜多變,多為山區(qū)、半山區(qū),平均海拔在1 000~1 800 m,州內(nèi)轄有8個縣區(qū)。該州水資源總量較為豐富,但各縣區(qū)水資源及降水時空分布差異較大。年平均降雨量為1 200 mm,降雨量總體呈北少南多的趨勢。
圖1 文山壯族苗族自治州水系示意圖
本文根據(jù)2014年文山市環(huán)保局對該州飲用水水源地的監(jiān)測數(shù)據(jù),利用以下評價模型對該州水源地進行水質(zhì)評價。
本文用到的評價模型分別是FA-SVR(基于螢火蟲算法[2]優(yōu)化學(xué)習參數(shù)的回歸支持向量機)、FA-SVM(基于螢火蟲算法優(yōu)化學(xué)習參數(shù)的分類支持向量機)和模糊綜合指數(shù)法。各模型詳細描述如下。
由螢火蟲算法(FA)及回歸支持向量機(SVR)模型原理可知,F(xiàn)A-SVR的原理即為使回歸支持向量機模型的誤差最小,可通過螢火蟲算法來搜尋一組向量(C,g,ε)。其實現(xiàn)步驟為:
(1)根據(jù)模型對實測樣本數(shù)據(jù)進行歸一化處理;
(2)初始化螢火蟲算法相關(guān)參數(shù)(如螢火蟲個數(shù),迭代次數(shù)、初始吸引度、步長因子等),確定均方誤差MSE為目標函數(shù),對應(yīng)螢火蟲的亮度;
(3)模型運算結(jié)束后,進行反歸一化處理,最后進行綜合水質(zhì)判斷。
由FA算法及SVM模型原理可知,F(xiàn)A-SVM的思想就是通過FA算法搜尋一組向量(C,g)使SVM模型的正確識別率最高。正確識別率依賴于對綜合水質(zhì)的先驗判斷,應(yīng)合理地進行先驗判斷,提高模型可靠性。其實現(xiàn)步驟:
(1)根據(jù)模型對實測樣本數(shù)據(jù)進行歸一化處理;
(2)初始化螢火蟲算法相關(guān)參數(shù)(如螢火蟲個數(shù),迭代次數(shù)、初始吸引度,步長因子等),設(shè)定懲罰因子C和核函數(shù)參數(shù)g的搜尋范圍,確定正確識別率Accuracy為目標函數(shù),對應(yīng)螢火蟲的亮度;
(3)模型運算結(jié)束后,能直接輸出對應(yīng)的水質(zhì)類別。
模糊綜合指數(shù)法實現(xiàn)水質(zhì)評價的主要步驟如下[4]。
(1)設(shè)水體中有m個因素可以影響水質(zhì),這些因素的有n個評價指標(a=1,2,...,m;b=1,2,...,n),可得評價因素的特征矩陣X=(rij)n·m。綜合考慮a中因素,可建立隸屬度函數(shù)R:
(2)R的現(xiàn)實意義為每個因素對其評價指標的隸屬程度。各水質(zhì)級別的隸屬函數(shù)由以下函數(shù)確定。
第一級:
第二級至第m級:
第m級水的隸屬函數(shù):
式中:Wij為第i種因素第j級的評價指標,Ei為第i種因素檢測值。
(3)設(shè)a=1,2,...,m中各因素的權(quán)重為l,L=(l1,l2,...,lm)為所有權(quán)重的集合,且,則該模型可以以式(5)表達:
基于GB 3838—2002《地表水環(huán)境質(zhì)量標準》,構(gòu)造向量PT=(1,2,3,4,5)為水質(zhì)分級標準。則模糊綜合指數(shù)(Fuzzy comprehensive index)為:
本文采用2014年云南省文山州內(nèi)8個縣區(qū)中13個飲用水水源地水質(zhì)數(shù)據(jù)[5]。模型均在Matlab 2018a環(huán)境下進行仿真,支持向量機模型利用libsvm工具箱進行編程;計算機配置:Intel(R)Core(TM)i7-8750H CPU@2.20 GHz;內(nèi)存8 GB。模糊綜合指數(shù)法部分代碼如圖1所示。
圖1 模糊綜合指數(shù)法部分代碼
螢火蟲算法的初始化參數(shù)包括:螢火蟲數(shù)量為20個,迭代次數(shù)5 000次,初始光吸收指數(shù)1,吸引指數(shù)0.2,初始步長系數(shù)0.2。
SVR模型學(xué)習參數(shù)懲罰因子C的搜索空間設(shè)為0.1~2 000,核函數(shù)參數(shù)g的搜索空間設(shè)為0.1~1 000,不敏感系數(shù)ε的搜索空間設(shè)為0~1;SVM模型學(xué)習參數(shù)懲罰因子C設(shè)搜索空間為0.1~2 000,核函數(shù)參數(shù)g的搜索空間為0.1~1 000。插值法隨機生成20組樣本,并內(nèi)插得到120組樣本,實測數(shù)據(jù)及對應(yīng)評價結(jié)果的后8組數(shù)據(jù)作為測試樣本。輸出評價結(jié)果見表1,仿真圖如圖2所示。
表1 水質(zhì)綜合評價成果表
圖2 回歸支持向量機仿真結(jié)果
由結(jié)果可以看出:評價結(jié)果主要在樣本4、樣本11和樣本12存在差異。這3個樣本各項因子實測值見表2,各項因子標準見表3。
表2 樣本4、11、12的幾種因子實測值 單位:mg/L
表3 樣本4、11、12的單因子評價結(jié)果
根據(jù)各項水質(zhì)評價因子標準,3個樣本的單因子評價結(jié)果為:
以某類別因子數(shù)占優(yōu)為標準,3個樣本的水質(zhì)綜合類別應(yīng)為1類、1類和2類,樣本水質(zhì)達標。例如針對樣本12,兩者的結(jié)果顯示,其水質(zhì)綜合類別雖為3類,但很接近2類水的標準,符合國家GB 5749—2006《生活飲用水衛(wèi)生標準》相關(guān)要求。
模型的改進對水質(zhì)綜合評價的精度有著明顯的提高。本文利用新型元啟發(fā)式算法——螢火蟲算法,對SVR模型和SVM模型的學(xué)習參數(shù)進行優(yōu)化,建立模糊綜合評價模型以文山州13處水源地樣本因子進行評價,結(jié)果顯示13處水源地水質(zhì)符合國家標準。經(jīng)參數(shù)優(yōu)化的模糊綜合指數(shù)法易操作,可以作為水質(zhì)評價的輔助性參考工具。