孫英軍
(浙江省水文管理中心,浙江 杭州 310000)
工業(yè)廢水與生活廢水存在亂排放現(xiàn)象,使水體污染越來(lái)越嚴(yán)重,進(jìn)而使水中氮、磷等物質(zhì)含量超標(biāo)[1]。目前,各城市地下水達(dá)標(biāo)率較低,地下水水質(zhì)嚴(yán)重污染已成為制約現(xiàn)代化與城鎮(zhèn)化建設(shè)的重要因素,且水污染破壞了生態(tài)環(huán)境,對(duì)人們生活與身體康健造成影響。地下水作為人類用水主要來(lái)源之一,對(duì)其水質(zhì)進(jìn)行監(jiān)測(cè)已成為重點(diǎn)研究課題[2]?;诖耍巾毺岢隹煽康牡叵滤|(zhì)參數(shù)監(jiān)測(cè)技術(shù)。為此,提出基于超球支持向量機(jī)的地下水水質(zhì)參數(shù)自動(dòng)監(jiān)測(cè)技術(shù)。
超球支持向量機(jī)每類樣本只在訓(xùn)練本類模型時(shí)用到一次,適合并行運(yùn)算?;舅枷胧怯蓛煞诸悊栴}擴(kuò)展到多分類,對(duì)每一類樣本構(gòu)造出一個(gè)最小超球。超球支持向量機(jī)模型構(gòu)建步驟如下:
a.利用主成分分析方法采集地下水水質(zhì)數(shù)據(jù)。
b.建立樣本指標(biāo)體系,并選定訓(xùn)練集與測(cè)試集。
c.初始化種群位置與速度,計(jì)算適應(yīng)度值。
d.根據(jù)粒子速度、位置及學(xué)習(xí)因子更新慣性權(quán)重。
e.如果滿足終止條件則終止,得到最優(yōu)參數(shù)C(懲罰因子)與σ(核參數(shù)),基于最優(yōu)參數(shù)對(duì)超球支持向量機(jī)進(jìn)行訓(xùn)練,通過(guò)超球支持向量機(jī)對(duì)水質(zhì)進(jìn)行分級(jí)。
結(jié)合支持向量機(jī)回歸問題對(duì)超球進(jìn)行改進(jìn),生成包括所有樣本點(diǎn)的最小超球:
其中
式中R——超球半徑;
ξi——松弛變量;
C——懲罰因子;
a——超球球心。
超球支持向量機(jī)算法流程如下:
a.使用初始訓(xùn)練集Xa訓(xùn)練SVM。
b.生成超球。
c.數(shù)據(jù)集中任意一點(diǎn)xi到超平面f(x)±ε的距離公式為
保存di≤p的點(diǎn),得到保存點(diǎn)集St。
d.將增量數(shù)據(jù)Xb加入Xa中,使用SVM訓(xùn)練數(shù)據(jù)集Xa。
超球向量機(jī)法使用兩個(gè)同心超球縮減訓(xùn)練集,提高訓(xùn)練速度。
通過(guò)對(duì)典型支持向量機(jī)進(jìn)行分析可知,該模型可將低維空間內(nèi)樣本映射至高維空間實(shí)現(xiàn)相應(yīng)處理,進(jìn)而實(shí)現(xiàn)線性可分。高維空間特征計(jì)算過(guò)程中可能出現(xiàn)維數(shù)災(zāi)難,總體計(jì)算量非常大,為此引入核函數(shù)進(jìn)行解決[7-8]。目前使用范圍較廣的核函數(shù)主要包括線性核函數(shù)與徑向基核函數(shù)等。本研究選擇以下形式的核函數(shù):
式中xi和xj——第i和第j個(gè)樣本;
σ——核函數(shù)。
超球支持向量機(jī)運(yùn)行過(guò)程中模型參數(shù)對(duì)分類具有較大影響,主要影響參數(shù)包含懲罰因子C與核參數(shù)σ。相關(guān)研究顯示,如果核參數(shù)非常小,模型訓(xùn)練誤差非常小,即所有訓(xùn)練樣本均為支持向量機(jī),在核參數(shù)由小變大過(guò)程中,模型分類效果呈相應(yīng)變化,中間將得到某個(gè)值所得分類效果最好。懲罰因子越小,模型分類復(fù)雜程度越低,經(jīng)驗(yàn)風(fēng)險(xiǎn)值越大;相反模型分類復(fù)雜程度越高,經(jīng)驗(yàn)風(fēng)險(xiǎn)值越小[9-10]。為此,須找出1組恰當(dāng)?shù)膽土P因子與核參數(shù)使模型分類效果最優(yōu)。
采用改進(jìn)粒子群法對(duì)超球支持向量機(jī)運(yùn)行參數(shù)進(jìn)行優(yōu)化,步驟如下:
a.初始化算法運(yùn)行參數(shù),包括種群規(guī)模sizepop和加速系數(shù)c1、c2等,將算法最大迭代次數(shù)設(shè)為Tmax,任意生成一組(C,σ)作為粒子初始位置。
b.設(shè)置改進(jìn)粒子群算法適應(yīng)函數(shù),對(duì)粒子適應(yīng)度進(jìn)行計(jì)算與評(píng)估,選出最常用與典型的均方誤差MSE作為適應(yīng)度函數(shù),計(jì)算公式如下:
c.基于粒子適應(yīng)度值更新粒子自身與群體最優(yōu)適應(yīng)度值,對(duì)粒子速度、位置和學(xué)習(xí)因子等進(jìn)行動(dòng)態(tài)調(diào)節(jié),獲取新粒子群,計(jì)算公式如下:
式中c1ini、c2ini——c1、c2初始值;
t、Tmax——目前迭代次數(shù)與最大迭代次數(shù);
c1fin、c2fin——c1、c2終值。
d.如果未滿足算法終止條件或達(dá)到最大迭代次數(shù),返回b將最優(yōu)參數(shù)進(jìn)行輸出。
構(gòu)建評(píng)價(jià)指標(biāo)體系,并將該體系作為建立模型訓(xùn)練樣本集合的基礎(chǔ)[3],可降低人為因素與監(jiān)測(cè)數(shù)據(jù)對(duì)模型運(yùn)行的干擾,且體現(xiàn)評(píng)價(jià)結(jié)果客觀性,利于提高評(píng)價(jià)結(jié)果科學(xué)性?;趯?shí)際監(jiān)測(cè)數(shù)據(jù)與水環(huán)境質(zhì)量相關(guān)標(biāo)準(zhǔn)(見表1),選取氨氮、總磷、總氮作為輸入?yún)?shù)。
表1 水環(huán)境質(zhì)量相關(guān)標(biāo)準(zhǔn)
由于指標(biāo)項(xiàng)相對(duì)較多,且各指標(biāo)項(xiàng)間存在密切聯(lián)系,對(duì)收斂效率與分類精確性產(chǎn)生影響,直接將部分監(jiān)測(cè)因子刪除易造成水質(zhì)情況難以全方位反映等問題,為此,引入主成分分析法,將高維空間數(shù)據(jù)轉(zhuǎn)化為低維空間數(shù)據(jù)進(jìn)行處理,以簡(jiǎn)化統(tǒng)計(jì)數(shù)字特征,消除重疊信息,獲取1組可反映原本輸入變量情況的新變量[4-6]。先對(duì)總體采集到的樣本進(jìn)行主成分分析,具體過(guò)程如下。
假設(shè)存在n個(gè)樣本和p個(gè)指標(biāo)變量,則原始數(shù)據(jù)矩陣表達(dá)式為
對(duì)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,將數(shù)據(jù)按照一定比例進(jìn)行縮放,使其落到1個(gè)小區(qū)間內(nèi),對(duì)各指標(biāo)分量進(jìn)行標(biāo)準(zhǔn)化變換,變換表達(dá)式如下:
標(biāo)準(zhǔn)化后的矩陣X′可表示為
計(jì)算已知n個(gè)樣本間相關(guān)系數(shù),相關(guān)矩陣中各元素通過(guò)對(duì)應(yīng)相關(guān)系數(shù)描述如下:
計(jì)算獲取相關(guān)矩陣R, 基于Ax=λx轉(zhuǎn)換成|R-λE|=0,實(shí)現(xiàn)特征方程求解,獲取m個(gè)不小于0的特征值,即λ1,λ2,…,λm,且λ1≥λ2≥,…,≥λm≥0,其中與第i個(gè)特征值相應(yīng)的特征向量為ai=(ai1,…,aip)。
基于以上得到的m個(gè)特征向量對(duì)m個(gè)主成分變量進(jìn)行計(jì)算,公式如下:
式中F1——第一主成分;
但是,在對(duì)外漢語(yǔ)教學(xué)中,有很長(zhǎng)一段時(shí)間我們把教學(xué)重點(diǎn)放在語(yǔ)音、詞匯和語(yǔ)法上,缺乏對(duì)語(yǔ)用教學(xué)的重視。那么,現(xiàn)階段留學(xué)生的語(yǔ)用能力到底處于一個(gè)什么樣的水平,內(nèi)部發(fā)展是否均衡,語(yǔ)用能力是否隨著語(yǔ)言能力的提高而提高?留學(xué)生對(duì)語(yǔ)用能力的重要性、語(yǔ)用失誤的嚴(yán)重性又是如何看待的?在留學(xué)生看來(lái),教材編寫和課堂教學(xué),是否存在著語(yǔ)用教學(xué)方面的不足?
Fi——第i主成分。
利用訓(xùn)練集合監(jiān)督學(xué)習(xí)構(gòu)建相應(yīng)超球支持向量機(jī)水質(zhì)等級(jí)評(píng)價(jià)分類器,通過(guò)測(cè)試集合獲取評(píng)價(jià)結(jié)果,如果超過(guò)標(biāo)準(zhǔn)值則發(fā)出警報(bào)。在超球支持向量機(jī)中,各樣本僅需開展1次訓(xùn)練,較好地解決了傳統(tǒng)分類法多次參加訓(xùn)練與測(cè)試的問題。
為驗(yàn)證基于超球支持向量機(jī)的地下水水質(zhì)參數(shù)自動(dòng)監(jiān)測(cè)技術(shù)可靠性,開展以下試驗(yàn)。試驗(yàn)平臺(tái)為matlab,以一地下水段為測(cè)試目標(biāo)。監(jiān)測(cè)系統(tǒng)見圖1。
圖1 監(jiān)測(cè)系統(tǒng)
在地下水測(cè)試段分別設(shè)置3個(gè)測(cè)試點(diǎn),對(duì)本文提出的監(jiān)測(cè)技術(shù)監(jiān)測(cè)準(zhǔn)確性進(jìn)行驗(yàn)證。設(shè)置粒子群規(guī)模為20,加速度系數(shù)c1ini=2.5,c1fin=0.5,c2ini=0.5,最大迭代次數(shù)為50,ωmin=0.3,ωmax=0.9,懲罰因子取值區(qū)間為[0.01,100],核參數(shù)取值區(qū)間為[0,20]。
部分水質(zhì)類別判斷結(jié)果見表2、表3。
表2 觀測(cè)點(diǎn)1水質(zhì)類別判斷結(jié)果
表3 觀測(cè)點(diǎn)2水質(zhì)類別判斷結(jié)果
由表2、表3可知,基于超球支持向量機(jī)的地下水水質(zhì)參數(shù)自動(dòng)監(jiān)測(cè)技術(shù)監(jiān)測(cè)得到的結(jié)果與實(shí)際結(jié)果一致,而單因子分類結(jié)果與實(shí)際結(jié)果略有出入,有出入的原因是某個(gè)因子污染相對(duì)嚴(yán)重,導(dǎo)致單因子評(píng)價(jià)結(jié)果較片面,僅突出某一水質(zhì)因子的影響,無(wú)法整體反映地下水水質(zhì)參數(shù)情況。本文提出的監(jiān)測(cè)技術(shù)評(píng)價(jià)相對(duì)全面,綜合考慮了多項(xiàng)指標(biāo),可高效彌補(bǔ)單因子評(píng)價(jià)存在的不足,提高地下水水質(zhì)參數(shù)自動(dòng)監(jiān)測(cè)精確性。
對(duì)地下水進(jìn)行水樣測(cè)試,并記錄TOC(總有機(jī)碳)與COD(化學(xué)需氧量),將記錄數(shù)據(jù)通過(guò)基于Python的數(shù)據(jù)分析軟件進(jìn)行建模分析,生成以地下水COD值為x軸、以地下水TOC值為y軸的打點(diǎn)圖形,并運(yùn)用最小二乘法對(duì)數(shù)據(jù)進(jìn)行擬合,見圖2。
圖2 觀測(cè)點(diǎn)1 COD值與TOC值線性回歸模型
由圖2可知, 地下水COD值與TOC值存在良好的線性關(guān)系,監(jiān)測(cè)結(jié)果更靠近擬合的回歸曲線,可見地下水相關(guān)性較強(qiáng)。
TOC實(shí)測(cè)值與預(yù)測(cè)值跟隨性曲線見圖3,由圖3可知,兩處觀測(cè)點(diǎn)地下水水域TOC實(shí)測(cè)值曲線與TOC預(yù)測(cè)值曲線大致重合,可較好地實(shí)現(xiàn)不同地下水水域水質(zhì)參數(shù)監(jiān)測(cè)。
圖3 TOC實(shí)測(cè)值與預(yù)測(cè)值跟隨性曲線
基于上述研究,給出以下地下水水質(zhì)監(jiān)測(cè)建議:
a.建成前做好規(guī)劃。在監(jiān)測(cè)系統(tǒng)建設(shè)前期階段,基于各地區(qū)經(jīng)濟(jì)與供水等情況,按照先進(jìn)、可靠的基本要求進(jìn)行統(tǒng)一規(guī)劃,并為后期發(fā)展保留一定空間。隨著技術(shù)的不斷發(fā)展,在構(gòu)建系統(tǒng)過(guò)程中預(yù)留接口,避免重復(fù)開發(fā)。
b.建設(shè)過(guò)程中強(qiáng)化管理。組織相關(guān)專家對(duì)相應(yīng)方案進(jìn)行優(yōu)化,并在開始投入建設(shè)后及時(shí)采集設(shè)備合格證書與說(shuō)明書等,便于后期維護(hù),并開展連續(xù)試運(yùn)行,然后再驗(yàn)收。
c.建成之后重視維護(hù)。以保障在線自動(dòng)監(jiān)測(cè)性能為目的,按固定周期對(duì)各項(xiàng)監(jiān)測(cè)儀器進(jìn)行清洗和調(diào)節(jié)。
現(xiàn)階段,水質(zhì)監(jiān)測(cè)效率低,且精確性較差,為此,提出基于超球支持向量機(jī)的地下水水質(zhì)參數(shù)自動(dòng)監(jiān)測(cè)技術(shù)。以水質(zhì)監(jiān)測(cè)平臺(tái)為依托,結(jié)合主成分分析法、改進(jìn)粒子群法、超球支持向量機(jī)構(gòu)建地下水水質(zhì)參數(shù)級(jí)別評(píng)價(jià)模型。經(jīng)測(cè)試可知,本文所提方法具有良好的運(yùn)行效果。下一步將結(jié)合外界因素進(jìn)一步提升水質(zhì)監(jiān)測(cè)精確性,如利用地質(zhì)和氣象數(shù)據(jù)等實(shí)現(xiàn)水質(zhì)參數(shù)評(píng)價(jià)、監(jiān)測(cè)。