曹泓 儲(chǔ)政勇 李臻
摘 要:本文提出了一種基于人工神經(jīng)網(wǎng)絡(luò)的巢湖流域水體總磷和總氮的預(yù)測(cè)模型,可以預(yù)測(cè)出水體中總磷和總氮的濃度,有利于巢湖流域水體富營(yíng)養(yǎng)化的治理,節(jié)省了水質(zhì)監(jiān)測(cè)的成本;該模型使用易于測(cè)量且和總磷、總氮密切相關(guān)的水質(zhì)指標(biāo)作為輸入,利用巢湖流域歷史水質(zhì)數(shù)據(jù)進(jìn)行人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練、測(cè)試和驗(yàn)證。結(jié)果表明,人工神經(jīng)網(wǎng)絡(luò)可以有效的預(yù)測(cè)水體的總磷和總氮濃度。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò);總磷;總氮;水質(zhì)預(yù)測(cè)
1 概述
巢湖是我國(guó)第5大淡水湖,隨著周邊經(jīng)濟(jì)發(fā)展和人口的增長(zhǎng),水體出現(xiàn)富營(yíng)養(yǎng)化,總磷和總氮等指標(biāo)達(dá)到劣V類標(biāo)準(zhǔn)。[1]在對(duì)水體的富營(yíng)養(yǎng)化進(jìn)行評(píng)價(jià)時(shí),總磷和總氮是重要的水質(zhì)指標(biāo),目前通常的測(cè)定方法有分光光度法和離子色譜法等,需要經(jīng)過(guò)采樣、實(shí)驗(yàn)室處理和結(jié)果分析等步驟,存在著分析時(shí)間長(zhǎng)、需要消耗試劑以及產(chǎn)生二次污染等缺點(diǎn)。但是水體中的溫度、濁度、電導(dǎo)率、PH和溶解氧等參數(shù),通過(guò)在線水質(zhì)檢測(cè)儀,很容易進(jìn)行測(cè)量。人工神經(jīng)網(wǎng)絡(luò)是一種常用的非線性模式識(shí)別建模方法,可以在輸入變量和輸出變量之間建立非線性的映射模型,而且在映射過(guò)程中能夠并行分布處理和自適應(yīng)學(xué)習(xí),在人工智能和模式識(shí)別等領(lǐng)域都得到了廣泛的應(yīng)用。本研究利用水體中檢測(cè)成本低且方便的參數(shù),通過(guò)人工神經(jīng)網(wǎng)絡(luò)建立水體總磷和總氮預(yù)測(cè)模型,為巢湖流域的水體富營(yíng)養(yǎng)化監(jiān)測(cè)和治理提供了新的方法和依據(jù)。
2 基于人工神經(jīng)網(wǎng)絡(luò)的水體總磷和總氮預(yù)測(cè)
基于人工神經(jīng)網(wǎng)絡(luò)的水體總磷和總氮預(yù)測(cè),包含4個(gè)部分,數(shù)據(jù)采集、輸入變量選擇、數(shù)據(jù)預(yù)處理、人工神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練等。[2]
步驟(1)數(shù)據(jù)采集,從巢湖管理局環(huán)境保護(hù)監(jiān)測(cè)站獲取了巢湖流域2018年1月至2019年3月份的水質(zhì)數(shù)據(jù)650條,監(jiān)測(cè)指標(biāo)包括了《國(guó)家地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB3838-2002)規(guī)定的24項(xiàng)基本監(jiān)測(cè)項(xiàng)目,代表了水體的化學(xué)、物理和生物特性。
步驟(2)輸入變量選擇,水體的物理、化學(xué)和生物特性是相互影響、相互關(guān)聯(lián)的,因此,需要篩選出合適的水質(zhì)參數(shù)作為模型的輸入變量,[3]使用以下兩個(gè)標(biāo)準(zhǔn)作為篩選的主要依據(jù):第一是計(jì)算水質(zhì)參數(shù)和總磷、總氮在統(tǒng)計(jì)學(xué)上的相關(guān)系數(shù),相關(guān)系數(shù)表示輸出參數(shù)和輸入?yún)?shù)的相關(guān)性;第二是從檢測(cè)方法上來(lái)說(shuō),選取比總磷和總氮更容易檢測(cè)的指標(biāo)。通過(guò)初步篩選對(duì)水質(zhì)參數(shù)進(jìn)行排名,然后利用人工神經(jīng)網(wǎng)絡(luò)模型對(duì)輸入變量進(jìn)行再次篩選,當(dāng)訓(xùn)練模型產(chǎn)生的決定系數(shù)(R2)大于0.7時(shí),相應(yīng)的水質(zhì)參數(shù)作為模型的輸入變量。
步驟(3)數(shù)據(jù)預(yù)處理,人工神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)在分析之前,需要將數(shù)據(jù)標(biāo)準(zhǔn)化,利用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行分析,輸入變量處于同一數(shù)量級(jí),使網(wǎng)絡(luò)能夠快速收斂。
步驟(4)人工神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,本研究使用前向反饋神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,需要確定輸入層、輸出層、隱含層和連接權(quán)重,輸入層的節(jié)點(diǎn)數(shù)由輸入變量決定,輸出層的節(jié)點(diǎn)數(shù)由需要預(yù)測(cè)的水質(zhì)指標(biāo)總氮和總磷確定,通常隱含層的節(jié)點(diǎn)數(shù)只能借助學(xué)者給出的經(jīng)驗(yàn)公式并進(jìn)行多次試驗(yàn)得以確定,本研究利用“進(jìn)退法”算法快速確定隱含層節(jié)點(diǎn)數(shù);[4]為了滿足建模的需要,將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中訓(xùn)練集占總數(shù)的1/2,驗(yàn)證集和測(cè)試集分別占1/4,使用Matlab工具箱進(jìn)行建模;常用的模型評(píng)價(jià)指標(biāo)包括決定系數(shù)(R2)、建模均方根誤差(RMSEC)和預(yù)測(cè)均方根誤差(RMSEP)。預(yù)測(cè)模型的R2較大并且RMSE值較小表明預(yù)測(cè)效果好,反之表示模型的預(yù)測(cè)效果較差。
3 結(jié)論
本文提出了一種基于人工神經(jīng)網(wǎng)絡(luò)的巢湖流域水體總磷和總氮的預(yù)測(cè)模型,可以預(yù)測(cè)出水體中總磷和總氮的濃度,有利于巢湖流域水體富營(yíng)養(yǎng)化的治理,節(jié)省了水質(zhì)監(jiān)測(cè)的成本。
參考文獻(xiàn):
[1]龔文娟.巢湖流域縣河污染物來(lái)源特征分析.安徽農(nóng)業(yè)科學(xué),2019(08):73-76.
[2]曹泓.紫外可見(jiàn)光譜的水產(chǎn)養(yǎng)殖水體有機(jī)物濃度快速檢測(cè)研究.光譜學(xué)與光譜分析,2014.34(11):3015-3019.
[3]Ruben,G.and A.Y.Boakye.Prediction of Total Phosphorus Using an Artificial Neural Network.2016.
[4]孫弋清.基于進(jìn)退法的神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的確定方法.現(xiàn)代商貿(mào)工業(yè),2018.39(35):197-199.