【摘要】:在國家可持續(xù)發(fā)展的理念倡導(dǎo)下,環(huán)境保護(hù)受到越來越多的關(guān)注,在大數(shù)據(jù)時(shí)代,環(huán)境保護(hù)管理系統(tǒng)的出現(xiàn),為環(huán)境保護(hù)工作的質(zhì)量與效率提升提供了重要作用?;诖?,本文就數(shù)據(jù)挖掘技術(shù)在環(huán)境保護(hù)綜合管理系統(tǒng)中的應(yīng)用展開分析,首先,對環(huán)境數(shù)據(jù)采集與關(guān)鍵因素分析環(huán)節(jié)所應(yīng)用的大數(shù)據(jù)挖掘技術(shù)進(jìn)行簡要分析,進(jìn)一步探究大數(shù)據(jù)技術(shù)在包括預(yù)測方法與預(yù)測驗(yàn)證在內(nèi)的,環(huán)境預(yù)測方面的應(yīng)用分析。
【關(guān)鍵詞】:數(shù)據(jù)挖掘技術(shù);環(huán)境保護(hù);數(shù)據(jù)采集
前言:環(huán)境保護(hù)的實(shí)施質(zhì)量與效率,對城市的生態(tài)建設(shè)與可持續(xù)發(fā)展具有極大的管理。本文以S市環(huán)境保護(hù)綜合系統(tǒng)的應(yīng)用為例,分析新時(shí)期,數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程及效果,對提升系統(tǒng)的應(yīng)用價(jià)值具有重要作用。因此,要以生態(tài)健康和城市居民的身體健康為保護(hù)目標(biāo),充分運(yùn)用數(shù)據(jù)挖掘技術(shù),提升環(huán)境保護(hù)綜合管理系統(tǒng)的實(shí)踐性能,最終實(shí)現(xiàn)環(huán)境保護(hù)的長效管理。
1.環(huán)境數(shù)據(jù)的采集與關(guān)鍵因素分析
筆者以S市的水質(zhì)污染與治理狀況為基礎(chǔ),對數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行如下分析:
1.1數(shù)據(jù)采集
對S市的相關(guān)水質(zhì)數(shù)據(jù)進(jìn)行采集,主要目標(biāo)是自動監(jiān)測子站數(shù)據(jù)以及周邊污染企業(yè)排污數(shù)據(jù)。利用環(huán)境保護(hù)綜合管理系統(tǒng)進(jìn)行數(shù)據(jù)采集,數(shù)據(jù)來源主要依賴于污染源在線監(jiān)控子系統(tǒng)。
污染源在線監(jiān)控子系統(tǒng)主要的監(jiān)控對象為工業(yè)污染源,監(jiān)控手段即對區(qū)域排污狀況以及排污趨勢進(jìn)行了解和掌握,通過監(jiān)測結(jié)果與監(jiān)控資料等,能夠進(jìn)一步執(zhí)行環(huán)境保護(hù)法規(guī)與標(biāo)準(zhǔn),進(jìn)而推動環(huán)境管理工作的順利執(zhí)行。在污染源在線監(jiān)控子系統(tǒng)當(dāng)中,主要包括三個(gè)重要內(nèi)容,即現(xiàn)場在線監(jiān)控點(diǎn)、監(jiān)控中心以及數(shù)據(jù)傳輸網(wǎng)絡(luò),現(xiàn)場監(jiān)控點(diǎn)包括在線監(jiān)測儀器、通訊器等硬件設(shè)施,在捕捉到數(shù)據(jù)信息之后,及時(shí)利用數(shù)據(jù)傳輸網(wǎng)絡(luò),傳送至監(jiān)控中心,以視頻或信號等形式呈現(xiàn)監(jiān)控狀況。數(shù)據(jù)挖掘技術(shù)主要應(yīng)用于監(jiān)控中心,在其接收到各類環(huán)保信息之后,進(jìn)一步展開數(shù)據(jù)分析、計(jì)算以及數(shù)據(jù)處理操作,以全面滿足環(huán)境保護(hù)工作的業(yè)務(wù)管理需求與保護(hù)決策需求[1]。監(jiān)控中心為環(huán)境保護(hù)綜合管理系統(tǒng)提供各項(xiàng)數(shù)據(jù)服務(wù),是重要的信息交互支撐平臺,
1.2關(guān)鍵因素分析
基于數(shù)據(jù)挖掘技術(shù)的環(huán)境保護(hù)綜合管理系統(tǒng),在數(shù)據(jù)采集的基礎(chǔ)上能夠進(jìn)一步利用數(shù)據(jù)挖掘算法當(dāng)中的樸素貝葉斯分類算法,分析得出影響因素以及關(guān)鍵影響因素。
貝葉斯定理的基本求解公式導(dǎo)出過程如下:P(A|B)=P(AB)/P(B);P(A|B)表示的是事件B發(fā)生下事件A的條件概率,即事件B事先已經(jīng)發(fā)生,求解此種基礎(chǔ)上事件A的發(fā)生概率;P(AB)則表示事件A與事件B同時(shí)發(fā)生的概率;P(B)表示的是事件B發(fā)生的概率。無論事件A與事件B是否互為獨(dú)立事件,都能夠得出公式P(AB)=P(A|B)·P(B)=P(B|A)·P(A)。由此能夠進(jìn)一步導(dǎo)出貝葉斯定理:P(B|A)=[P(A|B)·P(B)]/P(A)。
運(yùn)用貝葉斯定理,從Excel數(shù)據(jù)挖掘工具當(dāng)中對影響環(huán)境能的關(guān)鍵因素進(jìn)行分析,需要經(jīng)歷以下三個(gè)步驟:第一,要完善建立數(shù)據(jù)挖掘結(jié)構(gòu),并將與數(shù)據(jù)相關(guān)的關(guān)鍵信息進(jìn)行導(dǎo)入存儲;第二,利用Microsoft貝葉斯概率分類算法,進(jìn)一步構(gòu)建數(shù)據(jù)挖掘模型;第三,針對模型當(dāng)中的相對屬性發(fā)出預(yù)測查詢命令,進(jìn)而達(dá)到識別區(qū)分明顯目標(biāo)屬性之間的因素。
2.環(huán)境預(yù)測及效果分析
2.1預(yù)測方法的選擇
構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的過程中,將人為影響因素全部剔除,進(jìn)而獲得水質(zhì)本身特點(diǎn),與傳統(tǒng)的水質(zhì)預(yù)測方法有著本質(zhì)的區(qū)別,此種方式所獲得的輸出結(jié)果更具有客觀性。神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用,需要應(yīng)用大量的歷史數(shù)據(jù),如,S市環(huán)境綜合管理系統(tǒng)中由污染源在線監(jiān)測系統(tǒng)與水質(zhì)自動監(jiān)測系統(tǒng)獲取的大量數(shù)據(jù),是構(gòu)建神經(jīng)網(wǎng)絡(luò)模型、推動神經(jīng)網(wǎng)絡(luò)模型運(yùn)算與分析的重要條件?;谏窠?jīng)網(wǎng)絡(luò)方法的多種適用性,在水質(zhì)預(yù)測中的應(yīng)用較為廣泛。尤其是其建模方法的靈活性,能過采用多種非線性函數(shù),來有效構(gòu)建、模擬其過程的非線性特征。
2.2預(yù)測驗(yàn)證
利用Excel數(shù)據(jù)挖掘工具中的神經(jīng)網(wǎng)絡(luò)算法,能夠?qū)Σ杉降娜繑?shù)據(jù)進(jìn)行有效預(yù)測。S市的環(huán)境保護(hù)綜合管理系統(tǒng)中,共包含17個(gè)水質(zhì)自動監(jiān)測項(xiàng)目、7個(gè)周邊污染源排放數(shù)據(jù),總計(jì)34個(gè)屬性。針對這34個(gè)屬性,按照每個(gè)屬性半年期限內(nèi)184個(gè)日均值數(shù)據(jù)來看,共有6358個(gè)數(shù)據(jù)需要參與到模型運(yùn)算當(dāng)中。神經(jīng)網(wǎng)絡(luò)模型的多屬性、大數(shù)據(jù)量的特點(diǎn),直接影響運(yùn)算時(shí)間較長。在此基礎(chǔ)上,運(yùn)用基于粗糙集的神經(jīng)網(wǎng)絡(luò)預(yù)測技術(shù),對模型進(jìn)行數(shù)據(jù)處理,約簡屬性后再次進(jìn)行運(yùn)算,能夠顯著降低神經(jīng)網(wǎng)絡(luò)預(yù)測誤差[2]。約簡屬性至9個(gè),極大的簡化了運(yùn)算過程與運(yùn)算量,從而有效縮短運(yùn)算時(shí)間。
這種基于粗糙集的神經(jīng)網(wǎng)絡(luò)預(yù)測技術(shù),與其他的時(shí)序算法、一般神經(jīng)網(wǎng)絡(luò)算法、邏輯回歸算法等相比,性能更好,效率更高,在很大程度上提升了預(yù)測效果的準(zhǔn)確性,應(yīng)用于環(huán)境綜合管理系統(tǒng)當(dāng)中,具有更高適用性。隨著水質(zhì)自動監(jiān)測項(xiàng)目的增加,監(jiān)測數(shù)據(jù)量也會越來越多,因此,在上述技術(shù)的基礎(chǔ)上,要進(jìn)一步增加訓(xùn)練數(shù)據(jù),以有效提升環(huán)境預(yù)測的精確度。
結(jié)束語:綜上所述,對數(shù)據(jù)挖掘技術(shù)在環(huán)境保護(hù)綜合管理系統(tǒng)中的應(yīng)用進(jìn)行分析,有利于促進(jìn)城市的生態(tài)建設(shè)與可持續(xù)發(fā)展。通過上述分析,能夠充分意識到大數(shù)據(jù)時(shí)代為環(huán)境保護(hù)工作帶來的優(yōu)勢與便利,進(jìn)而充分?jǐn)?shù)據(jù)挖掘技術(shù),能夠顯著提升數(shù)據(jù)采集與應(yīng)用效率,提升環(huán)境保護(hù)的效果,促進(jìn)系統(tǒng)建設(shè)與運(yùn)行的社會效益增強(qiáng)。因此,在未來的研究與發(fā)展過程中,要以數(shù)據(jù)挖掘?yàn)楹诵?,不斷拓展先進(jìn)技術(shù)的有效應(yīng)用,以促進(jìn)其信息化、智能化發(fā)展。
【參考文獻(xiàn)】:
[1]李愛霞,曹占江,譚會娟. 沙坡頭站荒漠生態(tài)環(huán)境長期定位監(jiān)測數(shù)據(jù)信息管理系統(tǒng)的建設(shè)與發(fā)展[J]. 中國沙漠,2014,34(02):617-624.
[2]巴愛軍,張富林. 企業(yè)環(huán)境保護(hù)監(jiān)測管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 信息與電腦(理論版),2012,(02):38-39.
作者簡介:王勇(1980.06.05);性別:男,籍貫:黑龍江省寧安人,學(xué)歷:本科,畢業(yè)于黑龍江八一農(nóng)墾大學(xué);現(xiàn)有職稱:環(huán)境工程師;研究方向:環(huán)境保護(hù);