国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于空間向量遺傳聚類的海洋環(huán)境監(jiān)測數(shù)據(jù)分析*

2012-10-22 01:06:20周汝雁陳中華代巖巖趙世亭何世鈞
傳感器與微系統(tǒng) 2012年6期
關(guān)鍵詞:數(shù)據(jù)源監(jiān)測點(diǎn)海水

周汝雁,陳中華,代巖巖,趙世亭,何世鈞

(上海海洋大學(xué)信息學(xué)院,上海 201306)

0 引言

近幾十年,人為排污活動加劇,進(jìn)入河口地區(qū)的營養(yǎng)物質(zhì)極大地促進(jìn)了這些海域的初級生產(chǎn),造成某些海區(qū)富營養(yǎng)化,導(dǎo)致海水的酸度增加,這些都將對海洋漁業(yè)生產(chǎn)和海洋生態(tài)環(huán)境產(chǎn)生巨大的影響[1]。雖然國家相關(guān)部門出臺了污水排放的相關(guān)標(biāo)準(zhǔn)和法規(guī),但有些單位仍向海水排放未經(jīng)處理的污水,有些污水處理廠也向海水中排放水質(zhì)超標(biāo)的污水,因此,海水水質(zhì)檢測和水質(zhì)變化情況監(jiān)測對保護(hù)海洋環(huán)境有著深遠(yuǎn)的意義[2,3]。

針對海水水質(zhì)監(jiān)測的多參數(shù)數(shù)據(jù)分析的處理,監(jiān)測中心接收到的數(shù)據(jù)都為海量數(shù)據(jù),對于進(jìn)一步的數(shù)據(jù)處理和控制措施的實(shí)施監(jiān)測中心要花費(fèi)較長的處理時(shí)間,因此,在進(jìn)行異常情況確認(rèn)和處理前首先要進(jìn)行數(shù)據(jù)挖掘,從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、事先不知但又潛在有用的信息,聚類分析是數(shù)據(jù)挖掘的重要方法之一,而海洋環(huán)境參數(shù)的變化是漸進(jìn)的,即便有國家海水水質(zhì)標(biāo)準(zhǔn),但水質(zhì)狀況的分析既要對多項(xiàng)指標(biāo)進(jìn)行綜合評價(jià),又具有模糊過渡的特點(diǎn),因此,引入隸屬度概念,采用模糊C均值(FCM)聚類方法進(jìn)行分析更為合理,克服了硬性分類的不足[4],但基于目標(biāo)函數(shù)的FCM是一種局部尋優(yōu)算法,存在對初始化敏感和難以獲得全局最優(yōu)解的缺陷,其聚類數(shù)目也是依照經(jīng)驗(yàn)進(jìn)行選取的,缺乏充分的科學(xué)性,而且海量數(shù)據(jù)的聚類會浪費(fèi)大量的時(shí)間和資源;遺傳算法(GA)是一種借鑒生物界自然選擇和進(jìn)化機(jī)制發(fā)展起來的具有自適應(yīng)性和自組織能力的隨機(jī)搜索算法,具有全局搜索和并行計(jì)算能力,被廣泛應(yīng)用于求解復(fù)雜的優(yōu)化問題[5,6],遺傳算法通過模仿生物界“適者生存”原理,無需待解問題領(lǐng)域的特殊知識,無需對所有數(shù)據(jù)逐一進(jìn)行處理,而是隨機(jī)生成優(yōu)化問題的一組可能解,經(jīng)遺傳變異操作后便可得到優(yōu)化問題的全局近似最優(yōu)解[7]。因此,本文采用空間向量遺傳聚類分析方法,進(jìn)行海量數(shù)據(jù)處理,既可大大減少數(shù)據(jù)處理量,又能得到科學(xué)合理的處理結(jié)果,也可提高監(jiān)測中心對異常情況的響應(yīng)速度。

1 遺傳聚類算法

1.1 FCM 聚類算法

FCM算法具有良好的局部尋優(yōu)性和誤差收斂性,是一種貪心算法,并不一定能夠得到全局最優(yōu)解,經(jīng)常會陷入到局部最優(yōu)而非全局最優(yōu)。算法步驟為

將有限向量 x={xk|xk∈RP,k=1,2,3,…,n}分為c類(1<c<n),分類矩陣U為

其中,uik表示向量xi屬于類ck的隸屬度,0≤uik≤1。

目標(biāo)函數(shù)可定義為

其中,dik為向量 xk到ci的空間距離,ci(1≤i≤c),ci∈RP。

算法執(zhí)行前給出固定迭代次數(shù),以免終止條件不能滿足陷入無限循環(huán)。FCM算法應(yīng)用于下述遺傳聚類算法步驟(2)。

1.2 遺傳聚類算法步驟

1)種群初始化:n個(gè)樣本被分為c類,每個(gè)聚類中心作為一個(gè)基因,c個(gè)基因組成的基因鏈形成染色體,初始聚類中心隨機(jī)選取,因此,初始染色體由隨機(jī)選擇的c個(gè)基因組成。設(shè)置種群大小n、最大進(jìn)化代數(shù)g、交叉概率Pc、變異概率Pm的初始值。從數(shù)據(jù)集S={S1,S2,…,Sm}中隨機(jī)選取n個(gè)向量形成初始種群,組成模糊分類矩陣U。

2)對種群進(jìn)行以下操作:a.隨機(jī)選取聚類中心;b.進(jìn)行聚類劃分;c.求解當(dāng)前劃分下的聚類中心,為提高搜索速度,初始聚類中心可根據(jù)實(shí)際數(shù)據(jù)分布情況進(jìn)行給定,在每次得到聚類劃分得到聚類中心后,用當(dāng)前的聚類中心替換原來的聚類中心;d.計(jì)算適應(yīng)度。

3)選擇運(yùn)算:按染色體適應(yīng)度大小用輪盤賭方法選擇下一代個(gè)體。

4)交叉運(yùn)算:任選2個(gè)個(gè)體進(jìn)行單點(diǎn)交叉操作。

5)變異運(yùn)算:變異的概率由變異概率參數(shù)Pm決定,變異的位置隨機(jī)產(chǎn)生,采用對變異位進(jìn)行“非”操作。

6)得到最優(yōu)染色體:若達(dá)到停止條件,迭代結(jié)束,解碼出聚類中心;否則,轉(zhuǎn)向步驟(2),重復(fù)執(zhí)行迭代過程[8]。

2 監(jiān)測點(diǎn)海水水質(zhì)狀況遺傳聚類分析

以上海地區(qū)沿海水質(zhì)狀況監(jiān)測情況為例,在距離海岸100 m處每間隔5 km設(shè)置1個(gè)采樣點(diǎn),30處監(jiān)測采樣點(diǎn)分布見圖1所示,從北向南分別標(biāo)記為采樣點(diǎn)1~30。根據(jù)投放的浮標(biāo),結(jié)合實(shí)測數(shù)據(jù)以及遙感數(shù)據(jù),提取溫度,鹽度,pH,DO 4個(gè)參數(shù)為特征參數(shù)進(jìn)行分析,其中DO值為表觀耗氧量AOU。

圖1 檢測區(qū)域采樣點(diǎn)Fig 1 Sampling sites in the monitoring area

2.1 對某一時(shí)段內(nèi)不同監(jiān)測點(diǎn)數(shù)據(jù)的聚類分析

對某一時(shí)段內(nèi)30個(gè)監(jiān)測點(diǎn),各監(jiān)測點(diǎn)間隔30 min連續(xù)測量5 h得到的300組數(shù)據(jù)進(jìn)行分析。聚類初始條件設(shè)置為:種群大小n=100、最大進(jìn)化代數(shù)g=50、交叉概率Pc=0.9、變異概率Pm=0.01。

聚類結(jié)果顯示,采樣點(diǎn)數(shù)據(jù)可分為4類,見圖2與表1。

圖2 采樣點(diǎn)聚類結(jié)果Fig 2 Clustering result of sampling sites

表1 各采樣點(diǎn)所屬類別Tab 1 Categories of each sampling sites

聚類結(jié)果在環(huán)境監(jiān)測參數(shù)特征空間的投影如圖3所示。

其中I類,由圖3(a)和(b)顯示,此類監(jiān)測點(diǎn)pH在7~9之間,大部分集中在8左右。DO值在4~8mg/L之間,大部分集中在6~8 mg/L之間。鹽度在(25~35)×10-3之間,大部分集中在(30~35)×10-3之間,溫度基本在 21.5~22.5℃之間,此類點(diǎn)海水檢測數(shù)據(jù)顯示,除DO值稍低之外,海水其他參數(shù)較為正常。II類,由圖3(a)和(d)顯示,此類監(jiān)測點(diǎn)pH與I類基本相同,在7~9之間。但鹽度在(13~25)×10-3之間,明顯低于 I類,DO 值在2.5~4.5 mg/L之間,溫度基本在22~23℃之間。此類點(diǎn)應(yīng)為有污水排放或有河水與海水交匯,水質(zhì)狀況比較正常。Ⅲ類,由圖3(c)和(d)顯示,此類監(jiān)測點(diǎn)DO值和溫度值與II類基本相同,DO 值基本在2.5~4.5 mg/L 之間,溫度基本在22~23℃之間,少數(shù)監(jiān)測點(diǎn)溫度高于23℃。但pH偏低,在6~7之間。鹽度在(5~20)×10-3之間,也低于II類。此類點(diǎn)附近應(yīng)有陸源排污口,水質(zhì)狀況較差,需要進(jìn)行進(jìn)一步監(jiān)測或進(jìn)行處理。Ⅳ類,由圖3(a)和(c)顯示,此類監(jiān)測點(diǎn)DO值最低,基本在1~3 mg/L之間。pH范圍較大,在8.5~12之間。鹽度值最低,在(0~15)×10-3之間。溫度最高,在23.5~25℃之間。此類監(jiān)測點(diǎn)水質(zhì)狀況較差,附近應(yīng)有陸源排污口,溫度最高主要是由于排出的污水所致,而且排出的污水處理情況很差,需要進(jìn)行進(jìn)一步監(jiān)測或進(jìn)行處理。

圖3 聚類結(jié)果在環(huán)境監(jiān)測參數(shù)特征空間的投影Fig 3 Projection of clustering result into the feature space of environment monitoring parameters

從聚類結(jié)果在環(huán)境監(jiān)測參數(shù)特征空間的投影可以看出:I類數(shù)據(jù)源采樣點(diǎn)所處位置為水質(zhì)最好的區(qū)域,II類次之,Ⅲ類和Ⅳ類數(shù)據(jù)源采樣點(diǎn)所處位置的水質(zhì)較差,通過采樣點(diǎn)數(shù)據(jù)在多參數(shù)特征空間的分布情況,可實(shí)現(xiàn)對海水水質(zhì)狀況的分類識別、分析,并進(jìn)行進(jìn)一步的監(jiān)測處理。

2.2 對不同時(shí)段監(jiān)測點(diǎn)數(shù)據(jù)的分析

對30個(gè)監(jiān)測點(diǎn)相隔2 d后另一時(shí)段監(jiān)測到的300組多參數(shù)數(shù)據(jù)進(jìn)行分析。仍按2.1的聚類結(jié)果的分類情況將300組數(shù)據(jù)在環(huán)境監(jiān)測參數(shù)特征空間進(jìn)行投影,如圖4所示。

圖4 聚類結(jié)果在環(huán)境監(jiān)測參數(shù)特征空間的投影Fig 4 Projection of clustering results into the feature space of environment monitoring parameters

將圖4與圖3進(jìn)行比較可以看出:I類數(shù)據(jù)源采樣點(diǎn)中部分?jǐn)?shù)據(jù)向II類數(shù)據(jù)方向移動,說明此類中某些采樣點(diǎn)處的水質(zhì)情況在變差,II類數(shù)據(jù)源采樣點(diǎn)中部分?jǐn)?shù)據(jù)向Ⅲ類數(shù)據(jù)方向移動,說明此類中某些采樣點(diǎn)處的水質(zhì)情況在變差,Ⅲ類數(shù)據(jù)源采樣點(diǎn)數(shù)據(jù)位置無大的變化,與圖3所處位置基本相同,說明此類中采樣點(diǎn)處的水質(zhì)情況無明顯變化,Ⅳ類數(shù)據(jù)源采樣點(diǎn)向pH值低的II類數(shù)據(jù)方向移動,DO值也有所升高,說明此類中某些采樣點(diǎn)處的水質(zhì)情況在變好,但此類采樣點(diǎn)所處區(qū)域水質(zhì)狀況仍不容樂觀。

若進(jìn)行分析時(shí)各類采樣點(diǎn)數(shù)據(jù)混雜分布,無法區(qū)分時(shí),可重新按2.1給出的方法聚類后再進(jìn)行分析。

3 結(jié)論

本文以海水水質(zhì)常見參數(shù)為例,給出了一種遺傳算法和模糊聚類分析相結(jié)合進(jìn)行海水質(zhì)狀況數(shù)據(jù)處理的方法,該方法可以在某一時(shí)間段對不同監(jiān)測點(diǎn)數(shù)據(jù)進(jìn)行分析,得到監(jiān)測區(qū)域內(nèi)的水質(zhì)狀況分類情況,發(fā)現(xiàn)并確定水質(zhì)狀況異常海域。采用此方法還可以對不同時(shí)段監(jiān)測點(diǎn)數(shù)據(jù)進(jìn)行分析,得到該監(jiān)測區(qū)域海水水質(zhì)變化趨勢。另外,采用此方法也可以將其他多項(xiàng)海水水質(zhì)參數(shù)數(shù)據(jù),如N含量、P含量,COD值,硫化物、濁度等參數(shù)在特征空間進(jìn)行聚類分析,是海洋環(huán)境多參數(shù)數(shù)據(jù)分析及信息挖掘的一種有效方法。

[1] 張 勇,崔永平,秦榜輝,等.上海市排污口有機(jī)污染物調(diào)查研究[J].海洋開發(fā)與管理,2008(7):81-83.

[2] 王 琪.海洋環(huán)境問題及其政府管理[J].中國海洋大學(xué)學(xué)報(bào):社會科學(xué)版,2002(4):91 -96.

[3] 馬春生,潘 紅,周洪英,等.發(fā)展海洋環(huán)境監(jiān)測的意義和作用[J].科技創(chuàng)新導(dǎo)報(bào),2010(2):123-124.

[4] 郭良波.模糊數(shù)學(xué)在海洋環(huán)境評價(jià)中的應(yīng)用[J].南陽理工學(xué)院學(xué)報(bào),2010,3(2):83 -86.

[5] Goldberg D E.Genetic algorithms in search,optimization and machine learning[M].New York:Addison-Wesley,1989:106 -110.

[6] Holland J H.Adaptation in natural and artificial systems[M].Ann Arbor:University of Michigan Press,1975:126 -130.

[7] Bandyopadhyay S,Maulik U.Genetic clustering for automatic evolution of clusters and application to image classification[J].Pattern Recognition,2002,35(6):1197 -1208.

[8] Zhou Ruyan,Chen Ming,F(xiàn)eng Guofu,et al.Genetic clustering route algorithm in WSNs[C]∥The 6th International Conference on Natural Computation,2010:4023 -4026.

猜你喜歡
數(shù)據(jù)源監(jiān)測點(diǎn)海水
天津南港LNG接收站沉降監(jiān)測點(diǎn)位布設(shè)
煤氣與熱力(2022年4期)2022-05-23 12:44:56
撫河流域綜合治理監(jiān)測布局優(yōu)化
全站儀極坐標(biāo)法監(jiān)測點(diǎn)穩(wěn)定性分析方法研究
喝多少杯海水能把人“渴死”?
海水為什么不能喝?
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價(jià)研究
海水
我省舉辦家畜血吸蟲病監(jiān)測點(diǎn)培訓(xùn)班
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價(jià)算法
太康县| 津南区| 盱眙县| 岳普湖县| 白玉县| 万荣县| 东港市| 墨竹工卡县| 龙里县| 封丘县| 饶阳县| 平利县| 南宁市| 耿马| 黄山市| 汉阴县| 娱乐| 怀远县| 望城县| 铜梁县| 若羌县| 咸宁市| 英山县| 通许县| 嘉定区| 洞头县| 清徐县| 开阳县| 金溪县| 九台市| 宜兰县| 锦屏县| 余江县| 宁安市| 延川县| 英德市| 扎赉特旗| 万载县| 峨眉山市| 包头市| 佳木斯市|