鄒強(qiáng) 劉茜 李娟妮
摘 要:遙感影像分類是遙感技術(shù)研究發(fā)展應(yīng)用中的一個(gè)重要組成部分?;贛atlab平臺(tái)應(yīng)用BP、LVQ兩種神經(jīng)網(wǎng)絡(luò)算法對(duì)TM多光譜影像進(jìn)行了分類研究,最后應(yīng)用混淆矩陣對(duì)這兩種網(wǎng)絡(luò)算法與最大似然法的影像分類結(jié)果做了精度評(píng)價(jià)與對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,神經(jīng)網(wǎng)絡(luò)分類器作為一種非參數(shù)分類器,進(jìn)行影像光譜特征分類時(shí)能獲得較高的分類精度,引入對(duì)比度紋理特征后精度有更進(jìn)一步的提高。兩種神經(jīng)網(wǎng)絡(luò)算法中,LVQ網(wǎng)絡(luò)算法的影像分類精度比BP網(wǎng)絡(luò)要高。
關(guān)鍵詞:遙感影像分類 BP神經(jīng)網(wǎng)絡(luò) LVQ 神經(jīng)網(wǎng)絡(luò) Matlab 紋理特征
中圖分類號(hào):P237 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2014)04(c)-0223-02
近幾十年來,遙感對(duì)地觀測(cè)技術(shù)的迅速發(fā)展為地表資源調(diào)查與環(huán)境監(jiān)測(cè)提供了多平臺(tái)、多傳感器、多時(shí)相、多分辨率的海量影像數(shù)據(jù),這些數(shù)據(jù)加工處理后被廣泛應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)是以模擬人腦神經(jīng)系統(tǒng)的結(jié)構(gòu)與功能為基礎(chǔ)而建立的一個(gè)理論化數(shù)學(xué)模型,具有自學(xué)習(xí)、自組織、自適應(yīng)、高度魯棒性、全局并行分布處理等良好特性。人工神經(jīng)網(wǎng)絡(luò)分類具備較強(qiáng)容錯(cuò)性,能實(shí)現(xiàn)對(duì)特征空間較復(fù)雜的劃分。
1 特征提取與選擇
遙感影像分類是模式識(shí)別技術(shù)在遙感技術(shù)領(lǐng)域中的一種典型應(yīng)用。該文采用的影像數(shù)據(jù)為TM多光譜影像,大小為512×512,包含除熱紅外波段TM6以外的其他六個(gè)波段,空間分辨率為30 m,均已幾何校正與輻射定標(biāo)。圖1是原始TM影像的4、3、2三個(gè)波段合成的假彩色影像。如何從各波段影像中選擇或者提取特征影像對(duì)后期的影像分類精度影響較大。通常既要考慮選擇的特征影像所包含的地物信息量,又要考慮影像波段間的獨(dú)立性。對(duì)此Chavez[5]等人在1982年提出了最佳指數(shù)因子(Optimum Index Factor,OIF)模型分析法。OIF計(jì)算公式如下式(1):
(1)
式中,Si表示第i波段數(shù)據(jù)的標(biāo)準(zhǔn)差。Rij是第i個(gè)波段與第j個(gè)波段間的相關(guān)系數(shù)。本文n取值為3。OIF值越大表明對(duì)應(yīng)的波段組合兼顧波段的信息量與波段間的獨(dú)立性越好。
在計(jì)算并分析TM各波段數(shù)據(jù)間的相關(guān)系數(shù)與每個(gè)波段的信息含量后,基于OIF模型計(jì)算TM影像中任意三個(gè)波段的OIF值,在TM1,2,3時(shí),OIF值31.332;TM1,2,4時(shí),OIF值64.185;TM1,2,5時(shí),OIF值37.264;TM1,2,7時(shí),OIF值26.506;TM1,3,4時(shí),OIF值65.790;TM1,3,5時(shí),OIF值41.100;TM1,3,7時(shí),OIF值29.328;TM1,4,5時(shí),OIF值67.454;TM1,4,7時(shí),OIF值64.549;TM1,5,7時(shí),OIF值30.867;TM2,3,4時(shí),OIF值69.391;TM2,3,5時(shí),OIF值39.326;TM2,3,7時(shí),OIF值28.888;TM2,4,5時(shí),OIF值68.653;TM2,4,7時(shí),OIF值69.144;TM2,5,7時(shí),OIF值29.696;TM3,4,5時(shí),OIF值70.489。綜合分析TM影像各波段數(shù)據(jù)間的相關(guān)系數(shù)與每個(gè)波段的信息含量后,考慮將TM影像的波段組合3、4、5作為其后期分類的光譜特征影像。
紋理特征是影像中普遍存在卻又難以描述的空間特征,一直為研究者所關(guān)注。GLCM分析法是實(shí)際中常用紋理信息表達(dá)與提取的最具代表性的統(tǒng)計(jì)分析方法之一。影像的GLCM定義為從影像位置為(x,y)、灰度為i的像素出發(fā),統(tǒng)計(jì)出該像素及與此像素距離為δ、灰度為j的像素同時(shí)出現(xiàn)的概率。數(shù)學(xué)式表達(dá)如下式(2):
(2)
式中,i,j=0,1…L-1;L是影像的灰度級(jí)數(shù);分別為影像中的像素坐標(biāo);為影像的行列數(shù);δ是兩個(gè)像素間相隔的距離;θ是兩個(gè)像素連線按順時(shí)針方向與X正向軸的夾角。
Barald等[6]人的研究工作表明對(duì)遙感影像而言,對(duì)比度、相關(guān)性、熵、二階矩這四種常用的紋理度量特征統(tǒng)計(jì)效果較好。根據(jù)以上四種紋理度量特征對(duì)紋理的描述特性結(jié)合影像上待分地物類型紋理表現(xiàn)特點(diǎn),選擇了對(duì)比度紋理特征,提取結(jié)果如下圖2所示。
2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是根據(jù)生物神經(jīng)網(wǎng)絡(luò)研究成果啟發(fā)構(gòu)造的一種數(shù)學(xué)模型,神經(jīng)元是其最基本單元,其能學(xué)習(xí)和模仿人腦的信息處理活動(dòng)。
BP神經(jīng)網(wǎng)絡(luò)是一種利用非線性可微分函數(shù)進(jìn)行權(quán)值修正與調(diào)整的多層前饋人工神經(jīng)網(wǎng)絡(luò),也是前向網(wǎng)絡(luò)的核心部分,其主要特點(diǎn)是輸入信號(hào)正向傳遞,誤差反向傳播。
LVQ(學(xué)習(xí)向量量化)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法是從Kohonen競(jìng)爭(zhēng)算法演化而來,它由輸入層,競(jìng)爭(zhēng)層與線性輸出層三層神經(jīng)元組成。其中,輸入層與競(jìng)爭(zhēng)層間的神經(jīng)元全連接,競(jìng)爭(zhēng)層與輸出層之間的神經(jīng)元部分連接且連接權(quán)值固定為1。當(dāng)用于模式分類時(shí),其優(yōu)點(diǎn)在于能求得全局最優(yōu)且不需要對(duì)輸入向量進(jìn)行歸一化與正交化。
3 實(shí)驗(yàn)結(jié)果及精度評(píng)價(jià)與對(duì)比分析
結(jié)合影像的相關(guān)背景資料并對(duì)影像目視解譯,綜合分析后將TM影像上的主要地物類型分為植被、河水、海水、道路用地及居民區(qū)用地等五種。本文所用的訓(xùn)練樣本與精度測(cè)試樣本通過ENVI軟件獲取。啟動(dòng)ENVI,選取一定數(shù)量分布均勻,具有典型性、代表性及準(zhǔn)確性的訓(xùn)練樣本與測(cè)試樣本。對(duì)訓(xùn)練樣本進(jìn)行優(yōu)化提純后,確定TM影像上的待分地物類型對(duì)應(yīng)選擇的訓(xùn)練樣本數(shù)目各為500個(gè);然后為每類地物類型隨機(jī)產(chǎn)生各150個(gè)測(cè)試樣本;選擇參與分類的TM影像數(shù)據(jù)組合,將這兩類樣本均輸出保存為ASCII文本文件。
將分類影像數(shù)據(jù)及ASCII文本文件中的訓(xùn)練樣本、測(cè)試樣本讀入Matlab中,分別對(duì)其進(jìn)行如下式(3)的數(shù)據(jù)歸一化處理,以去除不同維度數(shù)據(jù)間的數(shù)量級(jí)差別,從而避免因輸入與輸出數(shù)據(jù)的數(shù)量級(jí)差別太大而造成網(wǎng)絡(luò)訓(xùn)練與預(yù)測(cè)誤差較大。
(3)endprint
式中,分別是轉(zhuǎn)換前后的數(shù)據(jù)值,分別為數(shù)據(jù)集合中的最小值與最大值。
對(duì)BP網(wǎng)絡(luò)中的不同地物類別訓(xùn)練樣本輸入向量對(duì)應(yīng)的期望輸出向量采用以下一種新編碼,如某一個(gè)輸入向量xi(i為該輸入向量的類別號(hào)),則對(duì)應(yīng)的期望輸出向量編碼為[0.1 0.1 …0.9…0.1]mT,其中m為影像上待分的地物類別數(shù)。
在Matlab平臺(tái)上創(chuàng)建BP與LVQ神經(jīng)網(wǎng)絡(luò),設(shè)置并不斷調(diào)整影響訓(xùn)練效果的相關(guān)參數(shù),如網(wǎng)絡(luò)的初始連接權(quán)值與閾值、學(xué)習(xí)算法函數(shù)、訓(xùn)練算法函數(shù)、網(wǎng)絡(luò)傳遞函數(shù)、網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)等,然后對(duì)創(chuàng)建的兩種網(wǎng)絡(luò)進(jìn)行大量的訓(xùn)練,分別取訓(xùn)練誤差最小的網(wǎng)絡(luò)對(duì)各組影像數(shù)據(jù)進(jìn)行分類;為直觀表示分類結(jié)果,使用顏色表矩陣為各地物類型對(duì)應(yīng)的類別號(hào)賦予一種顏色,其中植被為綠色、河水為藍(lán)色、海水為青色、道路用地為黃色、居民區(qū)用地為品紅色,將分類結(jié)果輸出為索引彩色圖像。
如圖3(a)、(b)、(c)、(d)分別是基于BP網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果與基于LVQ網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果。
利用訓(xùn)練好的多組BP與LVQ神經(jīng)網(wǎng)絡(luò)對(duì)相應(yīng)歸一化后的測(cè)試樣本仿真預(yù)測(cè),最終輸出為各地物類別編碼,針對(duì)不同地物類別統(tǒng)計(jì)相應(yīng)的真實(shí)地物類別編碼個(gè)數(shù),輸出為混淆矩陣,再求算總體精度與Kappa系數(shù)進(jìn)行精度評(píng)價(jià);同時(shí)亦對(duì)基于光譜特征的最大似然法分類結(jié)果進(jìn)行了精度計(jì)算。最大似然法:總體精度:72.9%,kappa系數(shù)0.711;BP網(wǎng)絡(luò)數(shù)據(jù)一總體精度76.5%,kappa系數(shù)0.743,數(shù)據(jù)二:總體精度80.7%,kappa系數(shù)0.788;LVQ網(wǎng)絡(luò):數(shù)據(jù)一總體精度79.5%,kappa系數(shù)0.774,數(shù)據(jù)二總體精度85.7%,kappa系數(shù)0.836.
對(duì)圖3中TM影像數(shù)據(jù)的各組分類結(jié)果進(jìn)行人眼目視觀察,可明顯看出LVQ神經(jīng)網(wǎng)絡(luò)算法的總體分類效果都較BP網(wǎng)絡(luò)要好,且“椒鹽現(xiàn)象”比較少。從表2中的定量精度分析中可獲知,不論是總體精度還是Kappa系數(shù),兩種神經(jīng)網(wǎng)絡(luò)算法的都較最大似然法的影像分類精度高,其中LVQ網(wǎng)絡(luò)算法的分類精度最高,尤其引入紋理特征后有更明顯的提高。
4 結(jié)語
實(shí)驗(yàn)結(jié)果表明,BP與LVQ神經(jīng)網(wǎng)絡(luò)分類器從一定程度上可以克服傳統(tǒng)遙感影像分類方法無法解決的不確定性與模糊性,能獲得較高的影像分類精度,引入紋理特征后精度有更進(jìn)一步的提高,說明這兩種神經(jīng)網(wǎng)絡(luò)算法能有效的將光譜特征與紋理特征有機(jī)結(jié)合起來對(duì)影像進(jìn)行分類,具有較強(qiáng)的研究?jī)r(jià)值與應(yīng)用意義。
參考文獻(xiàn)
[1] 魏麗英,夏明,田春林.基于LVQ神經(jīng)網(wǎng)絡(luò)的城市快速路事件自動(dòng)檢測(cè)算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2010(2).endprint
式中,分別是轉(zhuǎn)換前后的數(shù)據(jù)值,分別為數(shù)據(jù)集合中的最小值與最大值。
對(duì)BP網(wǎng)絡(luò)中的不同地物類別訓(xùn)練樣本輸入向量對(duì)應(yīng)的期望輸出向量采用以下一種新編碼,如某一個(gè)輸入向量xi(i為該輸入向量的類別號(hào)),則對(duì)應(yīng)的期望輸出向量編碼為[0.1 0.1 …0.9…0.1]mT,其中m為影像上待分的地物類別數(shù)。
在Matlab平臺(tái)上創(chuàng)建BP與LVQ神經(jīng)網(wǎng)絡(luò),設(shè)置并不斷調(diào)整影響訓(xùn)練效果的相關(guān)參數(shù),如網(wǎng)絡(luò)的初始連接權(quán)值與閾值、學(xué)習(xí)算法函數(shù)、訓(xùn)練算法函數(shù)、網(wǎng)絡(luò)傳遞函數(shù)、網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)等,然后對(duì)創(chuàng)建的兩種網(wǎng)絡(luò)進(jìn)行大量的訓(xùn)練,分別取訓(xùn)練誤差最小的網(wǎng)絡(luò)對(duì)各組影像數(shù)據(jù)進(jìn)行分類;為直觀表示分類結(jié)果,使用顏色表矩陣為各地物類型對(duì)應(yīng)的類別號(hào)賦予一種顏色,其中植被為綠色、河水為藍(lán)色、海水為青色、道路用地為黃色、居民區(qū)用地為品紅色,將分類結(jié)果輸出為索引彩色圖像。
如圖3(a)、(b)、(c)、(d)分別是基于BP網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果與基于LVQ網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果。
利用訓(xùn)練好的多組BP與LVQ神經(jīng)網(wǎng)絡(luò)對(duì)相應(yīng)歸一化后的測(cè)試樣本仿真預(yù)測(cè),最終輸出為各地物類別編碼,針對(duì)不同地物類別統(tǒng)計(jì)相應(yīng)的真實(shí)地物類別編碼個(gè)數(shù),輸出為混淆矩陣,再求算總體精度與Kappa系數(shù)進(jìn)行精度評(píng)價(jià);同時(shí)亦對(duì)基于光譜特征的最大似然法分類結(jié)果進(jìn)行了精度計(jì)算。最大似然法:總體精度:72.9%,kappa系數(shù)0.711;BP網(wǎng)絡(luò)數(shù)據(jù)一總體精度76.5%,kappa系數(shù)0.743,數(shù)據(jù)二:總體精度80.7%,kappa系數(shù)0.788;LVQ網(wǎng)絡(luò):數(shù)據(jù)一總體精度79.5%,kappa系數(shù)0.774,數(shù)據(jù)二總體精度85.7%,kappa系數(shù)0.836.
對(duì)圖3中TM影像數(shù)據(jù)的各組分類結(jié)果進(jìn)行人眼目視觀察,可明顯看出LVQ神經(jīng)網(wǎng)絡(luò)算法的總體分類效果都較BP網(wǎng)絡(luò)要好,且“椒鹽現(xiàn)象”比較少。從表2中的定量精度分析中可獲知,不論是總體精度還是Kappa系數(shù),兩種神經(jīng)網(wǎng)絡(luò)算法的都較最大似然法的影像分類精度高,其中LVQ網(wǎng)絡(luò)算法的分類精度最高,尤其引入紋理特征后有更明顯的提高。
4 結(jié)語
實(shí)驗(yàn)結(jié)果表明,BP與LVQ神經(jīng)網(wǎng)絡(luò)分類器從一定程度上可以克服傳統(tǒng)遙感影像分類方法無法解決的不確定性與模糊性,能獲得較高的影像分類精度,引入紋理特征后精度有更進(jìn)一步的提高,說明這兩種神經(jīng)網(wǎng)絡(luò)算法能有效的將光譜特征與紋理特征有機(jī)結(jié)合起來對(duì)影像進(jìn)行分類,具有較強(qiáng)的研究?jī)r(jià)值與應(yīng)用意義。
參考文獻(xiàn)
[1] 魏麗英,夏明,田春林.基于LVQ神經(jīng)網(wǎng)絡(luò)的城市快速路事件自動(dòng)檢測(cè)算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2010(2).endprint
式中,分別是轉(zhuǎn)換前后的數(shù)據(jù)值,分別為數(shù)據(jù)集合中的最小值與最大值。
對(duì)BP網(wǎng)絡(luò)中的不同地物類別訓(xùn)練樣本輸入向量對(duì)應(yīng)的期望輸出向量采用以下一種新編碼,如某一個(gè)輸入向量xi(i為該輸入向量的類別號(hào)),則對(duì)應(yīng)的期望輸出向量編碼為[0.1 0.1 …0.9…0.1]mT,其中m為影像上待分的地物類別數(shù)。
在Matlab平臺(tái)上創(chuàng)建BP與LVQ神經(jīng)網(wǎng)絡(luò),設(shè)置并不斷調(diào)整影響訓(xùn)練效果的相關(guān)參數(shù),如網(wǎng)絡(luò)的初始連接權(quán)值與閾值、學(xué)習(xí)算法函數(shù)、訓(xùn)練算法函數(shù)、網(wǎng)絡(luò)傳遞函數(shù)、網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)等,然后對(duì)創(chuàng)建的兩種網(wǎng)絡(luò)進(jìn)行大量的訓(xùn)練,分別取訓(xùn)練誤差最小的網(wǎng)絡(luò)對(duì)各組影像數(shù)據(jù)進(jìn)行分類;為直觀表示分類結(jié)果,使用顏色表矩陣為各地物類型對(duì)應(yīng)的類別號(hào)賦予一種顏色,其中植被為綠色、河水為藍(lán)色、海水為青色、道路用地為黃色、居民區(qū)用地為品紅色,將分類結(jié)果輸出為索引彩色圖像。
如圖3(a)、(b)、(c)、(d)分別是基于BP網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果與基于LVQ網(wǎng)絡(luò)的兩組TM影像數(shù)據(jù)分類結(jié)果。
利用訓(xùn)練好的多組BP與LVQ神經(jīng)網(wǎng)絡(luò)對(duì)相應(yīng)歸一化后的測(cè)試樣本仿真預(yù)測(cè),最終輸出為各地物類別編碼,針對(duì)不同地物類別統(tǒng)計(jì)相應(yīng)的真實(shí)地物類別編碼個(gè)數(shù),輸出為混淆矩陣,再求算總體精度與Kappa系數(shù)進(jìn)行精度評(píng)價(jià);同時(shí)亦對(duì)基于光譜特征的最大似然法分類結(jié)果進(jìn)行了精度計(jì)算。最大似然法:總體精度:72.9%,kappa系數(shù)0.711;BP網(wǎng)絡(luò)數(shù)據(jù)一總體精度76.5%,kappa系數(shù)0.743,數(shù)據(jù)二:總體精度80.7%,kappa系數(shù)0.788;LVQ網(wǎng)絡(luò):數(shù)據(jù)一總體精度79.5%,kappa系數(shù)0.774,數(shù)據(jù)二總體精度85.7%,kappa系數(shù)0.836.
對(duì)圖3中TM影像數(shù)據(jù)的各組分類結(jié)果進(jìn)行人眼目視觀察,可明顯看出LVQ神經(jīng)網(wǎng)絡(luò)算法的總體分類效果都較BP網(wǎng)絡(luò)要好,且“椒鹽現(xiàn)象”比較少。從表2中的定量精度分析中可獲知,不論是總體精度還是Kappa系數(shù),兩種神經(jīng)網(wǎng)絡(luò)算法的都較最大似然法的影像分類精度高,其中LVQ網(wǎng)絡(luò)算法的分類精度最高,尤其引入紋理特征后有更明顯的提高。
4 結(jié)語
實(shí)驗(yàn)結(jié)果表明,BP與LVQ神經(jīng)網(wǎng)絡(luò)分類器從一定程度上可以克服傳統(tǒng)遙感影像分類方法無法解決的不確定性與模糊性,能獲得較高的影像分類精度,引入紋理特征后精度有更進(jìn)一步的提高,說明這兩種神經(jīng)網(wǎng)絡(luò)算法能有效的將光譜特征與紋理特征有機(jī)結(jié)合起來對(duì)影像進(jìn)行分類,具有較強(qiáng)的研究?jī)r(jià)值與應(yīng)用意義。
參考文獻(xiàn)
[1] 魏麗英,夏明,田春林.基于LVQ神經(jīng)網(wǎng)絡(luò)的城市快速路事件自動(dòng)檢測(cè)算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2010(2).endprint