国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

均衡FCM算法在農(nóng)作物遙感影像解譯中的應(yīng)用

2020-12-09 05:31:47李奇生趙成萍尹子琴李博周新志
江蘇農(nóng)業(yè)學報 2020年5期
關(guān)鍵詞:圖像分類

李奇生 趙成萍 尹子琴 李博 周新志

摘要:針對傳統(tǒng)的模糊C-均值聚類算法(FCM算法)對大數(shù)據(jù)集收斂速度慢,聚類不均勻類別樣本時出現(xiàn)大類吃小類現(xiàn)象以及對初始聚類中心點要求高等問題,提出了一種基于均衡樣本集思想的模糊C-均值聚類算法(均衡FCM算法)。選取Landsat8、Sentinel2A遙感衛(wèi)星采集獲得的哈爾濱市賓縣2018年遙感圖像,驗證方法的有效性。結(jié)果顯示,提出的均衡FCM算法可以改善傳統(tǒng)FCM算法存在的問題,驗證了均衡FCM算法的有效性。

關(guān)鍵詞:均衡C-均值聚類算法(均衡FCM算法);混合像元;面積提取;圖像分類

中圖分類號:S127文獻標識碼:A文章編號:1000-4440(2020)05-1163-06

Abstract:To solve the conventional fuzzy C-means clustering algorithm(FCM algorithm) problems including slow convergence speed for large data sets, the occurrence of neglect of smaller clustered groups when the clustering categories are uneven, and high requirement on the initial clustering center points, this paper proposed a fuzzy clustering algorithm model based on balanced data sets (BDS-FCM algorithm). To verify the effectiveness, the remote sensing images of Bin County, Harbin City collected by Landsat8 and Sentinel2A remote sensing satellites in 2018 was selected as experimental subjects. Results of the experiment show that the proposed BDS-FCM algorithm can improve the conventional FCM algorithm and verify the effectiveness of BDS-FCM.

Key words:fuzzy C-means clustering algorithm based on balanced data sets(BDS-FCM algorithm);mixed pixel;area extraction;image classification

由于中低分辨率遙感衛(wèi)星空間分辨率較低,單個像元中可能會存在多種地物信息(混合像元)。該問題是進行遙感解譯的難點之一,許多研究者進行過混合像元分解研究[1-3]。世界各國現(xiàn)已將遙感技術(shù)融入農(nóng)作物分類、面積估算等工作中,發(fā)展至今已經(jīng)取得不錯的成就[4-6]。在多作物分類以及面積估算工作中,能否改善或解決混合像元問題常常可以決定解譯工作能否達到理想精度。常見的混合像元分解模型有線性模型、非線性模型、幾何光學模型以及模糊模型等。Kai等在決策樹分類后加入基于線性光譜混合模型用于分解混合像元,提升了分類和面積提取精度[7]。由Bezdek等提出的基于模糊集思想的模糊C-均值算法(FCM),操作簡單,將每個樣本點用一個隸屬度來反映數(shù)據(jù)的關(guān)聯(lián)程度,不同于其他的硬分類算法,它建立了樣本類屬的不確定性,客觀反映現(xiàn)實世界,被廣泛用于各領(lǐng)域[8-9]。

模糊C-均值算法被很多研究者用于遙感研究。Kaur等[10]利用了模糊算法隸屬度函數(shù)對混合像元進行分解,但該算法對噪聲敏感、魯棒性較差,初始聚類中心的選擇對最終的聚類結(jié)果影響很大,若選取不當可能會陷入局部最優(yōu),對運算速度有很大影響。同時在處理樣本集差距較大的多類別聚類中,很可能會出現(xiàn)大類吞并小類等情況。很多研究人員在改善其魯棒性上提出了優(yōu)化方法,主流的方法有2種。一種是對模糊算法自身目標函數(shù)的優(yōu)化,例如將區(qū)間2型模糊理論引入模糊算法改進目標函數(shù)[11],利用局部空間信息和灰色信息給出新的目標函數(shù)[12],引入一種加權(quán)因子同時考慮居中像素與其相鄰像素之間的空間距離和隸屬關(guān)系,以此優(yōu)化目標函數(shù)[13];另一種方法是將其他算法和FCM算法相融合,解決FCM的局限性,例如在FCM前引入SSO算法優(yōu)化目標函數(shù),進一步尋找最優(yōu)聚類中心[14]。Honglei等[15]提出一種將模糊C均值聚類與馬爾可夫隨機場相結(jié)合的聚類算法,算法本身魯棒性很強,分類精度高,但在農(nóng)業(yè)遙感面積估算工作中,樣本集的分布一般并不平均,以上方法在處理類別間樣本差距較大的情況時效果仍不夠理想。

鑒于此,本研究提出一種均衡模糊C-均值聚類算法(均衡FCM算法),將模糊算法與支持向量機算法(SVM算法)相融合,在SVM算法對樣本集粗分類后的規(guī)則文件中選取分類把握較大的點作為純凈樣本點,采用小樣本類過采樣方法平衡數(shù)據(jù)集,再將純凈樣本點各維度特征值的平均值作為初始中心點輸入FCM算法,并將該方法用于多類別農(nóng)作物的解譯。

1材料與方法

1.1研究區(qū)域與數(shù)據(jù)

賓縣是黑龍江省哈爾濱市的下轄縣,位于黑龍江省南部(圖1)。其主要農(nóng)作物有玉米、水稻等。主要糧食作物空間變化呈現(xiàn)較強的規(guī)律性。土地利用率高,其中耕地面積比例為59.56%,林地面積比例為31.64%,水域面積比例為4.97%,居民用地面積比例為3.22%,而其他類型用地如草地、未利用土地等面積比例為僅占0.61%[16]。賓縣年降雨量少,適合進行遙感研究。賓縣統(tǒng)計局2016年農(nóng)作物播種面積統(tǒng)計結(jié)果顯示玉米和水稻的播種面積占總面積的94.5%,因此本研究對主要農(nóng)作物玉米和水稻進行解譯。賓縣玉米種植面積分布較均衡,水稻種植面積集中在北部和西部地區(qū)。玉米播種時間在4月20日至5月10日之間,收獲在10月中旬。水稻 于4月育苗,5月插秧,9月末至10月上中旬收獲,主要作物生長期基本同步。在5月底至6月中旬左右,玉米還未完全長出,水稻處于泡田整地期,在該時期作物田塊易于識別。為了方便方法驗證,在無云或少云天氣下選定了2種6幅遙感圖像,即2018年6月1日、10月10日的Landsat8 OLI圖像和2018年5月31日、7月25日各2幅Sentinel 2A圖像。為了方便研究,對5月31日以及7月25日各2幅Sentinel2A圖像進行拼接,得到完整的賓縣區(qū)域。但在5月底6月初時,玉米尚未長出,其光譜信息更接近于裸地,在此情況下不易區(qū)分玉米和建筑兩種地物,而處于泡田期的水稻與水域相近。為此利用10月10日的Landsat8數(shù)據(jù)以及7月25日的Sentinel2A數(shù)據(jù)進行掩膜,在此時期植被已經(jīng)完全長出,根據(jù)其光譜信息將水域與建筑地物掩膜并裁剪5月底6月初數(shù)據(jù)。在選定特征值時,利用多波段信息進行波段運算,計算歸一化植被指數(shù)(NDVI)以及陸表水指數(shù)(LSWI),計算公式如下:

同時選取Landsat8的第6波段以及Sentinel 2A的第11波段SWIR1作為特征值輸入模型。

1.2研究方法

將BDS-FCM算法應(yīng)用于不同空間分辨率和光譜分辨率的衛(wèi)星數(shù)據(jù)。具體工作模型如圖2所示,共分為4個模塊。

1.2.1遙感數(shù)據(jù)預(yù)處理模塊預(yù)處理是進行遙感研究的必備流程。衛(wèi)星原始遙感數(shù)據(jù)無法直接用于圖像解譯,對其進行預(yù)處理的目的主要是對遙感圖像進行噪聲濾除,更好地利用預(yù)處理后的遙感圖像所反映的地物目標波譜特性進行反演、統(tǒng)計和分析。包括輻射定標、大氣校正、幾何校正等。

1.2.2特征提取模塊以人工解譯的方式選定各類監(jiān)督像元,設(shè)定樣本集中共C類子樣本。對其進行特征提取后組成一個多維特征空間。該特征空間分為2個部分,用于分類輸入的多維特征以及地理空間坐標特征。特征空間可由一個特征矩陣來表示,矩陣中元素為Ax,y={a1,a2,…,am},其中x、y表示其空間地理坐標,以便最后進行圖像還原。am為該點的第m個特征值。

1.2.3算法處理模塊BDS-FCM算法執(zhí)行步驟如下:

(1)選用SVM工具箱中l(wèi)ibsvm方法進行粗分類。選擇參數(shù)訓(xùn)練SVM模型,將監(jiān)督像元打上標簽輸入訓(xùn)練函數(shù)得到結(jié)構(gòu)模型model。其中在進行SVM算法選擇時,分類處理可選擇模型C-支持向量分類機(C-SVC)和V-支持向量分類機(V-SVC)。面對不同的應(yīng)用場景應(yīng)選擇不同的分類方法以達到最優(yōu)效果。同時核函數(shù)有線性、多項式、RBF等,選定合適的核函數(shù)將特征合理地映射至高維空間也是影響分類結(jié)果的重要因素之一。

(2)SVM分類預(yù)測,將方法1.2中的特征矩陣輸入第1步訓(xùn)練的model中進行分類,得到粗分類結(jié)果文件decision_values,由其統(tǒng)計分類結(jié)果并確定小樣本集。該文件為一個矩陣,可表示為D=[dx,y,c],其中dx,y,c表示對橫、縱坐標為x、y的點分類結(jié)果第c類的決策度,以百分數(shù)表示。

(3)擴充小樣本集,選用的方法為基于線性直插的過采樣方法(Synthetic minority oversampling technique,SMOTE)。SMOTE算法是由Nitesh等提出的面對小樣本的采樣方法[17],其原理如圖3所示。

其中X為小樣本集中的一個隨機樣本,X1、X2、X3、X4、X5是其相鄰樣本,人工合成樣本點為Y1、Y2、Y3、Y4、Y5。按照以下公式隨機插入在X與它相鄰樣本連線上的某一不確定位置。

為了減少混合像元點對結(jié)果的影響。擴充小樣本集時選擇決策度(dx,y,c)>0.9的點作為樣本進行擴充,擴充倍數(shù)為第2步中統(tǒng)計分類結(jié)果中大樣本與小樣本的比值,并將人工合成樣本并入原始樣本。將決策度(dx,y,c)>0.95的點進行分類別平均,所得各類的平均值作為下一步模糊算法的初始中心點輸入。

(4)進行模糊聚類。Ax,y點對各類地物的隸屬度表示為集合Ux,y={ux,y,1,ux,y,2,…,ux,y,C}。模糊像元點的隸屬度矩陣滿足:

對于閾值(δ)的選擇可以根據(jù)不同遙感數(shù)據(jù)源來調(diào)整,不同的空間分辨率形成模糊像元的概率不同,分辨率越高的數(shù)據(jù)閾值(δ)可設(shè)置越高。根據(jù)隸屬度矩陣將一個像元面積(S)進行分解,第i類作物占第j個混合像元的比例面積表示為:

1.2.4結(jié)果驗證模塊將方法1.3的分類結(jié)果以及分類后的面積進行統(tǒng)計。一方面將各像元分類結(jié)果與坐標特征相結(jié)合還原圖像,另一方面將試驗結(jié)果和驗證數(shù)據(jù)進行數(shù)據(jù)比對以驗證算法的準確度。

2結(jié)果與分析

數(shù)據(jù)特征空間建立后輸入模型,SVM方法選取參數(shù)更好設(shè)定的V-支持向量分類機,其中懲罰因子設(shè)置為0.5,設(shè)定對特征維度低、較大數(shù)據(jù)集分類效果較好的RBF核函數(shù)處理數(shù)據(jù)集。在模糊算法參數(shù)選擇中設(shè)定c=3,m=2,ε=1×10-5。Landsat8以及Sentinel 2A的分類效果如圖4所示,同時加入使用傳統(tǒng)FCM對Landsat8數(shù)據(jù)處理的分類結(jié)果進行對比。為了驗證本試驗的分類精度,采取混淆矩陣進行統(tǒng)計分析。為了保證選取驗證參照點的科學性,對3類地物采取分層抽樣的方法共選取500個參照點,同時利用與全色波段融合后的15 m分辨率Landsat8數(shù)據(jù)確定參照點的地物歸屬。驗證結(jié)果如表1所示。

從分類結(jié)果圖可以看到水稻樣本點沒有被正常識別,而一些玉米地和林地交界處的樣本點被識別為水稻。由于FCM本質(zhì)上是一種聚類算法,實現(xiàn)原理為優(yōu)化目標函數(shù)以達到類內(nèi)距離最小化。圖5a表示分類所要達到的效果,兩類別分類并不均勻。當FCM算法用于該數(shù)據(jù)分類時,會出現(xiàn)圖5b的問題,即為了達到距離最小化將類別中心向大類靠近,甚至將小類看作噪聲點,導(dǎo)致小類被吞并。因此在試驗數(shù)據(jù)中處于大類別的玉米樣本和林地樣本將小樣本水稻樣本吞噬,而交界處的混合樣本點數(shù)量多于水稻樣本,因此被識別為第3類。在本研究算法(均衡FCM算法)中,Landsat8數(shù)據(jù)處理的總體分類精度達到了96.2%,卡帕系數(shù)為92.98%;Sentinel2A數(shù)據(jù)處理的分類精度達到了94.8%,卡帕系數(shù)為90.34%??梢钥闯觯狙芯克惴ǎň釬CM算法)對Landsat8數(shù)據(jù)處理的分類精度高于Sentinel2A數(shù)據(jù)處理。但是Sentinel2A的空間分辨率高于Landsat8,這是由于在處理Sentinel2A數(shù)據(jù)時由兩景數(shù)據(jù)拼接時出現(xiàn)的色差問題影響了圖像解譯過程,進而導(dǎo)致分類精度下降。

閾值(δ)的選擇影響混合像元分解的精度。對賓縣Landsat8和Sentinel2A數(shù)據(jù)分別選取0.80、0.82的閾值,此參數(shù)是根據(jù)大量手動調(diào)試結(jié)果挑選出的較優(yōu)參數(shù)。選定Landsat8數(shù)據(jù)源驗證面積統(tǒng)計精度,將30 m分辨率的多光譜數(shù)據(jù)與15 m分辨率的全色波段融合得到15 m分辨率數(shù)據(jù),并通過人工先驗知識設(shè)立監(jiān)督像元點后進行監(jiān)督分類和面積統(tǒng)計用于驗證(表2、表3)。對各作物的面積統(tǒng)計精度(表3)進行加權(quán)平均可得總精度,受圖像拼接時的誤差影響,Sentinel2A的總精度略低于Landsat8。由于分解了混合像元,各類作物的面積統(tǒng)計精度獲得了提升。

3討論

本研究提出了均衡模糊C-均值聚類算法(均衡FCM算法),并用于農(nóng)作物遙感解譯。優(yōu)化了模糊算法對初始中心點的選擇,解決了當樣本集不平衡時大類吞并小類的問題。該算法利用SVM算法對數(shù)據(jù)源的特征值進行粗分類,根據(jù)粗分類的結(jié)果確定FCM算法的初始類中心點并擴充小樣本數(shù)據(jù)集以達到數(shù)據(jù)平衡的效果。選取哈爾濱市賓縣不同數(shù)據(jù)源的圖像進行試驗,分類結(jié)果和卡帕系數(shù)表明該算法可以達到較好的分類效果。通過分解混合像元提升了各類地物的面積統(tǒng)計精度。通過本試驗得到如下結(jié)論:(1)聚類算法在處理類別分布不均勻樣本時,常常會將小樣本當作噪聲而影響聚類精度,這對于農(nóng)作物遙感解譯過程是難以接受的。(2)由于地形、土壤等因素的影響,農(nóng)作物遙感樣本常出現(xiàn)分布不均情況,因此在處理類似問題時要對樣本集進行均衡化處理。(3)模糊算法將像元分解至多類,利于處理中低精度遙感數(shù)據(jù)問題,而在農(nóng)作物遙感解譯時利用此算法可以提高解譯精度,尤其在作物面積統(tǒng)計上。

研究中存在的問題:混合像元和純凈像元最高隸屬度閾值的選擇問題上本研究未給出明確的方法,選擇的主要依據(jù)是試驗結(jié)果和經(jīng)驗。但此閾值的選擇影響農(nóng)作物面積統(tǒng)計精度,需要提出一套選擇理論。此外,由于本研究算法(均衡FCM算法)在分類前要進行粗分類以確定樣本類別分布,耗時較長。因此建議在解譯前目視粗略判斷各類別分布情況,若分布相對均衡,可直接利用FCM算法進行解譯。

參考文獻:

[1]LI Q, LAN H, ZHAO X, et al. River centerline extraction? using the multiple direction integration algorithm for mixed and pure water pixels[J]. GIScience & Remote Sensing, 2019, 56(2): 256-281.

[2]XIAN-CHUAN Y, XIAO-FENG C, HENG-ZHI C, et al. Mixed-Pixel decomposition of SAR images based on single-pixel ICA with selective members[J]. GIScience & Remote Sensing, 2011, 48(1): 130-140.

[3]KAVZOGLU T, REIS S. Performance analysis of maximum likelihood and artificial neural network classifiers for training sets with mixed pixels[J]. GIScience & Remote Sensing, 2008, 45(3): 330-342.

[4]孟令奎,李曉香,張文. 植被覆蓋區(qū)VIIRS與MODIS遙感指數(shù)的相關(guān)性[J]. 江蘇農(nóng)業(yè)學報, 2018,34(3):570-577.

[5]SON N T, CHEN C F, CHEN C R, et al. AssBDSment of Sentinel-1A data for rice crop classification using random forests and support vector machines[J]. Geocarto International, 2018, 33(6): 587-601.

[6]何瑞銀,沈明霞,從靜華,等. 植被信息提取過程中ETM+遙感影像的分類方法[J]. 江蘇農(nóng)業(yè)學報, 2008, 24(1):29-32.

[7]KAI W, JUN Z, GUOFENG Z. Early estimation of winter wheat planting area in Qingyang city by decision tree and pixel Unmixing methods based on GF-1 satellite data[J]. Remote Sensing Technology and Application, 2018, 33(1): 158-167.

[8]MAHELA O P, SHAIK A G. Recognition of power quality disturbances using S-transform based ruled decision tree and fuzzy C-means clustering classifiers[J]. Applied Soft Computing, 2017, 59: 243-257.

[9]LIANG-QUN L, WEI-XIN X, ZONG-XIANG L. A novel quadrature particle filtering based on fuzzy c-means clustering[J]. Knowledge-Based Systems, 2016, 106: 105-115.

[10]KAUR S, BANSAL R K, MITTAL M, et al. Mixed pixel decomposition based on extended fuzzy clustering for single spectral value remote sensing images[J]. Journal of the Indian Society of Remote Sensing, 2019, 47(3): 427-437.

[11]QIU C, XIAO J, HAN L, et al. Enhanced interval type-2 fuzzy c-means algorithm with improved initial center[J]. Pattern Recognition Letters, 2014, 38: 86-92.

[12]KRINIDIS S, CHATZIS V. A robust fuzzy local information C-means clustering algorithm[J]. IEEE Transactions on Image ProcBDSing, 2010, 19(5): 1328-1337.

[13]ZHANG H, SHI W, HAO M, et al. An adaptive spatially constrained fuzzy c-means algorithm for multispectral remotely sensed imagery clustering[J]. International Journal of Remote Sensing, 2018, 39(8): 2207-2237.

[14]BUI Q T, NGUYEN Q H, PHAM V M, et al. A novel method for multispectral image classification by using social spider optimization algorithm integrated to fuzzy C-mean clustering[J]. Canadian Journal of Remote Sensing, 2019, 45(1): 42-53.

[15]HONGLEI Y, JUNHUAN P, BAIRU X, et al. Remote sensing classification using fuzzy C-means clustering with spatial constraints based on Markov random field[J]. European Journal of Remote Sensing, 2013, 46(1): 305-316.

[16]成勝權(quán). 基于RS和GIS的賓縣土地利用和土壤侵蝕的定量研究[J]. 水利科技與經(jīng)濟, 2012, 18(9):100.

(責任編輯:張震林)

猜你喜歡
圖像分類
基于可變形卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究
基于SVM的粉末冶金零件的多類分類器的研究
高光譜圖像分類方法的研究
深度信念網(wǎng)絡(luò)應(yīng)用于圖像分類的可行性研究
基于p.d.f特征的分層稀疏表示在圖像分類中的應(yīng)用
基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類技術(shù)研究與實現(xiàn)
基于數(shù)據(jù)挖掘的圖像分類算法
基于云計算的圖像分類算法
基于錨點建圖的半監(jiān)督分類在遙感圖像中的應(yīng)用
一種基于引導(dǎo)濾波和MNF的高光譜遙感圖像分類方法
珠海市| 洛宁县| 泰兴市| 重庆市| 揭阳市| 远安县| 宁夏| 桂平市| 鹿邑县| 温泉县| 郎溪县| 宽城| 高平市| 广南县| 甘南县| 绥阳县| 香港 | 昔阳县| 云林县| 东乌珠穆沁旗| 合川市| 勐海县| 岳池县| 四川省| 永寿县| 湛江市| 奉化市| 历史| 齐河县| 虎林市| 荃湾区| 永登县| 全椒县| 会宁县| 红安县| 昌吉市| 湘乡市| 涪陵区| 连州市| 巍山| 巴彦淖尔市|