姚巧鴿 夏銀紅
摘要:針對分割農(nóng)業(yè)害蟲圖像時不能區(qū)分相鄰灰度值的問題,提出鄰域算法。首先確定像素的鄰域度,像素的鄰域通過移除低于某一給定閾值的所有邊并將所有相連的樣本點作為域類而獲得;然后采用基于關(guān)系權(quán)重方法區(qū)分鄰域類別,從全局的角度衡量了每個特征項對所有類別的區(qū)分能力;接著基于可變聚類半徑對像素數(shù)據(jù)排重,刪除重復(fù)性數(shù)據(jù);最后給出了算法流程。仿真試驗結(jié)果表明,本研究算法分割農(nóng)業(yè)害蟲圖像的效果清晰,消耗的時間較少。
關(guān)鍵詞:鄰域關(guān)系;像素;聚類;權(quán)重;農(nóng)業(yè)害蟲;圖像分割
中圖分類號: TP391.41文獻標志碼: A
文章編號:1002-1302(2017)11-0174-04[HS)][HT9.SS]
農(nóng)業(yè)生產(chǎn)中需要檢查農(nóng)產(chǎn)品中是否存在害蟲,避免農(nóng)業(yè)災(zāi)害的發(fā)生,在農(nóng)業(yè)害蟲的檢測中圖像背景復(fù)雜,害蟲在圖像中很難與背景分離[1-2]。
傳統(tǒng)的檢測技術(shù)主要依賴于人眼,是農(nóng)民自己對農(nóng)產(chǎn)品的每個細節(jié)進行檢查。但是檢查環(huán)境往往很惡劣,同時受天氣干擾,檢查工作很難展開,利用計算機視覺處理代替人工檢測成為了一種必然的發(fā)展趨勢。目前使用的算法主要有以下幾種,K均值算法(K-means)是基于劃分的算法,只有農(nóng)業(yè)圖像數(shù)據(jù)聚類簇的平均值被定義的情況下才能使用,對噪聲和孤立點數(shù)據(jù)敏感[3];基于統(tǒng)計信息算法(statistical information grid,STING)將農(nóng)業(yè)圖像空間區(qū)域劃分為矩形單元,單元中存儲著預(yù)先計算的統(tǒng)計信息,可處理高維數(shù)據(jù),但是檢測質(zhì)量取決于網(wǎng)格的粒度,由于聚類的邊界是直線,檢測質(zhì)量較低[4];基于動態(tài)模型的層次聚類算法(dynamic model hierarchical clustering,DMHC)不依賴于靜態(tài)模型,適應(yīng)被合并簇的內(nèi)部特征,但是算法過于復(fù)雜,在每次判斷子類的相似度時都要做最小連接二等分[5];基于密度與噪聲應(yīng)用的空間聚類算法(density-based spatial clustering of applications with noise,DBSCAN)對農(nóng)業(yè)圖像數(shù)據(jù)聚類中的每個對象通過連接區(qū)域劃分為簇,但是對參數(shù)敏感,若沒有采用空間索引,時間復(fù)雜度高[6];基于共享型鄰居聚類算法(shared neighbor clustering,SNC)具有對輸入樣本的順序不敏感、輸入?yún)?shù)的鄰域知識最小化等特點,但是存在孤立點的預(yù)處理不夠,同時代表點的確定過程不夠全面[7]。
本研究通過鄰域算法(neighborhood relationship,NR)對農(nóng)業(yè)害蟲圖像分割,首先確定像素鄰域度,像素的鄰域通過移除低于某一給定閾值的所有邊并將所有相連的樣本點作為域類而獲得;然后采用基于關(guān)系權(quán)重的方法對鄰域類別區(qū)分,從全局的角度衡量了每個特征項對所有類別的區(qū)分能力;接著基于可變聚類半徑對像素數(shù)據(jù)排重,刪除重復(fù)性數(shù)據(jù),最后給出了算法流程。
1圖像像素鄰域關(guān)系數(shù)據(jù)聚類劃分
1.1像素鄰域度計算
在圖像像素集合S=(s1,s2,…,sm)中2個元素(sq,sp)(q=1,2,…,m;p=1,2,…,m)間的關(guān)系R=(r1,r2,…,rm)為有限集A=(x1,x2,…,xm),對于任何ri(i=1,2,…,m),通過xj(xj∈A)描述2個元素(sq,sp)相對ri的鄰域度,鄰域函數(shù)μri(Xj)表示鄰域度,A中所有集合的共同作用反映(sq,sp)相對于ri(i=1,2,…,m)的鄰域度μri(sq,sp):μri(sq,sp)=c1μri(x1)+c2μri(x2)+…+cmμri(xm)。其中,c1,c2,cm為權(quán)重系數(shù),且0≤cj≤1,∑[DD(]mj=1[DD)]cj=1。
對q和p取不同值,構(gòu)成模糊關(guān)系矩陣[μri(sq,sp)]m×m,反映的是圖像像素集合S中各像素相互間關(guān)系密切程度的分布情況。鄰域度越大,2個像素彼此之間的關(guān)系越密切,即可歸為圖像目標或者圖像背景[8-9]。
1.2鄰域像素排重
1.2.1像素相似度計算
假定p和q 2個像素點之間的相似度定義為
[JZ]similarity(p,q)=size(NN(p))∩(NN(q))。
式中:NN(p)、NN(q)分別為對應(yīng)p、q的最近鄰域,通過移除低于某一給定閾值的所有邊,并將所有相連的樣本點作為域類而獲得,本研究選取的閾值為
[JZ]ε=[SX(]∑[DD(]nq=1[DD)]NN(q)[KF(]∑[DD(]nq=1[DD)][NN(q)]2[KF)][SX)]。
1.2.2鄰域關(guān)系權(quán)重
為了區(qū)分鄰域類別,采用基于關(guān)系權(quán)重的方法,權(quán)重計算為
[JZ]W(t,m)=[SX(]TF(t,m)×W(t|c)[KF(]∑[DD(]t∈d[DD)][TF(t,m)×W(t|c)]2[KF)][SX)]。
式中:TF(t,m)為像素t在像素總數(shù)m中出現(xiàn)的頻數(shù);W(t|c)為關(guān)系權(quán)重,W(t|c)值越大,則特征項對于類別c的區(qū)分能力越強[10-11]。
設(shè)關(guān)系權(quán)重W(t|c)=lg(m/nt+0.02),nt為訓練集中出現(xiàn)t的像素數(shù),衡量了每個特征項對所有類別的區(qū)分能力。若給定k個類別k1,k2,…,kk,其中特征項t同屬于ki、kj 2個類別的特征集,那么:
[JZ]W(t,m)=[SX(]TF(t,m)×lg(m/nt+0.02)[KF(]∑[DD(]t∈d[DD)][TF(t,m)×lg(m/nt+0.02)]2[KF)][SX)]。
從全局的角度衡量了每個特征項對于所有類別的區(qū)分能力。
如果對于任意類別c的任意特征項t,如果W(t|c)=1,則頻數(shù)歸一化:W(t,m)=[SX(]TF(t,m)[KF(]∑[DD(]t∈d[DD)][TF(t,m)]2[KF)][SX)],則所有特征項相對于所有類別的區(qū)分能力均相同[12]。
1.2.3基于可變聚類半徑的像素數(shù)據(jù)刪重
在圖像中點為pi(i=1,2,3,…,np),線為li(i=1,2,3,…,nl),樣條線為 si(i=1,2,3,…,ns),設(shè)p1為已存在基點,基于點p1(x,y)選擇點p2,基于點p2選擇水平點p3,基于點p2、p3選擇線段l1,基于線段l1選擇平行于l1距離為l的線段l2,垂直于線段l2過點p2、p3分別選擇線段l3、l4,這樣便選擇出分割小矩形,基于點p1(x,y)選擇點p4,基于點p4選擇水平方向上的點p5;分別以點p4、p5為圓心選擇半徑為r1、r2的圓c1、c2,選擇一線段切于圓c1、c2,這樣便選擇出分割小圓形,以此類推,可以選擇任意分割小圖形的實體集合。假設(shè)節(jié)點集合為V(v1,v2,v3),分割小圖形之間的關(guān)系集為V{(v1,v2),(v1,v4),(v2,v3),(v2,v6),(v3,v6),(v3,v9),…},通過選擇適當?shù)木垲惏霃剑严嗨频姆指钚D形聚集到同一個聚簇,保留其中的一個小圖形,刪除其他小圖形,達到聚類排重的目的,同時大大降低了程序的時間復(fù)雜度??疾旌痛诸愊袼刈钕嗨频膋個小圖形鄰域,根據(jù)k個小圖形鄰域的類別來判定待分類,判斷規(guī)則:[JP2]
[HT9.,8.5]C=arg maxci[score(d,ci)]=arg maxci[∑[DD(]dj∈k[HT4.]NN(d)[DD)][HT9.,8.5]Sim(d,dj)δ(d,ci)]。[HT][JP]
式中:kNN(d)為像素d的k個鄰域;ci為類別;δ(d,ci)的含義為
[JZ]δ(d,ci)=[JB({]1[KG3]d∈ci0[KG3]dci[JB)]。
對小圖形進行兩兩比較,計算它們之間的相似度,根據(jù)給定的相似度閾值判斷,如果2個小圖形的相似度大于閾值,認為這2個小圖形重復(fù);否則,這2個小圖形不重復(fù),刪除重復(fù)小圖形。把小圖形分成若干個稱為聚簇的子集,使得每個聚簇內(nèi)的成員之間具有較大的相似性,而聚簇和聚簇之間的小圖形具有較小的相似性。并且隨著聚類半徑的減小,聚簇內(nèi)成員之間的相似性會增大[13-14]。因此,通過不斷縮小聚類半徑R,使得被聚集到同一聚簇下的小圖形之間的相似度越來越高,直到可以認為它們就是相同的小圖形為止。這樣就達到了通過聚類算法來進行小圖形排重的目的,然后保留該聚簇中的某一個小圖形,刪除其他的重復(fù)小圖形。步驟如下:
①給定聚類半徑R=[SX(]∑[DD(]i=1[DD)]ci[KF(]∑[DD(]i=1[DD)](ci)2[KF)][SX)],以其中的某個樣本向量xi初始化一個聚類中心ci=xi;
②對于樣本xi,尋找距離樣本xi最近的聚類中心ci,并得到它們之間的相似度r=[KF(][SX(]1n[SX)]∑[DD(]nl=1[DD)](xi,l-ci,l)2[KF)];
③如果r≤R,把樣本xi歸入聚類中心ci所在的聚簇Ci,同時更新該聚類中心為
[JZ]ci=[SX(]1K[SX)]∑[DD(]x[HT4.]s∈[JX+0.3mm]C[HT3.]i[DD)][HT]xs[HT]。
式中:K為聚簇Ci所包含的向量個數(shù)。如果r>R,把xi初始化為新的聚類中心cn+1=xi,n為目前的聚簇個數(shù)。
④重復(fù)步驟②,直至所有的樣本聚類完畢。
2農(nóng)業(yè)害蟲圖像分割過程
在農(nóng)業(yè)圖像灰度分布曲線中,灰度值較低的是農(nóng)業(yè)圖像背景區(qū)域,灰度值較高的是農(nóng)業(yè)害蟲圖像區(qū)域,灰度值變化比較大的地方為害蟲區(qū)域與背景的邊緣交接處。對農(nóng)業(yè)圖像的某列灰度值g(x,y)自上而下求微分,每次移動距離為Δx:
[JZ]|g(x+Δx,y)-g(x+Δx,y)|>T。
式中:T為閾值。
當灰度值變化比較大時,獲得第一個點的行數(shù)i11是該列害蟲區(qū)域的上邊緣,以及最后一個點的行數(shù)i21是該列害蟲區(qū)域的下邊緣,每列灰度掃描后,獲得上邊緣行向量I1=[i11,i12,…,i1n]和下邊緣行向量I2=[i21,i22,…,i2n],n為農(nóng)業(yè)圖像的列數(shù)。
對確定的害蟲區(qū)域上、下邊緣進行分割,統(tǒng)計圖像邊緣行所有像素的分布概率:
[
φ最大時,ρ就是最佳分割閾值。
算法流程:(1)輸入圖像,計算像素相似度;(2)對不同的像素進行鄰域關(guān)系權(quán)重計算,劃分出不同聚類;(3)通過可變聚類半徑將像素數(shù)據(jù)排重,去掉相同的聚類;(4)若當前聚類中心和前一次中心的誤差小于0.02,則可得最佳分割閾值ρ,執(zhí)行步驟(5),否則,執(zhí)行步驟(2);(5)輸出分割圖像。
3仿真試驗
[HTK]3.1農(nóng)業(yè)害蟲圖像分割[HT]
采用不同算法對農(nóng)業(yè)圖像濾波后進行分割,硬件計算機參數(shù):Inter CORE I5-2430M,主頻2.4 GHz,三級緩存為 3 MB,內(nèi)存DDR4系列,大小為4 GB,硬盤串行接口,軟件程序通過Matlab實現(xiàn)。
用不同算法對圖1的白菜蚜蟲圖像進行分割,結(jié)果如圖2所示,可以看出本研究算法NR的分割效果清晰,整體上保持了較為穩(wěn)定的分割效果,并且在局部輪廓邊緣上比其他算法分割的更精細,這是因為本研究算法通過可變聚類半徑對像素數(shù)據(jù)重復(fù)性的刪除,使得聚類之間像素分布相差不大,減少了誤分割。
用不同算法對圖3的梨小食心蟲圖像進行分割,結(jié)果如圖4所示,可以看出本研究算法NR分割受其他邊緣影響小,聚類過程考慮了鄰域像素點對中心像素點聚類結(jié)果的影響,使聚類結(jié)果較為準確。
3.2定性分析
用歸一化互相關(guān)系數(shù)(normalized correlation,NC)來評價分割效果:
[JZ]NC=[SX(]∑[DD(]Mi=1[DD)]∑[DD(]Nj=1[DD)]W(i,j)×W′(i,j)[KF(]∑[DD(]Mi=1[DD)]∑[DD(]Nj=1[DD)]W(i,j)2[KF)][KF(]∑[DD(]Mi=1[DD)]∑[DD(]Nj=1[DD)]W′2(i,j)[KF)][SX)]。
式中:M×N為圖像大??;W(i,j)、W′(i,j)表示源圖像與分割后圖像在位置(i,j)處的灰度值。NC值越接近于1越好,對白菜蚜蟲、梨小食心蟲圖像的分割NC值定性分析結(jié)果如圖5、圖6所示。
對圖像分割來說,分割速度十分重要,為了衡量各個算法的分割效率,對每幅圖像進行多次重復(fù)分割,取平均分割時間作為評價標準,對白菜蚜蟲、梨小食心蟲圖像的分割速度定性分析結(jié)果如圖7、圖8所示。
[JP2]由圖5、圖6、圖7、圖8可知,本研究算法NR的NC值較接近于1,分割消耗的時間較少,[JP3]這是因為本研究算法將像素數(shù)據(jù)對象分割成集群,在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大,以便減小數(shù)據(jù)對象之間的影響。[JP]
4總結(jié)
本研究通過鄰域算法對農(nóng)業(yè)害蟲圖像進行分割,仿真試驗結(jié)果表明,本研究算法分割的效果清晰,分割消耗的時間少,為農(nóng)業(yè)害蟲圖像分割研究提供了一種新的參考方法,但是如[CM(25]何找出像素周圍鄰域的最佳大小和個數(shù),仍然是目前面臨[CM)][FL)]
參考文獻:
[1]王愛新,李春友,張喆. 基于計算機視覺的農(nóng)業(yè)圖像害蟲定位檢測算法[J]. 江蘇農(nóng)業(yè)科學,2016,44(7):361-364.
[2]田海韜,趙軍,蒲富鵬. 馬鈴薯芽眼圖像的分割與定位方法[J]. 浙江農(nóng)業(yè)學報,2016,28(11):1947-1953.
[3]Qiu C Y,Wang C L,Zuo X Q. A novel multi-objective particle swarm optimization with K-means based global best selection strategy[J]. International Journal of Computational Intelligence Systems,2013,6(5):822-835.[ZK)][HT][HJ]
[FK(W12][TPYQG8.tif][FK)]
[HT8.]
[HJ1.7mm]
[4]Sun W,Hansen A,Zhang L Y,et al. Neonatal nicotine exposure impairs development of auditory temporal processing[J]. Hearing Research,2008,245(1/2):58-64.
[5]Pokotilovski Y N. Constraints on strongly coupled chameleon fields from the experimental test of the weak equivalence principle for the neutron[J]. JETP Letters,2013,96(12):751-753.
[6]Li X Y,Gao G H,Sun J X. A new semi-unsupervised intrusion detection method based on improved DBSCAN[J]. Journal of Networks,2010,5(12):1527-1534.
[7]Pande S,Morgan F,Cawley S,et al. Modular neural tile architecture for compact embedded hardware spiking neural network[J]. Neural Processing Letters,2013,38(2):131-153.
[8]Schübler E,Decker C,Lerch F. Networks of clusters:a governance perspective[J]. Industry and Innovation,2013,20(4):357-377.
[9]Kim H,Kim H J,Lee J H,et al. Scheduling dual-armed cluster tools with cleaning processes[J]. International Journal of Production Research,2013,51(12):3671-3687.[ZK)]
[10]Ye J. Interval-valued intuitionistic fuzzy cosine similarity measures for multiple attribute decision-making[J]. International Journal of General Systems,2013,42(8):883-891.
[11]Rocha A R,Pirmez L,Delicato F C,et al. WSNs clustering based on semantic neighborhood relationships[J]. Computer Networks,2012,56(5):1627-1645.
[12]Aljaber B,Stokes N,Bailey J,et al. Document clustering of scientific texts using citation contexts[J]. Information Retrieval Journal,2010,13(2):101-131.
[13]Hansen P,Brimberg J,Uroevi D,et al. Solving large p-median clustering problems by primal-dual variable neighborhood search[JP3][J]. Data Mining and Knowledge Discovery,2009,19(3):351-375.[JP]
[14]Gan G J. Application of data clustering and machine learning in variable annuity valuation[J]. Insurance Mathematics & Economics,2013,53(53):795-801.[ZK)][HT][HJ][FL)]