吳濤
摘 要:圖像的光譜特征、高頻紋理特征和中低頻紋理特征,影響算法的特征提取結(jié)果,現(xiàn)有的圖像分類算法由于特征提取與訓(xùn)練方法工作不到位,導(dǎo)致分類準(zhǔn)確率難以達(dá)到預(yù)期目標(biāo),針對該問題研究基于特征提取和半監(jiān)督學(xué)習(xí)的圖像分類算法。算法設(shè)置過濾式、封裝式以及嵌入式特征篩選規(guī)則,預(yù)處理原始圖像特征信息;增強(qiáng)圖像敏感區(qū)域,提取圖像光譜特征,利用灰度共生矩陣和復(fù)值函數(shù)Gabor濾波,提取圖像高頻紋理和中低頻紋理特征;數(shù)據(jù)訓(xùn)練采用半監(jiān)督學(xué)習(xí)方法,通過不斷更新分類器完成對圖像的分類工作。結(jié)果表明,與5組其他分類算法相比,文中算法提取到了4處不明顯的圖像特征;在500、750和1 000次分類器更新的條件下,當(dāng)近鄰個(gè)數(shù)為7時(shí),文中分類算法的準(zhǔn)確率出現(xiàn)峰值,分別為92.51%、90.65%和90.22%,比5組算法的平均分類準(zhǔn)確率,高出了1.98%、3.08%和4.14%,新的分類算法的分類效果超過預(yù)期。
關(guān)鍵詞:特征提取;半監(jiān)督學(xué)習(xí);圖像;分類算法;近鄰個(gè)數(shù);準(zhǔn)確率
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A ? ? 文章編號:1001-5922(2021)11-0092-06
Image Classification Algorithm Based on Feature Extraction and Semi Supervised Learning
Wu Tao
(The First Affiliated Hospital of Chongqing Medical University, Chongqing 400016, China)
Abstract:The spectral features, high-frequency and low-frequency texture features of the image affect the feature extraction results of the algorithm, existing image classification algorithms work do not in place due to feature extraction and training methods, leading to the classification accuracy is difficult to achieve the expected target, the image classification algorithm based on feature extraction and semi-supervised learning. The algorithm sets filtering, encapsulation, and embedded feature filtering rules to preprocess the raw image feature information, the image-sensitive regions are enhanced, image spectral features are extracted, and image high-frequency and medium-and low-frequency texture features were extracted using the complex-valued function Gabor filter, a semi-supervised learning method was used for the classification of images by constantly updating the classifier. The results show that the algorithm extracted four other image features of other classification algorithms, Under the conditions 500,750, and 1,000 classifier updates, when the number of close neighbors is 7, the accuracy of the text classification algorithm peaks, with 92.51%, 90.65%, and 90.22%, respectively, the average classification accuracy of the 5 sets of algorithms was 1.98%, 3.08% and 3.08% and 4.14%, and the new classification algorithm exceeded the expected classification effect.
Key words:feature extraction; semi-supervised learning; image; classification algorithm; the number of close neighbors; accuracy
0 引言
遙感、測繪技術(shù)和地理信息系統(tǒng)在時(shí)代發(fā)展過程中的不斷更新,生成的圖像也越來越精準(zhǔn)詳細(xì),為土地類別分析、植被覆蓋程度劃分以及地質(zhì)災(zāi)害等監(jiān)測等工作,提供更加先進(jìn)的技術(shù)支持。為了得到較為精準(zhǔn)的分析結(jié)果,師蕓等(2020)研究高光譜影像分類方法[1];王斌等(2019)則提出圖像分類和檢索方法[2]。其中前者強(qiáng)調(diào)了高光譜影像的特點(diǎn)和圖像降維、特征映射等內(nèi)容,后者則結(jié)合實(shí)際物體,將計(jì)算機(jī)視覺融入到圖像分類當(dāng)中。隨著對科技手段的深入研究,楊萌林等(2020)認(rèn)為上述分類方法當(dāng)中,存在數(shù)據(jù)序列稀疏、不連續(xù)和不完整等問題[3];胡軒等(2020)則認(rèn)為圖像的目標(biāo)形狀和尺寸過于復(fù)雜,普通的分類方法無法充分獲得圖像的顯著性空間信息[4]。
針對上述觀點(diǎn),高子翔等(2019)基于雙路卷積神經(jīng)網(wǎng)絡(luò)模型,提出圖像分類算法,通過優(yōu)化池化組合豐富特征差異,加強(qiáng)特征表達(dá)層次從而實(shí)現(xiàn)特征差異互補(bǔ),強(qiáng)化圖像分類效果[5]。張艮山等(2020)利用局部二值模式算子構(gòu)建LBP圖,通過最小二乘支持向量機(jī)構(gòu)建最優(yōu)分類模型,實(shí)現(xiàn)對圖像的分類[6]。王鑫等(2019)搭建一個(gè)具有7層卷積結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),通過訓(xùn)練得到不同的高層特征,第5層池化層輸出后進(jìn)行降維,最終以串聯(lián)的形式融合特征數(shù)據(jù)分類圖像[7]。齊永鋒等(2020)利用等距特征映射處理數(shù)據(jù)并挖掘非線性特征,以標(biāo)記像元為中心構(gòu)建softmax分類器[8]。許開煒等(2019)基于點(diǎn)特征相似性,優(yōu)化卷積神經(jīng)網(wǎng)絡(luò),根據(jù)顯示的鄰域像元對中心像元分類的影響程度,進(jìn)行圖像分類[9]。鑒于此,研究了基于特征提取和半監(jiān)督學(xué)習(xí)的圖像分類算法。
1 基于特征提取和半監(jiān)督學(xué)習(xí)的圖像分類算法
1.1 設(shè)置多重特征篩選規(guī)則
新的圖像分類算法將特征提取與半監(jiān)督學(xué)習(xí)相結(jié)合,設(shè)置過濾式、封裝式以及嵌入式同步處理的特征篩選規(guī)則。過濾式特征篩選規(guī)則,根據(jù)樣本數(shù)據(jù)之間的相關(guān)性,剔除存在冗余的樣本,該規(guī)則定義下的圖像數(shù)據(jù),通過下列計(jì)算公式描述:
式(1)中,I (x,y)表示圖像 I 的橫縱坐標(biāo);g(x,y)表示聯(lián)合概率密度;g(x)、g(y)分別表示不同方向的概率密度函數(shù)。過濾式特征篩選規(guī)則以上述公式為計(jì)算依據(jù),對特征進(jìn)行第1層過濾處理[10]。封裝式特征篩選規(guī)則與第1層規(guī)則相反,通過評估前一層過濾得到的特征數(shù)據(jù)屬性,得到滿足分類要求的數(shù)據(jù)。第2層規(guī)則依靠遞歸特征消除法反復(fù)識別,通過選擇其中最好或剔除最差的數(shù)據(jù),分析每1個(gè)特征參數(shù)。該方法設(shè)置樣本為,其中,xi、yi表示第 i 個(gè)特征數(shù)據(jù)的所在橫、縱坐標(biāo);M表示總數(shù)量。將所有數(shù)據(jù)按照固定順序排列,初始化特征序列并計(jì)算權(quán)重,得到:
式(2)中:λi、λj表示相鄰的第個(gè)、第 j 個(gè)特征數(shù)據(jù)的識別系數(shù)。根據(jù)該值的平方,計(jì)算特征序列W中數(shù)據(jù)的得分,將得分較小的數(shù)據(jù)從W中剔除,更新W和前一層特征篩選結(jié)果[11]。嵌入式特征篩選規(guī)則在第2次特征篩選的基礎(chǔ)上,根據(jù)范數(shù)正則化和最小二乘損失回歸模型,建立目標(biāo)函數(shù):
式(3)中:Aω和B分別表示樣本和標(biāo)簽;γ表示稀疏度調(diào)節(jié)參數(shù)。第3層規(guī)則根據(jù)上述公式獲取目標(biāo),通過多條件特征篩選并存的方式,為特征提取工作進(jìn)行數(shù)據(jù)預(yù)處理,保證半監(jiān)督學(xué)習(xí)使用的數(shù)據(jù)集合種,少有甚至是沒有冗余與干擾數(shù)據(jù)。
1.2 提取圖像特征
利用設(shè)置的規(guī)則篩選特征數(shù)據(jù)后,提取圖像的光譜特征和紋理特征,并構(gòu)建特征集合。已知圖像原始的波段灰度可劃分為4個(gè),分別為藍(lán)、綠、紅和近紅外,分別用L、G、R以及NIR表示。已知圖像背景影響近紅外波段,所以圖像的類別信息覆蓋程度有所差異。近紅外波段衍生歸一化指數(shù),該指數(shù)可以區(qū)分不同屬性特征,具有很強(qiáng)的響應(yīng)能力和敏感的識別能力,設(shè)置該指數(shù)為C1。當(dāng)圖像相似程度較高時(shí),需要利用修正指數(shù)確定同一類屬性特征的所在區(qū)域,所以設(shè)置該指數(shù)為C2。通過上述兩個(gè)指數(shù)增強(qiáng)圖像的敏感區(qū)域,公式為
式(4)中:k1、k2表示不同波段對圖像的影響系數(shù);? 表示調(diào)節(jié)參數(shù)。確定敏感區(qū)域K后,根據(jù)亮度指數(shù)計(jì)算結(jié)果提取K區(qū)域的圖像光譜特征,公式為
根據(jù)式(4)、式(5),實(shí)現(xiàn)對圖像光譜特征的提取。圖像除了具備光譜特征外還具備紋理特征,所以結(jié)合圖像的高頻紋理和中低頻紋理特征,分別利用灰度共生矩陣和復(fù)值函數(shù)Gabor濾波,完成紋理特征提取工作。灰度共生矩陣描述了圖像中灰度空間,所以算法將256灰度級線性壓縮量化成16灰度級,計(jì)算0°、45°、90°以及145°四個(gè)方向的灰度共生矩陣。設(shè)置滑動步長為1、滑動窗口為3×3,通過計(jì)算特征向量平均值,設(shè)置紋理特征向量的分量。此次設(shè)計(jì)將對比度和同質(zhì)度作為圖像的紋理特征,這兩個(gè)參數(shù)的計(jì)算公式為:
式(6)中:E 和 Hom 分別表示對比度和同質(zhì)度;n表示對比對象數(shù)量;P (i, j ) 表示兩兩圖像之間的相似性概率[12]。面對圖像中的高頻紋理特征時(shí),算法按照上述流程提取特征,面對中低頻紋理特征時(shí),算法利用Gabor函數(shù)調(diào)制中心頻率和方向,通過模擬視覺效果得到中低頻特征,該函數(shù)的計(jì)算公式為
式(7)中,u和v表示方向和尺度;Vu,v表示函數(shù)在圖像上的掃描頻率;au表示邊界條件;Fu,v(a,b)表示濾波特征;a和b表示像元位置;σ表示高斯因子標(biāo)準(zhǔn)差[13]。通過上述公式,提取中低頻紋理特征,結(jié)合高頻紋理特征提取結(jié)果,為半監(jiān)督學(xué)習(xí)提供訓(xùn)練數(shù)據(jù)。
1.3 基于半監(jiān)督學(xué)習(xí)更新分類器分類圖像
分類器通過半監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練,從未標(biāo)記樣本中提取有用信息。假設(shè)標(biāo)記與未標(biāo)記的特征樣本集用S1和S2表示,則存在、。設(shè)置樣本類別個(gè)數(shù)為m,半監(jiān)督學(xué)習(xí)在全部樣本集的基礎(chǔ)上構(gòu)建學(xué)習(xí)模型,預(yù)測待分類樣本時(shí),將預(yù)測值分類的錯(cuò)誤率控制在最小。算法利用3個(gè)分類器進(jìn)行協(xié)同訓(xùn)練,其中前兩個(gè)分類器分類預(yù)測未標(biāo)記樣本S2,當(dāng)兩個(gè)分類器的結(jié)果一致且置信度高于預(yù)設(shè)值時(shí),將未標(biāo)記樣本和S1都添加到第3個(gè)分類器的訓(xùn)練集合當(dāng)中,根據(jù)已知參數(shù)建立分類器訓(xùn)練條件:
式(8)中,β表示訓(xùn)練指標(biāo);μ表示最差情況下模型的分類正確率;θ表示分類誤差噪聲比例上限;N表示分類器更新次數(shù);ζ 表示置信度[14]。假設(shè)類別參數(shù),則根據(jù)式(8)得到:
半監(jiān)督學(xué)習(xí)在每次迭代時(shí),前2個(gè)分類器標(biāo)記樣本后,將一致性的樣本添加到第3個(gè)分類器中,假設(shè)第q次和第q-1迭代訓(xùn)練時(shí),G q和G q-1表示被標(biāo)記添加到分類器中的樣本,S1∪G q則對于S1∪Gq和S2∪G q-1來說,第q次訓(xùn)練時(shí)的S1∪G q至今存在:
式(10)中,U q表示;Us1表示分類器噪聲比例;e1q表示前2個(gè)分類器在第q次訓(xùn)練時(shí)的分類誤差比例。已知公式(9)的計(jì)算結(jié)果與μ2之間存在正比例關(guān)系,所以當(dāng)εq>εq-1時(shí),μq<μq-1,此時(shí)可以利用第3個(gè)分類器對未標(biāo)記樣本進(jìn)行學(xué)習(xí)。假設(shè)0≤e1q,eq-1<0.5,那么存在[15]。當(dāng)上述條件成立時(shí),對S1q進(jìn)行采樣,此時(shí)分類器的采樣個(gè)數(shù),通過下列公式確定:
式(11)中,要求S1q-1的絕對值,大于e1q和的比值。使用以上半監(jiān)督學(xué)習(xí)流程更新分類器,通過分類器對圖像進(jìn)行類別劃分,實(shí)現(xiàn)圖像分類算法。
2 應(yīng)用測試
設(shè)計(jì)對比實(shí)驗(yàn),將文中提出的基于特征提取和半監(jiān)督學(xué)習(xí)的分類算法作為實(shí)驗(yàn)組,將基于自適應(yīng)池化的分類算法作為對照組A,將基于LBP與LSSVM的分類算法作為對照組B,將改進(jìn)的基于深度學(xué)習(xí)的分類算法作為對照組C,將基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的算法作為對照組D,將點(diǎn)特征相似與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的分類算法作為對照組E。為了減少實(shí)驗(yàn)次數(shù)控制測試時(shí)間,以高分遙感圖像作為此次實(shí)驗(yàn)測試對象,本文中算法的分類準(zhǔn)確率超過90%時(shí),優(yōu)于所有對比方法,滿足此次研究要求。準(zhǔn)備穩(wěn)定的測試環(huán)境,保證網(wǎng)絡(luò)通信狀態(tài)為最佳,分別將6組算法應(yīng)用到高分遙感圖像的分類工作當(dāng)中,比較算法在不同環(huán)節(jié)當(dāng)中的應(yīng)用效果。
2.1 高分遙感圖像特征提取效果
高分遙感圖像紋理更多更復(fù)雜,選擇高分遙感圖像作為測試對象,增加測試難度的同時(shí)能夠代表大多數(shù)圖像,增強(qiáng)實(shí)驗(yàn)結(jié)果的說服力度。圖1為算法分類測試過程中的某一分類目標(biāo)。
圖1中的深色區(qū)域代表建筑物所在位置,淺色區(qū)域代表綠色植被覆蓋區(qū)域的所在位置。分別利用不同的算法提取圖像特征,其中基于自適應(yīng)池化的分類算法,利用構(gòu)建的雙路卷積神經(jīng)網(wǎng)絡(luò)模型,提取高分遙感圖像特征;基于LBP與LSSVM的分類算法,在基于局部二值模式算子生成的LBP圖中,提取特征數(shù)據(jù);改進(jìn)的基于深度學(xué)習(xí)的分類算法,利用七層卷積神經(jīng)網(wǎng)絡(luò)獲取圖像特征;基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的算法,依靠等距映射挖掘非線性特性數(shù)據(jù),從而實(shí)現(xiàn)對目標(biāo)數(shù)據(jù)的提取;點(diǎn)特征相似與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的分類算法,計(jì)算點(diǎn)特征相似性從而提取相似性數(shù)據(jù)。文中分類算法按照篩選規(guī)則預(yù)處理圖像數(shù)據(jù),然后利用式(4)~(7)的計(jì)算,提取高分遙感圖像特征。圖2為6組算法應(yīng)用下,分別按照各自的特征提取流程獲得的提取結(jié)果。
從圖2可以看出,5個(gè)對照組算法和本算法獲得的特征提取結(jié)果,與圖1所顯示的特征區(qū)域高度近似,但由于本文算法利用過濾式、封裝式以及嵌入式篩選規(guī)則,預(yù)先處理了圖像特征信息,所以獲得了4處極不明顯的特征區(qū)域。同樣的測試條件下,5個(gè)對照組算法中,只有對照C組、D組以及對照E組中,提取到了不明顯的圖像特征,但只有對照E組的提取結(jié)果,與本文算法的提取結(jié)果類似。
2.2 分類效果
根據(jù)6組算法的高分遙感圖像特征提取結(jié)果,繼續(xù)完成圖像分類工作,最終得到6組圖像分類結(jié)果。實(shí)驗(yàn)通過比較預(yù)測標(biāo)簽和真實(shí)標(biāo)簽,評價(jià)算法對高分遙感圖像的實(shí)際分類效果。設(shè)置3組指標(biāo),分別為敏感性指標(biāo)(Sensitivity)、特異性指標(biāo)(Specificity)和準(zhǔn)確性指標(biāo)(Accuracy),3個(gè)指標(biāo)的計(jì)算公式為:
式(12)中:f1、f2分別表示真建筑區(qū)域和真植被覆蓋區(qū)域;g1、g2分別表示假建筑區(qū)域和假植被覆蓋區(qū)域。此次測試以多分類為研究重點(diǎn),所以再引入識別率指標(biāo)(Recognition)和準(zhǔn)確率指標(biāo)(Overall Recognition Accuracy)進(jìn)行評價(jià),計(jì)算公式為:
式(13)中,Mij表示第i個(gè)特征被劃分到第j類集合中的數(shù)量;T表示類別總數(shù)。6組算法在圖2顯示的結(jié)果的基礎(chǔ)上進(jìn)行圖像分類,根據(jù)式(12)和式(13),獲得當(dāng)分類器的更新次數(shù)為500時(shí),不同算法的分類評價(jià)結(jié)果,如表1所示。
由表1可知,本算法的評價(jià)結(jié)果均高于5個(gè)對照組算法。已知影響算法分類結(jié)果的關(guān)鍵因素之一,就是特征數(shù)據(jù)的近鄰個(gè)數(shù),所以導(dǎo)出不同種算法,分類器進(jìn)行500、750和1 000次更新時(shí)的分類結(jié)果,如圖3所示。
由圖3可知,當(dāng)近鄰個(gè)數(shù)為7時(shí),6組分類器在500、750以及1 000次更新狀態(tài)下,獲得的圖像分類準(zhǔn)確率最高;當(dāng)近鄰個(gè)數(shù)為9時(shí),6組算法的分類準(zhǔn)確率最低。根據(jù)上述測試結(jié)果可知,無論分類器的更新狀態(tài)如何,算法在滿足7個(gè)近鄰的條件下,能夠獲得更好的圖像分類結(jié)果。綜合上述測試結(jié)果,6組算法在近鄰個(gè)數(shù)為7時(shí),能夠獲得最好的圖像分類效果,此時(shí)本文算法的分類準(zhǔn)確率分別為90.51%、91.45%和92.86%,比5個(gè)對照組的平均分類準(zhǔn)確率。分別高出1.98%、3.08%和4.14%,滿足90%以上的預(yù)設(shè)目標(biāo)。
3 結(jié)語
本文研究以現(xiàn)有的5種常規(guī)圖像分類算法為對比,通過設(shè)置特征篩選規(guī)則,完善數(shù)據(jù)的預(yù)處理工作,采用半監(jiān)督學(xué)習(xí)方法得到滿意的測試結(jié)果,將使分類準(zhǔn)確率達(dá)到90%以上。但綜合此次研究過程來看,研究的新分類算法存在較多復(fù)雜的計(jì)算步驟,所以運(yùn)行算法時(shí)容易出現(xiàn)數(shù)據(jù)遲緩、更新延遲等問題,今后可以對該算法進(jìn)行優(yōu)化,進(jìn)一步完善機(jī)器學(xué)習(xí)的監(jiān)督工作,完善分類器的數(shù)據(jù)訓(xùn)練與映射工作,進(jìn)一步提高算法的分類效果。
參考文獻(xiàn)
[1]師 蕓,馬東暉,呂 杰,等. 基于流形光譜降維和深度學(xué)習(xí)的高光譜影像分類[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(06):151-160+323.
[2]王 斌,黃竹芹,陳良宵. 圓周特征描述:有效的葉片圖像分類和檢索方法[J]. 軟件學(xué)報(bào),2019,30(04):1 148-1 163.
[3]楊萌林,張文生. 分類激活圖增強(qiáng)的圖像分類算法[J]. 計(jì)算機(jī)科學(xué)與探索,2020,14(01):149-158.
[4]胡 軒,盧其楷. 基于顯著性剖面的高光譜圖像分類算法[J]. 光學(xué)學(xué)報(bào),2020,40(16):71-79.
[5]高子翔,張寶華,呂曉琪, 等.基于自適應(yīng)池化的雙路卷積神經(jīng)網(wǎng)絡(luò)圖像分類算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2019,40(05):1 334-1 338.
[6]張艮山,田建恩,張 哲. 基于LBP與LSSVM的數(shù)字圖像分類算法[J]. 液晶與顯示,2020,35(05):471-476.
[7]王 鑫,李 可,徐明君,等. 改進(jìn)的基于深度學(xué)習(xí)的遙感圖像分類算法[J]. 計(jì)算機(jī)應(yīng)用,2019,39(02):382-387.
[8]齊永鋒,陳 靜,火元蓮,等. 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的高光譜圖像分類算法[J]. 紅外技術(shù),2020,42(09):855-862.
[9]許開煒,楊學(xué)志,艾加秋,等. 點(diǎn)特征相似與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的SAR圖像分類算法研究[J]. 地理與地理信息科學(xué),2019,35(03):28-36.
[10]何勝美,李高榮,許王莉. 基于秩能量距離的超高維特征篩選研究[J]. 統(tǒng)計(jì)研究,2020,37(08):117-128.
[11]楊弘凡,李 航,陳凱陽,等. 亮度變化下室外場景圖像特征點(diǎn)提取方法[J]. 河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,41(01):18-23+5.
[12]趙若晴,王慧琴,王 可,等. 基于方向梯度直方圖和灰度共生矩陣混合特征的金文圖像識別[J]. 激光與光電子學(xué)進(jìn)展,2020, 57(12):98-104.
[13]楊恢先,付 宇,曾金芳,等. 基于正交Log-Gabor濾波二值模式的人臉識別算法[J]. 智能系統(tǒng)學(xué)報(bào),2019,14(02):330-337.
[14]劉 坤,王 典,榮夢學(xué). 基于半監(jiān)督生成對抗網(wǎng)絡(luò)X光圖像分類算法[J]. 光學(xué)學(xué)報(bào),2019,39(08):117-125.
[15]魏志強(qiáng),畢海霞,劉 霞. 基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖上半監(jiān)督極化SAR圖像分類算法[J]. 電子學(xué)報(bào),2020,48(01):66-74.