姜文澤
摘要:計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域中的一個(gè)重要分支,更是人工智能的基礎(chǔ)。人工智能領(lǐng)域中的信息多種多樣,其中圖片信息即視覺(jué)信息比其他信息如觸覺(jué)、聽(tīng)覺(jué)信息要重要得多。該文將簡(jiǎn)要概述計(jì)算機(jī)視覺(jué)領(lǐng)域中圖像操作所要進(jìn)行的第一步——圖像特征提取時(shí)的圖像特征以及提取過(guò)程中所用到的方法。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);圖像特征;特征提取方法
中圖分類(lèi)號(hào):TP3? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)16-0185-02
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1? 提取方法
1.1? 直方圖
直方圖(Histogram)作為一個(gè)統(tǒng)計(jì)手段,具有一定的統(tǒng)計(jì)作用,同時(shí)其不僅可以表示一般數(shù)據(jù)的分布,也可以對(duì)圖像的數(shù)據(jù)或特征進(jìn)行統(tǒng)計(jì),生成圖像特征分布的直方圖,譬如灰度、顏色、梯度(邊緣)、形狀、紋理、局部特征點(diǎn)等。
直方圖本質(zhì)上是對(duì)圖像的原始特征或數(shù)據(jù)進(jìn)行降維,通過(guò)對(duì)其特征進(jìn)行處理、對(duì)其數(shù)據(jù)分布進(jìn)行建模,使數(shù)據(jù)具有一定的總結(jié)性,同時(shí)可以有效節(jié)省存儲(chǔ)空間、簡(jiǎn)化運(yùn)算量,更易于查看和分析,為進(jìn)一步圖像處理或分析做準(zhǔn)備。
1.2? 聚類(lèi)
聚類(lèi)(Clustering)是一種可以取代直方圖的特征提取方法,該方法可以通過(guò)基于數(shù)據(jù)的無(wú)監(jiān)督訓(xùn)練得到更穩(wěn)定的值。其目標(biāo)是找到混合樣本集中存在的內(nèi)在的群組關(guān)系,即對(duì)對(duì)象集合分割分塊或分組為不同的子集或類(lèi),使得類(lèi)內(nèi)關(guān)聯(lián)性高,類(lèi)間關(guān)聯(lián)性差。
常用的聚類(lèi)方法有K-means聚類(lèi)、均值漂移聚類(lèi)、基于密度的聚類(lèi)(DBSCAN)、基于高斯混合模型的最大期望聚類(lèi)(EM)、凝聚層次聚類(lèi)和圖團(tuán)體檢測(cè)等方法。
2? 圖像特征
2.1? 顏色特征
顏色特征是圖像特征中的一種全局特征,它直觀地描述了圖像中物體的表面性質(zhì)。但顏色對(duì)圖像區(qū)域的方向、大小等變化不敏感,故顏色特征不能很好表述圖像中的局部特征。
顏色特征主要的提取方法有量化顏色直方圖和聚類(lèi)顏色直方圖,兩種方法的適用顏色空間不同,前者適用于RGB和HSV等均勻顏色空間,后者適用于Lab等非均勻空間。
量化顏色直方圖的操作簡(jiǎn)單,計(jì)算高效,但存在量化問(wèn)題,如果顏色相對(duì)單調(diào)還容易產(chǎn)生分布稀疏的問(wèn)題。
對(duì)于Lab等非均勻空間,使用K-means聚類(lèi)算法對(duì)所有像素點(diǎn)的顏色向量進(jìn)行聚類(lèi),直方圖的區(qū)間單元由聚類(lèi)中心代表。
2.2? 幾何特征
常見(jiàn)的幾何特征有邊緣(Edge)、角點(diǎn)(Corner)以及斑點(diǎn)(Blob)。
邊緣是指梯度、亮度、顏色交界處以及面與面相交、線與線相交等像素有明顯變化的區(qū)域,即圖像中某一特性在某一方向上分布的不連續(xù)處。對(duì)于復(fù)雜圖片,可以先將彩色圖像轉(zhuǎn)化為灰度圖像,再對(duì)其某一方向的灰度值函數(shù)求一階導(dǎo)數(shù),得到的一階導(dǎo)數(shù)的高于某個(gè)閾值的極值區(qū)域即邊緣區(qū)域。該閾值也是一個(gè)超參數(shù),若閾值設(shè)置過(guò)低,邊緣提取不精確,導(dǎo)致得到的邊緣區(qū)域信息量過(guò)大,進(jìn)而可能會(huì)導(dǎo)致計(jì)算量過(guò)大;若閾值設(shè)置過(guò)高,提取到的邊緣區(qū)域過(guò)少,則會(huì)導(dǎo)致信息質(zhì)量較低。邊緣提取時(shí)一階導(dǎo)數(shù)對(duì)噪聲極為敏感,故應(yīng)先進(jìn)行高斯去噪,再使用一階導(dǎo)數(shù)獲取極值。
角點(diǎn)是一種顯著點(diǎn),即在某方面屬性特別突出的點(diǎn)。在本文中,角點(diǎn)區(qū)域被定義為在任何方向上移動(dòng)某個(gè)框形區(qū)域(小觀察窗),導(dǎo)致大的像素變動(dòng)的區(qū)域,可以簡(jiǎn)單表示為以下數(shù)學(xué)模型:
對(duì)計(jì)算得到的角點(diǎn)響應(yīng)值[E(u,v)]進(jìn)行閾值化得到局部最大點(diǎn)。Harris角點(diǎn)響應(yīng)值相對(duì)于邊緣提取是更高一層的特征值,它不受光照、平移、旋轉(zhuǎn)這些尺度的影響。
斑點(diǎn)(Blob)可以理解為圓斑,通??梢岳美绽固荻惹髽O值來(lái)計(jì)算斑點(diǎn)。同樣的,斑點(diǎn)對(duì)噪聲極其敏感,需要先做高斯去噪再進(jìn)行進(jìn)一步計(jì)算。先進(jìn)行高斯濾波再進(jìn)行拉普拉斯濾波相當(dāng)于直接對(duì)其進(jìn)行二階高斯導(dǎo)數(shù)(LoG)濾波。公式表示為:
公式左側(cè)為先進(jìn)行高斯濾波,再進(jìn)行拉普拉斯濾波;公式右側(cè)為二階高斯導(dǎo)數(shù)濾波。
2.3? 紋理特征
紋理特征作為一種全局性的特征,具有可以反映物體表面的特性。紋理特征與角點(diǎn)類(lèi)似,具有旋轉(zhuǎn)不變性;但又區(qū)別于角點(diǎn),具有良好的抗噪性能,同時(shí)有可能會(huì)受到光照或反射的影響。紋理特征的常用提取方法有方向梯度直方圖(HOG)、局部二值模式(LBP)和Gabor濾波器組。
基于局部方格單元的方向梯度直方圖通常適用于圖像中的人體檢測(cè),圖像中的幾何和光學(xué)的變化不會(huì)影響圖像提取的結(jié)果。該方法的優(yōu)點(diǎn)是簡(jiǎn)單高效且不需要做高斯模糊。
局部二值模式一般應(yīng)用于人臉特征的分析。它所計(jì)算出的二進(jìn)制模型簡(jiǎn)單直觀。只需將圖像中每個(gè)像素點(diǎn)與周?chē)南袼攸c(diǎn)進(jìn)行比較閾值化即可得到LBP編碼。
以某個(gè)像素點(diǎn)為中心,畫(huà)出半徑為r的圓,在圓周上均勻采樣p個(gè)點(diǎn),與中心像素點(diǎn)進(jìn)行比較,將數(shù)值大小量化為0或1,當(dāng)小于中心像素點(diǎn)時(shí)量化為0,反之量化為1,將得到的多位bit按照順(逆)時(shí)針組成一個(gè)數(shù),該數(shù)即中心像素點(diǎn)的LBP編碼,同時(shí)該數(shù)值可以作為直方圖的一個(gè)bin,遍歷操作所有像素點(diǎn),每有一個(gè)相同的bin,該區(qū)間上的數(shù)值增加1,最終可以得到一個(gè)描述圖像紋理特征的直方圖。如圖2-9所示,以中心像素點(diǎn)為圓心,繪制了一個(gè)半徑為2的圓,均勻采樣8個(gè)點(diǎn),通過(guò)比較具體數(shù)值可以量化為圖2-10,從中心像素點(diǎn)正上方的像素點(diǎn)按照順時(shí)針進(jìn)行編碼,得到二進(jìn)制編碼00001101,即為其中心像素點(diǎn)的8bits的LBP編碼。
Gabor濾波器組在二維空間中本質(zhì)上是高斯核函數(shù)和正弦平面波的乘積,因此其具有高斯核的特性。與人類(lèi)的視覺(jué)系統(tǒng)類(lèi)似,可以用多個(gè)濾波器捕捉多尺度多方向多頻率的信息。
3? 總結(jié)
計(jì)算機(jī)視覺(jué)作為人工智能的基礎(chǔ),特征提取更是當(dāng)中的一個(gè)重要概念,即將圖像中具有不同特征的像素點(diǎn)劃分為不同的子集,使每個(gè)子集都具有不同的特性。隨著時(shí)代的發(fā)展和提取方法的改進(jìn)與優(yōu)化,提取到的圖像特征也越發(fā)精細(xì)準(zhǔn)確,為圖像處理的后續(xù)操作提供了更多的可能性。
參考文獻(xiàn):
[1] 張錫英,車(chē)鑫.圖像顏色特征提取及其分類(lèi)研究[J].安徽農(nóng)業(yè)科學(xué),2014,42(07):2196-2198.
[2] 李?yuàn)檴?彩色圖像邊緣檢測(cè)相關(guān)算法研究[D].西北大學(xué),2018.
【通聯(lián)編輯:代影】