国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種SVM集成的圖像分類方法研究

2012-06-29 01:37:08羅會(huì)蘭杜連平
電視技術(shù) 2012年23期
關(guān)鍵詞:分類器單詞詞匯

羅會(huì)蘭,杜連平

(江西理工大學(xué)信息工程學(xué)院,江西 贛州 341000)

責(zé)任編輯:哈宏疆

隨著現(xiàn)代信息技術(shù)的發(fā)展,圖像已經(jīng)成為了一種重要的信息載體。信息量日益增大的同時(shí),也帶來(lái)了海量的圖像數(shù)據(jù),這就對(duì)如何快速而有效地進(jìn)行圖像數(shù)據(jù)分類提出了新的挑戰(zhàn)。然而,由于位置、尺度、光照及背景噪聲等的影響,也在一定程度上加大了圖像分類的難度?,F(xiàn)存的基于形狀的模型化模型[1-2]試圖定位不同的物體局部并確定它們?cè)诳臻g上的關(guān)系。盡管這些方法可能表示能力強(qiáng),但是這種空間約束模型無(wú)法處理或識(shí)別較大的變形,比如大的但不在一個(gè)平面內(nèi)的旋轉(zhuǎn)和遮擋等。近年來(lái),一些用于圖像分類的主流方法是使用獨(dú)立塊的集合來(lái)表示圖像,這些獨(dú)立塊由局部視覺描述子來(lái)描述[3-5]。其中較為典型的是詞袋(Bag-of-Words,BOW)模型,它來(lái)源于文本分類中的“texton”模型[6],確定每類中特定的語(yǔ)素(texton)比例,而忽略它們之間的空間關(guān)系。盡管BOW模型沒(méi)有顯示形狀模型化,學(xué)習(xí)到的模型對(duì)于形狀不規(guī)則的物體或者高度結(jié)構(gòu)化的物體類都是非常有效的[7]。在文獻(xiàn)[8]中,首次將這種文本檢索模型應(yīng)用到視覺檢索中,證實(shí)了這種模型的有效性。在檢測(cè)到獨(dú)立顯著性區(qū)域塊(或稱為興趣點(diǎn))且為這些區(qū)域塊計(jì)算描述子(也就是特征表示)之后,必須為訓(xùn)練和測(cè)試圖像表示它們的分布。一種較為流行的表示顯著性區(qū)域塊分布的方法,也稱為圖像量化方法[9],是通過(guò)對(duì)特定訓(xùn)練圖像集的描述子進(jìn)行聚類得到一個(gè)視覺詞匯本。然后圖像表示成視覺單詞標(biāo)簽的直方圖。在這種情形下,文檔就是圖像,它們根據(jù)視覺詞匯本來(lái)量化,然后用傳統(tǒng)分類器來(lái)分類。

基于此,本文提出了一種支持向量機(jī)(Support Vector Machine,SVM)集成的圖像分類方法。在BOW模型描述圖像的基礎(chǔ)上,首先,分析視覺單詞數(shù)目對(duì)于分類性能的影響,從而獲得最佳分類性能時(shí)的視覺單詞數(shù)目;其次,考慮訓(xùn)練多少個(gè)不同SVM分類器,使得集成分類結(jié)果后能到達(dá)最好的分類性能。實(shí)驗(yàn)結(jié)果表明SVM集成的圖像分類方法有效提高了分類精度,具有一定的穩(wěn)健性。

1 SVM集成的圖像分類方法

本文研究將集成學(xué)習(xí)的優(yōu)勢(shì)應(yīng)用到圖像分類中。圖1是提出的SVM集成的圖像分類方法的流程圖。分類過(guò)程包括兩個(gè)階段:訓(xùn)練階段和測(cè)試階段。在訓(xùn)練階段,可以得到圖像不同的SIFT特征、不同的視覺詞匯本、不同的BOW模型。利用這些不同的BOW模型可以訓(xùn)練得到不同的SVM分類器;在測(cè)試階段,利用訓(xùn)練得到的不同的SVM分類器分別對(duì)測(cè)試圖像進(jìn)行分類,進(jìn)而得到不同的分類結(jié)果,然后將這些分類結(jié)果進(jìn)行集成作為最終的分類結(jié)果。

圖1 SVM集成的圖像分類流程圖

1.1 相關(guān)知識(shí)

Bag-of-Words在自然語(yǔ)言理解中是用來(lái)表示文檔的流行方法,這種方法忽略單詞的順序,比如,“a good book”和“book good a”在模型中是一樣的。Bag-of-Words模型把每個(gè)文檔看成是一個(gè)“bag”,所以順序是不考慮的,“bag”中包含了來(lái)自于一個(gè)特定字典的詞匯。計(jì)算機(jī)視覺研究領(lǐng)域使用同樣的思想來(lái)表示圖像,這里圖像被當(dāng)成文檔,從圖像中提取的特征相當(dāng)于單詞。

Lowe[10]提出了一種尺度不變特征轉(zhuǎn)換描述子SIFT(Scale Invariant Feature Transform),它結(jié)合了一個(gè)尺度不變區(qū)域檢測(cè)子和一個(gè)基于檢測(cè)出的區(qū)域上的梯度分布的描述子。描述子表示成梯度和方向的三維直方圖。在每個(gè)位置和方向組合中統(tǒng)計(jì)梯度大小。這種梯度位置和方向的量化使得SIFT描述子對(duì)于小的幾何變形和小的錯(cuò)誤更加穩(wěn)健。

BOW模型的最后一步是將興趣點(diǎn)對(duì)應(yīng)的描述子矢量轉(zhuǎn)換成視覺單詞(類似于文本文檔中的單詞),這些視覺單詞組成一個(gè)詞匯本(類似于單詞字典)。具體做法是采用K-means聚類算法對(duì)提取圖像的SIFT特征進(jìn)行聚類,每一個(gè)聚類中心看作是圖像的一個(gè)視覺單詞,就能把每一個(gè)從圖像中提取的特征映射到與它最接近的圖像視覺詞匯本上,并且能把圖像表示為一個(gè)視覺詞匯本上的直方圖特征。一個(gè)視覺單詞可以認(rèn)為是一些相似興趣點(diǎn)的代表。一個(gè)簡(jiǎn)單的方法是在所有的矢量上運(yùn)行聚類算法,然后視覺單詞定義成學(xué)習(xí)得到的簇的中心。簇的個(gè)數(shù)就是詞匯本的大小。在生成的視覺詞匯本的基礎(chǔ)之上,將每幅圖像中的SIFT特征與視覺詞匯本中的視覺單詞進(jìn)行比較。對(duì)于每幅圖像,分別統(tǒng)計(jì)視覺單詞出現(xiàn)的頻率,從而構(gòu)建每個(gè)圖像的BOW描述的直方圖特征。

圖2 圖像量化及分類器訓(xùn)練

圖像分類的目標(biāo)是根據(jù)它們包含的物體類別來(lái)分類。方法大致遵循傳統(tǒng)視覺詞匯本方法:先從圖像中選擇興趣點(diǎn),然后用局部視覺描述子特征化興趣點(diǎn),最后用學(xué)習(xí)得到的視覺詞匯本對(duì)這些描述后的興趣點(diǎn)置標(biāo)簽。和文本分類相似,通過(guò)計(jì)算每個(gè)標(biāo)簽出現(xiàn)的頻率建立一個(gè)直方圖,此直方圖用來(lái)描述圖像內(nèi)容。直方圖送入分類器來(lái)估計(jì)圖像的類標(biāo)簽。視覺詞匯本一般是由訓(xùn)練數(shù)據(jù)的描述子聚類得到。一個(gè)有n個(gè)興趣點(diǎn),它們的描述子分別是{r1,r2,…,rn}的圖像,對(duì)于一個(gè)有L個(gè)單詞的詞匯本模型V={w1,w2,…,wL} ,傳統(tǒng)的詞匯量化此圖像得到矢量x=[x1,x2,…,xL]T,其中

量化后的圖像矢量輸入到分類器訓(xùn)練、測(cè)試,如圖2和圖3所示。這里討論的圖像分類任務(wù)是給每個(gè)圖像一個(gè)類標(biāo)簽。

圖3 測(cè)試圖像量化及分類

1.2 分類器集成

分類器集成后能否比單個(gè)成員分類器性能更好,取決于各個(gè)成員分類器間的差異性。為了更好地理解這一點(diǎn),假設(shè)有3個(gè)分類器f1,f2,和f3。有一個(gè)測(cè)試圖像I分別輸入到這3個(gè)分類器中,如果這3個(gè)分類器是相同的,則當(dāng)f1分類錯(cuò)誤時(shí),f2和f3也會(huì)給出錯(cuò)誤的答案。然而,當(dāng)這些分類器是獨(dú)立的,沒(méi)有相互關(guān)系時(shí),則當(dāng)f1給出錯(cuò)誤的答案時(shí),f2和f3也許是正確的,所以在這種情況下,使用多數(shù)投票集成方法集成它們就能產(chǎn)生正確的結(jié)果,如圖4所示。所以集體中成員間的差異性是公認(rèn)的決定集成泛化能力的一個(gè)關(guān)鍵因素。結(jié)合多個(gè)從不同方面給出的結(jié)果的集成方法,是現(xiàn)存的最強(qiáng)的機(jī)器學(xué)習(xí)算法之一。本文的思想就是將集成方法的優(yōu)勢(shì)應(yīng)用到圖像分類中。

圖4 雖然有錯(cuò)誤的分類結(jié)果,但是集成分類器的分類結(jié)果可以得到正確的分類結(jié)果

1.3 SVM集成分類方法步驟

Step1利用尺度無(wú)關(guān)特征轉(zhuǎn)換(SIFT)提取圖像特征;

Step2對(duì)SIFT特征進(jìn)行K-means聚類形成視覺詞匯本;

Step3將所有圖像的SIFT特征與詞匯本進(jìn)行比較,統(tǒng)計(jì)視覺單詞出現(xiàn)的頻率,從而構(gòu)建圖像的BOW模型描述;

Step4利用圖像的BOW模型描述訓(xùn)練SVM分類器;

Step5利用Step4得到的SVM分類器對(duì)測(cè)試圖像進(jìn)行分類,得到相應(yīng)的分類結(jié)果;

Step6重復(fù)Step1~Step5 N次,可以得到對(duì)測(cè)試圖像的N個(gè)不同的分類結(jié)果;

Step7將Step6中得到的N個(gè)不同分類結(jié)果進(jìn)行集成,并將集成結(jié)果作為最終分類結(jié)果,集成算法采用基于簇相似劃分算法(CSPA)。

2 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果分析

為了證實(shí)本文方法的有效性,選取以下6類圖像進(jìn)行MATLAB仿真實(shí)驗(yàn)。該圖像數(shù)據(jù)集主要來(lái)自Caltech datasets,包括 Airplane,Background,Bike,Car,F(xiàn)ace,Motorbike。每一類圖像由200~1000幅圖像組成。綜合考慮實(shí)現(xiàn)的效率,每幅圖像能提取的最大興趣點(diǎn)數(shù)為100,K-means最大迭代次數(shù)為50。

首先,分析視覺單詞數(shù)目對(duì)于分類性能的影響。這里采用8 種不同大小的視覺單詞 50,100,200,300,500,600,800,1000,它們分類性能(正確分類圖像所占的百分比)的比較情況如圖5所示。從圖5不難看出,當(dāng)視覺單詞數(shù)目過(guò)小時(shí),容易忽略圖像的某些重要的視覺特征,導(dǎo)致分類性能相對(duì)較低;但是當(dāng)視覺單詞數(shù)目大于一定值之后,視覺單詞的數(shù)目繼續(xù)增加,提升圖像分類的性能不是很明顯,而且產(chǎn)生的視覺單詞數(shù)目越多,形成詞匯本時(shí)所花費(fèi)的實(shí)驗(yàn)時(shí)間也就越長(zhǎng),如圖6所示。綜合考慮分類性能和時(shí)間復(fù)雜度,在后續(xù)實(shí)驗(yàn)中選擇分類性能相對(duì)較高的視覺單詞數(shù)目600。

其次,考慮到將不同的SVM分類器分類結(jié)果集成后得到的最終分類結(jié)果不同。在不同的BOW模型的基礎(chǔ)上訓(xùn)練并構(gòu)建數(shù)目 N 分別為5,10,15,20,25,30 個(gè)不同的SVM分類器,并分別對(duì)它們的分類結(jié)果進(jìn)行集成。經(jīng)過(guò)多次試驗(yàn)總結(jié)了不同數(shù)目的不同SVM分類器的分類結(jié)果集成后對(duì)分類性能的影響見圖7所示。從圖7中數(shù)據(jù)可以看出當(dāng)不同分類器數(shù)目N為10時(shí),集成后的分類性能已經(jīng)相對(duì)較好,雖然隨著分類器數(shù)目的增多,集成分類性能提升的不是很明顯,而且需要花費(fèi)更多的實(shí)驗(yàn)時(shí)間。兼顧分類性能和時(shí)間復(fù)雜度的要求,本實(shí)驗(yàn)中對(duì)Step1~Step5重復(fù)10次,訓(xùn)練產(chǎn)生10個(gè)不同的SVM分類器并對(duì)測(cè)試圖像的分類結(jié)果進(jìn)行集成,完成分類實(shí)驗(yàn)。

最后,分別用本文提出的方法(即SVM集成分類結(jié)果的方法)、文獻(xiàn)[11]和文獻(xiàn)[12]所提出的方法進(jìn)行分類實(shí)驗(yàn)。其中,文獻(xiàn)[11]和文獻(xiàn)[12]是沒(méi)有采用集成學(xué)習(xí)技術(shù)對(duì)SVM的分類結(jié)果進(jìn)行集成的。分別比較文獻(xiàn)[11]、文獻(xiàn)[12]使用方法的分類精度和本文方法的分類精度,見表1。從表1實(shí)驗(yàn)數(shù)據(jù)可以看出,采用本文的分類方法明顯提高了分類精度。

表1 本文方法與其他方法分類精度的比較

3 結(jié)束語(yǔ)

本文從BOW模型理論和實(shí)驗(yàn)的基礎(chǔ)上針對(duì)SVM集成的圖像分類方法進(jìn)行了研究。實(shí)驗(yàn)結(jié)果表明采用集成學(xué)習(xí)技術(shù)的SVM集成的圖像分類方法能很好地實(shí)現(xiàn)圖像的分類,提高了分類精度,具有一定的穩(wěn)健性。當(dāng)然,本文研究的方法也存在著一些不足,需要繼續(xù)完善和探索。如何在訓(xùn)練集上訓(xùn)練KNN、SVM等多種分類器,然后對(duì)它們的分類結(jié)果進(jìn)行集成,以提高對(duì)圖像分類的精度是下一步要研究的內(nèi)容。

[1]FERGUS R.Object class recognition by unsupervised scale-invariant learning[C]//Proc.IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2003.[S.l.]:IEEE Press,2003:264-271.

[2]LI Feifei.A bayesian approach to unsupervised one-shot learning of object categories[C]//Proc.the Ninth IEEE International Conference on Computer Vision:Volume 2.[S.l.]:IEEE Press,2004:1134-1141.

[3]何友松,吳煒,陳默,等.基于Bag of Features算法的車輛圖像識(shí)別研究[J]. 電視技術(shù),2009,33(12):104-107.

[4]AGARWAL A,TRIGGS B.Hyperfeatures-multilevel local coding for visual recognition[C]//Proc.IEEE ECCV,2006. [S.l.]:IEEE Press,2006:30-43.

[5]YUEN P C,MAN C H.Human face image searching system using sketches[J].IEEE Trans.Systems,Man and Cybernetics:Part A,2007,37(4):493-504.

[6]VARMA M,ZISSERMAN A.A statistical approach to texture classification from single images[EB/OL].[2012-04-10].http://www.robots.ox.ac.uk/~vgg/research/texclass/papers/varma05.pdf.

[7]WINN J,CRIMINISI A,MINKA T.Object categorization by learned universal visual dictionary[C]//Proc.the 10th IEEE International Conference on Computer Vision:Volume 2.[S.l.]:IEEE Press,2005:1800-1807.

[8]ZHANG J.Local features and kernels for classification of texture and object categories:a comprehensive study[C]//Proc.2006 IEEE CVPR.[S.l.]:IEEE Press,2006:17-22.

[9]MAREE R.Random subwindows for robust image classification[C]//Proc.2005 IEEE CVPR.[S.l.]:IEEE Press,2005:34-40.

[10]LOWE D G.Distinctive image features from scale-invariant keypoints[C]//Proc.2004 IEEE IJCV.[S.l.]:IEEE Press,2004:91-110.

[11]劉碩研,須德,馮松鶴,等.一種基于上下文語(yǔ)義信息的圖像塊視覺單詞生成算法[J].電子學(xué)報(bào),2010,38(5):1156-1161.

[12]陳凱,肖國(guó)強(qiáng),潘珍,等.單尺度詞袋模型圖像分類方法[J].計(jì)算機(jī)應(yīng)用研究,2011,28(10):3986-3988.

猜你喜歡
分類器單詞詞匯
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
單詞連一連
本刊可直接用縮寫的常用詞匯
看圖填單詞
BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
看完這些單詞的翻譯,整個(gè)人都不好了
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
洮南市| 广州市| 安新县| 龙海市| 亳州市| 柘荣县| 桐庐县| 马关县| 高要市| 宝清县| 乌恰县| 江门市| 抚宁县| 平阴县| 桃园县| 临邑县| 敦煌市| 文安县| 盱眙县| 龙陵县| 禄劝| 漾濞| SHOW| 新巴尔虎右旗| 高雄县| 龙陵县| 南雄市| 南汇区| 讷河市| 疏附县| 安岳县| 安平县| 贵港市| 涿州市| 安西县| 万盛区| 青田县| 东源县| 自贡市| 宁强县| 托克逊县|