国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于BoW模型的圖像分類方法研究

2017-04-26 09:09:00賀偉姚婭川彭彩平

科技創(chuàng)新與應(yīng)用 2017年10期

關(guān)鍵詞：特征提取

賀偉+姚婭川++彭彩平

摘要：圖像分類是圖像檢索的基礎(chǔ)，成功的圖像檢索是從海量的數(shù)字圖像中提取有效信息的必要手段。針對當(dāng)前圖像分類領(lǐng)域存在的效率低下的問題，提出了一種基于BoW模型的圖像分類方法。在BoW模型中，采用加權(quán)的K均值聚類方法完成特征與視覺單詞之間的映射；然后對聚類產(chǎn)生的視覺單詞進(jìn)行閾值驗(yàn)證，去除冗余的詞匯，生成最終的視覺詞典。

關(guān)鍵詞：BoW模型；圖片分類；特征提?。籏均值聚類

引言

對人類而言，眼睛在捕獲外界傳來的視覺信息之后，會將這些信息移交給大腦進(jìn)行處理，大腦在對眼睛看到的圖片中進(jìn)行解讀之后，將會在短期記憶里描述圖片里有些什么內(nèi)容。大腦在記憶圖片里的內(nèi)容時，實(shí)際上也是將視覺信息轉(zhuǎn)存為它所采用的獨(dú)特表示方式。相應(yīng)的，在計算機(jī)視覺領(lǐng)域，人眼的功能由攝相機(jī)等成像設(shè)備模擬，大腦的分析過程則采用計算機(jī)去模擬，計算機(jī)通過對攝像機(jī)獲取的數(shù)據(jù)信息進(jìn)行處理，從而給出圖像的內(nèi)容的解釋。因此要找到一種合適的表達(dá)方式，讓計算機(jī)能夠像人腦一樣來表述圖像的內(nèi)容。只有合適的表達(dá)方式，才能讓計算機(jī)實(shí)現(xiàn)基于內(nèi)容的進(jìn)一步的圖像操作。

BoW模型就是一種比較常用的圖像特征描述子。起初BoW模型是針對文檔信息處理和文本檢索而建立的。它忽略了語法和語序，僅以單詞為基本單位來對文本進(jìn)行描述。推廣到圖像處理中的BoW模型是通過圖像的局部特征向視覺單詞的映射實(shí)現(xiàn)的，下面將從BoW模型出發(fā)，分析說明一種基于BoW模型的圖像分類方法。

1 BoW模型

BoW（ bag of words）模型最先由Csurka等[2]從自然語言處理領(lǐng)域引入到圖像分類領(lǐng)域。BoW模型是一種以單詞為模型的描述向量。將圖像類比為由若干單詞組成的文檔，然后從每幅圖像的視覺單詞頻率直方圖中得到圖像的描述向量，最后得到圖像所映射的類別。使用BoW模型對圖像進(jìn)行分類可以取得較好的分類效果。

采用BoW模型的關(guān)鍵點(diǎn)是提取圖像的視覺單詞描述。通常的做法是采用SIFT算法提取圖像的局部特征，通過SIFT提取特征后，每幅圖像都由一個128維特征向量集合描述，此時對這個向量集合進(jìn)行K均值聚類，最后將得到K個聚類中心作為視覺單詞，所有視覺單詞的集合就是視覺詞匯表。由于聚類的不精確性，以及缺乏先驗(yàn)知識時K值設(shè)置的隨意性，視覺詞匯表往往具有一定程度上的冗余。圖像的分類是在生成視覺詞典之后完成的。通常是采取與生成詞典時一樣的算法來提取特征，然后做出圖像的視覺單詞頻率直方圖，得到圖像分類的結(jié)果。如果在特征提取過程中混入了噪聲，最后的結(jié)果可能會出現(xiàn)偏差?；谝陨戏治觯疚乃岢龅牟捎肂oW模型實(shí)現(xiàn)圖像分類的方法，首先是對特征進(jìn)行加權(quán)，采用加權(quán)后的K均值聚類，生成初始的視覺詞典，然后根據(jù)一定的檢驗(yàn)判定原則，對視覺單詞進(jìn)行驗(yàn)證，刪去冗余詞匯，構(gòu)成最終的視覺詞典。

2 加權(quán)的K均值聚類

在視覺詞匯表構(gòu)建時，使用最廣泛是無監(jiān)督聚類算法，例如K均值算法。然而，在實(shí)際圖像中特征描述符中的每個特征維度的取值范圍不同，并且對于圖像分類來說，每個維度具有不同的重要性。但傳統(tǒng)的K聚類方法將所有的特征一視同仁不加區(qū)分。因此，為了構(gòu)建更加有效的視覺詞典，本文采用加權(quán)的K均值算法，該算法采用明科斯基距離對特征進(jìn)行加權(quán)。

4 實(shí)驗(yàn)結(jié)果與總結(jié)

為了更好地說明本文所提出的基于BoW模型的圖像分類方法的有效性，隨機(jī)從數(shù)據(jù)庫Caltech 101以及Caltech 256中抽取樣本來進(jìn)行驗(yàn)證。對每個樣本組，分別采用本文所提的對視覺詞典的生成做出優(yōu)化的方法和傳統(tǒng)的沒有任何改進(jìn)的基于BoW模型的圖像分類方法來進(jìn)行圖像分類訓(xùn)練識別實(shí)驗(yàn)。

實(shí)驗(yàn)結(jié)果證明，無論視覺詞匯表是大還是小，用加權(quán)的K均值聚類的效果都比使用普通的K均值聚類的效果要好。這說明，本文所提出的采用加權(quán)的K均值方法來生成視覺詞典是能夠取得更優(yōu)的效果的。

參考文獻(xiàn)

[1]王瑩，基于BoW模型的圖像分類方法研究[D].哈爾濱工程大學(xué)，2012.

[2]Csurka G，Dance C，F(xiàn)an L，et al.Visual categoriza-tion with bags of keypoints[C].ECCV 04 Workshopon Statistical Learning in Computer Vision.Prague，Czech，2004：59-74.

[3]李科，游雄，杜琳.基于多特征組合與優(yōu)化BoW模型的影像分類技術(shù)研究[J].系統(tǒng)仿真學(xué)報，2016，28（6）：1386-1393.

[4]李宇，王宏琦，孫顯.利用多尺度語義模型的復(fù)雜圖像目標(biāo)自動提取方法[J].武漢大學(xué)學(xué)報（信息科學(xué)版），2012，37（9）：1064-1067.

猜你喜歡

特征提取和最小二乘支持向量機(jī)的水下目標(biāo)識別

艦船科學(xué)技術(shù)(2022年15期)2022-09-14 09:21:50

基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究

電子制作(2019年15期)2019-08-27 01:12:00

基于Daubechies(dbN)的飛行器音頻特征提取

電子制作(2018年19期)2018-11-14 02:37:08

基于DNN的低資源語音識別特征提取技術(shù)

自動化學(xué)報(2017年7期)2017-04-18 13:41:09

Bagging RCSP腦電特征提取算法

自動化學(xué)報(2017年11期)2017-04-04 02:52:58

一種基于LBP 特征提取和稀疏表示的肝病識別算法

中國生物醫(yī)學(xué)工程學(xué)報(2017年6期)2017-02-10 05:11:45

基于DSP的直線特征提取算法

廣西科技大學(xué)學(xué)報(2016年1期)2016-06-22 13:10:38

基于改進(jìn)WLD的紋理特征提取方法

計算機(jī)工程(2015年4期)2015-07-05 08:28:02

淺析零件圖像的特征提取和識別方法

機(jī)電信息(2015年3期)2015-02-27 15:54:46

基于CATIA的橡皮囊成形零件的特征提取

機(jī)械工程師(2015年10期)2015-02-02 01:13:49

科技創(chuàng)新與應(yīng)用2017年10期

科技創(chuàng)新與應(yīng)用的其它文章: 人員密集場所消防監(jiān)督檢查工作問題分析; 地鐵滅火救援所面臨困難分析及應(yīng)對措施; GIS技術(shù)在城市規(guī)劃中的應(yīng)用; 力學(xué)計量中短距離無線通信系統(tǒng)的運(yùn)用; 淺析互聯(lián)網(wǎng)思維在職業(yè)培訓(xùn)中的應(yīng)用; 加強(qiáng)林業(yè)發(fā)展對生態(tài)環(huán)境保護(hù)產(chǎn)生的重要作用

靖州| 文山县| 资讯 | 卫辉市| 仁布县| 荃湾区| 施甸县| 梨树县| 措勤县| 维西| 穆棱市| 克山县| 鄂托克前旗| 城固县| 惠东县| 宁南县| 通道| 富民县| 德昌县| 洛浦县| 新河县| 苏尼特左旗| 余江县| 巴林右旗| 池州市| 吴桥县| 得荣县| 尉氏县| 房山区| 吴忠市| 汝阳县| 嘉义县| 莲花县| 阜南县| 晋城| 拜城县| 九龙城区| 肥西县| 旺苍县| 肃南| 台江县|