国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于金字塔梯度方向圖像特征的檢索模型設(shè)計

2014-08-29 17:58白宗文周美麗白茹
現(xiàn)代電子技術(shù) 2014年15期
關(guān)鍵詞:電子商務(wù)

白宗文+周美麗+白茹

摘 要: 隨著互聯(lián)網(wǎng)的普及和發(fā)展,電子商務(wù)網(wǎng)站數(shù)量急劇增長,迫切需要一個平臺對在線銷售商品進(jìn)行標(biāo)注以方便用戶進(jìn)行搜索。通過提取類別圖像和測試圖像的金字塔梯度方向直方圖(PHOG)全部特征,然后計算兩者之間的距離,測試圖像與類別圖像距離比較近的就屬于同一類圖像。利用Matlab語言開發(fā)出了能夠?qū)崿F(xiàn)這一檢索分類模型。實驗證明這一模型靈活性好,準(zhǔn)確性高。

關(guān)鍵詞: 電子商務(wù); 圖像檢索; 混淆矩陣; 金字塔梯度方向直方圖

中圖分類號: TN911.7?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2014)15?0065?03

Design of image retrieval model based on image features

in pyramid histogram of oriented gradient

BAI Zong?wen, ZHOU Mei?li, BAI Ru

(Yanan University, Yanan 716000, China)

Abstract: With the development and popularization of Internet, and rapid increase of e?commerce web sites, sales of commodity on line needs a platform for the annotation urgently to facilitate users to search in e?commerce site. The distance between the testing image and category image is calculated according to the entire features extracted in category image and testing image PHOG. If the distance between the testing image and category image is in the range, they belong to the same class. The model that could fulfil the image retrieval classification was developed with Matlab language. Experiment results show that the model has high flexibility and accuracy.

Keywords: e?commerce; image retrieval; confusion matrix; PHOG

0 引 言

隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,網(wǎng)上資訊、網(wǎng)上銷售、網(wǎng)上購物等已成為一種潮流,來自各個領(lǐng)域的信息以圖片、圖表、動畫和視頻為形式的信息發(fā)布量日益龐大。在許多應(yīng)用領(lǐng)域中如數(shù)字圖書館、天氣預(yù)報、醫(yī)療圖像管理、犯罪預(yù)防、宇宙探測、交通檢測等,圖像信息每天都以驚人的速度填充著或形成更加龐大的圖像信息庫。人們在工作、生活中越來越多地接觸到大量的各種各樣的圖像信息,可以說網(wǎng)絡(luò)的普及和發(fā)展對人們的生活、對社會各個領(lǐng)域均產(chǎn)生了巨大影響,特別是Web的興起,網(wǎng)絡(luò)上傳輸?shù)男畔⒏且灾笖?shù)級速度增長。但出現(xiàn)在Web上公共資源等圖像信息都是無序、無索引的,在這樣的環(huán)境下尋找感興趣的資料是非常耗時的。因此就需要有一個對信息進(jìn)行分類、檢索系統(tǒng)平臺來快捷地實現(xiàn)搜索目的[1]。

本文研究實現(xiàn)了根據(jù)圖像特征完成對在線商品的自動分類,以方便人們對商品圖片信息的檢索,尤其可以推廣到電子商務(wù)領(lǐng)域。眾所周知,電子商務(wù)網(wǎng)站的數(shù)量正在急劇增長,電子商務(wù)已經(jīng)逐漸進(jìn)入了一個全新的時代,以一批國內(nèi)外知名的電子商務(wù)網(wǎng)站為代表,如Amazon、ebay、淘寶等越來越受到大眾的認(rèn)可和好評,只是目前這些商務(wù)平臺的基本信息檢索系統(tǒng)已基本成熟,但是還不是很完善,本文主要采用的是提取PHOG特征即商品局部特征相似的方法,主要評價標(biāo)準(zhǔn)是通過計算商品相似度距離來實現(xiàn)分類[2]。

1 算法原理

對于靜止圖像分類檢索主要根據(jù)圖像特征如顏色(Color)、紋理(Texture)、形狀(Shape)和特征空間等[3],其中基于顏色、紋理、形狀的分類方法應(yīng)用已經(jīng)很廣泛。而特征空間的分類檢索方法多應(yīng)用于對遙感圖像、紋理圖像進(jìn)行分類,基于特征空間的分類方法是將原圖像經(jīng)過K?L變換或小波變換等把圖像用特征空間表示,然后在圖像特征空間中提取圖像的高層特征對圖像進(jìn)行分類。應(yīng)用特征空間的分類方法可降低數(shù)據(jù)維數(shù),降低計算復(fù)雜性,但其分類效果與特征提取的方式有很大關(guān)系。

Anna Bosch提出了圖像的金字塔方向梯度直方圖表示方式(圖像PHOG特征表示)[4],其具體步驟如下:先提取圖像的邊緣輪廓,再將圖像輪廓進(jìn)一步分層,每一層將上一層的各塊比例按寬和高等分成更小的分塊,提取這些分塊輪廓點的梯度方向直方圖, 然后按權(quán)值合并,這樣就形成一個大金字塔梯度方向直方圖作為圖像的形狀特征。近年來提取圖像的PHOG 特征在圖像分類、檢索等領(lǐng)域應(yīng)用得非常廣泛[5] 。

本文以Matlab語言為基礎(chǔ)根據(jù)圖像PHOG特征即塔式梯度方向直方圖進(jìn)行分類。為了進(jìn)一步描述這種方法原理,圖1將一幅圖像逐級分割細(xì)化,一般是按橫縱坐標(biāo)均分兩段,如圖1第一行,上一級對圖像的每一分塊在下一級分割中就被分成4 塊。計算每一級各塊所含邊緣點對應(yīng)的梯度方向直方圖,然后匯總這些梯度方向直方圖就得到圖像最終的PHOG 形狀描述特征。設(shè)圖像共被分割成[L]級, 第[l]級每個軸被平均分成[2l]段, 從而得到[4l]個圖像塊, 每塊的梯度方向直方圖有[K]個區(qū)間,所以PHOG 特征共有[Kl∈L4l] 維[5]。圖像的PHOG金字塔形狀的空間描述如圖1所示。

每個描述符包含在了每個分區(qū)域的圖像水平分辨率的一個方向上的梯度直方圖。這兩個PHOG形象描述的距離反映了某種程度上圖像的形狀和相對應(yīng)的空間布局的相似性[6]。從圖1 中可以看出隨著分割層數(shù)的增加,梯度方向直方圖對圖像形狀的刻畫也越來越局部化和精細(xì)化。

混淆矩陣是圖像分類經(jīng)常使用的一種衡量算法性能的標(biāo)準(zhǔn)方法[7],圖2是對混淆算法的詳細(xì)說明,橫排表示測試圖片的實際類別,豎排表示測試圖片的預(yù)測類別,而從左往右的中心對稱線則表示分類正確的數(shù)目,通過混淆矩陣可以直觀地看出結(jié)果的準(zhǔn)確性。本文用Matlab編程語言,實現(xiàn)了對于圖像PHOG特征提取的快速分類,并且還進(jìn)行多次測試,通過擴(kuò)大測試類別,改變[L]值的大小來驗證算法的準(zhǔn)確性,并對結(jié)果做混淆矩陣分析,利用混淆矩陣的直觀性很好地驗證了該算法的準(zhǔn)確性[8]。

2 仿真實驗

通過Matlab設(shè)計M文件,所需要的M文件主要有兩大類:一是循環(huán)提取文件夾里的圖片的PHOG特征;二是循環(huán)計算測試集里的每張圖片與訓(xùn)練集圖片的PHOG特征間的距離。取[L=1,]對兩類圖片進(jìn)行測試:在圖庫中選取了兩大類圖片共計40張,第一類是20張項鏈,第二類是20張球,取10張項鏈和10張球作為測試集C,其余10張項鏈和球作為訓(xùn)練集A與B,如圖3所示。

圖2 混淆矩陣

圖3 訓(xùn)練集圖片示意圖

接下來通過M程序分別求A,B,C中每張圖片的PHOG特征并存于a,b,c中,然后將c中的每張圖片的PHOG特征與a和b中每張圖片的PHOG特征求距離,這樣就得到了兩個1×200的距離值,而所得1×200每個數(shù)據(jù)表示的是距離值,第一行表示C中的圖片PHOG特征到A中圖片的距離;第二行表示C中的圖片PHOG特征到B中圖片的距離;而第一列的前10個數(shù)表示C中第一張圖片到A中圖片的距離;11~20表示到C中第二張圖片到A中圖片的距離,依次類推,就可以根據(jù)數(shù)據(jù)對測試圖片進(jìn)行分類并做混淆矩陣。互相比較距離值,距離較小的一類就是測試圖片所屬類,根據(jù)結(jié)果做混淆矩陣如圖4所示。

圖4 兩類圖片的混淆矩陣

從圖4可以直觀看出共17張分類正確,3張分類錯誤,準(zhǔn)確率為85%。

3 結(jié) 論

由上述實驗仿真可以得出對于無噪聲或小噪聲圖像通過提取測試圖片的PHOG特征,進(jìn)而計算測試集與訓(xùn)練集圖片的PHOG特征求距離,距離最近的一類就是測試圖片的所屬類或最相似類。這一技術(shù)可被推廣到電子商務(wù)中,具有一定的實用價值。

參考文獻(xiàn)

[1] 章毓晉.圖像工程(上冊):圖像處理與分析[M].北京:清華大學(xué)出版社,1999.

[2] 章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社,2003.

[3] 李建生.圖像元數(shù)據(jù)特征提取及其在檢索中的應(yīng)用[D].南京:南京師范大學(xué),2006.

[4] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344?353.

[5] 袁杰,魏寶剛,王李冬.一種綜合PHOG形狀和小波金字塔能量分布特征的圖像檢索方法[J].電子學(xué)報,2011,39(9):2114?2119.

[6] 肖冶江.基于色彩的圖像檢索系統(tǒng)研究及實現(xiàn)[D].南寧:廣西大學(xué),2007.

[7] 賈世杰,孔祥維,付海燕,等.基于互補(bǔ)特征和類描述的商品圖像自動分類[J].電子與信息學(xué)報,2010(10):2294?2300.

[8] 吳小季.基于SVM圖像分類方法的研究[D].南京:南京信息工程大學(xué),2011.

每個描述符包含在了每個分區(qū)域的圖像水平分辨率的一個方向上的梯度直方圖。這兩個PHOG形象描述的距離反映了某種程度上圖像的形狀和相對應(yīng)的空間布局的相似性[6]。從圖1 中可以看出隨著分割層數(shù)的增加,梯度方向直方圖對圖像形狀的刻畫也越來越局部化和精細(xì)化。

混淆矩陣是圖像分類經(jīng)常使用的一種衡量算法性能的標(biāo)準(zhǔn)方法[7],圖2是對混淆算法的詳細(xì)說明,橫排表示測試圖片的實際類別,豎排表示測試圖片的預(yù)測類別,而從左往右的中心對稱線則表示分類正確的數(shù)目,通過混淆矩陣可以直觀地看出結(jié)果的準(zhǔn)確性。本文用Matlab編程語言,實現(xiàn)了對于圖像PHOG特征提取的快速分類,并且還進(jìn)行多次測試,通過擴(kuò)大測試類別,改變[L]值的大小來驗證算法的準(zhǔn)確性,并對結(jié)果做混淆矩陣分析,利用混淆矩陣的直觀性很好地驗證了該算法的準(zhǔn)確性[8]。

2 仿真實驗

通過Matlab設(shè)計M文件,所需要的M文件主要有兩大類:一是循環(huán)提取文件夾里的圖片的PHOG特征;二是循環(huán)計算測試集里的每張圖片與訓(xùn)練集圖片的PHOG特征間的距離。取[L=1,]對兩類圖片進(jìn)行測試:在圖庫中選取了兩大類圖片共計40張,第一類是20張項鏈,第二類是20張球,取10張項鏈和10張球作為測試集C,其余10張項鏈和球作為訓(xùn)練集A與B,如圖3所示。

圖2 混淆矩陣

圖3 訓(xùn)練集圖片示意圖

接下來通過M程序分別求A,B,C中每張圖片的PHOG特征并存于a,b,c中,然后將c中的每張圖片的PHOG特征與a和b中每張圖片的PHOG特征求距離,這樣就得到了兩個1×200的距離值,而所得1×200每個數(shù)據(jù)表示的是距離值,第一行表示C中的圖片PHOG特征到A中圖片的距離;第二行表示C中的圖片PHOG特征到B中圖片的距離;而第一列的前10個數(shù)表示C中第一張圖片到A中圖片的距離;11~20表示到C中第二張圖片到A中圖片的距離,依次類推,就可以根據(jù)數(shù)據(jù)對測試圖片進(jìn)行分類并做混淆矩陣?;ハ啾容^距離值,距離較小的一類就是測試圖片所屬類,根據(jù)結(jié)果做混淆矩陣如圖4所示。

圖4 兩類圖片的混淆矩陣

從圖4可以直觀看出共17張分類正確,3張分類錯誤,準(zhǔn)確率為85%。

3 結(jié) 論

由上述實驗仿真可以得出對于無噪聲或小噪聲圖像通過提取測試圖片的PHOG特征,進(jìn)而計算測試集與訓(xùn)練集圖片的PHOG特征求距離,距離最近的一類就是測試圖片的所屬類或最相似類。這一技術(shù)可被推廣到電子商務(wù)中,具有一定的實用價值。

參考文獻(xiàn)

[1] 章毓晉.圖像工程(上冊):圖像處理與分析[M].北京:清華大學(xué)出版社,1999.

[2] 章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社,2003.

[3] 李建生.圖像元數(shù)據(jù)特征提取及其在檢索中的應(yīng)用[D].南京:南京師范大學(xué),2006.

[4] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344?353.

[5] 袁杰,魏寶剛,王李冬.一種綜合PHOG形狀和小波金字塔能量分布特征的圖像檢索方法[J].電子學(xué)報,2011,39(9):2114?2119.

[6] 肖冶江.基于色彩的圖像檢索系統(tǒng)研究及實現(xiàn)[D].南寧:廣西大學(xué),2007.

[7] 賈世杰,孔祥維,付海燕,等.基于互補(bǔ)特征和類描述的商品圖像自動分類[J].電子與信息學(xué)報,2010(10):2294?2300.

[8] 吳小季.基于SVM圖像分類方法的研究[D].南京:南京信息工程大學(xué),2011.

每個描述符包含在了每個分區(qū)域的圖像水平分辨率的一個方向上的梯度直方圖。這兩個PHOG形象描述的距離反映了某種程度上圖像的形狀和相對應(yīng)的空間布局的相似性[6]。從圖1 中可以看出隨著分割層數(shù)的增加,梯度方向直方圖對圖像形狀的刻畫也越來越局部化和精細(xì)化。

混淆矩陣是圖像分類經(jīng)常使用的一種衡量算法性能的標(biāo)準(zhǔn)方法[7],圖2是對混淆算法的詳細(xì)說明,橫排表示測試圖片的實際類別,豎排表示測試圖片的預(yù)測類別,而從左往右的中心對稱線則表示分類正確的數(shù)目,通過混淆矩陣可以直觀地看出結(jié)果的準(zhǔn)確性。本文用Matlab編程語言,實現(xiàn)了對于圖像PHOG特征提取的快速分類,并且還進(jìn)行多次測試,通過擴(kuò)大測試類別,改變[L]值的大小來驗證算法的準(zhǔn)確性,并對結(jié)果做混淆矩陣分析,利用混淆矩陣的直觀性很好地驗證了該算法的準(zhǔn)確性[8]。

2 仿真實驗

通過Matlab設(shè)計M文件,所需要的M文件主要有兩大類:一是循環(huán)提取文件夾里的圖片的PHOG特征;二是循環(huán)計算測試集里的每張圖片與訓(xùn)練集圖片的PHOG特征間的距離。取[L=1,]對兩類圖片進(jìn)行測試:在圖庫中選取了兩大類圖片共計40張,第一類是20張項鏈,第二類是20張球,取10張項鏈和10張球作為測試集C,其余10張項鏈和球作為訓(xùn)練集A與B,如圖3所示。

圖2 混淆矩陣

圖3 訓(xùn)練集圖片示意圖

接下來通過M程序分別求A,B,C中每張圖片的PHOG特征并存于a,b,c中,然后將c中的每張圖片的PHOG特征與a和b中每張圖片的PHOG特征求距離,這樣就得到了兩個1×200的距離值,而所得1×200每個數(shù)據(jù)表示的是距離值,第一行表示C中的圖片PHOG特征到A中圖片的距離;第二行表示C中的圖片PHOG特征到B中圖片的距離;而第一列的前10個數(shù)表示C中第一張圖片到A中圖片的距離;11~20表示到C中第二張圖片到A中圖片的距離,依次類推,就可以根據(jù)數(shù)據(jù)對測試圖片進(jìn)行分類并做混淆矩陣?;ハ啾容^距離值,距離較小的一類就是測試圖片所屬類,根據(jù)結(jié)果做混淆矩陣如圖4所示。

圖4 兩類圖片的混淆矩陣

從圖4可以直觀看出共17張分類正確,3張分類錯誤,準(zhǔn)確率為85%。

3 結(jié) 論

由上述實驗仿真可以得出對于無噪聲或小噪聲圖像通過提取測試圖片的PHOG特征,進(jìn)而計算測試集與訓(xùn)練集圖片的PHOG特征求距離,距離最近的一類就是測試圖片的所屬類或最相似類。這一技術(shù)可被推廣到電子商務(wù)中,具有一定的實用價值。

參考文獻(xiàn)

[1] 章毓晉.圖像工程(上冊):圖像處理與分析[M].北京:清華大學(xué)出版社,1999.

[2] 章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社,2003.

[3] 李建生.圖像元數(shù)據(jù)特征提取及其在檢索中的應(yīng)用[D].南京:南京師范大學(xué),2006.

[4] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344?353.

[5] 袁杰,魏寶剛,王李冬.一種綜合PHOG形狀和小波金字塔能量分布特征的圖像檢索方法[J].電子學(xué)報,2011,39(9):2114?2119.

[6] 肖冶江.基于色彩的圖像檢索系統(tǒng)研究及實現(xiàn)[D].南寧:廣西大學(xué),2007.

[7] 賈世杰,孔祥維,付海燕,等.基于互補(bǔ)特征和類描述的商品圖像自動分類[J].電子與信息學(xué)報,2010(10):2294?2300.

[8] 吳小季.基于SVM圖像分類方法的研究[D].南京:南京信息工程大學(xué),2011.

猜你喜歡
電子商務(wù)
2025年我國農(nóng)村電子商務(wù)交易額達(dá)到2.8萬億元
《電子商務(wù)法》如何助力直銷
淺析中小企業(yè)電子商務(wù)服務(wù)外包
電子商務(wù)實踐能力的提升探析
電子商務(wù)
電子商務(wù)模式創(chuàng)新的相關(guān)研究
關(guān)于加快制定電子商務(wù)法的議案
跨境電子商務(wù)中的跨文化思考
基于AS仿真的電子商務(wù)交易系統(tǒng)研究
電子商務(wù)人的核心能力