国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于分布式聚類算法的圖像特征提取研究

2017-12-29 08:34擺小軍張鎮(zhèn)東
移動(dòng)信息 2017年1期
關(guān)鍵詞:字典紋理特征提取

呂 娜 擺小軍 張 烜 張鎮(zhèn)東

?

基于分布式聚類算法的圖像特征提取研究

呂 娜 擺小軍 張 烜 張鎮(zhèn)東

國(guó)網(wǎng)新疆電力公司信息通信公司,新疆 烏魯木齊 830000

在計(jì)算機(jī)視覺(jué)領(lǐng)域,聚類算法主要用來(lái)構(gòu)建視覺(jué)詞匯的詞袋,因其簡(jiǎn)單、高效而得到了廣泛的應(yīng)用。眾所周知,最簡(jiǎn)單的聚類算法是K-means算法。該算法主要是通過(guò)初始化一組聚類中心,并通過(guò)計(jì)算其他樣本點(diǎn)到聚類中心的距離判斷該樣本點(diǎn)屬于某一個(gè)聚類中心。采用分布式K-means算法提取圖像特征則是在分布式的環(huán)境下圖像特征的提取。通過(guò)聚類的過(guò)程得到聚類中心,即字典,在得到字典后,通過(guò)特征映射函數(shù),將輸入的圖像向量轉(zhuǎn)換成相應(yīng)的新的特征表達(dá),用來(lái)準(zhǔn)確表達(dá)。

聚類算法;聚類中心;特征提取;分布式

引言

1967年,J.B.MacQueen提出了K-means聚類算法,隨后該算法被廣泛應(yīng)用在不同的領(lǐng)域,由于其容易實(shí)現(xiàn)、簡(jiǎn)單高效的特點(diǎn),使其依舊是目前被研究的熱點(diǎn)。由于K-means 算法易于描述,時(shí)間效率高,在處理大規(guī)模數(shù)據(jù)方面有很大的優(yōu)勢(shì)。目前,該算法在圖像分類,圖像檢索以及自然語(yǔ)言處理等眾多領(lǐng)域都有廣泛的應(yīng)用。

分布式K-means算法[1]是在分布式平臺(tái)上實(shí)現(xiàn)的,主要是對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行聚類分析,體現(xiàn)了并行計(jì)算和分布式計(jì)算日益增長(zhǎng)的趨勢(shì)。其思想是:首先在各個(gè)站點(diǎn)上對(duì)數(shù)據(jù)進(jìn)行局部聚類操作,之后將其結(jié)果輸入給其他站點(diǎn)并聚集成最終的聚類結(jié)果。

1 常見(jiàn)圖像特征提取算法

1.1 顏色特征

顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點(diǎn)的特征,此時(shí)所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對(duì)象的局部特征。

常用的特征提取方法主要是顏色直方圖,能簡(jiǎn)單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動(dòng)分割的圖像和不需要考慮物體空間位置的圖像。但是,顏色直方圖無(wú)法描述圖像中顏色的局部分布及每種色彩所處的空間位置,即無(wú)法描述圖像中的某一具體的對(duì)象或物體。

1.2 紋理特征

紋理特征同樣也是一種全局特征,描述圖像或圖像區(qū)域所對(duì)應(yīng)景物的表面性質(zhì)。由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質(zhì)屬性,所以僅僅利用紋理特征是無(wú)法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無(wú)法匹配成功。作為一種統(tǒng)計(jì)特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。但是,紋理特征也有不足之處,一個(gè)很明顯的缺點(diǎn)是當(dāng)圖像的分辨率變化的時(shí)候,所計(jì)算出來(lái)的紋理可能會(huì)有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2D圖像中反映出來(lái)的紋理不一定是3D物體表面真實(shí)的紋理。

1.3 形狀特征

各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來(lái)進(jìn)行檢索,但它們也有一些共同的問(wèn)題。主要有:基于行政的檢索方法還缺乏完善的數(shù)據(jù)模型;當(dāng)目標(biāo)有變形時(shí),會(huì)引起檢索結(jié)果不準(zhǔn)確的現(xiàn)象等[2]。通常情況下,形狀特征有兩類表示方法:一類是輪廓特征;另一類是區(qū)域特征。圖像的輪廓特征主要針對(duì)物體的外邊界,而圖像的區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域。

2 基于分布式聚類算法的圖像特征提取

2.1 原理

K-means算法是基于樣本間相似性度量的聚類方法的一種,屬于非監(jiān)督學(xué)習(xí)方法的一種。K-means算法主要是來(lái)計(jì)算數(shù)據(jù)聚集的算法,通過(guò)迭代的方式不斷地選取離聚類中心最近均值的算法。K-means聚類算法是一種典型的動(dòng)態(tài)的聚類算法,其主要關(guān)注點(diǎn)是以誤差平方和作為準(zhǔn)則函數(shù),通過(guò)逐點(diǎn)修改聚類中心,對(duì)每一個(gè)樣本按某一種計(jì)算方法,將該樣本分配給某一組,之后重新計(jì)算這個(gè)組的均值。同時(shí),所獲得的新的均值作為該組的新的聚類中心進(jìn)行下一次樣本的聚類。

在分布式的基礎(chǔ)上,將單機(jī)K-means算法并行化、分布式化,對(duì)輸入的數(shù)據(jù)并行處理。在具體的聚類過(guò)程中,給定上一步驟得到的完整的聚類中心,在每個(gè)獨(dú)立計(jì)算的節(jié)點(diǎn)上讀取輸入數(shù)據(jù),計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的相應(yīng)的聚類中心,最終輸出全局的聚類集合。

2.2 圖像特征提取

采用分布式K-means算法來(lái)提取圖像特征。首先對(duì)輸入的圖像隨機(jī)提取圖像塊,這一操作對(duì)圖片之間是不相關(guān)的,在分布式的環(huán)境下可以并行進(jìn)行。同時(shí)為了減少冗余信息,保留關(guān)鍵信息,之后會(huì)對(duì)所提取的圖像塊進(jìn)行預(yù)處理操作,這里包括正則化和白化過(guò)程,在預(yù)處理過(guò)程中,同樣可以在多個(gè)獨(dú)立月工作的節(jié)點(diǎn)之間并行的進(jìn)行,從而提高效率,最后將得到的預(yù)處理后的圖像塊作為并行化K-means算法的輸入,進(jìn)行提取字典的操作,在得到字典后,通過(guò)選取的特征映射函數(shù),將圖像映射為一個(gè)新的表達(dá),即是圖像特征。該算法是在分布式上實(shí)現(xiàn)的每一個(gè)步驟,包括預(yù)處理、字典的學(xué)習(xí)以及最終的圖像特征提取過(guò)程都是并行處理的。相對(duì)于單機(jī)系統(tǒng)實(shí)現(xiàn)的算法,在一定程度上節(jié)約了時(shí)間成本。同時(shí),K-means作為一種無(wú)監(jiān)督的特征學(xué)習(xí)方法,避免了對(duì)各種訓(xùn)練參數(shù)的學(xué)習(xí)。這些參數(shù)一般是需要通過(guò)交叉驗(yàn)證的方式來(lái)獲得最優(yōu)設(shè)置,這無(wú)疑會(huì)增加很大的時(shí)間成本。但是,在分布式K-means提取圖像特征的過(guò)程中,除了需要學(xué)習(xí)字典外,不需要學(xué)習(xí)其他的參數(shù)。因此,相對(duì)于其他的特征學(xué)習(xí)算法,該算法時(shí)間效率上具有很大的優(yōu)勢(shì)[3]。

3 總結(jié)

圖像特征提取是計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域中一個(gè)很重要的部分,主要指的是使用計(jì)算機(jī)提取圖像信息,決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)圖像特征,其結(jié)果是把圖像上的點(diǎn)分為不同的子集,這些子集通常屬于孤立的點(diǎn)、連續(xù)的曲線或者連續(xù)的區(qū)域。聚類算法被廣泛的應(yīng)用在日常生活中。在商業(yè)上,聚類算法有助于分析人員從各種消費(fèi)數(shù)據(jù)庫(kù)中提取出特定的消費(fèi)信息,并且概括出消費(fèi)信息中體現(xiàn)的消費(fèi)模式。聚類算法是數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)重要部分,通??梢宰鳛橐粋€(gè)良好的工具來(lái)發(fā)現(xiàn)數(shù)據(jù)庫(kù)中的深層次的特征表達(dá)。同時(shí),可以概括出每一個(gè)特定類別的特點(diǎn),采用分布式的聚類算法提取圖像特征,能夠避免眾多參數(shù)的訓(xùn)練,很大程度上節(jié)省了時(shí)間成本。

[1]張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2007,24(5):166-168.

[2]吳夙慧,成穎,鄭彥寧,潘云濤.K-means算法研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2011(5):28-35.

[3]孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008,19(1):48-61.

Research on image feature extraction based on Distributed Clustering Algorithm

LYU Na Bai Xiaojun Zhang Xuan Zhang Zhendong

State Grid Xinjiang Electric Power Company Information and Communication Company,Xinjiang Urumqi 830000

In the field of computer vision,clustering algorithm is mainly used to construct the word bag of visual words, which is widely used for its simple and efficient. As everyone knows,the most simple clustering algorithm is the K-means algorithm,the algorithm is mainly by initializing a set of cluster centers,and by calculating the other sample points to the distance from the cluster center to determine the sample belongs to a cluster center. The distributed K-means algorithm of image feature extraction is to extract image features in the distributed environment,clustering centers obtained by clustering process, which is in the dictionary, the dictionary,the feature mapping function,the input image vector is converted to the new features of the corresponding expression for accurate expression.

clustering algorithm;cluster center;feature extraction;distributed

TP391.41

A

1009-6434(2017)01-0147-02

猜你喜歡
字典紋理特征提取
基于BM3D的復(fù)雜紋理區(qū)域圖像去噪
空間目標(biāo)的ISAR成像及輪廓特征提取
基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
基于特征提取的繪本閱讀機(jī)器人設(shè)計(jì)方案
字典的由來(lái)
使用紋理疊加添加藝術(shù)畫特效
基于Daubechies(dbN)的飛行器音頻特征提取
大頭熊的字典
TEXTURE ON TEXTURE質(zhì)地上的紋理
正版字典
伊春市| 修水县| 许昌县| 桂东县| 无为县| 屯留县| 武隆县| 遂昌县| 安顺市| 黄骅市| 灵宝市| 贵德县| 正定县| 江阴市| 嫩江县| 沂源县| 仙游县| 原阳县| 利辛县| 永州市| 洞口县| 于都县| 无为县| 墨江| 云龙县| 德化县| 辉南县| 林周县| 嘉善县| 奎屯市| 临颍县| 柞水县| 太和县| 调兵山市| 禄丰县| 汉沽区| 偃师市| 古蔺县| 临高县| 平顶山市| 广安市|