郭 健,李向陽,哀 薇
(華南理工大學 自動化科學與工程學院,廣州 510641)
?
基于PCA的彩色印刷圖像色彩分割算法
郭 健,李向陽,哀 薇
(華南理工大學 自動化科學與工程學院,廣州 510641)
針對彩色圖像的印刷過程中,原圖像的色彩分割問題,提出了基于PCA(主成分分析)并結合其它典型彩色圖像分割方法的新分割算法;該算法首先利用PCA算法把圖像分解為主特征分量和殘?zhí)卣鞣至績煞至繄D;然后采用二次分水嶺算法對殘?zhí)卣鞣至繄D進行分割;利用K-Means算法對主特征分量圖進行聚類初分割,接著對聚類初分割后的圖像進行相似色彩區(qū)域融合;最后把分割后的兩分量圖的進行融合,得到最終的分割結果圖;該算法可以應用于彩色印刷圖像的色彩自動分割和彩色印刷過程的自動色彩控制中。
色彩分割;主成分分析;分水嶺算法;K均值聚類
在彩色圖像印刷系統(tǒng)中,被印刷圖像(原圖像)的色彩提取和區(qū)域分割是實現自動彩色油墨配置和色彩濃度控制的前提。印刷圖像中包含有豐富的色彩和輪廓及紋理特征,各種色彩的區(qū)域面積不均衡,需要避免因區(qū)域面積不均衡而造成紋理區(qū)域被更大區(qū)域“吞并”現象;同時,通過成像設備獲取圖像不可避免含有噪聲,分割算法必須對噪聲有很好的濾除能力。典型的圖像分割算法各有優(yōu)缺點,單獨使用并不能適合印刷圖像分割。例如,K-Means算法存在易受噪聲和孤立點影響的問題;分水嶺算法對圖像的梯度變化很敏感,可以用于色彩漸進過渡的印刷圖像分割,但是容易造成過分割;基于圖論的分割算法,由于需要人工參與確定前景和背景,不滿足自動分割的要求;基于區(qū)域生長和區(qū)域分裂合并的分割算法也存在需要人工確定種子點的缺陷。
為了綜合利用現有典型算法的優(yōu)點,本文應用主成分分析(principal component analysis,PCA)算法對原圖像進行主成份分解,然后針對分解后的圖像應用典型的圖像分割算法,最后把分割后的不同成份圖像分量進行融合,從而實現對原圖像的分割。
假設數據集在維空間中有個樣本,PCA的核心思想是利用K-L變換對數據集的階協(xié)方差矩陣進行正交特征分解,求出協(xié)方差矩陣的n個特征值;接著求出矩陣的n個特征向量,這n個特征向量構成了n維空間的標準正交基;然后將數據集投影到這n個標準正交基上。特征值的模代表數據集在每個基上的的投影長度;特征值越大,說明數據集在對應特征向量上的方差越大,信息量越多。前個最大特征值對應的投影分量包含了主要特征,而最小特征值上對應的投影信息量很小,主要包含了細節(jié)特征。對一幅有M個像素點的彩色圖像而言,每個像素點都可以看作是一個3維向量,X=[x1,x2,x3]如果在RGB色彩空間中,則x1,x2,x3分別代表圖像的3個顏色分量R、G、B。對圖像做K-L變換的基本思想是通過求分量x1,x2,x3間的協(xié)方差矩陣Cx=[cov(xi,xj)]的特征值及特征向量ui。用特征向量ui組成正交矩陣Φ=[u1,u2,u3]T作為變換矩陣,將[x1,x2,x3]變換到正交系[y1,y2,y3]。
對印刷圖像做K-L變換的步驟如下:
Step 1:對M個像素點的X=[x1,x2,x3]計算各分量的均值
(1)
然后對每個像素點求xi-uxi(i=1,2,3),這等價于將[x1,x2,x3]的原點移至像素點中心。
Step 2:計算協(xié)方差矩陣
E[(xi-Exi)(xj-Exj)T]=
(2)
Step 3:根據|λI-Cx|計算協(xié)方差陣Cx的特征值并降序排列為λ1>λ2>λ3和對應的特征向量u1,u2,u3。將特征向量ui作為行向量構成正交變換矩陣Φ=[u1,u2,u3]T。
Step 4:通過y=Φ·x將像素點投影到特征向量上[u1,u2,u3],求出y=[y1,y2,y3]。
經過上述變換后,圖像的協(xié)方差矩陣Cx變?yōu)閷顷嚕瑈1,y2,y3之間相互獨立,K-L變換去除了分量間的相關性。對圖1(a)的原圖像做K-L變換,得到正交系[y1,y2,y3]的分布如圖2所示。
圖1 PCA分解后的成分圖
圖2 K-L變換
從圖2可以看出,在y1和y2上的投影包含了圖像主要特征,而在y3上的投影包含圖像的紋理特征,圖1的(b)、(c)和(d)為根據PCA算法在y1,y2和y3上的投影后的第1成分圖、第2成分圖和第3成分圖。為了后續(xù)敘述方便,把較大特征值的投影圖稱為主特征分量圖,在圖2中是第1成分圖和第2成分圖;最小特征值的投影圖稱為殘?zhí)卣鞣至繄D,在圖2中是第3成分圖。分別對主特征分量圖和殘?zhí)卣鞣至繄D采用不同的分割算法,首先對殘?zhí)卣鞣至繄D進行分割,然后對剔除殘?zhí)卣鞣至繄D后的主特征分量圖進行分割,最后融合兩部分分割結果。
由圖1(d)可以看到,在殘?zhí)卣鞣至繄D中,紋理特征具有較大的投影值,而其他點則相對較暗。因此只需對殘?zhí)卣鞣至繄D進行合適的閾值分割就可以獲得圖像絕大部分的紋理特征,采用最大類間方差算法(OTSU),并自適應地確定閾值可以實現第3分量圖的二值化,從而提取出圖像的重要紋理特征。
OTSU算法把圖像閾值化為只包含前景和背景的一幅二值圖像。其核心思想是選取最佳閾值使得前景和背景的類間方差最大,類內方差最小。對第3成分圖二值化后的結果如圖3所示。
圖3 閾值化圖
最終所得到的二值圖包含了圖像主要的紋理特征。由以上結果可以看出,圖中紋理特征豐富的區(qū)域(如臉部)最后被分割出來。
經PCA分解后的殘?zhí)卣鞣至繄D包含豐富的紋理特征,圖像中的梯度變化較大,分割算法必須對圖像中的梯度變化有良好的響應,分水嶺算法能較好地適應具有該圖像特征的圖像分割。分水嶺算法是一種基于拓撲理論的數學形態(tài)學的分割算法,模擬了集水盆中漫水筑壩的過程,較經典的實現是Luc Vincent和 Pierre Soille提出的基于梯度圖的分割,其基本思想是對彩色圖像先求其梯度圖,然后對梯度圖進行漫水筑壩。針對分水嶺算法對圖像存在過分割情況,本文提出了二次分水嶺分割算法。在初次分水嶺分割圖的基礎上,對分割后的梯度圖做形態(tài)學閉開平滑,然后再進行第二次分水嶺分割,最后對二次分水嶺的結果進行適當的小區(qū)域合并,該方法較好地解決了過分割的問題,結果如圖4所示。
圖4 殘?zhí)卣鞣至糠指顖D
圖1中的第1成分圖和第2成分圖是經過PCA分解后的原圖像的主特征分量,對于原圖像的主特征分量圖,首先利用K-Means聚類分割算法對主特征分量圖的進行初分割。由于實際印刷過程中圖像可印刷的色彩種類有限,K-Means算中的值取為實際印刷色彩上限。若原圖像的實際色彩種類大于上限,則表明該彩色印刷機不能完成原圖像的印刷任務,需要更換可印色彩更多的印刷機或者采用在同一印刷機上進行多次印刷。若圖像實際色彩種類小于上限,則經過初分割之后,圖像中可能還存在色彩相近的區(qū)域,因此還需要進行相似顏色區(qū)域的融合。
K-Means的基本原理是隨機選取圖像中的個點作為初始聚類中心點,而后迭代求取圖像中最優(yōu)聚類中心和最優(yōu)分類,使得(3)式定義的誤差平方和準則函數值最小。
(3)
其中,Mj是屬于類Cj的所有點的均值,xi是屬于類Cj的點。K-Means算法的計算過程如下:
Step 1:給定包含n個點的圖像,隨機選取K個初始聚類中心Z(I)=(z1,z2,…,zk),j=1,2,3,…,k,其中I是迭代次數標志,初始化為1;
Step 2:計算每個點到聚類中心距離d(xi,Z(I)),如果d(xi,zj)≤min{d(xi,Z(I))},則xizj;
Step 3:計算誤差平方和準則函數Jc:
(4)
上述過程結束后,圖像的初分割已經完成,然后檢查如色彩相似性,對于極相似的色彩要進一步色彩合并和融合。對于初分割形成的區(qū)域,本文采用色彩的歐式距離度量作為區(qū)域融合的度量標準,實現區(qū)域融合的具體步驟如下。
Step 1:取初分割圖像的一個區(qū)域xi做為第一個類簇Cm|m=1;
Step 2:計算下一個區(qū)域xi+1到所有類簇Cj(1≤j≤m)間的歐式距離d(xi+1,Cj),并取得最小值d(xi+1,Ck)=min1≤j≤md(xi+1,Cj),若d<θ,則Ck={xi,xi+1},并且更新Ck為所有成員的均值;否則新建類簇Cm+1={xi+1};
Step 3:重復2直到所有區(qū)域迭代完畢。
區(qū)域融合過程中的相似性度量閾值根據經驗取為θ=50,上述過程的分割效果圖如圖5所示。
圖5 主特征分量分割圖
經過主特征分量圖和殘?zhí)卣鞣至繄D的分割后,把主特征分量的分割圖和殘?zhí)卣鞣至康姆指顖D再融合得到圖像的最終分割圖,如圖6所示,共分割成7種不同顏色,用于配置印刷機的油墨色彩和生成印刷圖案。
對于圖1(a)的原圖像,實驗對比了本文算法與SLIC算法、傳統(tǒng)K-Means算法、分水嶺分割算法,圖7分別給出了它們的色彩分割結果圖。
圖7 分割對比圖
從圖7可以看出,SLIC算法分割效果不理想,不符合人眼的視覺分割效果;K-Means算法和分水嶺分割算法丟失了圖像的部分特征,分割結果也不理想,不能應用于彩色圖像的印刷控制中。本文提出的算法很好的滿足了印刷圖像色彩分割的需求,明顯優(yōu)于其他分割算法,適合彩色圖像的印刷控制。
針對彩色印刷圖像的色彩分割問題,本文提出了基于PCA的彩色圖像分割算法,該算法能夠結合了現有典型算法的優(yōu)點,實驗結果表明本算法的圖像分割效果較好地符合人眼的視覺分割效果,能夠很好的適用于印刷圖像的色彩控制。
[1]Chen B, Harrison R, Pan Y. Novel Hybrid Hierarchical-K-means Clustering Method (H-K-means) for Microarray Analysis [A]. Proceedings of the 2005 IEEE Computational Systems Bioinformatics Conference Workshops (CSBW’05).[C]. 2005: 105-108.
[2]Tapas Kanungo, Nathan S. Netanyahu. An Efficient k-Means Clustering Algorithm: Analysis and Implementation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 881-891.
[3]Fan J P. Automatic Image Segmentation by Integrating Color-Edge Extraction and Seeded Region Growing [J]. IEEE Transactions on Image Processing, 2001, 10(10): 1454-1466.
[4]吳夙慧.K-Means算法研究綜述[J].知識組織與知識管理,2011,205(5):25-35.
[5]孫吉貴.聚類算法研究[J].軟件學報,2008,19(1):48-61.
[6]林開顏.彩色圖像分割方法綜述[J].中國圖像圖形學報,2005,10(1):1-10.
[7]何 俊.圖像分割算法研究綜述[J].計算機工程與科學,2009,31(12):58-61.
[8]張武強,穆瑞輝.基于模糊K均值和節(jié)點位置的負載均衡傳感網路由策略[J].科學技術與工程,2013(1):912-916.
[9]柯尊海,劉 勇,徐義春,等.基于改進K均值的運動目標檢測算法研究[J].三峽大學學報:自然科學版,2012,24(6):98-102.
[10]張 靖,段 富.優(yōu)化初始聚類中心的改進K-Means算法[J].計算機工程與設計,2013,34(5):1691-1694.
[11]任 磊,賴惠成,陳欽政,等.基于改進K均值聚類與HSV模型的棉花分割算法[J].計算機工程與設計,2013,34(5):1772-1776.
[12]王雪光,陳淑紅.基于K均值聚類的成熟草莓圖像分割算法[J].農機化研究,2013,35(6):51-54.
[13]王聯(lián)國,韓曉慧,宋 磊.基于改進混合蛙-K均值聚類算法的無功電壓控制分區(qū)[J].傳感器與微系統(tǒng),2013,32(6):18-21.
Color Segmentation of Color Printing Image Algorithm based on PCA
Guo Jian, Li Xiangyang, Ai Wei
(School of Automation Science and Engineering, South China University of Technology, Guangzhou 510641, China)
To solve the color image segmentation problem in the color image printing process, a new segmentation algorithm is proposed based on PCA and combined with other typical image segmentation algorithms. According to the proposed algorithm, firstly PCA is used to decompose the original image into two parts; secondly, the K-Means algorithm is used to divide the primal part of image and then twice-watershed algorithm is used to divide the remnant part of image; finally, the segmented images are got by merging the two kinds of segmentation images. This proposed algorithm can be applied to color printing image segmentation and automatic color printing control during the process of color image printing.
color segmentation; PCA; watershed; algorithim; k-means clustering
2015-09-15;
2015-11-11。
郭 健(1990-),男,碩士研究生,主要從事圖像處理和印刷控制系統(tǒng)方向的研究。
李向陽(1969-),男,副教授,主要從事學習控制和嵌入式系統(tǒng)方向的研究。
1671-4598(2016)03-0211-03
10.16526/j.cnki.11-4762/tp.2016.03.057
TP391
A
哀 薇(1979-),女,副教授,主要從事數據驅動控制方向的研究。