魏潔 黃發(fā)忠 辛化梅
摘 要:二維凝膠圖像電泳過程中可能出現(xiàn)蛋白質(zhì)點(diǎn)重疊和堆聚的現(xiàn)象,文章利用圖像處理與分析技術(shù)設(shè)計(jì)了一種有效重疊蛋白質(zhì)點(diǎn)分離的算法。利用多邊形近似方法,將檢測(cè)到的蛋白質(zhì)點(diǎn)邊緣轉(zhuǎn)化成數(shù)字邊界,對(duì)該數(shù)字邊界用多邊形進(jìn)行有效近似,計(jì)算近似多邊形頂點(diǎn)對(duì)應(yīng)的內(nèi)角,通過閾值的設(shè)定,得到邊界上的凹點(diǎn),對(duì)凹點(diǎn)進(jìn)行匹配連線,從而實(shí)現(xiàn)對(duì)重疊蛋白質(zhì)點(diǎn)的有效分割。
關(guān)鍵詞:凝膠圖像;重疊蛋白質(zhì)點(diǎn);多邊形近似;凹點(diǎn);分割
引言
在二維凝膠圖像中,大量的蛋白質(zhì)點(diǎn)以圓或者橢圓的形式存在,它們有著不同的大小,不同的蛋白質(zhì)點(diǎn)有占有相同凝膠表面的趨勢(shì),這就導(dǎo)致了一些點(diǎn)的部分重疊,從而形成難以分析的點(diǎn)重疊區(qū)[1],影響蛋白質(zhì)點(diǎn)的準(zhǔn)確檢測(cè)。利用數(shù)字圖像處理與分析技術(shù)設(shè)計(jì)一種有效的重疊蛋白質(zhì)點(diǎn)分離算法,對(duì)提高蛋白質(zhì)點(diǎn)檢測(cè)的精度和可信度具有重要的意義。
現(xiàn)有的蛋白質(zhì)點(diǎn)檢測(cè)方法主要可以分為基于模型、基于分割以及基于特定新理論的檢測(cè)方法。其中基于模型的方法是采用某種數(shù)學(xué)模型,如高斯函數(shù)和擴(kuò)散函數(shù),擬合蛋白質(zhì)點(diǎn)的灰度值,從而得到蛋白質(zhì)點(diǎn)的邊界和體積,實(shí)現(xiàn)蛋白質(zhì)點(diǎn)的檢測(cè)[2]?;诜指畹姆椒ㄊ菍⒛z圖像分成多個(gè)小區(qū)域,每個(gè)區(qū)域理論上只包含一個(gè)蛋白質(zhì)點(diǎn)[3]?;谔囟ㄐ吕碚摰臋z測(cè)方法,如基于水平集的檢測(cè)方法,利用這一數(shù)學(xué)理論對(duì)能量函數(shù)進(jìn)行極小值求解的曲線演化過程,最終獲得目標(biāo)輪廓邊緣從而進(jìn)行蛋白質(zhì)點(diǎn)檢測(cè)[4]。已有的蛋白質(zhì)點(diǎn)檢測(cè)方法未能很好的分離重疊蛋白質(zhì)點(diǎn),文章提出一種基于最小周長(zhǎng)多邊形近似[5](Minimum Perimeter Polygon,MPP)的重疊蛋白質(zhì)點(diǎn)分割方法,用逼近蛋白質(zhì)點(diǎn)數(shù)字邊界的多邊形來近似表示蛋白質(zhì)點(diǎn)邊界,再利用凹點(diǎn)匹配對(duì)得到的近似多邊形的頂點(diǎn)進(jìn)行匹配連線,達(dá)到有效分離重疊蛋白質(zhì)點(diǎn)的效果。
1 基于區(qū)域跟蹤的蛋白質(zhì)點(diǎn)預(yù)分割方法
區(qū)域跟蹤能給出二值圖像中所有物體的內(nèi)邊界和外邊界,在圖像中尋找滿足某種檢測(cè)準(zhǔn)則的點(diǎn),將其全部鄰點(diǎn)進(jìn)行檢查,將具有相似屬性如強(qiáng)度,灰度級(jí),紋理顏色等的相鄰點(diǎn)及該點(diǎn)全部合并,從而產(chǎn)生小塊目標(biāo)區(qū)域。然后檢查該區(qū)域的全部鄰點(diǎn),并把滿足該檢驗(yàn)準(zhǔn)則的點(diǎn)并入該區(qū)域,經(jīng)過迭代過程,直到處理完每個(gè)像素,形成不同的區(qū)域[6]。
基于區(qū)域跟蹤算法,首先對(duì)圖像1-(a)進(jìn)行預(yù)處理并得到其二值圖像,遍歷該二值圖像,標(biāo)記第一個(gè)像素塊的第一個(gè)前景像素(i,j);對(duì)該像素八鄰域逆時(shí)針?biāo)阉?,若搜索到前景像素,則將(i,j)更新為(i',j'),進(jìn)行標(biāo)記;不斷執(zhí)行上步直到再次遇見該像素塊的第一個(gè)前景像素;繼續(xù)遍歷圖像,直到處理完整幅圖像,得到圖1-(b)。
通過區(qū)域跟蹤方法得到凝膠蛋白質(zhì)點(diǎn)的初始外圍輪廓信息,為后續(xù)重疊點(diǎn)的分離奠定了基礎(chǔ)。
2 重疊蛋白點(diǎn)的判別
其中,L表示檢測(cè)得到的蛋白質(zhì)邊界的周長(zhǎng),用邊緣相鄰像素間距離之和表示;S表示檢測(cè)得到的蛋白質(zhì)點(diǎn)的面積,可以用該區(qū)域內(nèi)像素個(gè)數(shù)來表示。
對(duì)于蛋白質(zhì)點(diǎn)重疊現(xiàn)象,可以分為三種情況:(1)單向雙點(diǎn)重疊,兩個(gè)蛋白質(zhì)點(diǎn)相互重疊;(2)單向多點(diǎn)重疊,多個(gè)蛋白質(zhì)點(diǎn)沿同一方向重疊;(3)多向重疊,蛋白質(zhì)相互重疊部分的中心兩兩連線或其延長(zhǎng)線組成一個(gè)多邊形。
3 基于MPP算法的重疊蛋白質(zhì)點(diǎn)分割
3.1 基于MPP算法的多邊形近似方法
在重疊蛋白質(zhì)點(diǎn)的判別中,我們已經(jīng)將重疊蛋白質(zhì)點(diǎn)區(qū)域提取出來,下一步需要對(duì)其進(jìn)一步分離。
數(shù)字邊界可以用多邊形近似來逼近,多邊形的計(jì)算可以用多邊形邊的線性關(guān)系來表示,這樣有利于得到一個(gè)區(qū)域的近似值。多邊形與鏈碼及邊界分段表示相比,具有更強(qiáng)抗噪聲的能力,當(dāng)邊界上的點(diǎn)數(shù)與多邊形的線段點(diǎn)數(shù)相同時(shí),多邊形能準(zhǔn)確的表達(dá)邊界。利用多邊形近似不僅用最少的線段來表示邊界,而且能夠表達(dá)原圖像邊界的本質(zhì)形狀。
利用周長(zhǎng)最小的多邊形近似表示邊界[8],將邊界看作是介于多邊形內(nèi)外界墻之間的有彈性的線。當(dāng)它在內(nèi)外界限的限制之下收縮緊繃的時(shí)候,就可以得到最小邊界,它使用單元條閉合了該區(qū)域。
3.2 凹點(diǎn)的判別
在凝膠圖像的判別中,重疊蛋白質(zhì)點(diǎn)都有一個(gè)共同特征,就是重疊區(qū)域會(huì)存在凹陷[9],因此,通過判斷近似多邊形頂點(diǎn)內(nèi)角的大小來作為進(jìn)一步判斷蛋白質(zhì)點(diǎn)是否發(fā)生重疊的分離依據(jù)。
近似多邊形每個(gè)頂點(diǎn)對(duì)應(yīng)的內(nèi)角大小可以通過該點(diǎn)與前后點(diǎn)分別連接得到的向量的夾角大小來表示,該點(diǎn)與前點(diǎn)組成的向量和與后點(diǎn)組成的向量的夾角大于180°時(shí),該點(diǎn)為凹點(diǎn),當(dāng)該夾角小于180°時(shí),該點(diǎn)為凸點(diǎn)。如圖3所示,I 為凸角對(duì)應(yīng)凸點(diǎn),II為為凹角對(duì)應(yīng)凹點(diǎn)。
3.3 分離線的確定
在得到蛋白質(zhì)邊界的凹點(diǎn)之后,進(jìn)行凹點(diǎn)的匹配,確定分離線[10],分割重疊蛋白質(zhì)點(diǎn)。
當(dāng)?shù)玫降陌键c(diǎn)個(gè)數(shù)n=1時(shí),判定該凹點(diǎn)為由噪聲引起的凹陷;對(duì)單向雙點(diǎn)重疊情況,只有一對(duì)凹點(diǎn),直接連接兩個(gè)凹點(diǎn);對(duì)單向多點(diǎn)重疊的情況,將凹點(diǎn)分別向中心軸線做投影,投影點(diǎn)距離最近,且對(duì)應(yīng)凹點(diǎn)連線距離最短為匹配的凹點(diǎn)[11];對(duì)多向重疊情況,要結(jié)合蛋白質(zhì)點(diǎn)本身是圓形或者橢圓形[3],并且遵循凹點(diǎn)連線的延長(zhǎng)線兩兩相交的原則匹配凹點(diǎn)。
3.4 實(shí)驗(yàn)結(jié)果及分析
從結(jié)果來看,圖7較圖1-(b)而言,分割更為準(zhǔn)確,實(shí)現(xiàn)了蛋白質(zhì)點(diǎn)中重疊部分的有效分割。文章分割方法有良好的抗噪性能,對(duì)于絕大多數(shù)重疊區(qū)域具有較好的分割效果,但對(duì)于極少數(shù)蛋白質(zhì)點(diǎn)邊緣不規(guī)則,與之粘連的蛋白質(zhì)點(diǎn)的點(diǎn)徑相當(dāng)于其突起的情況,無法精確分離。改進(jìn)的方法是在凹點(diǎn)檢測(cè)和匹配時(shí)結(jié)合蛋白質(zhì)點(diǎn)的形狀、面積分布等進(jìn)行匹配修正,尋找最匹配的點(diǎn)。
4 結(jié)束語
為了解決蛋白質(zhì)點(diǎn)預(yù)分割之后,重疊蛋白質(zhì)點(diǎn)的分離問題,提出了利用基于多邊形近似蛋白質(zhì)點(diǎn)進(jìn)而尋找匹配凹點(diǎn),對(duì)重疊蛋白質(zhì)點(diǎn)進(jìn)行分離的的算法。實(shí)際情況中存在非常復(fù)雜的蛋白質(zhì)點(diǎn)重疊現(xiàn)象,要準(zhǔn)確分割所有重疊蛋白質(zhì)點(diǎn)需要考慮蛋白質(zhì)的生物性質(zhì),間距等更多參數(shù),進(jìn)一步的工作是尋找一種自適應(yīng)的分離方法來分割重疊情況更加復(fù)雜的蛋白質(zhì)點(diǎn)。
參考文獻(xiàn)
[1]Michalis Savelonas,Dimitris Maroulis,Eleftheria. segmentation of two-dimentional gel electrophoresis image containing overlapping spots [J].IEEE,2009.
[2]Serackis T, Kambhamettu C. An image analysis suite for spot detection and spot matching intwo-dimensional electrophoresis gels [J].Electrophoresis,2008,29(3):706-715.
[3]張超.基于模糊形態(tài)學(xué)和分水嶺的蛋白質(zhì)點(diǎn)檢測(cè)方法研究[D].南昌航空大學(xué).
[4]閆克裕.基于水平集的牛乳體細(xì)胞圖像分割[D].內(nèi)蒙古農(nóng)業(yè)大學(xué),2008.
[5]J Sklansky,R L Chazin,B J Hansen. Minimum perimeter polygons of digitized silhuettes[J].IEEE Trans. Computers,1972.
[6]張德豐.詳解MATLAB數(shù)字圖像處理[M].電子工業(yè)大學(xué)出版社:260-268.
[7]傅蓉.細(xì)胞重疊與融合性圖像的分離與分割技術(shù)研究[D].南方醫(yī)科大學(xué),2007.
[8]Gonzalez Rafael C,Woods Richard E. Digital image processing [M].電子工業(yè)出版社,2007.
[9]韋冬冬,趙豫紅.基于凹點(diǎn)匹配的重疊圖像分割算法[J].計(jì)算機(jī)與應(yīng)用化學(xué),2010,27(1):99-102.
[10]蘇娜,薛河儒.重疊牛乳體細(xì)胞判別和分割方法的研究[J].計(jì)算機(jī)工程,2011,37(7):231-233.
[11]劉偉華,隋青美.基于凹點(diǎn)搜索的重疊粉體顆粒的自動(dòng)化分離算法[J].電子測(cè)量與儀器學(xué)報(bào),2010,24(12):1095-1100.
作者簡(jiǎn)介:魏潔(1988-),女,山東濰坊,山東師范大學(xué)碩士研究生,研究方向?yàn)樾盘?hào)與信息處理。
黃發(fā)忠,男,山東濟(jì)南,副教授,研究方向?yàn)樾盘?hào)與信息處理。
辛化梅,女,山東青島,博士,副教授,研究方向?yàn)樾盘?hào)與信息處理。