国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

凝膠微球芯片實驗數(shù)據(jù)分析方法的設計與應用

2010-09-11 01:46:30成黃歡孫嘯周國華
中國生物醫(yī)學工程學報 2010年4期
關鍵詞:微球灰度計數(shù)

李 成黃 歡孫 嘯周國華

1)(生物電子學國家重點實驗室 東南大學生物醫(yī)學工程學院,南京 210096)2)(華東生物醫(yī)學技術研究所,南京 210002)

凝膠微球芯片實驗數(shù)據(jù)分析方法的設計與應用

李 成1,2黃 歡2孫 嘯1*周國華2

1)(生物電子學國家重點實驗室 東南大學生物醫(yī)學工程學院,南京 210096)2)(華東生物醫(yī)學技術研究所,南京 210002)

在一種使用凝膠微球芯片新技術進行基因突變分析的生物學方法中,芯片上紅綠兩種顏色微球個數(shù)的比例代表了正?;蚺c突變基因的比例。針對微球芯片掃描的圖像,發(fā)展一種新的方法對圖像進行處理和分析,自動識別不同顏色的微球,得到分別代表野生型和突變型的紅色微球和綠色微球的各自個數(shù),并開發(fā)了相應軟件。取單色通道,然后灰度化,使用迭代法和大津法進行二值化的閾值選取,再用中值濾波算法進行噪聲雜點消除,最后進行信號點識別及計數(shù)。通過對掃描圖像的人工計數(shù)和軟件計數(shù)結果的對比,新的方法相對于人工計數(shù)結果的偏差率小于10%。實踐表明,新方法在處理和分析微球芯片圖像時,目標識別結果達到要求,相應軟件已在大腸癌早期診斷的生物學研究中應用,提高了分析效率。

圖像分析;微球芯片;圖像識別

Abstract:In hydrogel bead-array to analyze gene mutation,the proportion of red beads’number to green beads’represents the proportion of mutant genes to wild type genes.Based on the scanning images of a bead array,we developed a new analyzing method to recognize different color beads and count out the number of these beads representing different genes automatically.A corresponding software was also developed to improve the counting efficiency.A single color channel was selected first.Then the color image was transferred into gray one.The iterative and Otsu algorithms were used to calculate the threshold value which was used in binaryzation.Then median filtering was used to get rid of noises.Finally signal points were recognized and numbers were counted automatically.The deviation rate of the automatic results to manual counting results could be controlled less than 10% based on the result comparison of the software and manual work.The recognizing and counting results obtained by the proposed method meet the requirement.The software has been applied in early diagnosis of colon cancer.

Key words:image analysis;bead-array;image identification

引言

近年來,從基因突變角度進行疾病的早期診斷,正成為一個研究熱點。然而,由于在癌癥早期階段,突變的基因豐度遠低于正常的野生型基因豐度,給癌癥的早期診斷帶來了一定的難度[1]。到現(xiàn)在為止,已經(jīng)有一些針對基因突變的檢測手段,如DNA測序、數(shù)字化PCR等方法,但都存在一定的局限。例如:DNA測序不適用于突變量小于20%的突變樣本的檢測[2],靈敏度不高;數(shù)字化 PCR法則通過將DNA模板稀釋分配到小孔中進行擴增[3-4],而每個小孔最多只能擴增一分子野生型或突變型基因,小孔數(shù)目的有限性局限了這種方法的靈敏度。如今,一種改進的微乳液 PCR法[5]得到應用,由于這種方法在油包水的微孔中進行單分子擴增,避免了小孔數(shù)量引起的局限性,從而大大提高了檢測的靈敏度。但是,這種方法要用到流式細胞儀去獲得檢測結果,因而成本非常昂貴。最近,筆者采用了一種新的微乳液PCR和水凝膠微球芯片技術進行相關基因表達量分析的實驗方法[6],這種方法結合了微乳液PCR方法,保證了檢測的高靈敏度,同時又通過微球芯片技術,避免使用流式細胞儀分析結果,大大降低了成本。這種新的實驗方法對于組織樣本中的微量突變響應非常靈敏,同時成本很低,從而為癌癥早期診斷的普及提供了一種可能。

這種方法的大概步驟為:首先,采用微球介導的微乳液克隆擴增技術,對樣本進行擴增,最終實現(xiàn)在每個微囊中僅包含有一分子模板和一個微球,達到單分子擴增;接著,收集微球,并用水凝膠固定在玻璃芯片上,再通過蓋玻片的壓力,使微球均勻地平鋪在芯片表面,制成單層微球芯片;然后,加入分別與野生型和突變型擴增產(chǎn)物特異性互補的熒光探針進行雜交;最后,掃描成像。

在掃描的微球芯片圖像中,包括紅綠兩種顏色的點,分別代表結合有野生型和突變型DNA片段的微球,紅點和綠點的比例就代表了野生型和突變型基因的比例,圖像中這些代表微球的點統(tǒng)稱為信號點。本研究的目的即通過圖像處理的各種算法,自動識別圖中紅綠兩種顏色的微球,并分別計數(shù)。計數(shù)前先要進行必要的預處理,圖1就是經(jīng)過圖像預處理后僅顯示單色信號點的灰度圖。從中可見,凝膠固定的微球隨機分布,大部分代表微球的信號點孤立且邊緣清晰可見,這部分的微球識別較為容易。但是還有相當數(shù)目的微球并沒有如實驗所設想的成為完全的單層微球,而是出現(xiàn)部分疊加,有些甚至疊加成團,導致圖像上的信號點出現(xiàn)粘連,這部分微球的識別和計數(shù)就成為需要主要解決的問題。另外,實驗中選用的是直徑為34 μm的瓊脂糖微球作為引物結合載體,但由于實驗過程中不可避免的誤差,導致圖像上代表微球的信號點大小不一。圖像上還可以看到一些雜點或干擾條紋,由實驗過程中不可避免的因素造成。所以,在圖像識別和計數(shù)過程中,也應盡量去除這部分干擾。

圖1 凝膠微球芯片的單色灰度圖像Fig.1 Single-color grayscale image of a hydrogel beads array

1 方法設計

根據(jù)以上分析的實驗圖像特點,分預處理和目標識別兩個模塊進行圖像處理,流程如圖2所示。

圖2 方法流程Fig.2 Flowchart of the method

1.1 預處理

1.1.1 顏色通道選擇

因為圖像上信號點主要有紅色和綠色,為避免相互影響,應分別計數(shù),先使圖像呈單色顯示。分析實驗圖像,為熒光掃描儀掃描后輸出的24位的bmp格式,紅、綠、藍三種顏色通道各占8位,色階值范圍0~255。所以,若要單色顯示,只要使另外兩種顏色通道的色階值為0即可。

1.1.2 灰度化

圖像上主要分背景和信號點,預處理的目的是提取信號點并剔除噪聲,轉(zhuǎn)化為二值圖像。在二值化以前,需要分析圖像單色通道的色階值分布特征,故先轉(zhuǎn)化為灰度圖,為下一步二值化的分析做好準備。將圖像中的紅、綠、藍各色階值統(tǒng)一用之前單色通道的色階值代替,即可轉(zhuǎn)化為灰度圖。

1.1.3 二值化

將圖像上的灰度值置為0或255,這樣以后的圖像不再涉及像素的多級值,使處理變得簡單,而且數(shù)據(jù)的處理和壓縮量較小。這里,把背景設為255(白色),而信號點的值設為0(黑色),并采用閾值分割,所有灰度大于或等于閾值的像素被判定為背景,其余像素為信號點內(nèi)的有效像素。該方法的設計難點在于如何進行粘連信號點的分割,而閾值選擇的恰當與否對分割的效果起著決定性的作用。筆者參考了一些常見的閾值分割算法,如雙峰法、迭代法、大津法[7],根據(jù)圖像特征,選擇迭代法和大津法分別進行分割閾值的計算,并繪出了圖像的灰度直方圖,最終由用戶在參考多種算法結果的基礎上決定分割閾值。

1)迭代法選擇閾值是基于逼近的思想,其實現(xiàn)步驟如下。

步驟1:求出圖像的最大灰度值和最小灰度值,記為Zmax和 Zmin,令初始閾值為

步驟2:根據(jù)閾值Tk將圖像像素分為第1族和第2族,分別求出兩者的平均灰度值Z1和Z2。

步驟3:求出新閾值Tk+1=(Z1+Z2)/2。

步驟4:若指定一個極小值ε,有|Tk+1-Tk|<ε,若逼近之值基本滿足要求,則Tk+1即為最后的迭代結果,否則令Tk=Tk+1,重新執(zhí)行上面的計算過程,直到|Tk+1-Tk|<ε。

2)大津法屬于最大類間方差法,是自適應計算單閾值的簡單、高效算法。其原理是對目標灰度圖像的直方圖進行分析,把閾值作為分界線將直方圖分成兩個部分,并從小到大不斷移動,每次移動后就比較新分割的兩部分到分界線的距離,當閾值使分界線在兩部分之間的距離最大時,此時的閾值即所求閾值。對一幅灰度圖用公式來表達,設t為分割閾值,前景點數(shù)占圖像總像素的比例為w0,平均灰度為u0,背景點數(shù)為w1,平均灰度為u1。圖像的總平均灰度為

從最小灰度值到最大灰度值遍歷t,當t使函數(shù)G=w0(u0-u)2+w1(u1-u)2的值最大時,t即為分割的最佳閾值。

1.1.4 中值濾波

該算法是基于排序統(tǒng)計理論的一種能有效抑制噪聲的非線性信號處理技術,基本原理是把數(shù)字圖像或數(shù)字序列中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍的像素值接近真實值,從而消除孤立的噪聲點。在本軟件中,將窗口大小設為3像素×3像素,進行逐個像素掃描,當前像素點的值則被以其為中心的9個像素點的中間值取代,從而一些獨立的噪聲點被去除,而有效信號點的邊緣被保護。

1.2 信號點識別

完成預處理后,下面就開始識別信號點。如果信號點是一個個分開的無粘連連通域,對每個信號點內(nèi)的像素遞歸尋找鄰接的有信號值的像素,通過分析遞歸返回的變量,就可得到微球的個數(shù)和面積。但實際圖像中的部分信號點是粘連在一起的,用上述方法無法準確統(tǒng)計個數(shù)。分析圖像特征,由于選取的都是直徑34 μm的微球,所以信號點大小比較均勻,使用一定大小的圓點標識信號點,進而轉(zhuǎn)化為求圓點的個數(shù),分割結果較好。

1.2.1 小面積區(qū)域標識

由于同一次實驗選取的微球大小基本一致,在預處理過程中加入了統(tǒng)計分析功能,對所有的單連通區(qū)域求取平均面積供用戶參考,再由用戶確定一個面積參數(shù),對像素數(shù)目小于此參數(shù)的單連通域都標識為單個微球,認為是一個獨立且有效的信號點。

1.2.2 粘連微球中心定位

假設微球在圖像中的形狀都近似圓形,由于與熒光染料特異性結合的DNA片段在微球上的擴增一般都假設均勻,所以反映在平面圖像上,越中心的位置染料聚集密度越高,從而信號強度應當越高。據(jù)此分析,同樣建立了一個3像素×3像素的窗口進行逐個像素掃描,并挑選連通區(qū)域內(nèi)信號值最高的像素點為中心點,循環(huán)找到信號值最高的像素,即認為是信號點的擬定中心。之后再使用圓形與當前連通區(qū)域進行形狀匹配,不斷微調(diào)圓心位置,直到匹配程度最高。

1.2.3 信號點標識

在假定的信號點中心處嘗試繪制標識圓,且要滿足兩個判斷條件:一是在所要繪制的標識圓區(qū)域內(nèi),均有信號值;二是對當前信號點區(qū)域繪制標識圓時,不與任意先前的標識圓發(fā)生粘連。這樣繪制的每一個標識圓將代表一個有效的信號點,且將圖像上粘連的信號點數(shù)目轉(zhuǎn)化為無粘連的標識圓的數(shù)目。圖3為圖1中信號點的識別結果,其中空心黑圈代表識別出的標識圓邊緣??梢钥吹?,有效信號點幾乎全部成功識別,且標識圓完全沒有疊加,進而可以實現(xiàn)準確計數(shù)。

圖3 信號點的識別結果Fig.3 The recognizing result of signal spots in the example image

1.2.4 標識圓計數(shù)

使用成熟的單連通域遞歸算法,即可完成計數(shù)任務。當逐行掃到有信號的像素時,開始8個方向的遞歸尋找,只要和此像素連通的其他信號像素均在輔助矩陣中進行標注。下面繼續(xù)掃描信號像素點進行計數(shù)時,就不會將之前標注過的像素點計算在內(nèi),從而實現(xiàn)了標識圓的準確計數(shù)。

圖3中標識符的自動計數(shù)結果為947,而對原圖的人工計數(shù)結果為955。經(jīng)過實驗人員的驗證,這兩種方法所產(chǎn)生的結果差異是滿足實驗分析要求的。

1.2.5 信號點識別結果修正

由于微球的大小并不完全一樣,而且實驗過程中可能發(fā)生各種操作誤差、熒光染料雜交、信號點粘連等情況,上面的算法識別結果不一定完全正確,因而適當?shù)娜斯ぽo助識別修正是必要的。一些被錯誤繪制的標識符應當可以被操作者去除,而另一些沒有被成功識別的信號點可以被操作者增繪標識符。如果操作人員要得到更準確的結果,可以修正后重新進行計數(shù)。

2 應用結果

采用水凝膠微球芯片技術,進行了糞便脫落細胞中大腸癌相關基因表達量檢測的研究。大腸癌是最常見的消化道惡性腫瘤,篩查是早期發(fā)現(xiàn)大腸癌和提高大腸癌患者生存率的關鍵。目前用于普查篩選方法主要是結腸鏡和大便隱血試驗,而這兩種方法對大腸癌的早期診斷均不十分理想;如今國際上糞便脫落細胞的檢測為一種無創(chuàng)性檢查,對大腸癌的診斷具有重要意義。筆者采用基于微球的微乳液“克隆”PCR法,同時擴增待測大腸癌相關基因COX2(或c-myc)的cDNA和一個看家基因betaactin的cDNA,并通過雙色熒光技術,分別為擴增后的微球標記上紅色或綠色,用以標識微球上被擴增的是待測癌癥基因還是看家基因;再用水凝膠法,將這些克隆PCR產(chǎn)物(即表面包埋有DNA分子的微球)制備成微球芯片。由于看家基因beta-actin的表達量基本不變,故紅色和綠色微球個數(shù)的比例高低表示待測基因的相對表達量,從而實現(xiàn)了一種新的大腸癌早期診斷的實驗方法。這種方法產(chǎn)生了大量的結果圖像,用人工進行計數(shù)顯然不可能。所以,為了驗證自動計數(shù)方法的實用性,從上述研究中挑選了10幅圖像進行人工計數(shù)和自動計數(shù)的對比。本研究認為,經(jīng)過人工識別修正后的再次計數(shù)為人工計數(shù)結果,且認為是準確結果,設為M;而原圖不經(jīng)修正的第一次自動識別結果可認為是自動計數(shù)結果,設為A。自動計數(shù)相對于人工計數(shù)的偏差率W為

同時,也計算了平均偏差率,有

具體結果見表1。

對10幅典型圖像的計數(shù)結果的平均偏差率為3.94%。觀察對比結果,第2組綠球(12.5%)和第4組綠球(20.7%)識別的偏差率較大。

3 討論

3.1 關于偏差率大的原因

表1 人工和自動計數(shù)結果對比Tab.1 Comparison of manual and auto-counting results

對于第二組綠球和第四組綠球識別的偏差率較大的情況,主要是因為相應的掃描圖像中出現(xiàn)了與其他圖像相比比例較高的混色球。所謂混色球,是指實驗時同一個微球上同時擴增了正常和突變的基因片段,沒能達到真正的單分子擴增,導致兩種顏色的熒光探針同時發(fā)光,人工識別時就出現(xiàn)漏查。在這種情況下,自動計數(shù)在計數(shù)綠球時將混色球計入的選擇應當認為是正確的。通過圖4中的示意,對第4組數(shù)據(jù)進行具體的原因分析。觀察圖4(b)中綠球的識別后圖,右上角3個箭頭所指的微球成功識別,但在原圖中觀察,對應微球均為混色球,并且由于紅色強度較高,掩蓋了較弱的綠色,導致人工識別時漏查3個綠球;同時,灰度圖中左下方箭頭所指的綠球發(fā)光面積較大,造成識別圖中多標識了兩個信號點,因而多查了2個綠球另外,而發(fā)光面積與實驗所選微球是否大小不均、微球雜交受污染程度都會影響偏差率。由于此圖本身的綠球數(shù)目比較少,所以偏差率超過了20%,大大超過了平均偏差率。

圖4 較大差異結果組對應圖像。(a)綠球?qū)叶葓D;(b)識別后圖Fig.4 Corresponding imagesofthedatasetwith comparatively big difference.(a)Corresponding grayscale image of green beads;(b)Image after recognizing

通過對其他各組數(shù)據(jù)的分析,偏差也大都與實驗圖像的質(zhì)量相關,表明實驗過程及掃描所成圖像的質(zhì)量是本方法能夠正確應用的基礎。另外,當實驗中每次采用的微球大小不均導致圖像中信號點大小不一時,面積較大的信號點內(nèi)有可能滿足同時繪制兩個標識圓的條件,導致多查;面積較小的信號點又有可能滿足不了半徑確定的標識圓的繪制條件(即繪制范圍內(nèi)都有信號值,同時又不能與其他標識圓發(fā)生粘連),導致漏查。還有其他一些因素,如熒光染色不均勻、一個微球雜合了兩種顏色的熒光染料、信號點粘連程度較深等,都會對自動計數(shù)方法的偏差率產(chǎn)生影響。但正如10組對比數(shù)據(jù)和圖2的識別結果所示,其中占大多數(shù)的孤立信號點都可以準確識別,而數(shù)量其次的粘連程度不深的信號點群的識別效果也較好,只有極少數(shù)的粘連程度較深的信號點識別有誤,因而所建立的自動計數(shù)方法的結果已經(jīng)比較準確,可滿足實驗過程無大差錯、掃描圖像質(zhì)量較好的結果分析要求。

另外,根據(jù)基因COX-2的表達量進行大腸癌早期診斷,有一個相對于看家基因比例的判斷閾值,若COX-2基因與看家基因的表達量比例在此閾值上下10%的范圍內(nèi),都建議去做更精準的醫(yī)學檢驗。在本方法中,計數(shù)的平均偏差率達到3.94%,因而在凝膠微球芯片用于大腸癌早期診斷的臨床應用中,需要擴大要求進行醫(yī)學檢驗的范圍,即兩者表達量的比例在閾值上下15%的范圍建議進行進一步的醫(yī)學檢驗,這樣即可滿足初步篩查的要求。

3.2 關于閾值分割算法

由于閾值選擇的適當與否對分割效果起到?jīng)Q定性作用,所以這里對迭代法和大津法這兩種閾值分割算法進行專門討論。迭代法所得閾值對圖像的分割效果較好,能夠區(qū)分出圖像的前景和背景的主要區(qū)域,但對圖像的細微區(qū)域區(qū)分度不高;而大津法適應性強,對圖像的分割質(zhì)量具有一定保障,是一種穩(wěn)定和通用的閾值分割算法,但在兩群物體的灰度差不明顯的情況下,會丟失圖像的一些整體信息[7]。為了驗證兩種方法對計數(shù)結果的影響,針對上面的10幅例圖,對比了兩種方法分割后的計數(shù)結果,如表2所示。

表2 迭代法和大津法計算閾值分割結果對比Tab.2 Comparison of segmentation results based on threshold values calculated by iterative and Otsu algorithms

分析上面的結果對比,可知這兩種閾值分割算法的應用主要有兩種情況。

1)在質(zhì)量較好的圖像中,由于目標和背景區(qū)別顯著,所以兩種算法分割后的計數(shù)結果差別不大。即使兩種算法計算的閾值差別較大,計數(shù)結果仍然相近,如2組綠球、3組紅球、3組綠球、5組紅球等。在這種情況下,兩種閾值分割算法的效果都滿足要求。

2)對于目標和背景差別不大的圖像,兩種算法分割后計數(shù)的結果差別比較大。即使兩者計算的閾值相近,但由于部分信號點強度低于計算的閾值,導致部分信號點丟失,計數(shù)結果偏低,如1組綠球、6組紅球、8組紅球、9組紅球等。在這種情況下,大津法則體現(xiàn)了其優(yōu)勢,計算的閾值能夠分割出更多的有效信號點,從而更加接近真實值。

分析質(zhì)量較好的圖像時,兩種閾值分割算法的效果都較好,區(qū)別不大;而分析質(zhì)量較差、目標和背景區(qū)別不大的圖像時,大津法的分割效果更好。

4 結論

針對凝膠微球芯片圖像,本研究提出了一種實用且高效的微球自動計數(shù)方法。此方法執(zhí)行速度快,智能化程度高,大大提高了微球計數(shù)的效率,并已成功用于利用凝膠微球芯片進行大腸癌相關基因表達量的研究中,為微球芯片圖像分析提供了一種新的思路。

[1]Lleonart ME,Cajal SR,Groopman JD,et al.Sensitive and specific Detection of K-ras mutations in colon tumors by short oligonucleotide mass analysis [J].Nucleic Acids Res,2004,32:e53.

[2]Bar-Eli M,Ahuja H,Gonzalez-Cadavid N,et al.Analysis of NRAS exon-1 mutations in myelodysplastic syndromes by polymerase chain reaction and direct sequencing[J].Blood,1989,73,281-283.

[3]Seung MD,Giovanni T,Constance J,et al.Detecting colorectal cancer in stool with the use of multiple genetic targets[J].Cancer Inst,2001,93,858-865.

[4]Vogelstein B,Kinzler KW.Digital PCR[J].Proc Natl Acad Sci USA,1999,96:9236-9241.

[5]Margulies M,Egholm M,Altman W,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437,376-380.

[6]Huang Huan,Qi Zongtai,Deng Lili,et al.Highly sensitive mutation detection based on digital amplification coupled with hydrogel bead-array[J].Chem Commun(Camb),2009,4094-4096.

[7]蔣先剛.數(shù)字圖像處理工程軟件設計[M].北京:中國水利水電出版社,2006.

Design and Application of the Method for Analyzing Experimental Data from Hydrogel Bead-Array

LI Cheng1,2HUANG Huan2SUN Xiao1*ZHOU Guohua2
1(State Key Laboratory of Bioelectronics,Southeast University,Nanjing 210096,China)2(Huadong Research Institute for Medicine and Biotechnics,Nanjing 210002,China)

R318

A

0258-8021(2010)04-0492-06

10.3969/j.issn.0258-8021.2010.04.003

2010-03-01,

2010-04-23

國家自然科學基金資助項目(30470454);南京科學技術發(fā)展項目支持(200801087)

*通訊作者。 E-mail:xsun@seu.edu.cn

猜你喜歡
微球灰度計數(shù)
采用改進導重法的拓撲結構灰度單元過濾技術
古人計數(shù)
基于灰度拉伸的圖像水位識別方法研究
高技術通訊(2021年3期)2021-06-09 06:57:48
遞歸計數(shù)的六種方式
懸浮聚合法制備窄尺寸分布聚甲基丙烯酸甲酯高分子微球
古代的計數(shù)方法
這樣“計數(shù)”不惱人
基于最大加權投影求解的彩色圖像灰度化對比度保留算法
自動化學報(2017年5期)2017-05-14 06:20:56
基于灰度線性建模的亞像素圖像抖動量計算
TiO2/PPy復合導電微球的制備
平阴县| 沁源县| 广水市| 泸州市| 湖州市| 朝阳区| 周至县| 青浦区| 易门县| 柘荣县| 五华县| 伊宁县| 含山县| 醴陵市| 陇川县| 中超| 新竹市| 满城县| 曲沃县| 扎兰屯市| 富锦市| 平山县| 黄龙县| 连平县| 依安县| 南涧| 隆安县| 新巴尔虎右旗| 娄烦县| 荥阳市| 宜州市| 巴林左旗| 醴陵市| 陇西县| 通河县| 博野县| 高青县| 内乡县| 乐安县| 叙永县| 沂水县|