余肖翰,曾松福,曹宇峰,陳 瑤,謝杰鎮(zhèn),鄭少平
(1.國(guó)家海洋局 廈門海洋環(huán)境監(jiān)測(cè)中心站,福建 廈門361008;2.廈門大學(xué) 信息科學(xué)與技術(shù)學(xué)院,福建 廈門361005)
赤潮是在特定的環(huán)境條件下,海水中某些浮游植物、原生動(dòng)物或細(xì)菌爆發(fā)性增殖或高度聚集而引起水體變色的一種有害生態(tài)現(xiàn)象。近年來(lái),隨著經(jīng)濟(jì)和社會(huì)的發(fā)展,我國(guó)沿海地區(qū)赤潮爆發(fā)的頻率和規(guī)模都在增加。赤潮已經(jīng)成為制約我國(guó)沿海經(jīng)濟(jì)可持續(xù)發(fā)展的一個(gè)重要因素,引起了政府和社會(huì)各界的廣泛關(guān)注[1-2]。如何準(zhǔn)確地進(jìn)行赤潮的監(jiān)測(cè),采取有效的防治措施,減少赤潮造成的危害和損失,已經(jīng)成為海洋環(huán)保部門的當(dāng)務(wù)之急,而這些都離不開(kāi)對(duì)浮游生物的鑒定。
流式細(xì)胞攝像系統(tǒng)(Flow Cytometer And Microscope,F(xiàn)low CAM)技術(shù)是將流式細(xì)胞分析技術(shù)與顯微成像技術(shù)相結(jié)合的新興技術(shù),它可以在分析流體的同時(shí)高分辨率地實(shí)時(shí)顯示和存儲(chǔ)每個(gè)微粒的數(shù)字彩色圖像,通過(guò)專業(yè)軟件分析、篩選、分類、查看相關(guān)信息,快速分辨出水樣中藻類,直觀地看到結(jié)果。其高效率、高靈敏度、高分辨率和高精度等特點(diǎn),使得試驗(yàn)人員可以對(duì)赤潮生物細(xì)胞進(jìn)行同步、迅速并且多參數(shù)的定量和定性分析,這對(duì)赤潮生物鑒定、浮游生物多樣性的研究有著重要意義。
本文章采用流式細(xì)胞攝像系統(tǒng)技術(shù)采集赤潮藻類樣本,構(gòu)建福建南部海域的赤潮生物圖譜數(shù)據(jù)庫(kù),在該圖譜數(shù)據(jù)庫(kù)的基礎(chǔ)上,使用VisualSpread軟件自動(dòng)識(shí)別法對(duì)赤潮藻類樣品進(jìn)行鑒定;此外還采用另一種分析方式即通過(guò)Matlab開(kāi)發(fā)的運(yùn)算描述子來(lái)對(duì)樣品進(jìn)行二次分析歸類,并對(duì)兩種方法的識(shí)別精確度進(jìn)行比較。
Flow CAM流式細(xì)胞攝像系統(tǒng)是一套將流式細(xì)胞儀和顯微鏡的功能以及成像和熒光技術(shù)結(jié)合到一起的新型的數(shù)字式流式細(xì)胞分析系統(tǒng),由三個(gè)子系統(tǒng)構(gòu)成:流控系統(tǒng),光學(xué)系統(tǒng)和電學(xué)系統(tǒng)(圖1)。
圖1 Flow CAM體系結(jié)構(gòu)示意圖Fig.1 A sketch map of Flow CAM structure
通過(guò)不斷摸索,實(shí)驗(yàn)人員總結(jié)出一套流式細(xì)胞攝像系統(tǒng)與顯微鏡鑒定比對(duì)技術(shù)路線,以此建立圖譜庫(kù)并對(duì)識(shí)別率進(jìn)行計(jì)算分析(圖2)。
圖2 FlowCAM技術(shù)路線圖Fig.2 Technology Scheme of the FlowCAM
Flow CAM配置多個(gè)放大倍數(shù)的顯微物鏡,根據(jù)分析顆粒物的大小范圍,針對(duì)性選擇安裝其中某一個(gè),并使用與所安裝的物鏡相對(duì)應(yīng)的VisualSpreadsheet采集軟件(表1)。
表1 顯微物鏡和流通池的配對(duì)Table 1 Matching between microobjective and flow cell
采集模式使用自動(dòng)拍攝模式見(jiàn)圖3。
圖3 自動(dòng)拍攝模式示意圖Fig.3 Automatically shooting mode
濃度與顆粒采集計(jì)算式為
式中,M為粒子濃度;C為顆粒數(shù);R為圖像采集率;E為結(jié)束時(shí)間;S為開(kāi)始時(shí)間;F為刻度像素;D為寬度。
實(shí)驗(yàn)組采用課題研究與其它監(jiān)測(cè)任務(wù)相結(jié)合的方式,采集海洋浮游植物網(wǎng)樣與水樣用于圖譜庫(kù)的分析和建立。未爆發(fā)赤潮時(shí)則通過(guò)分析其它監(jiān)測(cè)任務(wù)所采集的樣品進(jìn)行圖片收集工作;赤潮爆發(fā)時(shí)則迅速派專人到現(xiàn)場(chǎng)采集樣品進(jìn)行分析;赤潮已消退較快而無(wú)法派專人現(xiàn)場(chǎng)采集的,則通過(guò)福建省其他相關(guān)海洋部門收集樣品。
以2010-06-14日深滬灣爆發(fā)的米氏凱倫藻赤潮樣品測(cè)試為例,當(dāng)采用100μm孔徑的篩絹過(guò)濾樣品所獲得濾液,選擇100μm流通池和20倍顯微物鏡,打開(kāi)相應(yīng)倍數(shù)的軟件并設(shè)置,進(jìn)行圖片采集(圖4)。具體實(shí)驗(yàn)過(guò)程中針對(duì)不同水樣采用了50,100,150,200,250,300和600μm等各種孔徑的篩絹過(guò)濾后的濾液進(jìn)行分批次鑒別。
圖4 TIF拼圖文件Fig.4 TIF puzzle file
使用VisualSpread將采集的藻類進(jìn)行排列,并在拼圖頁(yè)內(nèi)顯示,將選取圖片歸到Libraries(庫(kù)文件)中。
實(shí)驗(yàn)人員選擇默認(rèn)參數(shù)作為篩選變量,其中主要關(guān)注ESD、PPC、Aspect Rtio等重要參數(shù),需進(jìn)行進(jìn)一步詳細(xì)設(shè)置(圖5)。
圖5 篩選參數(shù)設(shè)置Fig.5 Settings of screening parameters
根據(jù)本次發(fā)生赤潮的米氏凱倫藻進(jìn)行篩選,建立米氏凱倫藻庫(kù)文件存入圖譜數(shù)據(jù)庫(kù)中(圖6)。
圖6 藻類入庫(kù)截圖Fig.6 Storing screenshots of algae
使用Matlab2009對(duì)數(shù)據(jù)的多重處理進(jìn)行進(jìn)一步的深入開(kāi)發(fā),通過(guò)對(duì)藻類樣本圖像的特征提取并結(jié)合SVM算法作分類計(jì)算[3-7]。
本研究不對(duì)圖像預(yù)處理(如灰度處理、圖像去噪、平滑與銳化的濾波、膨脹與腐蝕等)進(jìn)行贅述,直接采用處理后的切割圖片進(jìn)行特征分析識(shí)別。
使用不變矩特征采用Hu[8]構(gòu)造7個(gè)經(jīng)典的不變矩,特征的維數(shù)為7維。
使用傅里葉描述子進(jìn)行輪廓特征提取,特征的維數(shù)為64。
使用形態(tài)譜算法形態(tài)譜提供了40個(gè)形態(tài)特征[9]。
7個(gè)自定義的形態(tài)特征:包括細(xì)胞圖像的長(zhǎng)軸長(zhǎng)度(Major AxisLength)、短軸長(zhǎng)度(Minor Axis Length)、周長(zhǎng)(Perimeter)、面積(Area)、伸長(zhǎng)度(Major Axis Length/Minor Axis Length)、矩形度(Area/(Major Axis-Length×Minor AxisLength))和圓度(4×Pi×Area/Perimeter2)[10]。
1)通過(guò)流式細(xì)胞攝像系統(tǒng)采集了各種藻類照片5 000余張。目前為止,收集到的可以建庫(kù)的福建南部典型的赤潮種類共計(jì)15種,如中肋骨條藻、夜光藻、東海原甲藻、米氏凱倫藻、血紅哈卡藻(又名血紅阿卡藻,紅色赤潮藻[11])和多紋膝溝藻等(圖7)。
2)對(duì)這6種福建南部典型赤潮藻類的1 500個(gè)樣本進(jìn)行特征提取,得到118維的組合特征向量。由于不同的特征提取算法,得到的特征向量長(zhǎng)度差異較大,實(shí)驗(yàn)組又通過(guò)歸一化多級(jí)主特征向量評(píng)估準(zhǔn)則進(jìn)行特征降維(圖8)。
圖7 6種福建南部海域典型赤潮種類Fig.7 Six typical species of red tide algae in the sea area south of Fujian
圖8 歸一化多級(jí)主特征向量評(píng)估示意圖Fig.8 A sketch map of normalized multi-level main eigenvector assess
各特征向量降維前后的長(zhǎng)度變化情況見(jiàn)表2:
表2 降維處理后各特征向量維數(shù)變化表Table 2 Changes in dimensions of eigenvectors after dimensionality reduction
支持向量機(jī)(SVM)是從線性可分情況下的最優(yōu)分類發(fā)展而來(lái),其基本原理可以用二維線性可分的分類問(wèn)題進(jìn)行解釋。如圖9所示,實(shí)心點(diǎn)和空心點(diǎn)代表兩類樣本,H為分類線,H1、H2分別為經(jīng)過(guò)各類中離分類線最近的樣本點(diǎn)且平行于分類線的直線,它們之間的距離叫做分類間隔。所謂最優(yōu)分類線就是要求分類線不但能將兩類正確分開(kāi),而且使分類間隔最大[12]。
圖9 二維線性可分情況下的最優(yōu)分類線Fig.9 The optimal classification line under the two-dimensional linear separable case
構(gòu)造方式采取一對(duì)一方式,共訓(xùn)練了6個(gè)SVM二值子分類器,所取得函數(shù)都是徑向基(RBF)函數(shù)見(jiàn)式(2):
KNN算法中k取值為10,ε取值為0.75,r為SVM的參數(shù)g,c為懲罰系數(shù)。
以徑向基(RBF)為核函數(shù)的支持向量機(jī)作為識(shí)別器,參數(shù)C、γ采用上面介紹的網(wǎng)格搜索方法確定,分別取C=0.5,γ=0.062 5對(duì)6種藻類進(jìn)行分類識(shí)別實(shí)驗(yàn)。
VisualSpreadsheet是FlowCAM配套的一套專業(yè)控制工作和分析顆粒物的軟件,從1999年問(wèn)世至今不斷完善著各類自定義粒子成像。由于本課題是使用VisualSpreadsheet本身作為圖譜數(shù)據(jù)庫(kù)的采集、編輯、建庫(kù)工具,因此圖譜數(shù)據(jù)庫(kù)中已入庫(kù)的1 500個(gè)樣本不能直接作為比對(duì)標(biāo)準(zhǔn)。而在比對(duì)過(guò)程中,只能使用已有水樣并從中取1 500個(gè)清晰圖片樣本進(jìn)行分析,其中不可避免因?yàn)槿霂?kù)樣本與測(cè)試水樣中藻類顆粒的相似度較高,造成VisualSpreadsheet結(jié)果表現(xiàn)較好(表3)。
表3 VisualSpreadsheet實(shí)驗(yàn)精度表Table 3 Experimental accuracy of VisualSpreadsheet
另外值得注意的是,F(xiàn)low CAM系統(tǒng)采用的是多光學(xué)鏡頭配合相應(yīng)流通池進(jìn)行圖片采集,因此實(shí)驗(yàn)過(guò)程中僅采取單一物鏡取得的數(shù)據(jù)進(jìn)行識(shí)別分析,避免了因不同物鏡造成的同類藻形狀分辨率大小差異帶來(lái)的誤差。
實(shí)驗(yàn)過(guò)程中,對(duì)每個(gè)樣本用3種算法從不同的角度描述形狀特征,得到的特征向量之間可能存在信息冗余。但之所以使用3種方法更重要目的是將特征向量間的信息缺陷進(jìn)行互補(bǔ)磨平。
通過(guò)混淆矩陣可以得到如下精度表(表4):
表4 描述子與SVM分類器實(shí)驗(yàn)精度表Table 4 Experimental accuracy of descriptor and SVM
通過(guò)已建立的赤潮藻類圖譜數(shù)據(jù)庫(kù),對(duì)福建南部海域4個(gè)站位的浮游植物網(wǎng)樣進(jìn)行篩選歸類,每個(gè)樣品選擇300個(gè)清晰圖片樣本進(jìn)行分析(不到300個(gè)樣本數(shù)則全選)。得出識(shí)別精度結(jié)果如表5所示,可看出特征形態(tài)明顯的藻類識(shí)別精度較高,反之較低。
表5 圖譜庫(kù)識(shí)別精度表Table 5 Accuracy of Library Recognition
選取2個(gè)福建南部海域站位的浮游植物網(wǎng)樣,每個(gè)樣品分別測(cè)試3次,用圖譜庫(kù)對(duì)幾種相應(yīng)的浮游植物優(yōu)勢(shì)種進(jìn)行篩選歸類輸出圖譜庫(kù)篩選結(jié)果,與相應(yīng)的顯微鏡結(jié)果進(jìn)行比對(duì)(表6)。
圖譜庫(kù)篩選結(jié)果與顯微鏡結(jié)果的比值變化范圍在32.2%~96.2%之間,可見(jiàn)采用流式細(xì)胞攝像系統(tǒng)在計(jì)數(shù)方面存在較大瓶頸,對(duì)浮游植物樣品進(jìn)行篩選以計(jì)算其密度還需要進(jìn)一步的優(yōu)化和改進(jìn)。
表6 圖譜庫(kù)篩選結(jié)果與顯微鏡結(jié)果比對(duì)Table 6 Comparison of Library and Microscopy
1)本項(xiàng)目利用流式細(xì)胞攝像系統(tǒng),初步建立了一種能快速檢測(cè)和鑒定赤潮生物及其他浮游植物種類的方法,經(jīng)文獻(xiàn)資料與實(shí)驗(yàn)收集建立了福建南部海域赤潮生物檔案。
使用新建立的檢測(cè)方法及構(gòu)建的福建南部海域赤潮生物圖譜數(shù)據(jù)庫(kù),能達(dá)到快速鑒定的典型赤潮生物至少5種,常見(jiàn)赤潮生物10種,其他浮游植物9種,合計(jì)24種基本涵蓋了福建歷史上爆發(fā)過(guò)的赤潮藻類和常規(guī)監(jiān)測(cè)中容易產(chǎn)生優(yōu)勢(shì)種的藻類。
這種新的檢測(cè)方法可以作為福建南部海域赤潮生物鑒定的輔助手段,可在一定程度上減少傳統(tǒng)顯微鏡檢的工作量,并能對(duì)所得數(shù)據(jù)加以分析和總結(jié),有助于提高赤潮應(yīng)急工作效率,對(duì)福建南部海域赤潮災(zāi)害應(yīng)急監(jiān)測(cè)與預(yù)警預(yù)報(bào)工作將起到積極的作用。
在圖片資源的基礎(chǔ)上進(jìn)一步探討了形狀特征描述子,從不同角度描述了藻類的形狀特征,為后續(xù)系統(tǒng)的擴(kuò)展算法提供另一種有效途徑。
2)對(duì)于直徑20μm以下的,和/或無(wú)法與其他藻類明顯區(qū)分開(kāi)的(如一個(gè)屬內(nèi)的圓篩藻、角毛藻等),最多只能定性到屬,而無(wú)法到種;由于同屬種類形態(tài)特征相似無(wú)法區(qū)分識(shí)別,故在福建南部海域曾發(fā)生過(guò)赤潮的種類——角毛藻屬(聚生角毛藻、柔弱角毛藻、旋鏈角毛藻等)與海鏈藻屬(諾氏海鏈藻、細(xì)弱海鏈藻等)等藻種已建庫(kù)備用,暫未投入應(yīng)用分析。
3)目前的赤潮圖譜數(shù)據(jù)庫(kù)還有待完善,截止課題完成,圖譜庫(kù)中24種藻種的有效樣本合計(jì)已達(dá)4萬(wàn)余個(gè),初步滿足赤潮藻類分析的要求。但通過(guò)流式細(xì)胞攝像技術(shù)來(lái)識(shí)別赤潮藻類只能作為輔助技術(shù),要將該技術(shù)業(yè)務(wù)化還需今后大量的分析研究:需要繼續(xù)增加藻類水樣的分析以獲得更多的圖譜豐富數(shù)據(jù)庫(kù),并在此基礎(chǔ)上廣泛全面的開(kāi)發(fā)其他的形狀特征描述子,如:Sobel算子在像素加權(quán)的特點(diǎn)、Canny算子在邊緣分割的優(yōu)勢(shì)、Laplacian算子增強(qiáng)高頻又能保持低頻不變等,這些都是很有特點(diǎn)且行之有效的圖形分析方法;而近年自主智能學(xué)習(xí)算法的實(shí)際應(yīng)用(如谷歌的虛擬腦技術(shù))更是將圖形分析上升到一個(gè)新的高度。
如何有效避免目前已有技術(shù)的局限性,尋求更全面的解決方案應(yīng)用于赤潮藻類識(shí)別分析,開(kāi)發(fā)出更準(zhǔn)確的運(yùn)算描述方法是實(shí)驗(yàn)室未來(lái)的發(fā)展方向。
致謝:本研究的完成得到導(dǎo)師及廈門大學(xué)信息與技術(shù)學(xué)院王博亮教授的指導(dǎo),并提出寶貴意見(jiàn),在此表示真摯的感謝。
:
[1] ZHAO D Z,ZHAO D L,ZHANG F S,Type of Formation,Distribution And Temporal Trend of Red Tides Occurred In The China Sea[J].Marine Environmental Science,,2003,22(3):7-11.趙冬至,趙冬玲,張豐收.我國(guó)海域赤潮災(zāi)害的類型、分布與變化趨勢(shì)[J].海洋環(huán)境科學(xué),2003,22(3):7-11.
[2] CULVERHOUSE P,WILLIAMS R,REGUERA B,et al,Expert and machine discrimination of marine flora:a comparison of recognition accuracy of field collected phytoplankton[J].IEEE International Conference on Visual Information Engineering,2003,7:177-181.
[3] LIU F,CAO G H,TANG Z M,Real-time Human's Shape Monitoring &Recognition System Using Moment Invariants[J].Computer Engineering,2002,28(9):80-83.劉菲,曹冠華,唐振民.基于不變矩的實(shí)時(shí)人形識(shí)別研究[J].計(jì)算機(jī)工程,2002,28(9):80-83.
[4] ZAHN C T,ROSKIES R Z.Fourier Descriptors for Plane Closed Curves[J].IEEE Transactions On Computers,1972,C-21(3):269-281.
[5] RUI Y,SHE A C,HUANG T S.Modified Fourier Descriptors for Shape Representation-A Practical Approach.[C].[s.l.]:[s.n.],1996:47-12.
[6] DUAN L J,A Survey of Shape Feature[J].Computer Science,2007.34(8):215-218,247.段立娟.形狀特征的編碼描述研究綜述[J].計(jì)算機(jī)科學(xué),2007.34(8):215-218,247.
[7] GONZALEZ R C,WOODS R E.Digital Image Processing,Second Edition.[M].Beijing:PTPRSS,2003.
[8] HU M K.Visual pattern recognition by moment invariants[J].IRE Transaction on Information Theory,1962,8(2):179-187.
[9] TANG X.Texture Information in Run-Length Matrices[J].IEEE Transaction on Image Processing,1998,7(11):1602-1609.
[10] ZHENG S P,XIE J Z,WANG B L,et al.Red Tide Dominant Species Recognition Research Using Shape Descriptors[J].Journal of Xiamen University(Nature Science),2009,48(5):676-679.鄭少平,謝杰鎮(zhèn),王博亮,等.基于形狀特征描述子的赤潮優(yōu)勢(shì)種識(shí)別研究[J].廈門大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,48(5):676-679.
[11] HUANG Z G,LIN M,China Marine species with atlas[M].Beijing:Ocean Press,2012.黃宗國(guó),林茂.中國(guó)海洋物種和圖集[M].北京:海洋出版社,2012.
[12] LI R,YE S W,SHI Z B.SVM-KNN Classifier——A New Method of Improving the Accuracy of SVM Classifier[J].Acta Electronica Sinica,2002,30(5):745-748.李蓉,葉世偉,史忠柏.SVM-KNN分離器—一種提高SVM分類精度的新方法[J].電子學(xué)報(bào),2002,30(5):745-748.