李尹岑,孔祥云,楊德智
(國家知識產(chǎn)權(quán)局專利局專利審查協(xié)作北京中心光電部,北京 100096)
圖像數(shù)據(jù)庫是現(xiàn)代醫(yī)學(xué)系統(tǒng)的一個重要組成部分,對于協(xié)助診斷和預(yù)防醫(yī)學(xué)相關(guān)病情具有十分重要的應(yīng)用意義,特別是數(shù)字化圖像存檔與傳輸系統(tǒng)在醫(yī)療系統(tǒng)中的應(yīng)用可以非常方便的幫助醫(yī)生在進(jìn)行病情判斷與分析時提取生物體內(nèi)組織或器官形態(tài)、結(jié)構(gòu)甚至是功能信息,完成病理組織結(jié)構(gòu)及臨床診斷研究。與此同時,基于計算機(jī)與掃描成像技術(shù)發(fā)展而來的CT掃描技術(shù)可以將人體病變組織的具體問題影射成像,并利用計算機(jī)圖像處理與檢索技術(shù)從圖像中提取相關(guān)特征參數(shù)來表征或反應(yīng)病人病情。這種技術(shù)大大提升了醫(yī)生診斷病情的準(zhǔn)確性和精確度。
對于CT圖像的特征提取主要集中在顏色、灰度、形狀以及紋理等方面。不同的圖像特征可以表征和度量一類具體的特征問題。目前評價圖像特征提取的主要指標(biāo)有查準(zhǔn)率、查全率以及命中準(zhǔn)確率等。
CT圖像特征提取評價指標(biāo)中的查準(zhǔn)率是指經(jīng)過圖像特征提取后所能夠識別和反饋的CT圖像的特征圖像的數(shù)目和所有返回圖像的比值,而查全率則是指圖像特征提取后返回結(jié)果中相關(guān)圖像數(shù)據(jù)與數(shù)據(jù)庫中所存在的所有的相關(guān)圖像數(shù)目的比例。這兩個評價參數(shù)是圖像特征提取中應(yīng)用最為廣泛和可信度最高的兩個評價指標(biāo)。
假設(shè)存在一幅肝臟CT圖像Q,通過數(shù)據(jù)庫檢索后所返回的同一大類圖像數(shù)目為N,相關(guān)圖像數(shù)目為n,數(shù)據(jù)庫中所有的圖像數(shù)目為T,則查準(zhǔn)率的數(shù)學(xué)表達(dá)式為recall=n/N,查全率的數(shù)學(xué)表達(dá)式為precision=n/T。顯然,檢索結(jié)果值越大,檢索效果越好,檢索越精確。
命中準(zhǔn)確率則是用于表征所命中的檢索圖像與查詢圖像的比值。假設(shè)被檢索圖像所在的圖像集為G,檢索后輸出的圖像數(shù)目為A,A中屬于G的圖像數(shù)目為k,則命中準(zhǔn)確率可被定義為pre=k/A×100%。
為獲得檢索結(jié)果和評價結(jié)果,首先需要根據(jù)肝部腫瘤圖像構(gòu)建檢索數(shù)據(jù)庫,數(shù)據(jù)庫的建立可以通過相關(guān)數(shù)據(jù)庫軟件完成,如SQL,MySQL等。該數(shù)據(jù)庫中包含了以下兩部分信息:圖像信息極其對應(yīng)的特征信息。其中,圖像信息由患者相關(guān)信息構(gòu)成,特征信息由圖像特征參數(shù)及相關(guān)信息構(gòu)成。
在使用該數(shù)據(jù)庫進(jìn)行圖像檢索時需要執(zhí)行如下步驟。首先對圖像進(jìn)行基本的信息提取,然后根據(jù)提取結(jié)果將圖像信息分割為多個子圖像塊,該子塊應(yīng)該包含相關(guān)的特征信息,然后分別應(yīng)用相應(yīng)的圖像特征提取算法對圖像中的特征進(jìn)行深度提取,提取后將該信息與圖像數(shù)據(jù)庫和特征數(shù)據(jù)庫進(jìn)行對比分析,從中提取符合返回結(jié)果的圖像,完成檢索。
小波變換是一種非常常見的多尺度可視化信息處理算法,其通過小波變換函數(shù)可以將圖像中的特征信息放大提取出來。每進(jìn)行一次小波變換可以將圖像分解為四個原始圖像四分之一大小的子圖,每張子圖可用于表征原始圖像中的水平方向、垂直方向以及對角線方向的高頻和低頻信息。經(jīng)過多次小波變換后可以獲得權(quán)重最大,特征含量最高的特征信息。
小波變換中關(guān)注的核心在于所選擇的尺度低通濾波器和小波高通濾波器。原始圖像多次經(jīng)過這些濾波器后可以獲得多個方向和維度的紋理特征。
進(jìn)行特征檢索的關(guān)鍵在于特征匹配,即相似度定義和度量。小波變換環(huán)境下的相似度度量主要通過特征參數(shù)與目標(biāo)圖像特征參數(shù)的距離來表征。為提高算法的通用性和準(zhǔn)確性,在度量前可以對所形成的特征參數(shù)向量進(jìn)行歸一化處理。假設(shè)圖像信息函數(shù)f(x,y)具有的特征序列為F,F(xiàn)中包含的特征參數(shù)有[Hf1j,Hf2j,…,Hfkj]個具體值。 其中,Hfij標(biāo)示第i副子圖像中的第j個特征向量矩陣。K表示所有CT圖像數(shù)據(jù)庫中的圖像數(shù)目,則可以由F獲得該特征序列的均值mj和方差σj,其歸一化特征序列可以轉(zhuǎn)換為
對其進(jìn)行相似性度量時所采用的歐式距離定義為
為提升相似度表征的準(zhǔn)確性,需要使用統(tǒng)計的方式對腹部和病灶兩幅圖像之間的相似度進(jìn)行表征,此時主要需要分別對圖像的全局和局部兩部分內(nèi)容的歐氏距離進(jìn)行計算和分析。需要說明的是,表征圖像特征的參數(shù)有多個,不同的參數(shù)獲取和度量方式不盡相同。為獲得更為精準(zhǔn)和統(tǒng)一的檢索結(jié)果可以對需要各表征參數(shù)的歐氏距離進(jìn)行線性組合。線性組合后的數(shù)據(jù)同樣需要進(jìn)行外部歸一化,歸一化方法同特征參數(shù)的歸一化方式,均采用高斯歸一化。
為實(shí)現(xiàn)完整的肝部CT圖像特征提取與目標(biāo)檢索可以執(zhí)行如下步驟:
首先使用Gabor算法和小波變換算法對可表征肝部全局特征的特征參數(shù)進(jìn)行提取,并將所提取出的特征參數(shù)組成特征向量矩陣,矩陣的每一維度表示該圖像的某一特征,然后對肝部病灶處的灰度特征和灰度共生特征進(jìn)行提取,最后將所提取的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的圖像信息和特征信息進(jìn)行對比檢索和查詢,在相似度范圍內(nèi)的圖像被認(rèn)為屬于目標(biāo)圖像,返回到檢索結(jié)果中,完成檢索。
醫(yī)學(xué)診斷中會產(chǎn)生大量的圖像信息,這些圖像信息之間具有相似性,可用于協(xié)助醫(yī)生對病癥、病灶等進(jìn)行判斷和分析。使用圖像特征提取方法對醫(yī)學(xué)圖像中的關(guān)鍵特征信息進(jìn)行放大提取可顯著提升病情診斷精確度,降低醫(yī)生的工作難度。
[1]He ZY,You XG,Tang YY.Texture image retrieval based on non - tensorproductWaveletfilterbanks[J].Signal Processing,2009,89(8):1501-1510.
[2]張晨光.基于內(nèi)容的肝臟CT圖像檢索的研究[D],上海交通大學(xué),2005.
[3]安志勇.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)研究[D].西安電子科技大學(xué),2008.