余其徽 ,袁海霞 ,張燕群 ,俞 清 ,季正標 ,張 麒,5 ,王文平
(1.上海先進通信與數(shù)據(jù)科學研究院(上海大學),上海 200444;2.上海大學通信與信息工程學院,上海 200444;3.復旦大學附屬中山醫(yī)院超聲科,上海 200032;4.復旦大學附屬中山醫(yī)院廈門醫(yī)院超聲科,福建 廈門 361015;5.杭州依圖醫(yī)療研究院,浙江 杭州 310000)
近年來,膽囊息肉樣病變的發(fā)病率逐年升高,較為常見的兩種息肉類型是膽囊膽固醇性息肉和膽囊腺瘤。前者不會發(fā)生惡變,稱為假性息肉;而后者是一種起源于腺上皮的真性息肉,易發(fā)生不典型增生并發(fā)展為膽囊癌,屬于癌前病變的一種[1-2]。目前,超聲檢查是區(qū)分膽囊真假性息肉首選的影像學方法。對于膽囊真性息肉,及時的膽囊切除術非常必要。臨床外科學指南建議對于直徑大于1 cm 的膽囊息肉進行膽囊切除術,但這經(jīng)常受到學者和臨床醫(yī)生的質疑。他們認為,直徑大于1 cm 的膽囊息肉中有許多良性息肉。如對良性息肉進行膽囊切除手術,會對患者的健康造成巨大的傷害,且占用公共衛(wèi)生資源。同時,直徑小于1 cm 的息肉也可能是真性息肉,僅超聲觀察其生長顯然不合理[3-4]。因此,臨床亟需一種可廣泛應用的新技術,在術前盡早鑒別膽囊真假性息肉,從而僅對真性息肉進行膽囊切除術,降低醫(yī)療資源的浪費,提高患者的生存質量。
近年來,隨著人工智能的迅猛發(fā)展,許多學者在醫(yī)學影像領域取得了一定的進展。Dalmis 等提出人工智能多參數(shù)乳腺磁共振成像方法,實現(xiàn)了乳腺良惡性的病變分類[5]。Colling 等將圖像分析和機器學習應用于組織病理學,加快了組織病理學在臨床實踐中的發(fā)展[6]。Weisberg 等將放射組學特征與深度學習模型相結合,實現(xiàn)了良好的胰腺癌早期診斷性能[7]。因此,考慮到計算機可能利用高維信息捕捉到宏觀醫(yī)學影像上的變化,其分辨率遠遠超過人眼的分辨率[8-9]。將基于計算機輔助分析超聲圖像,可獲取客觀的影像學特征,以鑒別膽囊良惡性息肉,為醫(yī)生的臨床決策提供精確、可靠的診斷建議。
本研究回顧性分析了經(jīng)手術病理證實的膽囊膽固醇性息肉和膽囊腺瘤患者術前超聲二維圖像,通過計算機提取分析多組影像學特征,以期盡早發(fā)現(xiàn)這兩種疾病的影像差異,從而輔助鑒別膽囊膽固醇性息肉和膽囊腺瘤。
首先,采集膽囊膽固醇息肉和膽囊腺瘤的超聲圖像并進行圖像分割,以確定病灶位置。接著,用計算機提取病灶的空域、形態(tài)兩類量化特征,并通過統(tǒng)計學分析對特征進行選擇。最后,使用這些特征用于支持向量機(support vector machine,SVM)算法分類判決。膽囊膽固醇息肉和膽囊腺瘤的圖像分析流程如圖 1 所示。
圖1 膽囊膽固醇息肉和膽囊腺瘤的圖像分析流程圖Fig.1 Image analysis process of gallbladder cholesterol polyp and gallbladder adenoma
本文研究的病例超聲圖像來自于復旦大學附屬中山醫(yī)院超聲科,共獲得68 例患者69 個膽囊息肉術前超聲圖像資料。所有病例均行膽囊切除術并獲得手術病理結果。其中,膽囊膽固醇息肉37 例38 個病灶,膽囊管狀腺腺瘤31 例31 個病灶。病灶直徑0.7~4.1 cm。超聲檢查儀器包括:Canon Aplio500(日本),Mindray Resona7s (中國),Hitachi Ascendus(日本)彩色多普勒超聲診斷儀,探頭頻率3.5~5.0 MHz。患者超聲檢查前須空腹(禁食8 h 以上)。超聲檢查時,病灶局部放大并顯示病變最大切面,測量病灶最大直徑,并存儲病灶原始超聲圖像。
在進行超聲圖像定量分析前,首先要確定病灶區(qū)域。膽囊腺瘤超聲圖像病灶處理如圖2 所示。由于膽囊息肉、周邊血管、腺體等組織器官結構復雜,圖像自動分割技術并不能很好地對病灶進行準確分割。因此,本文由具有豐富臨床經(jīng)驗的醫(yī)生手動勾勒超聲圖像中的病灶輪廓,如圖2(a)所示。接著,對超聲圖像進行二值化處理,得到掩膜圖像,如圖2(b)所示。其中,掩膜圖像中白色像素點對應超聲圖像中的病灶區(qū)域,黑色像素點對應超聲圖像中的非病灶背景區(qū)域。
圖2 膽囊腺瘤超聲圖像的病灶處理Fig.2 Lesion processing based on the ultrasound image of gallbladder adenoma
本文將基于原始超聲圖像及其對應的掩膜圖像提取病灶的影像學特征,包括空域特征和形態(tài)特征。首先,本文提取了病灶的空域特征。空域特征包括一階統(tǒng)計量特征和灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征。一階統(tǒng)計量特征基于超聲灰度圖提取,包括:病灶內部像素的變異系數(shù),其為離散程度的一個歸一化量度,定義為標準差與平均值之比;相對中值比,其定義為病灶區(qū)域像素中值和參考區(qū)域 (病灶往外擴若干像素形成的矩形區(qū)域)像素中值的對應比值;相對均值比,其定義為病灶區(qū)域像素均值和參考區(qū)域 (病灶往外擴若干像素形成的矩形區(qū)域)像素均值的對應比值。
灰度共生矩陣是一種重要的紋理分析方法,其定義為圖像上間隔距離為d和方向為θ的兩個像素同時出現(xiàn)的聯(lián)合概率分布G(i,j;d,θ)。共生矩陣的一個元素不僅可以反映像素的分布特性,也可以反映具有相同灰度或接近灰度的像素點之間的位置分布特性[10]。本文求取GLCM 特征時,為簡化計算量,將原來的256 個灰度級重新量化到 8 個灰度級,即得到 8×8 的灰度共生矩陣G(i,j)(i=1,2,...,8;j=1,2,...,8)。同時,設定方向θ=0°,45°,90°,135°;距離d=1,2,...,15 像素。提取的GLCM 特征包括對比度和均一度。對比度反映原圖像中病灶區(qū)域灰度值局部變化的情況。該值越大,說明病灶局部灰度變化越大。均一度反映原圖像中紋理的相似度或同質性。該值越大,說明病灶局部間的灰度越接近、分布越均勻。
接著,本文提取了病灶的形態(tài)特征,如圖3 所示。該類特征包括擬合橢圓的長軸長度和短軸長度,擬合橢圓是與病灶有相同標準二階中心距的圖形(橢圓所示)以及病灶的周長,其定義為病灶(不規(guī)則曲線所示)區(qū)域最外層像素點的個數(shù)。
圖3 病灶形態(tài)學特征的示意圖Fig.3 Schematic diagram illustrating morphological features of lesion
本文對提取的所有影像學特征進行了統(tǒng)計學檢驗。假設特征參數(shù)對應的數(shù)據(jù)為正態(tài)分布,采用非配對t檢驗;否則,采用KW 檢驗。其中,統(tǒng)計學檢驗輸出概率p值小于0.05 表示有統(tǒng)計學差異,保留有統(tǒng)計學意義的特征,并依據(jù)這些特征進行后續(xù)的分類判決。
由于醫(yī)學數(shù)據(jù)獲取的局限性及涉及的倫理問題,本文采集的膽囊息肉超聲樣本屬于小樣本集。考慮到SVM 對小樣本集具有很高的適用性,本文選用SVM 算法對膽囊息肉進行分類判決。SVM 算法通過尋找一個決策邊界來最大化兩組之間的邊界。這是一種非常流行的分類方法[11-12]。在本試驗中,SVM 分類算法流程如圖4 所示。圖4 中,實線表示采用訓練集訓練,虛線表示使用測試集測試。
圖4 SVM 分類算法流程圖Fig.4 Flowchart of SVM classification algorithm
先按照7 ∶3 的比例將數(shù)據(jù)集分成訓練集和測試集。在訓練集上,本文分別采用5 次交叉驗證方法,得到與空域特征相對應的最優(yōu)模型A 和形態(tài)特征相對應的最優(yōu)模型B。為集成A、B 兩類模型,本文將模型A 訓練集的輸出概率值Pa和模型B 訓練集的輸出概率值Pb整合為特征c。對于每一個病例,c的定義如下:
然后,本文調整特征c的分類得分閾值以優(yōu)化集成模型。其中,約登指數(shù)(youden index,Yi)作為參考指標,訓練集Yi 最大值對應的最優(yōu)分類得分閾值被用于測試集分類。最后,本文分析了模型A、模型B 和集成模型對應的測試集分類性能;同時,為了量化測試集的分類能力,通過10 次樣本集隨機劃分,重復試驗評估后取平均值作為測試集的評估結果。其中,本文采用的評估指標包括分類精度(accuracy,Acc)、分類靈敏度(sensitivity,Sen)、特異性(specificity,Spc)、受試者工作特征(receiver operating characteristic,ROS)和曲線下面積(area under the curve,AUC)。
所有入組病例均經(jīng)手術病理證實,包括膽囊膽固醇性息肉37 例38 個病灶。膽囊腺瘤31 例31 個病灶。所有病例的病灶統(tǒng)計學分析結果如表1 所示。當特征參數(shù)對應的數(shù)據(jù)為正態(tài)分布時,給出對應特征的均值和標準差。否則,給出對應特征的中位數(shù)和四分位數(shù)。
表1 所有病例的病灶區(qū)域統(tǒng)計學分析Tab.1 Quantitative analysis results for lesion regions of all patients
在表2 中,從空域特征來看,對比度、均一度和相對中值比對膽囊膽固醇性息肉和膽囊腺瘤的鑒別有很大的參考價值(p<0.001)。相較于膽囊膽固醇性息肉,膽囊腺瘤的變異系數(shù)和對比度值更小,均一度更大,表明膽囊腺瘤的病灶區(qū)域的像素分布更均勻;同時,膽囊腺瘤的相對中值比和相對均值比更小,表明膽囊腺瘤的內部高亮區(qū)域相對占比更少。從形態(tài)特征來看,長軸長度、短軸長度和病灶的周長對膽囊膽固醇性息肉和膽囊腺瘤的鑒別有較大的參考作用(p<0.001),相較于膽囊膽固醇性息肉,膽囊腺瘤的長軸長度、短軸長度和周長更大,表明膽囊腺瘤的病灶區(qū)域外周輪廓更大,并且形態(tài)更不規(guī)則。
膽囊膽固醇息肉和膽囊腺瘤的超聲圖像如圖5所示。
圖5 膽囊膽固醇息肉和膽囊腺瘤的超聲圖像Fig.5 Ultrasound image of gallbladder cholesterol polyps and gallbladder tubular adenoma
通過超聲圖像影像學分析,膽囊腺瘤的均一度參數(shù)值(0.640)明顯高于膽囊膽固醇息肉的均一度參數(shù)值(0.494)。分析結果表明,膽囊腺瘤病灶區(qū)域的像素分布較膽固醇性息肉更均勻。該特征有助于區(qū)分膽固醇息肉和膽囊腺瘤,對兩種疾病的鑒別診斷有一定的潛在價值。
使用SVM 分類算法,本文分別得到5 個空間特征對應的最優(yōu)模型A 和3 個形態(tài)特征對應的最優(yōu)模型B以及集成模型。測試集的分類性能如表2 所示。
表2 測試集的分類結果Tab.2 Classification results of the test set
分類結果表明,與空域模型A 的分類性能相比,形態(tài)模型B 的Acc 更高,但Sen 和Spc 相對更不平衡。
不同模型的ROC 曲線如圖6 所示。
圖6 不同模型的ROC 曲線Fig.6 ROC curves of different models
當集成模型A 和B 之后,測試集的Acc、Sen 和Spc 分別提高到0.905、0.910 和0.900。此時,平均分類得分閾值為0.351。同時,從圖6 中可以看出,集成模型的AUC(0.927)最高,形態(tài)模型AUC(0.919)高于空間模型AUC(0.882)。
本研究嘗試將人工智能影像學技術應用于69例膽囊息肉的二維超聲圖像分析,以區(qū)分膽囊膽固醇息肉和膽囊腺瘤??沼蛱卣餮芯匡@示,與膽囊膽固醇息肉相比,膽囊腺瘤的病灶區(qū)域像素分布更均勻(均一度;p<0.001),息肉內部高亮區(qū)域相對占比更少(相對中值比;p<0.001),膽囊腺瘤的這些影像學特征與其病理特征密切相關,表明均一度和相對中值比等特征確實具有潛在的分類能力,與文獻報道相符[13]。同時,形態(tài)特征研究表明,相較于膽囊膽固醇性息肉,膽囊腺瘤的病灶區(qū)域形態(tài)周長更大(周長;p<0.001)。但膽囊腺瘤的平均直徑大于膽囊膽固醇息肉,并不能表示較大的病灶中沒有膽固醇息肉、較小的病灶中不存在膽囊腺瘤。這種僅依靠息肉的大小和形狀來鑒別膽囊真假性息肉的方法過于簡單化。因此,以考慮結合病灶空域和形態(tài)特征來鑒別膽囊腺瘤和膽固醇息肉為宜。本文SVM 集成模型分類準確率、敏感性、特異性分別達到90.5%、91.0%、90.0%,曲線下面積為0.927,表明借助計算機輔助分析膽囊息肉超聲圖像,有助于臨床醫(yī)生從其潛在的形態(tài)和空域特征中獲益,從而對膽囊真假性息肉進行準確鑒別。
本研究也存在一定的局限性。首先,本文初步將人工智能技術應用于膽囊真性息肉與假性息肉鑒別,病例數(shù)還相對較少,需積累更多的病例以進一步驗證方法的有效性及模型的泛化能力,從而為臨床診斷提供更可靠的參數(shù)和診斷界值。其次,后續(xù)的研究將嘗試提取更多的超聲影像定量特征,并結合彈性超聲、超聲造影等多模態(tài)超聲技術獲取多模態(tài)超聲特征,從而更全面、準確地表征膽囊息肉屬性,實現(xiàn)更精準的真假性息肉鑒別。