常健博 姜燊種 陳顯金 駱嘉希 李沃霖 張慶華 魏俊吉 石林 馮銘 王任直
自發(fā)性腦出血(sICH)是多種病因?qū)е碌脑l(fā)性腦實(shí)質(zhì)出血,我國(guó)發(fā)病率約為69.6/10 萬(wàn)人年[1],發(fā)病30 天內(nèi)病死率高達(dá)40%(13.1%~61.0%),僅有12%~39%的患者可以實(shí)現(xiàn)遠(yuǎn)期生活自理[2],給社會(huì)和家庭帶來了極大的疾病負(fù)擔(dān)。腦出血的診斷與治療具有一定的復(fù)雜性,涉及神經(jīng)外科、神經(jīng)內(nèi)科等多個(gè)學(xué)科,中國(guó)不同地區(qū)患者的預(yù)后差異較大[3],導(dǎo)致這種差異的原因復(fù)雜多樣,但缺少對(duì)腦出血精準(zhǔn)診斷的便捷技術(shù)是其中的重要原因之一。頭部CT 檢查可以很好地顯示出血灶,而準(zhǔn)確估算CT 圖像中血腫量,是各項(xiàng)研究亟需解決的問題,目前以醫(yī)師手動(dòng)分割的血腫結(jié)果作為計(jì)算血腫量的“金標(biāo)準(zhǔn)”,但這種方法耗時(shí)費(fèi)力;臨床上常以多田公式(即長(zhǎng)×寬×高/2)作為血腫量的估算方法,但其結(jié)果難言精準(zhǔn)[4]。隨著人工智能(AI)技術(shù)的進(jìn)步,不斷有學(xué)者嘗試自動(dòng)分割CT 圖像中的血腫量,常用方法主要有兩類,一類是模糊C-均值(FCM)聚類算法,另一類則是神經(jīng)網(wǎng)絡(luò)。其中FCM 法基于CT 圖像的灰度值,姜春雨等[5]在既往研究的基礎(chǔ)上,對(duì)FCM 法分割的精準(zhǔn)度進(jìn)行改進(jìn),但迄今尚無(wú)大樣本研究對(duì)其效能進(jìn)行過驗(yàn)證?;谏窠?jīng)網(wǎng)絡(luò)的模型也可見諸報(bào)道,Cho 等[6]通過深度學(xué)習(xí)框架,基于3 萬(wàn)幀腦出血的頭部CT 平掃圖像,構(gòu)建的算法準(zhǔn)確度達(dá)80%、回歸度為82%。上述研究大多是從人工智能技術(shù)的角度進(jìn)行研究,2016 年Stroke發(fā)表了Scherer 等[7]的一種計(jì)算方法,即借助體素隨機(jī)森林法對(duì)血腫進(jìn)行分割,最終在驗(yàn)證集中(30 例)該算法與手動(dòng)分割的一致性相關(guān)系數(shù)(CCC)為0.99,雖然優(yōu)于多田公式的0.82,但手動(dòng)勾畫、多田公式和自動(dòng)分割三者之間的差異未達(dá)到統(tǒng)計(jì)學(xué)意義。本研究根據(jù)腦血腫的CT圖像特征,擬提出一種基于深度學(xué)習(xí)技術(shù)的分割方法——卷積神經(jīng)網(wǎng)絡(luò)的算法分割(算法分割),并與多田公式、手動(dòng)分割進(jìn)行對(duì)比,初步探索精準(zhǔn)、便捷的腦血腫分割方法的可行性。
1.資料來源 本研究采用的影像學(xué)資料均來自中國(guó)顱內(nèi)出血影像數(shù)據(jù)庫(kù)(CICHID),該數(shù)據(jù)庫(kù)建于2019 年初,由中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院牽頭,依托于中國(guó)醫(yī)師協(xié)會(huì)智慧醫(yī)療分會(huì)醫(yī)療大數(shù)據(jù)學(xué)組[8]。截至 2019 年 10 月共收入 22 個(gè)醫(yī)療中心(包括三甲醫(yī)院19所)近5000例次頭部CT掃描資料,包括腦實(shí)質(zhì)出血、腦室出血、硬膜下出血、硬膜外出血、蛛網(wǎng)膜下腔出血,以及顱腦創(chuàng)傷等各種類型的顱內(nèi)出血,其中以自發(fā)性腦實(shí)質(zhì)出血為主;本研究選擇自發(fā)性腦實(shí)質(zhì)出血的部分?jǐn)?shù)據(jù)進(jìn)行分析。
2.納入與排除標(biāo)準(zhǔn) (1)納入自發(fā)性腦出血患者(年齡>18 歲)的頭部CT 影像,影像資料均于手術(shù)前或未行手術(shù)治療時(shí)獲得,患者性別、既往史情況等不限。(2)頭部CT 影像均為標(biāo)準(zhǔn)的DICOM 格式,不限制掃描時(shí)所用的參數(shù)及機(jī)器品牌。(3)排除蛛網(wǎng)膜下腔出血、硬膜下出血、硬膜外出血的患者。(4)本研究經(jīng)中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院倫理審查委員會(huì)審核并批準(zhǔn)(批準(zhǔn)文號(hào):S-K1175)。
3.一般資料 根據(jù)納入與排除標(biāo)準(zhǔn),共選取146 例術(shù)前或未行手術(shù)治療的自發(fā)性腦出血患者的頭部CT 資料,覆蓋5 個(gè)醫(yī)療中心的多種CT 掃描儀和掃描參數(shù),層厚3 ~7 mm。所納入的病例資料均由計(jì)算機(jī)自動(dòng)生成隨機(jī)數(shù)字表,隨機(jī)分為訓(xùn)練集(90例)、測(cè)試集(26例)和驗(yàn)證集(30例)。
本研究納入的影像學(xué)資料均進(jìn)行人工手動(dòng)分割腦血腫邊界。訓(xùn)練集和測(cè)試集用于訓(xùn)練算法分割,驗(yàn)證集采用手動(dòng)分割、算法分割、精確多田公式和傳統(tǒng)多田公式共4種方法對(duì)血腫體積進(jìn)行測(cè)量。
1.血腫體積測(cè)量 (1)人工手動(dòng)分割:采用開源軟件 Insight Toolkit SNAP(ITK-SNAP,https://itk.org/)[9]進(jìn)行分割,于 CT 平掃橫斷面圖像,沿腦血腫邊界進(jìn)行勾畫,標(biāo)注后的血腫由ITK-SNAP 軟件生成1 個(gè)分割文件,并輸出血腫體積。(2)精確多田公式:精確多田公式(精確A×精確B×精確C/2)是在ITK-SNAP軟件輔助下,精確測(cè)量最大血腫面積層面血腫的最長(zhǎng)徑(A),以及該層面與最長(zhǎng)徑垂直的最長(zhǎng)徑(B),同時(shí)以實(shí)際層厚乘以出現(xiàn)出血的層面數(shù)(C),上述單位均為ml,所得數(shù)據(jù)小數(shù)點(diǎn)后保留2 位小數(shù),以精確 A、B、C 相乘除以 2 得出血腫體積[9]。由兩位研究者分別獨(dú)立完成精確A、B、C 的測(cè)量,取測(cè)量結(jié)果的平均值納入最終統(tǒng)計(jì)。(3)傳統(tǒng)多田公式:傳統(tǒng)多田公式(粗略A×粗略B×粗略C/2)是將上述精確多田公式所測(cè)結(jié)果取平均值后,進(jìn)行換算。將精確A、B 單位換算為cm 并保留1位小數(shù),將層面數(shù)按照5 mm 層厚取整后獲得C,以換算的粗略A、B、C 相乘除以2 獲得血腫體積,以ml 為單位并保留1 位小數(shù)。(4)基于卷積神經(jīng)網(wǎng)絡(luò)的算法分割:在血腫手動(dòng)分割后,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),采用TensorFlow 平臺(tái)(https://tensorflow.google.cn)和cuDNN(https://developer.nvidia.com/cudnn)搭建 3D卷 積 網(wǎng) 絡(luò)[9],可 通 過 AccuBrainTX(http://www.accubraintx.com/)訪問算法分割模型。最終,以手動(dòng)分割為基準(zhǔn),計(jì)算其他方法的百分誤差,即(其他方法-手動(dòng)分割)/手動(dòng)分割×100%。同時(shí)按血腫形態(tài)標(biāo)注為規(guī)則和不規(guī)則;按人工手動(dòng)分割的體積,以6 ml為界值,標(biāo)注血腫體積為≥6 ml與<6 ml。
2.統(tǒng)計(jì)分析方法 采用SPSS 20.0 統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)處理與分析,使用PRISM GraphPad 8.0繪圖。數(shù)據(jù)的正態(tài)性檢驗(yàn)采用Kolmogorov-Smirnov 檢驗(yàn),不同方法之間的一致性檢驗(yàn)采用Bland-Altman 分析(均數(shù)-差值)、組內(nèi)相關(guān)系數(shù)(ICC)表示,呈正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,呈非正態(tài)分布的計(jì)量資料以中位數(shù)和四分位數(shù)[M(P25,P75)]表示,采用Mann-WhitneyU檢驗(yàn),以P≤0.05為差異具有統(tǒng)計(jì)學(xué)意義。
經(jīng)Kolmogorov-Smirnov 檢驗(yàn),通過不同計(jì)算方法獲得的血腫體積以及各種方法與手動(dòng)分割的體積百分誤差均為非正態(tài)分布資料(均P<0.05),不同方法計(jì)算所得血腫體積和各種方法與手動(dòng)分割的體積百分誤差如表1 所示,算法分割的百分誤差最小,而精確多田公式的百分誤差低于傳統(tǒng)多田公式,提示在4 種算法中以算法分割所得血腫體積更接近手動(dòng)分割結(jié)果。
表1 不同測(cè)量方法的血腫體積和百分誤差[M(P25,P75)]Table 1. ICH volumes and percentage error by different measurement methods [M (P25, P75)]
不同方法的一致性檢驗(yàn)結(jié)果如表2,圖1 所示,在各種方法與手動(dòng)分割血腫體積的差值中,以算法分割的差值范圍最窄,為17.90 ml;精確多田公式和傳統(tǒng)多田公式的差值范圍更寬,分別為32.45 和34.52 ml;3 種方法與手動(dòng)分割的組內(nèi)相關(guān)系數(shù)均較高(>0.75),但是算法分割對(duì)手動(dòng)的組內(nèi)相關(guān)系數(shù)為0.983,均高于兩種多田公式對(duì)手動(dòng)的方法(0.923和0.917)。
綜合上述一致性檢驗(yàn)結(jié)果,可以認(rèn)為算法分割、精確多田公式和傳統(tǒng)多田公式3 種方法與手動(dòng)分割均具有較好的一致性,其中算法分割較兩種多田公式的波動(dòng)范圍更小,而精確多田公式略小于傳統(tǒng)多田公式。
為了進(jìn)一步分析不同方法一致性檢驗(yàn)存在差異的原因,本研究還對(duì)不同方法的百分誤差在不同血腫形態(tài)(規(guī)則、不規(guī)則)、不同體積(≥6 ml、<6 ml)中是否存在差異進(jìn)行探索。驗(yàn)證集中30 例自發(fā)性腦出血患者頭部CT 影像呈規(guī)則血腫者18 例、不規(guī)則 12 例,血腫體積 ≥ 6 ml 者 19 例、< 6 ml 者 11 例。如表3所示,Mann-WhitneyU檢驗(yàn)顯示,血腫規(guī)則與血腫不規(guī)則組之間精確多田公式的百分誤差差異具有統(tǒng)計(jì)學(xué)意義(P=0.038),提示該公式百分誤差在不同血腫形態(tài)中有所不同;而其他方法的百分誤差,在不同血腫形態(tài)(規(guī)則與不規(guī)則)或血腫體積(≥6 ml 與<6 ml)的比較,組間差異均無(wú)統(tǒng)計(jì)學(xué)意義(P> 0.05)。
本研究基于卷積神經(jīng)網(wǎng)絡(luò)的腦血腫自動(dòng)分割算法可自動(dòng)識(shí)別、分割頭部CT平掃所顯示的自發(fā)性腦血腫形態(tài),并計(jì)算血腫體積,以手動(dòng)分割為“金標(biāo)準(zhǔn)”,分別對(duì)算法分割、精確多田公式和傳統(tǒng)多田公式進(jìn)行一致性檢驗(yàn),結(jié)果顯示:與多田公式相比,算法分割的百分誤差最小,為15.54(8.41,23.18)%、組內(nèi)相關(guān)系數(shù)最高,為0.983,Bland-Altman 一致性檢驗(yàn)顯示,93.33%(28/30)的數(shù)據(jù)在95%一致性界限(LoA),并且其95%LoA最窄,為-6.46 ~5.97 ml,表明該方法測(cè)量結(jié)果穩(wěn)定,與“金標(biāo)準(zhǔn)”的一致性良好。同時(shí)對(duì)不同血腫體積和形態(tài),算法分割百分誤差差異均無(wú)統(tǒng)計(jì)學(xué)意義。
表2 不同測(cè)量方法的一致性檢驗(yàn)(n=30,ml)Table 2. Agreement statistics of different measurement methods (n=30, ml)
圖 1 Bland-Altman 一致性檢測(cè) 1a 算法分割的 95%LoA 最窄,為-6.46 ~ 5.97 ml,6.67%(2/30)的點(diǎn)在95%LoA 以外。在95%LoA 以內(nèi),算法分割與手動(dòng)分割血腫差值的最大值為4.50 ml 1b,1c 精確多田公式和傳統(tǒng)多田公式的95%LoA范圍分別為-12.55 ~16.51 ml 和-13.34 ~18.07 ml,均有10%的點(diǎn)在95%LoA 以外。在95%LoA 以內(nèi)的差值最大值分別為8.39和5.91 mlFigure 1 Bland-Altman analysis findings The 95%LoA of algorithm segmentation was - 6.46-5.97 ml and the points outside 95%LoA was 6.67% (2/30). Within 95%LoA, the maximum value of hematoma difference was 4.50 ml between algorithm segmentation and manual segmentation (Panel 1a). The 95%LoA of accurate Tada formula and traditional Tada formula were - 12.55-16.51 ml and - 13.34-18.07 ml, respectively. Within 95%LoA, the maximum value of hematoma difference was 8.39 and 5.91 ml, respectively (Panel 1b, 1c).
多田公式計(jì)算方法是由橢球體體積公式(4/3×π×0.50長(zhǎng)×0.50寬×0.50高)簡(jiǎn)化而來,因其計(jì)算簡(jiǎn)便、快捷而廣泛應(yīng)用于腦血腫體積的估算,但該公式易高估血腫量[10]。既往研究認(rèn)為,多田公式在血腫形態(tài)不規(guī)則或呈散在分布時(shí),不能準(zhǔn)確地估算出血腫體積[11]。本研究結(jié)果顯示,精確多田公式計(jì)算中出現(xiàn)的百分誤差,在規(guī)則和不規(guī)則血腫中存在統(tǒng)計(jì)學(xué)差異;而傳統(tǒng)多田公式在兩型之間的百分誤差則差異無(wú)統(tǒng)計(jì)學(xué)意義。這可能與精確多田公式的百分誤差較傳統(tǒng)多田公式[17.49(11.24,43.01)%對(duì)22.70(14.53,38.92)%]稍小有關(guān),即無(wú)論是血腫形態(tài)規(guī)則與否,傳統(tǒng)多田公式的百分誤差均較大。研究顯示,血腫體積越大(>40 ml 與20 ~40 ml),多田公式的誤差絕對(duì)值和百分誤差越大[12]。本研究結(jié)果提示,采用多田公式估算血腫體積,其百分誤差在不同血腫形態(tài)中存在一定差異,而在不同血腫體積計(jì)算中則無(wú)這種差異,與Xu等[4]的研究結(jié)果基本一致。值得注意的是:既往關(guān)于計(jì)算機(jī)輔助計(jì)算對(duì)比多田公式估算血腫體積的研究,并未說明其研究所用多田公式的估算方法是基于計(jì)算機(jī)精確測(cè)量還是傳統(tǒng)膠片估算法[4,7,13]。而本研究則提示,與直接估算膠片的傳統(tǒng)多田公式相比,借助各類醫(yī)學(xué)影像工作站中的工具精準(zhǔn)測(cè)量A、B、C 數(shù)值的百分誤差更小、組內(nèi)相關(guān)系數(shù)更高、95%LoA 更窄且與手動(dòng)分割結(jié)果的一致性更高,能夠更為準(zhǔn)確地估計(jì)出血腫量。
表3 不同測(cè)量方法在不同血腫形態(tài)和體積中的差異性分析[M(P25,P75),%]Table 3. Difference analysis of hematoma shape and volume in different measurement methods [M (P25, P75), %]
為了更加精確、快速地獲得腦出血量,彌補(bǔ)傳統(tǒng)計(jì)算方法的不足,目前推出了多種血腫自動(dòng)分割算法,諸如灰度聚類[5,14]、貝葉斯法[15]、隨機(jī)森林[7]等,近年隨著神經(jīng)網(wǎng)絡(luò)相關(guān)算法的進(jìn)步與提高,深度學(xué)習(xí)算法被用于血腫分割[6,16],其準(zhǔn)確度可達(dá)80%[6]。但計(jì)算機(jī)工程指標(biāo),如準(zhǔn)確度、戴斯(Dice)值等不能很好的回答臨床問題,例如測(cè)量穩(wěn)定性、與傳統(tǒng)方法的比較優(yōu)勢(shì)等。在本研究中,我們對(duì)卷積神經(jīng)網(wǎng)絡(luò)與手動(dòng)分割的一致性進(jìn)行探索,不僅通過Bland-Altman 一致性檢驗(yàn)和95%LoA 證實(shí)了前者的準(zhǔn)確性,而且經(jīng)對(duì)血腫形態(tài)和體積大小的對(duì)比分析,進(jìn)一步驗(yàn)證了該算法用于不同形態(tài)和體積腦血腫的穩(wěn)定性。而且與多田公式法相比,卷積神經(jīng)網(wǎng)絡(luò)對(duì)腦血腫體積的計(jì)算優(yōu)于傳統(tǒng)計(jì)算方法。
精確并穩(wěn)定地計(jì)算腦血腫體積,有助于臨床醫(yī)師更好地把握病情、更精準(zhǔn)地回答臨床問題。以手術(shù)治療腦出血的療效研究為例,有時(shí)在高質(zhì)量的證據(jù)之間的結(jié)論會(huì)存在矛盾,雖然包括Cochrane 系統(tǒng)評(píng)價(jià)在內(nèi)的系統(tǒng)評(píng)價(jià)均認(rèn)為手術(shù)可降低病死率[17],甚至改善 Glasgow 預(yù)后分級(jí)(GOS)等遠(yuǎn)期轉(zhuǎn)歸[18];但在Lancet報(bào)道的多項(xiàng)有關(guān)手術(shù)療效的大型國(guó)際多中心高質(zhì)量隨機(jī)對(duì)照臨床研究中,如涉及早期手術(shù)療效的國(guó)際腦出血外科手術(shù)試驗(yàn)(STICH-Ⅱ)[19]或穿刺引流聯(lián)合重組組織型纖溶酶原激活物(rt-PA)微創(chuàng)術(shù)與重組組織型纖溶酶原激活物聯(lián)合清除顱內(nèi)出血研究(MISTIE-Ⅲ)[20],經(jīng)總體分析均未得出外科手術(shù)能夠降低患者病死率的結(jié)論。腦血腫體積是判斷患者是否需行手術(shù)治療的指征[21],而傳統(tǒng)的血腫體積計(jì)算方法(多田公式)中存在較大的誤差,推測(cè)可能即是造成上述高質(zhì)量證據(jù)之間矛盾的原因。除了準(zhǔn)確計(jì)算腦血腫體積,隨著人工智能技術(shù)在臨床醫(yī)學(xué)領(lǐng)域的深入應(yīng)用,逐漸實(shí)現(xiàn)自動(dòng)、精準(zhǔn)和便捷的腦血腫分割,是今后影像組學(xué)、手術(shù)模擬以及手術(shù)導(dǎo)航等計(jì)算方法進(jìn)一步研究的基礎(chǔ)。
由于基于卷積神經(jīng)網(wǎng)絡(luò)的算法分割研究尚處于初級(jí)階段,故具有一定的局限性:(1)雖然訓(xùn)練集、驗(yàn)證集樣本來自多中心影像學(xué)資料,但因數(shù)量較小,對(duì)其算法的推廣、泛化能力仍有待進(jìn)一步驗(yàn)證。(2)病例數(shù)較少,驗(yàn)證集中的血腫呈偏態(tài)分布,對(duì)血腫體積、形態(tài)的差異比較采用了非參數(shù)檢驗(yàn),其結(jié)果需在今后的研究中擴(kuò)大樣本量,采用進(jìn)一步的差異性檢驗(yàn)加以驗(yàn)證。(3)驗(yàn)證集中血腫體積較小,平均僅為16 ml,導(dǎo)致絕對(duì)差值較小、百分誤差隨之增大,造成百分誤差被高估。
與傳統(tǒng)多田公式方法相比,采用卷積神經(jīng)網(wǎng)絡(luò)計(jì)算頭部CT平掃圖像中的腦血腫體積,與手動(dòng)分割的一致性更高、95%LoA 更窄,其百分誤差在不同血腫形態(tài)、體積的情況下差異更小,具有一定應(yīng)用前景,但仍需通過大樣本臨床研究加以驗(yàn)證。
利益沖突無(wú)