丁 川,李小虎,王 俊,李紅文,王玉萍,余長亮,葛亞瓊,王海寶,劉 斌
腦出血(intra-cerebral hemorrhage,ICH)約占所有腦卒中的30%,預(yù)后最差,具有高致死率、高致殘率的特點(diǎn)[1],其中約30%的腦出血患者早期顱內(nèi)血腫發(fā)生擴(kuò)大[2],不但是早期神經(jīng)系統(tǒng)惡化的預(yù)測因素,也是臨床潛在的治療靶點(diǎn),因此如何準(zhǔn)確地預(yù)測并預(yù)防血腫擴(kuò)大,也成為腦出血患者個(gè)性化治療的關(guān)鍵[3]。臨床上首診CT平掃顱內(nèi)血腫的位置、形態(tài)、密度是否混雜、CT血管成像(computed tomography hngiography,CTA)中的斑點(diǎn)征均具有提示意義,但是定性存在一定的主觀判斷,且無法量化血腫的異質(zhì)性。影像組學(xué)是一個(gè)新興的但發(fā)展迅速的定量分析方法,通過從影像圖像上提取感興趣區(qū)域(return of investment,ROI),通過高通量的方法獲取紋理特征,從而將醫(yī)學(xué)圖像信息轉(zhuǎn)換為可識別的高維度的數(shù)據(jù)。這些高維度的放射學(xué)特征,對于高血壓性腦出血評估及預(yù)后預(yù)測有著潛在的臨床應(yīng)用價(jià)值。該文旨在初步探討基于頭部CT平掃的放射組方法對于高血壓腦出血早期血腫擴(kuò)大預(yù)測的最佳機(jī)器學(xué)習(xí)方法。
1.1 一般資料回顧性分析2017年8月—2020年3月安徽醫(yī)科大學(xué)第一附屬醫(yī)院本部及高新兩個(gè)院區(qū)首次就診的腦出血患者。納入標(biāo)準(zhǔn):① 符合自發(fā)性腦出血的表現(xiàn);② 發(fā)病6 h以內(nèi)進(jìn)行頭顱CT平掃檢查;③ 發(fā)病后未進(jìn)行外科手術(shù)治療,并于24 h內(nèi)復(fù)查頭顱CT。排除標(biāo)準(zhǔn):① 除外繼發(fā)性腦出血患者,如外傷、血管畸形、顱內(nèi)占位、缺血再灌注損傷等;② 單純腦室系統(tǒng)出血者;③ CT圖像運(yùn)動(dòng)偽影較大者。納入患者共130例,男90例,女40例。
1.2 檢查方法采用GE Optima CT680 64排螺旋CT機(jī),掃描參數(shù):管電壓120 kV,管電流300 mA,采用螺旋掃描模式,螺距1.2,掃描范圍自顱底水平至顱頂水平,層厚5 mm,掃描視野(field of view,FOV)為512,范圍自顱底水平至顱頂水平。
1.3 血腫體積測量血腫擴(kuò)大的定義為24 h內(nèi)兩次頭顱CT平掃圖像相比,血腫至少擴(kuò)大33%或6 ml以上[4],由兩名經(jīng)驗(yàn)豐富的放射科主治醫(yī)師共同閱片,選取顱內(nèi)血腫最大層面逐層勾畫感興趣區(qū)域,當(dāng)意見不同時(shí)相互討論取得統(tǒng)一。再利用田多公式分別計(jì)算24 h內(nèi)前后兩次頭顱CT檢查顱內(nèi)血腫的體積V1、V2,將病例組分為血腫擴(kuò)大組和非擴(kuò)大組。
1.4 放射性特征提取將所有腦出血患者的頭顱CT平掃圖像以DICOM格式導(dǎo)入ITK-SNAP(www.itk-snap.org)軟件,調(diào)整窗寬90 Hu,窗位35 Hu,手動(dòng)逐層勾畫顱內(nèi)血腫的輪廓,形成3D感興趣容積(volume of investment,VOI)(圖1),再提取強(qiáng)度特征,體積特征,基于直方圖的特征,紋理參數(shù)和空間特征。紋理參數(shù)包括灰度共生矩陣(gray level co-occurrence matrix, GLCM),灰度游程矩陣(gray level run length matrix,GLRLM),灰度區(qū)域大小矩陣(gray level size zone matrix, GLSZM)等,該研究中共提取402個(gè)放射組學(xué)特征。
圖1 應(yīng)用GE Artificial Intelligence Kitl軟件提取紋理特征A:頭顱CT平掃圖像;B:逐層勾勒血腫輪廓;C:提取的部分特征值
1.5 統(tǒng)計(jì)學(xué)處理所有的過程均采用R軟件3.5.1版(www.r-project.org)進(jìn)行分析。比較6種經(jīng)典的機(jī)器學(xué)習(xí)方法預(yù)測早期血腫擴(kuò)大的準(zhǔn)確性和機(jī)器學(xué)習(xí)方法的穩(wěn)定性。機(jī)器學(xué)習(xí)方法包括:隨機(jī)森林(random forests,RF),k近鄰(k near neighbor,kNN),支持向量機(jī)(support vector machines,SVM-Radial),神經(jīng)網(wǎng)絡(luò)(neural networks,NNet),梯度提升樹算法(gradient boosting machine,GBM)和廣義線性模型(generalize linear model,GLM)。將所選特征應(yīng)用于分類模型構(gòu)建的預(yù)測變量,交叉訓(xùn)練每個(gè)模型,從而繪制ROC曲線,對曲線下面積(AUC)、準(zhǔn)確性進(jìn)行量化,重復(fù)100次交叉訓(xùn)練過程,從而獲得對模型性能的可靠預(yù)測,通過相對標(biāo)準(zhǔn)偏差(relative standard deviation,RSD)量化每種機(jī)器學(xué)習(xí)方法的穩(wěn)定性。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。RSD%定義為:RSD%=σ_AUC∕μ_AUC×100%。
其中σ中AUC是100個(gè)AUC值的標(biāo)準(zhǔn)偏差,μ_AUC是100個(gè)AUC值的平均值。較低的RSD值對應(yīng)于機(jī)器學(xué)習(xí)方法較高的穩(wěn)定性。
2.1 病例分組結(jié)果根據(jù)早期血腫是否擴(kuò)大分為陽性組和陰性組,陽性組共34例,其中包括男24例,女10例,年齡30~95(75.9±15.6)歲,陰性組共96例,其中包括男66例,女30例,年齡30~86(59.9±14.3)歲。
2.2 基于CT平掃圖像上提取的腦血腫紋理特征通過交叉驗(yàn)證比較不同的分類模型,計(jì)算準(zhǔn)確性和AUC來量化不同機(jī)器學(xué)習(xí)方法的預(yù)測性能。通過最大相關(guān)最小冗余(minimum correlation and maximum relavant,mRMR)特征選擇方法共提取了402個(gè)放射特征,對前5、10、15、20、25、30個(gè)選定特征分別訓(xùn)練不同分類器,當(dāng)選擇前25個(gè)特征來構(gòu)建模型,所有分類器均值A(chǔ)UC最高,見圖2;前25個(gè)特征包括直方圖特征6個(gè),灰階共生矩陣紋理特征(GLCM)4個(gè),灰階游程矩陣紋理特征(GLRLM)15個(gè)。
圖2 選擇不同選定特征時(shí)所有分類器的平均AUC
2.3 特征值預(yù)處理結(jié)果和6種機(jī)器學(xué)習(xí)方法效能分析前25個(gè)選定特征的機(jī)器學(xué)習(xí)方法的穩(wěn)定性,所有分類器均采用100次交叉驗(yàn)證,準(zhǔn)確性、AUC、PPV(陽性預(yù)測值)、NPV(陰性預(yù)測值)、靈敏度、特異性為100次交叉驗(yàn)證的結(jié)果,見表1。SVM-Radial表現(xiàn)最佳的模型穩(wěn)定性(準(zhǔn)確性=0.714,ACC=0.723)。圖3、4顯示了對分類模型穩(wěn)定性和預(yù)測性能的評估,結(jié)果表明SVM-Radial(RSD=0.202)優(yōu)于其他機(jī)器學(xué)習(xí)方法。
圖3 分類模型穩(wěn)定性評估
圖4 分類模型交叉驗(yàn)證結(jié)果
表1 六種不同分類器學(xué)習(xí)方法建模結(jié)果
ICH約占所有腦卒中的10%~30%,預(yù)后最差,其中約30%的腦出血患者早期顱內(nèi)血腫擴(kuò)大,血腫擴(kuò)大不僅直接引起腦組織損傷,而且會(huì)使血腫周邊腦水腫面積增大,引起繼發(fā)性腦組織損傷[4],從而導(dǎo)致致死率、致殘率的增高。因此如何準(zhǔn)確地預(yù)測并預(yù)防血腫擴(kuò)大,也成為腦出血患者個(gè)性化治療的關(guān)鍵。
頭顱CT檢查是腦出血患者入院檢查的第一站[5],是臨床診斷、治療的重要資料,CT平掃上血腫形態(tài)不規(guī)則、密度不均勻(黑洞征、漩渦征)[6-8]等已被證實(shí)對血腫擴(kuò)大的預(yù)測具有較高的敏感性、特異性,但是該定性特征往往存在主觀判斷。CTA“斑點(diǎn)征”[9-10]是近些年來熱議的血腫擴(kuò)大獨(dú)立預(yù)測指標(biāo),但是其敏感性與特異性并不理想,且CTA檢查不是腦出血常規(guī)檢查項(xiàng)目,存在一定的臨床局限性。
影像組學(xué)是近些年來比較熱門的研究方法,旨在從醫(yī)學(xué)圖像中提取定量特征,并探索與結(jié)果的相關(guān)性[11-12]。影像組學(xué)在中樞神經(jīng)系統(tǒng)非腫瘤病變研究多數(shù)集中于腦出血、阿爾茨海默病及多發(fā)性硬化等[13]。Shen et al[14]在2018年報(bào)道NCCT紋理分析可以客觀的量化腦出血的異質(zhì)性,并獨(dú)立預(yù)測血腫的早期擴(kuò)大,但是對高血壓性腦出血早期血腫擴(kuò)大預(yù)測的最佳機(jī)器學(xué)習(xí)方法未進(jìn)行深入地研究。機(jī)器學(xué)習(xí)方法是人工智能的核心,可以實(shí)現(xiàn)對未知數(shù)據(jù)的預(yù)測,具有很強(qiáng)的泛化能力。該研究比較了6種基于放射學(xué)的機(jī)器學(xué)習(xí)方法預(yù)測高血壓性腦出血血腫擴(kuò)大的可行性,首先取了402個(gè)定量放射學(xué)特征,再進(jìn)行特征選擇。特征選擇可以有效避免維數(shù)的困擾并減少擬合,結(jié)果顯示使用前25個(gè)選定特征時(shí)所有分類器的平均性能最高。SVM-Radial(AUC:0.714±0.144,準(zhǔn)確性:0.723±0.109,RSD:0.202)具有最高的預(yù)測性的穩(wěn)定性。初步研究結(jié)果提示放射組學(xué)預(yù)測自發(fā)性腦出血血腫擴(kuò)大時(shí)候,選擇SVM-Radial分類器,預(yù)測效果最好。與李惠等[11]研究結(jié)果基本一致,即基于頭顱CT平掃的放射組學(xué),并選擇合適的機(jī)器學(xué)習(xí)方法,可以對高血壓性腦出血早期擴(kuò)大進(jìn)行有效預(yù)測。SVM是一種強(qiáng)大有效的機(jī)器學(xué)習(xí)方法,原理是在統(tǒng)計(jì)學(xué)的基礎(chǔ)上,小樣本條件下,構(gòu)建一個(gè)超平面,提供了最佳的分離邊界,最大限度地分離高維物體、空間,目前SVM已應(yīng)用于包括醫(yī)療在內(nèi)的多項(xiàng)領(lǐng)域。
該研究存在不足之處:一是樣本量較小,并且是單中心研究,可以進(jìn)一步加大樣本量并進(jìn)行多中心數(shù)據(jù)收集進(jìn)行外部驗(yàn)證;二是該研究采用的是手動(dòng)勾畫ROI,可能會(huì)存在偏差,因?yàn)轱B內(nèi)血腫與周圍腦實(shí)質(zhì)密度差異較大,血腫輪廓的勾勒后期可以選擇半自動(dòng)或自動(dòng)分割。
綜上所述,該研究基于頭顱CT放射組學(xué)確定最佳機(jī)器學(xué)習(xí)方法,可以預(yù)測高血壓性腦出血血腫早期是否擴(kuò)大,使醫(yī)學(xué)圖像中包含的信息價(jià)值最大化,從而有利于對患者腦出血的評估,具有潛在的臨床價(jià)值。