徐燦飛, 黃 艷, 張開治1,
(1. 吉林大學中日聯(lián)誼醫(yī)院神經(jīng)外科,吉林 長春 130033; 2. 浙江大學醫(yī)學院附屬邵逸夫醫(yī)院病理科,浙江 杭州 310020; 3. 吉林大學中日聯(lián)誼醫(yī)院醫(yī)療保險管理部,吉林 長春 130033)
急性缺血性腦卒中(acute ischemic stroke,AIS)以其高發(fā)病率、高致殘率和高死亡率等特點嚴重危害人民健康[1]。在發(fā)病4.5 h 內(nèi)行重組人組織型纖溶酶原激活劑 (recombinant tissue plasminogen activator,rt-PA) 靜脈溶栓為AIS 目前常用的治療方案[1-4]。rt-PA 靜脈溶栓治療有嚴格的時間窗要求,超過時間窗將增加患者顱內(nèi)出血的風險[5]。約20%的AIS 患者無法明確發(fā)病時間,因患者發(fā)病時間不明確未能接受rt-PA 靜脈溶栓,導致其預后不佳[6]。因此,有效識別發(fā)病4.5 h 內(nèi)的AIS 患者是當前研究的熱點。機器學習方法采用計算機通過模擬人類的學習方式獲取新的知識,在對獲得的知識結(jié)構(gòu)進行重組后進一步完善自身性能[7]。隨著計算機技術(shù)的不斷改進,機器學習方法在醫(yī)學影像輔助診斷方面的應用較為廣泛[8-9]。有研究[10-11]報道了結(jié)合多模態(tài)影像識別發(fā)病4.5 h 內(nèi)AIS 患者的機器學習方法,而依據(jù)磁共振彌散加權(quán)成像(diffusion weighted imaging,DWI)評估AIS患者發(fā)病時間的機器學習方法尚未完全闡明。本研究以發(fā)病時間明確的AIS 患者的DWI 為依據(jù),訓練可用于識別發(fā)病時間在4.5 h 內(nèi)AIS 患者的機器學習模型,以期輔助臨床醫(yī)師有效評估發(fā)病時間不明的AIS 患者對rt-PA 靜脈溶栓治療的適應性。
1.1 一般資料選擇2021 年1 月—2021 年7 月于吉林大學中日聯(lián)誼醫(yī)院神經(jīng)內(nèi)科和神經(jīng)外科收治的DWI 資料完整的AIS 患者227 例。納入標準:①前循環(huán)AIS;②有明確的發(fā)病時間;③在發(fā)病后24 h內(nèi)接受DWI 檢查;④DWI 成像清晰。排除標準:①顱內(nèi)出血、腫瘤或創(chuàng)傷;②DWI 有運動偽影圖像無法評估;③DWI 檢查前接受血管再通治療。最終納入227 例患者,其中男性患者165 例,女性患者62例,患者年齡30~93歲,平均年齡64.5 歲。根據(jù)發(fā)病至DWI 檢查時間,將患者分為發(fā)病時間≤4.5 h 組(n=70)和發(fā)病時間>4.5 h 組(n=157)。227 例患者采用完全隨機法按照7∶3 的比例劃分為訓練集和測試集。訓練集患者158 例,其中發(fā)病時間≤4.5 h 組49 例,發(fā)病時間>4.5 h 組109 例;測試集患者69 例,其中發(fā)病時間≤4.5 h組21 例,發(fā)病時間>4.5 h 組48 例。
1.2 DWI 檢查方法所有患者的DWI 檢查均由西門子3.0T 核磁掃描設備(德國西門子公司)完成。掃描參數(shù):TR 4300 ms,TE 98 ms,矩陣160×160,3 個方向,視野230 mm×230 mm,反轉(zhuǎn)角90°,層數(shù)20,層厚5 mm,b=1 000 s·mm-2。
1.3 圖像采集和標注將AIS 患者的DWI 以DICOM 格式由圖像存儲與傳輸系統(tǒng)中導出,由1 名具有5 年以上頭部核磁影像診斷經(jīng)驗的神經(jīng)外科醫(yī)師采用ITK-SNAP 軟件(www. itksnap. org)于DWI 上沿病灶邊緣仔細繪制輪廓線,逐層分割感興趣區(qū)域(region of interest,ROI),并由2 名具有15 年以上頭部核磁影像診斷經(jīng)驗的神經(jīng)外科醫(yī)師進行校對。見圖1。
圖1 AIS 患者頭部DWIFig. 1 DWI of head of patients with AIS
1.4 特征提取采用Python 軟件“Pyradioiomics”包由AIS 患者頭部DWI 的ROI 圖像中提取圖像特征[12]。目前可由醫(yī)學影像中提取的圖像特征主要包括一階特征、形態(tài)特征和紋理特征,可從不同方面解析圖像的隱含特點。一階特征采用ROI 圖像的特征值,以直方圖定量描述圖像內(nèi)的信號強度及其分布情況;形態(tài)特征可以量化ROI 圖像的形狀和大小,如ROI 圖像的周長、球形度、長軸長度和短軸長度等;紋理特征可定量刻畫腦梗死灶內(nèi)的異質(zhì)性[13-14]?;叶裙采仃嚕╣ray level co-occurrence matrix,GLCM)定義ROI 圖像的二階聯(lián)合概率函數(shù),包括集群顯著性、集群陰影和聯(lián)合熵等;灰度相關(guān)矩陣(gray level dependence matrix,GLDM)通過統(tǒng)計ROI 圖像中某個像素與周圍像素的差值小于特定閾值的情況描述紋理特征,如灰度方差、依賴方差和依賴熵等;灰度游程矩陣(gray level run length matrix,GLRLM) 以ROI 圖像中一維方向記錄連續(xù)多個相同像素值出現(xiàn)的情況描述紋理特征,如運行長度非均勻性、運行長度非均勻歸一化和運行熵等;灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM) 定義了具有相同灰度強度連接體素的數(shù)量,如區(qū)域熵、低灰度區(qū)域強調(diào)和高灰度區(qū)域強調(diào)等;鄰域灰度差矩陣(neighborhood gray tone difference matrix,NGTDM)量化在給定距離內(nèi)的灰度值與其相鄰距離內(nèi)的平均灰度值的差值,包括粗糙度、對比度、繁忙度、復雜度和強度。
1.5 特征選擇對提取后的特征進行特征選擇,去除相似和冗余的特征以提高算法的計算效率及防止過擬合的發(fā)生。將提取的特征值進行Z-score 正則化處理,Spearman 相關(guān)性檢驗評估各特征的相關(guān)性,排除一致性過高的特征[15-16]。Spearman 相關(guān)系數(shù)的正負值反映特征變化方向是否一致,絕對值越大表示特征間相關(guān)性越高,當2 個特征的Spearman 相關(guān)系數(shù)絕對值>0.9 時,可以認為2 個特征存在較高的一致性,可以相互替代,即為冗余特征。使用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型對剩余特征進行壓縮,參數(shù)λ 反映了LASSO 回歸模型對特征系數(shù)的壓縮程度,λ 值增大,特征系數(shù)被逐漸壓縮為0[17]。λ 值過大會因系數(shù)過度壓縮而導致部分有意義的特征被排除,若λ 值過小會因系數(shù)壓縮不足而導致部分冗余的特征被保留。結(jié)合10 倍交叉驗證法確定λ 的最佳值,根據(jù)不同λ值對應的均方誤差篩選均方誤差最小時的最佳λ 值。獲取發(fā)病時間≤4.5 h 組和發(fā)病時間>4.5 h 組患者存在顯著差異的特征。
1.6 模型訓練和測試基于篩選后的圖像特征,在訓練集中分別采用支持向量機(support vector machines,SVM)、K 近鄰 (k-nearest neighbor,KNN)、決策樹、極限樹、隨機森林、XGBoost 和LightGBM 共7 種機器學習算法進行模型訓練[18-23]。在測試集中以受試者工作特征曲線(receiver operating characteristic curve,ROC)和曲線下面積(area under curve,AUC)評估模型識別發(fā)病4.5 h內(nèi)AIS 患者的效果并計算95% 置信區(qū)間(confidence interval,CI)。對以上模型進行100 次隨機校驗,最終得到每種算法的最優(yōu)模型并進行比較。
2.1 特征提取和特征選擇于ROI 圖像中共提取107 個特征,包括18 個一階特征、14 個形態(tài)特征和75 個紋理特征。采用Spearman 相關(guān)分析的方法,共排除79 個冗余特征。見圖2。
圖2 使用Pyradiomics 提取107 個特征的Spearman 相關(guān)系數(shù)圖Fig. 2 Spearman correlation coefficient diagram of 107 features extracted by Pyradionics
采用LASSO 回歸模型壓縮剩余的28 個特征系數(shù)(圖3),橫坐標為λ值,縱坐標為特征系數(shù)。最終獲取22 個可用于識別發(fā)病4.5 h 內(nèi)AIS 患者的圖像特征,包括4 個一階特征、6 個形態(tài)特征和12 個紋理特征。見圖3~5。
圖3 LASSO 回歸模型壓縮的特征系數(shù)收斂圖Fig. 3 Convergence diagram of characteristic coefficients compressed with LASSO regression model
圖4 10 倍交叉驗證結(jié)果Fig. 4 10-fold cross validation results
圖5 22 個特征直觀圖Fig. 5 Pictorial diagram of 22 features
2.2 發(fā)病4.5 h 內(nèi)AIS 患者識別情況經(jīng)過100 次隨機校驗后獲得SVM、 KNN、 Decision Tree、Random Forest、 Extra Trees、 XGBoost 和LightGBM 算法的最優(yōu)模型。SVM 模型的AUC 為0.735 (95%CI: 0.595~0.874), KNN 模型的AUC 為0.532(95%CI:0.364~0.700),Decision Tree 模型的AUC 為0.624 (95%CI: 0.481~0.768), Random Forest 模型的AUC 為0.761(95%CI: 0.643~0.879), Extra Trees 模型的AUC 為0.670(95%CI:0.508~0.833),XGBoost模型的AUC 為0.817 (95%CI:0.697~0.938),LightGBM 模 型 的 AUC 為 0.775 (95%CI:0.642~0.908)。其中XGBoost 模型識別發(fā)病4.5 h內(nèi)AIS 患者的AUC 最大,模型的準確率、靈敏度和特異度分別為0.739、0.733 和0.814。見圖6和表1。
表1 7 種模型識別發(fā)病4.5 h 內(nèi)AIS 患者的性能Tab. 1 Performances of 7 models in identification of AIS patients with onset time within 4.5 h
圖6 7 種模型識別發(fā)病4.5 h 內(nèi)AIS 患者的ROC 曲線Fig. 6 ROC curves of AIS patients with onset time within 4.5 h identified by 7 models
與AIS 相關(guān)的影像學檢查中,DWI 是反映腦組織缺血后發(fā)生細胞毒性水腫最敏感的序列,液體衰減反轉(zhuǎn)恢復(fluid attenuated inversion recovery,F(xiàn)LAIR) 可以較好地顯示發(fā)生血管源性水腫的腦梗死病灶[24]。FLAIR 高信號提示血腦屏障的完整性遭到破壞,該影像學現(xiàn)象常出現(xiàn)于AIS 發(fā)生后的數(shù)小時內(nèi)[25]。對于發(fā)病時間不明的AIS 患者,可通過讀取DWI-FLAIR 不匹配信息判斷患者發(fā)病時間是否在4.5 h 內(nèi)[26-27],常規(guī)的人工判讀難以對其進行精準區(qū)分,EMERIAU 等[28]發(fā)現(xiàn):通過人工讀取DWI-FLAIR 不匹配信息識別發(fā)病4.5 h 內(nèi)AIS 患者的敏感度和特異度僅為0.55 和0.60。郭靜麗等[29]報道:人工通過DWI-FLAIR 識別發(fā)病4.5 h 內(nèi)AIS 患者的AUC、準確率、靈敏度和特異度分別為0.634、63.8%、0.667 和0.622。評估DWI 存在較強的主觀性,DWI-FLAIR 不匹配信號的人工讀取結(jié)果一致性偏低。LEE[11]等發(fā)現(xiàn):由2 名腦卒中疾病的專家對DWI-FLAIR 不匹配信息的視覺評估一致性僅為73.2%。與傳統(tǒng)的人工方法比較,機器學習模型可以更有效地識別發(fā)病4.5 h 內(nèi)的AIS 患者。
隨著計算機技術(shù)的不斷改進,機器學習在AIS領(lǐng)域的應用呈現(xiàn)出強勁的增長態(tài)勢。使用機器學習方法可進行AIS 患者早期診斷和病灶自動分割、自動化Alberta 卒中項目早期CT 評分(Alberta Stroke Program Early CT Score,ASPECTS)、自動化TOAST 分型、預測AIS 患者最終梗死灶、預測AIS 患者出血轉(zhuǎn)化概率和預測AIS 患者預后效果等[30-35]。目前,結(jié)合DWI 識別發(fā)病4.5 h 內(nèi)AIS 患者的機器學習方法的研究較多,HO 等[10]等以DWI、FLAIR、表觀彌散系數(shù)(apparent diffusion coefficient, ADC) 序列和灌注加權(quán)成像(perfusion weighted imaging,PWI)四模態(tài)核磁影像為基礎(chǔ)訓練的Logistic 回歸模型識別發(fā)病4.5 h 內(nèi)AIS 患者的AUC、靈敏度和特異度分別為0.765、0.788 和0.609。LEE 等[11]依據(jù)DWI、ADC 和FLAIR 影像訓練的Random Forest 模型識別AIS 患者的AUC、靈敏度和特異度分別為0.851、0.758和0.826。本研究結(jié)果顯示:XGBoost 模型識別發(fā)病4.5 h 內(nèi)AIS 患者具有較大的AUC 和較高的準確度、靈敏度和特異度。本研究可僅使用DWI 訓練模型識別發(fā)病4.5 h 內(nèi)AIS 患者,DWI 較FLAIR 和PWI 在AIS 的診療中使用更加廣泛,且更為廉價和易獲取,在部分經(jīng)濟欠發(fā)達和醫(yī)療水平相對落后的地區(qū)也可常規(guī)獲取,具有較好的通用性。
綜上所述,基于DWI 的XGBoost 模型可有效識別發(fā)病4.5 h 內(nèi)AIS 患者,對于輔助評估AIS 患者發(fā)病時間具有一定的臨床意義。