【摘 要】目的:探討機器學習結(jié)合CT影像組學特征構(gòu)建模型預(yù)測2型糖尿病(type 2 diabetes mellitus,T2DM)患者椎體脆性骨折的準確性。方法:回顧性收集140例(新發(fā)椎體脆性骨折的T2DM患者70例,對照組70例)患者CT圖像和臨床資料。另收集18例(椎體脆性骨折的T2DM患者16例,對照組2例)患者的前次CT圖像和臨床資料作為外部驗證集。應(yīng)用單因素分析、Pear?son相關(guān)分析、最小冗余度最大相關(guān)度算法、二元logistic回歸分析和最小絕對值收縮和選擇算子模型篩選出最佳特征?;谥С窒蛄繖C、多層感知器、極端梯度提升(eXtreme Gradient Boosting,XGBoost)構(gòu)建預(yù)測模型。應(yīng)用受試者工作特征曲線下面積(area under the curve,AUC)對模型效能進行評估。結(jié)果:從每例患者的CT圖像中提取了1 037個影像組學特征,然后精簡為14個影像組學特征。17個臨床特征中性別、年齡、體質(zhì)指數(shù)是預(yù)測結(jié)果的獨立因素。其中XGBoost分類器表現(xiàn)最好,訓練集中XGBoost模型的AUC分別為1.000、0.929、1.000;測試集中分別為0.954、0.862、0.969。結(jié)論:基于臨床及影像組學特征構(gòu)建的XGBoost模型可作為預(yù)測T2DM患者椎體脆性骨折的一種無創(chuàng)性輔助工具。
【關(guān)鍵詞】影像組學;機器學習;2型糖尿??;脆性骨折;計算機體層成像
【中圖分類號】R319;R587;R814.42 【文獻標志碼】A 【收稿日期】2024-02-01
隨著人口老齡化問題的加劇,2型糖尿病(type2 diabetes mellitus,T2DM)與骨質(zhì)疏松發(fā)病率逐年升高。越來越多的證據(jù)表明,2型糖尿病可能增加患者骨骼脆性,導致骨折風險[1-2]和死亡率增加[3-4],因此T2DM患者盡早做好骨質(zhì)健康管理具有重要的臨床意義。然而,目前的骨折風險評估工具不能充分預(yù)測T2DM 患者的骨折風險,這引發(fā)了大家對T2DM患者骨骼健康的關(guān)注。
對于患者的治療效果和生存周期來說,精確的診斷和預(yù)測至關(guān)重要。在這個領(lǐng)域,機器學習算法已成為不可或缺的工具,它可以挖掘大量臨床信息,比傳統(tǒng)方法具有更高的準確性和敏感性[5]。影像組學則是從醫(yī)學圖像中提取定量指標,通過使用高級數(shù)據(jù)模型算法對這些特征進行進一步分析,可以發(fā)現(xiàn)肉眼無法識別的影像特征[6-7]。本研究應(yīng)用先進的機器學習算法,提取高通量影像組學特征,可以將椎體CT圖像中所包含的肉眼無法觀測到的骨質(zhì)結(jié)構(gòu)信息量化并應(yīng)用于診斷,探討機器學習結(jié)合影像組學預(yù)測T2DM患者椎體脆性骨折的價值。
1 資料與方法
1.1 研究對象
收集重慶醫(yī)科大學附屬第三醫(yī)院2016年至2023年收治的70例新發(fā)椎體脆性骨折的T2DM患者作為病例組。男性20例,女性50例,平均年齡(71.06±9.52)歲,年齡范圍為43~90歲。病例組納入標準:①確診為2型糖尿病;②2周內(nèi)受到輕微創(chuàng)傷(相當于從站立高度或更低的高度跌倒)發(fā)生椎體脆性骨折;③或者無明確外傷史,1周內(nèi)經(jīng)磁共振確診為新發(fā)椎體脆性骨折;④有覆蓋骨折椎體的CT平掃檢查;⑤人口統(tǒng)計學和常規(guī)實驗室檢查完整。排除標準:①存在引起繼發(fā)性骨質(zhì)疏松的基礎(chǔ)疾病,如庫欣綜合征、高泌乳素血癥、吸收不良綜合征和各種胃腸道疾?。肆_恩病、慢性胰腺炎);②影響骨代謝的基礎(chǔ)疾病,如甲狀旁腺功能亢進或低下、甲狀腺功能亢進或低下、成骨不全癥、骨軟化癥、佩吉特骨病;③脊柱多發(fā)腫瘤,如骨髓瘤、轉(zhuǎn)移瘤等。將椎體分為3個區(qū)域,T1~T10為胸段,T11~L1為胸腰段,L2~L5為腰段[8]。納入的患者中,骨折部位分別為:胸段(n=7)、胸腰段(n=42)、腰段(n=21)。
對照組納入標準為:①確診為T2DM;②經(jīng)雙能X線吸收測量儀(dual-energy X-ray absorptiometry,DXA)檢查診斷為骨密度正常;③包含胸腰椎的CT平掃檢查。排除標準為:①存在引起繼發(fā)性骨質(zhì)疏松的基礎(chǔ)疾病,如庫欣綜合征、高泌乳素血癥、吸收不良綜合征和各種胃腸道疾病(克羅恩病、慢性胰腺炎);②影響骨代謝的基礎(chǔ)疾病,如甲狀旁腺功能亢進或低下、甲狀腺功能亢進或低下、成骨不全癥、骨軟化癥、佩吉特骨??;③脊柱多發(fā)腫瘤,如骨髓瘤、轉(zhuǎn)移瘤等。納入對照組患者70 例,其中男性47 例,女性23 例,平均年齡(61.83±8.51)歲,年齡范圍50~83歲。
此外,收集18例患者(納排標準同上),這些患者有本次病歷前1 年內(nèi)的相關(guān)病歷資料,前1 次的病歷資料作為外部驗證集。其中骨折患者16 例,骨密度正常患者2 例。男性5例,女性13例,平均年齡(71.50±9.65)歲,年齡范圍51~90歲。
將病例組和對照組的140例患者按照8∶2比例將數(shù)據(jù)隨機分為訓練集(112例)和測試集(28例)。訓練集用于構(gòu)建模型,測試集用于調(diào)整模型參數(shù)來優(yōu)化模型性能。外部驗證集全程不參與模型的構(gòu)建,用于評估模型的性能?;颊吡鞒桃妶D1。
根據(jù)電子病歷所記錄可獲得下列臨床數(shù)據(jù),人口學特征:包括年齡、性別、體質(zhì)量指數(shù)(body mass index,BMI)、糖尿病病程??紤]到臨床指標的適用性,故納入以下實驗室指標:包括糖化血紅蛋白、肝功能檢查、腎功能檢查。
1.2 設(shè)備及掃描參數(shù)
使用256排螺旋CT(revolution CT,GE),螺距為0.938:1,轉(zhuǎn)速為0.6 s/r。掃描參數(shù)方面,采用CT平掃模式,管電壓為100 kV,自動管電流調(diào)制范圍為200~350 mA。圖像重建方面,重建間隔為0.625 mm,重建層厚為0.625 mm。
1.3 圖像分析
圖像分割:運用3D Slicer軟件(版本:Slicer 4.11.20210226)將導入的CT平掃圖像進行感興趣區(qū)域手動逐層勾畫。感興趣區(qū)域選取骨折椎體同區(qū)域鄰近兩個椎體。其中對照組與病例組一一對應(yīng)。首先,沿著椎體皮質(zhì)骨的內(nèi)緣逐層手動勾畫,避免包含相鄰的椎間盤、椎弓根和脂肪組織,得到ROI-1。接著,使用Margin板塊中的Shrink功能將ROI-1部分向內(nèi)縮小2.5 mm,得到最終三維ROI-2(圖2)。由醫(yī)師A(初級影像醫(yī)師)完成以上所有ROI勾畫。為了評估分割中的觀察者間差異,在訓練集和測試集標注完成6個月后進行隨機抽樣,選擇60位患者由2名擁有豐富圖像分割經(jīng)驗的醫(yī)師A和B(中級影像醫(yī)師,從事影像診斷工作11年)重新勾畫感興趣區(qū)域。
圖像預(yù)處理:首先,對ROI進行歸一化,將所有影像分辨率調(diào)整到一致。然后,使用K近鄰插值法將ROI重采樣至1 mm×1 mm×1 mm的體素大小。
提取特征:使用Python平臺(版本:3.7.6)中的開源軟件包PyRadiomics(版本:3.0.1)從ROI中提取一階特征、形狀特征和紋理特征,其中紋理特征包括灰度共生矩陣特征、灰度相關(guān)矩陣特征、灰度游程矩陣特征、灰度尺寸區(qū)域矩陣特征、相鄰灰度差分矩陣特征。
可重復性分析:為評估觀察者內(nèi)和觀察者間的一致性,采用組內(nèi)相關(guān)系數(shù)(interclass correlation coefficient,ICC)對數(shù)據(jù)進行分析,并且只保留了ICC值gt;0.75的特征作為進一步的分析對象。
1.4 特征選擇、模型構(gòu)建和驗證
特征降維:為了精簡影像組學特征,得到最佳特征組合,采用單因素分析、Pearson 相關(guān)分析、最小冗余度最大相關(guān)度算法(minimum redundancy maximum relevance,mRMR)和最小絕對值收縮和選擇算子(least absolute shrinkage andselection operator,Lasso)回歸分析逐步篩選特征。
模型構(gòu)建:將經(jīng)過Lasso篩選后的影像組學特征納入3種機器學習算法支持向量機(support vector machine,SVM)、多層感知器(multi-layer perceptron,MLP)、極端梯度提升(eXtreme Gradient Boosting,XGBoost)進行建模。構(gòu)建影像組學模型、臨床模型、臨床-影像組學模型。采用受試者工作特征(receiver operating characteristic,ROC)曲線及曲線下面積(area under the curve,AUC)、準確度、靈敏度、特異度、召回率、F1值對模型的預(yù)測效能進行評估。
1.5 統(tǒng)計學方法
使用SPSS(版本:26.0)和Python(版本:3.7.6)進行臨床資料統(tǒng)計學分析。對于計量資料,采用兩獨立樣本t 檢驗分析正態(tài)分布的數(shù)據(jù);采用Mann-Whitney U 檢驗分析非正態(tài)分布的數(shù)據(jù);計數(shù)資料使用卡方檢驗或者Fisher精確檢驗進行分析;然后采用Pearson相關(guān)分析來確保特征之間不存在高度相關(guān)性(排除相關(guān)系數(shù)|r|≥0.8的特征);采用二元logistic回歸分析得到納入的臨床特征。檢驗水準α=0.05。
2 結(jié)果
2.1 臨床基線特征
按照8∶2比例將數(shù)據(jù)隨機分為訓練集(112例)和測試集(28例)。在訓練集中,患有椎體脆性骨折的患者有56例,未患有椎體脆性骨折的患者有56例。臨床特征中性別、年齡、BMI和尿酸這4個特征差異具有統(tǒng)計學意義(表1),接著進行二元logistic回歸分析,最終使用性別、年齡、BMI構(gòu)建臨床模型(表2)。
2.2 影像組學特征篩選結(jié)果
從ROI-2中共提取1 037個影像組學特征,在經(jīng)過ICC值篩選和標準化處理后,保留了665個特征進行后續(xù)分析。采用單因素分析篩選差異具有統(tǒng)計學意義的特征,共有218個特征有意義(Plt;0.05),Pearson相關(guān)分析后46個影像組學特征被保留下來。使用最小冗余度最大相關(guān)度算法,選擇mRMR排序最高的30個特征。最后進行10折交叉驗證得到Lasso模型的最優(yōu)λ值,根據(jù)最優(yōu)λ值,得到14個回歸系數(shù)不等于0的影像組學特征(圖3)。
2.3 模型構(gòu)建與評估
基于14個最佳影像組學特征(表3)和3個臨床特征通過SVM、MLP、XGBoost分類器分別建立影像組學模型和臨床模型。在影像組學模型和臨床模型中XGBoost分類器均表現(xiàn)最佳(表4),影像組學模型3個分類器的測試集AUC分別為0.862、0.806、0.954。臨床模型3 個分類器的測試集AUC分別為0.778、0.770、0.862。構(gòu)建結(jié)合兩者的臨床-影像組學模型,并繪制ROC曲線評估模型的預(yù)測效能(圖4)。測試集中XGBoost模型的AUC分別為0.954、0.862、0.969;準確度分別為0.893、0.821、0.929;靈敏度分別為0.929、0.714、1.000,特異度分別為0.857、0.929、0.857;召回率分別為0.929、0.714、1.000;F1分數(shù)為0.897、0.800、0.933。
根據(jù)XGBoost分類器構(gòu)建的臨床-影像組學模型,對外部驗證集進行驗證以了解模型的預(yù)測泛化能力。應(yīng)用ROC曲線分析驗證集病例預(yù)測的AUC、準確度、靈敏度、特異度、召回率和F1分數(shù)分別為0.969、0.944、1.000、0.938、1.000和0.800。
3 討論
脆性骨折通常指是指受到輕微創(chuàng)傷(相當于從站立高度或更低的高度跌倒)即發(fā)生的骨折,其中最常見的是椎體骨折[9]。脆性骨折嚴重威脅老年患者的生命和健康,常常是導致他們殘疾和死亡的主要原因之一。一項針對西班牙老年人群的大樣本調(diào)查顯示,男性T2DM患者髖部骨折后死亡率比非糖尿病患者高出28%,女性則高出57%[10]。護理和治療骨質(zhì)疏松癥及骨折的成本巨大,給家庭和社會帶來了沉重的負擔。因此,預(yù)防脆性骨折的發(fā)生成為了骨質(zhì)疏松治療的主要目標之一,有望以此來降低死亡率并減輕社會經(jīng)濟負擔。
T2DM患者的骨質(zhì)疏松常表現(xiàn)出低骨轉(zhuǎn)換率、成骨細胞活性下降和骨修復能力受損等特征,并且T2DM還會影響骨基質(zhì)、骨結(jié)構(gòu)和骨代謝,這些都難以通過傳統(tǒng)的DXA檢測,所以DXA可能會低估2型糖尿病患者的骨折風險[11]。世衛(wèi)組織推薦的骨折風險評估工具(fracture risk assessment tool,F(xiàn)RAX),適用于具有一個或多個脆性骨折臨床危險因素,未發(fā)生骨折且骨量減少者,特異性不足,并且它在評分時納入了T1DM風險,但是并未納入T2DM風險,1項前瞻性研究和1項回顧性研究表明,該評分低估了2 型糖尿病患者骨折風險[12-13],因此FRAX 評分對于T2DM 患者骨折風險的評估也不能滿足臨床需求。
影像組學是一種新型醫(yī)學技術(shù),它利用高通量特征提取算法,充分挖掘和分析隱含在圖像中的額外信息,超越了傳統(tǒng)基于形態(tài)學和半定量分析的影像醫(yī)學模式,為個性化醫(yī)療提供更有效的支持[14]。利用機器學習和影像組學預(yù)測骨質(zhì)健康的研究較多,但都存在一定局限性,有待進一步探討。2022年,Chen YX等[15]利用14 419例糖尿病患者的數(shù)據(jù),開發(fā)了一種結(jié)合XGBoost 和深度神經(jīng)網(wǎng)絡(luò)(Deepneural networks,DNN)的混合模型來預(yù)測T2DM 患者的骨折風險。此研究同時使用了11種機器學習方法,模型的準確率為67.76%~86.08%,精確度70.41%~87.69%?;旌夏P瞳@得了最好的性能(準確率90.38%,精確度90.52%,AUC約0.90)。Chu SJ等[16]開發(fā)了概率分類向量機算法來構(gòu)建骨折風險預(yù)測模型,而不是普遍使用的算法。結(jié)果顯示,概率分類向量機獲得了最好F1評分(0.97)。Chen的研究確定了18個糖尿病患者骨折風險的影響因素,Chu確定了17個影響因素,但是此兩項研究納入了臨床特征,而無影像學特征。為了更準確地預(yù)測髖部骨折的風險,Yosibash Z等[17]開發(fā)了一種基于CT掃描的自主有限元分析的機器學習算法,用于評估T2DM患者的髖部骨折風險。研究結(jié)果顯示,該算法在T2DM患者中的敏感性為92%,特異性為88%(交叉驗證曲線下面積AUC=0.92),表明此算法結(jié)合醫(yī)學圖像,在糖尿病患者骨折風險評估的準確性方面具有更大的優(yōu)勢。本研究將臨床數(shù)據(jù)和CT平掃圖像相結(jié)合,用機器學習模型評估T2DM患者的椎體骨折風險,也達到了較好的模型效果,外部驗證集AUC為0.969。
本研究提取CT 影像組學特征和收集臨床資料,經(jīng)過統(tǒng)計分析,篩選出14個影像組學特征和3個臨床特征。本課題組開發(fā)并驗證了3種基于CT平掃成像和臨床特征預(yù)測T2DM患者椎體脆性骨折的模型。其中臨床-影像組學模型,結(jié)合了有意義的臨床特征和影像組學特征將參與者分為骨折組和非骨折組,其效能優(yōu)于單獨的影像組學特征模型(在測試集中模型AUC、準確度、靈敏度、特異度、召回率、F1值分別為0.969、0.929、1.000、0.857、1.000、0.933和0.954、0.893、0.929、0.857、0.929、0.897),并且表現(xiàn)出較高的預(yù)測效能。研究結(jié)果顯示高齡、女性、低BMI是脆性骨折的危險因素。隨著年齡的增長,骨重建出現(xiàn)了失衡,引發(fā)進行性骨丟失。絕經(jīng)后女性雌激素水平下降,對破骨細胞的抑制作用減弱,導致骨吸收功能增強。高BMI者骨骼承受更大機械負荷,這改善了骨骼的微細結(jié)構(gòu),增強了機械負荷性細胞刺激因子的作用。這些因子作用于成骨和破骨細胞表面的機械應(yīng)力感受器,刺激骨形成并抑制骨丟失,從而增加骨密度和骨骼強度。單因素分析中顯示,低尿酸也是脆性骨折的危險因素,可能與其具有強烈的抗氧化作用,能清除體內(nèi)氧化應(yīng)激產(chǎn)生的氧自由基,避免氧化損傷有關(guān)。糖化血紅蛋白和糖尿病病程被排除了,可能是因為本研究是回顧性研究且數(shù)據(jù)量較少,存在數(shù)據(jù)偏移。
本研究仍存在一定的局限性。首先,樣本數(shù)量相對較少,所有資料采集自單一中心的病例,這限制了模型的魯棒性和泛化能力。其次,手動分割椎體,這可能導致觀察者之間和觀察者內(nèi)部特征提取的變化,自動分割方法是在未來工作中要解決的另一個問題。脆性骨折給T2DM 患者帶來嚴重的疼痛、殘疾、感染等危害,極大地降低了患者的生活質(zhì)量和生存預(yù)期,本研究提出的基于臨床資料和CT圖像的模型,表現(xiàn)出在預(yù)測T2DM患者脆性骨折風險方面的巨大潛力,可以作為放射科醫(yī)生和臨床醫(yī)生決策時的潛在輔助工具。
參考文獻
[1] Janghorbani M,Van Dam RM,Willett WC,et al. Systematic reviewof type 1 and type 2 diabetes mellitus and risk of fracture[J]. Am J Epi?demiol,2007,166(5):495-505.
[2] Vestergaard P. Discrepancies in bone mineral density and fracturerisk in patients with type 1 and type 2 diabetes:a meta-analysis[J]. Os?teoporos Int,2007,18(4):427-444.
[3] Madsen CM,Jantzen C,Norring-Agerskov D,et al. Excess mortal?ity following hip fracture in patients with diabetes according to age:a na?tionwide population-based cohort study of 154,047 hip fracture patients[J]. Age Ageing,2019,48(4):559-563.
[4] Martinez-Laguna D,Nogues X,Abrahamsen B,et al. Excess of allcausemortality after a fracture in type 2 diabetic patients:a populationbasedcohort study[J]. Osteoporos Int,2017,28(9):2573-2581.
[5] Sirsat MS,F(xiàn)ermé E,Camara J. Machine learning for brain stroke:areview[J]. J Stroke Cerebrovasc Dis,2020,29(10):105162.
[6] Mayerhoefer ME,Materka ALangs G,et al. Introduction to ra?diomics[J]. J Nucl Med,2020,61(4):488-495.
[7] Kumar V,Gu YH,Basu S,et al. Radiomics:the process and thechallenges[J]. Magn Reson Imaging,2012,30(9):1234-1248.
[8] Muehlematter UJ,Mannil M,Becker AS,et al. Vertebral body in?sufficiency fractures:detection of vertebrae at risk on standard CT im?ages using texture analysis and machine learning[J]. Eur Radiol,2019,29(5):2207-2217.
[9] Ling X,Cummings SR,Mingwei Q,et al. Vertebral fractures in Bei?jing,China:the Beijing osteoporosis project[J]. J Bone Miner Res,2000,15(10):2019-2025.
[10] Tebé C,Martínez-Laguna D,Carbonell-Abella C,et al. The asso?ciation between type 2 diabetes mellitus,hip fracture,and post-hip frac?ture mortality:a multi-state cohort analysis[J]. Osteoporos Int,2019,30(12):2407-2415.
[11] 盧艷慧,李春霖. 老年2型糖尿病合并骨質(zhì)疏松的臨床進展[J]. 中華糖尿病雜志,2020,12(6):353-356.
Lu YH,Li CL. Clinical progress of senile type 2 diabetes mellitus withosteoporosis[J]. Chin J Diabetes Mellit,2020,12(6):353-356.
[12] Schwartz AV,Vittinghoff E,Bauer DC,et al. Association of BMDand FRAX score with risk of fracture in older adults with type 2 diabetes[J]. JAMA,2011,305(21):2184-2192.
[13] Fraser LA,Pritchard J,Ioannidis G,et al. Clinical risk factors forfracture in diabetes:a matched cohort analysis[J]. J Clin Densitom,2011,14(4):416-421.
[14] 劉澤群,孫文閣. 影像組學在胰腺囊性腫瘤中的應(yīng)用進展[J].中國醫(yī)學計算機成像雜志,2022,28(2):221-224.
Liu ZQ,Sun WG. Advances in radiomics ofPancreatic cystic neoplasm[J]. Chin Comput Med Imag,2022,28(2):221-224.
[15] Chen YX,Yang TY,Gao XF,et al. Hybrid deep learning modelfor risk prediction of fracture in patients with diabetes and osteoporosis[J]. Front Med,2022,16(3):496-506.
[16] Chu SJ,Jiang AJ,Chen LZ,et al. Machine learning algorithms forpredicting the risk of fracture in patients with diabetes in China[J]. Heli?yon,2023,9(7):e18186.
[17] Yosibash Z,Trabelsi N,Buchnik I,et al. Hip Fracture Risk As?sessment in Elderly and Diabetic Patients:Combining Autonomous Fi?nite Element Analysis and Machine Learning[J]. J Bone Miner Res,2020,38(6):876-886.
(責任編輯:李青穎)
基金項目:重慶市臨床重點專科建設(shè)經(jīng)費及2020年重慶醫(yī)科大學智慧醫(yī)學研究資助項目(編號:ZHYX202004)。