韓春霞,鄭嘉祺,王 煥,徐凌霄,劉 俊,艾自勝
(同濟大學醫(yī)學院,上海 200092)
髖部骨折是目前許多國家面臨的重要公共衛(wèi)生問題,其有較高的發(fā)病率和死亡率,對個人和醫(yī)療保健都產(chǎn)生巨大的影響和經(jīng)濟負擔[1-2]。據(jù)估計,到2050年,全球?qū)l(fā)生626萬例髖骨骨折,其中443萬例(71%)將發(fā)生在亞洲和其他的發(fā)展中國家[3]。而股骨頸骨折作為臨床上常見的一種髖部骨折尤其值得關注,其大約占全部髖部骨折的一半[4]。大多數(shù)患者為保留自身髖部的正常功能會選擇內(nèi)固定作為主要的治療方式。但術后患者常因嚴重的并發(fā)癥面臨再次手術的風險,再手術率為高達10%~48.8%[5]。術后常見的并發(fā)癥包括骨折不愈合、股骨頭壞死以及股骨頸短縮等,其中股骨頭壞死是導致再手術的主要并發(fā)癥,發(fā)生率為10%~45%[6-7]。
機器學習正被應用于社會和科學的各個領域。而神經(jīng)網(wǎng)絡作為機器學習領域的一種數(shù)據(jù)分類算法,具有強大的非線性分類能力,尤其是針對于復雜的回歸問題[8-9]。神經(jīng)網(wǎng)絡模擬了生物大腦的模式識別能力,主要由3層組成:輸入層、隱藏層、輸出層,其通過梯度下降的方法使損失函數(shù)達到最小,從而達到最佳的預測效果。本研究將探討神經(jīng)網(wǎng)絡在預測股骨頸骨折術后并發(fā)癥方面的應用價值,為臨床研究和實踐提供更多的科學依據(jù)。
收集同濟大學附屬同濟醫(yī)院、同濟大學附屬第十人民醫(yī)院、上海交通大學附屬第六人民醫(yī)院等3家醫(yī)院2013年3月—2017年1月行內(nèi)固定手術的新鮮股骨頸骨折患者。所有病例股骨頭壞死的診斷依照X線攝片或MRI,X線攝片壞死表現(xiàn)為股骨頭硬化、囊性變、密度不勻等改變,軟骨下出現(xiàn)新月征,股骨頭塌陷變性,髖關節(jié)間隙變窄;MRI壞死表現(xiàn)為T1出現(xiàn)帶狀低信號、T2出現(xiàn)雙線征,根據(jù)X線攝片和MRI結果將患者分為壞死組和非壞死組。
納入標準:(1) 年齡≥18周歲;(2) 隨訪時間≥36個月;(3) 臨床資料完整;(4) 骨折前能獨立行走無其他損傷傷側(cè)髖關節(jié)活動受限的因素。排除標準:(1) 病理性骨折以及假體周圍骨折;(2) 多發(fā)性損傷或合并其他部位的骨折;(3) 有精神疾病或者神志不清楚的患者;(4) 長期使用激素類藥物的患者。
根據(jù)納入排除標準,共納入378例股骨頸骨折患者,其中未壞死組295例,壞死組83例。所有患者的基線信息見表1。
表1 股骨頸骨折患者基線信息Tab.1 Baseline information of patients with femoral neck fracture M(P25,P75),[n(%)]
將單因素差異有統(tǒng)計學意義的變量Logistic多因素回歸共篩選出8個變量(表2),分別是BMI、Garden分型、完全負重時間、受傷至手術時長、VAS評分、術后錯位程度、取不取內(nèi)固定、CCI。
表2 Logistic多因素回歸結果Tab.2 The results of Logistic regression
3種模型的構建均采用SPSS 20.0進行構建。MLP神經(jīng)網(wǎng)絡模型最佳參數(shù)設置:隱藏層數(shù)為2,第一層單位數(shù)為2,第二層單位數(shù)為5,隱藏層和輸出層激活函數(shù)分別為sigmoid和softmax函數(shù)。RBF神經(jīng)網(wǎng)絡模型最佳參數(shù)設置:隱藏層數(shù)為1,單位數(shù)為3,隱藏層和輸出層激活函數(shù)分別為標準化徑向基和softmax函數(shù)。
3種模型訓練集和測試集預測性能結果顯示,MLP神經(jīng)網(wǎng)絡的準確度(0.940±0.022,0.917±0.013)、精確度(0.878±0.015,0.876±0.017)、召回率(0.828±0.024、0.885±0.018)、F1分數(shù)(0.897±0.019、0.938±0.000)以及AUC(訓練集:0.940,測試集:0.923)均高于Logistic回歸模型和RSF神經(jīng)網(wǎng)絡模型,見表3、4及圖1。MLP神經(jīng)網(wǎng)絡變量重要性圖顯示排名前3的自變量分別是VAS評分、Garden分型、CCI,見圖2。
圖1 訓練集和測試集3種模型的ROC曲線圖Fig.1 ROC curves of three models for training and testing cohorts
圖2 MLP神經(jīng)網(wǎng)絡變量重要性圖Fig.2 The importance plot of variables for MLP neural network
表3 訓練集3種模型預測性能指標Tab.3 Prediction performance metrics of three models for the training cohort
訓練集和測試集3種模型預測性能指標比較結果顯示MLP神經(jīng)網(wǎng)絡在準確度、精確度、召回率、F1分數(shù)以及AUC值等性能指標方面的表現(xiàn)均優(yōu)于Logistic和RBF神經(jīng)網(wǎng)絡模型,各指標之間差異有統(tǒng)計學意義(P<0.05)見表5、6。
表4 測試集3種模型預測性指標Tab.4 Prediction performance metrics of three models for the testing cohort
表5 訓練集3種模型預測性能指標比較Tab.5 Comparison of prediction performance metrics of three models in the training cohort
表6 測試集3種模型預測性能指標比較Tab.6 Comparison of prediction performance metrics of three models in the testing cohort
近年來隨著交通以及建筑行業(yè)的興起,股骨頸骨折的發(fā)生逐漸呈年輕化趨勢,中青年股骨頸骨折患者在術后易發(fā)生股骨頭壞死,已經(jīng)成為再次手術的高危人群。目前關于術后股骨頭壞死的危險因素分析,絕大多數(shù)研究[10-13]使用的仍然是傳統(tǒng)Logistic回歸。本研究通過分析378例經(jīng)內(nèi)固定治療的新鮮股骨頸骨折患者的臨床資料和預后信息,分別使用Logistic回歸、MLP神經(jīng)網(wǎng)絡以及RBF神經(jīng)網(wǎng)絡3種方法建立股骨頸術后并發(fā)癥預測模型,尋找最佳的預后預測方法。
在本研究中,多因素分析結果顯示,VAS評分、Garden分型、術后錯位程度、髖疏松、CCI、受傷至手術時長、BMI、取不取內(nèi)固定等8個因素與術后股骨頭壞死相關(P<0.05)。VAS評分越高,Garden分型等級越高、術后錯位程度越嚴重、受傷至手術時長越長、CCI越低、BMI越高、完全負重時間越短以及保留內(nèi)固定的患者術后更易發(fā)生股骨頭壞死。本研究結果與國內(nèi)外許多研究一致,一項關于250例股骨頸骨折患者7.5年的隨訪研究表明,術后錯位程度、Garden分型以及內(nèi)固定取出均是股骨頭壞死重要的危險因素[14]。Shen等[15]和Lee等[16]的研究顯示,BMI較高的患者,其術后股骨頭壞死的發(fā)生率也明顯升高,與本研究結果一致。主要原因可能是BMI較高的患者其對骨折斷端產(chǎn)生的壓力較大,增加了骨折斷端的剪切力和移位程度,會導致血管進一步扭曲,這提示臨床上應注意對于BMI較高患者的術后恢復期間的體重管理。潘顯明等[17]對82例中青年股骨頸骨折患者進行研究發(fā)現(xiàn)下地負重行走時間越早(<6個月),股骨頭缺血壞死概率越大,壞死的程度也越重,與本研究結果一致。因此,對于術后的患者應主張早活動晚負重的理念,來降低術后股骨頭壞死的發(fā)生率[18]。此外,本研究還發(fā)現(xiàn)VAS疼痛評分以及CCI與術后股骨頭壞死也有較強的關聯(lián),這可能主要是由于VAS疼痛評分較高和CCI較低的患者大多為高能量損傷的中青年患者,骨折移位程度較大,血管扭曲損傷程度嚴重,術后血運難恢復,從而易發(fā)生股骨頭壞死[11,19-20]。同時本研究顯示受傷至手術時間越長,股骨頭壞死發(fā)生的危險性越高,Jain等[21]的研究發(fā)現(xiàn)受傷至手術時長>12 h的患者其術后股骨頭壞死發(fā)生率明顯高于<6 h的患者,與本研究結果一致;然而Xu等[22]的一項Meta分析并未發(fā)現(xiàn)受傷至手術時長與股骨頭壞死之間存在關聯(lián),可能是由于各研究人群以及受傷至手術時長分組不一致,導致研究存在偏倚,所以受傷至手術時長對于股骨頭壞死的影響還需進一步深入研究。
神經(jīng)網(wǎng)絡作為一種非線性分類模型,其通過神經(jīng)元儲存大量的信息,提高了對于數(shù)據(jù)信息的記憶力,便于處理高噪聲的復雜數(shù)據(jù),從而改善預測的精度[23-24]。本研究構建了MLP和RBF兩種神經(jīng)網(wǎng)絡模型,研究結果表明訓練集和測試集MLP神經(jīng)網(wǎng)絡模型的準確度、精確度、召回率、F1分數(shù)以及AUC值均高于Logistic回歸預測模型和RBF神經(jīng)網(wǎng)絡模型(P<0.05),表明MLP神經(jīng)網(wǎng)絡模型具有良好的表現(xiàn)性能。而且針對于機器學習領域的“黑匣子”問題,本研究通過MLP神經(jīng)網(wǎng)絡模型對所有變量的重要性進行了排序,明確了VAS評分、Garden分型、CCI以及BMI等相關變量對于預測股骨頸骨折患者術后股骨頭壞死方面的重要性,為神經(jīng)網(wǎng)絡用于個性化預測提供了依據(jù)。
本研究仍存在一些不足之處。首先,本研究收集的是上海市3家醫(yī)院的回顧性病例,且陽性樣本量偏少。其次,本研究構建的是單層神經(jīng)網(wǎng)絡,導致模型預測精度有限,后續(xù)應嘗試多層甚至更復雜的模型。最后,研究還存在未被納入的影響因素如營養(yǎng)狀況、骨密度等影響股骨頭壞死的因素。
綜上所述,MLP神經(jīng)網(wǎng)絡在預測股骨頸骨折術后股骨頭壞死方面的預測效能高于傳統(tǒng)的Logistic回歸,可以為臨床上股骨頭壞死的預防與診治提供參考依據(jù),協(xié)助臨床醫(yī)生更加精準的預測股骨頭壞死的發(fā)生,具有較好的應用前景。