范飛,戴鑫華,占夢軍,李媛,張奎,鄧振華
四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院,四川 成都610041
年齡推斷是個體識別的重要方法之一,成人骨骼和牙齒發(fā)育已基本停止,青少年年齡推斷常用的觀測指標(biāo)與方法,如骨骺閉合和牙齒發(fā)育的狀況,不適用于成人年齡推斷。但成人的部分骨骼仍表現(xiàn)出一定規(guī)律性的增齡性變化,如恥骨聯(lián)合面[1]、耳狀面[2]、顱縫[3]、肋軟骨[4]、喉軟骨[5-6]等。甲狀軟骨、環(huán)狀軟骨是喉軟骨中較大的2 塊軟骨,大部分為透明軟骨,喉軟骨部位的計(jì)算機(jī)體層成像(computed tomography,CT)掃描片,可觀察甲狀軟骨骨化、環(huán)狀軟骨骨化、舌骨大角與舌骨體骨性結(jié)合等在成人期表現(xiàn)出一定的規(guī)律性[7]。但目前喉軟骨在成人年齡推斷的適用性備受爭議[5-10]。因此,本研究應(yīng)用CT 圖像重組聯(lián)合數(shù)據(jù)挖掘技術(shù)探索喉軟骨和舌骨用于成人年齡推斷的可行性。
收集四川大學(xué)華西醫(yī)院2015—2017 年的頸部薄層CT,樣本年齡范圍18~<80 歲,排除影響喉軟骨和舌骨增齡性變化的疾病、外傷、手術(shù)史、用藥史,甲狀腺鈣化,圖片質(zhì)量差等情況。共收集頸部薄層CT 413 例,其中男性179 例(43.3%,平均年齡46.53 歲),女性234 例(56.7%,平均年齡44.82 歲),詳見表1。根據(jù)攝片時間和身份證記載出生日期計(jì)算樣本真實(shí)年齡,保留小數(shù)點(diǎn)后2 位。本研究為回顧性數(shù)據(jù)收集,所有頸部CT 均為臨床診療拍攝,樣本收集符合醫(yī)學(xué)倫理學(xué)有關(guān)規(guī)定。隨機(jī)篩選男性20 例(平均年齡47.52 歲)、女性20 例(平均年齡42.71 歲)作為測試集,余159 例男性(平均年齡46.41 歲)和214 例女性(平均年齡45.02 歲)為訓(xùn)練集。
本研究頸部薄層CT 掃描均采用四川大學(xué)華西醫(yī)院SOMATOM Definition AS+128 層螺旋CT(德國西門子公司)。管電壓120 kV、管電流110 mAs,層厚1.00 mm。
應(yīng)用Syngo CT 2011A 軟件(德國西門子公司)對收集的CT 影像進(jìn)行表面陰影遮蓋法(surface shaded display,SSD)重組。去除周圍組織,完全暴露喉軟骨、舌骨。直接在CT 工作站對喉軟骨、舌骨三維圖像閱片,綜合判斷喉軟骨和舌骨等級。
表1 413例樣本年齡和性別分布Tab. 1 Age and sex distribution of the 413 samples(例)
甲狀軟骨和環(huán)狀軟骨分級參照TURK 等[11]的分級方法進(jìn)行修訂,分別分為6 級(表2)和5 級(表3);舌骨骨性結(jié)合參照FISHER 等[12]的分級方法并根據(jù)本研究樣本年齡范圍進(jìn)行修訂,分為3 級(表4)。
從總樣本中隨機(jī)篩選20 例樣本由2 位觀察者重復(fù)閱片,2 位觀察者均為法醫(yī)學(xué)博士研究生,第1 位觀察者2 周后重復(fù)閱片,進(jìn)行Kappa 檢驗(yàn)評估方法一致性。各指標(biāo)與年齡之間進(jìn)行Spearman 相關(guān)性檢驗(yàn)。應(yīng)用訓(xùn)練集訓(xùn)練并建立成人年齡推斷的多元線性回歸(multiple linear regression,MLR)模型、支持向量回歸(support vector regression,SVR;kernel=rbf)模型和貝葉斯嶺回歸(Bayesian ridge regression,BRR)模型。模型構(gòu)建均采用scikit-learn 0.17 機(jī)器學(xué)習(xí)工具包(Python 語言)完成,Python 代碼從Scikit-Learn 官網(wǎng)(https://scikit-learn.org/stable/)中獲取。一般描述性分析和相關(guān)性分析采用SPSS 22.0 軟件(美國IBM 公司),檢驗(yàn)水準(zhǔn)α=0.05。
為評估模型準(zhǔn)確性和泛化能力,對模型進(jìn)行留一交叉驗(yàn)證,并應(yīng)用測試集計(jì)算年齡推斷回歸模型的平均絕對誤差(mean absolute error,MAE)、偏差以及絕對誤差(absolute error,AE)在5 歲和10 歲以內(nèi)的概率。
表2 甲狀軟骨分級Tab. 2 Stage classification of thyroid cartilage
Kappa 檢驗(yàn)結(jié)果顯示,喉軟骨和舌骨閱片分級一致性較好。其中,甲狀軟骨骨化分級組內(nèi)一致性0.857,組間一致性0.793;環(huán)狀軟骨骨化閱片分級組內(nèi)一致性0.779,組間一致性0.715;舌骨骨性結(jié)合閱片分級組內(nèi)一致性0.879,組間一致性0.840。
從圖1可知,各指標(biāo)隨年齡變化的趨勢不大,各等級間年齡重疊較大。各指標(biāo)與年齡中等或低等相關(guān),男性與年齡相關(guān)性略高于女性,男性右側(cè)舌骨與年齡相關(guān)性最高,女性甲狀軟骨與年齡相關(guān)性最高(表5)。
表3 環(huán)狀軟骨分級Tab. 3 Stage classification of cricoid cartilage
表4 舌骨分級Tab. 4 Stage classification of hyoid bone
年齡推斷模型(表6~7)中,SVR 的準(zhǔn)確性最高,在男性中明顯優(yōu)于MLR 和BRR,在女性樣本中SVR的優(yōu)勢不明顯。建立的MLR:
男性:y=-4.69+4.83x1+4.06x2+8.94x3+6.89x4(R2=0.594), (1)
女性:y=7.43+6.07x1+5.55x2+0.39x3+1.65x4(R2=0.287), (2)
其中,y為年齡,x1為甲狀軟骨等級,x2為左側(cè)舌骨等級,x3為右側(cè)舌骨等級,x4為環(huán)狀軟骨等級。
圖1 各指標(biāo)年齡變化趨勢Fig. 1 The age trend of each values
表5 各指標(biāo)與年齡的相關(guān)性Tab. 5 The correlation between age and each values
表6 男性不同模型年齡推斷準(zhǔn)確性Tab. 6 Accuracy of age estimation by different models in males
表7 女性不同模型年齡推斷準(zhǔn)確性Tab. 7 Accuracy of age estimation by different models in females
1958 年,KEEN 等[13]首次將喉軟骨應(yīng)用于年齡推斷,研究133 例成人和兒童的喉軟骨影像學(xué)和組織學(xué)變化,發(fā)現(xiàn)了喉軟骨變化的性別差異。1980 年,VLCEK[14]發(fā)現(xiàn)甲狀軟骨骨化存在一定的年齡相關(guān)性,并繪制了男性甲狀軟骨每十年的變化特點(diǎn)。1993 年,TURK 等[11]將男女性甲狀軟骨骨化進(jìn)程分別分為5 個等級,環(huán)狀軟骨分為4 個等級,杓狀軟骨分為3 個等級。2008 年,GARVIN[8]研究發(fā)現(xiàn),應(yīng)用Cerny 分級方法研究離體甲狀軟骨和環(huán)狀軟骨影像的年齡變化并不準(zhǔn)確,只有28.84%的個人被分配到正確的年齡組。2010 年,DANG-TRAN 等[15]比 較 了TURK 等[11]和VLCEK[14]的甲狀軟骨分級方法,發(fā)現(xiàn)男性樣本中,TURK分級更易閱片,與年齡相關(guān)性更高。因此本研究分級方法參照TURK分級法,對喉軟骨骨化程度進(jìn)行分級。
既往研究中喉軟骨骨化影像與年齡的相關(guān)性差異較大。KEEN 等[13]研究發(fā)現(xiàn),甲狀軟骨骨化與年齡相關(guān)性較差,骨化過程變異性較大。TURK 等[11]也發(fā)現(xiàn)甲狀軟骨骨化個體差異較大,與年齡相關(guān)性較差。GARVIN[8]、YEAGER 等[9]研究發(fā)現(xiàn)喉軟骨骨化程度與年齡無直接相關(guān)性。DANG-TRAN 等[15]的CT 研究也發(fā)現(xiàn)甲狀軟骨骨化與年齡的相關(guān)性不顯著。但也有研究表明,甲狀軟骨骨化與年齡相關(guān)性較好。1995年,SUGIYAMA 等[16-17]研究發(fā)現(xiàn)喉軟骨骨化與年齡相關(guān)性非常好,可用于日本男性年齡推斷。2003年,程杰等[5-6]研究發(fā)現(xiàn),甲狀軟骨與年齡的相關(guān)性男性為0.997 1,女性為0.984 8。2003年,DE LA GRANDMAISON 等[18]研究發(fā)現(xiàn),喉軟骨(甲狀軟骨、環(huán)狀軟骨、杓狀軟骨)骨化等級總和與年齡呈正相關(guān),總相關(guān)性為0.74,雖然相關(guān)性較好,但同一年齡層喉軟骨骨化個體差異較大,因此不能單獨(dú)用于年齡推斷。既往舌骨與年齡的相關(guān)性研究中,也發(fā)現(xiàn)了較大的年齡變化[19-20]。本研究中,喉軟骨、舌骨與年齡的相關(guān)性均未超過0.6,相關(guān)性呈中等或較差。同時,本研究也發(fā)現(xiàn)同一年齡層喉軟骨骨化的個體差異性較大,致使本方法精確性不足。
既往對喉軟骨年齡推斷的研究以分析喉軟骨骨化規(guī)律為主,較少出現(xiàn)年齡推斷模型。而其他組織的年齡推斷模型多采用線性回歸模型[5-6],但線性回歸模型在年齡推斷中存在一定的局限性:(1)其數(shù)據(jù)特征要求具備線性關(guān)系,但法醫(yī)學(xué)年齡推斷指標(biāo)與年齡的關(guān)系很可能為多元非線性特征;(2)用多維數(shù)據(jù)擬合的數(shù)學(xué)模型表達(dá)多維空間的某一曲線時,傳統(tǒng)的線性回歸模型通常是在線性方程后面加高階項(xiàng),由此增加的可調(diào)參數(shù)可能增加過擬合的風(fēng)險。AYKROYD 等[21]提出,應(yīng)用線性回歸模型推斷實(shí)際年齡常會有預(yù)測殘差(1-r2,r表示實(shí)際年齡與指標(biāo)的Pearson 相關(guān)系數(shù)),而各指標(biāo)與年齡的相關(guān)系數(shù)不高,因此,應(yīng)用線性回歸模型常會引起較大的年齡估計(jì)誤差。BUK 等[22]認(rèn)為線性回歸模型不太適用于年齡推斷,提出數(shù)據(jù)挖掘技術(shù)可以較為客觀地找尋與年齡相關(guān)性較高的骨骼發(fā)育指標(biāo),有望提高年齡推斷的準(zhǔn)確性。數(shù)據(jù)挖掘?qū)?shù)據(jù)無要求,可從大量、模糊、有噪聲的數(shù)據(jù)中,提取隱含而有用的信息。因此,本研究應(yīng)用數(shù)據(jù)挖掘技術(shù)建立了年齡推斷模型的SVR 模型和BRR 模型。
2012 年,BUK 等[22]在骨盆推斷年齡的研究中應(yīng)用了多種數(shù)據(jù)挖掘技術(shù),包括決策樹、貝葉斯網(wǎng)絡(luò)、最近鄰算法、徑向基函數(shù)和自適應(yīng)進(jìn)化模型等,較為全面地闡述了高功效統(tǒng)計(jì)方法在法醫(yī)年齡推斷中的應(yīng)用。DUDZIK 等[23]認(rèn)為,應(yīng)用高功效的統(tǒng)計(jì)方法可提高年齡推斷的準(zhǔn)確性。數(shù)據(jù)挖掘技術(shù)通過對大量模糊數(shù)據(jù)進(jìn)行分析,挖掘、揭示數(shù)據(jù)中隱含的并有潛在價值的信息,可用于回歸分析。XU 等[24]比較研究了DNA甲基化推斷年齡的多元線性模型、多元非線性模型、誤差反向傳播神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(support vector machine,SVM)的準(zhǔn)確性,其中SVM 推斷年齡準(zhǔn)確性最高。FISHER 等[12]建立了舌骨推斷年齡組的累積logistic 模型,年齡層分類準(zhǔn)確率達(dá)60%。本研究應(yīng)用數(shù)據(jù)挖掘技術(shù)建立了成人年齡推斷的SVR 和BRR 模型,并與多元線性模型進(jìn)行比較,結(jié)果顯示,喉軟骨CT推斷年齡的模型中,SVR 的準(zhǔn)確性最高。SVM 可將二維轉(zhuǎn)換為高維空間,應(yīng)用最優(yōu)分類超平面更好地分開數(shù)據(jù)。但SVM 可解釋性較差。VAN VLIERBERGHE等[25]在第三磨牙推斷年齡的二次回歸模型和SVM 的比較研究中也發(fā)現(xiàn),SVM 準(zhǔn)確性略高于二次回歸模型。中國漢族男性顱縫推斷成人年齡研究中線性支持向量機(jī)準(zhǔn)確性亦高于既往線性模型[3]。
本研究應(yīng)用CT 圖像重組技術(shù),全方位地觀察喉軟骨、舌骨骨性變化情況,無需復(fù)雜前處理技術(shù),避免周圍組織干擾,省時省力。同時,應(yīng)用數(shù)據(jù)挖掘技術(shù)建立年齡推斷模型,提高了成人年齡推斷的準(zhǔn)確性。
本研究應(yīng)用數(shù)據(jù)挖掘技術(shù)建立的SVR 模型降低了喉軟骨成人年齡推斷誤差,但本研究仍存在一定的局限性:(1)本研究樣本量較小且分布不均一,20 歲以下和60 歲以上年齡層的樣本量低于其他年齡層,因此后期研究將進(jìn)一步提高樣本量樣本均衡分布,以減少樣本量對年齡推斷結(jié)果的影響;(2)在測試集中,SVR 模型推斷年齡的MAE 仍較大(男性8.67 歲,女性12.69 歲)。因此,尚不能單獨(dú)運(yùn)用喉軟骨推斷成人年齡,需結(jié)合其他方法綜合推斷年齡,如頸椎等周圍組織。后期,法醫(yī)學(xué)年齡推斷研究可探索更為高端的數(shù)據(jù)挖掘技術(shù),如過渡分析、貝葉斯網(wǎng)絡(luò)等,以進(jìn)一步提高年齡推斷的精確度和準(zhǔn)確性。