(四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院,四川 成都 610041)
骨骼肌挫傷是法醫(yī)學(xué)實(shí)踐中常見的機(jī)械性損傷,挫傷時(shí)間推斷是目前法醫(yī)學(xué)鑒定中的難點(diǎn)之一。既往推斷骨骼肌挫傷時(shí)間的研究大多是對單一物質(zhì)的表達(dá)變化進(jìn)行檢測,存在物質(zhì)的某一表達(dá)值對應(yīng)兩個(gè)甚至多個(gè)時(shí)間點(diǎn)的現(xiàn)象,因此難以準(zhǔn)確界定挫傷時(shí)間的范圍。
代謝組學(xué)是在20世紀(jì)90年代后期,繼蛋白組學(xué)、轉(zhuǎn)錄組學(xué)、基因組學(xué)之后發(fā)展起來的系統(tǒng)生物學(xué)的一個(gè)新分支,以生物樣本中相對分子質(zhì)量<1000的小分子物質(zhì)為研究對象,如糖類、脂類、氨基酸、核苷酸等,通過氣相色譜-質(zhì)譜法(gas chromatography-mass spectrometry,GC-MS)、液相色譜-質(zhì)譜法(liquid chromatography-mass spectrometry,LC-MS)和核磁共振(nuclear magnetic resonance,NMR)等技術(shù)獲得大量的機(jī)體代謝物隨時(shí)間變化的信息,實(shí)現(xiàn)對機(jī)體受刺激或擾動前后代謝產(chǎn)物譜圖及其動態(tài)變化的整體監(jiān)測,利用主成分分析(principal components analysis,PCA)、偏最小二乘判別分析(partial least square-discriminant analysis,PLS-DA)、正交偏最小二乘判別分析(orthogonal partial least square-discriminant analysis,OPLSDA)等多元統(tǒng)計(jì)分析方法對數(shù)據(jù)進(jìn)行降維分析,在已知高維數(shù)據(jù)中找到規(guī)律對未知樣本進(jìn)行判別分析[1]。近年來,代謝組學(xué)廣泛應(yīng)用于各學(xué)科領(lǐng)域的研究,HAO等[2]利用超高效液相色譜-質(zhì)譜(ultra-high performance liquid chromatography-mass spectrometry,UPLC-MS)代謝組學(xué)方法對慢性低劑量高滅磷中毒的大鼠尿液進(jìn)行分析,認(rèn)為可以將二甲基硫代磷酸鹽作為高滅磷中毒的敏感性指標(biāo)。朱士勝[3]運(yùn)用1HNMR代謝組學(xué)方法研究了彌漫性軸索損傷(diffuse axonal injury,DAI)大鼠血漿中代謝物質(zhì)的變化,篩選出32種可能為DAI早期診斷提供可靠依據(jù)的特異性標(biāo)志物,說明了代謝組學(xué)用于進(jìn)行DAI早期診斷的可能。
本研究在建立大鼠骨骼肌不同挫傷時(shí)間模型基礎(chǔ)上,利用GC-MS技術(shù)獲取大鼠的血清代謝物數(shù)據(jù),比較PCA、PLS-DA和OPLS-DA 3種模式識別方法的識別預(yù)測能力,選擇識別能力高的方法篩選生物標(biāo)志物;利用支持向量機(jī)(support vector machine,SVM)對所獲取的生物標(biāo)志物數(shù)據(jù)進(jìn)行分析及建模,初步探討其在大鼠骨骼肌挫傷時(shí)間推斷中應(yīng)用的可能性,以期為大鼠骨骼肌挫傷時(shí)間的推斷提供新思路。
健康成年雄性SD大鼠60只(購自成都達(dá)碩實(shí)驗(yàn)動物有限公司)被隨機(jī)分為10個(gè)實(shí)驗(yàn)組(傷后0、2、4、8、12、24、48、96、144、240 h組),1個(gè)對照組和1個(gè)驗(yàn)證組(傷后192 h組),每組5只。所有實(shí)驗(yàn)過程均遵守四川省實(shí)驗(yàn)動物管理委員會的規(guī)定,符合《實(shí)驗(yàn)動物管理和使用指導(dǎo)》。
1.2.1 模型制備與樣本收集
所有大鼠均適應(yīng)性喂養(yǎng)3d。參照自由落體打擊裝置[4]將500 g砝碼從90 cm高處自由下落,打擊1次造成大鼠左后肢骨骼肌挫傷。確保打擊處皮膚完整,皮下出血、腫脹伴爬行時(shí)患肢拖拉,脛腓骨未捫及骨折。實(shí)驗(yàn)組大鼠分別在傷后0、2、4、8、12、24、48、96、144、240h脫頸椎處死,驗(yàn)證組大鼠在傷后192h脫頸椎處死。對照組大鼠不造成損傷,在適應(yīng)性喂養(yǎng)3 d后脫頸椎處死。大鼠處死后立即從腹主動脈采血分離上清液凍存。取挫傷區(qū)中心肌肉標(biāo)本行常規(guī)蘇木精-伊紅(hematoxylin-eosin,HE)染色,于光學(xué)顯微鏡下觀察骨骼肌的病理學(xué)改變。
1.2.2 樣本前處理
血清樣本:上述凍存的血清樣本解凍后取50μL于微量離心管中,與150 μL的-20℃冰乙腈混勻、渦旋,以離心半徑10cm,12000r/min,離心10min,取上清液吹干,肟化、硅烷化后加入內(nèi)標(biāo)硬脂酸甲酯庚烷溶液,渦旋靜置,取上清液進(jìn)行GC-MS分析。
質(zhì)量控制(quality control,QC)樣本:取所有血清樣本各50 μL于10 mL離心管中混勻,制得QC樣本。取QC樣本50 μL于1.5 mL微量離心管中,加入冰乙腈150 μL,其余操作同血清樣本。QC樣本用于物質(zhì)定性,檢驗(yàn)儀器和樣本的穩(wěn)定性。
空白對照樣本:在空的杜氏小管中加入100 μL冰乙腈,用氮吹儀吹干,其余操作同血清樣本。與血清樣本、QC樣本代謝產(chǎn)物數(shù)據(jù)進(jìn)行對比,去除干擾物數(shù)據(jù)。
1.2.3 GC-MS檢測條件
使用7890A-5795C氣相色譜-質(zhì)譜聯(lián)用儀(美國Agilent公司),色譜分離采用DB-5MS毛細(xì)管柱(30 m×0.25 mm,0.25 μm),載氣為高純氦氣,流速為1.0mL/min,進(jìn)樣口溫度為250℃,輔助加熱器溫度為230℃,分流比為10∶1;起始溫度為60℃,保持1min,以8℃/min升至300℃,最后保持5min。質(zhì)譜離子源溫度為230℃,最大值為250℃,四極桿溫度為150℃,最大值為200℃,電離能量為70 eV,全掃描模式,掃描范圍m/z 50~600。
利用AMDIS 6.51軟件(美國NIST公司)對GC-MS數(shù)據(jù)去卷積,以峰面積>10000、匹配度>80%[5]定性色譜峰,比對美國國家標(biāo)準(zhǔn)與技術(shù)研究所(National Institute of Standards and Technology,NIST;https://www.nist.gov)14質(zhì)譜庫、結(jié)合人類代謝組學(xué)數(shù)據(jù)庫(Human Metabolome Database,HMDB;https://hmdb.ca)進(jìn)行色譜峰定性,通過色譜峰對齊、污染物排除、缺失值填補(bǔ)、數(shù)據(jù)歸一化等預(yù)處理后初步篩選生物標(biāo)志物,獲得代謝物名稱、保留時(shí)間、相對含量等信息,導(dǎo)入SIMCA-P 13.0軟件(瑞典Umetrics公司)進(jìn)行PCA、PLS-DA、OPLS-DA,比較3種模式識別方法的識別預(yù)測能力。
為避免過擬合,采用交叉驗(yàn)證評估模型的穩(wěn)定性及預(yù)測能力[6],Q2>0.5為可靠模型,Q2>0.9為優(yōu)秀模型,且 R2、Q2值差距不大于 0.2~0.3 為好[7],R2、Q2值越接近1說明模型可靠性越強(qiáng)。以R2、Q2值比較3種模式識別方法的識別預(yù)測能力。置換驗(yàn)證用于驗(yàn)證模型的可靠度,R2與Q2值小于得分圖中原始值,并且Q2回歸直線與Y軸交點(diǎn)小于0說明該模型有效[8]。
通過以上標(biāo)準(zhǔn)選擇最佳模式識別方法,以變量投影重要性(variable importance in projection,VIP)>1.0且單因素方差分析P<0.05為條件進(jìn)一步篩選生物標(biāo)志物。分別以初步篩選的生物標(biāo)志物和進(jìn)一步篩選出的生物標(biāo)志物相對含量作為輸入向量,以實(shí)際損傷時(shí)間為輸出向量建立SVM回歸模型,為防止模型過擬合,選擇70%數(shù)據(jù)(36個(gè)樣本)作為訓(xùn)練集,30%數(shù)據(jù)(14個(gè)樣本)作為測試集。以驗(yàn)證組(傷后192h組)數(shù)據(jù)為驗(yàn)證集,通過預(yù)測損傷時(shí)間與真實(shí)損傷時(shí)間的差值及預(yù)測損傷時(shí)間均方根誤差(root mean square error,RMSE)初步判斷模型預(yù)測能力。
對照組大鼠骨骼肌大體觀察及組織病理學(xué)檢驗(yàn)均未見明顯異常。
實(shí)驗(yàn)組大鼠大體觀察見損傷處皮膚完整,皮下出血、腫脹,解剖確定無脛腓骨骨折。組織病理學(xué)檢驗(yàn)發(fā)現(xiàn),骨骼肌挫傷后即可見皮下出血,部分肌纖維斷裂。傷后2~4h出血加重,肌纖維變性,間質(zhì)水腫。傷后8h部分骨骼肌出現(xiàn)不同程度壞死,橫紋不清,間質(zhì)水腫加重,較多中性粒細(xì)胞浸潤。傷后12~24h骨骼肌進(jìn)一步壞死,橫紋消失,間質(zhì)水腫明顯,中性粒細(xì)胞較前增多,可見較多單核巨噬細(xì)胞和少量淋巴細(xì)胞(圖1)。傷后48h組織疏松水腫仍較明顯,中性粒細(xì)胞較前明顯減少,單核巨噬細(xì)胞和淋巴細(xì)胞增多,挫傷區(qū)大片肌細(xì)胞壞死解離。傷后96h損傷區(qū)周邊紅細(xì)胞溶解,周圍可見新生毛細(xì)血管出現(xiàn),中性粒細(xì)胞進(jìn)一步減少,以單核巨噬細(xì)胞和淋巴細(xì)胞為主的炎癥細(xì)胞散在浸潤。傷后144~240h損傷區(qū)各炎癥細(xì)胞進(jìn)一步減少,可見肉芽組織形成。
圖1 對照組及傷后24h組大鼠骨骼肌的組織病理學(xué)變化(HE×400)Fig.1 Histopathological changes of skeletal muscle of rats in control group and 24h after injury group(HE×400)
2.2.1 QC樣本分析
將QC樣本、對照組樣本和實(shí)驗(yàn)組樣本的所有代謝物數(shù)據(jù)一起導(dǎo)入SIMCA-P 13.0軟件中進(jìn)行PCA分析,發(fā)現(xiàn)QC樣本分布較為集中,提示系統(tǒng)誤差小,實(shí)驗(yàn)結(jié)果可靠(圖2)。
圖2 PCA分析結(jié)果Fig.2 Results of PCA analysis
2.2.2 初步篩選生物標(biāo)志物
將前處理后的所有樣本進(jìn)行GC-MS檢測,獲得實(shí)驗(yàn)組與對照組代謝產(chǎn)物的原始譜圖(圖3,實(shí)驗(yàn)組以傷后48h組為例),因圖中色譜峰數(shù)量過多并有重疊現(xiàn)象,難以憑借肉眼區(qū)分譜圖的差異。
圖3 GC-MS檢測原始譜圖Fig.3 The original spectrum of GC-MS
將QC樣本與NIST 14質(zhì)譜庫比對,結(jié)合HMDB數(shù)據(jù)庫共選出60種內(nèi)源性代謝產(chǎn)物。各實(shí)驗(yàn)組樣本和對照組樣本經(jīng)數(shù)據(jù)預(yù)處理后,篩選出31種代謝產(chǎn)物,主要是酸類、糖類、脂類等物質(zhì)(表1)。
表1 篩選出的代謝物及其保留時(shí)間Tab.1 Selected metabolites and their retention time(時(shí)間/s)
2.2.3 進(jìn)一步篩選生物標(biāo)志物
分別以PCA、PLS-DA、OPLS-DA 3種模式識別方法對各實(shí)驗(yàn)組與對照組、相鄰時(shí)間實(shí)驗(yàn)組兩兩之間進(jìn)行多元統(tǒng)計(jì)分析,結(jié)果模型均驗(yàn)證成功(圖4~5,以對照組和傷后24 h組比較為例),且3種模式識別方法均能將各樣本明顯分離,其中OPLS-DA模式下R2、Q2值更接近1,提示該方法的識別預(yù)測能力最佳。故對全部實(shí)驗(yàn)組和對照組進(jìn)行OPLS-DA分析,進(jìn)一步篩選生物標(biāo)志物。
圖4 對照組和傷后24h組得分圖Fig.4 Score plots of 24h after injury group and control group
圖5 對照組和傷后24h組比較的模型置換驗(yàn)證結(jié)果Fig.5 Model replacement test in comparison of 24h after injury group and control group
在OPLS-DA模式下,以VIP>1.0且P<0.05為標(biāo)準(zhǔn)篩選出6種生物標(biāo)志物,分別為單硬脂酸甘油酯、乙醇胺、纈氨酸、來蘇糖、酪氨酸、棕櫚酸。6種生物標(biāo)志物的相對含量在骨骼肌挫傷后的變化見表2。單硬脂酸甘油酯含量在挫傷當(dāng)時(shí)明顯高于對照組,傷后4 h迅速下降至最低值,而后呈現(xiàn)逐漸上升趨勢。乙醇胺含量在傷后2、24、96h出現(xiàn)3次峰值,在8、48h出現(xiàn)2次谷值。纈氨酸含量在挫傷當(dāng)時(shí)低于對照組,后逐漸升高,至2h達(dá)第1個(gè)峰值后開始下降,至傷后12h降至谷值后開始上升,并于48h出現(xiàn)第2個(gè)峰值,于144h降至最低值后再次上升。來蘇糖含量在挫傷當(dāng)時(shí)高于對照組,隨后開始下降,至8h達(dá)最低值,后續(xù)在24h和144h出現(xiàn)2次峰值,在48h出現(xiàn)一次谷值。酪氨酸含量在挫傷當(dāng)時(shí)低于對照組,后上升,至4h達(dá)峰值后開始下降,于12h時(shí)降至最低值后再次上升,于96h時(shí)達(dá)最高峰。棕櫚酸含量在傷后2h達(dá)到峰值,之后隨時(shí)間延長出現(xiàn)波動,至傷后48h降至最低值。由上述結(jié)果可發(fā)現(xiàn),6種生物標(biāo)志物含量隨時(shí)間變化的規(guī)律性欠佳,難以用于進(jìn)行骨骼肌挫傷時(shí)間的推斷。
2.3.1 建立SVM回歸模型
分別以31種和6種生物標(biāo)志物數(shù)據(jù)為輸入向量,實(shí)際損傷時(shí)間為輸出向量進(jìn)行SVM建模,訓(xùn)練集和測試集的預(yù)測結(jié)果見表3。發(fā)現(xiàn)相較于6種生物標(biāo)志物數(shù)據(jù),使用31種生物標(biāo)志物數(shù)據(jù)作為輸入向量時(shí),訓(xùn)練集和測試集所識別的挫傷時(shí)間都更接近真實(shí)挫傷時(shí)間。
表2 實(shí)驗(yàn)組及對照組6種代謝物相對含量變化Tab.2 Changes of 6 metabolites in experimental group and control group[n=5,±s,濃度(/μmol/L)]
表2 實(shí)驗(yàn)組及對照組6種代謝物相對含量變化Tab.2 Changes of 6 metabolites in experimental group and control group[n=5,±s,濃度(/μmol/L)]
注:1)與對照組比較,P<0.05;2)與相鄰上組比較,P<0.05。
組別對照傷后0h傷后2h傷后4h傷后8h傷后12h傷后24h傷后48h傷后96h傷后144h傷后240h單硬脂酸甘油酯45.54±8.15 164.24±1.281)35.00±2.571)2)33.39±4.531)37.86±4.111)38.57±1.83 47.85±4.922)36.78±6.281)2)41.53±7.30 50.26±8.702)52.88±4.701)乙醇胺41.13±3.03 43.90±5.04 66.57±1.441)2)59.51±2.941)2)43.50±2.862)48.33±1.341)2)64.80±4.951)2)47.94±1.881)2)71.56±4.611)2)67.59±2.391)58.15±3.411)2)纈氨酸366.30±5.98 280.29±5.141)587.08±5.761)2)501.08±14.811)2)312.29±8.561)2)221.17±11.431)2)276.72±22.701)2)781.10±21.311)2)612.30±12.511)2)128.41±12.481)2)629.76±16.111)2)來蘇糖68.61±5.20 118.16±5.451)115.94±7.051)84.58±18.711)2)48.14±9.241)2)60.72±6.20 110.53±18.141)2)74.56±11.002)81.97±13.01 113.88±7.421)2)92.76±16.141)2)酪氨酸229.04±16.66 122.30±5.551)240.14±13.522)243.65±19.16 164.34±48.011)2)128.38±21.241)2)185.69±19.731)2)216.64±10.64 268.55±6.161)2)225.32±37.092)222.59±32.742)棕櫚酸389.80±54.96 494.80±12.251)641.33±77.741)2)501.54±9.011)2)567.95±51.641)2)498.70±48.281)2)502.68±8.501)340.77±3.901)2)385.79±6.74 406.62±37.25 404.59±18.84
表3 SVM回歸模型訓(xùn)練集和測試集的預(yù)測結(jié)果Tab.3 Prediction results of training set and test set of SVM regression model (±s,時(shí)間/h)
表3 SVM回歸模型訓(xùn)練集和測試集的預(yù)測結(jié)果Tab.3 Prediction results of training set and test set of SVM regression model (±s,時(shí)間/h)
注:“-”表示無數(shù)據(jù)。
訓(xùn)練集樣本數(shù)/n測試集樣本數(shù)/n組別傷后0h傷后2h傷后4h傷后8h傷后12h傷后24h傷后48h傷后96h傷后144h傷后240h 4534434342 6種生物標(biāo)志物預(yù)測值1.306±1.047 11.259±11.551 26.247±5.489 11.574±1.900 12.545±2.606 28.937±7.883 48.995±5.941 79.405±14.625 82.204±17.152 40.314±4.085 31種生物標(biāo)志物預(yù)測值0.094±0.012 1.935±0.090 3.990±0.102 8.002±0.118 12.270±0.289 24.029±0.113 48.306±0.937 96.013±0.119 144.040±0.122 240.010±0.127 1021121213 6種生物標(biāo)志物預(yù)測值6.979-25.312±1.532 10.555 12.344 36.617±10.116 44.353 72.451±4.781 52.474 39.122±3.873 31種生物標(biāo)志物預(yù)測值0.954-3.744±3.057 6.575 12.179 24.552±0.902 50.271 95.625±1.969 144.580 240.701±2.572
2.3.2 SVM回歸模型驗(yàn)證
將驗(yàn)證組(傷后192h組)血清樣本的相應(yīng)代謝物數(shù)據(jù)分別代入6種和31種生物標(biāo)志物的SVM回歸模型中進(jìn)行骨骼肌挫傷時(shí)間推斷。結(jié)果顯示,以31種生物標(biāo)志物建立的SVM回歸模型的推斷準(zhǔn)確性較高(表4)。
表4 SVM回歸模型驗(yàn)證結(jié)果Tab.4 Validation results of SVM regression model(n=5,±s,時(shí)間/h)
表4 SVM回歸模型驗(yàn)證結(jié)果Tab.4 Validation results of SVM regression model(n=5,±s,時(shí)間/h)
注:RMSE為均方根誤差。
RMSE 136.819 4.052生物標(biāo)志物6種31種預(yù)測損傷時(shí)間55.344±7.485 195.781±1.629
建立骨骼肌挫傷動物模型的方法有多種,不同的方法造成骨骼肌挫傷的機(jī)制相同,但骨骼肌挫傷的程度并不一致,實(shí)際應(yīng)用中以重物自由落體打擊法應(yīng)用較多。本研究在以往研究基礎(chǔ)上通過研究自由落體打擊裝置所建立的骨骼肌挫傷模型,其病理學(xué)改變典型,適用于骨骼肌挫傷的相關(guān)研究。
在代謝組學(xué)研究中,儀器狀態(tài)不穩(wěn)定、操作誤差等均會降低代謝組學(xué)數(shù)據(jù)的可靠性,所以有必要設(shè)置QC樣本對儀器穩(wěn)定性和數(shù)據(jù)可靠性進(jìn)行檢測[9]。本研究中QC樣本由所有樣本等比例混合所得,所含成分相同,在正常樣本之間穿插進(jìn)樣,利用PCA模式對包括QC樣本在內(nèi)的所有樣本進(jìn)行分析,如果QC樣本在PCA得分圖上緊密聚集,則說明儀器穩(wěn)定,代謝物數(shù)據(jù)可靠。本研究發(fā)現(xiàn),QC樣本分布較為集中,提示本研究所用儀器穩(wěn)定,所獲代謝物數(shù)據(jù)可靠,可用于后續(xù)分析。
本研究應(yīng)用OPLS-DA模式共篩選出單硬脂酸甘油酯、乙醇胺、纈氨酸、來蘇糖、酪氨酸、棕櫚酸6種生物標(biāo)志物,其含量在骨骼肌挫傷后均隨時(shí)間延長出現(xiàn)變化,但是并無明顯規(guī)律,難以用于骨骼肌挫傷時(shí)間的推斷。原因可能為OPLS-DA主要是基于線性回歸的方法在不同類別之間建立數(shù)學(xué)模型,使不同類別的樣本分離最大化,從而發(fā)現(xiàn)不同類別之間的差異性代謝物[10],而代謝組學(xué)數(shù)據(jù)并不能用簡單的線性關(guān)系來表述[11]。綜上,OPLS-DA模式能夠較好地解決代謝組學(xué)研究中的分類問題,并能尋找出導(dǎo)致類別不同的生物標(biāo)志物,但不能根據(jù)生物標(biāo)志物的含量變化直接進(jìn)行骨骼肌挫傷時(shí)間的推斷。魯翰霖[12]對大鼠挫傷后0.5、1、2 h的骨骼肌進(jìn)行代謝通路分析,發(fā)現(xiàn)各對應(yīng)時(shí)間點(diǎn)及損傷后2h內(nèi)均有特征代謝差異物及持續(xù)表達(dá)的差異代謝產(chǎn)物,差異代謝物與三羧酸循環(huán)、糖酵解、蛋白質(zhì)等多個(gè)代謝途徑相關(guān),參與了損傷早期骨骼肌抗氧化、清除壞死組織、能量供給、挫傷區(qū)蛋白質(zhì)降解與生成等過程。本研究中,生物標(biāo)志物為血清中脂類代謝物及氨基酸,其含量波動可能與損傷后能量代謝有關(guān),相關(guān)代謝通路尚待進(jìn)一步研究,以明確其含量發(fā)生差異性變化的代謝機(jī)制。
本研究中,以6種生物標(biāo)志物和31種生物標(biāo)志物均成功建立了推斷挫傷時(shí)間的SVM回歸模型。根據(jù)6種生物標(biāo)志物數(shù)據(jù)建立SVM回歸模型時(shí),在訓(xùn)練集、測試集中預(yù)測損傷時(shí)間與實(shí)際損傷時(shí)間差距均較大;對驗(yàn)證組大鼠的骨骼肌挫傷時(shí)間進(jìn)行推斷時(shí)結(jié)果為(55.344±7.485)h,與實(shí)際損傷時(shí)間(192 h)之間差值較大且RMSE值較高。根據(jù)31種生物標(biāo)志物數(shù)據(jù)建立SVM回歸模型時(shí),在訓(xùn)練集、測試集中預(yù)測損傷時(shí)間與實(shí)際損傷時(shí)間差距均較?。粚︱?yàn)證組大鼠的骨骼肌挫傷時(shí)間進(jìn)行推斷時(shí)結(jié)果為(195.781±1.629)h,與實(shí)際損傷時(shí)間(192 h)較為接近且RMSE值較低。以上結(jié)果提示,根據(jù)31種生物標(biāo)志物數(shù)據(jù)建立的SVM回歸模型的準(zhǔn)確性遠(yuǎn)高于根據(jù)6種生物標(biāo)志物數(shù)據(jù)建立的SVM回歸模型的準(zhǔn)確性,利用31種生物標(biāo)志物數(shù)據(jù)建立的SVM回歸模型用來進(jìn)行骨骼肌挫傷時(shí)間推斷的可靠性較高,其原因可能是31種代謝物的信息含量多于6種生物標(biāo)志物的信息含量。顧嘉運(yùn)等[13]發(fā)現(xiàn),樣本量達(dá)到一定值時(shí)繼續(xù)增加樣本量并不能增加SVM回歸預(yù)測的準(zhǔn)確度,本研究中特征量的多少與SVM回歸預(yù)測準(zhǔn)確度之間是否存在類似的關(guān)系,以及具體需要多少特征量以使SVM回歸模型推斷骨骼肌挫傷時(shí)間的能力達(dá)到最大化需后續(xù)進(jìn)一步分析研究。近年來,許多研究[14-17]結(jié)果表明,大鼠骨骼肌損傷后相關(guān)蛋白的表達(dá)及炎癥因子水平隨損傷時(shí)間延長呈現(xiàn)時(shí)序性變化,有望用于損傷時(shí)間的推斷,但隨著損傷時(shí)間的延長,機(jī)體代償、恢復(fù),可能會出現(xiàn)同一表達(dá)水平對應(yīng)多個(gè)時(shí)間點(diǎn)的情況。DU等[18]研究了大鼠骨骼肌挫傷后相關(guān)愈合基因的表達(dá),構(gòu)建預(yù)測模型并引入外部數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果顯示基因表達(dá)模型和多變量分析有望用于損傷時(shí)間的推斷。
本研究利用代謝組學(xué)和SVM回歸模型對骨骼肌挫傷時(shí)間進(jìn)行推斷,為尋找、探究生物標(biāo)志物用于推斷骨骼肌挫傷時(shí)間提供了新的思路。但本研究發(fā)現(xiàn),不同數(shù)量代謝物信息推斷損傷時(shí)間差異較大,且驗(yàn)證組樣本過少未能進(jìn)一步評估預(yù)測模型的泛化能力,后續(xù)研究可進(jìn)一步明確生物標(biāo)志物參與的代謝通路、優(yōu)化構(gòu)建SVM回歸模型的代謝物數(shù)量、引入多時(shí)間組的外部驗(yàn)證,以提高該方法推斷骨骼肌挫傷時(shí)間的準(zhǔn)確性和可行性。