張富源,王林林,3,張 淼,3,董雯雯,3,張忠鐸,李新杰,馬星宇,杜書奎,袁浩淼,官大威,3,趙銳,3
1.中國醫(yī)科大學法醫(yī)學院 法醫(yī)司法鑒定中心,遼寧 沈陽 110122;2.智慧司法鑒定聯(lián)合實驗室,遼寧 沈陽 110122;3.遼寧省法醫(yī)學生物證據重點實驗室,遼寧 沈陽 110122
水中尸體的鑒定一直是法醫(yī)工作中的重點及難點,實踐中需要明確水中尸體的死亡時間(postmortem interval,PMI)以及死亡原因等問題。死后淹沒時間(postmortem submersion interval,PMSI)是指水中尸體從入水到被發(fā)現(xiàn)所經歷的時間[1],與其PMI 基本一致,常用于衡量水中尸體的死亡時間。有研究[2-3]提出,采用腐敗程度總評分(total aquatic decomposition score,TADS)結合累積日度(accumulated degree day,ADD)的方法推斷水中尸體PMSI,但該方法易受主觀因素影響,且不適用于早期水中尸體[4-5]。另外,盡管硅藻檢驗被認為是診斷溺死的“金標準”,但其存在假陽性和假陰性[6-7]。因此,建立或尋找具有較高準確性及特異性的方法或指標用于早期水中尸體PMSI 推斷及死因鑒別是亟須解決的法醫(yī)病理學科學問題。
代謝組學是一個新興的組學技術應用領域,專門檢測機體在疾病或者外界刺激狀態(tài)下體內組織或體液中小分子代謝物的變化情況[8]。隨著相應儀器性能的提高和代謝組學方法的發(fā)展,越來越多的學者認識到深入了解機體死后代謝過程的變化對于準確推斷PMI的重要性[9-11]。由于溺水過程涉及復雜的病理生理過程及機制[12],而且機體在死亡后體內多種生化過程因缺氧而中斷,代謝物發(fā)生不可逆的變化[13]。從整體角度分析機體的代謝變化不僅有助于深入了解溺死的病理生理過程,而且對探索水中尸體死后代謝譜變化規(guī)律與淹沒時間和死亡原因的關系具有重要意義。
近些年,國內外法醫(yī)學者針對血液、玻璃體液、房水、腦脊液、心包液及滑膜液等進行了尸體死后代謝和生物化學研究[14-18],其中玻璃體液由于解剖位置特殊,不易被破壞污染,是較為理想的研究檢材[19]。本研究擬建立大鼠溺死及死后即刻入水模型,通過LCMS/MS 代謝組學方法檢測死亡早期水中大鼠尸體玻璃體液中的小分子代謝譜,運用多元統(tǒng)計分析及機器學習算法探索代謝物的變化規(guī)律及差異,以期為水中尸體早期PMSI 推斷及死因鑒別提供參考。
Q ExactiveTMHF-X 質譜儀(美國Thermo Fisher Scientific 公司),VanquishTMNeo UHPLC 系統(tǒng)(美國Thermo Fisher Scientific 公司),Hypesil GoldTMC18選擇性HPLC 色譜柱(100 mm×2.1 mm,1.9 μm;美國Thermo Fisher Scientific 公司),D3024R 低溫離心機(美國Scilogex 公司)。
甲醇(色譜純,美國Thermo Fisher Scientific 公司),水(色譜純,美國Merck 公司),甲酸(色譜純,美國Thermo Fisher Scientific 公司),醋酸銨(色譜純,美國Thermo Fisher Scientific 公司)。
健康成年雄性SD 大鼠100 只,體質量230~270 g,由中國醫(yī)科大學實驗動物部提供。將大鼠適應性飼養(yǎng)于溫度(25±2)℃、相對濕度45%~55%、光照/黑暗12 h 交替的環(huán)境中,自由進食飲水。飼養(yǎng)1 周后進行實驗,實驗地點為遼寧省沈陽市沈北新區(qū)冬雪湖(N41°963′,E123°479′),水體為淡水湖泊,于夏季(6 月)開展實驗,整個實驗期間湖水溫度為20 ℃~25 ℃。本研究獲得中國醫(yī)科大學動物倫理學委員會審核批準(審批號CMU2019242)。
將SD 大鼠隨機分為溺死組和死后即刻入水組,每組50 只。溺死組大鼠參照WANG 等[20]方法制作大鼠溺死模型,將大鼠置于無菌網袋內,按照自然湖水中淹沒1 min、水上呼吸30 s 的步驟循環(huán),直至大鼠死亡,死亡后將其置于自然湖水中淹沒(約水下0.5 m)。對死后即刻入水組大鼠采用二氧化碳(CO2)氣體窒息處死后浸入湖水相同水深處。于死后固定時間點0、6、12、18 及24 h,在每組中提取10 只大鼠的雙側眼球玻璃體液,取材后立即將樣本置于液氮中速凍,隨后于-80 ℃保存?zhèn)錂z。每組每個時間點內取8 只大鼠的樣本用于訓練集模型構建,2 只大鼠的樣本作為測試集樣本。其中死后即刻入水(0 h)組有2 只大鼠玻璃體液取材失敗,本研究共98 份玻璃體液樣本。
抽取50 μL 玻璃體液樣本置于微量離心管中,加入200 μL 質譜級甲醇沉淀蛋白,渦旋振蕩后冰浴靜置5 min,于4 ℃下,15 000×g離心10 min。移取100 μL上清液至新的微量離心管中,加入質譜級水稀釋至甲醇含量為53%,并于4 ℃下,15 000×g離心10 min,收集上清液,上機進行分析。從每個實驗樣本中取等體積樣本混勻作為質量控制(quality control,QC)樣本,用于平衡色譜-質譜系統(tǒng)和監(jiān)測儀器狀態(tài),在整個實驗過程中對系統(tǒng)穩(wěn)定性進行評價。以53%甲醇水溶液代替實驗樣本作為空白樣本,用于去除背景離子。QC 樣本和空白樣本處理過程與實驗樣本相同。
色譜條件:Hypesil GoldTMC18 選擇性HPLC 色譜柱,柱溫40 ℃,流速0.2 mL/min。陽離子模式流動相A 為0.1%甲酸溶液,流動相B 為甲醇;陰離子模式下流動相A 為5 mmol/L 醋酸銨,pH 值9.0,流動相B 為甲醇;流動相及梯度洗脫程序見表1。
表1 LC-MS/MS 儀器的色譜柱梯度洗脫程序Tab.1 Column gradient elution procedure for LC-MS/MS instruments
質譜條件:質譜掃描范圍m/z為100~1 500,噴霧電壓3.2 kV,鞘氣流速35 mL/min,輔助氣流速為10 mL/min;離子傳輸管溫度320 ℃;極性為陽離子模式、陰離子模式;MS/MS 二級掃描模式為數據依賴型掃描。
1.5.1 數據預處理
將原始數據文件導入Compound Discoverer 3.1軟件(美國Thermo Fisher Scientific 公司),進行保留時間、質荷比等參數的篩選,然后對不同樣本根據保留時間偏差0.2 min 和質量偏差5×10-6進行峰對齊。根據質量偏差5×10-6、信號強度偏差30%、信噪比3、最小信號強度100 000、加和離子等信息進行峰提取,同時對峰面積進行定量,整合目標離子,然后通過分子離子峰和碎片離子進行分子式預測,并與mzCloud(https://www.mzcloud.org/)和mzVault、MassList 本地數據庫進行比對,采用空白樣本去除背景離子,對定量結果進行歸一化,最終得到各種代謝物的定性定量檢測結果,以Excel 格式(.xls)輸出并保存。為便于數據分析,將陽離子模式及陰離子模式下所得代謝物定性定量結果合并。
1.5.2 統(tǒng)計分析
將數據預處理所得結果導入SIMCAP 14.1 軟件(瑞典Umetrics 公司)中進行PCA 及PLS 分析,探究不同PMSI 及不同死因間玻璃體液樣本的代謝譜差異。PCA 是一種在沒有樣本分組信息的情況下對樣本進行無監(jiān)督分析的方法,常用于觀察實驗樣本和QC 樣本的自然聚類趨勢[21],依此確定實驗是否穩(wěn)定。PLS是基于已知樣本的分組信息進行模式識別的有監(jiān)督多元統(tǒng)計方法,常用于模型建立及尋找組間差異,并采用交叉檢驗和置換檢驗來驗證模型的可靠性[22]。PLS 可應用于分類及回歸問題,當應用于分類問題時稱作PLS-判別分析(discriminant analysis,DA)。PLS回歸及PLS-DA 經交叉檢驗得到驗證參數為R2X、R2Y、Q2Y。R2X為模型對自變量X數集上的解釋能力,R2Y為模型對因變量Y數集上的解釋能力,Q2Y表示模型的預測能力,R2Y、Q2Y值越接近1,說明模型可靠性越強,反之,模型越不可靠。
1.5.3 生物標志物篩選、數學模型建立及驗證
本研究借助機器學習中的隨機森林(random forest,RF)算法建立水中尸體的PMSI 推斷回歸模型及死因判別的分類器模型。如1.2 節(jié)所述,將各時間點樣本按照8∶2 的比例隨機分為訓練集及測試集。將訓練集數據導入R v3.6.1,設訓練集樣本中各種代謝物的定量結果為自變量(x),分別以各樣本的PMSI及死因為因變量(y)構建PMSI 推斷回歸模型及死因判別的分類器模型。為提高模型的應用性,減少自變量的數目,本研究以全部代謝物構建的回歸模型誤差為參考,對RF 模型進行五重十折交叉檢驗,以Inc-NodePurity 指標(該值越大,代表變量在該衡量標準下相對更加重要[23])評估各代謝物在PMSI 推斷回歸模型中的重要性,篩選并確定與模型相關性高、貢獻度大的生物標志物,并以此建立簡化數學模型。
將測試集樣本數據導入R v3.6.1并代入上述模型中,預測每個樣本的PMSI及死因,并與實際值比較以驗證模型的準確性及可靠性。以平均絕對誤差(mean absolute error,MAE)為指標評價回歸模型預測PMSI與實際值間的誤差。以受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under the curve,AUC)及正確率為指標衡量分類器模型的預測精度。其中AUC 值越接近于1 的分類器模型,表明其預測正確率越高。AUC 的判斷標準:0.50~0.70表示模型效果低,0.70~0.85 表示模型效果一般,0.85~0.95表示效果很好,0.95~1.00表示效果非常好。
通過QC、數據過濾及歸一化等數據預處理步驟,最終得到991 種代謝物,這些代謝物包括氨基酸、糖、有機酸及脂類物質等。通過無監(jiān)督的PCA 觀察不同PMSI 及不同死因尸體玻璃體液樣本的聚類特征,結果(圖1)顯示,QC 樣本緊密聚集,表明該實驗穩(wěn)定性好。不同PMSI 樣本在主成分2 軸上由下至上依次分布,特別是0 h 組與其他時間組明顯分離,說明不同PMSI 的代謝譜不同,但12、18、24 h 組間明顯重疊。此外,溺死組及死后即刻入水組樣本無法通過PCA進行有效區(qū)分。
圖1 訓練集樣本PCA 得分圖Fig.1 PCA score plot of samples in the training set
采用PLS-DA 探索水中尸體2 種死因間玻璃體液代謝譜的差異。2 種死因間在PLS-DA 圖上有較大范圍重疊,且模型不可靠(Q2Y=0.585)(圖2A),置換檢驗結果表明其未過擬合(圖2B)。進而借助RF 算法建立分類器模型,并在測試集樣本中進行驗證,AUC為0.63,正確率為50%(圖2C~D)。
圖2 溺死組及死后即刻入水組大鼠尸體玻璃體液代謝譜的差異比較Fig.2 Comparison of vitreous humor metabolic profile differences between drowning and postmortem immediately submersion rats cadavers
PCA 分析結果顯示,淹沒早期的水中大鼠玻璃體液代謝譜具有一定的時間依從性。2 種死因間玻璃體液代謝譜差異較小,將不同死因組樣本一并分析,應用有監(jiān)督的PLS回歸方法探索水中尸體玻璃體液代謝譜的時間變化規(guī)律。在PLS 回歸得分圖(圖3A)中,不同PMSI 在主成分1 軸方向上由左至右依次分布,模型的置換檢驗結果證明其未過擬合(200次,圖3B),表明水中淹沒早期大鼠的玻璃體液代謝譜變化具有良好的時間規(guī)律性。
圖3 水中尸體玻璃體液代謝譜變化規(guī)律Fig.3 Changing pattern of vitreous fluid metabolic profile of cadavers in water
基于代謝譜變化規(guī)律,借助RF 算法,構建了PMSI 推斷模型(以下稱為“全代謝物回歸模型”),并應用測試集樣本進行驗證。RF 回歸模型對測試集樣本的PMSI 預測值與實際值比較,MAE 為0.827 h(圖3C、表2)。
表2 全代謝物回歸模型及簡化回歸模型對測試集樣本的預測結果Tab.2 Full regression model and simplified regression model prediction results of metabolites for the samples in the test set (h)
對全代謝物回歸模型進行五重十折交叉檢驗,結果表明,模型的預測誤差隨模型中變量(代謝物)數的增加呈現(xiàn)先下降后逐漸升高的趨勢(圖3D)。
以全代謝物回歸模型誤差為參考,盡量減少模型中指標的數量,結合模型建立過程中得到的Inc-NodePurity 指標評估各代謝物的重要性,最終篩選出13 種生物標志物(表3),其中7-甲基黃嘌呤及N2,N2-二甲基鳥苷重要性明顯高于其他生物標志物。
表3 篩選出的13 種生物標志物信息Tab.3 Information of 13 biomarkers selected
篩選出的生物標志物的熱力圖(圖4)顯示,僅死后即刻入水組中18 h 的個別樣本的代謝物含量與組內其他樣本有較大差異外,13 種生物標志物含量均呈現(xiàn)較好的PMSI 依賴性變化趨勢?;?3 種代謝物的含量變化重新建立簡化回歸模型并應用測試集樣本進行驗證,簡化回歸模型MAE為0.847 h(圖5、表2),該簡化模型預測結果與全代謝物回歸模型的結果之間差異無統(tǒng)計學意義(P>0.05)。
圖4 13 種生物標志物含量變化熱力圖Fig.4 Heat map demonstrating dynamic changes in 13 biomarkers
圖5 簡化回歸模型對測試集樣本的預測結果與實際結果比較Fig.5 Comparision between simplified regression model prediction results for the test set samples and actual results
自然界多種水體環(huán)境中均可能發(fā)現(xiàn)人類尸體,如江河、海洋及水庫等,常為自殺、意外落水、他殺后拋尸入水及自然災害導致死亡[3]。水中尸體PMSI 推斷及死因判別對相關案件的偵破具有重要意義,但現(xiàn)有PMSI 推斷方法的準確性有待提高。LC-MS/MS 技術將色譜高分離性能與質譜高靈敏度、高選擇性及高通量的優(yōu)點相結合,可同時檢測死后機體內多種物質或指標的變化及差異[24],為水中尸體的研究提供了有力工具。本研究基于LC-MS/MS 技術檢測并分析25 ℃左右的淡水自然環(huán)境中水中早期大鼠玻璃體液中的代謝譜,初步探索了玻璃體液代謝組學在推斷水中尸體早期PMSI 和死亡原因方面的應用。
本研究在所有樣本中共檢測到991 種代謝物,包括多類代謝物,構成了早期水中大鼠玻璃體液腐敗過程中的代謝譜。HIRAKAWA 等[25]通過研究大鼠的肌肉代謝譜發(fā)現(xiàn)不同死因間代謝特征明顯不同,并提出代謝組學可用于死因鑒別。但本研究通過PCA、PLS-DA 及分類器模型均未觀察到溺死組及死后即刻入水組間的差異,說明通過玻璃體液代謝物尚不能有效鑒別水中尸體的死因,這可能與以下原因有關:(1)死亡過程產生的代謝物在不同組織中具有較大的差異;(2)外部或內部刺激引起機體某一組織或器官的代謝變化能夠通過血液影響其他組織或器官的代謝譜,玻璃體液受血流的影響較小[26]。以上分析提示,玻璃體液代謝譜受死因影響小,也為適用于水中不同死因尸體的PMSI 推斷研究提供了基礎。研究[14,27]表明,玻璃體液中代謝物變化比血液更加緩慢、平穩(wěn),且其代謝物濃度與PMI 之間的相關性更強。本研究通過PCA 及PLS 回歸分析均可觀察到玻璃體液代謝譜在死后24 h 內連續(xù)變化,說明在淡水自然水體環(huán)境中玻璃體液代謝譜變化具有較好的時間規(guī)律性。死后機體的腐敗涉及各種代謝物,其變化和PMI 間的相關性非常復雜,無法簡化地通過單一指標的線性回歸來解釋[28]。相較于傳統(tǒng)統(tǒng)計分析方法,RF 算法等人工智能機器學習算法可學習變量之間的復雜關系并建立數學模型,從而實現(xiàn)更準確的預測,更適于高維數據的處理與分析[29]。本研究基于代謝物集群的含量變化應用RF 算法建立回歸模型用于水中尸體PMSI 推斷,表明了玻璃體液中的代謝物能夠較準確地推斷水中尸體早期PMSI。
盡管本研究基于全部的代謝物構建了能夠用于推斷水中尸體PMSI 的模型,但研究[28]表明,死后多種代謝物的含量變化并非全部都與PMI 具有相關性,而且本研究的全代謝物回歸模型的交叉檢驗結果也表明模型對PMSI 預測的準確性隨著代謝物種類的增多先升高后下降。此外,為了提高該方法在水中尸體淹沒時間推斷中的可應用性,有必要對推斷PMSI 具有重要作用的代謝物進行篩選并構建簡化推斷模型。因此,以全代謝物回歸模型誤差為標準,通過RF 算法篩選到13 種含量變化具有良好時間規(guī)律性且對模型貢獻度較高的代謝物,并以此建立了準確預測PMSI的簡化模型。既往采用玻璃體液中鉀離子濃度變化推斷PMI 所建立的線性回歸方程[30]在24 h 內存在較大誤差,而本研究中得到的PMSI 推斷模型在24 h 內誤差低。同時本研究觀察到死后即刻入水組中1例經過18 h 浸泡后大鼠玻璃體液中目標代謝物含量與該亞組內其他樣本具有較大差異,原因可能是實驗對象個體間差異較大,但在該樣本存在的情況下簡化回歸模型的預測準確性依舊較高,進一步說明了該模型的可靠性。需要注意的是,本項研究仍處于實驗階段,所得結果尚需在更大數據集及人體標本中通過靶向代謝組學方法檢測目標代謝物含量變化,并借助機器學習算法構建數學模型進一步驗證。
玻璃體液中代謝物含量的死后變化可能與周圍眼組織的死后變化、毗連內眼結構的擴散、細菌的代謝活動甚至蒸發(fā)作用等密切相關[13,26]。近期應用玻璃體液進行代謝組學的研究[13-14,27,31]發(fā)現(xiàn),次黃嘌呤、?;撬?、膽堿、肌酸、甘油在內的多種代謝物與陸上不同種屬動物的死后經過時間密切相關。本研究中篩選的代謝標志物僅甘油與上述研究中結果研究一致,可能與以下原因有關:(1)死后尸體保存條件不同,陸地上環(huán)境和淡水特殊環(huán)境的差異;(2)樣本種屬的差異;(3)土壤與水體中微生物組分和豐度具有較大的差異[32],不同微生物對同種底物的降解速率及程度差異;(4)水體環(huán)境和陸地上尸體的蒸發(fā)程度差異。因此,陸地上尸體的相關研究成果并不能直接應用于水中尸體PMSI 推斷,開展水中尸體的專項研究十分必要。
本研究應用代謝組學技術結合多元統(tǒng)計分析和RF 算法對水中尸體玻璃體液代謝譜進行研究,發(fā)現(xiàn)代謝物集群隨水中尸體的淹沒時間延長呈現(xiàn)時序性變化規(guī)律,篩選的13 種生物標志物建立的簡化數學模型,有望用于水中尸體早期PMSI 的推斷。