方雅婷,蘭瓊,解通,劉艷芳,梅書燕,朱波峰,2
(1.南方醫(yī)科大學(xué)法醫(yī)學(xué)院,廣東 廣州 510515;2.西安交通大學(xué)口腔醫(yī)學(xué)院 陜西省顱頜面精準(zhǔn)醫(yī)學(xué)研究中心,陜西 西安 710049)
人工智能技術(shù)是一門多學(xué)科間廣泛交叉的前沿科學(xué),自1956年的達(dá)特茅斯會議后,其概念和研究領(lǐng)域不斷擴(kuò)展[1]。隨著人工神經(jīng)網(wǎng)絡(luò)理論的提出,人工智能技術(shù)飛速發(fā)展,并被廣泛應(yīng)用于醫(yī)學(xué)研究等各個領(lǐng)域[2-4]。近年來快速發(fā)展的法醫(yī)學(xué)同樣面臨著獲取、分析和應(yīng)用大數(shù)據(jù),以應(yīng)對復(fù)雜鑒定問題的挑戰(zhàn)[5],很多傳統(tǒng)的學(xué)習(xí)算法已難以適應(yīng)發(fā)展的新需求[6]。如何將人工智能技術(shù)融會貫通到法醫(yī)學(xué)各個領(lǐng)域,消除人工分析時產(chǎn)生的主觀偏差,形成“人工智能+法醫(yī)學(xué)”的新模式,是當(dāng)前解決疑難復(fù)雜案件、提高實際檢案工作的效率與科研能力的新策略。本文對2015年以來人工智能技術(shù)在法醫(yī)學(xué)中最新的研究進(jìn)展及應(yīng)用前景進(jìn)行了系統(tǒng)梳理、總結(jié)與展望。
人的面部容貌雖然在生長發(fā)育中會發(fā)生變化,但是個人特征是相對固定的,因此是同一認(rèn)定和個體識別理想的生物學(xué)特征。PENG等[7]在馬爾可夫網(wǎng)絡(luò)(Markov networks)的基礎(chǔ)上,自適應(yīng)地學(xué)習(xí)組合圖像的多個表征,并采用最小誤差邊界切割(minimum error boundary cut)算法對重疊區(qū)域進(jìn)行拼接,建立基于多重表征的自適應(yīng)人臉?biāo)孛韬铣煞椒?,實現(xiàn)了高效的人臉識別。SAJID等[8]測量并評估了面部不對稱特征的尺寸及其隨年齡變化的特點,發(fā)現(xiàn)非對稱性面部特征是預(yù)測年齡的一個強(qiáng)有力指標(biāo),基于支持向量機(jī)算法針對量化的面部不對稱特征估計給定人臉圖像的年齡組,并采用卷積神經(jīng)網(wǎng)絡(luò)提取非對稱的面部特征,通過分析人臉圖像年齡組估計誤差對人臉識別算法的影響,發(fā)現(xiàn)將從年齡組估計中提取到的信息嵌入人臉識別算法中,可以大大提高人臉識別的準(zhǔn)確性。
下頜骨是頜面部重要的組成結(jié)構(gòu),因其僅以軟組織連接于上頜部,所以在尸體白骨化中易遺失。為實現(xiàn)丟失了下頜骨的頜面部重建,NINO-SANDOVAL等[9]在2016年采用支持向量機(jī)監(jiān)督學(xué)習(xí)算法選取哥倫比亞人頭顱側(cè)位X線圖像中10個顱頜關(guān)節(jié)變量對下頜骨相對于上頜骨的矢狀位置關(guān)系進(jìn)行分類,發(fā)現(xiàn)骨性Ⅱ類和骨性Ⅲ類的顱頜面結(jié)構(gòu)有不依賴于下頜骨的獨(dú)特骨性關(guān)系。2017年他們采用人工神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,基于同樣的數(shù)據(jù)集,選取了17個顱頜面形態(tài)的解剖相關(guān)變量預(yù)測上、下頜骨的位置關(guān)系,發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)的分類預(yù)測能力優(yōu)于支持向量機(jī)[10]。
另一方面,隨著人臉識別的相關(guān)研究逐步報道,如何有效地收集和管理與人臉有關(guān)的數(shù)據(jù)成了另一項挑戰(zhàn)。KAUR等[11]采用基于文本挖掘的人工智能技術(shù)對文獻(xiàn)自動注釋,嘗試開發(fā)一個可以提取面部形態(tài)學(xué)特征以及面部疾病相關(guān)信息的人臉數(shù)據(jù)庫。雖然這項工作目前仍處于初始研究階段,但其為人工智能在人臉識別中的應(yīng)用開辟了新思路與方向。
骨骼的發(fā)育過程具有連續(xù)性和階段性特征,對尸骨遺骸的年齡預(yù)測有助于推斷其死亡時的年齡。傳統(tǒng)的骨齡鑒定方法是以人工測定的方法對骨骺生長進(jìn)行分級,不僅在骨骺分類上存在一定的技術(shù)困難,而且無法消除主觀性偏差。為克服這些難題,WANG等[12]采用支持向量機(jī)對中國青少年的腕關(guān)節(jié)X線圖像進(jìn)行訓(xùn)練,構(gòu)建年齡預(yù)測模型,實現(xiàn)了對橈骨遠(yuǎn)端和尺骨遠(yuǎn)端骨骺的自動分類。ZHANG等[13]考慮到性別差異,運(yùn)用體繪制技術(shù)提取280名女性和282名男性第5頸椎至第1腰椎區(qū)域的CT圖像信息后,分別采用簡單線性回歸、多元線性回歸、梯度增強(qiáng)回歸、支持向量機(jī)和決策樹等算法構(gòu)建了男性特異性和女性特異性年齡預(yù)測模型。SPAMPINATO等[14]用公共數(shù)據(jù)集測試并評估了OverFeat、GoogLeNet和OxfordNet三種卷積神經(jīng)網(wǎng)絡(luò)模型在骨齡自動評估中的應(yīng)用,并基于處理后的X線圖像,建立了全新的用于骨齡推斷的BoNet卷積神經(jīng)網(wǎng)絡(luò)模型。LEE等[15]基于手部及腕關(guān)節(jié)X線圖像,創(chuàng)建了一個可以自動檢測并分類的卷積神經(jīng)網(wǎng)絡(luò)模型,能夠在放射科醫(yī)生的指導(dǎo)下自動生成結(jié)構(gòu)化報告,實現(xiàn)了精準(zhǔn)的骨齡評估。NAVEGA等[16]以歐洲女性的股骨為研究對象,構(gòu)建了基于骨密度測量法的人工神經(jīng)網(wǎng)絡(luò)模型用于骨齡評估。
除骨骼外,牙齒的發(fā)育情況也是年齡預(yù)測的重要指標(biāo)之一。de TOBEL等[17]先對口腔全景X線圖像對比度設(shè)置進(jìn)行優(yōu)化,評估了下頜第三磨牙的特征,并使用Adobe Photoshop CC 2017軟件以標(biāo)準(zhǔn)化的方式在其周圍放置矩形邊框,隨后利用MATLAB R2017a軟件中的機(jī)器學(xué)習(xí)算法對下頜第三磨牙的特征進(jìn)行自動識別,研發(fā)了一種基于下頜第三磨牙的年齡預(yù)測自動檢測技術(shù)。STEPANOVSKY等[18]比較了從簡單數(shù)學(xué)模型到復(fù)雜機(jī)器學(xué)習(xí)算法的22種年齡預(yù)測模型,證明基于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)挖掘方法優(yōu)于基于平均年齡的傳統(tǒng)數(shù)學(xué)模型方法,并提出了用具有代表性的中位年齡代替牙齒發(fā)育階段的方法與缺失牙病例的缺失數(shù)據(jù)替換技術(shù),構(gòu)建了基于列表多元線性回歸模型(tabular multiple linear regression model)的年齡預(yù)測模型。
當(dāng)缺乏完整的骨骼證據(jù)時,用分子生物學(xué)方法分析案發(fā)現(xiàn)場遺留的血液、組織等生物學(xué)物證所包含的信息,是法醫(yī)學(xué)年齡推斷的另一重要手段。繼多元回歸、反向傳播神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)以及隨機(jī)森林模型被應(yīng)用于基于DNA甲基化的年齡預(yù)測模型構(gòu)建后[19-20],VIDAKI等[21]選出16個CpG位點,首次應(yīng)用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建年齡預(yù)測模型,不僅提高了預(yù)測的精準(zhǔn)度,還排除了未成年以及不同種族背景的影響。FENG等[22]使用逐步向后的多元線性回歸分析和窮舉搜索算法(exhaustive searching algorithm)進(jìn)行了系統(tǒng)的特征位點選擇,確定了用于年齡預(yù)測的最優(yōu)9個CpG位點,最終構(gòu)建的年齡預(yù)測模型的精確度高于其他已經(jīng)報道的年齡預(yù)測模型,提示特征位點選擇對最終模型的性能起著至關(guān)重要的作用。目前,法醫(yī)學(xué)面臨的主要挑戰(zhàn)是法醫(yī)現(xiàn)場檢材的質(zhì)量低、可用于分析的檢材量少。同時,每種組織或體液都可能表現(xiàn)出不同的年齡相關(guān)DNA甲基化模式,且這種模式受到環(huán)境、疾病等多種因素的影響。因此,在廣泛的人類組織和細(xì)胞類型中開發(fā)一種靈敏、多組織適用的年齡預(yù)測模型是一項非常具有挑戰(zhàn)性的工作[23-24]。
在嚴(yán)重的自然災(zāi)害、重大事故案件中涉及高度腐爛、殘缺尸體遺骸時,基于兩性在骨骼形態(tài)特征上的差異,通過法醫(yī)人類學(xué)的方法對尸體遺骸進(jìn)行特征分析,無需借助DNA分型也可快速得到骨骸的性別等信息,有助于節(jié)省搜索調(diào)查的時間和資源[25]。MUSILOVA等[26]采用相干點漂移密度對應(yīng)分析(coherent point drift-dense correspondence analysis)方法對103例法國成年人的顱骨CT掃描圖像進(jìn)行分析,并基于徑向支持向量機(jī)結(jié)合交叉驗證的算法構(gòu)建了一個精準(zhǔn)度高達(dá)90.3%的性別分類器。BEJDOVA等[27]用幾何形態(tài)計量學(xué)分析154例中歐(捷克共和國)成年人的顱骨CT掃描圖像后,僅利用上面部骨骼形態(tài)構(gòu)建了支持向量機(jī)和交叉驗證結(jié)合的性別鑒定模型。2018年,GAO等[28]提取中國漢族成人的顱骨三維特征,基于模糊C均值聚類(fuzzy C-means,F(xiàn)CM)算法提出了一種用于顱骨性別鑒定的新的無監(jiān)督算法——MKDSIFFCM。經(jīng)比較發(fā)現(xiàn),在同樣的中國漢族成人顱骨樣本中,MKDSIF-FCM算法的性別鑒定精準(zhǔn)度高于決策樹、支持向量機(jī)等其他常用分類器。CAVALLI等[29]以1700例成人顱骨側(cè)位CT掃描圖為研究對象,使用模式識別和人工神經(jīng)網(wǎng)絡(luò),將監(jiān)督與非監(jiān)督技術(shù)相結(jié)合,提出一個不依賴于顱骨測量值的顱骨形狀自動建模的新方法。值得注意的是,性別二態(tài)性的程度和模式受到地域、環(huán)境等多種因素的影響[30],不同年齡、地域的人類骨骼特征可能具有差異[31]。對此,MUSILOVA等[26]提出可以通過向數(shù)據(jù)集系統(tǒng)中添加不同的種群樣本用以消除分類器的種群特異性,提高性別預(yù)測的準(zhǔn)確性。
基于毛細(xì)管電泳平臺的短串聯(lián)重復(fù)(short tandem repeat,STR)序列分型是法醫(yī)通過DNA分析解決刑事或民事訴訟案件的主要手段。如何從背景噪聲中提取真實的等位基因信息一直是STR電泳圖譜解讀的挑戰(zhàn)。傳統(tǒng)的分析方法是設(shè)定統(tǒng)一的信號強(qiáng)度閾值區(qū)分片段峰,但是往往需要專業(yè)人員調(diào)整參數(shù)才可以得出正確的STR分型結(jié)果。TAYLOR等[32-33]避開了信號強(qiáng)度閾值的使用,先是用兩個原始電泳圖譜訓(xùn)練了一個簡單的人工神經(jīng)網(wǎng)絡(luò)模型用于光譜分離,而后擴(kuò)大樣本量構(gòu)建了一個結(jié)合貝葉斯算法的人工神經(jīng)網(wǎng)絡(luò)模型,探索了人工神經(jīng)網(wǎng)絡(luò)在STR電泳圖譜峰分類上的應(yīng)用,不僅有效避免了由于擴(kuò)增不均衡造成的部分等位基因信息丟失,而且可以排除由于電泳過程中設(shè)備電流跳動等情況產(chǎn)生的偽峰干擾。2019年,TAYLOR等[34]考慮到同一實驗室可能會有多個不同的毛細(xì)管電泳分型儀器,且法醫(yī)日常檢案中的DNA樣本可能是混合樣本等復(fù)雜情況,進(jìn)一步探索了人工神經(jīng)網(wǎng)絡(luò)模型在不同電泳儀器產(chǎn)生的圖譜以及混合DNA樣本的圖譜中的可泛化性。另一方面,MARCIANO等[35]開發(fā)了一個智能等位基因檢測降噪系統(tǒng),評估了動態(tài)化閾值與機(jī)器學(xué)習(xí)相結(jié)合檢測偽峰和降噪工具的有效性。該系統(tǒng)用根據(jù)樣本內(nèi)的每個基因座計算的動態(tài)峰檢測閾值取代傳統(tǒng)的靜態(tài)分析閾值,檢測等位基因并去除低水平信號噪聲后,應(yīng)用stutter峰過濾器過濾掉stutter峰,用微調(diào)算法減少非等位基因、非stutter峰引起的噪聲,并用機(jī)器學(xué)習(xí)模型評估基因座中是否存在額外的檢測噪聲。
對于DNA混合物中DNA供者人數(shù)的準(zhǔn)確估計是法醫(yī)工作者對DNA混合物精確分析的重要前提。近些年學(xué)者們提出了不同的算法,有效地提高了準(zhǔn)確度[36-39]。但研究表明,當(dāng)DNA混合樣本中貢獻(xiàn)者人數(shù)較多時,現(xiàn)有算法往往無法對貢獻(xiàn)者人數(shù)進(jìn)行準(zhǔn)確估計。MARCIANO等[40]使用機(jī)器學(xué)習(xí)的方法來推斷混合DNA樣本中提供者的數(shù)量,評估了K近鄰(K-nearest neighbors)、分類與回歸樹(classification and regression trees)、多元邏輯回歸、多層感知器(classification and regression trees)及支持向量機(jī)5種候選機(jī)器學(xué)習(xí)算法后,構(gòu)建了最優(yōu)的貢獻(xiàn)者數(shù)量估計(probabilistic assessment for contributor estimation,PACE)系統(tǒng)。經(jīng)過驗證,發(fā)現(xiàn)在多達(dá)4個供體的DNA混合物中,PACE系統(tǒng)識別供者人數(shù)的準(zhǔn)確度仍然超過98%,是法醫(yī)評估DNA混合物中貢獻(xiàn)者人數(shù)的一個有力工具。
MONSALVE等[41]分析了244個哥倫比亞人群的顱骨特征變異,構(gòu)建了適用于哥倫比亞祖先信息推斷的人工神經(jīng)網(wǎng)絡(luò)模型。POSPIECH等[42]在考慮性別因素的影響下,使用神經(jīng)網(wǎng)絡(luò)和邏輯回歸模型研究了波蘭人群中6個IrisPlex SNP[43]在預(yù)測虹膜顏色方面的作用,結(jié)果發(fā)現(xiàn),6個IrisPlex SNP中有4個與波蘭人群的虹膜顏色有關(guān),表明虹膜顏色的遺傳具有群體特異性,且不同性別也具有差異。
JUHáSZ等[44]考慮到遷徙人口中必然包含男性和女性,同時分析了當(dāng)代歐亞和美國土著人群的線粒體和Y染色體單倍群,并與古線粒體單倍群分布比較,提出了基于單倍群逆秩向量聚類的方法揭示當(dāng)代歐亞和美國土著人群的遷移過程和史前歷史。隨后他們[45]聯(lián)合分析了歐亞大陸共同民族的單倍群遺傳數(shù)據(jù)和民間音樂數(shù)據(jù)的相關(guān)性,發(fā)現(xiàn)單倍群-統(tǒng)一輪廓類型(haplogroup-unified contour type,Hg-UCT)的逆向量決定的多維點系統(tǒng)具有非常清晰的結(jié)構(gòu),證明了民間音樂的傳播可能與早期人類遷移過程有關(guān)。
死亡時間是指從人體死亡到尸體檢驗所經(jīng)歷的時間。法醫(yī)對死亡時間的精準(zhǔn)推斷,有助于判斷嫌疑人是否有作案時間,為案件的偵查提供線索。傳統(tǒng)的技術(shù)手段包括形態(tài)學(xué)、生物化學(xué)、光譜學(xué)、代謝組學(xué)、脂質(zhì)組學(xué)、基因組學(xué)、轉(zhuǎn)錄組學(xué)、昆蟲學(xué)以及死亡微生物組學(xué)等[46]。
2019年,LI等[47]通過顯微紅外技術(shù)結(jié)合機(jī)器學(xué)習(xí)方法研究人類死后軟骨光譜學(xué)變化,建立了死亡時間推斷模型,推動了光譜成像技術(shù)結(jié)合多元數(shù)據(jù)分析(multivariate data analyses)在死亡時間推斷上的應(yīng)用發(fā)展。2018年,ZHANG等[48]采用傅里葉變換衰減全反射紅外光譜法分析尸體的玻璃體液,并引入先進(jìn)的機(jī)器學(xué)習(xí)算法,建立了貝葉斯嶺回歸、支持向量回歸和人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行死亡時間推斷。
已有研究[49-51]表明,在尸體腐敗過程中,尸體和附近土壤中的微生物群落能夠形成一個動態(tài)系統(tǒng),因此可以通過檢測尸體附近的土壤微生物估計死亡時間。METCALF等[52]分別對尸體附近土壤進(jìn)行16S rRNA基因(古菌和細(xì)菌群落)、18S rRNA基因(微生物真核生物群落)測序,提取尸體分解過程相關(guān)的微生物多樣性表征,并使用隨機(jī)森林回歸以及動態(tài)貝葉斯網(wǎng)絡(luò)探究微生物演替在不同土壤類型、季節(jié)和寄主物種中的可預(yù)測性。JOHNSON等[53]使用7種回歸算法對尸體鼻道和耳道中的皮膚微生物群落進(jìn)行分析,最終開發(fā)了一個K近鄰回歸模型評估死亡時間。
利用犯罪現(xiàn)場尸體上昆蟲的發(fā)育或演替規(guī)律來推斷死亡時間是法醫(yī)昆蟲學(xué)家們研究的重點。MOORE等[54]先用氣相色譜-質(zhì)譜聯(lián)用技術(shù)分析了麗蠅幼蟲表皮碳?xì)浠衔铮鶕?jù)其化學(xué)成分隨時間的變化構(gòu)建了基于人工神經(jīng)網(wǎng)絡(luò)的麗蠅幼蟲年齡推斷模型,隨后用同樣的方法構(gòu)建了麗蠅成蟲年齡推斷模型[55],為精準(zhǔn)死亡時間推斷提供了新方法。
REN等[56]應(yīng)用基質(zhì)輔助激光解吸電離飛行時間成像質(zhì)譜技術(shù)篩選正常大鼠與彌散性軸索損傷大鼠腦干組織的差異表達(dá)蛋白,構(gòu)建了監(jiān)督神經(jīng)網(wǎng)絡(luò)分類器,為彌散性軸索損傷的鑒定提供了依據(jù)。WEI等[57]基于豬顱骨骨折樣本開發(fā)了一種自動化的模式識別分類方法,用以區(qū)分不同場景下的顱骨骨折模式,為法醫(yī)學(xué)鑒定區(qū)分嬰幼兒意外和虐待性頭部創(chuàng)傷提供了新思路。YILMAZ等[58]以10個尸體檢驗相關(guān)參數(shù)為基礎(chǔ)構(gòu)建了可以判斷活產(chǎn)還是死產(chǎn)的人工神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)網(wǎng)絡(luò)模型。這些研究均表明了人工智能在法醫(yī)損傷鑒定及尸體檢驗死亡原因鑒定中的應(yīng)用前景。另一方面,運(yùn)用文本分類技術(shù)對尸體檢驗后生成的法醫(yī)純文本尸體檢驗報告分類,提取特征向量構(gòu)建自動化死亡原因預(yù)測模型,有效縮短了尸體檢驗后死亡原因判定的時間,提高了預(yù)測準(zhǔn)確度。MUJTABA等[59]運(yùn)用6種不同的自動文本分類技術(shù)分析43個從尸體檢驗記錄中提取的主特征向量,構(gòu)建了一個基于尸體檢驗記錄的死亡原因預(yù)測分類模型。隨后該團(tuán)隊[60]開發(fā)了一種基于概念圖的文檔表示技術(shù),并提取醫(yī)學(xué)臨床術(shù)語概念特征,通過圖形表示后使用這些特性來訓(xùn)練一個兩級文本分類器預(yù)測死亡方式及死亡原因。
隨著法醫(yī)影像學(xué)技術(shù)的發(fā)展,利用醫(yī)學(xué)成像技術(shù)和計算機(jī)軟件程序進(jìn)行虛擬解剖,通過無創(chuàng)的手段查找尸體體內(nèi)損傷與疾病,已成為死亡原因推斷的重要手段。EBERT等[61-62]開發(fā)了一種基于死后尸體計算機(jī)斷層掃描的穿刺針自動放置系統(tǒng),通過計算機(jī)斷層掃描引導(dǎo),用機(jī)器人手臂實現(xiàn)尸體穿刺針放置的自動化,提取組織和液體樣本進(jìn)行組織學(xué)和毒理學(xué)分析。但是該系統(tǒng)在處理多處穿刺等復(fù)雜情況時難以找到能夠避開與尸體解剖結(jié)構(gòu)以及已經(jīng)放置的針的最佳進(jìn)針點。為了解決這個問題,他們在2016年開發(fā)了一種新的算法[63],可以自動為給定的目標(biāo)置針點規(guī)劃有效、無碰撞的進(jìn)針軌跡用于引導(dǎo)機(jī)器人自動置針。受深度學(xué)習(xí)在醫(yī)學(xué)圖像分析中應(yīng)用的啟發(fā),2017年,EBERT等[64]用死后尸體計算機(jī)斷層掃描圖像訓(xùn)練了兩個獨(dú)立的深度學(xué)習(xí)網(wǎng)絡(luò)用以判斷心包有無積血以及心包積血的含量,證明了應(yīng)用深度學(xué)習(xí)自動檢測出血性心包積液的可行性。
ELIAERTS等[65]開發(fā)了一個用超幾何分布抽樣結(jié)合傅里葉變換紅外光譜和支持向量機(jī)算法的工具,用于采樣并快速分析可卡因和左旋咪唑,幫助執(zhí)法部門快速緝獲可卡因。同年,MOLLERUP等[66]利用人工神經(jīng)網(wǎng)絡(luò)建立了液相色譜-高分辨精確質(zhì)譜聯(lián)用技術(shù)的識別參數(shù)預(yù)測模型,可以支持毒物的初步篩查。2019年,WENDT等[67]以阿片類鎮(zhèn)痛藥曲馬多為模型藥物,以接受過曲馬多暴露的芬蘭人尸體檢驗采集的血液為樣本集,采用監(jiān)督機(jī)器學(xué)習(xí)分類算法通過識別和評估CYP2D6基因座中的單核苷酸變異實現(xiàn)CYP2D6代謝表型的自動分類,從而在法醫(yī)學(xué)中幫助調(diào)查死亡原因和死亡方式。
MIGUEL-HURTADO等[68]用21種常用的機(jī)器學(xué)習(xí)分類器通過手部的特征預(yù)測性別、身高、體質(zhì)量以及足部尺寸4種生物特征,加速了自動化的生物特征識別技術(shù)在法醫(yī)學(xué)個體識別中的應(yīng)用;HEINRICH等[69]開發(fā)了基于計算機(jī)視覺的多算法軟件工具,對尸體生前和死后的口腔全景X線片進(jìn)行分析比對,依據(jù)牙齒特征實現(xiàn)個體識別。TACKMANN等[70]分析了5個人體部位和土壤樣本的測序數(shù)據(jù),訓(xùn)練了一個具有人體部位分類性能的隨機(jī)森林模型,并報道了一組核心生物標(biāo)志物,首次用人工智能進(jìn)行了人體部位特異性微生物生物標(biāo)志物鑒定。DENG等[71]基于不同個體具有不同心電波形的時間關(guān)系和形狀,利用動態(tài)神經(jīng)學(xué)習(xí)機(jī)制開發(fā)了一種心電動態(tài)識別模型用于個體識別。
此外,應(yīng)用人工智能技術(shù)進(jìn)行交通事故鑒定[72-73]、法醫(yī)土壤生物地理模式分析[74]、燒焦骨頭的最高加熱溫度估算[75],利用質(zhì)子核磁共振波譜結(jié)合支持向量機(jī)進(jìn)行血液種屬鑒定[76],于遺傳算法等人工智能進(jìn)行血跡模式分析[77]以及結(jié)構(gòu)磁共振成像結(jié)合機(jī)器學(xué)習(xí)算法對青少年罪犯進(jìn)行心理病態(tài)特征分析及預(yù)測[78]均為法醫(yī)案件調(diào)查提供了新的科學(xué)技術(shù)方法。
以上國內(nèi)外研究表明,人工智能的計算機(jī)視覺、語音識別、自然語言處理等各個技術(shù)在法醫(yī)學(xué)個體表型特征推斷、遺傳背景研究、DNA圖譜分析、個體識別、死亡時間推斷、死亡原因鑒定、虛擬解剖、活體損傷鑒定以及毒物分析等多個方面均有著廣泛的應(yīng)用前景。
機(jī)器學(xué)習(xí)是實現(xiàn)人工智能技術(shù)的主要途徑和重要手段[79]。在早期研究報道中,人工智能技術(shù)的實現(xiàn)主要圍繞線性回歸、邏輯回歸、決策樹學(xué)習(xí)、貝葉斯網(wǎng)絡(luò)、K近鄰法、支持向量機(jī)等傳統(tǒng)的機(jī)器學(xué)習(xí)算法的運(yùn)用展開。深度學(xué)習(xí)走進(jìn)人們的視野后[80],由于在圖像識別方面具有獨(dú)特優(yōu)勢而被廣泛應(yīng)用到人臉識別、DNA電泳圖譜分析以及基于X線片、CT片的個體表型特征推斷、個體識別。此外,深度學(xué)習(xí)比傳統(tǒng)的淺層機(jī)器學(xué)習(xí)算法擁有更多的處理層,更適用于需要提取特征的大數(shù)據(jù)集挖掘[10,80-82]。由此可見,用深度學(xué)習(xí)取代淺層機(jī)器學(xué)習(xí)識別圖像、用自動學(xué)習(xí)提取層次化特征取代依靠人工經(jīng)驗提取樣本表層特征已經(jīng)成為當(dāng)下大數(shù)據(jù)時代中人工智能的發(fā)展趨勢。
法醫(yī)學(xué)領(lǐng)域中,雖然現(xiàn)在人工智能的應(yīng)用研究已經(jīng)有了突飛猛進(jìn)的發(fā)展,但其研究成果是否可以推廣到法醫(yī)的實際應(yīng)用,除了新技術(shù)帶來的倫理等方面的挑戰(zhàn)以外,還有許多問題亟待解決。第一,選擇適當(dāng)?shù)乃惴ㄊ沁\(yùn)用人工智能有效解決問題的前提。一方面,先進(jìn)的機(jī)器學(xué)習(xí)算法(如深度學(xué)習(xí))有助于人工智能的實現(xiàn),法醫(yī)學(xué)研究者還需努力學(xué)習(xí)、探索更先進(jìn)的人工智能技術(shù),將其融通到法醫(yī)學(xué)領(lǐng)域中;另一方面,在解決一些簡單問題中,傳統(tǒng)機(jī)器學(xué)習(xí)算法的快速、簡便等優(yōu)勢不可忽視。解決實際問題時,應(yīng)先考慮想要解決什么問題,選擇適應(yīng)的算法構(gòu)建人工智能模型。第二,初始訓(xùn)練的數(shù)據(jù)集足夠大、具有代表性是人工智能算法有效性的保證。上述研究多為人工智能模型的探索性研究,雖然可以實現(xiàn)相應(yīng)的廣義模型,但樣本量是否足以支持模型的可泛化,在此問題上仍存在爭議。第三,應(yīng)用機(jī)器學(xué)習(xí)算法創(chuàng)建預(yù)測模型時需要可測量的特性或觀察到的現(xiàn)象作為特征向量,選擇的特征向量過多或過少,均會導(dǎo)致生成的模型無法泛化[74]。第四,隨著分子生物學(xué)分析方法的發(fā)展,分析平臺類型也逐漸多樣化,如何消除平臺效應(yīng)成為另一個挑戰(zhàn)。無論是將z-score轉(zhuǎn)換作為標(biāo)準(zhǔn)化來排除平臺效應(yīng)[22],還是引入新的變量來表示平臺類型[83],都為解決上述問題提供了思路。第五,人工智能作為新技術(shù),其在法醫(yī)學(xué)領(lǐng)域的應(yīng)用標(biāo)準(zhǔn)仍缺乏統(tǒng)一化、規(guī)范化[84-87]。只有制定完善的法醫(yī)學(xué)專業(yè)標(biāo)準(zhǔn),才能消除人工智能可否作為法庭證據(jù)的爭議。第六,如何應(yīng)用人工智能解決復(fù)雜親緣關(guān)系鑒定、組織體液來源精準(zhǔn)溯源以及活體損傷時間鑒定、傷病因果關(guān)系判定等疑難問題還有待探索。
人工智能可以幫助法醫(yī)學(xué)鑒定工作者從龐大復(fù)雜的數(shù)據(jù)中挖掘出更深層的規(guī)律和有用的信息,使數(shù)據(jù)發(fā)揮最大化的價值。基于人工智能和自動化信息技術(shù)的特征識別技術(shù)為法醫(yī)學(xué)提供了方便、準(zhǔn)確和可重復(fù)的方法,如何應(yīng)用三維模型、醫(yī)學(xué)成像技術(shù)等方法,使用人工智能實現(xiàn)以非侵入性的方式對人群和人群之間的長期變化進(jìn)行研究的虛擬人類學(xué)、法醫(yī)DNA分析、虛擬解剖、毒物分析以及智能自動模式識別系統(tǒng)等,國內(nèi)外法醫(yī)學(xué)者已經(jīng)做出了很多的嘗試,但是想要進(jìn)一步將人工智能的優(yōu)勢融入法醫(yī)學(xué)實踐工作中,真正實現(xiàn)法醫(yī)學(xué)專家和人工智能協(xié)同工作的“人工智能+法醫(yī)學(xué)”,還需要更多的努力。