王澤宇,陳露,祁鳴
(浙江大學(xué)醫(yī)學(xué)院,浙江 杭州 310000)
人面部識別(human face recognition)技術(shù)是生物識別技術(shù)的一種,主要通過計算機(jī)與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計學(xué)原理等高科技密切結(jié)合,利用人體固有的臉形、虹膜、視網(wǎng)膜、色斑、痣疣以及指紋、靜脈紋等生物特征,和頭部動態(tài)、眨眼睛頻率、聲音、筆跡、步態(tài)等行為特征,采用不同特征表示方法分析人面部圖像,提取有效信息進(jìn)行研究。科學(xué)研究發(fā)現(xiàn),疾病不僅會造成人體內(nèi)在結(jié)構(gòu)、生理功能的異常,還可能會導(dǎo)致人面部特征、運動形態(tài)改變或畸形,尤其先天性遺傳疾病會造成面部特殊特征?;诖?,近年來,人臉面部識別技術(shù)已逐漸進(jìn)入醫(yī)學(xué)診斷領(lǐng)域,通過分析患者面部的視覺特征信息研究疾病引起的特殊面容,采集患者面部特征標(biāo)志點數(shù)據(jù),構(gòu)建患者面部模式與疾病數(shù)據(jù)庫,最終通過計算機(jī)機(jī)器診斷來確定患者的疾病類型[1-2]。本文簡要概述了人面部識別技術(shù)的發(fā)展歷史與基本原理,以及其在醫(yī)學(xué)遺傳領(lǐng)域上的發(fā)展歷史、應(yīng)用與現(xiàn)狀,為醫(yī)學(xué)領(lǐng)域的遺傳學(xué)研究提供遺傳診斷的依據(jù)[3]。
18世紀(jì),1篇基于人面部特征信息進(jìn)行身份鑒別的文章發(fā)表于《Nature》[2]上,開啟了近代人面部識別技術(shù)應(yīng)用的序幕。
目前,遺傳病診斷包括常規(guī)診斷和特殊診斷。常規(guī)診斷指與一般疾病相同的診斷方法;特殊診斷是指采用遺傳學(xué)方法,包括染色體檢查、家系分析等,是遺傳病確診的關(guān)鍵。前者耗時短但誤診率高,后者準(zhǔn)確性高卻需耗費大量的人力、物力、財力,非普通家庭所能承擔(dān)。而面部識別技術(shù)可用技術(shù)模型協(xié)助人力,以數(shù)據(jù)庫補充遺傳學(xué)分析,將線下會診轉(zhuǎn)化為線上詢診,在降低誤診率的同時提高診斷效率。據(jù)統(tǒng)計,遺傳綜合癥中已明確約有3 500 種遺傳綜合征具有明顯的面部病理特征。面部識別診斷技術(shù)是由成熟的面部識別技術(shù)與醫(yī)學(xué)領(lǐng)域診斷技術(shù)相結(jié)合,通過計算機(jī)機(jī)器輔助醫(yī)生進(jìn)行疾病的準(zhǔn)確診斷。面部識別診斷技術(shù)的基本步驟包括受試者圖像預(yù)處理、人面部檢測、面部特征信息提取和疾病數(shù)據(jù)庫對比并分類。具體步驟如下:①獲得受試者(患者)面部圖像。圖像可通過攝像頭、相機(jī)等獲得,圖像需保證清晰度、像素、人臉完整程度、背景光線顏色和被拍攝者的方向與形態(tài),建立圖像的預(yù)處理標(biāo)準(zhǔn),有助于批量處理圖像。②檢測預(yù)處理圖像。按照面部形態(tài)以及比例特征進(jìn)行面部點位標(biāo)記,點位標(biāo)記精細(xì)程度越高,產(chǎn)生數(shù)據(jù)量也就越大,識別準(zhǔn)確率也就越高。③圖像特征點信息提取。采用Gabor 小波變換(Gabor wavelet transform)、局部二值模式(local binary pattern)等方法對幾何特征、質(zhì)地和相關(guān)度等特征點進(jìn)行處理與數(shù)據(jù)提取[1]。④完成數(shù)據(jù)提取后,將受試者樣本面部特征數(shù)據(jù)與機(jī)器后端中疾病數(shù)據(jù)庫進(jìn)行比對,篩選出與樣本特征相似的疾病模型且歸類,從而對該受試者得出具體診斷結(jié)果,其中可用到的診斷分類、歸類方法包括留一交叉驗證法及訓(xùn)練法等[4]。
面部識別技術(shù)及成果已初步應(yīng)用于醫(yī)學(xué)領(lǐng)域,在具有明顯面部病理特征的疾病中,人面部識別技術(shù)可對其進(jìn)行精確識別與分類,且具有診斷的潛在應(yīng)用價值,如先天遺傳性疾病、內(nèi)分泌疾病、慢性疲勞綜合征和CFS 缺乏等疾病[5]。2003年,人面部識別技術(shù)第1次被成功地應(yīng)用于遺傳綜合征的面部識別,證明計算機(jī)機(jī)器通過識別算法識別遺傳綜合征的可行性較高。該實驗選取55 例患有5 類不同遺傳綜合征的測試者,包括脆性X綜合征(窄長臉、面中部發(fā)育差、前額突出、下頜前突、耳部特殊改變,如大耳、耳外翻、招風(fēng)耳、單耳輪等)、德朗熱綜合征(小頭、弓形眉、連體眉、短鼻、鼻孔前傾、長人中、上唇薄、嘴角上翹和顎/頜小)、黏多糖貯積癥3型(頭大、舟型頭、前額突出、眉毛濃密、眼睛突出、眼瞼腫脹、鼻梁低平、鼻孔上翻和嘴唇大而厚)、Prader-Willi綜合征(窄臉、前額窄凸、長顱、單眼皮、杏仁眼、斜視、窄鼻梁、薄上唇、嘴角下垂、小嘴、小下頜)和Williams-Beuren綜合征(小頭、眉間潮紅、眼裂小、斜視和低鼻梁)。試驗采用人工設(shè)置32 個面部標(biāo)記點并使用Gabor小波變換進(jìn)行數(shù)據(jù)處理,結(jié)果采用留一法將單個樣本進(jìn)行對比與分類,試驗結(jié)果最終顯示診斷準(zhǔn)確率達(dá)到76%,而試驗中的臨床遺傳學(xué)專家對同樣的圖片進(jìn)行判斷,其準(zhǔn)確率僅為62%,低于計算機(jī)的識別正確率。計算機(jī)能更好的、更精準(zhǔn)的識別受試者患有的潛在疾病。
2.1 唐氏綜合征 唐氏綜合征是最常見的因染色體異常導(dǎo)致的遺傳綜合征。唐氏綜合征患者具有的特殊面容特征包括眼距寬、眼裂小、眼外側(cè)上斜、有內(nèi)眥贅皮,鼻根低平,外耳小,舌胖、常伸出口外,流涎多,身材矮小,頭圍低于正常人、頭前后徑短、枕部平呈扁頭,頸短,皮膚寬松等特殊的面容特征,可被計算機(jī)捕捉且識別檢測率較高[6-7]。2014年,研究者采用多個不同的分類器(包括支持向量機(jī)、k-近鄰、隨機(jī)森林和線性鑒別分析)識別唐氏綜合征患者和正常人群,正確率最高為96.7%。實驗中識別技術(shù)采用獨立分量分析(independent component analysis),同時,改進(jìn)了標(biāo)志點的檢測,用該技術(shù)分析出的代表性面部特征非常符合臨床的觀察。另外,實驗還測試該技術(shù)分辨唐氏綜合征和其他遺傳綜合征,到97%的正確率。有研究者認(rèn)為,該技術(shù)可有效地用于唐氏綜合征的檢測,并可推廣至其他遺傳綜合征的識別[8]。
2.2 德朗熱綜合征 2014 年,一種新型技術(shù)面部畸形新分析(facial dysmorphology novel analysis,F(xiàn)DNA)技術(shù)被用于識別CdLS患者的面部圖像。研究者選取34例CdLS患者的照片作為陽性樣本,97例非CdLS的其他綜合征患者作為陰性樣本,對FDNA系統(tǒng)進(jìn)行訓(xùn)練,訓(xùn)練完畢的系統(tǒng)識別31例NIPB,或 SMC1A 基因突變的 CdLS 患者和非 CdLS 受試者(分別為16、6、9例),其識別正確率為87%,而醫(yī)學(xué)專家對相同樣本的識別正確率為77%??梢奆DNA技術(shù)對CdLS患者和非CdLS受試者的辨識能力較強,臨床前景較好[4]。
2.3 努南綜合征 Noonan綜合征(努南綜合征),1963年由Noonan 和Ehmke 首次認(rèn)定的一種疾病,患者伴有特殊面容和多發(fā)畸形,包括先天性心臟病。Noonan 綜合征的發(fā)病率為1:2 500~1:1 000,目前明確發(fā)病相關(guān)基因為PTPN11、SOS1、RAF1、RIT1、KRAS、BRAF、SHOC2等,與絲裂原活化蛋白酶(RAS-MAPK)信號通路異常有關(guān)[9-10]。Noonan 綜合征的主要特征包括特殊面容(即眼距增寬、瞼裂下斜、蹼頸)、先天性心臟病、身材矮小和胸部畸形。約25%的患者有精神發(fā)育遲滯,50%患者有出血傾向。骨骼系統(tǒng)、神經(jīng)系統(tǒng)、泌尿生殖系統(tǒng)、淋巴系統(tǒng)、眼睛和皮膚可不同程度地受累[11-14]。2004 年,Hammond 等[15]使用 11 個遺傳綜合征的醫(yī)學(xué)診斷相關(guān)特征點,包括內(nèi)外眼角、上嘴唇中點、左右嘴角、鼻根、鼻尖、人中、下巴等,同時采用密度表面模型(dense surface model,DSM)和3D人臉模型分析的方法進(jìn)行Noonan綜合征面部特征的建模和分析。實驗中采用5 種分類器包括近鄰均值、C5.0 決策樹、神經(jīng)網(wǎng)絡(luò)、邏輯回歸和支持向量機(jī)識別Noonan患者和健康人群。實驗結(jié)果表現(xiàn)敏感性和特異性的最高水平達(dá)到94%和88%。2017 年3 月,Paul Kruszka 等[16]選取非洲、亞洲和拉丁美洲等地共20 多個國家的罕見病患者樣本,運用人面部特征識別技術(shù)進(jìn)行試驗比對,其中患者平均年齡8 歲。總樣本量為322 例,標(biāo)注樣本量為125 例Noonan患者,其中女性占比46%。實驗結(jié)果顯示,敏感性為94%,特異性為90%。
2.4 其他遺傳疾病 除上述遺傳疾病種類以外,仍有多種遺傳疾病具有明顯的面部患病特征可通過人工智能面部識別進(jìn)行診斷,包括克氏綜合征(Klinefelter syndrome,KS)、X染色體易裂癥等遺傳疾病[17]。針對表現(xiàn)出特殊面部特征的疾病,面部識別技術(shù)均能較準(zhǔn)確的識別并進(jìn)行診斷[18-19],如內(nèi)分泌代謝性疾病庫欣綜合征[20-22]、肢端肥大癥[23-24]等。2011年,實驗室研究人員選取57 例肢端肥大癥患者面部圖片樣本進(jìn)行試驗,加入60張正常人面部圖像,使用面部圖像輔助診斷(facial image diagnostic aid,F(xiàn)IDA)人臉分類軟件對患者及正常人群進(jìn)行識別。建立Gabor 小波變換與留一交叉驗證方法對實驗圖像進(jìn)行分析處理,實驗結(jié)果顯示,患者識別正確率為71.9%,對照組圖像識別正確率為91.5%,略高于醫(yī)學(xué)專家的63.2%和80.8%[25]。
2.5 遺傳疾病常規(guī)診斷現(xiàn)狀與技術(shù)對比 遺傳疾病常規(guī)診斷依賴于傳統(tǒng)醫(yī)生的個人經(jīng)驗與診斷技術(shù),個體差異較大,而人面部識別技術(shù)可依據(jù)數(shù)據(jù)庫識別成功率較高,且已在遺傳綜合征、肢端肥大癥等疾病領(lǐng)域取得了良好效果。同時,人面部識別技術(shù)也可用于其他具有特殊特征的疾病類型,如慢性疲勞綜合征和內(nèi)分泌疾病等有面部特征改變的疾病。人面部識別診斷技術(shù)作為遺傳疾病診斷輔助手段或遺傳疾病篩查手段具有高效、簡單、便宜、非侵入性和易推廣等優(yōu)點。
但人面部識別診斷尚需實現(xiàn)以下幾方面工作:①識別診斷成功率受到樣本數(shù)據(jù)量的限制。數(shù)據(jù)量積累越多,所獲得的檢測結(jié)果往往越精確。②受地域限制。不同地域不同人種的面部特征及數(shù)據(jù)往往不同,需在計算機(jī)內(nèi)建立多套樣本模型以保證識別檢測的成功率。③需建立年齡、BMI和家庭基礎(chǔ)信息匹配的人面部識別數(shù)據(jù)庫,盡量完善統(tǒng)計數(shù)據(jù)信息與種類,從而保證計算機(jī)識別的準(zhǔn)確性。
經(jīng)過人面部識別技術(shù)的不斷發(fā)展與完善,越來越多的遺傳綜合征將被計算機(jī)記錄,應(yīng)用開發(fā)機(jī)器算法,有望覆蓋遺傳綜合征檢測篩查。在國內(nèi)遺傳咨詢臨床醫(yī)生嚴(yán)重缺乏、國內(nèi)醫(yī)療資源分布不均的環(huán)境下,傳統(tǒng)疾病檢測診斷的高昂費用將推進(jìn)人面部識別技術(shù)這種人力資源消耗少、費用低廉的新型醫(yī)療檢測方式的普及與應(yīng)用[26]。雖然面部識別技術(shù)應(yīng)用前景可觀,但在醫(yī)學(xué)遺傳領(lǐng)域,對其技術(shù)穩(wěn)定性的評估和臨床應(yīng)用的普適性還需要實踐探索,尤其是相似面部病理特征的區(qū)分與歸類,仍有待醫(yī)學(xué)與計算機(jī)領(lǐng)域研究者共同推進(jìn)。