国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

精準醫(yī)療時代的法醫(yī)表型特征分子刻畫研究進展

2019-03-24 18:01
法醫(yī)學雜志 2019年5期
關鍵詞:刻畫隊列表型

(公安部物證鑒定中心 現場物證溯源技術國家工程實驗室 法醫(yī)遺傳學公安部重點實驗室 北京市現場物證檢驗工程技術研究中心,北京100038)

法醫(yī)表型特征分子刻畫技術也稱分子畫像技術,指通過生物物證中的遺傳信息,基于特定人群數據庫和算法模型刻畫物證供者的族群地域、家族系譜、體貌特征等表型,作為“生物證人”為案件偵查提供線索。該技術作為現有短串聯重復(short tandem repeat,STR)序列個體識別技術的補充,使法醫(yī)物證鑒定對于公安實戰(zhàn)的作用不再局限在比對識別,而是拓展至提供各種表型信息、家族信息等,劃定偵查范圍,指導偵查方向,為案件偵查尤其是冷案、積案等疑難案件偵查提供新的線索。該技術體系高度依賴人群遺傳資源。國際人類基因組單體型圖計劃(International HapMap Project)[1-2]、千人基因組計劃(1000 Genomes Project)[3]等顯著推動了族群地域推斷研究,英國生物樣本庫(UK Biobank)[4]、英國雙胞胎項目(TwinsUK)等隊列[5],以及美國 23andMe、Ancestry等基因檢測公司[6]的數據,顯著推動了歐美人群的身高、面貌等特征研究。我國擁有豐富的遺傳資源,近年來也開展了針對中國人群的特征刻畫研究。

1 國內外人群隊列建設現狀

1.1 國外人群隊列建設

歐美等國先后投入幾億到幾百億美元建立大型人群隊列,主要呈現如下特點:一是生物樣本庫的標準化、大型化、全面化;二是國家間及國家內部研究機構對生物樣本庫的共建和共享呈現網絡化、聯盟化趨勢[7]。美國先后組織和參與了一系列大型基于人群的基因組學研究。1990年啟動的人類基因組計劃(Human Genome Project,HGP)開啟了基因組時代序幕[1]。2002年,美國、加拿大、中國、日本、英國、尼日利亞等啟動HapMap計劃,形成了全球11個人群的1218份樣本的全基因組遺傳多態(tài)圖譜[2]。2008年,美國、德國、中國、英國等發(fā)起的國際千人基因組計劃(1000 Genomes Project)形成了全球26個人群的2 504份樣本的基因組遺傳多態(tài)性圖譜[3]。斯坦福大學發(fā)起的人類基因組多樣性計劃(Human Genome Diversity Project,HGDP)收集了全球 52個人群的1043份樣本和SNP分型[8]。耶魯大學Kidd實驗室構建了全球55個人群的2 000多份樣本的永生細胞系。這些人群隊列的全球覆蓋率高,為族群地域研究提供了重要支撐。其中,千人基因組還常被用作基因填補(imputation)的參考數據,并廣泛應用于各國人群基因頻率分析、表型特征推斷模型測試等研究工作中。

冰島的deCODE Genetics與英國生物樣本庫(UK Biobank)是歐洲比較著名的生物樣本庫[4,9]。冰島人具有高度的遺傳同質性,是遺傳學的理想研究對象,deCODE Genetics公司于1996年啟動該項目,收集了14萬冰島人群的DNA樣本和家族系譜數據[9]。UK Biobank于2007年建成,收集了約50萬份英國人群樣本(40~69歲)[4]。加拿大Saguenay Youth Study研究團隊收集了生活在魁北克的法裔加拿大青少年和父母樣本、MRI掃描等體檢數據[7]。這些樣本庫存在較多親緣關系,除了疾病研究外,也適用于親緣及系譜方面的研究。

少數人群隊列在建設時采集了志愿者的外觀表型信息,為臉部形態(tài)等體貌特征遺傳研究提供了寶貴的數據資源。英國1993年啟動的TwinsUK是英國最大的成年雙胞胎研究隊列[5]。澳大利亞QIMR Berghofer Institute of Medical Research組織的兩個雙胞胎隊列研究,主要收集青少年[10]和成年雙胞胎的樣本[11-12]。這兩個雙胞胎人群隊列都包含臉部圖像。荷蘭鹿特丹的Rotterdam Study(RS)是持續(xù)進行的北歐和西歐人群隊列研究,包括RS-Ⅰ、RS-Ⅱ、RS-Ⅲ,總共為15000名參與者,部分人群進行了頭面部磁共振成像(magnetic resonance imaging,MRI)三維掃描[13-15]。這些數據被用于臉部特征的分子刻畫研究中。人類性狀遺傳研究(Genetic Investigation of Anthropometric Traits,GIANT)是由全球300多家機構組成的大型全基因組關聯分析(genome-wide association study,GWAS)聯盟,目標是通過多人群數據匯集挖掘身高和肥胖等人體測量學性狀相關遺傳位點[16-17]。目前,國際上認可度最高的身高相關遺傳位點研究成果就是基于GIANT數據開展的。

數據庫量級的上升無疑會對表型特征分子刻畫研究帶來極大的助力。美國加州自2007年開始的基因、環(huán)境和健康研究項目(Research Program on Genes,Environment,and Health,RPGEH)[18]已經收集了20萬人的生物樣本和健康情況等信息,研究環(huán)境和遺傳因素對常見病的影響。2015年初,美國宣布啟動精準醫(yī)學計劃(Precision Medicine Initiative,PMI),2016年啟動All of Us,將創(chuàng)建100萬志愿者的人群隊列支持精準醫(yī)學研究。英國政府于2012年發(fā)起“10萬基因組計劃”,歷時5年完成,對英國國民醫(yī)療保健服務體系(National Health Service,NHS)中的10萬名患者的完整基因組進行測序。2018年5月,英國宣布將在未來5年開展500萬人基因組計劃。法國于2016年宣布開啟France Génomique項目。澳大利亞于2016年啟動基因組學健康未來計劃(Genomics Health Futures Mission,GHFM)。德國、加拿大、以色列、韓國、日本等國也紛紛宣布開展大型人群基因組測序計劃。

1.2 中國人群隊列建設

我國擁有豐富的遺傳資源,生物樣本庫建設起步并不晚,但是缺乏包含外觀表型信息的國家級可共享的人群隊列樣本庫,因此在表型特征分子刻畫研究方面仍處于初始階段。中國醫(yī)學科學院于1994年建立了中華民族永生細胞庫,包括47個民族70個群體的3 982株永生細胞庫和7 210份DNA標本[19]。中國慢性病前瞻性研究項目(China Kadoorie Biobank,簡稱CKB項目)是中國醫(yī)學科學院與英國牛津大學于2004年聯合啟動的國際合作研究項目,在中國10個?。ǖ貐^(qū))開展,涉及51萬余人,持續(xù)時間15~20年[20]。2007年,復旦大學與泰州醫(yī)藥高新產業(yè)園啟動泰州市人群健康跟蹤研究項目,采集了志愿者的人體測量學數據和臉部圖像數據,規(guī)模約20萬例[21]?;谔┲萑巳宏犃?,我國的表型特征遺傳研究取得了初步的進展。中國科學院北京基因組研究所的精準基因組醫(yī)學重點實驗室于2016年宣布在未來4年完成4000名志愿者DNA樣本和多種表型數據的采集,并對其中2000名進行深入的精準醫(yī)學研究。

在遺傳資源整合方面,中國人類遺傳資源平臺(National Infrastructure of Chinese Genetic Resources,NICGR)是國家自然資源科技共享平臺的一部分,于2003年7月由中華人民共和國科學技術部牽頭啟動,2007年9月網絡發(fā)布[22]?!笆逡?guī)劃”期間,國家衛(wèi)生計生委科學技術研究所在中國人類遺傳資源平臺的基礎上成立了國家人類遺傳資源共享服務平臺[23]。2011年1月,國家發(fā)展改革委員會批復依托深圳華大基因研究院組建深圳國家基因庫(China National Gene Bank),采用基因信息數據庫和生物樣本庫相結合的建設模式,主要存儲管理我國特有遺傳資源、生物信息和基因數據。2015年3月,中華人民共和國科學技術部召開首次精準醫(yī)學戰(zhàn)略專家會議[24],提出中國精準醫(yī)療計劃,擬在2030年前投入600億元資金支持精準醫(yī)療行業(yè)的發(fā)展。同年10月,精準醫(yī)療被列入我國“十三五規(guī)劃”重點發(fā)展項目中。2015年至今,中華人民共和國科學技術部啟動了一系列疾病、自然人群、體質人類學等人群隊列構建相關的研究項目。隨著資源整合工作的推動,我國有望在將來形成綜合的人群隊列數據庫,快速推動表型特征分子刻畫研究的進展。

2 法醫(yī)表型特征分子刻畫技術研究進展

各種人群隊列積累了豐富的數據資源,使得全面挖掘基因組中的遺傳信息成為可能,族群地域、系譜、年齡、面貌、身高、色素等表型特征研究進展顯著,具體如下。

2.1 族群地域推斷研究

檢測人群之間具有遺傳分布差異的位點可以判斷DNA供者的族群地域,這種位點被稱為祖先信息位點(ancestry informative marker,AIM)。STR[25]、單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)[26]、插入/缺失突變(insertion/delete mutation)[27]、微單倍型(microhaplotype)[28]等均可作為AIM。族群推斷位點數目并非越多越好,遺傳距離不同的族群,位點篩選標準和參考數據集不同。近10年來,族群地域推斷技術已經從對洲際間人群進行區(qū)分,發(fā)展到對同一國家內部的人群進行區(qū)域性刻畫。區(qū)域群體之間的遺傳差異高于區(qū)域內人群之間的遺傳差異,在該領域的研究早期,檢測少量的AIM即可實現五大洲際人群(非洲、歐洲、東亞、太平洋和美洲印第安人群)的推斷,例如,34-SNP[29]、46-Indel[30]、27-SNP[31]等。洲際人群內部結構的進一步區(qū)分則需使用更多的AIM,如2014年發(fā)表的55-SNP進一步實現了全球8個區(qū)域人群的區(qū)分(撒哈拉以南非、北非、西南亞、歐洲、南亞、東亞、大洋洲、美洲印第安人群)[32]。公安部物證鑒定中心在2018年對東亞人群研究形成了74-SNP東亞南北方人群區(qū)分體系[33],以及適合高原人群區(qū)分的高原適應單倍型檢測體系[34]。

2.2 法醫(yī)系譜推斷研究

法醫(yī)系譜推斷也稱為長距離家族關系搜索(longrange familial search),是基于全基因組SNP數據和共祖片段分析(identity by descent,IBD)等技術,分析和搜索某個體的父系、母系的1~9級親緣關系。2018年,美國警方利用該技術在社會數據庫GEDmatch中鎖定嫌疑人的第三代堂(表)兄妹(third cousin),破獲了40年前轟動全美的“金州殺手”案,該技術被《科學》雜志評選為2018年十大科學突破之一[35-36],迅速受到各國法醫(yī)學領域的關注?;诿绹?00年的人口增長速率預測,如果能建立300萬的歐裔美國人群庫(2%的人口比例),即可找到幾乎99%的歐裔美國人至少一個三代表親[35]。由于該技術搜索的家族范圍更廣,可迅速成為冷案、積案等疑難案件偵破的技術手段。

2.3 年齡推斷研究

法醫(yī)學推斷個體年齡主要基于骨骼、牙齒等骨性測量指征,但該法不適于斑跡類或骨骼毀損的現場生物檢材。DNA甲基化是一種表觀遺傳修飾標記,在機體的生長、發(fā)育和衰老過程中呈現動態(tài)變化,甲基化水平與年齡呈現相關性,成為目前較為常用的年齡預測分子標志物[37-38]。伴隨全基因組甲基化芯片等技術的出現,大量年齡相關的甲基化位點被發(fā)掘。由于DNA甲基化具有組織特異性和人群特異性,目前研究[39-43]報道了針對血液、血斑、唾液、精液等組織類型推斷以及針對族群地域推斷的甲基化位點組合。檢測平臺包括焦磷酸測序、飛行時間質譜、下一代測序等,推斷算法包括多元線性回歸[41]、支持向量機[44]、人工神經網絡[45]等。未來需從檢測靈敏度、多組織適用性等角度開展深入研究。

2.4 臉部特征刻畫研究

臉部特征刻畫相關研究主要包括三維臉部圖像的數字化[46],臉部特征點間距[47-48]、角度、主成分變量[49-50]等特征關聯遺傳位點的挖掘,三維臉部特征刻畫模型的建立[51-52]等。該研究需采集臉面部的二維、三維照片或者三維MRI圖像。2012年,荷蘭Kayser實驗室基于鹿特丹人群的萬余名歐洲人樣本,發(fā)現了PAX3、PRDM16、TP63、C5orf50和COL17A1等臉面部形態(tài)特征相關基因[47]。同年,美國Evans實驗室基于雅芳父母和子女的縱向研究(Avon Longitudinal Study of Parents and Children,ALSPAC)[53]的萬余份歐洲人樣本,發(fā)現PAX3基因的rs7559271與鼻根位置、鼻根點到內眥的距離相關[54]。近兩年,美國的Shriver實驗室與23andMe[6]等公司合作建立了萬余例美國黑人和歐洲人群的臉部表型人臉樣本庫,基于三維高密度數據點整體特征分析方法建立了三維人臉預測模型臉部特征刻畫研究體系[50-51],從方法學和相關基因位點挖掘數量等多個方面取得了突破。國內的唐鯤實驗室基于泰州市人群健康跟蹤研究項目等人群樣本,研究發(fā)現與我國歐亞混合人群面部特征相關的400多個SNP位點,并建立了三維臉部特征分子刻畫模型[52]。

2.5 色素表型特征刻畫研究

身高、肥胖、臉部特征等表型是多基因遺傳性狀,且受到環(huán)境因素的影響,但色素有明顯的主效基因。例如,HERC2和OCA2基因對眼睛顏色的貢獻度很大,HERC2-rs12913832位點的GG等位基因與藍色眼睛緊密關聯[55],所以色素相關的遺傳及刻畫研究相對成熟。荷蘭Kayser實驗室基于荷蘭鹿特丹等多個人群的表型及遺傳數據,先后研發(fā)了IrisPlex(6-SNP)[55]、HIrisPlex(24-SNP)[56]和 HIrisPlex-S(41-SNP)[57]3 種CE平臺檢測體系和算法模型。其中,2018年建成的HIrisPlex-S在HIrisPlex的基礎上,通過全球人群隊列研究,添加了17個膚色相關位點,形成了可進行3種眼睛顏色(藍色、棕色、中間色)、4種頭發(fā)顏色(金黃色、紅色、棕色、黑色)和5種皮膚顏色(很白、白色、中間色、淺黑色、黑色)推斷的綜合色素特征刻畫體系,并經過了多家實驗室的驗證。

此外,在身高研究方面,GIANT計劃的開展顯著推動了歐洲人群身高、肥胖等研究的進展,先后發(fā)現了54、180和697個身高相關SNP位點,分別解釋4%~6%、10%和20%的身高變量[58],但目前對身高進行較為準確的分子刻畫仍然是一個沒有解決的難題。在毛發(fā)形態(tài)、耳朵形態(tài)、眉毛深淺等表型特征方面也有相關研究成果涌現,但都尚未形成類似色素表型可以初步進行法醫(yī)學應用的體系或模型。

2.6 相關產業(yè)發(fā)展情況

消費級(direct-to-consumer,DTC)基因檢測行業(yè)主要進行祖先來源、健康風險評估、營養(yǎng)代謝、遺傳疾病等基因分析。美國早在10年前已出現,個人用戶已超千萬,如23andMe(500萬數據)、Ancestry(900萬數據)、GEDmatch(100萬數據)、DNA.Land、Human Longevity、Helix等。中國于2013年開始出現,如微基因(30萬數據)、23魔方(30萬數據)、水母基因、各色DNA等。雖然這類公司大多是帶有娛樂性質的商業(yè)化運轉,但是匯集了大量人群樣本和檢測數據,為法醫(yī)學應用帶來契機。例如,美國Parabon Nanolab公司通過分子畫像、系譜推斷等業(yè)務為案件偵破提供技術服務;美國“金州殺手”案件的偵破就是基于GEDmatch[35-36];FamilyTreeDNA于2019年2月1日宣布與FBI合作,允許執(zhí)法機構訪問其DNA數據庫,協助案件偵查。

3 發(fā)展趨勢分析

法醫(yī)表型特征分子刻畫技術是數據驅動型的新型研究領域,需解決的核心問題是如何從生物物證中挖掘各類遺傳信息和如何基于這些遺傳信息刻畫、重建物證供者的表型特征。目前,該技術已初步形成理論框架,未來將會聯用多遺傳標記、多計算手段和多檢測平臺,向著精細刻畫發(fā)展和完善。同時,法醫(yī)檢材的適用性研究必不可少,案例應用是新技術是否具備生命力的檢驗標準。此外,該方向的研究和應用依賴特定的人群樣本和數據,如何與社會上的公共人群資源庫銜接,如何制定技術應用、隱私保護等相關的標準規(guī)范也是研究重心之一。總之,各類公共資源庫、測序、大數據等新技術為法醫(yī)DNA領域帶來了前所未有的發(fā)展契機,未來現場生物物證的精細刻畫結果將作為“生物證人”服務案件偵查等公共安全工作。

猜你喜歡
刻畫隊列表型
Artin單群的一種刻畫
隊列里的小秘密
基于多隊列切換的SDN擁塞控制*
在隊列里
刻畫細節(jié),展現關愛
建蘭、寒蘭花表型分析
豐田加速駛入自動駕駛隊列
GABABR2基因遺傳變異與肥胖及代謝相關表型的關系
慢性乙型肝炎患者HBV基因表型與血清學測定的臨床意義
72例老年急性白血病免疫表型分析