趙更
摘要:胎兒的非整倍體檢測主要包括對常染色體13,18,21進行檢測,以便發(fā)現(xiàn)胎兒是否患有T21,T13,以及T18等先天性疾病。傳統(tǒng)的產前檢測首先是進行血清學和超聲診斷學篩查,進行產前初檢。對于篩查高風險的孕婦,需要接受絨毛取樣或羊水穿刺,進行核型分析,以便明確胎兒是否患有非整倍體疾病。羊水或絨毛穿刺手術雖然準確率和靈敏度非常高,但是孕婦在接受這些手段進行檢查的同時,往往有流產的風險。借助高通量測序技術的發(fā)展,胎兒非整倍體檢測可以以一種無創(chuàng)的形式進行,本文總結了在基于高通量測序技術手段進行無創(chuàng)產前檢查所使用的生物信息學算法。
關鍵詞:無創(chuàng)產前檢查; 高通量測序;胎兒非整倍體
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2018)09-0229-03
Abstract: The fetus aneuploidy testing, mainly focus on the analysis of data at chromosomes 13, 18, 21, X and Y, to determine the ploidy state of the fetus. Conventional prenatal testing mainly include serological screening and ultrasound diagnostics screening, at the early state of screening. Pregnant women with high risk of aneuploidy evaluated by above screening should take invasive testing such as chorionic villus sampling or amniocentesis, to do karyotype analysis. Methods such as amniocentesis, chrorion villus sampling have high accuracy, but are invasive and carry significant risks. With the development of high-throughput sequencing technologies, fetal aneuploidy detection can be done in the form of a noninvasive. This paper summarizes the bioinformatics algorithms of NIPD that based on high-throughput sequencing technology
Key words: NIPD; High-throughput sequencing; Fetus aneauploidy
胎兒的非整倍體檢測主要包括對常染色體13,18,21進行檢測,以便發(fā)現(xiàn)胎兒是否患有T21,T13,以及T18等先天性疾病。傳統(tǒng)的產前檢測首先是進行血清學和超聲診斷學篩查,進行產前初檢。對于篩查高風險的孕婦,需要接受絨毛取樣或羊水穿刺,進行核型分析,以便明確胎兒是否患有非整倍體疾病。羊水或絨毛穿刺手術雖然準確率和靈敏度非常高,但是孕婦在接受這些手段進行檢查的同時,往往有宮內感染或流產的風險[1]。
1997年香港中文大學的盧煜明及其團隊研究發(fā)現(xiàn)孕婦血液中存在胎兒的游離DNA,為孕婦及胎兒的多項疾病檢測提供了安全可靠的方法[2]。近年來,胎兒的無創(chuàng)產前檢測技術發(fā)1展迅速,胎兒的游離細胞可以成功地被提取用于非侵入性胎兒性別鑒定和Rh血型鑒定[3,4]。但是,胎兒游離細胞在母親血液中所占比例微乎其微的這一客觀事實(胎兒游離細胞與母血中母親細胞比例接近1:1000 000),使得從母血中提取出胎兒游離細胞的技術所花費的成本非常昂貴并且可靠性也比較低[5-7]。隨著高通量測序技術的發(fā)展及測序成本的降低,人們將越來越多的注意力集中到從母親外周血中分析胎兒游離DNA進而進行非整倍體檢測的研究上來。
1 問題描述
正常人含有23對同源染色體,其中一半來自父親,一半來自母親。在胎兒產前染色體整倍性檢測中正常的胎兒都是二倍體的。產前檢測中的非整倍體,是指染色體組中比正常二倍體增加或減少個別染色體的個體。在胎兒產前檢測中,常見的非整倍體相關的疾病有21三體綜合癥,18三體綜合癥,13三體綜合癥,Klinefelter綜合癥(45,XXY),以及Turner綜合癥(45,X)等疾病。
現(xiàn)今科學已經明確,胎兒的游離DNA長期穩(wěn)定的存在于孕婦的外周血中。孕婦懷孕四周左右,就能從其血液中檢測出胎兒的游離DNA。孕婦懷孕7周的時候,胎兒的游離DNA就會以比較穩(wěn)定的比例存在于母血中。研究表明:1)胎兒的游離DNA是以小片段的形式存在于母血中,片段長度范圍在75bp到205bp之間;2)胎兒游離DNA約占血漿中全部游離DNA總量的5%到10%[8],并且這一比例會隨著孕周的增長而增加;3)胎兒游離DNA在孕婦分娩以后的2小時內,會迅速被清除[2]。
2 主流的高通量生物信息學算法
由于胎兒的游離DNA序列被“淹沒”在強大的母親DNA序列之中,因此,如果要精準的定量胎兒某個編號的同源染色體的個數(shù)是非常困難的。高通量測序技術的出現(xiàn),使得該問題的解決提供了可能。目前國內外關于高通量技術預測胎兒染色體非整倍性的檢測方法主流的有兩大類,即大規(guī)模平行測序技術及配套的分析技術以及目標測序技術。
2.1 大規(guī)模平行測序技術生物信息學算法
大規(guī)模平行測序孕婦外周血從而進行胎兒非整倍體檢測算法的出發(fā)點為:當測序深度和比對足夠的情況下,胎兒基因組的差異也會引起測序數(shù)據在參考基因組不同區(qū)域和染色體上比對分布的差異。
受此啟發(fā),2008年Rossa W. K. Chiu等人[9]提出了一種基于對母體血漿中 DNA 大規(guī)模平行測序的生物信息算法來進行產前非整倍體檢測。該方法的算法示意圖如圖1所示。
該方法的大致步驟為:1)抽取孕婦的外周血進行高通量測序,并將高通量測序獲得的reads數(shù)據比對到人類參考基因組上,進而確定每個 DNA 片段出自哪一條染色體,而不在意 DNA 在染色體上的具體位置;2)對出自某一具體染色體上的 read 進行計數(shù)(只考慮那些只能映射到人類參考基因組上的一個位置的read,并要求沒有錯配,記為 “Unique” read),并計算比對到每一條人類染色體的 read 的總數(shù)量;3)計算出每條染色體的表達率,即精確比對到該染色體上的 read 數(shù)量占精確比對到參考基因組上的所有 read 數(shù)量的百分數(shù)[%ChrN],計算公式為(1)所示;4)根據第三步,將樣品數(shù)據的感興趣編號染色體表達率數(shù)據與正常樣品數(shù)據參照染色體表達率數(shù)據代入(2)公式獲得一個Z-score值;5)根據Z-score值進而判斷樣品數(shù)據的感興趣染色體的倍數(shù)。
該算法提出后,在識別出懷有T21三體綜合癥胎兒的孕婦方面有較高的準確率(準確率接近100%[11])。然而該算法具有如下一些缺點:1)未考慮測序數(shù)據會受到GC偏好性的影響[10];2)未將不同孕期母體胎兒游離DNA濃度不同的這一重要信息融合進入該算法中。
為了解決上述問題,在該算法的基礎上,Chen EZ等人提出了一種GC糾正的方法,可以有效地對懷有T13三體綜合癥胎兒以及T18三體綜合癥胎兒的孕婦進行篩查[10]。我們國內的貝瑞和康公司也是采用將GC標準化后代入上述的公式從而計算Z-Score值進行非整倍體產前檢測的,并且其算法已經應用于臨床[12]。2013年哈爾濱工業(yè)大學的白鴻葉等人,提出了一種構建 GC 含量偏差的校正模型,以消除 GC 含量對比對分布密度帶來的偏差[13]。2012年,華大的無創(chuàng)產前檢測團隊Fuman Jiang等人[14]提出了將GC糾正及胎兒游離DNA在所檢測樣品的濃度預測值融合進入大規(guī)模測序算法進行產前篩查的算法(NIFTY)。該算法的大體流程如圖2所示。
該算法不僅可以對胎兒常染色體的非整倍性做出篩查,還可以對胎兒的性染色體的非整倍性進行篩查。
大規(guī)模并行測序進而預測胎兒的非整倍體算法是我們國內目前用于臨床中的主流算法。
2.2 目標片段測序技術生物信息學算法
另外一種預測胎兒非整倍體的高通量生物信息算法是目標片段測序技術生物信息學算法。該算法提出的根本出發(fā)點為:染色體非整倍性反映到分子水平上,表現(xiàn)為同源染色體的條數(shù)不是兩條的關系,表現(xiàn)為3條或1條。但是反映到染色體DNA序列上某個SNP位點而言, 如果胎兒的SNP為雜合子,則表現(xiàn)為該位點的等位基因劑量比例將會出現(xiàn)1:1,而對于一個21-三體的患兒,其等位基因的劑量比例將會為1:2 或者2:1。
為了使用目標測序算法不僅可以分析雜合子的非整倍體胎兒,也可以分析其他SNP分型的非整倍體患兒,一種定量分析方法稱為DANSR算法[15,16,17]被設計出來用于篩選T21和T18的樣品數(shù)據。該算法從感興趣的染色體上選擇感興趣的區(qū)域然后再選擇感興趣的SNP位點進行PCR擴增之后再進行測序,使用數(shù)字分析方法進行預測。該方法被證實可以識別出21三體和18三體的臨床樣品數(shù)據。然而該方法的實施需要參照染色體數(shù)據,并且要求參照染色體數(shù)據的擴增與感興趣染色體片段區(qū)域擴增效率應盡可能地接近。2012年Liao等人[18]通過在目標染色體上選擇一系列SNP位點進行測序,并計算胎兒和母親的SNPs 比值,然后將該比值與參照基因組進行再比較,從而給出胎兒的目標染色體的拷貝數(shù)。該方法使用一系列SNP位點某種程度上減輕了染色體與染色體之間擴增的偏好性;然而該方法采用參照染色體做對照,某種程度上減輕了該算法的優(yōu)勢。
2012年natera公司研發(fā)出了一個在臨床上應用非常廣泛的目標測序算法[19],可以對胎兒的染色體非整倍性做出篩查。該算法通過確定一個聯(lián)合分布模型,利用父母基因型數(shù)據產生對不同可能的胎兒染色體倍數(shù)狀態(tài)的期望分布,然后比較期望分布和所測量的等位分布模式,觀察檢測的等位分布頻率模式和期望的等位分布模式的哪種最匹配,以此來判斷胎兒的非整倍性。該算法的計算流程如圖3所示。
該算法提出以后,在臨床上得到了廣泛的應用,該算法不僅可以對胎兒的常染色體的非整倍性做出檢測,還可以對性染色體的非整倍性做出檢測。該算法至今還在不斷地完善與更新中[20,21]。
3 總結
本文總結了應用于無創(chuàng)產前檢測的主流生物信息學算法。主流的生物信息學算法分為兩大類:大規(guī)模測序算法和目標片段測序算法。這兩種類型的算法在預測胎兒非整倍體檢測方面都有著很高的準確率,并且已經被廣泛地應用到了臨床。目標片段測序類型的算法與大規(guī)模測序算法相比,需要較低的測序通量并且一次測序可以分析較多的樣品數(shù)據,但是目標片段算法的實施需要選擇較多的SNP位點。隨著社會的發(fā)展,人類的進步,相信會有更多的無創(chuàng)產前生物信息算法被開發(fā)出來,用于預測胎兒的染色體疾病。
參考文獻:
[1] Lo Y M D, Tein M S C, Lau T K, et al. Quantitative analysis of fetal DNA in maternal plasma and serum: implications for noninvasive prenatal diagnosis[J]. The American Journal of Human Genetics, 1998, 62(4): 768-775..
[2] Lo Y M D, Corbetta N, Chamberlain P F, et al. Presence of fetal DNA in maternal plasma and serum[J]. The Lancet, 1997, 350(9076): 485-487.
[3] Lo Y M D, Hjelm N M, Fidler C, et al. Prenatal diagnosis of fetal RhD status by molecular analysis of maternal plasma[J]. New England Journal of Medicine, 1998, 339(24): 1734-1738.
[4] Finning K, Martin P, Summers J, et al. Effect of high throughput RHD typing of fetal DNA in maternal plasma on use of anti-RhD immunoglobulin in RhD negative pregnant women: prospective feasibility study[J]. bmj, 2008, 336(7648): 816-818.
[5] Bianchi D W, Simpson J L, Jackson L G, et al. Fetal gender and aneuploidy detection using fetal cells in maternal blood: analysis of NIFTY I data[J]. Prenatal diagnosis, 2002, 22(7): 609-615.
[6] Guetta E, Simchen M J, Mammon-Daviko K, et al. Analysis of fetal blood cells in the maternal circulation: challenges, ongoing efforts, and potential solutions[J]. Stem cells and development, 2004, 13(1): 93-99.
[7] Lo Y M D, Chiu R W K. Prenatal diagnosis: progress through plasma nucleic acids[J]. Nature Reviews Genetics, 2007, 8(1): 71-77.
[8] Lun F M F, Chiu R W K, Chan K C A, et al. Microfluidics digital PCR reveals a higher than expected fraction of fetal DNA in maternal plasma[J]. Clinical chemistry, 2008, 54(10): 1664-1672.
[9] Chiu R W K, Chan K C A, Gao Y, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma[J]. Proceedings of the National Academy of Sciences, 2008, 105(51): 20458-20463.
[10] Chen E Z, Chiu R W K, Sun H, et al. Noninvasive prenatal diagnosis of fetal trisomy 18 and trisomy 13 by maternal plasma DNA sequencing[J]. Plos one, 2011, 6(7): e21791.
[11] Chiu R W K, Akolekar R, Zheng Y W L, et al. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study[J]. Bmj, 2011, 342: c7401.
[12] http://www.berrygenomics.com/bambnitest/technology/process/
[13] 白鴻葉.高通量DNA測序數(shù)據的分布密度分析及其應用[D].哈爾濱工業(yè)大學,2013.
[14] Jiang F, Ren J, Chen F, et al. Noninvasive Fetal Trisomy (NIFTY) test: an advanced noninvasive prenatal diagnosis methodology for fetal autosomal and sex chromosomal aneuploidies[J]. BMC medical genomics, 2012, 5(1): 57.
[15] Sparks A B, Wang E T, Struble C A, et al. Selective analysis of cell-free DNA in maternal blood for evaluation of fetal trisomy[J]. Prenatal diagnosis, 2012, 32(1): 3-9.
[16] Sparks A B, Struble C A, Wang E T, et al. Noninvasive prenatal detection and selective analysis of cell-free DNA obtained from maternal blood: evaluation for trisomy 21 and trisomy 18[J]. American journal of obstetrics and gynecology, 2012, 206(4): 319. e1-319. e9.