羅芳 李昊旻
(1.浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院兒科,浙江杭州 310003;2.浙江大學(xué)醫(yī)學(xué)院附屬兒童醫(yī)院,浙江杭州 310052)
隨著新生兒或兒童重癥監(jiān)護(hù)相關(guān)醫(yī)療技術(shù)的發(fā)展,感染、營養(yǎng)、早產(chǎn)等疾病的診治已有了長足的進(jìn)步,新生兒或小嬰兒遺傳性疾病所致死亡或預(yù)后不良的發(fā)生比例凸顯。遺傳性疾病中的單基因疾病目前估計6 500余種,且每年以200種的速度增加[1‐2]。據(jù)相關(guān)研究報道北美新生兒/兒童重癥監(jiān)護(hù)室(NICU/PICU)和兒童心胸外科重癥監(jiān)護(hù)室中因遺傳性疾病導(dǎo)致的死亡高達(dá)15%[3‐4]。一方面由于此類疾病病情惡化迅速,未及時診治常致預(yù)后不良,快速進(jìn)行病因診斷并針對性給予干預(yù)措施,可為患兒提供最佳的臨床管理決策,促進(jìn)經(jīng)驗治療向精準(zhǔn)治療的轉(zhuǎn)型,實現(xiàn)診斷率的提升和病死率的下降;另一方面對于預(yù)后差的一些遺傳疾病,快速診斷也有助于做出臨終照顧的決定,從而減輕痛苦并減少醫(yī)療資源的浪費。可見基因診斷在NICU/PICU的開展具有迫切性、高需求性和適合性。
目前臨床上常用的基因檢測主要有基因芯片、panel篩查、全外顯子測序(whole exome sequencing, WES)等,但各自提供的信息不夠全面,在診斷時長、診斷率方面也存在不足。全基因組測序(whole genome sequencing, WGS)則涵蓋包括點突變、拷貝數(shù)、內(nèi)含子區(qū)域的結(jié)構(gòu)及重組變異等更為全面的信息[5‐6]。隨著測序成本的不斷降低,其臨床接受度不斷提高。但測序數(shù)據(jù)獲取后需要極高專業(yè)的判讀和解釋,常規(guī)的基因組測序、數(shù)據(jù)分析和遺傳診斷報告需要數(shù)周才能返回臨床,無法滿足臨床診治病情快速發(fā)展的遺傳性疾病的需求。針對WGS現(xiàn)有的局限性,科研工作者從2012年起在測序及診斷時長上不懈努力:2012年5月Saunders等[7]采用快速全基因組測序(rapid whole genome sequencing, rWGS)技術(shù)在50 h內(nèi)診斷新生兒遺傳疾??;2015年10月該團(tuán)隊將此技術(shù)的診斷時長縮短至26 h[8];2019年4月該團(tuán)隊的進(jìn)一步研究成果發(fā)表[9]:建立了人工智能快速全基因組自動分析診斷系統(tǒng),并完成其回顧性驗證和前瞻性研究。該系統(tǒng)中全基因組測序時長為15.5 h,系統(tǒng)的另一關(guān)鍵組件提供自動分析數(shù)據(jù)功能解決數(shù)據(jù)獲取后的解讀,使得整個診斷流程可在24 h之內(nèi)完成,也被稱為超快速全基因組學(xué)測序(ultra‐rapid whole‐genome sequencing, urWGS),從時間上和功能上解決了常規(guī)基因組測序解讀周期長及解讀專業(yè)依賴的現(xiàn)狀。本文介紹rWGS在NICU/PICU的臨床應(yīng)用并簡述人工智能快速全基因組自動分析診斷系統(tǒng)的相關(guān)技術(shù)。
2012年Saunders等[7]采用rWGS在50 h內(nèi)對NICU中疑似遺傳性疾病患兒做出了基因診斷,其中回顧性明確了兩名已知病因患兒的基因診斷(1例Tay Sachs病,1例Menkes?。?;并前瞻性對5例未確診新生兒中的4例做出了診斷:1例GJB2基因相關(guān)重癥皮損,1例BRAT1基因相關(guān)的致死性新生兒強(qiáng)直和多灶性癲癇綜合征,在1個家系中鑒定了BCL9L為一新的隱性內(nèi)臟異位基因,排除了1例患兒已知的候選基因。所采用的軟件是癥狀和體征輔助的基因組分析(symptom‐and sign‐assisted genome analysis, SSAGA)軟件,該軟件為遺傳性疾病的診斷提供了1個診療框架:即由醫(yī)生輸入患兒的臨床表型,根據(jù)表型軟件列出與之相關(guān)的候選致病基因列表,從而加快基因分析進(jìn)程,在后續(xù)的一些文獻(xiàn)中被稱為表型驅(qū)動的WGS。在2012年該軟件已經(jīng)囊括了當(dāng)時591種遺傳病相關(guān)的227個臨床術(shù)語,診斷的敏感性達(dá)到了77%~96%,特異性高達(dá)99.5%。
2015年該團(tuán)隊采用升級后的rWGS技術(shù),包括Illumina HiSeq 2500快速運行模式下18 h的全基因組測序,Edico DRAGEN序列比對和變異檢出,以及三款軟件(VIKING、RUNES和SSAGA)聯(lián)合對數(shù)據(jù)進(jìn)行分析,該技術(shù)將診斷的敏感性和特異性提高到99.5%以上[8]。同年一項回顧性研究[10]比較了在NICU、PICU內(nèi)重癥患兒常規(guī)基因檢測和rWGS在診斷率、診斷時間、臨床管理兩者之間的差異。結(jié)果顯示35例患兒中20例(57%)通過rWGS明確了基因診斷,32例患兒中3例(9%)通過常規(guī)基因檢測方法明確診斷,兩者差異有統(tǒng)計學(xué)意義。在接受rWGS診斷的20例患兒中,13例(65%)被認(rèn)為具有及時的臨床指導(dǎo)價值,4例(20%)被認(rèn)為對臨床治療管理具有非常有利的指導(dǎo)意義,6例(30%)確診后開始接受姑息治療。根據(jù)研究對象的隨訪結(jié)果,120 d病死率達(dá)到57%(12/21),揭示了在NICU和PICU中采用rWGS的方法診斷遺傳疾病的高需求性和迫切性。
2018年一項部分雙盲隨機(jī)對照試驗的研究[11]結(jié)果發(fā)表,納入對象是NICU和PICU中4月齡以下的患兒,試驗組采用rWGS +常規(guī)基因檢測,對照組僅采用常規(guī)基因檢測。由于兩組之間診斷率的嚴(yán)重失衡,研究提早結(jié)束。在這項納入了65例嬰兒的隨機(jī)對照試驗中,28 d內(nèi)rWGS的診斷敏感性為31%,而常規(guī)基因測序為3%,認(rèn)為對于病因不明的危重癥嬰兒,rWGS可作為首選的一線診斷檢測方法。
之后這一技術(shù)也被推廣應(yīng)用于較大年齡PICU中的危重癥患兒,在一項由38例4月齡至17歲的接受了rWGS檢測的PICU患兒組成的回顧性隊列研究中,17例(45%)患兒經(jīng)rWGS明確了基因診斷,其中4例(24%)因基因診斷直接導(dǎo)致管理策略改變,9例(53%)臨床上并無畸形特征或發(fā)育遲緩[12]。結(jié)果提示早期的基因診斷影響到患兒和/或其家庭在住院期間或出院后的臨床管理,部分患兒避免活檢,部分患兒采取了替代治療,部分患兒進(jìn)行了疾病相關(guān)后遺癥的監(jiān)測。另一項回顧性研究也證實了24例平均年齡為16月齡的危重癥患兒中有42%的兒童明確了基因診斷[13]??梢妼τ赑ICU中潛在的病因不明確的患兒也同樣受益于入院早期的rWGS診斷。需要提及的是超過70%的病例是由重癥監(jiān)護(hù)室醫(yī)生提出并進(jìn)行測序的,這表明臨床醫(yī)生有能力識別出具有高度疑似攜帶疾病相關(guān)突變基因的兒童,已確定的變異涉及廣泛的疾病范圍,包括癲癇、腦病、心肌病、室性心律失常、自身免疫、免疫和炎癥性疾病[14]。
自2012年起,將全基因組學(xué)用于臨床的系列研究,顯示W(wǎng)GS在重癥患兒中遺傳性疾病的診斷率從42%上升到57%,改變了30%~72%的醫(yī)療管理及 24%~34% 病例的預(yù)后[7‐8,10,15‐16]。2018 年一項回顧性隊列研究[15]利用專家咨詢法(Delphi法)進(jìn)行成本分析,并采用平行比較的方法進(jìn)行評估(之前曾有類似的病例在該醫(yī)學(xué)中心診斷過,或者有醫(yī)療成本和治療費用價目呈現(xiàn)的既往病例)。該研究發(fā)現(xiàn)基于rWGS的診斷讓醫(yī)療成本降低了80萬美元,并將住院時間縮短了124 d;認(rèn)為對重癥監(jiān)護(hù)室中疑似患有遺傳病的患兒進(jìn)行rWGS診斷,不但能夠挽救患兒的生命,而且具有良好的成本效益。經(jīng)過rWGS診斷后43%的患兒獲得了診斷,節(jié)省醫(yī)療保健費用近13萬美元;其中11例患兒避免了并發(fā)癥,4例患兒避免了嚴(yán)重并發(fā)癥。
2019年rWGS進(jìn)一步發(fā)展,與人工智能有機(jī)結(jié)合,組成了人工智能快速全基因組自動分析診斷系統(tǒng)[9],也被稱為urWGS。該系統(tǒng)所采納的數(shù)據(jù)一是來源于血標(biāo)本的rWGS產(chǎn)生的測序數(shù)據(jù),二是來源于患兒臨床資料的電子病歷(electronic health record, EHR)。在自動分析的過程中集成了目前在基因組測序、人工智能領(lǐng)域的多種新興技術(shù)[17‐19]:美國Illumina公司的Nextera DNA Flex Library Prep Kit直接從血樣或干血斑(常規(guī)應(yīng)用于新生兒疾病篩查)中快速制備基因組文庫,之后采用NovaSeq 6000測序儀搭配S1型流動槽,在平均15.5 h內(nèi)完成基因組測序;DRAGEN Bio‐IT生物信息分析平臺可在20 min內(nèi)完成1個人類基因組的30X測序數(shù)據(jù)的分析,并自動將所讀序列與參考基因組對齊,識別和分析核苷酸變異。英國Clinithink公司的臨床自然語言處理平臺CliX ENRICH可在20 s內(nèi)梳理患者的EHR并自動提取關(guān)鍵表型信息,并將EHR中提取的表型特征從臨床術(shù)語概念自動轉(zhuǎn)換為可直接服務(wù)于遺傳報告分析的標(biāo)準(zhǔn)人類表型術(shù)語;Diploid開發(fā)的MOON系統(tǒng)自動解析基因組,并對疑似致病變異進(jìn)行自動過濾和篩查;深度集成現(xiàn)有遺傳性疾病知識庫和自然語言處理醫(yī)學(xué)文獻(xiàn)驅(qū)動基因變異的自動解讀,可在5 min內(nèi)在全基因組450萬個基因變異中篩選致病變異。上述技術(shù)流程有機(jī)結(jié)合可最終在24 h內(nèi)為疑似遺傳病重癥兒童提供快速診斷。
利用該系統(tǒng),研究人員針對圣地亞哥兒童醫(yī)院的101例患有105種遺傳病的患兒開展回顧性分析,在表型提取階段,臨床自然語言處理技術(shù)提取的患者表型數(shù)據(jù)比專家提取的表型數(shù)據(jù)多27倍,同時比在線人類孟德爾遺傳(Online Mendelian Inheritance in Man, OMIM)數(shù)據(jù)庫中匹配遺傳疾病的預(yù)期表型特征高出4倍,顯示臨床自然語言處理技術(shù)提取表型的高效率和高的覆蓋率。以專家診斷結(jié)果作為參照,該自動化診斷系統(tǒng)的精確度為99%(93/94),查全率為97%(94/97)[9]。為進(jìn)一步驗證診斷系統(tǒng)的有效性,研究人員利用該系統(tǒng)在7例重癥嬰兒中開展了前瞻性研究,其中3例患兒診斷為遺傳性疾病,均通過人工分析方法和Sanger測序證實。第1例女,7周齡,因酮癥酸中毒入住PICU,在血標(biāo)本送檢及EHR建檔后19.2 h,自動診斷系統(tǒng)識別出了胰島素基因中先前未報道的雜合錯義變異(c.26C>G,pPro9Arg)與常染色體顯性永久性新生兒糖尿?。∣MIM疾病記錄606176)相關(guān)。第2例是1個既往健康的17月齡男孩,因敗血癥性休克、代謝性酸中毒、壞疽性膿腫和低丙種球蛋白血癥住院。單例、先證者、快速測序和自動解釋鑒定出存在布魯頓酪氨酸激酶基因中的致病性雜合突變(c.974+2T>C)與X‐連鎖的無丙種球蛋白血癥(OMIM #300755)相關(guān)。為大劑量靜脈注射免疫球蛋白和6周抗生素治療提供了治療指導(dǎo)和治療信心。第3例為3日齡男孩因反復(fù)驚厥并家族史收住NICU。自動診斷系統(tǒng)鑒定為鉀離子電壓門控通道kqt樣亞家族成員2基因中可能致病的雜合變異(c.1051C>G),該基因與常染色體顯性良性家族性新生兒癲癇(OMIM 121200)發(fā)作相關(guān),診斷時長為20.9 h。
人工智能rWGS的診斷效率在后續(xù)開展的第二項隨機(jī)對照試驗中[20]也得以體現(xiàn)。該試驗的研究結(jié)果在2019年10月發(fā)表:213例嬰兒中24例(11%)因病情嚴(yán)重直接給予urWGS檢測,其余隨機(jī)分為rWES組95例,rWGS組94例。后兩者的診斷率分別為19%和20%,診斷時長的中位數(shù)分別是11.0 d和11.2 d,無明顯差異。但在分析可能影響蛋白功能的變異和ClinVar數(shù)據(jù)庫收錄的致病性/可能致病性的變異上,rWGS的分析性能明顯優(yōu)于rWES。而在這一組病例中urWGS診斷的比例(11/24,46%)高于rWES及rWGS,且診斷結(jié)果時間更短(平均4.6 d),提示urWGS在臨床應(yīng)用上的良好前景。
綜上,人工智能快速全基因組自動分析診斷系統(tǒng)的開發(fā)為促進(jìn)基因測序技術(shù)成為兒童尤其是NICU/PICU重癥患兒的一線診斷檢測手段提供了強(qiáng)有力的技術(shù)支持。診斷流程的自動化有助于減少經(jīng)驗稀缺的臨床醫(yī)學(xué)遺傳學(xué)家的人工分析和數(shù)據(jù)解釋的需求,減少臨床診斷中數(shù)據(jù)分析和解讀的耗時,消除WGS臨床應(yīng)用的障礙。但該系統(tǒng)向臨床的推廣仍會面臨一些障礙,自動化的平臺需要進(jìn)行一定程度的改裝才能在不同的醫(yī)院體系中實施,特別是針對不同文化和環(huán)境,其中部分技術(shù)還不完善,中文環(huán)境下的患者表型自動采集將是首先面臨的困難。其次,進(jìn)行rWGS檢測的最佳時機(jī)也有待進(jìn)一步探索,開展rWGS所需的費用昂貴也將是推廣應(yīng)用的一個障礙。再就是該項技術(shù)應(yīng)用于臨床所面臨的倫理問題[21‐22]:從樣本的選擇性送檢、家長的知情同意到以rWGS診斷為基礎(chǔ)決定是否姑息治療或是積極救治的疾病管理過程均涉及到倫理問題,是該項技術(shù)發(fā)展必須面臨且需要不斷討論的問題;而且關(guān)于在NICU/PICU環(huán)境下對嬰兒進(jìn)行rWGS的潛在風(fēng)險的數(shù)據(jù)尚收集或預(yù)估不足等[23]。但毫無疑問早期快速的基因診斷對危重癥患兒臨床管理決策、家庭治療選擇、遠(yuǎn)期預(yù)后評估及醫(yī)療系統(tǒng)的資源調(diào)配具有重大或決定性意義,相信危重癥患兒早期快速精準(zhǔn)診療的時代即將到來。