王征 侯維 鄭素軍
目前,我國對罕見病診療的重視已上升到國家健康戰(zhàn)略層面,分別于2018年、2023年頒布了我國第一批、第二批罕見病目錄,其中罕見肝病占15.46%(32/207),而遺傳代謝性肝病又占了罕見肝病的81.25%(26/32),這凸顯了遺傳代謝性肝病的重要性。然而,罕見病的診斷仍然困難重重,診斷過程往往很漫長,準(zhǔn)確診斷的平均時間為4.8年,常需要7名以上分布在不同領(lǐng)域的醫(yī)師或?qū)?漆t(yī)師參與,給患者及其家人帶來了巨大的負(fù)擔(dān)和心理痛苦,也對當(dāng)前的醫(yī)療系統(tǒng)構(gòu)成了巨大挑戰(zhàn)[1]。近二十年來,由于全外顯子組測序(WES)等二代測序(NGS)技術(shù)的成熟和發(fā)展,檢測成本呈指數(shù)級下降,WES已成為遺傳代謝性肝病主要的檢測方法,使得越來越多的不明原因肝病的成人和兒童得到了成功診斷[2]。盡管如此,由于基因檢測、遺傳學(xué)相關(guān)培訓(xùn)的不足,多數(shù)臨床肝病醫(yī)師對WES檢測原理及方法、生物信息學(xué)分析和結(jié)果解讀等方面仍存在相關(guān)知識缺乏或了解不夠。如《2022年中國罕見病臨床診療現(xiàn)狀調(diào)研報(bào)告》顯示,對使用過基因檢測的15 626名醫(yī)務(wù)工作者進(jìn)行調(diào)查發(fā)現(xiàn),雖然WES是最常用的基因檢測方法(超過50%),但多數(shù)醫(yī)務(wù)工作者卻存在“基因檢測報(bào)告解讀困難”,也對“基因公司太多、檢測過程不透明、檢測報(bào)告不規(guī)范”等存在擔(dān)心與困擾。以上現(xiàn)狀均阻礙了臨床醫(yī)師對WES的恰當(dāng)選用,降低了WES的診斷效能,影響了遺傳代謝性肝病診療能力的提升。本文梳理并總結(jié)了WES在遺傳代謝性肝病應(yīng)用過程中的一些常見問題,希望對相關(guān)醫(yī)師的臨床診療有所幫助。
NGS根據(jù)檢測基因覆蓋范圍不同可分為靶向(panel)測序、WES、全基因組測序(WGS)。NGS的基因panel是針對某種臨床表型(如膽汁淤積、黃疸、門靜脈高壓等)而預(yù)先設(shè)計(jì)或由專家選擇的一組基因,所選基因已知與該臨床表型相關(guān)。靶向(panel)測序具有測序深度高(靶基因被測到的次數(shù)多)、覆蓋范圍均勻、變異檢出的靈敏度高等特點(diǎn),還可針對特定變異檢測出罕見的遺傳變異[2-3]。但panel包如果覆蓋基因不全或更新不及時,可能會導(dǎo)致某種疾病或表型的新發(fā)現(xiàn)致病基因,由于尚未納入panel包,從而導(dǎo)致假陰性結(jié)果而漏診。
WES以低成本捕獲基因組的外顯子區(qū)域(即蛋白質(zhì)編碼區(qū),占基因組的1%~2%,卻包含了約85%的致病變異),在某些情況下還可捕獲非翻譯區(qū)(UTRs)和內(nèi)含子-外顯子交界區(qū)域。WES優(yōu)勢是能夠較全面的覆蓋蛋白質(zhì)編碼區(qū)。WES無法檢測到包括拷貝數(shù)變異(CNV)等結(jié)構(gòu)變異和非編碼變異(NCV)在內(nèi)的相關(guān)變異,對于上述基因變異所致疾病,WES可能得到陰性結(jié)果而導(dǎo)致漏診。如Niguidula等[4]發(fā)現(xiàn)接受WES的患者中有63%的結(jié)果為陰性或不確定。
WGS不僅可捕獲編碼區(qū),還可捕獲非編碼區(qū)域,能夠識別典型和復(fù)雜的結(jié)構(gòu)變異、串聯(lián)重復(fù)序列、內(nèi)含子變異及可能無法被WES準(zhǔn)確捕獲的編碼區(qū)域變異。但由于WGS費(fèi)用高、報(bào)告周期長、結(jié)果解讀困難等原因,目前主要用于科研,并未大面積在臨床應(yīng)用。
有些學(xué)者建議將WES作為一線檢測方法[5],但也有許多臨床醫(yī)生認(rèn)為WES/WGS應(yīng)該應(yīng)用于常規(guī)單基因檢測或基于panel的NGS檢測陰性結(jié)果的患者。與panel基因檢測方法相比,WES/WGS可獲得較為完整的遺傳信息,提高罕見疾病診斷率[1]。如對于臨床表型復(fù)雜、難于選擇或沒有合適的外顯子panel測序可供選擇,應(yīng)用WES是很好的解決辦法。近年來,應(yīng)用WES/WGS發(fā)現(xiàn)的罕見疾病相關(guān)致病基因的速度穩(wěn)步加快,占新發(fā)現(xiàn)致病基因的85%以上[6]。越來越多的證據(jù)表明,從診斷率和臨床效用的角度來看,WES應(yīng)被推薦為一線的基因組檢測工具[7]。
NGS的檢測流程分為“濕實(shí)驗(yàn)”(實(shí)驗(yàn)室操作)和“干實(shí)驗(yàn)”(生物信息學(xué)分析和數(shù)據(jù)解讀報(bào)告)兩個部分。“干實(shí)驗(yàn)”是NGS非常重要的環(huán)節(jié)。實(shí)驗(yàn)人員對患者DNA樣品進(jìn)行處理和上機(jī)測序,產(chǎn)生大量的序列數(shù)據(jù),之后利用生物信息學(xué)軟件,將這些序列信息轉(zhuǎn)化為可靠的變異信息,再對變異的致病性進(jìn)行判讀,才能完成一份樣品的檢測。
1.臨床信息收集
由醫(yī)師對患者進(jìn)行問診和有針對性的體格檢查,全面、詳細(xì)、準(zhǔn)確地采集病史,并對采集的信息進(jìn)行篩選,歸納總結(jié)為病史摘要。
由我國基因檢測聯(lián)盟發(fā)起并完成的《遺傳病二代測序臨床檢測全流程規(guī)范化共識探討》中,建議對臨床信息的收集可參照在線人類孟德爾遺傳數(shù)據(jù)庫(OMIM)疾病條目中臨床體征摘要,按照中文人類表型標(biāo)準(zhǔn)術(shù)語(CHPO)詞條進(jìn)行描述[8]。但大多數(shù)肝病醫(yī)師對詞條的了解和應(yīng)用不足,而多以患者的臨床癥狀或?qū)嶒?yàn)室異常結(jié)果填報(bào)檢測申請單并提供給實(shí)驗(yàn)室。實(shí)驗(yàn)室人員往往不具備相關(guān)臨床知識,將這些信息再轉(zhuǎn)化成CHPO詞條進(jìn)行基因篩選時,可能出現(xiàn)不準(zhǔn)確的現(xiàn)象,影響候選基因的篩選。因此,建議使用人類表型標(biāo)準(zhǔn)術(shù)語,這將為實(shí)驗(yàn)室、臨床醫(yī)生和研究人員之間的表型共享提供標(biāo)準(zhǔn)[9],也希望將來在臨床醫(yī)生、遺傳學(xué)專家和實(shí)驗(yàn)室人員的共同努力下,能夠形成系統(tǒng)表型分析的總體指南,進(jìn)一步規(guī)范遺傳代謝性肝病的表型標(biāo)準(zhǔn)術(shù)語,搭建起臨床醫(yī)生和實(shí)驗(yàn)室的橋梁。
2.數(shù)據(jù)解讀流程
全基因組的測序平均檢出300~400萬個變異,手工篩選這些變異是不可能的。WES產(chǎn)生的變異數(shù)約2.0~2.2萬個,較WGS少得多[10];即使WES已忽略了非編碼變異,但所產(chǎn)生的個體變異數(shù)量仍是龐大的。通過生物信息學(xué)可將這些數(shù)據(jù)進(jìn)行初步篩選,但仍有數(shù)千到數(shù)萬個變異需進(jìn)行進(jìn)一步更詳細(xì)的分析。
將NGS測出的基因序列與參考基因組序列進(jìn)行比對是數(shù)據(jù)分析的第一步,而參考基因組序列的質(zhì)量是影響分析結(jié)果的主要因素。GRCh37(或hg19)和GRCh38(或hg38)是兩種最常用的人類參考基因組版本,分別于2009年和2013年發(fā)布,盡管GRCh38發(fā)布已過去了10余年,但仍有很多實(shí)驗(yàn)室還在使用GRCh37版本[11]。2022年Nurk等[12]在人類基因組組裝方面取得了突破,他們提出了第一個完全完整的、無間隙的人類參考基因組序列,命名為端粒到端粒(T2T)。與GRCh38相比,T2T中添加的大部分序列對應(yīng)于片段重復(fù)和著絲粒,可對這些區(qū)域進(jìn)行全面分析。此外,至少有幾百個蛋白質(zhì)編碼基因的拷貝數(shù)已更新。鑒于這些改進(jìn),T2T有望成為人類基因組學(xué)新的參考標(biāo)準(zhǔn);然而,切換到一個新的版本可能比之前的GRCh37-GRCh38過渡需要等待更長的時間。
NGS變異檢測主要針對單堿基變異(SNV)和小插入缺失變異(INDEL),常用于檢測SNV和INDEL的軟件是GATK和SAMtools等。由于檢測策略的差異,不同軟件的檢測結(jié)果往往存在一定的差別;相同軟件不同的參數(shù)設(shè)置同樣會導(dǎo)致檢測結(jié)果的差異[13]。
遺傳分析環(huán)節(jié)涉及變異初篩、表型匹配和變異致病性判讀3個步驟。因NGS產(chǎn)生的變異多,生物信息學(xué)分析環(huán)節(jié)涉及較多的人工判斷[13]。目前對序列變異的解讀主要根據(jù)美國醫(yī)學(xué)遺傳學(xué)和基因組學(xué)學(xué)院(ACMG)在2015年提出的指南,將變異分為5類:“致病(Pathogenic)”、“可能致病(Likely Pathogenic”)、“意義不確定的變異(VUS)”、“可能良性(Likely Benign)”、“良性(Benign)”,檢測結(jié)果通常只對前3類變異進(jìn)行報(bào)告[14]。最終,臨床醫(yī)生需結(jié)合患者的臨床表現(xiàn),確定是否作出診斷[15]。
3.對陽性結(jié)果的解讀
各實(shí)驗(yàn)室在基因檢測報(bào)告中,檢測出與患者表型相關(guān)且為“致病”或“可能致病”的基因變異被認(rèn)為是陽性結(jié)果。臨床醫(yī)師在閱讀檢測報(bào)告時,首先需注意其匹配的表型是否充分,即發(fā)現(xiàn)的基因變異是否能解釋患者的臨床表現(xiàn)?;蜃儺悆H能解釋其部分表型,或其典型表型不能被此基因變異所解釋均提示匹配不充分。其次要考慮其遺傳方式,如對于常染色體隱性遺傳疾病的基因診斷,變異應(yīng)為純合變異或兩條等位基因均有變異、但位點(diǎn)不同的復(fù)合雜合變異(反式復(fù)合雜合變異)。當(dāng)檢測到1個雜合變異時往往認(rèn)為是不致病的;當(dāng)檢測到2個雜合變異時,需要進(jìn)行遺傳家系分析,即對患者父母進(jìn)行檢測,來確定2個致病變異是否為反式復(fù)合雜合變異。如ATP7B基因檢測到2個致病的雜合變異,若為反式復(fù)合雜合變異,則根據(jù)Leipzig評分為4分,支持診斷肝豆?fàn)詈俗冃?若通過遺傳家譜分析,2個變異均分布在同一條染色體上,根據(jù)Leipzig評分為1分,僅為ATP7B基因致病變異的攜帶者,并不能通過基因診斷肝豆?fàn)詈俗冃訹16]。
4.對不確定結(jié)果的解讀
與患者表型相符、但基因變異致病性為“VUS”,是NGS報(bào)告中的最常見的變異類型,占臨床報(bào)告的40%~70%[17]。大多數(shù)VUS是錯義變異及同義變異和非編碼變異。VUS出現(xiàn)的主要原因是現(xiàn)有的研究不足以明確基因變異是否影響相應(yīng)蛋白表達(dá)或功能,難以確定基因與疾病關(guān)聯(lián)[18]。變異位點(diǎn)致病性解讀的規(guī)則隨著行業(yè)和技術(shù)的進(jìn)步不斷更新和完善,ACMG也根據(jù)最新的臨床實(shí)踐和科學(xué)研究成果不斷進(jìn)行更新和修訂,因此實(shí)驗(yàn)室同樣需追蹤最新的指南和行業(yè)共識,遵循ClinGen針對不同證據(jù)的細(xì)化建議及特定類型基因和疾病的建議。盡管ACMG指南為變異解釋提供了一個循證的框架,但各實(shí)驗(yàn)室之間實(shí)際應(yīng)用存在相當(dāng)大的差異,導(dǎo)致對VUS的判讀存在11%~26%的不一致[19-20],各實(shí)驗(yàn)室之間位點(diǎn)篩選的邏輯也未形成統(tǒng)一的行業(yè)標(biāo)準(zhǔn)。
需注意的是,盡管判斷位點(diǎn)致病性的證據(jù)多數(shù)可進(jìn)行自動化分析(如人群頻率、軟件預(yù)測等),而有些只能通過人工閱讀文獻(xiàn)或驗(yàn)證實(shí)驗(yàn)獲取。輔助解讀軟件可自動在ACMG指南框架下對變異進(jìn)行致病性判斷,但均需人工進(jìn)行校正,才可獲取足夠的證據(jù)項(xiàng)從而得到準(zhǔn)確的結(jié)論。若出現(xiàn)不確定結(jié)果時需與實(shí)驗(yàn)室及時溝通,鼓勵具備生物信息學(xué)分析能力的醫(yī)師,必要時向?qū)嶒?yàn)室申請?zhí)峁y序數(shù)據(jù)并自行進(jìn)行變異分析[21-22]。病例匹配、功能分析(包括RNA測序等)、構(gòu)建變異基因的動物模型是進(jìn)一步分析、驗(yàn)證VUS是否具有致病性的選擇,但這需大量的時間和資源,在臨床工作中很難實(shí)現(xiàn)。因此,大多數(shù)VUS仍未得到解決,這也是目前臨床和科研所面臨的一大挑戰(zhàn)。
5.對于陰性結(jié)果解讀
報(bào)告中“良性”或“可能良性”的變異及檢測出與表型不相關(guān)的基因變異為陰性結(jié)果。盡管陰性結(jié)果提示患者罹患非遺傳性疾病的可能性大,但也有可能存在假陰性的結(jié)果[23]。陰性結(jié)果原因有以下幾個方面:
(1)報(bào)告質(zhì)量控制:當(dāng)臨床醫(yī)生拿到一份NGS報(bào)告時,應(yīng)關(guān)注其樣本主要質(zhì)控參數(shù)、可報(bào)告范圍(檢測內(nèi)容)、檢測方法及其局限性等相關(guān)內(nèi)容。這些內(nèi)容可能部分位于報(bào)告首頁后(如檢測內(nèi)容概述),更多詳細(xì)信息多以附錄形式出現(xiàn)在報(bào)告主體內(nèi)容后,往往易被忽略。質(zhì)量控制的結(jié)果決定了報(bào)告結(jié)果是否真實(shí)可信[24],檢測質(zhì)量較差時則可能得到假陰性結(jié)果。
(2)探針沒有覆蓋:盡管WES技術(shù)取得了許多進(jìn)展,但其覆蓋范圍并不均勻(特別是在第一外顯子、高GC/AT區(qū)域和低復(fù)雜性區(qū)域),且受到捕獲探針特異性的限制,有可能造成假陰性結(jié)果。采用增強(qiáng)的外顯子組捕獲技術(shù),可進(jìn)一步提高醫(yī)學(xué)相關(guān)基因的覆蓋率。此外,NGS技術(shù)發(fā)展迅速,不同實(shí)驗(yàn)室或捕獲測序商業(yè)平臺不斷更新,在實(shí)際平均深度和中靶率上,不同的捕獲平臺也存在差異[25]。
(3)WES測不出或測不準(zhǔn)的變異:WES由于其檢測原理,對于長的動態(tài)變異、小的拷貝數(shù)變異、高度同源序列上的變異均存在測不準(zhǔn)的情況,而對于結(jié)構(gòu)變異、非編碼區(qū)變異、表觀遺傳、高度重復(fù)區(qū)域的變異則可能測不出。
如UGT1A1基因在其調(diào)控區(qū)域具有啟動子TATAA元件和苯巴比妥反應(yīng)增強(qiáng)元件(PBREM),以上均是Gilbert綜合征的主要突變區(qū)域。我國Gilbert綜合征患者最常見的UGT1A1突變位點(diǎn)是-3279 T>G(36.3%),其位于UGT1A1基因的PBREM中[26],位于非編碼區(qū),而WES不能覆蓋此區(qū)域,可導(dǎo)致漏診,形成假陰性結(jié)果。
WES對于結(jié)構(gòu)變異(SVs)很難發(fā)現(xiàn),SVs是一類大于50個堿基對的變異體,長度可達(dá)3 Mb,包括缺失、復(fù)制、插入、倒置、移動元素插入(轉(zhuǎn)座子)、易位和復(fù)雜的重排[27]。如遺傳性視網(wǎng)膜疾病,約有4.29%的患者是由致病性結(jié)構(gòu)變異導(dǎo)致[28]。
(4)新的致病基因和疾病尚未發(fā)現(xiàn):在過去的幾年里,每年有超過250個新的致病基因被發(fā)現(xiàn),WES/WGS在闡明、診斷相應(yīng)孟德爾遺傳病方面發(fā)揮了重要作用[29]。如進(jìn)行性家族性肝內(nèi)膽汁淤積癥也是因近年新致病基因的發(fā)現(xiàn)而得以拓寬對其的認(rèn)識,從過去我們認(rèn)知的PFIC1型(ATP8B1)、PFIC2型(ABCB11)、PFIC3型(ABCB4)增加到PFIC4型(TJP2)、PFIC5型(NR1H4)和PFIC6型(MYO5B)[30]。據(jù)統(tǒng)計(jì),OMIM數(shù)據(jù)庫平均每個月更新40~50個基因條目,隨著研究和文獻(xiàn)的更新及家系資料的補(bǔ)充,變異的致病性判斷可能會發(fā)生改變。因此,對于一些發(fā)病年齡早、有家族類似病史、存在多個系統(tǒng)或多個臟器病變、高度懷疑遺傳代謝性疾病的患者,如檢測結(jié)果為陰性,仍需謹(jǐn)慎判斷、考慮多種因素導(dǎo)致結(jié)果陰性的可能。
(5)非經(jīng)典孟德爾遺傳:遵循孟德爾遺傳模式的疾病被稱為孟德爾遺傳疾病。約80%的罕見疾病是遺傳性的,這些疾病大多數(shù)是遵循孟德爾遺傳方式的單基因疾病,但超過一半已確定的孟德爾病的遺傳機(jī)制仍難以明確。臨床中常見的非經(jīng)典孟德爾遺傳方式包括單親二體、遺傳印記、遺傳早現(xiàn)、線粒體遺傳和嵌合體、雙基因遺傳、修飾基因等。在遺傳性肝病中,Rotor綜合征就是典型的雙基因隱性遺傳疾病,由SLCO1B1和SLCO1B3同時發(fā)生純合或復(fù)合雜合突變引起。此外,外顯不完全和表達(dá)量不同的遺傳性變異體可能進(jìn)一步使得對其臨床意義的正確解讀復(fù)雜化[31]。
6.缺乏多學(xué)科會診
與常見疾病的診斷一樣,罕見病的診斷也依賴于就診時的體格檢查、診斷性檢查及醫(yī)師的臨床知識。但罕見疾病的癥狀往往被更常見的疾病所掩蓋。此外,罕見病可能是高度個體化的,遺傳背景和環(huán)境因素之間存在復(fù)雜的相互作用,基因的多效性(即一個基因不等于一個表型或疾病)也增加了診斷的難度。通過遺傳學(xué)家和臨床醫(yī)生、病理和影像專家參與的多學(xué)科會診模式,可有效提高診斷的效率[32]。
總之,上述仔細(xì)分析有助于我們甄別假陰性和真陰性結(jié)果。而對WES數(shù)據(jù)重新分析,有助于解決假陰性問題。由于不斷有孟德爾病新基因的發(fā)現(xiàn)及VUS致病性分析和生物信息學(xué)的發(fā)展進(jìn)步,對現(xiàn)有WES數(shù)據(jù)的重新分析可能會在數(shù)據(jù)生成數(shù)年后發(fā)現(xiàn)致病變異。研究表明,對初次分析結(jié)果為陰性的病例進(jìn)行WES數(shù)據(jù)重分析,可獲得額外平均10%的診斷率[33]。臨床中遇到以下幾種情況即建議進(jìn)行數(shù)據(jù)重新分析:(1)未明確診斷的陰性報(bào)告,懷疑為單基因疾病;(2)針對常染色體隱性遺傳疾病,只發(fā)現(xiàn)與表型相關(guān)的一個變異;(3)檢測報(bào)告的結(jié)果提示與表型相關(guān)的變異類型為VUS;(4)受檢者出現(xiàn)新的表型,或較之前報(bào)告的表型有新補(bǔ)充和關(guān)注的疾病方向;(5)家族內(nèi)出現(xiàn)相同表征的患者。一項(xiàng)對27項(xiàng)研究進(jìn)行的系統(tǒng)評價發(fā)現(xiàn),數(shù)據(jù)重分析將診斷率提高了約15%,建議在原始分析后18個月重新分析以優(yōu)化檢出率[34]。這一領(lǐng)域仍需要進(jìn)一步研究,以確定最佳做法。
隨著基因測序技術(shù)的不斷發(fā)展,WES在遺傳代謝性肝病的診斷和治療中起著越來越重要的作用。然而,我們也看到仍有超過60%的遺傳性疾病無法診斷而難以治療[40-41]。如何增加對WES的認(rèn)識、使用好WES,成為提升臨床醫(yī)師診療能力的挑戰(zhàn)。發(fā)揮臨床團(tuán)隊(duì)多學(xué)科優(yōu)勢與提升個人能力相結(jié)合,有助于解決這一問題。一方面,從醫(yī)療單位、學(xué)科建設(shè)角度出發(fā),應(yīng)積極推進(jìn)WES的開展,加強(qiáng)對臨床醫(yī)師的相關(guān)知識培訓(xùn),組建由遺傳學(xué)、生物信息學(xué)分析專家參與的肝病基因組學(xué)團(tuán)隊(duì),積極開展由肝病專家主導(dǎo)的多學(xué)科會診;另一方面,這也對臨床醫(yī)師提出了更高的要求:提倡具備對測序數(shù)據(jù)的自主分析能力;在強(qiáng)調(diào)以臨床思維為主導(dǎo)的同時,應(yīng)鼓勵臨床醫(yī)生熟練掌握并綜合應(yīng)用生化指標(biāo)、病理學(xué)、影像學(xué)、基因分子診斷等多學(xué)科知識;對一時未能診斷的患者應(yīng)進(jìn)行長期隨訪、必要時對WES數(shù)據(jù)再分析。