林 琦 黃枝妙 福建省疾病預(yù)防控制中心,福建省人獸共患病研究重點(diǎn)實(shí)驗(yàn)室(福建,福州,350001)
王宇平 鄭 暉 翁育偉(通訊作者) 福州國(guó)際旅行衛(wèi)生保健中心(福建,福州,350001)
新型冠狀病毒(SARS-CoV-2)是單股正鏈RNA病毒(Riboviria),屬于有包膜的β 屬冠狀病毒,是目前已知的第7 種可以感染人類(lèi)的冠狀病毒[1],基因組全長(zhǎng)約為30 kb。 SARS-CoV-2 感染患者和無(wú)癥狀感染者均可通過(guò)呼吸道飛沫、密切接觸等途徑將SARS-CoV-2 病毒傳播給易感人群[2]。 截至2021 年4 月19 日,全球范圍內(nèi)由SARS-CoV-2 感染導(dǎo)致的肺炎確診病例共計(jì)141 057 106 例, 死亡病例高達(dá)3 015 043 例[3],已造成全球性大流行。
福建省自2020 年2 月26 日本地新冠病例清零后,截至2021 年4 月19 日共確診境外輸入新冠病例290 例。 為了探索并構(gòu)建SARS-CoV-2 病例標(biāo)本直接高通量測(cè)序的方法(不經(jīng)過(guò)病毒分離培養(yǎng)的病毒全基因組測(cè)序方法),本研究選取1 例病毒載量較低的輸入性SARS-CoV-2 無(wú)癥狀感染病例咽拭子標(biāo)本進(jìn)行病毒全基因組二代測(cè)序和生物信息學(xué)分析, 為今后快速掌握輸入性SARS-CoV-2 病毒的基因組特征、追溯病毒潛在來(lái)源、追蹤病毒變異變遷規(guī)律提供有力的技術(shù)支撐, 從分子流行病學(xué)角度為我省新冠肺炎疫情的溯源和防控工作提供科學(xué)依據(jù)。
患者女,31 歲,于2021 年1 月8 日從日本回到福建省福州市,福州機(jī)場(chǎng)海關(guān)對(duì)其采集鼻咽拭子進(jìn)行SARS-CoV-2 核酸檢測(cè), 檢測(cè)結(jié)果為SARSCoV-2 核酸陽(yáng)性。 次日凌晨起被送至定點(diǎn)醫(yī)院隔離觀(guān)察,隔離觀(guān)察期間無(wú)明顯臨床癥狀,后被確診為無(wú)癥狀感染者。 福州市海關(guān)將該陽(yáng)性標(biāo)本(標(biāo)本號(hào):TH-H210159)于1 月13 日送至福建省疾病預(yù)防控制中心進(jìn)行SARS-CoV-2 全基因組測(cè)序。
取陽(yáng)性標(biāo)本液200 μL,采用病毒核酸提取試劑(西安天隆,磁珠法),按試劑盒說(shuō)明書(shū)和自動(dòng)核酸提取儀的操作說(shuō)明進(jìn)行病毒核酸(RNA)提取。 利用新冠病毒核酸檢測(cè)試劑(達(dá)安基因)對(duì)所獲病毒核酸進(jìn)行SARS-CoV-2 檢測(cè),經(jīng)復(fù)核,該病例核酸中的ORF1ab 基因Ct 值為35.50,N 基因Ct 值為33.38。
以提取的病毒RNA 作為模板, 按照Ion AmpliSeq SARS-CoV-2 Research Panel(ThermoFisher Scientific,美國(guó))使用說(shuō)明進(jìn)行新型冠狀病毒全基因組擴(kuò)增及測(cè)序文庫(kù)構(gòu)建。(1)使用SuperScript VILO cDNA Synthesis Kit(ThermoFisher Scientific,美國(guó))對(duì)病毒RNA 進(jìn)行反轉(zhuǎn)錄,合成第一鏈cDNA;(2)使用SARS-CoV-2 全基因組擴(kuò)增引物(ThermoFisher Scientific, 美國(guó)) 和Ion AmpliSeq Library Kit Plus(ThermoFisher Scientific,美國(guó))進(jìn)行病毒全基因組擴(kuò)增及測(cè)序文庫(kù)構(gòu)建;(3)采用Ion chef 系統(tǒng)及其配套試劑(ThermoFisher Scientific,美國(guó))來(lái)制備高通量測(cè)序模板;(4)最后,使用Ion Torrent GeneStudio S5 二代測(cè)序系統(tǒng)、Ion 530 芯片及配套試劑(ThermoFisher Scientific,美國(guó))對(duì)病毒全基因組進(jìn)行測(cè)序。
利用Ion Torrent 服務(wù)器內(nèi)置的IRMA(the iterative refinement meta-assembler)插件完成測(cè)序數(shù)據(jù)優(yōu)化、SARS-CoV-2 全基因組序列拼接及核苷酸突變分析等,利用IGV(version 2.8.13)查看并確認(rèn)可疑突變位點(diǎn),剔除非可信變異位點(diǎn)后最終確定病毒全基因序列。
根據(jù)IRMA 插件分析得到的核苷酸和氨基酸突變位點(diǎn)來(lái)確定病毒在中國(guó)分型法和GISAID 分型法中的對(duì)應(yīng)型別;分別利用在線(xiàn)工具Pangolin(https://pangolin.cog -uk.io/) 和 Nextclade (https://clades.nextstrain.org/) 進(jìn)行Pangolin 分型和Nextstrain 分型[4]。 根據(jù)全基因分型結(jié)果,從GISAID 上篩選并下載參比序列,采用在線(xiàn)的MAFFT version 7 軟件(https://mafft.cbrc.jp/alignment/server/) 進(jìn)行序列比對(duì), 最后使用MEGA 6.0 軟件的鄰接法(Neighbor-Joing,NJ)構(gòu)建系統(tǒng)進(jìn)化樹(shù),用bootstrap 抽樣1 000次來(lái)評(píng)估進(jìn)化樹(shù)的可靠性。
測(cè)序下機(jī)數(shù)據(jù)經(jīng)分析,該病例標(biāo)本此次測(cè)序共獲得有效reads 為4 305 361 條,平均讀長(zhǎng)為187 bp;經(jīng)Ion Torrent 服務(wù)器內(nèi)置插件IRMA 拼接獲得一條全長(zhǎng)為29 883 bp 的病毒全基因組序列(GISAID序列號(hào):EPI_ISL_1663017);Coverage Analysis 插件分析結(jié)果顯示, 以 SARS -CoV -2 武漢株(EPI_ISL_402125)為參考基因組,本次測(cè)序有效reads 中有4 243 271 條reads(有效率為98.56%)能夠比對(duì)到參考基因組上,測(cè)序平均深度為25 762×,基因組覆蓋度(完整度)為98.61%,覆蓋均一度較好,詳見(jiàn)圖1。
圖1 SARS-CoV-2 全基因組二代測(cè)序深度及覆蓋度分析
Variant Caller(突變分析插件)分析結(jié)果顯示,該SARS-CoV-2 病毒基因組序列同武漢參考株(EPI_ISL_402125)序列相比,共存在18 處核苷酸突變,突變類(lèi)型包含17 個(gè)SNP(單核苷酸多態(tài)性)和1處MNP(多核苷酸多態(tài)性),分別來(lái)自1 個(gè)非編碼區(qū)(ORF1ab 上游基因) 和5 個(gè)基因編碼區(qū) (包括:ORF1ab、S、ORF3a、ORF8、N), 編碼區(qū)中11 個(gè)突變位點(diǎn)來(lái)自O(shè)RF1ab 基因、1 個(gè)來(lái)自S 基因(D614G)[x]、1 個(gè)來(lái)自O(shè)RF3a、1 個(gè)來(lái)自O(shè)RF8 基因、3 個(gè)來(lái)自N 基因;氨基酸突變類(lèi)型包括7 個(gè)同義突變和10 個(gè)非同義突變。 該SARS-CoV-2 病毒全基因組序列突變情況見(jiàn)表1。在所有突變中,未見(jiàn)潛在的可導(dǎo)致毒株傳播力或致病性增強(qiáng)的氨基酸變異位點(diǎn)。
應(yīng)用中國(guó)分型法、Pangolin 分型法、Nextstrain分型法及GISAID 分型法等4 種不同的新冠病毒全基因分型方法對(duì)該病毒進(jìn)行分型, 分型結(jié)果顯示:該輸入性新冠病毒在中國(guó)分型法中屬于L 基因型歐洲家系分支,處于Pangolin 譜系中的B.1.1.214 進(jìn)化分支上,Nextstrain 分型為20B,GISAID 分型為GR 型。 不同分型結(jié)果及依據(jù)見(jiàn)表2。
根據(jù)該SARS-CoV-2 病毒全基因組的分型結(jié)果, 從GISAID 上篩選并下載了43 條參比序列,包含了Pangolin 進(jìn)化分支A 和B 及其子分支(B.1、B.1.1.214、B.1.1.7 英國(guó)變異株分支、B.1.351 南非變異株分支、P.1 巴西變異株分支等)。
將該SARS-CoV-2 病毒全基因組與所有參比序列構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖2),結(jié)果顯示該SARS-CoV-2病毒基因組序列與來(lái)自日本的參考株聚成一簇,共同處于進(jìn)化分支B.1.1.214 上,且與其中一株來(lái)自日本大阪(Japan/Osaka)的SARS-CoV-2 序列最接近;該病毒基因序列與我國(guó)本土流行的SARS-CoV-2 毒株(武漢1-3 月份流行株)屬于不同的基因型,提示該病毒為輸入性,而非本土新冠病毒的持續(xù)傳播;此外,該病毒序列與英國(guó)變異株(B.1.1.7 分支)、南非變異株(B.1.351分支)及巴西變異株(P.1 分支)處于不同分支上,無(wú)明顯相關(guān)性。 進(jìn)化分析結(jié)果證實(shí)該SARS-CoV-2 病毒來(lái)源于日本,且很可能來(lái)源于日本大阪地區(qū)。
圖2 SARS-CoV-2 病毒全基因組進(jìn)化樹(shù)
本研究采用SARS-CoV-2 全基因組靶向擴(kuò)增結(jié)合Ion S5 高通量二代測(cè)序技術(shù),成功地從1 例病毒載量較低(ORF1ab 基因Ct 值為35.50,N 基因Ct值為33.38) 的境外輸入新冠病例標(biāo)本中獲得一條全長(zhǎng)為29 883 bp 的病毒全基因組序列, 平均測(cè)序深度為25 762×,基因組覆蓋度達(dá)到98.61%,高質(zhì)量的測(cè)序結(jié)果為后續(xù)病毒全基因組突變位點(diǎn)分析、病毒分型及進(jìn)化分析等溯源工作提供了可靠的數(shù)據(jù)支撐。
既往研究表明,病毒的變異可能導(dǎo)致病毒的傳播力、致病力發(fā)生改變[5-7],因此快速測(cè)定病毒基因組并識(shí)別關(guān)鍵突變,是開(kāi)展病例管理和疫情處置的關(guān)鍵。 靶向擴(kuò)增結(jié)合高通量測(cè)序的技術(shù)方法,能夠跳過(guò)病毒分離培養(yǎng)環(huán)節(jié),直接從病毒載量較低的臨床標(biāo)本中靶向擴(kuò)增SARS-CoV-2 全基因組序列,再利用二代測(cè)序的高通量?jī)?yōu)勢(shì),在一次測(cè)序中獲得大量數(shù)據(jù),這些數(shù)據(jù)為拼接出完整的SARS-CoV-2 全基因組序列提供了可能性,也為后續(xù)的基因突變分析提供了足夠的測(cè)序深度, 因此該技術(shù)方法在SARS-CoV-2 的快速診斷、 變異分析和分子流行病學(xué)研究等工作中發(fā)揮了巨大作用。
本研究測(cè)序得到的SARS-CoV-2 病毒的中國(guó)分型為L(zhǎng) 基因型歐洲家系, Pangolin 分型為B.1.1.214,Nextstrain 分型為20B,GISAID 分型為GR型。 進(jìn)化分析顯示,該SARS-CoV-2 病毒與來(lái)自日本的參考株共同處于進(jìn)化分支B.1.1.214 上,與其中一株來(lái)自日本大阪(Japan/Osaka)的病毒序列最接近, 并不與我國(guó)本土流行的毒株處于同一分支上,結(jié)果證實(shí)了該病毒確實(shí)為日本輸入,且很可能來(lái)自日本大阪。 此外,該SARS-CoV-2 序列的N 蛋白含有GGG28881-28883AAC 突變, 有研究統(tǒng)計(jì)發(fā)現(xiàn)28881-28883 這3 個(gè)位點(diǎn)的堿基突變發(fā)生率大于5%,可能導(dǎo)致核酸檢測(cè)試劑盒對(duì)N 蛋白基因的檢測(cè)靈敏度降低[8-9]。由于中國(guó)疾病預(yù)防控制中心早期公開(kāi)的檢測(cè)引物及靶標(biāo)序列位置中N 基因的上游引物序列包含了28881-28883 這3 個(gè)核苷酸位點(diǎn)[10],所以需要對(duì)N 基因引物靶向區(qū)的核苷酸突變情況做持續(xù)監(jiān)測(cè),以及時(shí)評(píng)估試劑的靈敏度和準(zhǔn)確性。