秦小波, 高 華, 張冰冰, 高繼海
(1. 四川省自然資源科學研究院,成都 610015; 2. 成都中醫(yī)藥大學 藥學院 西南特色中藥資源國家重點實驗室,成都 611137; 3.成都市第三人民醫(yī)院 血液科,成都 610031; 4. 成都大學 醫(yī)學院(護理學院), 成都 610106)
新型冠狀病毒(SARS-CoV-2)是具有包膜的正鏈RNA病毒,屬冠狀病毒屬(Coronavirus);其感染引起的肺炎被世界衛(wèi)生組織命名為新型冠狀病毒肺炎(COVID-19)[1]。SARS-CoV-2屬于β屬的新型冠狀病毒,其顆粒多是多形性,直徑約60~140 nm;其基因特征與中東呼吸綜合征冠狀病毒(MERS-CoV)和急性呼吸系統(tǒng)綜合征冠狀病毒(SARS-CoV)有明顯區(qū)別[2];其RNA既可像mRNA 一樣直接進行蛋白翻譯,也可當作模板合成負義鏈,再經負義鏈復制子代RNA,具有很高的突變率[3]。
已公布的SARS-CoV-2基因組序列[4-5]中,基因組全長約30 kb,預測的開放讀碼框架(ORF)達11個,可能編碼已知或未知的成熟功能蛋白20余種;其基因組具有典型的冠狀病毒基因組結構,依次為5′-非翻譯區(qū)、5′-復制酶多聚糖蛋白基因(orf1/ab)、刺突糖蛋白基因(Spike, S)、小包膜糖蛋白基因(envelope,E)、膜糖蛋白基因(membrane,M)、核衣殼蛋白基因(nucleocapsid,N)以及3′-非翻譯區(qū)[6]。SARS-CoV-2作為一個新變種,其流行規(guī)律、致病機制與病原學特征都和以往流行的冠狀病毒具有差異。SARS-CoV-2全基因組序列的破譯,為COVID-19的診斷與相關研究提供了非常有用的基礎。又因其與SARS-CoV基因組表現出較高的序列同源性[2,6],相關研究可通過與已有的其他冠狀病毒的蛋白編碼特征比較預測,為后續(xù)研究提供有力的指導。
核衣殼蛋白即N蛋白,是RNA病毒的主要結構蛋白之一,與致病性密切相關。SARS-CoV-2 N蛋白的功能主要與結合病毒RNA發(fā)揮作用相關,可能參與RNA的轉錄及復制等,更全面的生物學功能還需深入研究。從預測的蛋白質氨基酸序列分析,其可能還具有與致病機理相關的新功能,因此在COVID-19的診斷以及疫苗研發(fā)方面具有重要意義。
通過公開的新型冠狀病毒的全基因組數據分析發(fā)現,N蛋白在不同地區(qū)的SARS-CoV-2中幾乎沒有變異,在冠狀病毒間變異也較小,且核心結構區(qū)域保守。因此,其重組抗原對亞單位疫苗的研究和診斷試劑的研制具有重要價值。本研究利用生物信息學預測分析SARS-CoV-2的N蛋白結構,構建原核系統(tǒng)并進行表達,獲得了大量高效表達的重組蛋白,為其作ELISA包被抗原開展抗體檢測提供基礎,也為后續(xù)相關深入研究提供借鑒和幫助。
大腸桿菌菌株BL21、質粒載體pET-28實驗保存。核衣殼蛋白基因編碼序列等根據GenBank:NC_045512由擎科生物科技有限公司根據密碼子偏好優(yōu)化合成。各種限制性內切酶、連接酶等購自TaKaRa公司;Ni-NTA 柱購自QIAGEN公司;抗His-tag多克隆抗體購自YEASEN公司;山羊抗兔IgG購自中杉金橋公司;Marker、質粒提取試劑盒和膠回收試劑盒購自天根生物有限公司;其他常規(guī)化學試劑均為進口或國產分析純。
1.2.1 SARS-CoV-2 核衣殼蛋白核酸及氨基酸序列分析
從國家生物信息中心(https://bigd.big.ac.cn)和NCBI 數據庫(https://www.ncbi.nlm.nih.gov)獲得SARS-CoV-2 與其他冠狀病毒的核衣殼區(qū)域核苷酸及其氨基酸序列,并分析預測分子質量、等電點及氨基酸組成。利用ClusterX進行序列比對分析同源區(qū)域及保守區(qū)。
1.2.2 SARS-CoV-2 核衣殼蛋白二級結構預測
應用EXPASY 服務器(https://www.expasy.org/resources)上的SOPMA、GOR 等方法分析預測核衣殼蛋白的二級結構[7-8],以及PROSCAN預測蛋白的修飾位點,SignalP預測蛋白的信號肽。
As the understanding of myocardial protection improved,the use of mildly hypertrophic left ventricles with short ischaemic times were also proposed with the caveat that there were no ECG changes[116].
1.2.3 SARS-CoV-2 核衣殼蛋白三級結構預測
采用Swiss-model(https://swissmodel.expasy.org)預測分析核衣殼蛋白的三級結構[9]。
1.2.4 SARS-CoV-2 核衣殼蛋白跨膜預測
采用TMHMM (http://www.cbs.dtu.dk/services/TMHMM)預測驗證其是否存在跨膜結構。
根據基因設計引物,結合質粒載體pET-28 多克隆位點,將BamH I與SacI兩個限制性酶切位點引入引物。引物:SV2NPF:5′-CGGGATCC ATGTCTGATAATGGACCCCA-3′;SV2NPR:5′-CGAGCTC GAGGCCTGAGTTGAGTCAG CAC-3′。PCR 條件:95 ℃預變性5 min; 94 ℃ 變性30 s,53 ℃退火30 s,72 ℃延伸1 min 20 s,30個循環(huán);然后72 ℃再延伸10 min。
將利用高保真酶擴增的PCR 產物雙酶切膠回收后連入pET-28載體。轉化BL21感受態(tài)細胞, 以獲得重組菌pET-N。在含50 mg/L卡那霉素的LB 培養(yǎng)基上進行初步篩選,挑取陽性克隆的菌落測序鑒定。
挑取重組菌pET-N,接入含卡那霉素的LB 液體培養(yǎng)基,37 ℃ 振蕩培養(yǎng)至OD600值為0.6~0.8時,取培養(yǎng)物作為誘導前樣品;向其余培養(yǎng)物中加入IPTG誘導表達。收集誘導后的菌體,重懸于PBS 溶液,液氮反復凍融4 次,再冰上超聲波處理(6 s × 9 s),直到菌液澄清。4 ℃離心后,取上清液和沉淀分別上樣。SDS-PAGE 電泳檢測重組載體的蛋白表達。Western Blot轉移,以抗His-tag 多克隆抗體作為一抗,羊抗兔IgG 多克隆抗體作為二抗,進行Western分析。
SARS-CoV-2 N蛋白的氨基酸有419個氨基酸,相對分子質量約為45.6 ku,等電點10.07,是堿性蛋白,且親水性強,疏水性弱。利用國家生物信息中心和NCBI 數據庫公開數據,選取了10個全球各地代表性的SARS-CoV-2 N蛋白氨基酸序列,同時選取了10個其他代表性冠狀病毒的N蛋白氨基酸序列,進行氨基酸序列比對,結果如圖1所示。分析發(fā)現各地SARS-CoV-2 N蛋白氨基酸序列幾乎沒有變異,但SARS-CoV-2 N蛋白氨基酸序列與其他冠狀病毒的N蛋白間存在一定變異,特別是N-端和C-端。結合三級結構預測比對分析發(fā)現N蛋白序列存在2個保守區(qū)域Region1和Region2,而在這兩個區(qū)域間的序列,SARS-CoV-2與其他冠狀病毒仍存在較多變異。
序列編號已標注在圖中。圖1 不同地區(qū)SARS-CoV-2 N蛋白氨基酸序列與其他β冠狀病毒的同源性比較Figure 1 Comparison of amino acid sequence of SARS-CoV-2 N protein with other β-coronaviruses in different regions
翻譯后修飾是蛋白質能夠發(fā)揮作用的重要過程,通過PROSCAN預測SARS-CoV-2 核衣殼蛋白的修飾位點。發(fā)現其氨基酸序列中有3個N-糖基化位點(N-glycosylation site),1個cAMP-和 cGMP-依賴的蛋白激酶磷酸化位點(cAMP-and cGMP-dependent protein kinase phosphorylation site),10個蛋白激酶C磷酸化位點(protein kinase C phosphorylation site),6個酪蛋白激酶II磷酸化位點(casein kinase II phosphorylation site),12個N-?;稽c(N-myristoylation site),1個酰胺化位點(amidation site),見表1。蛋白激酶C磷酸化位點特征序列是[ST]-x-[RK],C-端的堿性氨基酸殘基R或K可以很大程度上提高磷酸化反應的Vmax和Km。同時,體內的蛋白激酶C可以讓氨基酸Thr或Ser磷酸化,從而通過氨基酸的磷酸化調節(jié)蛋白質的活性[10]。分析發(fā)現所有位點中,共有17個蛋白激酶磷酸化位點,排在第一位。蛋白激酶磷酸化位點的存在,支持病毒RNA在轉錄過程中需要磷酸化活化。
表1 SARS-CoV-2核衣殼蛋白的修飾位點的預測
應用SOPMA、GOR分析工具預測SARS-CoV-2 核衣殼蛋白的二級結構(圖 2)。2 種方法對SARS-CoV-2 N蛋白的二級結構預測有較好的一致性,都顯示其二級結構中的柔性區(qū)域以無規(guī)卷曲為主,少見β-轉角(表2)。
SOPMA、GOR 為不同的預測方法;h:α-螺旋;e:β-片層;c:無規(guī)卷曲;t:β-轉角。圖2 SARS-CoV-2 核衣殼蛋白二級結構預測Figure 2 Prediction of secondary structure of SARS-CoV-2 N protein
表2 SARS-CoV-2 核衣殼蛋白二級結構百分占比
應用Swiss-model分析工具預測SARS-CoV-2 核衣殼蛋白的三級結構。通過比對蛋白質數據庫,發(fā)現其滿足同源建模條件,模擬三級結構如圖3所示。同時結合序列分析,發(fā)現其存在2段同源性高達90%以上的同源保守區(qū)域(圖1)。
(a)為核衣殼蛋白的三維結構;(b)為引入載體His標簽序列的核衣殼蛋白的三維結構。
經TMHMM預測分析,SARS-CoV-2 N蛋白無跨膜結構(圖4);而SignalP分析發(fā)現其無信號肽序列,其特征符合冠狀病毒核衣殼蛋白的主要特征。
圖4 TMHMM 預測SARS-CoV-2 核衣殼蛋白分析
以經過大腸桿菌密碼子優(yōu)化的合成核衣殼蛋白基因為模板,利用設計的帶BamH I 和SacI酶切位點的特異性引物進行PCR擴增,并膠回收獲得大量目的片段。將目的片段與pET-28載體分別經BamH I 和SacI 雙酶切,然后連接連入載體,構建重組原核表達載體pET-N。將連接產物轉化大腸桿菌BL21感受態(tài),挑選陽性克隆,接入LB液體培養(yǎng)基振蕩培養(yǎng),取樣通過測序驗證序列一致性后得到pET-N重組大腸桿菌。
pET-N重組大腸桿菌接入含相應抗生素的LB液體培養(yǎng)基中,經37 ℃振蕩培養(yǎng)至OD600值為0.6~0.8時,取培養(yǎng)物作為誘導前樣品;然后加入 IPTG至濃度1.0 mmol/L進行誘導。誘導培養(yǎng)6 h 后,收集菌體,并將樣品進行12% SDS-PAGE 電泳。電泳后,蛋白膠進行掃描分析蛋白Marker 和目的蛋白遷移率Mr,并根據 lgMw-Mr 的線性關系計算目的蛋白分子質量。分析顯示,在分子質量約50 ku處出現蛋白條帶,該蛋白與帶His 標簽的重組蛋白理論大小相符;同時目的蛋白表達量達菌體總蛋白的15%以上(圖5)。
1:空載體誘導對照;2:誘導重組菌;3:超聲裂解后包涵體;4:超聲裂解后相應可溶性蛋白;5:未誘導重組菌對照;6:純化的目的蛋白。
在重組表達設計時,為了便于重組蛋白的純化及鑒定,引入了載體上帶有的His 標簽。以兔抗His-tag 多克隆抗體為一抗,羊抗兔IgG抗體為二抗,進行核衣殼重組蛋白的Western Blot 分析。結果顯示,在約50 ku處出現了特異性條帶,與預期結果相吻合,表明該重組蛋白為目的蛋白SARS-CoV-2 N蛋白(圖6)。
M:蛋白質Maker;1:未誘導;2:誘導重組蛋白。
將誘導后收集的菌體進行超聲波破碎,離心后分別取上清液和沉淀作為樣品進行SDS-PAGE電泳,結果發(fā)現上清液與沉淀中都含有目的條帶,且包涵體中目的蛋白較多。由此表明,所表達的重組蛋白存在的包涵體可能與誘導條件有關,適當降低IPTG終濃度可以減少目的蛋白包涵體的產生(圖5)。
通過對pET-N重組表達菌的振蕩培養(yǎng),IPTG誘導處理,收集菌體,并進行超聲波破碎及包涵體溶解;然后利用目的蛋白C末端帶有的His標簽,進行Ni-NTA柱親和層析,收集洗脫峰,得到純化的融合蛋白。12% SDS-PAGE 電泳檢測分析表明,通過Ni-NTA 柱洗脫得到的樣品,經復性、透析除鹽后,可檢測到單一的蛋白電泳條帶,因此獲得了較純的融合蛋白,純度可以達到90%。通過該重組蛋白,利用醫(yī)療機構已有的ELISA檢測基礎,可開展SARS-CoV-2感染者血清中理論上存在的IgG或IgM抗體檢測,從而輔助補充核酸等檢測的不足。同時,利用核衣殼蛋白的免疫原性,結合膠體金等方式,可開發(fā)SARS-CoV-2抗體檢測試劑盒等。
全基因組測序結果提示,SARS-CoV-2 與SARS CoV 基因組序列同源性較高,說明兩者的結構和功能有一定的相似性[4,11]。本研究通過氨基酸同源比對分析,也發(fā)現SARS-CoV-2與SARS CoV的核衣殼蛋白(N 蛋白)氨基酸序列同源性較高,具有兩段同源性很高的保守區(qū)域,但在N端和C端差異較為明顯(圖1)。
核衣殼蛋白是冠狀病毒中一種與RNA相關的重要結構蛋白,一般位于病毒的核心,呈長螺旋核殼體,與病毒RNA結合,參與病毒包裝過程[12]。對不同地區(qū)提交的SARS-CoV-2基因組分析,推測N蛋白具有419 aa,分子質量大小約為45.6 ku,位于3′-端。預測顯示其等電點高達10.07,是典型的堿性蛋白;同時其中性親水性最強,氨基酸占比達44%,疏水性較弱,占比僅33%;與SARS CoV的N蛋白親疏水性有一定差異。SARS-CoV-2 N蛋白序列分析顯示,其177~207的序列存在多個SRXXX的特征序列,其可能是與RNA結合的位點[13],同時在SARS-CoV N蛋白序列的相應位置也發(fā)現具有該SRXXX特征序列;因此,推測177~207序列區(qū)域可能是SARS-CoV-2 N蛋白的RNA結合區(qū)域的部分。此外,SARS-CoV N蛋白位點分析發(fā)現在373~390蛋白序列區(qū)存在核轉移信號,但SARS-CoV-2 N蛋白序列在相應區(qū)域與SARS-CoV存在多個氨基酸變異,沒有該核轉移信號基序。而SARS-CoV-2 N蛋白序列中存在大量蛋白激酶磷酸化位點;磷酸化作為一種分子開關,可以改變RNA轉錄與剪接凝聚物(condensates)與蛋白復合物的親和力;這揭示SARS-CoV-2 N蛋白在病毒RNA的轉錄上可能存在開關功能[14]。
利用全病毒抗原進行診斷或試劑盒開發(fā)需要PⅢ級實驗室的支撐,成本高且易造成環(huán)境污染。因此,重組表達具有免疫原性重組蛋白是更好的選擇。大腸桿菌是一種最廣泛的原核表達系統(tǒng),其表達目的蛋白,具有快捷、經濟、高效等諸多優(yōu)點。本研究通過構建SARS-CoV-2 N蛋白的重組載體,重組融合蛋白在大腸桿菌中得到高效表達,但目的蛋白中的大部分以包涵體形式存在。雖然外源蛋白的表達容易形成無活性的包涵體是原核表達系統(tǒng)的不足[15],但通過適當降低溫度和IPTG濃度等可以減少包涵體的形成。而且,以包涵體形式表達的蛋白也容易純化,同時不經復性也可作包被抗原來檢測抗體,這在單純的免疫反應檢測上更具高效性。而冠狀病毒N蛋白的相關研究均揭示N蛋白具有很強的免疫原性[16-17]。在SARS期間,針對其N蛋白與患者體內血清的免疫原性研究已表明N蛋白對SARS-CoV診斷試劑的研制具有很高的價值[16],這對SARS-CoV-2病毒N蛋白的免疫原性及相關開發(fā)提供有力參考。雖然目前針對SARS-CoV-2 感染的免疫反應研究很少,僅有研究提到COVID-19 患者的N蛋白特異性抗體反應[4],這反映SARS-CoV-2病毒的N蛋白參與了機體的體液免疫。因此,本研究構建的SARS-CoV-2病毒N蛋白的重組表達蛋白可進行COVID-19的臨床檢測;同時本研究也為SARS-CoV-2 抗原抗體檢測試劑盒開發(fā)以及后續(xù)的SARS-CoV-2 基因組選擇性包裝等研究提供了技術支撐。