吉春苗,王斌,覃盼,黃耀偉*
(1.浙江大學(xué)動(dòng)物科學(xué)學(xué)院動(dòng)物預(yù)防醫(yī)學(xué)研究所,杭州 310058;2.嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實(shí)驗(yàn)室肇慶分中心,廣東肇慶 526238)
宿主適應(yīng)性免疫系統(tǒng)通過(guò)激活B淋巴細(xì)胞產(chǎn)生不同種類的抗體,從而保護(hù)機(jī)體免受病原侵害。B細(xì)胞受體(B cell receptor,BCR)是B淋巴細(xì)胞表面識(shí)別抗原的一種膜表面免疫球蛋白(immunoglobulin,Ig),具有抗原結(jié)合特異性。BCR 由2 條重鏈(IgH)和2 條輕鏈(IgL)組成,每條鏈均包含1 個(gè)可變區(qū)(variable region,V區(qū))和1個(gè)恒定區(qū)(constant region,C區(qū))。其中,可變區(qū)由3個(gè)互補(bǔ)決定區(qū)(complementarity determining region, CDR)組成,CDR 的氨基酸組成和排列順序呈現(xiàn)高度多樣性,尤其是重鏈CDR3(heavy chain CDR3,HCDR3)區(qū)域[1]。機(jī)體抗體庫(kù)具有豐富的多樣性,產(chǎn)生原因主要包括以下幾方面。1)BCR 編碼基因具有多樣性,例如:豬BCR重鏈V(variable)基因有15 種,D(diversity)基因有4種,J(joining)基因有5種[2]。2)B淋巴細(xì)胞成熟過(guò)程中V、D、J 基因發(fā)生重排。3)V、D、J 基因在重排過(guò)程中因末端脫氧核苷酸轉(zhuǎn)移酶(terminal deoxynucleotidyl transferase, TdT)的作用導(dǎo)致連接處發(fā)生不準(zhǔn)確的連接、核苷酸的插入或缺失。4)抗體重鏈、輕鏈配對(duì)的多樣性。5)體細(xì)胞高頻突變(somatic hypermutation, SHM),即B 細(xì)胞受抗原刺激后,已重排好的可變區(qū)基因突變頻率升高,以提高對(duì)抗原的親和力[3]。
早期,傳統(tǒng)的分子克隆技術(shù)配合Sanger測(cè)序讓人們對(duì)豬抗體庫(kù)多樣性有了初步認(rèn)識(shí),研究發(fā)現(xiàn)免疫前豬抗體庫(kù)V基因使用呈現(xiàn)選擇性,4個(gè)IGHV基因使用率接近80%[2,4]。但是,由于傳統(tǒng)測(cè)序方法通量較低,相對(duì)于龐大的抗體庫(kù)來(lái)說(shuō)所獲得的信息極為有限。近年來(lái),得益于高通量測(cè)序技術(shù)的發(fā)展,使得全面了解如此多樣的抗體庫(kù)成為可能。目前,高通量測(cè)序技術(shù)已被廣泛應(yīng)用于研究健康個(gè)體以及疫苗免疫或疾病狀態(tài)機(jī)體抗體庫(kù)的特征[5-8],為充分認(rèn)識(shí)機(jī)體對(duì)疾病或疫苗的抗體反應(yīng)提供了有效信息。
雖然抗體庫(kù)高通量測(cè)序技術(shù)在人、鼠及其他物種中被廣泛使用[9-11],但對(duì)正常豬以及病毒感染狀態(tài)下豬抗體庫(kù)的全貌卻研究甚少。豬既是一種重要的經(jīng)濟(jì)動(dòng)物,也是研究抗體庫(kù)發(fā)育的理想模型。與人類不同的是,豬絨毛膜胎盤可以阻斷母體免疫球蛋白以及其他蛋白向胎兒轉(zhuǎn)移,使得在無(wú)母親被動(dòng)影響狀態(tài)下研究新生仔豬抗體庫(kù)的發(fā)育成為可能。且豬IgH 只包含1 個(gè)高度保守的V 基因片段家族(VH3)[12],這為研究抗體庫(kù)提供了一個(gè)簡(jiǎn)單方便的體系。因此,建立適用于豬抗體庫(kù)高通量測(cè)序的方法十分必要且重要。本研究擬建立豬抗體庫(kù)高通量測(cè)序方法,并應(yīng)用此方法分析健康豬在正常生理狀態(tài)下抗體庫(kù)的組成特征,以期為今后進(jìn)一步深入研究豬抗體庫(kù)的發(fā)育以及病理狀態(tài)下豬抗體庫(kù)的動(dòng)態(tài)變化提供參考。
3 周齡健康仔豬4 只,品種為長(zhǎng)白豬,為同一只母豬同胎所生,由廣東溫氏集團(tuán)研究院提供。豬淋巴細(xì)胞分離試劑盒購(gòu)自深圳市達(dá)科為生物技術(shù)股份有限公司;RNA 小提試劑盒(RNeasy Mini Kit)、DNA凝膠回收試劑盒(QIAquick Gel Extraction Kit)均購(gòu)自德國(guó)Qiagen 公司;cDNA 合成試劑盒(RevertAid H Minus First Strand cDNA Synthesis Kit)購(gòu)自美國(guó)賽默飛世爾科技有限公司;DNA 聚合酶(Platinum@TaqDNA Polymerase High Fidelity)購(gòu)自美國(guó)Invitrogen 公司;高通量測(cè)序建庫(kù)試劑盒(TruSeq Sample Preparation Kit)購(gòu)自美國(guó)Illumina公司。
分別采集4 只3 周齡健康仔豬的靜脈血液樣本,通過(guò)豬淋巴細(xì)胞分離試劑盒分離外周血單個(gè)核細(xì)胞(PBMC),步驟大致如下:先將10 mL新鮮抗凝全血用等體積磷酸鹽緩沖液(phosphate buffer saline,PBS)稀釋,然后將稀釋后的血樣平鋪到淋巴細(xì)胞分離液面上方,在室溫條件下,以700×g離心20 min。離心后,管底是紅細(xì)胞,中間層是分離液,最上層是血漿層,血漿層與分離液層之間有一層白膜,即單個(gè)核細(xì)胞層。小心吸取白膜層到新的離心管中,用PBS 清洗2 遍,在室溫條件下,以250×g離心10 min。純化的PBMC用于RNA抽提。
文庫(kù)構(gòu)建包括RNA 提取、cDNA 合成和聚合酶鏈反應(yīng)(polymerase chain reaction, PCR)擴(kuò)增(圖1A)。首先,每個(gè)樣本取1×107PBMC并按照RNA提取試劑盒說(shuō)明書(shū)提取總RNA,通過(guò)Qubit 熒光定量?jī)x(美國(guó)賽默飛世爾科技有限公司)測(cè)定RNA濃度。隨后,按照cDNA 合成試劑盒說(shuō)明書(shū)分別取1 μg 高純度的RNA反轉(zhuǎn)錄成cDNA。最后以合成的cDNA為模板,通過(guò)多重PCR 以針對(duì)豬IgH 可變區(qū)V 基因的上游引物和針對(duì)恒定區(qū)C基因的下游引物擴(kuò)增豬IgH 文庫(kù)(圖1B),引物序列見(jiàn)表1。反應(yīng)體系:2 μL反轉(zhuǎn)錄混合物,5 μL 10×高保真PCR緩沖液,2 μL 50 mmol/L MgSO4,1 μL 10 mmol/L dNTP混合物,上、下游引物(10 μmol/L)各1 μL,0.2 μL 5 IU/μL Platinum@TaqDNA高保真聚合酶,加雙蒸水至50 μL。反應(yīng)條件:94 ℃預(yù)變性2 min;94 ℃變性15 s,58 ℃退火30 s ,68 ℃延伸1 min,共擴(kuò)增35 個(gè)循環(huán);最終保持在4 ℃。擴(kuò)增產(chǎn)物經(jīng)DNA凝膠回收試劑盒純化后,通過(guò)Qubit熒光定量?jī)x測(cè)定濃度,最終按照高通量測(cè)序建庫(kù)試劑盒說(shuō)明書(shū)分別連接接頭序列并富集,經(jīng)Agilent 2100生物芯片分析系統(tǒng)鑒定建庫(kù)合格后,由美國(guó)Illumina-Miseq 2×250雙端測(cè)序平臺(tái)測(cè)序。
圖1 豬抗體庫(kù)高通量測(cè)序方法Fig.1 High-throughput sequencing method for the porcine antibody repertoire
表1 多重PCR擴(kuò)增引物Table 1 Primers used for multiplex PCR amplification
測(cè)序原始數(shù)據(jù)通過(guò)FastQC(http://www.bioinfor matics.babraham.ac.uk/projects/fastqc/)進(jìn)行質(zhì)量檢測(cè),過(guò)濾低質(zhì)量的數(shù)據(jù)(錯(cuò)誤率大于1%),去除測(cè)序引物、接頭序列后,通過(guò)FLASH軟件對(duì)雙端測(cè)序序列進(jìn)行拼接,拼接后每條序列的平均長(zhǎng)度為400 bp。通過(guò)IMGT/HighV-QUEST(http://www. imgt. org/HighVQUEST/)[13]和IgBLAST(https://www.ncbi.nlm.nih.gov/igblast/)[14]將所有過(guò)濾后的拼接序列和國(guó)際免疫遺傳學(xué)數(shù)據(jù)庫(kù)(IMGT)中豬的IGHV、IGHD、IGHJ參考基因進(jìn)行比對(duì)。HCDR3序列同樣根據(jù)IMGT的定義進(jìn)行鑒定識(shí)別,基因使用頻率用平均值±標(biāo)準(zhǔn)誤表示。
為擴(kuò)增得到豬免疫球蛋白重鏈可變區(qū)的序列,本研究通過(guò)序列比對(duì),設(shè)計(jì)了1條針對(duì)豬BCR重鏈可變區(qū)V基因的正向通用引物和5條針對(duì)恒定區(qū)C基因的反向引物(圖1 和表1)。本研究以4 只健康的3周齡仔豬作為試驗(yàn)對(duì)象,分別采集其血液樣本,以外周血單個(gè)核細(xì)胞抽提的總RNA 為模板合成cDNA,再以cDNA 為模板通過(guò)多重PCR 擴(kuò)增得到每個(gè)樣品的BCR 重鏈文庫(kù),最終通過(guò)Illumina-Miseq 2×250雙端測(cè)序平臺(tái)對(duì)BCR重鏈可變區(qū)進(jìn)行測(cè)序,通過(guò)生物信息分析全面了解豬抗體庫(kù)的組成(圖1)。結(jié)果顯示:對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行過(guò)濾、拼接和比對(duì)后,每個(gè)樣本最終獲得的有效序列數(shù)均大于120 000 條(表2),是原先低通量測(cè)序數(shù)量的1 000倍,只有被識(shí)別為豬BCR重鏈序列并能成功翻譯成蛋白的高質(zhì)量序列才用于進(jìn)一步分析。
表2 測(cè)序序列比對(duì)結(jié)果匯總Table 2 Summary of sequencing reads alignment
參照國(guó)際免疫遺傳學(xué)數(shù)據(jù)庫(kù)(IMGT)的現(xiàn)有數(shù)據(jù),豬有15 個(gè)IGHV、4 個(gè)IGHD 和5 個(gè)IGHJ 基因片段。將每條高質(zhì)量測(cè)序序列與數(shù)據(jù)庫(kù)參考序列比對(duì),結(jié)果(圖2)發(fā)現(xiàn):在15個(gè)IGHV基因中,4只仔豬最常用的基因是IGHV1-4和IGHV1S2,其次是IGHV1-15和IGHV1-14。除此之外,IGHV1-6、IGHV1-8、IGHV1-10和IGHV1S5的使用頻率也均大于5%。以上8 種IGHV 基因使用頻率占總序列的80% 以上,而IGHV1-2、IGHV1-5、IGHV1S6、IGHV1S7和IGHV1S8的使用頻率極低,均小于1%。在4 個(gè)IGHD 基因中,IGHD1和IGHD2是使用最為頻繁的2種基因,兩者使用頻率之和在95%以上,而IGHD3和IGHD4的使用頻率極低(圖3)。在5 個(gè)IGHJ 基因中,仔豬僅使用IGHJ5(圖4)。以上結(jié)果表明豬選擇性偏好使用少數(shù)幾種特定的IGHV、IGHD、IGHJ基因。
圖2 豬抗體庫(kù)IGHV基因使用情況Fig.2 Usage of IGHV gene in the porcine antibody repertoire
圖3 豬抗體庫(kù)IGHD基因使用情況Fig.3 Usage of IGHD gene in the porcine antibody repertoire
圖4 豬抗體庫(kù)IGHJ基因使用情況Fig.4 Usage of IGHJ gene in the porcine antibody repertoire
HCDR3 作為變異性最高的區(qū)域,決定了抗體結(jié)合抗原的親和性和特異性。測(cè)序數(shù)據(jù)顯示,4 只健康仔豬HCDR3 序列的總體數(shù)量存在差異(表2),并發(fā)現(xiàn)不同個(gè)體間HCDR3 氨基酸序列相似性較低,表明機(jī)體抗體庫(kù)存在豐富的多樣性。HCDR3 的長(zhǎng)度分布也是反映抗體庫(kù)多樣性的指標(biāo)之一,進(jìn)一步對(duì)4 只仔豬不同長(zhǎng)度(1~30 個(gè)氨基酸)的HCDR3 分布情況進(jìn)行統(tǒng)計(jì)分析,結(jié)果(圖5)顯示,HCDR3 長(zhǎng)度呈明顯的正態(tài)分布,平均長(zhǎng)度為15.86 個(gè)氨基酸,其中,HCDR3 在14~19 個(gè)氨基酸之間分布最多。
圖5 4只仔豬中不同長(zhǎng)度HCDR3分布情況Fig.5 Distribution of HCDR3 with different lengths in four piglets
BCR 通過(guò)特異性識(shí)別和結(jié)合抗原在適應(yīng)性免疫應(yīng)答中發(fā)揮重要作用,了解不同狀態(tài)下抗體庫(kù)的組成特征對(duì)于研究病理情況下機(jī)體對(duì)病原的抗體反應(yīng)十分重要。由于機(jī)體抗體庫(kù)具有高度多樣性,使用普通的Sanger測(cè)序根本無(wú)法測(cè)序完全,所以需要依賴二代測(cè)序技術(shù)認(rèn)識(shí)抗體庫(kù)的全貌。盡管目前抗體庫(kù)高通量測(cè)序技術(shù)已廣泛應(yīng)用于人及其他物種,但幾乎沒(méi)有關(guān)于豬的研究報(bào)道,所以開(kāi)發(fā)適用于豬抗體庫(kù)高通量測(cè)序的方法十分必要。本研究通過(guò)多重PCR擴(kuò)增豬BCR重鏈文庫(kù),成功構(gòu)建豬抗體庫(kù)高通量測(cè)序方法,并分析了4 只健康豬外周血單個(gè)核細(xì)胞BCR重鏈的組成和特征。
豬IgH 的V、D、J 基因數(shù)量比其他物種(例如人和小鼠)少,豬只有來(lái)自一個(gè)VH3 家族的15 個(gè)IGHV 基因,與兔相似[15],而人類擁有來(lái)自7 個(gè)V 基因家族超過(guò)50種IGHV基因,小鼠擁有來(lái)自16個(gè)V基因家族超過(guò)100 種IGHV 基因[16]。本研究通過(guò)測(cè)序發(fā)現(xiàn),豬抗體庫(kù)重鏈V、D、J 基因使用呈現(xiàn)偏好性,15 個(gè)IGHV 基因中有8 個(gè)基因(IGHV1-4、IGHV1S2、IGHV1-15、IGHV1-14、IGHV1-6、IGHV1-8、IGHV1-10、IGHV1S5)的使用總頻率超過(guò)80%,有5 個(gè)IGHV 基因的使用頻率極低,這和之前報(bào)道IGHV1-4(文獻(xiàn)中稱為VHA)、IGHV1-6(VHB)、IGHV1S2(VHC)、IGHV1-8(VHE)是豬免疫前抗體庫(kù)中最主要的使用基因[4]相類似。我們的測(cè)序序列涵蓋了所有功能性IGHV 基因,充分證明我們的測(cè)序深度完全足夠。先前有研究報(bào)道只有2 個(gè)IGHD(IGHD1和IGHD2)和1 個(gè)IGHJ(IGHJ5)是有功能的基因[2],本研究測(cè)序結(jié)果與此基本一致,即IGHD1和IGHD2是主要的表達(dá)基因,IGHD3和IGHD4的表達(dá)極少。在測(cè)序序列比對(duì)過(guò)程中存在諸多影響比對(duì)結(jié)果的因素,如片段相似性、連接多樣性、體細(xì)胞超突變、測(cè)序錯(cuò)誤等。由于在V、D、J重排過(guò)程中末端脫氧核苷酸轉(zhuǎn)移酶(TdT)的作用會(huì)引起連接處核苷酸的插入和刪除,有時(shí)很難將每條測(cè)序序列精準(zhǔn)匹配到相應(yīng)的基因片段,尤其是長(zhǎng)度較短的D基因片段[17]。V、D、J重排過(guò)程中對(duì)某些基因的偏好在其他物種中同樣有出現(xiàn),例如小鼠IgH 表現(xiàn)出對(duì)VH1 家族的偏好使用,約50% 的基因都來(lái)自VH1[16]。
理論上,豬BCR重鏈有300種可能的V、D、J組合(15V×4D×5J=300VDJ),然而,由于實(shí)際利用的VH、DH和JH基因高度受限,造成V、D、J 組合相對(duì)有限,研究表明最高變區(qū)HCDR3 的多樣性可以彌補(bǔ)豬IgH 庫(kù)有限的組合多樣性[18]。本研究從4 只仔豬樣本中獲得的HCDR3 序列最少為12 萬(wàn)條,最多達(dá)到35萬(wàn)條,和之前低通量測(cè)序結(jié)果相比反映的信息更全面;分析結(jié)果顯示HCDR3長(zhǎng)度符合正態(tài)分布,平均長(zhǎng)度約為15.8 個(gè)氨基酸,比人類HCDR3 平均長(zhǎng)度(11.5 個(gè)氨基酸)長(zhǎng)[19]。當(dāng)機(jī)體處于正常狀況,免疫系統(tǒng)未受病原感染時(shí),BCR隨機(jī)組合呈現(xiàn)多克隆狀態(tài),一旦受到病原刺激則會(huì)出現(xiàn)特定重排和B細(xì)胞克隆性擴(kuò)增,本研究建立的豬抗體庫(kù)高通量測(cè)序方法可以協(xié)助更精確地區(qū)分病原特異性的克隆序列,輔助臨床疾病的診斷和治療。
本研究成功建立了評(píng)估豬抗體庫(kù)的高通量測(cè)序方法,闡明了豬抗體庫(kù)IgH 的V、D、J 基因的使用呈現(xiàn)高度選擇性,該方法獲得的序列數(shù)是以往低通量測(cè)序的1 000倍以上,分辨率更高,可以更全面地認(rèn)識(shí)豬抗體庫(kù)的組成特征,為進(jìn)一步深入研究不同疾病狀態(tài)下豬抗體庫(kù)特異性變化提供指導(dǎo)。