谷洪昌,陳 余,王 梁,呂學(xué)澤,楊衛(wèi)芳,張建偉,曲魯江*
(1.中國農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,北京100193;2.北京市畜牧總站,北京 100101)
主要組織相容性復(fù)合體(Major Histocompatibility Complex,MHC)是由多個基因組成的基因家族,可以編碼與免疫應(yīng)答相關(guān)的蛋白質(zhì)[1-2]。MHC 具有高度多態(tài)性、連鎖不平衡、單倍型遺傳的特點,在免疫中主要起到抗原呈遞的作用。家禽MHC 的提出最早可追溯到1948 年Briles 研究母雞的溶血性疾病實驗,當(dāng)時將雞血型系統(tǒng)用字母“D”來表示,1950 年改用字母“B”來表示[3-5]。1961 年,Schierman 等[2]正式將雞的B 復(fù)合體定義為MHC。在家禽中除了有MHC class I 和MHC class II,還具有禽類特有的MHC class IV,它們在雞上分別被命名為BF、BL 和BG。因為MHC class IV 基因只在禽類中出現(xiàn),所以這類MHC 基因引起較大關(guān)注,被認(rèn)為在家禽抗病免疫方面起著重要的作用[6-7]。20 世紀(jì)90 年代開始,MHC 區(qū)域的基因組研究開始轉(zhuǎn)向其他家禽和野生鳥類,但目前都相對滯后于在雞上的研究。因此,本研究通過介紹比較雞和其他幾種禽類MHC 結(jié)構(gòu),了解不同物種MHC 結(jié)構(gòu)研究的歷史和現(xiàn)狀,通過結(jié)構(gòu)差異理解禽類間的遺傳關(guān)系以及抗病性能的差異,有利于抗病育種和禽病免疫的研究。
1977 年P(guān)ink 等[8]定義了雞MHC 的3 個基因座:B-F、B-L 和B-G。B-F 和B-L 基因座之間物理距離較近但不會發(fā)生重組,B-G 與B-F、B-L 卻存在著0.05%的重組率[9-11]。這種極低重組率的特性使研究者通常將MHC 作為一個遺傳單位來進(jìn)行研究,即單倍型遺傳。
1988 年,Guillemot[12]通過克隆測得了雞MHC 區(qū)域的部分序列,測得總長320 kb,包含5 個BLB 基因和6 個BF 基因,該研究根據(jù)測序信息繪制了雞的第一份MHC 基因草圖。1999 年,92 kb 的BF/BL 區(qū)域被測序,共包含有19 個基因,其中編碼基因包括2 個I α 類基因(BFI、BF2) 和2 個II β 類 基 因(BLB1、BLB2),其 他 分 別 為B30.1、B-BTN1、B30.2、B-BTN2、LeutRNA、Tapasin、RING3、DMA、DMB1、DMB2、TAP1、TAP2、C4(complement 4) 以及CENP-A (histone H3、B-H3)[1]。MHC-I 類基因中,BF2 高度表達(dá),BF1低度表達(dá),某些單倍型中BF2 表達(dá)量甚至是BF1 的10倍[13-14],BF1 位于BMB2 和TAP1 之間,BF2 位于TAP2與C4 基因之間,BF1 與BF2 的轉(zhuǎn)錄方向相反[15],但均由8 個外顯子和7 個內(nèi)含子組成,以上研究結(jié)果表明BF/BL 區(qū)域簡單緊湊,內(nèi)含子相對較?。ù蠖鄶?shù)哺乳動物MHC 的10%)。與哺乳動物MHC 的不同之處在于,雞BF/BL 區(qū)域存在許多對應(yīng)基因的缺失,以及多出一些哺乳動物中未發(fā)現(xiàn)的基因,比如LMP、PSMB8 以及PSMB9 缺失,Blec1、Blec2 和單個BG 基因的存在[1]。
Shiina 等[16]對3 個紅色原雞的BAC 文庫進(jìn)行了克隆,最終得到242 kb 的MHC 序列,包含有46 個基因。新發(fā)現(xiàn)的MHC 序列延伸了來自于92 kb 的MHC-B 圖譜,在92 kb 中發(fā)現(xiàn)了1 個新基因,在其上游和下游各發(fā)現(xiàn)了21 個和5 個基因。另外,BG 基因被發(fā)現(xiàn)于延伸區(qū)域的上游,包含有多個拷貝。Salomonsen 等[7]同樣發(fā)現(xiàn)了在TRIM 基因與Blec 基因的上游存在12 個BG基因的分布,其中BG2 和BG3 距離這2 個基因較近,該研究也證明了不同MHC-B 的單倍型,BG 基因的數(shù)目不同,說明雞MHC 存在拷貝數(shù)變異。
1993 年,雞上報道了另一個遺傳獨立的MHC 區(qū)域,并將其命名為Rfp-Y[17]。在這一發(fā)現(xiàn)后不久,2 個MHC I 類、2 個MHC II 類基因和1 個最初分配給MHC-B 的c 型凝集素樣基因被重新分配到MHC-Y[18-19]。Rogers等[20]研究發(fā)現(xiàn)了MHC-Y 的2 個Ylec 基因,1 個完整的YF 基因,1 個截短的YLB 基因以及區(qū)域內(nèi)的CR1 重復(fù)。目前認(rèn)為的遺傳獨立的基因簇MHC-Y 含有2 個YF(YFV 和YFVI),3 個YLB 基 因 (YLBIII、YLBIV 和YLBV)和2 個Ylec 基因[15]。
雞共有39 對染色體[21],其中有30 對是小染色體,富含基因[22-23]。早在1985 年就確定了雞的MHC 區(qū)域位于第16 號小染色體(GGA 16)[24],后人進(jìn)一步確定MHC-B、MHC-Y 作為2 個獨立的區(qū)域位于GGA 16 上,并由保守的核仁組織區(qū)(NOR)分開[12,25]。Delany 等[26]通過熒光原位雜交以及胞質(zhì)基因分析法確定了紅色原雞16 號微染色體的基因結(jié)構(gòu),糾正了前人所指出的MHC-B 和MHC-Y 分居于NOR 兩側(cè)的結(jié)構(gòu)性錯誤,證明了分開2 個區(qū)域的是一段高GC 含量區(qū),即PO41重復(fù)[27]。16 號微染色體總長約10~15 Mb,基因結(jié)構(gòu)順序從中心粒近端到遠(yuǎn)端依次為NOR、MHC-Y、G+C rich、MHC-B、CD1 基因群,都位于GGA 16 的q 臂上[28]。
日本鵪鶉MHC 結(jié)構(gòu)在2004 年由Shiina 等[29]進(jìn)行了比較詳盡的研究,其單倍型1 跨越了180 kb 的基因組區(qū)域,由BG8 延伸至CENP-A,共編碼41 個基因,相當(dāng)于每4.4 kb 1 個基因,其基因密度略高于雞BF/BL區(qū)域(92 kb 內(nèi)有19 個基因)。在這41 個基因當(dāng)中,有15 個確定會表達(dá)的基因,包括6 個IIB 基因,4 個I類基因以及TAPBPL、RING3、TAP1、TAP2 和C4;剩余的26 個基因則根據(jù)其基因結(jié)構(gòu)的完整性被分為“可能表達(dá)的基因”和“假基因”,分別有12 個和14 個。除了假基因和RING3 外,其余26 個基因的編碼產(chǎn)物都會在免疫過程中發(fā)揮功能。另外,相比于雞BF/BL 區(qū)域存在5 個CR1,32 個簡單重復(fù),鵪鶉180 kb 區(qū)域內(nèi)包含1 個CR1,17 個長末端重復(fù)序列(LTRs),2 個微衛(wèi)星重復(fù)以及37 個簡單重復(fù)。
Shiina 的研究通過MHC 序列獨立證明了不同禽類的進(jìn)化關(guān)系[29]。鵪鶉與雞I 類基因構(gòu)建的系統(tǒng)進(jìn)化樹證明了鵪鶉I 類基因內(nèi)的關(guān)系要比2 個物種間I 類基因的關(guān)系更加密切,也進(jìn)一步說明鵪鶉MHC I 類基因是在共同祖先分化形成鵪鶉和雞2 個物種后才形成的。進(jìn)一步地,在對鵪鶉MHC-II 的系統(tǒng)發(fā)育進(jìn)化樹分析中得到了同樣的結(jié)果。
火雞與雞的分化時間較晚,大約在距今5 000 萬年前兩者分化為獨立的物種[30],因此兩者在基因組水平上具有高度的相似性,這種相似性在MHC 結(jié)構(gòu)上更能夠體現(xiàn)出來。
圖1 雞、鵪鶉和火雞MHC-B 區(qū)域的基因結(jié)構(gòu)對比
Chaves 等[31]得到了197 kb 的火雞B 基因座,該基因座與雞的MHC-B 區(qū)域是同線性的,共包含有34個基因(從TRIM7.2 到TAP1)。將197 kb 的火雞B基因座同雞170 kb 的B 基因座比對,同源性達(dá)95%,另外與雞MHC-B 的高GC 含量(55.5%)相似,火雞該區(qū)域的GC 含量也偏高(53.6%)。相比于雞,火雞MHC-B 具有以下特點:①整個區(qū)域內(nèi)包含12 個CR1長末端重復(fù)序列、30 個簡單序列重復(fù)序列和3 個復(fù)雜的重復(fù),其中出現(xiàn)的大的C/T 五聚體重復(fù)(300 bp)在雞上是沒有的;②多出了3 個基因,分別是2 個BG基因和1 個class II B 基因。Bauer 等[32]擴展了火雞的MHC-B,在新擴展的40 kb 區(qū)域內(nèi)包括:3 個BG 基因(BG4、BG5 和一個不完整的BG6)、KIFC、Blec3、Bzfp3 以及TRIM 的外顯子末端。延伸后的基因座與雞240 kb MHC-B 是線性同源的。
Reed 等[33]證明了火雞也有獨立的MHC-B 和MHC-Y,且都位于18 號微染色體上(MGA 18)。目前火雞上已經(jīng)鑒定出2 個遺傳上獨立的MHC-Y,且在基因組成上跟雞的MHC-Y 不是直接同源的[33-34]。
Xia 等[35]通過特定引物克隆出了鴨MHC I 區(qū)域,并對其進(jìn)行測序,最終得到了2.5 kb 的基因組序列,共編碼344~355 個氨基酸,包含有7 個外顯子和8 個內(nèi)含子。有趣地是,相比于雞的MHC-I,鴨MHC I 類序列更接近于人的MHC I 序列。鴨MHC I 包括有5 個基因:UAA、UBA、UCA、UDA 和UEA,只有UAA 高表達(dá),UEA 低表達(dá),其余則不表達(dá)。這種單個MHC I類基因的偏向表達(dá)模式只在少數(shù)幾種家禽中才出現(xiàn),比如雞的BF1 高表達(dá),BF2 低表達(dá)[1]。Mesa 等[36]證明鴨UAA 基因位于TAP2 一側(cè),而且MHC I 基因的表達(dá)與TAP 有關(guān),這種表達(dá)模式能夠促進(jìn)抗體對MHC I 限制性CTL 抗原簇的識別,達(dá)到對病毒的抵御效果[37]。Fleming 等[38]擴增了綠頭鴨MHC I 區(qū)域,在38 只鴨中得到了61 個獨有的等位基因,證明了MHC I 的等位基因具有高度多態(tài)性。
對于鴨MHC II 的研究開始相對較晚。Ren 等[39]通過對北京鴨BAC 文庫克隆測序得到了MHC II α 鏈的序列,該序列全長1 431 bp,編碼255 個氨基酸,包括4 個編碼信號多態(tài)的外顯子和1 個肽結(jié)合α1區(qū)、免疫球蛋白樣的α2區(qū)域、酸性的連結(jié)肽、疏水的跨膜區(qū)和1 個較短的胞漿區(qū)尾巴。同樣,該研究的BAC 測序發(fā)現(xiàn)了緊鄰α 基因的5 個IIβ 基因(IIb1-IIb5)。與雞、鵪鶉和火雞不同的是,鴨臨近α 基因的β 基因編碼方向相反。同樣,鴨MHC-IIα 基因與人HLA-DRA 的同源性(57.4%)也要高于和雞的同源性(56.7%)。
目前,對于鵝MHC 結(jié)構(gòu)的研究較少,尚處于起步階段。Xia 等[40]克隆 了 鵝 的MHC I(Ancy-MHC I),該cDNA 全長999 bp,共編碼333 個氨基酸,其對應(yīng)的基因組MHC I 區(qū)域全長為2 489 bp,其中內(nèi)含子長度為1 490 bp,該內(nèi)含子長度與鴨極為相似(1 486 bp),但和雞(1 015 bp)差異較大,該區(qū)域鴨與鵝氨基酸同源性(80.0%~85.5%)也要明顯高于雞和鵝的(59.8%~66.0%),以上結(jié)果均證明了鴨與鵝有更近的親緣關(guān)系。
Li 等[41]擴增出了Ancy-MHC IIB 的cDNA,共有2 條序列,長度分別為780 bp 和783 bp,分別編碼成熟蛋白質(zhì)的259、260 個氨基酸,由6 個外顯子和5 個內(nèi)含子組成,內(nèi)含子長度超過雞,這與MHC I 的研究一致。以上研究的進(jìn)化樹結(jié)果表明,與來自于其他物種已知MHC IIB 類序列相比,鵝、鷸和鴨聚集在了一起,而與雞、哺乳動物和魚類分開,這與人們對進(jìn)化的認(rèn)知基本一致[41]。
Chen 等[42]通過傳統(tǒng)的BAC 克隆得到了3 段朱鹮MHC 序列,分別為265、85、150 kb,其中265 kb 的序列對應(yīng)BG 區(qū)域,包含有從Blec3 到zfp1 的26 個基因;85 kb 與150 kb 的區(qū)域為存在1 個gap 的核心區(qū),該區(qū)域包含MHC I、MHC II 類基因和其他基因共28 個。Chang 等[43]利用二代測序得到了3 條朱鹮MHC 序列,總共對應(yīng)488 kb 區(qū)域,包含50 個基因。Chen 還發(fā)現(xiàn),相比于雞MHC-B,朱鹮多出COLL11A2 和ADPRH 等基因,另外有更多的Blec 和BF 拷貝。
黑琴雞(Tetrao tetrix)為松雞科琴雞屬鳥類,其MHC-B 全長88 390 bp,包含19 個基因,其中有2 個I 類基因、2 個II 類基因以及1 個IV 類基因,與雞的該區(qū)域表現(xiàn)為極高的同線性[44]。
紅腹錦雞(Chrysolophus pictus)是中國特有的品種,4D BAC 文庫測序得到了97 kb 的MHC-B 包含20個基因[45]。紅腹錦雞的MHC IIB 和NK 基因數(shù)量與雞相比差異顯著,另外還有TAPBP 基因和TAP1-TAP2區(qū)域的倒位等差異。
目前對于家禽MHC 的研究主要集中在2 個方面:一是通過不同家禽乃至哺乳動物的對應(yīng)基因的數(shù)據(jù)確定物種之間的進(jìn)化與親緣關(guān)系;二是研究各類MHC 分子及其編碼蛋白在免疫應(yīng)答中的作用。對MHC 結(jié)構(gòu)的揭示是這兩項研究的基礎(chǔ)與關(guān)鍵。本文詳細(xì)介紹了近幾十年來在幾種家禽上關(guān)于MHC 結(jié)構(gòu)的研究,其中在雞上的相關(guān)研究最為詳盡,確定了MHC 定位于GGA 16,并揭示了整個微染色體的結(jié)構(gòu)與基因的排列順序。鴨與鵝的研究相對較少,目前還未能進(jìn)行染色體定位,也無法確定完整的MHC 序列結(jié)構(gòu)。雞MHC I、MHC II 類基因都是雙拷貝的,其中與TAP2 相鄰的MHC II 類基因表現(xiàn)為少見的偏向表達(dá)模式,鴨、鵝、火雞和鵪鶉都具有多個拷貝的MHC I、MHC II 類基因,只有在鴨中表現(xiàn)為與雞相似的偏向表達(dá)模式。這種單個拷貝基因的高表達(dá)模式引起了很多研究者的注意,被認(rèn)為是由TAP2 基因引起的,與抗病性有很大關(guān)系。鳥類MHC基因拷貝數(shù)的差異可能是由于它們在生活中細(xì)胞內(nèi)和細(xì)胞外病原體暴露的差異導(dǎo)致的,不同單倍體對疾病的抗性存在明顯差異[46]。
MHC 結(jié)構(gòu)與家禽的多種傳染病相關(guān),不同的MHC基因在抗病免疫中所起的作用不同,但目前對于大多數(shù)家禽MHC 結(jié)構(gòu)的研究還很不完善。一方面,因為雙拷貝基因干擾性的存在,以及MHC 區(qū)域高GC 含量、插入缺失過多的特殊性質(zhì),導(dǎo)致部分序列難以獲得;另一方面,通過構(gòu)建克隆的方法得到的目的基因序列長度有限,無法得到完整的MHC 序列。隨著未來三代測序技術(shù)的出現(xiàn)、基因組研究水平的提高以及分析手段的豐富,MHC 基因排列順序與結(jié)構(gòu)會被逐步揭示。