劉晨臨,王秀良,林學(xué)政
( 1. 自然資源部第一海洋研究所,山東 青島 266061;2. 中國(guó)科學(xué)院海洋研究所,山東 青島 266071;3. 青島海洋科學(xué)與技術(shù)試點(diǎn)國(guó)家實(shí)驗(yàn)室 海洋生物學(xué)與生物技術(shù)實(shí)驗(yàn)室,山東 青島 266237)
生活在南極的大型海藻約有120~130種,其中有三分之一的是南極特有的[1]。在西南極半島,大型海藻廣泛生長(zhǎng)在潮間帶或淺岸海底的礁石上。喬治王島(King George Island)的梅爾維爾角(Melville Cape),90%以上的巖石底層被海藻覆蓋。而在將軍灣(Admiralty Bay),夏季大型海藻帶幾乎環(huán)繞著整個(gè)海灣沿岸,覆蓋了約37%海灣面積。褐藻和紅藻在潮下帶巖石基底上呈垂直分布,最深可達(dá)100 m水深處[2–3]。大型海藻是近岸海洋系統(tǒng)重要的初級(jí)生產(chǎn)者,為其他海洋生物提供庇護(hù)和食物來(lái)源[4]。除生態(tài)學(xué)意義,許多大型海藻也具有較高的經(jīng)濟(jì)價(jià)值,目前對(duì)南大洋海藻資源的開發(fā)利用日益成為熱點(diǎn)[5]。產(chǎn)膠紅藻Iridaea cordata(Turner)Bory和Curdiea racovitzaeHariot是南極和亞南極海岸潮間帶和潮下帶的常見(jiàn)物種[6]。I. cordata產(chǎn)卡拉膠[7],其硫酸多糖具有抗癌活性[8],C. racovitzae則是產(chǎn)瓊膠海藻[9]。
許多來(lái)自南極的物種只在低于5℃的溫度條件下生長(zhǎng)和繁殖。低溫需求決定了它們?cè)谀蠘O的北部分布邊界。I. cordata的最適生長(zhǎng)溫度在0~5℃,生存溫度的上限為11~16℃[10]。除冰凍和低溫外,海藻的生長(zhǎng)發(fā)育也被南極地區(qū)多種極端的光環(huán)境影響。夏季,潮間帶海藻暴露在強(qiáng)烈的紫外線輻射下,需要有效的紫外線傷害的防御和修復(fù)能力[11–12]。在I. cordata中發(fā)現(xiàn)了能夠吸收紫外線,降低紫外輻射傷害的類菌胞素氨基酸[13]。而冬季由于極夜和海冰覆蓋,黑暗時(shí)間較長(zhǎng),海藻生長(zhǎng)必須適應(yīng)弱光環(huán)境,降低其光合作用和生長(zhǎng)對(duì)光照的需求量[14–15]。在南極漫長(zhǎng)黑暗的冬季,因?yàn)榫哂休^高的光合效率和極低的光補(bǔ)償點(diǎn)和光飽和點(diǎn),I. cordata仍然能夠持續(xù)生長(zhǎng)[10]。
目前,對(duì)南極大型海藻的研究主要集中在生態(tài)分布、生物量和生物多樣性[2–3,6,15–16]、功能活性物質(zhì)的發(fā)現(xiàn)[17–18],以 及 光 合 生 理 活 性[10–12,19–20]等 方 面。迄 今 為止,除了南極綠藻Prasiola crispa的轉(zhuǎn)錄組數(shù)據(jù)[21],未見(jiàn)其他南極海藻功能基因或轉(zhuǎn)錄組學(xué)研究的報(bào)道。南極藻類因其特有的耐受極端環(huán)境的能力,成為發(fā)現(xiàn)新基因和新代謝機(jī)制的理想材料。而轉(zhuǎn)錄組測(cè)序和分析是發(fā)現(xiàn)這些基因資源最經(jīng)濟(jì)、有效的手段。我們從兩種南極紅藻的轉(zhuǎn)錄組序列中,挖掘了一些獨(dú)特的可能與其南極極端光環(huán)境,包括弱光和強(qiáng)紫外線輻射等適應(yīng)相關(guān)基因,為后續(xù)開展南極紅藻極端環(huán)境適應(yīng)機(jī)制研究提供了依據(jù)。同時(shí)從南極紅藻中發(fā)現(xiàn)的光修復(fù)酶基因,在化妝品領(lǐng)域也有開發(fā)利用的前景。
2018年2 月,在第34次中國(guó)南極科學(xué)考察中,依托“向陽(yáng)紅01”號(hào)科學(xué)考察船,在西南極南設(shè)得蘭群島喬治王島的長(zhǎng)城站附近(62.216°S,58.960°W)潮間帶采集紅藻樣品。采樣時(shí)陰天有小雨,氣溫約2℃。用無(wú)菌海水清洗藻體后,置于船上?150℃冰箱保存。保持冷凍狀態(tài)至回國(guó)后,在實(shí)驗(yàn)室提取藻樣的總RNA。
首先將冷凍的海藻樣品浸入液氮中,用冷卻的研缽研磨成細(xì)粉。使用天根植物RNAprep試劑盒提取總RNA。采用微量核酸定量?jī)x檢測(cè)RNA的質(zhì)量和濃度。測(cè)序文庫(kù)使用TruSeq RNA樣品制備試劑盒(Illumina, USA)構(gòu)建。用Illumina PCR引物進(jìn)行15個(gè)循環(huán)的PCR反應(yīng),選擇性富集兩端連接接頭分子的DNA片段,并用AMPure XP系統(tǒng)純化(Beckman Coulter,USA)。采用安捷倫(Agilent)生物分析儀2100系統(tǒng)中的高靈敏度DNA分析技術(shù)對(duì)產(chǎn)物進(jìn)行定量。Illumina Hiseq測(cè)序委托上海派森諾生物技術(shù)有限公司完成。
在數(shù)據(jù)組裝前先過(guò)濾原始數(shù)據(jù)。使用Cutadapt(v1.15)軟件刪除引物或接頭序列。過(guò)濾掉超過(guò)10%堿基質(zhì)量低于Q20的或未知核苷酸(Ns)堿基超過(guò)5%的序列。使用Trinity (v2.5.1)軟件對(duì)轉(zhuǎn)錄本進(jìn)行拼接[22]。選擇每個(gè)基因最長(zhǎng)的轉(zhuǎn)錄本作為該基因的代表性序列稱為非冗余基因。BlastX同源搜索NCBI非冗余蛋白數(shù)據(jù)庫(kù)NR (http://www.ncbi.nlm.nih.gov),E-value<10–5。利用真核生物直系同源蛋白質(zhì)聚類EggNOG(Evolutionary Genealogy of Genes: Non-supervised Orthologous Groups,http://eggnog.embl.de/version_3.0/)對(duì)非冗余基因進(jìn)行功能分類注釋[23]。利用京都基因與基因組百科全書KEGG(Kyoto Encyclopedia of Genes and Genomes,http://www.kegg.jp/)進(jìn)行代謝通路注釋,獲得物種內(nèi)分子間相互作用和反應(yīng)的網(wǎng)絡(luò)。KEGG代謝通路注釋以雙向最佳匹配(BBH)的方法,采用KAAS軟件完成[24]。使用PrimerPro(http://webdocs.cs.ualberta.ca/~yifeng/PrimerPro/)的微衛(wèi)星搜索模塊(MISA)篩選簡(jiǎn)單重復(fù)序列(SSRs)。
基因家族系統(tǒng)進(jìn)化樹的構(gòu)建用MEGA X軟件完成[25],將選擇的序列經(jīng)MUSCLE比對(duì)后,采用默認(rèn)參數(shù),用鄰接法構(gòu)建系統(tǒng)樹。經(jīng)過(guò)1000次自展值的檢驗(yàn),顯示一致性的系統(tǒng)樹。
南極紅藻I. cordata和C. racovitzae的形態(tài)如圖1所示。紅藻的鑒定采用克隆的18S rRNA基因與Gen-Bank已知序列進(jìn)行比對(duì),相似性為100%。
每種紅藻的轉(zhuǎn)錄組測(cè)序量約為6 G,I. cordata和C. racovitzae的轉(zhuǎn)錄組序列分別拼接成了14055條和12006條非冗余基因(表1)。非冗余基因的平均長(zhǎng)度分別為1473 bp和1448 bp。I. cordata的鳥嘌呤和胞嘧啶(GC)含量約為53.82%,C. racovitzae的GC含量約為47.28%。GC含量在一定程度上反映了基因組的熱穩(wěn)定性。角叉菜Chondrus crispus的GC含量約為55.6%[26],而龍須菜Gracilariopsis lemaneiformisGC含量為48.13%[27]。南極紅藻的GC含量與常溫紅藻的GC含量差別不大。
I. cordata和C. racovitzae轉(zhuǎn)錄組序列在各個(gè)數(shù)據(jù)庫(kù)的注釋情況見(jiàn)表2。在NR數(shù)據(jù)庫(kù),I. cordata和C.racovitzae分別有4788條(34.07%)和4468條(37.21%)非冗余基因得到注釋。在Swissprot數(shù)量庫(kù)中I. cordata和C. racovitzae則分別有4864(34.61%)和4938(41.13%)條非冗余基因得到注釋。紫菜Pyropia tenera轉(zhuǎn)錄組序列在UniProt數(shù)據(jù)庫(kù)(不含其他紫菜屬物種的基因組和轉(zhuǎn)錄組序列)中也僅有33.6%的重疊群匹配到同源序列[28]。這說(shuō)明了紅藻基因與公共數(shù)據(jù)庫(kù)中已知基因序列間的同源性較低,繼續(xù)豐富不同種類紅藻基因數(shù)據(jù)資源是很有必要的[29]。
圖1 南極紅藻Iridaea cordata (a)和Curdiea racovitzae (b)的形態(tài)Fig. 1 The morphology of Iridaea cordata (a) and Curdiea racovitzae (b)
I. cordata和C. racovitzae中被EggNOG注釋的非冗余基因分別有4523和4238條(圖2)。除了一般功能預(yù)測(cè)和功能未知的分類,翻譯后修飾、蛋白反轉(zhuǎn)和分子伴侶類別的非冗余基因(579,581)最多,其次依次是翻譯、核糖體結(jié)構(gòu)和起源(485,485)、信號(hào)傳導(dǎo)機(jī)制(389,321)、碳水化合物轉(zhuǎn)運(yùn)和代謝(301,280)、能量的產(chǎn)生和轉(zhuǎn)換(259,279)、RNA加工和修飾(237,221)、復(fù)制、重組和修復(fù)(209,176)、細(xì)胞內(nèi)轉(zhuǎn)移、分泌和囊泡轉(zhuǎn)運(yùn)(209,220)、氨基酸轉(zhuǎn)運(yùn)和代謝(201,209)以及轉(zhuǎn)錄(198,193)等分類。
表1 南極紅藻Iridaea cordata和Curdiea racovitzae轉(zhuǎn)錄本和非冗余基因Table 1 The contigs and unigenes of Iridaea cordata and Curdiea racovitzae
表2 Iridaea cordata和Curdiea racovitzae轉(zhuǎn)錄組序列在各個(gè)數(shù)據(jù)庫(kù)的注釋結(jié)果Table 2 The annotation results of Iridaea cordata and Curdiea racovitzae transcriptome
在已完成全基因組測(cè)序的紅藻中,角叉菜與I. cordata都屬于杉菜目,親緣關(guān)系最近。龍須菜與C.racovitzae同屬于江蘺目,有較近的親緣關(guān)系。我們將所測(cè)的兩種南極紅藻的轉(zhuǎn)錄組序列分別與角叉菜(基因組GenBank序列收錄號(hào):PRJEA78309、PRJNA 193762)和龍須菜 (PRJNA361418) 的基因組的蛋白編碼序列用本地BlastX(E-value<10?5)進(jìn)行比較,發(fā)現(xiàn)有5955條I. cordata的非冗余基因與4059條角叉菜的序列匹配。C. racovitzae的4964條非冗余基因匹配到了3596條龍須菜基因序列(圖3),但是兩兩物種間,互相不匹配的序列占有更大比例,說(shuō)明同目的紅藻間遺傳差異較大。
圖2 Iridaea cordata和Curdiea racovitzae轉(zhuǎn)錄組序列的EggNOG功能分類Fig. 2 EggNOG function classification of Iridaea cordata and Curdiea racovitzae
在光系統(tǒng)中,捕光復(fù)合物L(fēng)HC (Light-Harvesting Complex) 負(fù)責(zé)捕獲光能并將能量轉(zhuǎn)移到反應(yīng)中心。除了吸收光,這些蛋白質(zhì)還參與了光保護(hù)反應(yīng),以清除光合作用過(guò)程中產(chǎn)生的活性氧[30]。我們從紅藻角叉菜、龍須菜和耐受酸熱環(huán)境的單細(xì)胞紅藻Galdieria sulphuraria(PRJNA13023) 的基因組序列,以及兩種南極紅藻轉(zhuǎn)錄組序列中,通過(guò)BlastP比對(duì)、KEGG注釋分析和Pfam注釋查找有CB (Chloro a/b-bind) 結(jié)構(gòu)域的序列[31],篩選了假定的LHC家族基因,利用這些基因編碼的蛋白序列構(gòu)建了系統(tǒng)樹(圖4)。之前的研究認(rèn)為紅藻中僅有光系統(tǒng)I(PSI)相關(guān)的,與葉綠素a和類胡蘿卜素結(jié)合的LHC天線蛋白,稱為L(zhǎng)HCR[32–33]。LHCR的數(shù)目在不同紅藻間存在差異,蛋白分離純化的結(jié)果表明紫球藻有6種不同的LHCR蛋白,G. sulphuraria有5種,而Cyanidioschyzon merolae只有3種[33]。
從角叉菜、龍須菜和G. sulphuraria的基因組序列中各找到了5、13和10條Lhc序列。角叉菜的5條Lhcr基因均編碼紅藻型LHC蛋白,龍須菜有7條Lhcr基因,6條其他類型的Lhc基因。G. sulphuraria中有9條Lhcr基因和1條其他類型的Lhc基因。從I. cordata和C. racovitzae轉(zhuǎn)錄組中分別找到了8條和5條Lhc基因。分別包括4條Lhcr和1條Lhcf基因。Lhcf編碼巖藻黃質(zhì)和Chla/c結(jié)合蛋白,屬于PSI天線復(fù)合體。LHCF是硅藻和褐藻中的主要天線蛋白,但還未見(jiàn)在紅藻中的報(bào)道[34–35]。此外,I. cordata轉(zhuǎn)錄組中還包含多條與綠藻LHC蛋白同源的序列,參照萊茵衣藻LHC的分類,分別為L(zhǎng)hca2,Lhca6和Lhcb基因(圖5)。在萊茵衣藻中,LHCa2和LHCa6屬于PSI,而LHCb屬于PSII。
目前關(guān)于LHC蛋白的進(jìn)化還缺少切實(shí)的證據(jù),一種觀點(diǎn)認(rèn)為,紅藻、綠藻和高等植物L(fēng)hc基因家族是共同起源,獨(dú)立進(jìn)化的[32]。在進(jìn)化過(guò)程中,由于藻膽體的丟失,有些Lhca(LhcI) 的基因功能進(jìn)一步分化,成為PSII的天線蛋白[33]。綠藻中編碼Chla/b-和Chla/c結(jié)合蛋白的基因在LHCI / LHCII分化之前就已經(jīng)彼此分離[36]。LHCb是植物生長(zhǎng)和光保護(hù)反應(yīng)的關(guān)鍵蛋白。目前對(duì)PSII中LHC蛋白的研究主要在高等植物和綠藻中,而其他物種中則少見(jiàn)報(bào)道[36]。對(duì)于南極紅藻I. cordata特有的Lhc基因的蛋白產(chǎn)物還需要蛋白分離純化等生物化學(xué)的方法進(jìn)行驗(yàn)證。但是Lhc基因家族的擴(kuò)張能夠增強(qiáng)I. cordata在光限制環(huán)境中的光吸收和能量轉(zhuǎn)移能力,可能是適應(yīng)南極冬季弱光環(huán)境生存的關(guān)鍵。
圖3 角叉菜Chondrus crispus與Iridaea cordata,龍須菜Gracilariopsis chorda與Curdiea racovitzae匹配基因數(shù)目的韋恩圖Fig. 3 Diagram of the matching gene numbers between Chondrus crispus and Iridaea cordata, Gracilariopsis chorda and Curdiea racovitzae
環(huán)境非生物脅迫,如干旱或紫外線,可誘導(dǎo)藻類DNA損傷。目前發(fā)現(xiàn)的兩種光裂解酶,環(huán)丁烷嘧啶二聚體(CPD)光裂解酶和6?4光裂解酶,可以特異性地修復(fù)不同類型的UV誘導(dǎo)的DNA損傷,CPD和6?4嘧啶酮光產(chǎn)物 (6?4 PP)[37]。光裂解酶屬于紫外線/藍(lán)光激活蛋白家族—光裂解酶/隱花色素(CPF)家族,這個(gè)超家族包括光裂解酶、隱花色素(Cry)和Cry-DASH。這三類成員有很高的同源性,都含有能結(jié)合兩個(gè)生色團(tuán)的PHR(Photolyase Homology Region)功能區(qū)[38],但是Cry-DASH和隱花色素的PHR無(wú)光裂解酶活性[39]。
從紅藻角叉菜、龍須菜和G. sulphuraria的基因組序列,以及南極紅藻的轉(zhuǎn)錄組序列中通過(guò)Pfam注釋,選取了所有含PHR功能區(qū)的序列,作為假定的光裂解酶/隱花色素CPF家族蛋白序列,同時(shí)參考Fortunato等[40]構(gòu)建的CPF超級(jí)家族系統(tǒng)樹,選擇其中的綠藻、硅藻、褐藻和擬南芥的序列,與我們篩選的紅藻CPF家族蛋白序列一起構(gòu)建了的系統(tǒng)進(jìn)化樹,并對(duì)進(jìn)化樹的分支進(jìn)行了功能劃分(圖6)。I. cordata的轉(zhuǎn)錄組序列中有4條CPF家族基因,分別屬于6?4光裂解酶,光裂解酶CPD I和CPD II家族。C. racovitzae轉(zhuǎn)錄組序列中有6條CPF家族基因,分別編碼隱花色素Cry、Cry-DASH、Cry-DASH II和光裂解酶CPD II。6?4光裂解酶分支的物種,包括紅藻、硅藻、褐藻、綠藻和高等植物。Fortunato等[40]未在角叉菜中發(fā)現(xiàn)6?4光裂解酶基因,認(rèn)為只有單細(xì)胞紅藻中有6?4光裂解酶,但是我們?cè)诔鼵. racovitzae之外的所有紅藻中,都找到了6?4光裂解酶同源序列,說(shuō)明其在紅藻中是廣泛存在的。光裂解酶CPD,分為2個(gè)分支,CPD II廣泛分布于各類生物物種[40],與我們的結(jié)果一致。而CPD I則主要存在于細(xì)菌、古細(xì)菌、藍(lán)細(xì)菌和真菌中[37,40]。Fortunato等[40]未在灰色藻、甲藻和紅藻角叉菜中找到CPD I家族基因,但是在我們構(gòu)建的系統(tǒng)進(jìn)化樹中,在紅藻I. cordata,龍須菜以及硅藻中都找到了CPD I的同源序列。我們認(rèn)為在少數(shù)種類的硅藻和紅藻中存在的CPD I基因可能是通過(guò)水平基因轉(zhuǎn)移從原核生物中獲得的,用于修復(fù)其因生活環(huán)境嚴(yán)酷而造成的DNA損傷。在I. cordata轉(zhuǎn)錄組中未找到紅藻中普遍存在的Cry和Cry-DASH序列,同時(shí)在C. racovitzae轉(zhuǎn)錄組中未發(fā)現(xiàn)6?4光裂解酶,可能是轉(zhuǎn)錄組測(cè)序未能完全覆蓋基因組中所有編碼序列導(dǎo)致的。
從轉(zhuǎn)錄組序列中篩選的SSR序列,因?yàn)槠湄S富性且與編碼基因緊密相關(guān),成為在物種適應(yīng)性、生物地理分布和進(jìn)化研究中的重要分子標(biāo)記。利用MISA軟件分別從I. cordata的3014條非冗余基因中鑒定出5560個(gè)SSR位點(diǎn),從C. racovitzae的1636條非冗余基因中鑒定出2473個(gè)SSR位點(diǎn)。其中單核苷酸重復(fù)最多。紫菜P. seriata中三核苷酸的數(shù)目最多[29]。SSR的頻率和分布被認(rèn)為取決于各種因素,如數(shù)據(jù)集的大小、工具和使用的標(biāo)準(zhǔn)[41]。
圖4 捕光復(fù)合物的系統(tǒng)進(jìn)化樹Fig. 4 Phylogenetic tree of the light harvesting complex superfamily
圖5 Iridaea cordata的Lhca2、Lhca6和Lhcb基因編碼的蛋白序列與綠藻LHC序列的比較Fig. 5 Alignment of Lhca2, Lhca6 and Lhcb of Iridaea cordata with homologous LHCs in green algae
南極歷史上的冰川期對(duì)潮間帶物種造成了毀滅性的破壞,但是南極大陸架邊緣仍有零散的冰川未影響到的區(qū)域,成為潮間帶海藻的庇護(hù)所。在過(guò)去的500萬(wàn)年間,南極地區(qū)至少發(fā)生了38個(gè)冰期?間冰期循環(huán)[42]。由此可能會(huì)導(dǎo)致南極潮間帶生物生殖隔離和遺傳分化的產(chǎn)生[43]。利用單一基因的DNA條形碼序列研究冰川期棲息地減少對(duì)南極半島和南設(shè)得蘭群島常見(jiàn)的6種大型紅藻遺傳多樣性的影響,由于得到的遺傳多樣性水平極低,無(wú)法有效劃分海藻的種群,難以確定南極海藻起源的冰川庇護(hù)所的位置[6]。采用SSR標(biāo)記獲得海藻種內(nèi)的更精細(xì)的遺傳學(xué)分化,則有希望解決這一問(wèn)題。同時(shí)SSR標(biāo)記還可以應(yīng)用于研究南極的地質(zhì)演變以及預(yù)測(cè)氣候變化對(duì)南極生態(tài)系統(tǒng)的影響。
南極紅藻是南極地區(qū)重要的生物資源,作為極端環(huán)境生物,對(duì)其轉(zhuǎn)錄組序列的研究有助于新基因和代謝途徑的發(fā)現(xiàn)。由于實(shí)驗(yàn)材料獲取和運(yùn)輸保藏的困難,很難獲取新鮮的材料提取RNA用于轉(zhuǎn)錄組測(cè)序,這可能是目前南極大型海藻轉(zhuǎn)錄組學(xué)研究較少的原因。我們依托“向陽(yáng)紅01”號(hào)的船載超低溫冰箱,保證了從樣品采集到實(shí)驗(yàn)室RNA提取的過(guò)程中,材料保存完好。提取到了符合建庫(kù)要求的RNA,順利完成了兩種產(chǎn)膠紅藻的轉(zhuǎn)錄組測(cè)序工作。通過(guò)分析轉(zhuǎn)錄組序列,我們發(fā)現(xiàn)了一些可能與南極紅藻光限制和紫外線輻射等極端光環(huán)境適應(yīng)相關(guān)的特有基因,南極紅藻更加多樣化的Lhc基因可能是增強(qiáng)I. cordata在光限制環(huán)境中的光吸收和能量轉(zhuǎn)移能力,適應(yīng)南極冬季弱光環(huán)境生存的關(guān)鍵。而光裂解酶基因與其適應(yīng)極地的強(qiáng)紫外線輻射密切相關(guān)。這些基因的功能仍有待于進(jìn)一步的驗(yàn)證。通過(guò)轉(zhuǎn)錄組測(cè)序獲得的SSR標(biāo)記也為南極紅藻的適應(yīng)性和遺傳多樣性的研究開展奠定了基礎(chǔ)。
圖6 光裂解酶/隱花色素超家族的系統(tǒng)進(jìn)化樹Fig. 6 Phylogenetic tree of the cryptochrome/photolyase family