閆 晗 惠 敏 沙忠利① 程 嬌①
(1.中國(guó)科學(xué)院海洋研究所海洋生物分類(lèi)與系統(tǒng)演化實(shí)驗(yàn)室 青島市海洋生物多樣性與保護(hù)重點(diǎn)實(shí)驗(yàn)室 山東青島 266071;2.嶗山實(shí)驗(yàn)室 山東青島 266237; 3.中國(guó)科學(xué)院大學(xué) 北京 100049)
自1977 年美國(guó)深海潛水器阿爾文號(hào)在加拉帕戈斯裂谷附近發(fā)現(xiàn)深海熱液活動(dòng)和高密度的熱液生物群落以來(lái), 深?;芎铣缮鷳B(tài)系統(tǒng)開(kāi)始展現(xiàn)于世人面前(Corlisset al, 1979)。隨后, 1983 年美國(guó)研究人員在廣闊的墨西哥灣3 200 m 深處首次發(fā)現(xiàn)了海底冷泉系統(tǒng)(Andersonet al, 1983)。與依賴(lài)太陽(yáng)光能的光合生態(tài)系統(tǒng)不同, 以熱液和冷泉為代表的深?;芎铣缮鷳B(tài)系統(tǒng)主要依靠化能自養(yǎng)微生物利用硫化氫(H2S)、元素硫(S)、甲烷(CH4)和氫氣(H2)等還原性物質(zhì)氧化產(chǎn)生的能量進(jìn)行固碳、合成有機(jī)物, 從而維持生態(tài)系統(tǒng)的運(yùn)轉(zhuǎn), 這種“黑暗食物鏈”的發(fā)現(xiàn)改變了人們對(duì)深海初級(jí)生產(chǎn)力主要來(lái)源的認(rèn)知(Dubilieret al, 2008)。此外, 深?;苌鷳B(tài)系統(tǒng)是認(rèn)識(shí)特殊生命過(guò)程和研究生物適應(yīng)性進(jìn)化的天然實(shí)驗(yàn)場(chǎng)所。深?;墉h(huán)境具有黑暗、高壓、低氧、寡營(yíng)養(yǎng)且富含高濃度硫化物、甲烷和重金屬等特征, 大型生物卻能在如此極端環(huán)境中生存并形成群落, 主要原因是它們經(jīng)過(guò)長(zhǎng)期的適應(yīng)與歷史進(jìn)化過(guò)程, 形成了獨(dú)特的生命特征和環(huán)境適應(yīng)機(jī)制(程嬌等, 2021)。因此, 對(duì)深?;芎铣缮鷳B(tài)系統(tǒng)中生物的環(huán)境適應(yīng)機(jī)制的研究, 不僅將有助于加深對(duì)深海極端環(huán)境中特殊生命過(guò)程的理解, 也將為深海生物資源的開(kāi)發(fā)利用奠定理論基礎(chǔ)。
近年來(lái), 高通量測(cè)序技術(shù)的快速發(fā)展及大數(shù)據(jù)分析能力的提高, 使得在組學(xué)水平探究深海生物演化和環(huán)境適應(yīng)機(jī)制成為可能。作為后基因時(shí)代應(yīng)用最為廣泛的技術(shù)手段, 轉(zhuǎn)錄組測(cè)序技術(shù)可以全面快速獲得生物體在特定時(shí)空或生理?xiàng)l件下幾乎所有轉(zhuǎn)錄本的序列信息和表達(dá)信息, 已經(jīng)在深海生物適應(yīng)性演化機(jī)制研究中逐步得到應(yīng)用。例如, 在雙殼綱貝類(lèi)中, Zheng 等(2017)通過(guò)與淺海貽貝的比較轉(zhuǎn)錄組分析發(fā)現(xiàn)兩種深海偏頂蛤(Bathymodiolus platifrons和B.manusensis)中與共生菌識(shí)別相關(guān)的免疫識(shí)別受體發(fā)生收縮, 物質(zhì)轉(zhuǎn)運(yùn)、溶酶體活動(dòng)以及細(xì)胞凋亡等相關(guān)基因受正選擇或高表達(dá), 可能有助于共生關(guān)系的建立和維持; 在多毛類(lèi)環(huán)節(jié)動(dòng)物中, Zhang 等(2017)對(duì)分布于熱液區(qū)深海多鱗蟲(chóng)(Branchipolynoe pettiboneae和Lepidonotopodiumsp.)與淺海近緣物種進(jìn)行了比較轉(zhuǎn)錄組分析, 發(fā)現(xiàn)熱液多鱗蟲(chóng)可能通過(guò)不同類(lèi)型的血紅蛋白的快速進(jìn)化或高表達(dá)等策略實(shí)現(xiàn)對(duì)深海低氧環(huán)境的適應(yīng); 在十足目甲殼動(dòng)物中, Cheng 等(2019)對(duì)沖繩熱液與南海冷泉共有優(yōu)勢(shì)物種柯氏潛鎧蝦(Shinkaia crosnieri)進(jìn)行轉(zhuǎn)錄組測(cè)序和進(jìn)化分析, 提出柯氏潛鎧蝦很可能是通過(guò)功能基因的適應(yīng)性進(jìn)化和改變基因的表達(dá)水平來(lái)適應(yīng)熱液與冷泉兩種不同的深?;墉h(huán)境。以上研究結(jié)果表明轉(zhuǎn)錄組學(xué)分析方法已成為探究深海極端環(huán)境中特殊生命過(guò)程的重要研究手段。然而, 由于二代測(cè)序讀取長(zhǎng)度短, 轉(zhuǎn)錄本易發(fā)生拼接錯(cuò)誤, 無(wú)法準(zhǔn)確獲取完整轉(zhuǎn)錄本, 可變剪切和轉(zhuǎn)錄本多樣性在很大程度上仍然是未知(Zhanget al, 2020), 這限制了深海生物環(huán)境適應(yīng)機(jī)制及深?;蛸Y源開(kāi)發(fā)方面的深入研究。
十足目鎧甲蝦類(lèi)是深海多樣性最高的甲殼動(dòng)物類(lèi)群之一。在深海化能生態(tài)環(huán)境中, 鎧甲蝦是底棲生態(tài)群落中的常見(jiàn)種或優(yōu)勢(shì)種。勞盆擬刺鎧蝦(Munidopsis lauensis)隸屬于十足目(Decapoda)、異尾下目(Anomura)、鎧甲蝦總科(Galatheoidea)、擬刺鎧蝦科(Munidopsidae)、擬刺鎧蝦屬(Munidopsis), 是深?;苌虫z甲蝦類(lèi)代表性物種, 在西太平洋勞海盆(Lau Basin)、馬努斯海盆(Manus Basin)、北斐濟(jì)海盆(North Fiji Basin)、南海東北部以及印度洋等海域的熱液、冷泉區(qū)均有分布, 分布水深在1 120~2 000 m之間(Baba, 2005; Martinet al, 2005; Cubelioet al,2007; Hwanget al, 2022)。目前對(duì)勞盆擬刺鎧蝦分子生物學(xué)方面的研究?jī)H局限于線粒體基因組的測(cè)定(Sunet al, 2019), 以及微衛(wèi)星分子標(biāo)記的篩選(Boyleet al, 2013)。針對(duì)勞盆擬刺鎧蝦深海適應(yīng)性的相關(guān)研究尚未開(kāi)展, 且該物種基因序列信息相對(duì)匱乏, 限制了對(duì)其適應(yīng)性分子機(jī)制的深入研究。本研究利用PacBio 平臺(tái)的SMRT 測(cè)序技術(shù)開(kāi)展了勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組測(cè)序, 對(duì)獲得的轉(zhuǎn)錄本進(jìn)行注釋分析, 預(yù)測(cè)其編碼序列、轉(zhuǎn)錄因子、長(zhǎng)鏈非編碼RNA 等, 挖掘可能與其適應(yīng)深?;軜O端環(huán)境相關(guān)的關(guān)鍵基因和通路。研究旨在豐富勞盆擬刺鎧蝦的基因資源, 為進(jìn)一步探究深?;苌鷳B(tài)系統(tǒng)中大型底棲甲殼動(dòng)物的進(jìn)化和環(huán)境適應(yīng)分子機(jī)制提供數(shù)據(jù)支持。
用于本研究全長(zhǎng)轉(zhuǎn)錄組分析的勞盆擬刺鎧蝦樣品于2021 年6 月由“科學(xué)號(hào)”(中國(guó)科學(xué)院海洋研究所)科考船上搭載的遙控潛水器Quasar MkII 從位于中 國(guó) 南 海 的 臺(tái) 西 南 冷 泉(119°17.01′E, 22°06.91′N(xiāo),~1 118 m)采集。樣品收集到船上后, 通過(guò)形態(tài)學(xué)初步鑒定立即進(jìn)行解剖。將肝胰腺、鰓、肌肉和腸組織分離并在液氮中速凍后保存在–80 °C 條件下, 以便用于后續(xù)RNA 提取。保留部分肌肉組織儲(chǔ)存于濃度為70%的乙醇中, 以備于DNA 提取與COI 序列的擴(kuò)增,從而進(jìn)行分子鑒定。
參照使用說(shuō)明書(shū), 使用Trizol 試劑盒(Invitrogen,Carlsbad, CA, USA)提取各組織的總 RNA。使用Nanodrop2000 微分光光度計(jì)(Thermo Fisher)測(cè)定總RNA 的純度和濃度, 使用Agilent 2100 生物分析儀(Agilent Technologies, Palo Alto, CA, USA)檢測(cè)總RNA 的完整度以評(píng)估RNA 的質(zhì)量。不同組織檢測(cè)合格后的總RNA 等量混合, 用于下一步全長(zhǎng)轉(zhuǎn)錄組cDNA 文庫(kù)的構(gòu)建。
首先用 Oligo(dT) 磁珠富集 mRNA, 再用NEBNext?Single Cell/Low Input cDNA Synthesis &Amplification Module 將mRNA 反轉(zhuǎn)錄成cDNA。然后進(jìn)行PCR 周期優(yōu)化, 用于確定下游大規(guī)模PCR 反應(yīng)的最佳擴(kuò)增周期數(shù), 之后進(jìn)行大規(guī)模PCR 富集合成cDNA。cDNA 經(jīng)過(guò)DNA 損傷修復(fù), 末端修復(fù), 并與adapter 連接。將SMRTbell 模板與測(cè)序引物退火并與聚合酶結(jié)合形成完整的SMRTbell 文庫(kù)之后, 在PacBio Sequel II 平臺(tái)(美國(guó)太平洋生物科學(xué)公司)上進(jìn)行測(cè)序。
使用SMRT Link-v8.0.0 (Gordonet al, 2015)處理下機(jī)的PacBio 序列數(shù)據(jù)。首先, 從subreads.bam 文件中提取高質(zhì)量的環(huán)形一致性序列(circular consensus sequence, CCS)。通過(guò)去除序列中包含的5'端引物、3'端引物和多聚體結(jié)構(gòu), 獲得全長(zhǎng)非嵌合體(full length non-concatemer, FLNC)序列。然后使用Minimap2 (Li,2018)對(duì)同一轉(zhuǎn)錄本的FLNC 序列進(jìn)行聚類(lèi), 獲得到一致性序列。再使用Quiver 算法對(duì)序列進(jìn)行校正, 獲得高質(zhì)量一致轉(zhuǎn)錄本。使用CD-HIT-v4.6.7 (Cluster Database at High Identity with Tolerance) (Fuet al,2012)對(duì)獲得的一致性序列去冗余, 得到勞盆擬刺鎧蝦的全長(zhǎng)轉(zhuǎn)錄本。最后, 基于BUSCO (Benchmarking Universal Single-Copy Orthologs)的節(jié)肢動(dòng)物單拷貝直系同源基因標(biāo)準(zhǔn)集數(shù)據(jù)庫(kù), 使用 BUSCO-v3.0.2(Sim?oet al, 2015)對(duì)勞盆擬刺鎧蝦的全長(zhǎng)轉(zhuǎn)錄本集進(jìn)行完整性評(píng)估。
為了獲得勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄本的注釋信息,將isoform 序列與NCBI 非冗余蛋白質(zhì)(Nr)數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov)、Swiss-Prot 蛋白質(zhì)數(shù)據(jù)庫(kù)(http://www.expasy.ch/ sprot) 、 KEGG 數(shù) 據(jù) 庫(kù)(http://www.genome.jp/kegg)和 KOG 數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/COG)進(jìn)行比對(duì)分析, 閾值設(shè)置為 1E-5。根據(jù) Nr 數(shù)據(jù)庫(kù)的注釋信息, 使用Blast2GO (Conesaet al, 2005)軟件對(duì)全長(zhǎng)轉(zhuǎn)錄本進(jìn)行GO (Gene Ontology)注釋與功能分類(lèi)。
使用上述數(shù)據(jù)庫(kù)blast 比對(duì)和ANGEL (Shimizuet al, 2006)軟件預(yù)測(cè)兩種方法獲得全長(zhǎng)轉(zhuǎn)錄本蛋白編碼區(qū)(CDS)的核酸序列和氨基酸序列。通過(guò)hmmscan 將Isoform 的編碼序列與動(dòng)物TFdb 數(shù)據(jù)庫(kù)(http://www.bioguo.org/AnimalTFDB/)進(jìn)行比對(duì), 預(yù)測(cè)轉(zhuǎn)錄因子(transcription factor, TF)家族。使用CNCI-v2 (Sunet al,2013)和CPC (Konget al, 2007)軟件預(yù)測(cè)編碼能力,并將兩個(gè)軟件判定為非編碼序列的結(jié)果合集作為最終長(zhǎng)鏈非編碼RNA (LncRNA)的預(yù)測(cè)結(jié)果。利用Perl腳本 MISA (http://pgrc.ipk-gatersleben.de/misa/misa.html)對(duì)勞盆擬刺鎧蝦的全長(zhǎng)轉(zhuǎn)錄組進(jìn)行簡(jiǎn)單重復(fù)序列檢測(cè)。
使用Genedoc 軟件(Nicholaset al, 1997)對(duì)勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中注釋到的谷胱甘肽 S-轉(zhuǎn)移酶(glutathione S-transferase, GST)候選序列與其他節(jié)肢動(dòng)物不同亞家族的GST 氨基酸序列進(jìn)行多重序列比對(duì)。基于鄰接法(neighbor-joining, NJ), 使用MEGA軟件(Kumaret al, 2016)進(jìn)行系統(tǒng)發(fā)育樹(shù)的構(gòu)建, 并設(shè)置1 000 次重復(fù)。使用Genedoc 軟件對(duì)勞盆擬刺鎧蝦GST theta 亞家族的蛋白序列與包括柯氏潛鎧蝦、家蠶(Bombyx mori) 、 美州東部熊蜂(Bombus impatiens)、二化螟(Chilo suppressalis)在內(nèi)的四種節(jié)肢動(dòng)物的GST-theta 蛋白序列進(jìn)行比對(duì)。利用SMART(http://smart.embl-heidelberg.de/)預(yù)測(cè)勞盆擬刺鎧蝦GST-theta 蛋白的結(jié)構(gòu)域。
很高興收到你的來(lái)信。真的,十六年我從來(lái)不知什么叫高興。我以為高興和我無(wú)緣了。沒(méi)想到,突然收到你的信。你想我能不高興嗎?這是我十六年來(lái)第一次擁有一個(gè)最快樂(lè)的日子,比過(guò)節(jié)還開(kāi)心快樂(lè)。
經(jīng)COI 序列擴(kuò)增、測(cè)序與NCBI 數(shù)據(jù)庫(kù)進(jìn)行同源比對(duì)后, 從形態(tài)和分子層面鑒定所采樣品為勞盆擬刺鎧蝦。采用PacBio Sequel II 平臺(tái)對(duì)勞盆擬刺鎧蝦肝胰腺、鰓、肌肉和腸組織的RNA 進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序, 共獲得55 402 300 條原始序列, 平均長(zhǎng)度為1 506 bp, N50 長(zhǎng)度為1 587 bp。經(jīng)零模波導(dǎo)孔(ZMW)循環(huán)過(guò)后, 通過(guò)環(huán)型一致性序列分析, 共得到1 210 829個(gè)CCS, 平均長(zhǎng)度為1 793 bp, 循環(huán)數(shù)為43。對(duì)從CCS 得到的FLNC 序列進(jìn)行聚類(lèi)后獲得36 573 條一致性序列, 經(jīng)過(guò)校正后的高質(zhì)量一致轉(zhuǎn)錄本為36 037條。去冗余后, 獲得28 811 條高質(zhì)量非冗余isoform,平均長(zhǎng)度為2 086 bp, N50 長(zhǎng)度為2 275 bp (表1)。BUSCO 結(jié)果顯示勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中包括節(jié)肢動(dòng)物核心單拷貝同源基因數(shù)的60.51% (圖1a), 表明本研究三代全長(zhǎng)轉(zhuǎn)錄組測(cè)序獲得的非冗余轉(zhuǎn)錄本相對(duì)完整, 可繼續(xù)進(jìn)行下游的數(shù)據(jù)處理。
圖1 勞盆擬刺鎧蝦轉(zhuǎn)錄本的功能注釋Fig.1 Functional annotation of M. lauensis full-length transcripts
表1 基于PacBio 測(cè)序的勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組測(cè)序結(jié)果Tab.1 Summary for the full-length transcriptome of M.lauensis using PacBio sequencing
2.2.1 基本注釋 為了獲得勞盆擬刺鎧蝦更全面的遺傳信息, 將獲得的全長(zhǎng)轉(zhuǎn)錄本在Nr、SwissProt、KOG 和 KEGG 數(shù)據(jù)庫(kù)中進(jìn)行了比對(duì)分析, 共有20 616 (71.6%)條isoform 得到注釋。Nr 數(shù)據(jù)庫(kù)搜索比對(duì)顯示, 共注釋到348 個(gè)物種, 其中凡納濱對(duì)蝦(13 363; 65.01%)、克氏原螯蝦(Procambarus clarkii,881; 4.29%)和中華絨螯蟹(Eriocheir sinensis, 458;2.23%)是比對(duì)到同源序列數(shù)目前三的物種。
2.2.2 KOG 功能分類(lèi) 共有17 957 條isoform 注釋到25 個(gè)KOG 分類(lèi)中。其中, 占比前三位的功能分類(lèi)首先是一般功能預(yù)測(cè)(general function prediction only), 具有2 990 條(16.65%)注釋信息, 其次是翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶(posttranslational modification,protein turnover, chaperones)和信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(signal transduction mechanisms), 分別有2 095 (11.67%)和1 690 (9.4%)條基因注釋信息(圖1b)。
2.2.3 GO 功能注釋 將測(cè)序獲得的基因與GO 數(shù)據(jù)庫(kù)進(jìn)行匹配, 共有17 339 條isoform 被劃分到三個(gè)大類(lèi)。其中基因劃分最多的類(lèi)別是分子功能(molecular function, 6 669 個(gè)), 其次是生物過(guò)程(biological process, 5 955 個(gè))和細(xì)胞成分(cellular component, 4 715 個(gè))。分子功能類(lèi)別中可以細(xì)分為18個(gè)亞類(lèi)別, 其中占比最多的是結(jié)合活性(binding), 占比42.04%; 其次是催化活性(catalytic activity), 占比34.78%。生物過(guò)程類(lèi)別中注釋到26 個(gè)亞類(lèi)別, 占比最多的是細(xì)胞過(guò)程(cellular process), 占比 12.40%;其次是代謝過(guò)程(metabolic process), 占比11.30%。注釋到細(xì)胞成分類(lèi)別中的基因被劃分為23 個(gè)亞類(lèi)別,其中比例最大的為細(xì)胞(cell)和細(xì)胞組分(cell part),占比分別為 16.98%和 16.95%; 其次為細(xì)胞器(organelle), 占比為14.14% (圖1c)。
2.2.4 KEGG 功能注釋 共有20 117 條isoform 被注釋到144 條已知的KEGG 通路中, isoform 數(shù)量分布前20 條通路見(jiàn)表2。其中isoform 數(shù)量最多的通路是代謝途徑(metabolic pathways), 包括3 210 條isoform,其次是溶酶體(lysosome)與RNA 轉(zhuǎn)運(yùn)(RNA transport),分別有551 條和439 條isoform。
表2 前20 個(gè)KEGG 代謝途徑Tab.2 Top 20 KEGG pathways
通過(guò)對(duì)勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄本進(jìn)行CDS 預(yù)測(cè),共得到21 848 個(gè)CDS 序列。CDS 序列長(zhǎng)度分布在102~7 719 bp, 平均值為1 049 bp; 5'UTR 的長(zhǎng)度分布在3~4 831 bp, 平均值為266 bp; 3'UTR 的長(zhǎng)度分布在3~7 189 bp, 平均值為970 bp。
2.3.1 轉(zhuǎn)錄因子 轉(zhuǎn)錄因子是在轉(zhuǎn)錄過(guò)程中識(shí)別和結(jié)合特定核苷酸序列的蛋白質(zhì), 通過(guò)與其他相關(guān)蛋白的相互作用介導(dǎo)附近基因的表達(dá), 發(fā)揮重要的調(diào)控作用(Babu, 2010)。在勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中共發(fā)現(xiàn)了41 個(gè)轉(zhuǎn)錄因子家族, 包含537 個(gè)轉(zhuǎn)錄因子。其中最多的轉(zhuǎn)錄因子家族是zf-C2H2 家族, 其次是轉(zhuǎn)錄因子ZBTB 和CSD 家族(圖2a)。
圖2 勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組結(jié)構(gòu)分析Fig.2 Analysis of full-length transcriptome structure of M. lauensis
2.3.2 長(zhǎng)鏈非編碼RNA LncRNA 被定義為長(zhǎng)度超過(guò)200 個(gè)核苷酸且未被翻譯成蛋白質(zhì)的RNA 分子,它們從根本上參與一些生物過(guò)程, 如轉(zhuǎn)錄、翻譯、蛋白質(zhì)定位、細(xì)胞結(jié)構(gòu)完整性、重編碼以及其他細(xì)胞活動(dòng)(Maet al, 2013)。基于CPC 和CNCI 兩種預(yù)測(cè)方法,在勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中共發(fā)現(xiàn)了6 430 個(gè)LncRNA。
2.3.3 簡(jiǎn)單重復(fù)序列 簡(jiǎn)單重復(fù)序列又稱(chēng)為微衛(wèi)星DNA、短串聯(lián)重復(fù)序列, 通常指以1~6 個(gè)堿基為單位組成的短串聯(lián)重復(fù)序列。本研究共檢測(cè)到6 517條包含SSR 位點(diǎn)的isoform, 其中1 765 條包含超過(guò)1個(gè)SSR 位點(diǎn), 以復(fù)合形式存在的SSRs 數(shù)目為2 044個(gè)。進(jìn)一步根據(jù)短串聯(lián)重復(fù)單元的類(lèi)型對(duì)所檢測(cè)到的10 060 個(gè)SSRs 進(jìn)行分類(lèi)(圖2b)。依據(jù)重復(fù)核苷酸數(shù)目, SSRs 可分為5 種類(lèi)型, 核苷酸重復(fù)數(shù)目為2~6 個(gè),其中勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中數(shù)量最多的是三核苷酸重復(fù)序列(4 233, 42.08%), 其次是二核苷酸重復(fù)(4 199, 41.74%)。SSRs 重復(fù)次數(shù)在4~99 次之間, 主要集中在4~7 次, 且SSRs 數(shù)量隨著重復(fù)次數(shù)的增加而降低。
對(duì)isoform 數(shù)量分布最多的前20 個(gè)KEGG 通路進(jìn)行分析, 發(fā)現(xiàn)其中有兩個(gè)通路可能與勞盆擬刺鎧蝦適應(yīng)深?;軜O端生境相關(guān), 分別為過(guò)氧化物酶體(Peroxisome, ko: 04146)和谷胱甘肽代謝(Glutathione metabolism, ko: 00480)。在過(guò)氧化物酶體通路中, 共有180 條isoform 編碼該通路的31 個(gè)關(guān)鍵酶, 其中脫氫酶/還原酶SDR 家族的數(shù)量最多, 為27 條; 其次是D-天冬氨酸氧化酶(21 條)和過(guò)氧化氫酶(19 條); 甲羥戊酸激酶、α-甲?;o酶A 消旋酶、(S)-2-羥基-酸性氧化酶、ATP 結(jié)合盒亞家族D(ALD)成員2、2-羥基?;?CoA 裂解酶1、谷胱甘肽硫轉(zhuǎn)移酶kappa1 等數(shù)量最少, 分別有1 條(圖3a)。共有213 條isoform 參與谷胱甘肽代謝通路中19 個(gè)關(guān)鍵酶的編碼, 其中GST 的數(shù)量最多, 為59 條, 其次是前列腺素H2 D 異構(gòu)酶谷胱甘肽轉(zhuǎn)移酶(25 條)和谷胱甘肽過(guò)氧化物酶(18 條), 最少的是γ 谷氨酰環(huán)化轉(zhuǎn)移酶、蛋白質(zhì)二硫還原酶(谷胱甘肽)以及谷胱甘肽特異性γ-谷氨酰環(huán)轉(zhuǎn)移酶1, 數(shù)量?jī)H為1 條(圖3b)。
圖3 代謝通路圖Fig.3 Maps of the metabolic pathway
GSTs 屬于多功能酶, 可被分為15 個(gè)亞家族, 包括Alpha、Beta、Delta、Epsilon、Kappa、Lambda、Mu、Omega、Pi、Phi、Rho、Sigma、Theta、Tau 和Zeta (Huanget al, 2017)。勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中共有20 條isoform 被分別注釋到theta、delta、mu、kappa 四個(gè)GST 亞家族中。我們利用鄰接法對(duì)勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中注釋到的GST 候選序列與其他節(jié)肢動(dòng)物的GST 氨基酸序列進(jìn)行了系統(tǒng)發(fā)育樹(shù)的構(gòu)建(圖4a)。結(jié)果顯示勞盆擬刺鎧蝦全長(zhǎng)轉(zhuǎn)錄組中被注釋為不同亞家族的GSTs 分別聚類(lèi)在相應(yīng)亞家族的分支上。多重序列比對(duì)結(jié)果顯示勞盆擬刺鎧蝦的GST-theta 序列與柯氏潛鎧蝦的序列相似度最高, 第2~74 位氨基酸為N 端結(jié)構(gòu)域, 第108~201 位氨基酸為C 端結(jié)構(gòu)域(圖4b)。
近年來(lái), 以Pacbio 平臺(tái)為代表的第三代測(cè)序技術(shù)因其強(qiáng)大的讀長(zhǎng)優(yōu)勢(shì)改變了二代測(cè)序序列讀長(zhǎng)短和碎片化的局限性, 極大地提高了獲得完整基因信息的能力(Eidet al, 2009)。全長(zhǎng)轉(zhuǎn)錄組測(cè)序目前已成為從超大、復(fù)雜基因組物種中獲取海量基因序列信息的重要工具, 并逐步應(yīng)用于水生生物生長(zhǎng)發(fā)育、脅迫響應(yīng)、物種適應(yīng)性進(jìn)化以及重要基因挖掘等研究(Mehjabinet al, 2019; 王菁等, 2022; Chenget al,2022; Wanget al, 2022)。本研究通過(guò)Pacbio Sequel II平臺(tái)首次對(duì)深?;苌虫z甲蝦類(lèi)的全長(zhǎng)轉(zhuǎn)錄組進(jìn)行測(cè)序和分析。與之前深?;軜O端環(huán)境中的其他甲殼動(dòng)物二代轉(zhuǎn)錄組結(jié)果相比(Huiet al, 2018; Chenget al, 2019), 雖然本研究所獲得的轉(zhuǎn)錄本數(shù)量(28 811 條)相對(duì)較少(143 516 條, Huiet al, 2018; 108 237 條,Chenget al, 2019), 但在轉(zhuǎn)錄本完整性和質(zhì)量(N50,2 275 bp)方面卻遠(yuǎn)高于二代(1 068 bp, Huiet al, 2018;1 125 bp, Chenget al, 2019) (圖5), 可為后續(xù)勞盆擬刺鎧蝦基因資源的挖掘提供基礎(chǔ), 并為探究該物種在不同條件或不同組織的轉(zhuǎn)錄表達(dá)差異提供了參考序列。功能注釋是了解基因功能、研究基因的表達(dá)調(diào)控機(jī)制與預(yù)測(cè)蛋白功能的前提。勞盆擬刺鎧蝦各數(shù)據(jù)庫(kù)的轉(zhuǎn)錄本注釋率為71.56%, 顯著高于基于二代測(cè)序的長(zhǎng)角阿爾文蝦(40.27%, Huiet al, 2018)和柯氏潛鎧蝦(36.78%, Chenget al, 2019)。然而仍有8 195 個(gè)轉(zhuǎn)錄本未被注釋, 推測(cè)可能是鎧甲蝦類(lèi)或該物種的特有基因, 公共的數(shù)據(jù)庫(kù)中缺乏其相關(guān)的基因信息等原因造成。通過(guò)Nr 數(shù)據(jù)庫(kù)的注釋發(fā)現(xiàn), 勞盆擬刺鎧蝦與凡納濱對(duì)蝦比對(duì)到的同源信息最多, 所占比例為65.01%。僅注釋到兩個(gè)擬刺鎧蝦科物種, 分別為勞盆擬刺鎧蝦(116 條)和威氏擬刺鎧蝦(Munidopsis verrilli, 2 條), 表明擬刺鎧蝦科的已有基因資源相對(duì)匱乏。GO 注釋和KEGG 注釋結(jié)果顯示勞盆擬刺鎧蝦的轉(zhuǎn)錄組功能主要集中于細(xì)胞過(guò)程與代謝過(guò)程。這些基因注釋和分類(lèi)信息將有助于對(duì)勞盆擬刺鎧蝦基因功能的理解與深入研究。
轉(zhuǎn)錄因子通過(guò)特異性結(jié)合調(diào)控區(qū)域的DNA 序列來(lái)識(shí)別下游靶基因, 從而在調(diào)控各種生物過(guò)程的激活或者抑制中發(fā)揮重要作用(Charoensawanet al,2010)。本研究預(yù)測(cè)了勞盆擬刺鎧蝦的轉(zhuǎn)錄因子, 其中zf-C2H2 和ZBTB 是最豐富的轉(zhuǎn)錄因子家族。C2H2型是鋅指蛋白最常見(jiàn)的類(lèi)型之一, 在真核生物的生長(zhǎng)發(fā)育以及應(yīng)激反應(yīng)過(guò)程中起重要的調(diào)控作用(Liuet al, 2015)。ZBTB 蛋白是鋅指蛋白家族的亞家族之一, 在DNA 損傷反應(yīng)和細(xì)胞發(fā)育以及先天淋巴細(xì)胞的發(fā)育和分化等過(guò)程中起重要作用(Renet al, 2019)。本結(jié)果與馬氏珠母貝(Pinctada fucata martensii,Zhanget al, 2020)、口蝦蛄(Oratosquilla oratoria,Chenget al, 2022)、大菱鲆(Scophthalmus maximus, Fuet al, 2022)的全長(zhǎng)轉(zhuǎn)錄組解析得到的轉(zhuǎn)錄因子分析結(jié)果相似。近年來(lái)研究發(fā)現(xiàn)長(zhǎng)鏈非編碼RNA 可以通過(guò)與DNA 相互作用來(lái)調(diào)節(jié)轉(zhuǎn)錄、表觀遺傳修飾、翻譯和翻譯后修飾等生物過(guò)程(Bridgeset al, 2021)。截至目前, 尚未有關(guān)于勞盆擬刺鎧蝦的長(zhǎng)鏈非編碼RNA的報(bào)道。本研究鑒定出勞盆擬刺鎧蝦的 6 430 個(gè)LncRNA, 將為L(zhǎng)ncRNA 具體功能的進(jìn)一步研究提供基礎(chǔ)。SSRs 廣泛存在于真核生物體內(nèi), 因其分布廣、種類(lèi)多及重復(fù)單元的重復(fù)次數(shù)在個(gè)體間呈現(xiàn)高度特異性, 已成為檢測(cè)物種遺傳多樣性的有效工具。通過(guò)勞盆擬刺鎧蝦的全長(zhǎng)轉(zhuǎn)錄組分析共預(yù)測(cè)到了10 060個(gè)SSRs, 結(jié)合Boyle 等(2013)對(duì)馬努斯盆地的勞盆擬刺鎧蝦開(kāi)發(fā)的10 個(gè)SSRs, 可為勞盆擬刺鎧蝦在不同海盆的遺傳連通性和種群遺傳結(jié)構(gòu)研究提供候選分子標(biāo)記。
環(huán)境壓力可導(dǎo)致細(xì)胞內(nèi)活性氧(ROS)水平的增高(Lushchak, 2011), 而過(guò)氧化物酶體是在ROS 的代謝中起主要作用的細(xì)胞器(Mannaertset al, 1993)。據(jù)報(bào)道, 過(guò)氧化物酶體在各種化合物包括誘導(dǎo)抗氧化酶的污染物刺激下在生物體內(nèi)發(fā)生增殖(Orbeaet al,2002)。本研究發(fā)現(xiàn)過(guò)氧化物酶體通路位于isoform 數(shù)量分布最多的前20 條KEGG 通路中, 且有部分轉(zhuǎn)錄本注釋到參與過(guò)氧化物酶體生物發(fā)生的蛋白質(zhì)peroxin 編碼基因上, 因此我們推測(cè)勞盆擬刺鎧蝦極有可能在深海極端環(huán)境中受到外界因子刺激后發(fā)生了過(guò)氧化物酶體增殖現(xiàn)象, 以應(yīng)對(duì)細(xì)胞內(nèi)高ROS 水平。GSTs 廣泛分布于生物體內(nèi), 主要通過(guò)協(xié)助對(duì)抗內(nèi)源或者外來(lái)有害物質(zhì)從而實(shí)現(xiàn)細(xì)胞解毒功能(楊海靈等, 2006)。真核生物中參與谷胱甘肽代謝的GSTs主要屬于MAPEG 超家族, 在內(nèi)源性脂類(lèi)新陳代謝以及細(xì)胞解毒方面發(fā)揮重要的生物學(xué)作用(Jakobssonet al, 1996, 1999)。鄭佩華等(2020)通過(guò)對(duì)凡納濱對(duì)蝦的GSTs 進(jìn)行基因克隆, 發(fā)現(xiàn)MGST3 在對(duì)蝦抗逆境脅迫以及抵御病原菌感染的調(diào)控機(jī)制中發(fā)揮重要作用。Cheng 等(2019)在對(duì)深海熱液和冷泉的共有甲殼動(dòng)物柯氏潛鎧蝦進(jìn)行轉(zhuǎn)錄組比較分析時(shí)發(fā)現(xiàn)編碼GSTs 的基因在熱液個(gè)體中顯著上調(diào)表達(dá), 推測(cè)其有助于柯氏潛鎧蝦適應(yīng)理化條件更極端的熱液環(huán)境。在勞盆擬刺鎧蝦中, 我們發(fā)現(xiàn)了59 個(gè)編碼GSTs 的isoform, 參與谷胱甘肽代謝過(guò)程。此外還檢測(cè)到了同樣具有抗氧化作用的谷胱甘肽過(guò)氧化物酶以及參與谷胱甘肽合成的γ谷氨酰轉(zhuǎn)肽酶等。系統(tǒng)發(fā)育樹(shù)與多重序列比對(duì)結(jié)果顯示勞盆擬刺鎧蝦與柯氏潛鎧蝦GSTs 序列相似度高, 可能與兩物種的分類(lèi)地位較近以及生存環(huán)境相似有關(guān)。不同家族的GSTs 的亞基在序列上高度進(jìn)化, 但都由N 末端和C 末端兩個(gè)結(jié)構(gòu)域組成。與谷胱甘肽結(jié)合的G 位點(diǎn)存在于N 末端結(jié)構(gòu)域中, 與外源性和內(nèi)源性親電子底物結(jié)合的H 位點(diǎn)存在于C 末端結(jié)構(gòu)域中, 這兩者構(gòu)成了GSTs 的催化反應(yīng)活性中心(Armstrong, 1991; Ransonet al, 2005)。進(jìn)一步分析發(fā)現(xiàn)勞盆擬刺鎧蝦的N 末端比C 末端擁有更高的序列相似性, 這種現(xiàn)象在 GTS 家族中也是普遍存在的(Sinninget al, 1993)。這些基因可能在勞盆擬刺鎧蝦適應(yīng)高濃度硫以及重金屬等的深?;墉h(huán)境過(guò)程中發(fā)揮重要作用。
鑒于目前對(duì)深海極端環(huán)境下特殊生命過(guò)程的認(rèn)識(shí)不足, 與淺海近緣物種的比較分析是解析深海生物進(jìn)化與環(huán)境適應(yīng)機(jī)制的關(guān)鍵。本研究利用SMRT三代測(cè)序技術(shù)對(duì)勞盆擬刺鎧蝦進(jìn)行了全長(zhǎng)轉(zhuǎn)錄組測(cè)序與分析, 不僅豐富了勞盆擬刺鎧蝦的遺傳信息, 同時(shí)為深入揭示深?;苌鷳B(tài)系統(tǒng)大型甲殼動(dòng)物的適應(yīng)性進(jìn)化機(jī)制提供了研究基礎(chǔ)與數(shù)據(jù)支撐。后續(xù)可基于本研究進(jìn)一步開(kāi)展擬刺鎧蝦科物種與其淺海近緣生物的比較轉(zhuǎn)錄組分析, 從而加深十足目甲殼動(dòng)物對(duì)深海化能極端環(huán)境適應(yīng)機(jī)制的理解。