段曉晨,程起群
(1.中國水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所,上海 200090;2.上海海洋大學(xué)水產(chǎn)與生命學(xué)院,上海 201306)
現(xiàn)代高通量測序技術(shù)的迅速發(fā)展,使得通過不同方式來獲得魚類基因信息的過程變得更加快捷高效,轉(zhuǎn)錄組測序的對象變得更加廣泛,精準(zhǔn)率也得到了明顯提高。第二代測序技術(shù)出現(xiàn)后,魚類的轉(zhuǎn)錄組學(xué)研究達(dá)到了空前的熱度。但是,測序技術(shù)的迅猛發(fā)展也逐漸暴露出一些問題,魚類轉(zhuǎn)錄組學(xué)的發(fā)展面臨著新的挑戰(zhàn),例如:缺乏大量的基因組信息、惡劣環(huán)境下的魚類樣本難以采集和有效保存、單細(xì)胞轉(zhuǎn)錄組測序技術(shù)應(yīng)用少等。本文對轉(zhuǎn)錄組學(xué)技術(shù)的發(fā)展歷程及其在魚類研究中的應(yīng)用概況進(jìn)行了介紹,并對魚類轉(zhuǎn)錄組學(xué)的研究進(jìn)行了總結(jié)與展望。
轉(zhuǎn)錄組學(xué)、代謝組學(xué)和蛋白質(zhì)組學(xué)等各種組學(xué)技術(shù)陸續(xù)出現(xiàn),其中轉(zhuǎn)錄組學(xué)技術(shù)率先取得進(jìn)步并被認(rèn)為是應(yīng)用最為深入的技術(shù)手段之一[1]。遺傳學(xué)的中心法則顯示:DNA上的一系列遺傳信息可以經(jīng)由生物細(xì)胞內(nèi)的信使RNA(mRNA)在各項(xiàng)程序的精密調(diào)控下傳遞給蛋白質(zhì)。因此,科學(xué)家們認(rèn)為,RNA在DNA與蛋白質(zhì)之間承擔(dān)著生物信息傳遞的“紐帶”職能,而所有能夠進(jìn)行表達(dá)的基因所轉(zhuǎn)錄出的RNA及其轉(zhuǎn)錄水平,綜合起來被稱為轉(zhuǎn)錄組(transcriptome)[2]。轉(zhuǎn)錄組最重要的特點(diǎn)是特定的時間性和空間性,轉(zhuǎn)錄組研究不僅反映了個體的特定組織在某種生長發(fā)育階段下基因的表達(dá)水平,還可以用來比較同一部位在不同生存環(huán)境下基因表達(dá)水平的不同,這正是由轉(zhuǎn)錄組所具有的時間特性和空間特性所決定的[3]。轉(zhuǎn)錄組分為廣義轉(zhuǎn)錄組和狹義轉(zhuǎn)錄組,其中細(xì)胞或組織所轉(zhuǎn)錄出來的RNA總和被稱為廣義轉(zhuǎn)錄組,細(xì)胞中參與翻譯蛋白質(zhì)的所有mRNA的總和則被稱為狹義轉(zhuǎn)錄組[3]。而轉(zhuǎn)錄組學(xué)(transcriptomics)則是指一門在整體水平上研究細(xì)胞中基因轉(zhuǎn)錄的情況及轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科[1]。
隨著生物個體所處生長發(fā)育階段的不同及其生理狀態(tài)與外界環(huán)境的改變,該生物個體的轉(zhuǎn)錄組信息也隨之而改變。因此,為了更完整地研究生物生長發(fā)育、應(yīng)激免疫等生理作用機(jī)制,將轉(zhuǎn)錄組分析作為重要的研究途徑是必然的。通過對轉(zhuǎn)錄組圖譜的全面分析,能夠獲得如基因表達(dá)信息、反義轉(zhuǎn)錄本、可變剪接、差異表達(dá)基因和新基因等眾多信息[4]。相對于基因組分析而言,轉(zhuǎn)錄組分析的優(yōu)點(diǎn)除了所需要的花費(fèi)大大減少以外,其針對性也相對更強(qiáng),從轉(zhuǎn)錄組中篩選的遺傳標(biāo)記可直接進(jìn)行應(yīng)用[5]。
轉(zhuǎn)錄組學(xué)技術(shù)具有許多優(yōu)點(diǎn):
(1)靈敏度較高,因此可以檢測和定額痕量的RNA;
(2)不需預(yù)先得到所要研究物種的基因信息,因此適用于無參考基因序列的物種;
(3)獲得的數(shù)據(jù)豐富;
(4)能夠獲得細(xì)胞或組織中全部的RNA信息。通過將RNA反轉(zhuǎn)錄為cDNA的方式進(jìn)行測序,開發(fā)大量的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)標(biāo)記和微衛(wèi)星(simple sequence repeats,SSR)標(biāo)記,并進(jìn)行可變剪接的研究和定量分析[6-7]。
由于轉(zhuǎn)錄組所具有的技術(shù)復(fù)雜性,一系列具有相應(yīng)高通量的轉(zhuǎn)錄組學(xué)技術(shù)應(yīng)運(yùn)而生。轉(zhuǎn)錄組學(xué)技術(shù)主要包括以測序和雜交為基礎(chǔ)的兩類技術(shù)[4,8],目前這兩類技術(shù)作為良好的研究工具均在魚類的轉(zhuǎn)錄組學(xué)研究中得到了普遍運(yùn)用。
依據(jù)不同的原理,可以將轉(zhuǎn)錄組學(xué)技術(shù)劃分為兩類[9],如表1所示。
表1 轉(zhuǎn)錄組學(xué)技術(shù)的分類及優(yōu)點(diǎn)Tab.1 Classification and advantages of transcriptomics technology
測序技術(shù)的進(jìn)步促進(jìn)了轉(zhuǎn)錄組學(xué)研究的快速發(fā)展。20世紀(jì)70年代末,SANGER等[14]發(fā)明了雙脫氧終止法,從而使DNA序列的高效測定成為可能,第一代測序技術(shù)由此誕生。第一代測序技術(shù)優(yōu)點(diǎn)很明顯,如讀長可達(dá)300~1 000 bp、準(zhǔn)確度高、可對高重復(fù)序列進(jìn)行測序。但是由于自動化水平較低、測序通量較低且對基因的定量存在一定的偏差,因此限制了其在轉(zhuǎn)錄組學(xué)研究中的應(yīng)用[15]。
繼第一代測序技術(shù)得到普遍應(yīng)用后,以第二代測序技術(shù)(next generation sequencing,NGS)為代表的高通量測序技術(shù)在魚類轉(zhuǎn)錄組研究領(lǐng)域得到了穩(wěn)步發(fā)展[16]。第二代測序技術(shù)的讀長最高為2×150 bp,彌補(bǔ)了第一代測序技術(shù)閱讀通量低、自動化程度低的缺陷,同時顯著地提高了測序速度并減少了測序成本[17-18]。目前在研究中應(yīng)用較多的測序方法為第二代測序技術(shù),然而第二代測序技術(shù)仍存在著諸多問題,如讀長相對較短,測序之后還需要復(fù)雜的拼接過程[19]。
近年來,隨著第三代轉(zhuǎn)錄組測序技術(shù)的興起,在很大程度上解決了第二代測序技術(shù)所存在的問題。第三代測序技術(shù)能夠做到單分子實(shí)時測序,而且測序過程中免除了PCR擴(kuò)增步驟,除此之外,還具有超長的讀長功能。第三代測序技術(shù)在轉(zhuǎn)錄組學(xué)研究中可以更好地糾正錯誤拼接的基因,檢測選擇性剪切(alternative splicing)與多聚腺苷酸化(alternative polyadenylation,APA),鑒定長鏈非編碼RNA(lncRNA),鑒定新基因等[20]。
轉(zhuǎn)錄組測序流程和項(xiàng)目分析的流程[8]如圖1所示。
圖1 轉(zhuǎn)錄組測序流程和項(xiàng)目分析的流程Fig.1 Transcriptome sequencing process and project analysis process
為了避免組織中RNA的降解,轉(zhuǎn)錄組測序流程中的樣本采集和處理需要快速完成,其關(guān)鍵步驟為:首先將RNA保存液按樣品量的5~10倍加入到凍存管中,然后將采集的生物樣本麻醉,待麻醉劑起作用后將樣本解剖,取出所需組織立即放入RNA保存液中(注意將組織切割成小于5 mm的小片),做好標(biāo)記后置于4℃冰箱過夜,然后轉(zhuǎn)入-20℃冰箱,最后按照步驟提取RNA。
高通量測序技術(shù)的快速發(fā)展,使通過不同途徑來獲得魚類基因信息的過程變得更加便捷高效,轉(zhuǎn)錄組測序范圍變得更加廣泛,精確率也得到了顯著的提高。研究者們可以從整體上集中對基因的功能、信號通路、基因的表達(dá)模式等方面進(jìn)行全新的研究[11]。目前,轉(zhuǎn)錄組分析被廣泛應(yīng)用于分析魚類發(fā)育生物學(xué),研究包括化學(xué)脅迫、溫度脅迫等環(huán)境脅迫對基因表達(dá)的影響,研究生物的適應(yīng)性進(jìn)化等。
魚類遺傳育種、人工繁殖、動物胚胎與生殖工程等技術(shù)的發(fā)展和應(yīng)用要求對魚類生殖細(xì)胞的發(fā)生、受精等過程進(jìn)行更為深入地研究,因此運(yùn)用轉(zhuǎn)錄組學(xué)技術(shù)開展魚類發(fā)育生物學(xué)各個領(lǐng)域的研究工作正在穩(wěn)步進(jìn)行中。
袁靜[21]應(yīng)用第二代測序技術(shù)對尼羅羅非魚(Oreochromis niloticus)性腺發(fā)育的關(guān)鍵時期(孵化后5、30、90和180 d)進(jìn)行高通量測序,發(fā)現(xiàn)在其性腺中共有21 334個基因得到表達(dá),其中有21 006個基因在雌、雄性腺中均得到表達(dá),有259個基因特異表達(dá)于雄魚性腺,而僅有69個基因在雌魚性腺中得到特異表達(dá)。該研究建立了當(dāng)時尼羅羅非魚中最大的性腺轉(zhuǎn)錄組數(shù)據(jù)庫,轉(zhuǎn)錄組數(shù)據(jù)進(jìn)一步證明雌激素對羅非魚的性別決定和維持有重要作用。CHAPMAN等[22]利用454焦磷酸測序法對條紋鱸(Morone saxatilis)的卵巢進(jìn)行了研究,共得到230 151個表達(dá)序列。通過Blastx比對獲得的5 482個直系同源基因中,有4 120個得到GO(gene ontology)注釋,其中與繁殖和發(fā)育過程有關(guān)的基因超過 1 300 個。GUDBRANDSSON等[23]將轉(zhuǎn)錄組學(xué)分析運(yùn)用到來自于不同群體的北極紅點(diǎn)鮭(Salvelinus alpinus)胚胎發(fā)育的4個階段,發(fā)現(xiàn)一些與生物途徑相關(guān)的基因表達(dá)量有差異,而和血液凝結(jié)與能量代謝相關(guān)的基因卻在鮭魚的不同群體中實(shí)現(xiàn)了差異性表達(dá)。何飛祥[16]利用RNA測序(RNA sequencing,RNA-Seq)技術(shù)對金錢魚(Scatophagus argus)發(fā)育成熟的精巢和卵巢進(jìn)行高通量測序并構(gòu)建了cDNA文庫,組裝獲得136 561個unigene,然后通過與數(shù)據(jù)庫比對后獲得大量注釋信息,通過篩選得到32 122個差異表達(dá)基因,其中在精巢中高表達(dá)的有11 156個,在卵巢中高表達(dá)的有20 966個。
不同的養(yǎng)殖環(huán)境會對魚類組織的生理生化水平造成不同程度的影響,分析魚類組織在環(huán)境脅迫下的轉(zhuǎn)錄組變化及其涉及到的調(diào)控機(jī)理可以揭示魚體針對不同環(huán)境改變所做出的生長發(fā)育、物質(zhì)代謝、免疫調(diào)控及相關(guān)信號通路的響應(yīng)。因此,轉(zhuǎn)錄組分析被廣泛應(yīng)用于研究魚類基因表達(dá)受環(huán)境脅迫的影響領(lǐng)域。
王美垚[24]首先研究了降溫與升鹽的協(xié)同作用對刀鱭(Coilia nasus)(同種異名C.ectenes)幼魚腦組織轉(zhuǎn)錄組的影響,共得到4 721個差異表達(dá)基因,其中上調(diào)表達(dá)的基因有2 028個,下調(diào)表達(dá)的基因有2 693個,然后進(jìn)一步分析得到差異最顯著的前十名GO注釋條目。結(jié)果顯示差異最顯著的基因主要涉及“突觸傳導(dǎo)”“神經(jīng)信號傳導(dǎo)”等生物過程。李永娟[25]對熱激組的6尾虹鱒(Oncorhynchus mykiss)和對照組進(jìn)行轉(zhuǎn)錄組測序,熱激組與對照組共獲得27 796個mRNA,其中兩個組共有24 012個,熱激組獨(dú)有2 332個,對照組獨(dú)有1 452個;以q-value<0.05為臨界閾值,在受到熱應(yīng)激后共有128個肝臟基因的表達(dá)水平出現(xiàn)明顯差異。這為進(jìn)一步揭示虹鱒熱應(yīng)激反應(yīng)的分子調(diào)控機(jī)理及拓展有關(guān)基因在應(yīng)對未來氣候變化中的運(yùn)用奠定了大量數(shù)據(jù)基礎(chǔ)。朱婷芳等[26]采用Illumina Hiseq 4000平臺對大彈涂魚(Boleophthalmus pectinirostris)進(jìn)行高通量測序后獲得該魚短時低氧脅迫相關(guān)的轉(zhuǎn)錄組數(shù)據(jù),低氧脅迫處理組中累計(jì)獲得4 487個DEGs,其中包括2 507個上調(diào)的DEGs和1 980個下調(diào)的DEGs。其中低氧誘導(dǎo)組轉(zhuǎn)錄本的表達(dá)未發(fā)現(xiàn)顯著變化,而3-磷酸甘油醛脫氫酶和血管內(nèi)皮生長因子基因轉(zhuǎn)錄本的表達(dá)則上調(diào)。
通過分子生物學(xué)手段研究生物的環(huán)境適應(yīng)性及其遺傳與變異是進(jìn)化生物學(xué)領(lǐng)域所面臨的機(jī)遇與挑戰(zhàn),而轉(zhuǎn)錄組學(xué)技術(shù)提供了一種對生物體在不同狀態(tài)下基因的差異表達(dá)狀態(tài)進(jìn)行深入探究的工具。因此,轉(zhuǎn)錄組分析近年來也應(yīng)用于研究魚類的適應(yīng)性進(jìn)化方面。
JEUKENS等[27]利用RNA-Seq技術(shù)研究了短小型和正常鯡形白鮭(Coregonus clupeaformis)的轉(zhuǎn)錄組變化,結(jié)果顯示正常鯡形白鮭高表達(dá)的基因主要集中在蛋白質(zhì)的合成途徑,而短小型高表達(dá)的基因主要位于免疫、DNA復(fù)制和修復(fù)等過程。俞孟超[28]選擇分布于不同海拔的兩種裂腹魚類,軟刺裸鯉(Gymnocypris dobula)和怒江裂腹魚(Schizothorax nukiangensis),同生活在平原的鯉科魚類斑馬魚(Danio rerio)作比較分析,應(yīng)用Illumina平臺進(jìn)行轉(zhuǎn)錄組測序,獲得兩種裂腹魚類共8個組織的測序原始reads,對預(yù)測的編碼基因進(jìn)行注釋,共計(jì)得到11 007個單拷貝直系同源基因以用于后續(xù)的進(jìn)化分析。結(jié)果顯示,環(huán)境改變使裂腹魚類發(fā)生了快速進(jìn)化,且兩種裂腹魚對高原的適應(yīng)機(jī)制可能是不同的。趙胤丞[29]運(yùn)用二代測序技術(shù)對軟鰭金線鲃(地表種)(Sinocyclocheilus malacopterus)和犀角金線鲃(洞穴種)(S.rhinocerous)進(jìn)行了腦組織轉(zhuǎn)錄組測序,篩選得到的20 344個差異表達(dá)基因中,顯著差異表達(dá)基因有3 289個;其中顯著下調(diào)表達(dá)基因有2 598個,顯著上調(diào)表達(dá)基因有691個。研究結(jié)果表明,洞穴種犀角金線鲃的腦在適應(yīng)性進(jìn)化過程中扮演著重要的角色。
高密度養(yǎng)殖是人工養(yǎng)殖的重要特點(diǎn),然而魚類病害卻制約著水產(chǎn)養(yǎng)殖業(yè)的健康發(fā)展。為了減少經(jīng)濟(jì)損失,轉(zhuǎn)錄組學(xué)技術(shù)也應(yīng)用到了魚類的免疫學(xué)研究中。目前轉(zhuǎn)錄組學(xué)在魚類免疫方面的研究主要集中在魚類被寄生蟲、細(xì)菌或病毒感染前后的免疫相關(guān)基因的差異表達(dá)和分子標(biāo)記物的發(fā)現(xiàn)等方面。
杜光迅[30]對采自黃海海域的水樣進(jìn)行了菌種篩選,最終篩選出一株殺蟲活性最強(qiáng)的菌株,在得到該細(xì)菌全基因組的基礎(chǔ)上,對不同培養(yǎng)時間的該細(xì)菌轉(zhuǎn)錄組進(jìn)行了分析,預(yù)測到大量差異表達(dá)基因。此研究對開發(fā)用于治療大菱鲆(Scophthalmus maximus)盾纖毛蟲病的安全藥劑起到了促進(jìn)作用。劉凱[31]利用RNA-Seq技術(shù)對感染異尖線蟲(Anisakis)后的長江刀鱭肝臟組織進(jìn)行測序分析。然后對原始數(shù)據(jù)進(jìn)行過濾、組裝后共獲得62 604條Unigene,運(yùn)用GO和KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書,用來指一種分析基因產(chǎn)物生物細(xì)胞中的代謝途徑的方法)等生物信息學(xué)方法對其進(jìn)行注釋分析并預(yù)測其功能,共獲得961個差異表達(dá)基因,包括545個上調(diào)基因和416個下調(diào)基因。張明洋[32]采用高通量測序技術(shù)開展類志賀鄰單胞菌(Plesiomonas shigelloides)感染對鱘脾臟轉(zhuǎn)錄組和腸道菌群結(jié)構(gòu)的影響研究,發(fā)現(xiàn)類志賀鄰單胞菌感染可導(dǎo)致鱘脾臟和腸道轉(zhuǎn)錄組發(fā)生改變,其中有14 069個為脾臟差異表達(dá)基因,包括10 099個上調(diào)基因和3 970個下調(diào)基因;有16 091個為腸道差異表達(dá)基因,包含12 828個上調(diào)基因和3 263個下調(diào)基因。該研究得到的大量數(shù)據(jù)可為鱘魚類志賀鄰單胞菌感染的預(yù)防與控制提供科學(xué)依據(jù)。吳霆[33]通過轉(zhuǎn)錄組學(xué)分析發(fā)現(xiàn)異育銀鯽(Carassius auratus gibelio♀×Cyprinus carpio var.Singuonensis♂)感染CyHV-2后的頭腎中顯著上調(diào)基因有3 090個,而顯著下調(diào)基因有3 995個,KEGG信號通路分析進(jìn)一步發(fā)現(xiàn)上調(diào)基因主要富集在單純皰疹病毒感染信號通路和壞死性凋亡等免疫相關(guān)信號通路中。
以第二代測序技術(shù)為代表的高通量測序技術(shù)得到廣泛應(yīng)用后,轉(zhuǎn)錄組學(xué)領(lǐng)域獲得快速發(fā)展。例如對于癌癥治療來說,目前已經(jīng)逐步進(jìn)入了精準(zhǔn)治療時代,即根據(jù)癌癥患者的基因組特征和轉(zhuǎn)錄組特征來精準(zhǔn)指導(dǎo)用藥,這種治療模式因其無創(chuàng)性和精準(zhǔn)性獲得了醫(yī)生和患者的青睞。對于新型冠狀病毒的研究,可以對其基因組進(jìn)行測序分析,根據(jù)不同病毒亞型之間的基因組差異來做進(jìn)化分析,對病毒的發(fā)生進(jìn)行溯源并區(qū)分不同亞型的毒性強(qiáng)弱等,甚至對疫苗研究也有一定的指導(dǎo)意義。近年來,轉(zhuǎn)錄組學(xué)技術(shù)相繼應(yīng)用到魚類的發(fā)育生物學(xué)、環(huán)境脅迫、適應(yīng)性進(jìn)化和免疫生物學(xué)等領(lǐng)域中,得到大量的基因差異表達(dá)和結(jié)構(gòu)功能信息,對深入研究魚類的生長發(fā)育、病蟲害和遺傳進(jìn)化等起到了重要作用。
與此同時,現(xiàn)階段轉(zhuǎn)錄組學(xué)在魚類研究中面臨的問題與挑戰(zhàn)也是不容忽視的。第一,與人類和其他主要農(nóng)作物相比,魚類轉(zhuǎn)錄組學(xué)研究在轉(zhuǎn)錄組學(xué)研究領(lǐng)域還相對落后。尤其是魚類種類龐雜,缺少大量的基因組信息,這就給基因注釋造成了困難。第二,我國幅員遼闊、生物資源豐富,高海拔地區(qū)和其他極端環(huán)境中也存在多種魚類,然而由于環(huán)境惡劣,魚類的樣本采集和有效保存都存在著巨大問題。第三,當(dāng)前魚類轉(zhuǎn)錄組學(xué)方面的研究很少應(yīng)用單細(xì)胞轉(zhuǎn)錄組測序技術(shù),基本上仍是用魚類的整個組織或器官,然而魚類的基因表達(dá)情況在不同的細(xì)胞行使的功能是不同的。
未來魚類的轉(zhuǎn)錄組學(xué)研究趨勢,首先要擴(kuò)大魚類轉(zhuǎn)錄組學(xué)的研究領(lǐng)域,進(jìn)一步發(fā)展和豐富魚類的基因組信息。除此之外,要增強(qiáng)對極端環(huán)境中魚類的了解,解決目前普遍存在的如何有針對性地采集組織樣品進(jìn)行專項(xiàng)研究以及如何妥善保存樣品并應(yīng)用到以后的科學(xué)研究等方面的問題。隨著單細(xì)胞轉(zhuǎn)錄組測序技術(shù)取得突破性進(jìn)展和成本的逐步下降,采取單細(xì)胞轉(zhuǎn)錄組測序方法能夠具體研究不同細(xì)胞中基因的表達(dá)狀態(tài),從而減少誤差發(fā)生;但僅僅應(yīng)用轉(zhuǎn)錄組學(xué)這一種組學(xué)技術(shù)尚存在一定的局限性,因此轉(zhuǎn)錄組測序技術(shù)與基因組學(xué)、甲基化組學(xué)、代謝組學(xué)以及蛋白質(zhì)組學(xué)等方法結(jié)合的策略應(yīng)當(dāng)被廣泛應(yīng)用,多組學(xué)聯(lián)合分析是轉(zhuǎn)錄組學(xué)研究發(fā)展的重要方向。
綜上所述,轉(zhuǎn)錄組學(xué)技術(shù)為魚類生長發(fā)育、抗病免疫等方面提供了一種嶄新的研究手段,并因其高靈敏度和較低的成本等優(yōu)點(diǎn)得到了眾多研究者的青睞。盡管轉(zhuǎn)錄組學(xué)技術(shù)在魚類的研究中尚存在一定的局限性,但隨著測序技術(shù)的進(jìn)步和單分子測序技術(shù)的發(fā)展,轉(zhuǎn)錄組也與基因組、代謝組等組學(xué)進(jìn)行多組學(xué)聯(lián)合分析,這將為更加深入地研究魚類生長發(fā)育、適應(yīng)性進(jìn)化、抗病免疫和遺傳育種等創(chuàng)造條件。