張賀平
(中化化肥有限公司河北分公司,河北石家莊050031)
由條形柄銹菌小麥?;停≒uccinia striiformis f.sp.tritici,Pst)真菌引起的小麥條銹病是世界性禾谷類作物的重要病害之一,全球每年造成小麥產(chǎn)量直接經(jīng)濟損失近10億美元[1],在我國曾發(fā)生多次大流行,嚴(yán)重危害小麥生產(chǎn)安全[2]。經(jīng)過長期不懈的努力,我國在小麥條銹病治理中取得了重大進(jìn)展[3],但由于Pst極強的變異性新型致病型不斷涌現(xiàn),防治小麥條銹病的任務(wù)依然艱巨。
雖然不同病原菌侵染寄主所用策略不同,但最終目的都是為了獲取源自寄主的營養(yǎng)。Pst作為活體營養(yǎng)專性寄生菌,既要利用多種效應(yīng)因子逃避或抑制小麥的免疫反應(yīng),又要同小麥競爭吸收糖類等營養(yǎng)物質(zhì)以供應(yīng)菌體生長繁殖[4]。小麥條銹菌毒性變異豐富,目前對不同毒力小麥條銹菌在侵染小麥寄主過程中差異表達(dá)基因尚未進(jìn)行深入分析。
本研究選擇不同毒力小麥條銹菌(CY31、CY32、CY33和V26菌系的單孢子堆分離物),旨在通過RNA-seq技術(shù)測定Pst產(chǎn)孢時轉(zhuǎn)錄組并分析其轉(zhuǎn)錄組序列,并對差異表達(dá)基因進(jìn)行探討。
供試小麥條銹菌為CY31、CY32、CY33和V26菌系的單孢子堆分離物;供試小麥品種為銘賢169。
1.2.1 RNA提取、文庫構(gòu)建及測序采用Trizol法(Invitrogen,USA)分別提取小麥條銹菌各分離物的總RNA,提取過程中所用器具和耗材均經(jīng)過DEPC處理。DNaseⅠ消化樣品中的DNA,然后用Nanodrop檢測RNA的純度和濃度,采用Agilent 2100分析儀(安捷倫公司)檢測RNA完整值(RIN),以確定RNA質(zhì)量。
RNA檢測合格后,用帶有Oligo(dT)的低吸附磁珠通過A-T互補配對與mRNA的ployA尾結(jié)合的方式富集總RNA中的mRNA,隨后加入打斷試劑,按照Truseq RNA Sample Prep Kit v2說明書構(gòu)建雙末端cDNA文庫。由諾禾致源公司采用Illumina HiSeqTM2000進(jìn)行轉(zhuǎn)錄組測序。
1.2.2 測序數(shù)據(jù)質(zhì)量控制首先檢查測序原始讀長每個堿基的測序錯誤率,采用測序Phred數(shù)值(Q值)估算堿基判別的錯誤率(通常Q10、Q20和Q30對應(yīng)的堿基測序錯誤率分別為10.0%、1.0%和0.1%);其次,為保證分析質(zhì)量,必須對測序得到的原始讀長進(jìn)行過濾:去除帶接頭的讀長、片段內(nèi)無法確定堿基信息的比例>10%的讀長、Q值<20的堿基數(shù)占整個讀長50%以上的低質(zhì)量讀長,得到過濾后讀長,后續(xù)分析均基于過濾后讀長進(jìn)行。
1.2.3 與參考基因組序列的比對采用Tophat 2.0軟件將過濾后讀長比對到小麥條銹菌基因組(PST-78,GenBank:AJIL00000000.1)上,比對過程中允許≤2個堿基對的錯配。統(tǒng)計可定位到參考基因組上的讀長數(shù)量,其中包括在參考基因組上有多個比對位置的讀長數(shù)量以及在參考基因組上有唯一比對位置的讀長數(shù)量。如果參考基因組選擇合適,而且相關(guān)實驗不存在污染,正常情況下,定位到參考基因組上的讀長會高于70%,而有多個比對位置的讀長占總體的比例低于10%。根據(jù)過濾后讀長在參考基因組上的分布情況,總體評估獲得的測序數(shù)據(jù)在小麥條銹菌基因組上的覆蓋情況。比對到某基因的讀長若至少有1條與參考基因匹配,則將該參考基因定義為一個表達(dá)基因。
1.2.4 基因表達(dá)譜分析和差異基因注釋基因表達(dá)水平與其轉(zhuǎn)錄本的豐度相關(guān),通常轉(zhuǎn)錄本豐度越高,則基因表達(dá)水平越高。讀長數(shù)量除了與基因的真實表達(dá)水平相關(guān)外,還受測序深度和基因長度的影響。為減小這種影響,轉(zhuǎn)錄組基因表達(dá)量以FPKM(Fragments Per Kilobase per Millions base pairs sequenced)值來衡量。FPKM同時考慮了測序深度和基因長度對讀長數(shù)量的影響,是目前常用的基因表達(dá)水平估算方法。
由于本試驗沒有設(shè)置生物學(xué)重復(fù),因此,先采用DEGseq軟件的TMM程序?qū)ψx長計數(shù)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后用cufflinks軟件統(tǒng)計小麥條銹菌兩兩樣品間基因的表達(dá)差異狀況,再通過多重假設(shè)檢驗(False discovery ratio,F(xiàn)DR)對計算出的每一差異表達(dá)基因的P值進(jìn)行校正。為消除生物學(xué)變異,閾值設(shè)定為樣品間FPKM比值2倍以上且FDR<0.005,同時滿足差異倍數(shù)和顯著水平的基因作為差異表達(dá)基因。將差異表達(dá)基因和NCBI nr數(shù)據(jù)庫進(jìn)行比對,用nr注釋庫中同源基因的注釋信息代表差異表達(dá)基因的注釋信息。采用KOBAS軟件將差異表達(dá)基因與KEGG(Kyoto encyclopedia of genes and genomes)數(shù)據(jù)庫進(jìn)行比對,獲得差異表達(dá)基因相對應(yīng)的路徑注釋信息。
用Trizal法提取小麥條銹菌CY31、CY32、CY33和V26菌系的RNA后,質(zhì)量檢測顯示,OD260/OD280值在1.902~1.942,RIN值在9.5~9.7,25S/18S比值均為1.6,濃度范圍在468~540 ng/μL。表明所用樣品的RNA純度和完整性較好,可滿足轉(zhuǎn)錄組測序要求。
分析原始讀長堿基的測序錯誤率和Q值分布,可以檢測測序數(shù)據(jù)的質(zhì)量。測序錯誤率受多因素影響,轉(zhuǎn)錄組的測序錯誤率具有2個特點:一是隨著測序讀長長度增加測序錯誤率升高;二是讀長端的前6個堿基位置測序錯誤率較高。前者是由于測序過程中化學(xué)試劑消耗而導(dǎo)致的,后者是因為隨機引物和RNA模板不完全結(jié)合,而這6個堿基位置恰好是文庫構(gòu)建時反轉(zhuǎn)錄中隨機引物的位置。一般樣品的讀長中每個堿基測序錯誤率應(yīng)該低于0.5%。CY31、CY32、CY33和V26菌系測序過程堿基錯誤率均低于0.02%(表1)。除了堿基的測序錯誤率外,堿基的質(zhì)量也是RNA-Seq測序質(zhì)量評估的一個重要指標(biāo),一般Q30在80%以上的測序質(zhì)量非??煽俊1狙芯?個樣品的Q20均在95.63%以上,Q30在89.79%以上(表1)。表明轉(zhuǎn)錄組測序得到的質(zhì)量結(jié)果可靠,可用于后續(xù)分析。
表1 小麥條銹菌轉(zhuǎn)錄組測序數(shù)據(jù)評估統(tǒng)計
小麥條銹菌CY31、CY32、CY33和V26菌系轉(zhuǎn)錄組共產(chǎn)生396 711 824條原始讀長,經(jīng)過濾后獲得382 125 418條過濾后讀長,每個樣品均獲得了13.23 Gb以上的堿基(表1)。將過濾后讀長與小麥條銹菌PST-78菌系參考基因組分別比對,4個樣品序列的71.15%以上讀長可以比對到參考基因組(PST-78,GenBank:AJIL00000000.1)(表2)。其中,CY31、CY32、CY33和V26菌系唯一比對到參考基因組的讀長占總過濾后讀長的比例依次為73.03%、70.14%、73.13%和70.16%,多處比對到參考基因組的讀長占總過濾后讀長的百分比在0.99%~1.16%(表2),遠(yuǎn)低于10%。此外,定位到參考基因組外顯子區(qū)及內(nèi)含子區(qū)的讀長數(shù)量占定位到參考基因組上的讀長的比例顯示,定位到外顯子區(qū)的讀長的比例最高,CY31、CY32、CY33和V26菌系對應(yīng)的比例分別是60.8%、73.9%、57.5%和76.4%,定位到內(nèi)含子區(qū)域的讀長的比例最低,4個樣品對應(yīng)的比例均低于0.3%,從基因覆蓋度的角度也證實,轉(zhuǎn)錄組數(shù)據(jù)已覆蓋參考基因組上大部分基因。本研究所得轉(zhuǎn)錄組測序數(shù)據(jù)結(jié)果能反映小麥條銹菌菌系的整個轉(zhuǎn)錄組,這些測序數(shù)據(jù)的質(zhì)量、數(shù)量評估為后續(xù)的基因表達(dá)差異分析奠定了基礎(chǔ)。
表2 小麥條銹菌轉(zhuǎn)錄組數(shù)據(jù)與參考基因組比對統(tǒng)計 條
轉(zhuǎn)錄組的讀長數(shù)量可以定性地評估基因的表達(dá)情況,通過轉(zhuǎn)換計算出FPKM值則可以對多個基因表達(dá)水平進(jìn)行比較。統(tǒng)計CY31、CY32、CY33和V26菌系不同表達(dá)水平的基因數(shù)量,結(jié)果顯示,轉(zhuǎn)錄組FPKM值小于10的基因數(shù)分別占對應(yīng)文庫的74.73%、75.86%、74.94%和75.07%(表3),10<FPKM值<100時,基因數(shù)分別占21.57%、20.63%、21.32%和21.37%,其中,F(xiàn)PKM值大于60的基因數(shù)所占比例均低于7.0%,而FPKM值大于10 000的基因在CY31、CY32、CY33和V26菌系樣品文庫中分別有7、8、7、7個。為了檢測不同毒力小麥條銹菌基因的表達(dá)差異狀況,將|log2Fold change|≥1且FDR<0.005作為顯著差異表達(dá)基因的2個維度,從差異倍數(shù)和顯著水平2個水平評估小麥條銹菌樣品間差異表達(dá)基因,小麥條銹菌CY31、CY32、CY33和V26菌系間差異表達(dá)基因數(shù)目如表4所示,小麥條銹菌V26 vs.CY31、V26 vs.CY32、V26 vs.CY33間差異表達(dá)基因數(shù)量依次為35、4、52個,CY32 vs.CY31、CY32 vs.CY33、CY33 vs.CY31間差異表達(dá)基因數(shù)量最大不超過10個。各基因表達(dá)的差異倍數(shù)比較均一,差異水平變化主要集中在6倍以內(nèi),差異倍數(shù)最大的一個基因為13倍(V26 vs.CY33中的差異基因)。分析發(fā)現(xiàn),小麥條銹菌CY31、CY32、CY33、V26菌系產(chǎn)孢時不但差異表達(dá)基因較少,而且在不同菌系間往往出現(xiàn)相同的差異表達(dá)基因。例如,V26 vs.CY31發(fā)現(xiàn)35個差異表達(dá)基因,其中,上調(diào)基因25個、下調(diào)基因10個,上調(diào)基因中16個與V26 vs.CY33的上調(diào)基因相同,下調(diào)基因中8個與V26 vs.CY33的下調(diào)基因相同;V26 vs.CY32發(fā)現(xiàn)有4個差異表達(dá)基因(均為上調(diào)表達(dá))與V26 vs.CY33間的上調(diào)基因相同,其中的一個差異表達(dá)基因(PSTG_14209)在V26 vs.CY31、V26 vs.CY32、V26 vs.CY33的上調(diào)差異基因中均被發(fā)現(xiàn)。CY31 vs.CY33發(fā)現(xiàn)的3個差異表達(dá)基因(2個上調(diào)、1個下調(diào))與CY32 vs.CY31的相同。而CY32 vs.CY33的差異表達(dá)基因有所不同,發(fā)現(xiàn)的3個差異表達(dá)基因與CY32 vs.CY31、CY33 vs.CY31的差異表達(dá)基因均不同。
表3 小麥條銹菌不同表達(dá)水平區(qū)間的基因數(shù)量 個
表4 小麥條銹菌菌系間產(chǎn)孢時差異表達(dá)基因數(shù)量 個
將已注釋的差異表達(dá)基因與KEGG數(shù)據(jù)庫比對,結(jié)果表明,共有53個基因被注釋到了KEGG中的36個通路中,其中,顯著富集通路(P<0.05)有5個(表5)。顯著富集通路主要參與到氧化磷酸化(Oxidative phosphorylation)、RNA降解(RNA degradation)、真核生物核糖體合成(Ribosome biogenesis in eukaryotes)、淀粉和糖代謝(Starch and sucrose metabolism)、內(nèi)質(zhì)網(wǎng)蛋白加工(Protein processing in endoplasmic reticulum)等通路中??梢姡←湕l銹菌CY31、CY32、CY33和V26菌系間產(chǎn)孢時在糖類的代謝、磷酸化等方面變化明顯,說明小麥條銹菌產(chǎn)孢受糖代謝系統(tǒng)的調(diào)節(jié)。
表5 小麥條銹菌差異基因注釋
本研究結(jié)果表明,4個小麥條銹菌分離物間產(chǎn)孢時差異表達(dá)基因數(shù)量較少,而且在不同菌系間往往出現(xiàn)相同的差異表達(dá)基因。例如,V26 vs.CY31發(fā)現(xiàn)35個差異表達(dá)基因(上調(diào)表達(dá)25個、下調(diào)表達(dá)10個),其上調(diào)表達(dá)基因中有16個與V26 vs.CY33的上調(diào)基因相同,下調(diào)基因中有8個與V26 vs.CY33的下調(diào)基因相同。
功能注釋顯示,Pst分離物間差異表達(dá)基因主要集中在糖和淀粉代謝及氧化磷酸化路徑中。本研究發(fā)現(xiàn),編碼糖原脫支酶和磷酸葡萄糖變位酶的直 系同源基因PSTG_05529、PSTG_09692在4個Pst分離物與小麥親和互作中表達(dá)差異顯著。糖原脫支酶催化糖原分解并釋放1分子葡萄糖,而磷酸葡萄糖變位酶是糖原分解及其逆反應(yīng)糖原合成中共存的催化酶,可以催化葡萄糖-1-磷酸和葡萄糖-6-磷酸相互轉(zhuǎn)化,2種酶在糖代謝中具有重要的作用。
比較基因組發(fā)現(xiàn),病原菌基因組編碼產(chǎn)物的類型和數(shù)量與其寄生方式緊密相關(guān),例如,活體寄生菌中編碼細(xì)胞壁降解酶的基因比其他營腐生類型的少,小麥條銹菌基因組的特征更加顯著,其基因組中缺乏編碼同化N、S必需酶的基因,而編碼糖類和氨基酸轉(zhuǎn)運蛋白的基因數(shù)量極大增加[5-7],基因組結(jié)構(gòu)表明,小麥條銹菌生長依賴吸收源自寄主的糖類等營養(yǎng)。糖類既能提供能量,又能作為信號分子影響糖運輸方向、寄主抗病性等廣泛的細(xì)胞反應(yīng)。
多項研究結(jié)果表明,成功侵染的細(xì)菌、真菌和卵菌等病原菌調(diào)節(jié)寄主植物的SWEET基因大量表達(dá),增加外流到受侵染寄主質(zhì)外體中的糖含量以供病原菌吸收。病原菌操縱寄主的糖轉(zhuǎn)運蛋白,只是穩(wěn)定獲取源自植物糖類的第1步,隨后需要將糖類從植物質(zhì)外體吸收進(jìn)入菌體的細(xì)胞質(zhì),這一過程可能需要病原菌自身編碼的蔗糖酶類分解酶和糖轉(zhuǎn)運蛋白的參與。蔗糖酶主要功能是將蔗糖水解成葡萄糖和果糖,例如,青楊葉銹菌(Melampsora larici-populina)和小麥稈銹菌(Puccinia graminis f.sp.tritici)侵染各自的寄主過程中蔗糖酶基因均上調(diào)表達(dá)[7]。最近發(fā)現(xiàn)的Pst基因組中編碼蔗糖酶的PsINV基因可以高效分解蔗糖,并且在Pst與小麥的親和與非親和反應(yīng)中均大量表達(dá)[8]。侵染過程中蔗糖酶基因表達(dá)量增加,可能將質(zhì)外體中的蔗糖分解成容易吸收的葡萄糖和果糖等己糖,同時表明,這些病原菌編碼的糖轉(zhuǎn)運蛋白對己糖底物親和力比較高。此外,多項研究表明,病原菌自身編碼的糖轉(zhuǎn)運蛋白在與寄主糖轉(zhuǎn)運蛋白爭奪糖的過程中發(fā)揮著重要作用。例如,蠶豆銹菌(Ustilago fabae)編碼的HXT1轉(zhuǎn)運蛋白?;晕掌咸烟呛凸荹9],灰霉菌(Bortrytis cinerea)編碼的Frt1轉(zhuǎn)運蛋白對果糖高親和。在玉米黑粉菌(Ustilago maydis)中發(fā)現(xiàn)了19個糖轉(zhuǎn)運蛋白,其中,己糖轉(zhuǎn)運蛋白Hxt1底物較廣泛,與玉米競爭糖類時對葡萄糖具有高親和力,也可以轉(zhuǎn)運果糖和甘露糖[10-11]。蔗糖轉(zhuǎn)運蛋白UmSrt1具有底物專一性,其對蔗糖親和力比玉米的蔗糖轉(zhuǎn)運蛋白ZmSUT1高200倍,敲除UmSrt1極大降低了病原菌的毒性,同時敲除UmSrt1和Hxt1的菌株致病性和寄生適合度均強烈降低,表明Ustilago maydis侵染過程需要同時吸收果糖和葡萄糖,Ustilago maydis既能吸收蔗糖也能吸收己糖,對在多種生境下與玉米爭奪糖類具有極大優(yōu)勢[10,12-13]。寄主植物在和病原菌競爭糖類的過程中進(jìn)化出相反的糖轉(zhuǎn)運機制,寄主植物在免疫系統(tǒng)激發(fā)下調(diào)節(jié)STP類己糖轉(zhuǎn)運蛋白將糖從質(zhì)外體回收,降低質(zhì)外體中糖含量限制病原菌獲取糖類。例如,擬南芥的己糖轉(zhuǎn)運蛋白基因STP13受Pseudomonas syringae、Bortrytis cinerea或白粉菌侵染激活表達(dá),調(diào)節(jié)受侵染擬南芥質(zhì)外體中己糖轉(zhuǎn)運到細(xì)胞質(zhì),從而限制侵入到擬南芥質(zhì)外體中的病原菌獲取糖類營養(yǎng)[14-15]。葡萄受到活體專性寄生菌白粉菌和霜霉菌侵染時,己糖轉(zhuǎn)運蛋白STP13類直系同源基因VvHT5上調(diào)表達(dá),致使質(zhì)外體中糖含量降低,限制了病原菌擴散[16]。這些結(jié)果說明植物的己糖轉(zhuǎn)運蛋白在植物防御中具有重要作用。
本研究在Pst基因組中發(fā)現(xiàn)預(yù)測編碼葡萄糖轉(zhuǎn)運蛋白的基因,但未發(fā)現(xiàn)預(yù)測編碼果糖轉(zhuǎn)運蛋白的基因。一方面顯示糖轉(zhuǎn)運蛋白對Pst獲取糖類具有重要影響,另一方面表明Pst吸收糖類機制與已知的其他活體寄生菌有顯著不同[17]。
轉(zhuǎn)錄數(shù)據(jù)提供的僅是相關(guān)線索,如果要明確差異表達(dá)基因的確切功能,需要進(jìn)行遺傳、分子以及生理功能等的綜合深入分析。