姚運(yùn)法,張少平,練冬梅,賴正鋒,黃慧明,洪建基
(福建省農(nóng)業(yè)科學(xué)院 亞熱帶農(nóng)業(yè)研究所,福建漳州 363005)
黃秋葵,學(xué)名咖啡黃葵[Abelmoschusesculentus(Linn.)Moench],為錦葵科(Malvaceae)秋葵屬(Abelmoschus)一年或多年生草本植物。原產(chǎn)于非洲,自20世紀(jì)90年代初引入中國(guó),現(xiàn)國(guó)內(nèi)各地均有栽培。黃秋葵花和果莢作為重要開發(fā)價(jià)值的器官,富含蛋白質(zhì)、果膠多糖、總黃酮等營(yíng)養(yǎng)成分[1-4],其花主要開發(fā)黃秋葵花茶,經(jīng)濟(jì)附加值高[5];果莢具有降血壓、血脂和提高機(jī)體抗疲勞等功效,在黃秋葵保健品開發(fā)方面具有巨大潛力[6]。當(dāng)前,國(guó)內(nèi)對(duì)黃秋葵研究主要從栽培技術(shù)、營(yíng)養(yǎng)成分提取、功效分析和產(chǎn)品加工[7-10]等方面,但其基礎(chǔ)理論研究方面還很薄弱, 例如花、果莢中類黃酮物質(zhì)等主要功能成分及相關(guān)代謝途徑等均屬研究空白。
類黃酮(flavonoids)屬于植物重要次生代謝產(chǎn)物之一,是指2個(gè)苯環(huán)(A-與B-)通過(guò)3個(gè)碳原子連接形成具有C6-C3-C6基礎(chǔ)結(jié)構(gòu)的一類化合物[11],由于其純凈狀態(tài)呈現(xiàn)黃色,故稱黃酮。研究表明,類黃酮物質(zhì)對(duì)人體具有抗癌、抗氧化、抗動(dòng)脈硬化等功能[12-13],據(jù)其結(jié)構(gòu)的差異將類黃酮主要分為黃烷酮(flavanols)、異黃酮(isoflavones)、黃酮(flavones)、黃酮醇(flavonols)、二氫黃酮(2H-flavanones)與花色素(anthoyanidins)等6大類[14]。
轉(zhuǎn)錄組測(cè)序技術(shù)是連接基因組與代謝組的重要紐帶,本團(tuán)隊(duì)前期對(duì)紫色黃秋葵葉片[15]、果莢[16]轉(zhuǎn)錄組測(cè)序和分析,初步探討了黃秋葵次生代謝物質(zhì)合成的遺傳基礎(chǔ)。本研究利用Illumina Hi-seq 2500高通量測(cè)序技術(shù),根據(jù)黃秋葵花、果莢的轉(zhuǎn)錄組數(shù)據(jù)及其類黃酮代謝途徑關(guān)鍵基因分析,探討黃秋葵花、果莢類黃酮合成機(jī)理和關(guān)鍵差異表達(dá)基因,為后續(xù)黃秋葵關(guān)鍵基因克隆和功能驗(yàn)證、遺傳改良和加工利用等提供研究基礎(chǔ)。
試驗(yàn)材料為黃秋葵品種‘閩秋葵3號(hào)’,種植于福建省農(nóng)業(yè)科學(xué)院亞熱帶農(nóng)業(yè)研究所試驗(yàn)農(nóng)場(chǎng),2017年6月10日種植,8月15日開始采集樣品(花/果莢)。采集同一株黃秋葵植株花朵(上午9:00)和果莢(開花后8 d),花朵只保留完整花瓣,果莢去除果柄部位?;ê凸v均取3重復(fù),后立即液氮速凍,置于-70 ℃超低溫冰箱備用。
1.2.1高通量測(cè)序及數(shù)據(jù)組裝提取黃秋葵花、果莢總RNA,分別采用Nanodrop、Qubit2.0、Aglient 2100技術(shù)檢測(cè)RNA樣品的純度、濃度和完整性等,構(gòu)建cDNA文庫(kù),再分別使用Qubit2.0、Agilent 2100和Q-PCR對(duì)文庫(kù)的質(zhì)量進(jìn)行檢測(cè)。合格后,用Illumina HiseqTM2500進(jìn)行測(cè)序。測(cè)序讀長(zhǎng)為PE125。獲得原生數(shù)據(jù),進(jìn)行數(shù)據(jù)過(guò)濾,去除Reads中測(cè)序引物、接頭等人工序列,用Trinity對(duì)有效數(shù)據(jù)(Clean Data)進(jìn)行組裝。
將測(cè)序Reads構(gòu)建K-mer庫(kù),去除錯(cuò)誤的K-mer;將高頻率的K-mer作為種子向兩端進(jìn)行擴(kuò)展,不斷循環(huán)直到耗光K-mer庫(kù);再對(duì)Contig進(jìn)行聚簇,得到片段集合(Component);對(duì)每個(gè)Component中的Contig構(gòu)建De Bruijn圖;De Bruijn圖進(jìn)行簡(jiǎn)化;解開De Bruijn圖,獲得轉(zhuǎn)錄本序列。
1.2.2基因FPKM值估計(jì)與差異表達(dá)分析采用Bowtie[17]將測(cè)序得到的Reads與單基因數(shù)據(jù)(Unigene)庫(kù)進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果,結(jié)合RSEM[18]進(jìn)行表達(dá)量水平估計(jì)。利用FPKM值(fragments Per Kilobase of transcript per Million mapped reads)[19]表示對(duì)應(yīng)Unigene的表達(dá)豐度。使用EBSeq進(jìn)行差異表達(dá)分析[20]。采用Benjamini-Hochberg方法對(duì)原假設(shè)試驗(yàn)得到的顯著性P值進(jìn)行校正,校正后P值,即偽發(fā)現(xiàn)率(false discovery rate)小于0.01且差異倍數(shù)(fold change, FC)≥2作為篩選標(biāo)準(zhǔn)[21]。其中,F(xiàn)C表示兩樣品(組)間FPKM的比值。
1.2.3差異基因的功能注釋與代謝途徑富集分析使用Blast軟件將Unigene序列與NR、Swiss-Pro、GO、COG、KOG、KEGG數(shù)據(jù)庫(kù)比對(duì),再用KOBAS2.0得到Unigene在KEGG中的Orthology,預(yù)測(cè)氨基酸序列,使用HMMER軟件與Pfam數(shù)據(jù)庫(kù)分析,獲得Unigene的注釋信息。系統(tǒng)分析基因產(chǎn)物代謝途徑及功能,并將差異表達(dá)基因(DEGs)對(duì)比到KEGG數(shù)據(jù)庫(kù),得到DEGs的代謝途徑。
1.2.4類黃酮代謝關(guān)鍵差異基因分析利用注釋信息檢索法,對(duì)黃秋葵花、果莢類黃酮(黃烷酮、黃酮、異黃酮、黃酮醇、黃烷酮和花青素)關(guān)鍵詞進(jìn)行數(shù)據(jù)庫(kù)檢索,分析類黃酮物質(zhì)關(guān)鍵基因在KEGG數(shù)據(jù)庫(kù)功能注釋及代謝路徑。
1.2.5類黃酮代謝關(guān)鍵差異基因驗(yàn)證取 1 μg黃秋葵花或果莢的總 RNA,利用反轉(zhuǎn)錄試劑盒反轉(zhuǎn)錄成 cDNA,設(shè)計(jì)合成引物(表1),采用qRT-PCR檢測(cè)黃秋葵花、果莢組織部位與類黃酮代謝相關(guān)差異表達(dá)基因,設(shè)置3個(gè)重復(fù);統(tǒng)計(jì) 8個(gè)基因 (含 1 個(gè)內(nèi)參) 在待測(cè)樣品中的 Ct 值,計(jì)算相對(duì)表達(dá)量。
經(jīng)高通量測(cè)序和質(zhì)量控制,共獲得15.26 Gb有效數(shù)據(jù),其中黃秋葵花為7.12 Gb,果莢為8.14 Gb,堿基百分比均達(dá)到91.0%以上(表2)。數(shù)據(jù)質(zhì)量良好,適宜后續(xù)分析。對(duì)組裝結(jié)果進(jìn)行統(tǒng)計(jì)(表3),轉(zhuǎn)錄本序列組裝出154 721條轉(zhuǎn)錄本序列,平均長(zhǎng)度為937.5 bp,N50長(zhǎng)1 308 bp;由單基因序列(Unigene)組裝出65 436條Unigene,平均長(zhǎng)度為782.32 bp,N50長(zhǎng)1 215 bp。
經(jīng)與NR、Swiss-Prot、KEGG、COG、KOG、GO和Pfam數(shù)據(jù)庫(kù)的比對(duì),對(duì)Unigene功能注釋進(jìn)行統(tǒng)計(jì)(表4),在65 436條單基因序列中,共獲得39 245條Unigene的注釋結(jié)果,占單基因序列總數(shù)59.97%。其中與COG數(shù)據(jù)庫(kù)比對(duì),獲得9 366條同源序列,占單基因序列總數(shù)14.31%;與KOG數(shù)據(jù)庫(kù)比對(duì),獲得20 535條同源序列,占單基因序列總數(shù)31.38%;與GO數(shù)據(jù)庫(kù)比對(duì),獲得15 931條同源序列,占單基因序列總數(shù)24.35%;與KEGG數(shù)據(jù)庫(kù)比對(duì),獲得14 110條同源序列,占單基因序列總數(shù)21.56%;與Pfam數(shù)據(jù)庫(kù)比對(duì),獲得22 580條同源序列,占單基因序列總數(shù)34.51%;與Swissprot數(shù)據(jù)庫(kù)比對(duì),獲得24 494條同源序列,占單基因序列總數(shù)37.43%;與NR數(shù)據(jù)庫(kù)比對(duì),獲得38 905條同源序列,占單基因序列總數(shù)59.46%。
表1 實(shí)時(shí)熒光定量PCR引物
表2 有效數(shù)據(jù)評(píng)估統(tǒng)計(jì)
2.3.1DEGs篩選通過(guò)DEGs的篩選,獲得黃秋葵花與果莢DEGs 1 336個(gè),其中表達(dá)量上調(diào)的基因319個(gè),下調(diào)基因1 017個(gè);將DEGs單基因序列分別注釋到COG、GO、KEGG、KOG、Pfam、Swiss-Prot、NR7大數(shù)據(jù)庫(kù),共有1 131個(gè)基因獲得功能注釋,其中GO數(shù)據(jù)庫(kù)455個(gè),COG數(shù)據(jù)庫(kù)281個(gè),KOG數(shù)據(jù)庫(kù)472個(gè),KEGG數(shù)據(jù)庫(kù)372個(gè),Pfam數(shù)據(jù)庫(kù)844個(gè),Swiss-Prot數(shù)據(jù)庫(kù)807個(gè),NR數(shù)據(jù)庫(kù)1 123個(gè),其中NR數(shù)據(jù)庫(kù)注釋比高最高,達(dá)99.29%。
2.3.2GO功能注釋GO數(shù)據(jù)庫(kù)分為3大類,分別為B生物學(xué)過(guò)程(biological process),C細(xì)胞組成(cellular component)和M分子功能(molecular function),分別用來(lái)描述基因編碼產(chǎn)物所參加的生物過(guò)程、所具有的分子功能和所處的細(xì)胞環(huán)境等[22]。對(duì)黃秋葵花、果莢進(jìn)行GO分類統(tǒng)計(jì)顯示,455個(gè)DEGs被歸到41個(gè)功能小類(表5)。生物學(xué)過(guò)程中DEGs“代謝過(guò)程”、“單一生物過(guò)程”和“細(xì)胞過(guò)程”3個(gè)功能小類占比最高;細(xì)胞組分過(guò)程中DEGs在“細(xì)胞組分”、“細(xì)胞”和“細(xì)胞器”3個(gè)功能小類占比最高;分子功能過(guò)程中DEGs在“催化活性”和“結(jié)合活性”2個(gè)功能小類占比最高。
2.3.3KOG功能注釋將注釋到KOG數(shù)據(jù)庫(kù)的472個(gè)DEGs進(jìn)行直系同源分類,獲得23個(gè)功能分類,其中功能類別為R(一般功能預(yù)測(cè)),獲得96個(gè)注釋結(jié)果,占比20.33%;O(次生代謝產(chǎn)物生物合成、轉(zhuǎn)運(yùn)和代謝),獲得67個(gè)注釋結(jié)果,占比14.20%;T(信號(hào)轉(zhuǎn)導(dǎo)機(jī)制)獲得52個(gè)注釋結(jié)果,占比11.01%;Q(次生代謝產(chǎn)物的合成、轉(zhuǎn)運(yùn)和代謝)獲得44個(gè)注釋結(jié)果,占比9.32%。另外在G(碳水化合物轉(zhuǎn)運(yùn)與代謝)、K(轉(zhuǎn)錄)也分別獲得44和39個(gè)注釋結(jié)果,分別占比9.32%和8.26%(表6)。
表3 組裝結(jié)果統(tǒng)計(jì)分析
表5 差異表達(dá)基因GO功能注釋
2.3.4KEGG功能注釋將DEGs通過(guò)KEGG數(shù)據(jù)庫(kù)比對(duì)(表7),有372條基因得到注釋,分別富集在80條代謝通路,包括植物激素信號(hào)轉(zhuǎn)導(dǎo)(39個(gè))、淀粉和蔗糖代謝(33個(gè))、戊糖、葡萄糖醛酸轉(zhuǎn)換(25個(gè))、氨基酸的生物合成(16個(gè))、類苯基丙烷生物合成(14個(gè))和碳代謝(14個(gè))等22條代謝通路。本研究著重選擇類苯基丙烷生物合成代謝通路,尋找類黃酮代謝差異發(fā)生的關(guān)鍵基因。
據(jù)KEGG類黃酮代謝途徑和表8數(shù)據(jù)分析,黃秋葵類黃酮合成代謝途徑中,查爾酮合酶(chalcone synthase, CHS)和查爾酮-黃烷酮異構(gòu)酶(chalcone isomaerase, CHI)基因在花、果莢中均無(wú)差異表達(dá);3-黃烷酮羥化酶(flavanone 3-hydroxylase, F3H)、二氫黃酮醇4-還原酶(Dihydroflavonol-4-reductase, DFR)在黃秋葵花中具有顯著表達(dá)優(yōu)勢(shì);類黃酮3′,5′羧化酶(flavanone 3′,5′-hydroxylase, F3′5′H)、花青素還原酶(anthocyanidin reductase, ANR)、無(wú)色花色素還原酶基因(leucoanthocyanidin reductase, LAR)則在黃秋葵果莢中具有顯著表達(dá)優(yōu)勢(shì);而花青素苷合成酶(anthocyanidin, ANS)、葡萄糖基轉(zhuǎn)移酶(glycosyl transferases, GT)基因則分別在花、果莢中具有顯著表達(dá)。黃秋葵花、果莢中類黃酮代謝表現(xiàn)為:P-香豆素-CoA(P-coumaroyl-CoA)和3分子丙二醛-CoA(malnoyl-CoA),在CHS催化下,生成查爾酮(chalcone),查爾酮又在CHI作用下形成柚皮素(naringenin, NAR),此過(guò)程花與果莢均無(wú)顯著差異。黃秋葵花中NAR在F3H催化下生產(chǎn)二氫山奈酚(dihydokaempferol, DHK),DHK在DFR作用下,生成無(wú)色天竺葵苷元,后在ANS(c83240)作用下生成花青素苷元,花青素苷元分別在GT(c44799/c82004)等轉(zhuǎn)移酶的作用下,生成穩(wěn)定的花青素苷;黃秋葵果莢則在F3′5′H作用下將NAR生成二氫楊梅素(dihydromyricetin, DHM),后在FLS催化下,進(jìn)入黃酮醇代謝途徑,部分DHM在DFR、ANS (c94125)、GT(c44799)作用下生成飛燕草素苷元(delphinidin),飛燕草素苷元在ANR作用下,進(jìn)入原花青素代謝途徑,無(wú)色飛燕草素苷元在LAR催化下也進(jìn)入原花青素代謝途徑。另外,GT、ANS在黃秋葵花和果莢中分別有3個(gè)和2個(gè)差異表達(dá)拷貝,且表達(dá)量在不同組織中具有顯著互補(bǔ)性。
表6 差異表達(dá)基因KOG功能注釋
表7 差異表達(dá)基因KEGG功能注釋
表8 黃秋葵花、果莢類黃酮代謝關(guān)鍵基因差異表達(dá)情況
將表10中部分DEGs進(jìn)行熒光實(shí)時(shí)定量(RT-PCR),其中GT和ANS基因隨機(jī)選取多拷貝中1個(gè),共7個(gè)。差異表達(dá)基因中c82420、c78393和c44799 3個(gè)基因表達(dá)量上調(diào);c55984、c76561、c89149和c83240 4個(gè)基因表達(dá)量下調(diào),以黃秋葵c84471基因?yàn)閮?nèi)參基因, 進(jìn)行qRT-PCR驗(yàn)證。由圖1可知,7個(gè)基因qRT-PCR分析得到的相對(duì)表達(dá)量與轉(zhuǎn)錄組表達(dá)譜分析趨勢(shì)完全一致, 但表達(dá)的變化大小存在一定差異,說(shuō)明基因表達(dá)譜的分析結(jié)果基本可靠,其中DFR和ANR基因分別特異性在黃秋葵花、果莢中表達(dá),且表達(dá)量差異極大。
1.c55984;2.c82420;3.c76561;4.c78393;5.c44799;6.c89149;7.c94125圖1 差異表達(dá)基因qRT-PCR相對(duì)表達(dá)Fig.1 The relative expression levels of DEGs by qRT-PCR
通過(guò)Illumina HiSeqTM2500測(cè)序技術(shù)構(gòu)建黃秋葵花、果莢轉(zhuǎn)錄組數(shù)據(jù)庫(kù),花和果莢分別獲得7.12 Gb和8.14 Gb 有效數(shù)據(jù),堿基百分比(Q30)均達(dá)到91.0%以上。對(duì)Unigene進(jìn)行功能注釋,在65 436條單基因序列中,共獲得39 245條Unigene的注釋結(jié)果,占單基因序列總數(shù)59.97%。通過(guò)DEGs分析,獲得差異基因1 336個(gè),其中上調(diào)基因319個(gè),下調(diào)基因1 017個(gè)。獲得功能注釋基因有1 131個(gè),GO數(shù)據(jù)庫(kù)將455個(gè)DEGs歸到41個(gè)功能小類,代謝過(guò)程、催化活性、單一生物過(guò)程和細(xì)胞過(guò)程等4個(gè)功能小類占比最高;KOG數(shù)據(jù)庫(kù)將472個(gè)DEGs進(jìn)行直系同源分類,獲得23個(gè)功能分類,其中與次生代謝直接相關(guān)過(guò)程O和Q類別獲得111個(gè)注釋結(jié)果,合計(jì)占比23.52%;通過(guò)KEGG數(shù)據(jù)庫(kù)比對(duì),將372個(gè)DEGs注釋到80條代謝通路上,其中富集在類苯基丙烷生物合成途徑有14個(gè)DEGs,再通過(guò)類黃酮關(guān)鍵基因分析,共獲得10個(gè)關(guān)鍵差異基因。
植物類黃酮合成代謝是目前研究最清楚的此生代謝路徑之一[23],該通路上存在2個(gè)重要基因群,即上游基因群(early biosynthetic genes, EBGs)與下游基因群(late biosynthetic genes, LBGs)。EBGs主要包括 CHS、 CHI、F3H、F3′H、F3′5′H等基因[24-25];LBGs主要包括 DFR、 FLS、 ANS、ANR、 GT、?;D(zhuǎn)移酶(Acyl transferase, AT)和甲基轉(zhuǎn)移酶(Aethyl transferase, MT)等[26]。本研究發(fā)現(xiàn),前體合成階段關(guān)鍵酶(CHS、CHI)均無(wú)顯著差異表達(dá),這與CHS 和CHI基因編碼區(qū)和結(jié)構(gòu)都十分保守,在不同科植物間、不同組織部位上均具有較高的保守性相一致[27]。黃秋葵花、果莢類黃酮代謝路徑中發(fā)現(xiàn)F3H、F3′5′H、DFR、ANR、ANS、LAR和GT存在差異表達(dá),其中F3H、DFR在黃秋葵花中表現(xiàn)上調(diào)效應(yīng),F(xiàn)3′5′H、ANR、LAR在黃秋葵果莢中表現(xiàn)顯著上調(diào)效應(yīng),ANS、GT則分別在花和果莢中均有上調(diào)或下調(diào)效應(yīng)。NAR作為類黃酮合成的關(guān)鍵分支點(diǎn),黃秋葵花通過(guò)F3H、DFR、ANS(c83240)、GT(c82265/c82004)途徑,生成紫紅色花葵素-3-葡萄糖苷(pelagonidin-3-glucoside)[28],這與黃秋葵花喉深紅色表現(xiàn)可能有關(guān)。黃秋葵果莢則通過(guò)F3′5′H、FLS催化下,將NAR生成楊梅素(Myricetin)[29]等;部分NAR在F3H、DFR、ANS、LAR作用下,進(jìn)入花青素苷元(表焙兒茶素)和原花青素(沒(méi)食子兒茶素)合成途徑。初步推斷,黃秋葵花中富含花青素苷(葵素-3-葡萄糖苷)成分,果莢富含黃酮醇(楊梅素等)、花青素苷元(表焙兒茶素)原花青素(沒(méi)食子兒茶素等)等類黃酮物質(zhì)。另外ANS和GT基因在黃秋葵花、果莢中均存在多拷貝和底物特異性現(xiàn)象[30],推斷GT(c44799)、GT(c82004)在黃秋葵花中特異性的催化無(wú)色天竺葵素苷元,GT(c44799)在黃秋葵果莢中特異性的催化無(wú)色飛燕草苷元;ANS分別在花和果莢里高表達(dá),ANS(c83240)可能與黃秋葵花瓣顏色(黃色)有關(guān),ANS (c94125)可能與果莢顏色(濃綠色)有關(guān),具體GT、ANS特異性底物種類、產(chǎn)物及最終呈色關(guān)系還需要進(jìn)一步功能驗(yàn)證。
利用高通量轉(zhuǎn)錄組測(cè)序技術(shù),深入挖掘黃秋葵不同組織部位DEGs,從宏觀上理清黃秋葵花、果莢差異基因及調(diào)控機(jī)理等。近年來(lái),黃秋葵營(yíng)養(yǎng)成分研究在國(guó)內(nèi)越來(lái)越受到重視,特別是黃酮提取[31]和功能分析[32]逐漸成為研究熱點(diǎn),備受食品、醫(yī)藥等行業(yè)青睞。本研究豐富了黃秋葵花、果莢轉(zhuǎn)錄組水平生物數(shù)據(jù)信息,為類黃酮等關(guān)鍵基因克隆和功能驗(yàn)證等提供遺傳基礎(chǔ)。