宋發(fā)軍,李妍清,楊瑞霜,孟艷艷
(中南民族大學(xué) 生命科學(xué)學(xué)院&生物技術(shù)國(guó)家民委重點(diǎn)實(shí)驗(yàn)室&武陵山區(qū)特色資源植物種質(zhì)保護(hù)與利用湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430074)
重樓皂苷是中藥重樓(ParidisRhizoma)最主要的活性成分,具有抗菌、解蛇毒等多重功效.然而,重樓的野生植物資源瀕臨枯竭,且重樓屬植物的種子休眠期長(zhǎng)、人工繁育周期長(zhǎng)[1-2],從而導(dǎo)致重樓皂苷的供需矛盾日益突出.因此,解析重樓皂苷生物合成途徑中的關(guān)鍵基因,對(duì)實(shí)現(xiàn)人工合成重樓皂苷和保護(hù)野生重樓種質(zhì)資源具有重要意義.
重樓皂苷主要包括薯蕷皂苷和偏諾皂苷兩大類,其生物合成途徑下游的關(guān)鍵酶類尚未被完全確認(rèn).研究表明,重樓皂苷合成的最后步驟中,薯蕷皂苷元被糖苷化生成各種薯蕷皂苷,或薯蕷皂苷元經(jīng)過羥化生成偏諾皂苷元再苷化生成偏諾皂苷[3],而大多數(shù)重樓皂苷的糖苷化主要是由尿苷二磷酸糖基轉(zhuǎn)移酶(UDP glucuronosyltransferase,UGT)負(fù)責(zé)催化的[3].因此,研究重樓中的UGTs有助于揭示重樓皂苷的合成機(jī)制.目前重樓中被鑒定和表征的UGTs數(shù)量還很少.基因組信息的欠缺和有限的轉(zhuǎn)錄組數(shù)據(jù),阻礙了重樓皂苷生物合成途徑中UGTs的研究.本課題組前期以中藥重樓的正品藥源植物七葉一枝花為研究對(duì)象,進(jìn)行了全長(zhǎng)轉(zhuǎn)錄組的測(cè)序工作.本研究在已有數(shù)據(jù)的基礎(chǔ)上,利用隱馬爾可夫模型篩選UGTs;同時(shí)提取七葉一枝花不同組織的RNA,通過qRT-PCR技術(shù)明確UGTs的表達(dá)特征,獲得可能參與重樓皂苷生物合成的目標(biāo)UGTs.
七葉一枝花根狀莖、根、葉、花、莖及種子均采集于湖北省恩施土家族苗族自治州鶴峰縣.根狀莖等組織材料均采集于2019年5月,各組織材料迅速放于液氮中冷凍,隨后保存于-80 ℃冰箱中超低溫凍存?zhèn)溆?七葉一枝花種子采集于2019年10月,去種皮,洗凈,晾曬干后保存于4 ℃冰箱.
利用隱馬爾可夫模型從七葉一枝花轉(zhuǎn)錄組數(shù)據(jù)中篩選出UGT基因.使用CDD(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)在線軟件分析各個(gè)基因所編碼蛋白的結(jié)構(gòu)域.
利用ProtParam(http://web.expasy.org/protparam/)分析七葉一枝花UGT蛋白的基本理化性質(zhì),如氨基酸數(shù)量、分子量及等電點(diǎn)等.
使用MEGA5.0和Clustalx工具分析蛋白系統(tǒng)進(jìn)化關(guān)系,并采用NJ法構(gòu)建系統(tǒng)進(jìn)化樹;蛋白motif基序分析利用MEME軟件(http://meme-suite.org/tools/meme)完成.
通過 SWISS-MODLE(http://swissmodel.expasy.org/)方法在線對(duì)蛋白質(zhì)進(jìn)行三維立體結(jié)構(gòu)進(jìn)行預(yù)測(cè),隨后利用saves(http://servicesn.mbi.ucla.edu/SAVES/)對(duì)所得模型進(jìn)行評(píng)估.
葉、花、莖、種子用RNAprep Pure多糖多酚植物總RNA提取試劑盒提取RNA(北京天根生化);根狀莖、根用CTAB法結(jié)合RNA純化試劑盒(北京天根生化)提取RNA.所得RNA經(jīng)超微量分光光度計(jì)(Nanophotometer N50 Touch,美國(guó)Thermo公司)測(cè)量濃度、瓊脂糖凝膠電泳檢測(cè)合格后于-80 ℃下保存?zhèn)溆?
UGT家族基因的引物合成由上海生工完成(表1).使用PrimeScriptTMⅡ 1st Strand cDNA Synthesis Kit(TaKaRa)試劑盒進(jìn)行反轉(zhuǎn)錄獲得cDNA,實(shí)時(shí)熒光定PCR儀為QuantStudio5(Applied Biosystems,美國(guó)).選用GAPDH為內(nèi)參基因.
表1 七葉一枝花UGTs實(shí)時(shí)熒光定量分析引物
qRT-PCR的總反應(yīng)體系為20 μL:2 μL cDNA,上、下游引物各0.5 μL,SYBR 10 μL,RNase-Free ddH2O補(bǔ)齊至20 μL;反應(yīng)程序?yàn)椋?5 ℃ 預(yù)變性1 min,95 ℃變性15 s,54.5 ℃退火35 s,72 ℃ 延伸30 s,40個(gè)循環(huán),重復(fù)3次.擴(kuò)增后分析擴(kuò)增曲線及熔解曲線,采用2-ΔΔCT法計(jì)算待測(cè)基因的相對(duì)表達(dá)量.
Microsoft Excel 2016及GraphPad Prism 8進(jìn)行統(tǒng)計(jì)分析和圖表繪制,結(jié)果以3次重復(fù)的平均值±標(biāo)準(zhǔn)差(SD)表示;MeV4.8.1繪制表達(dá)量聚類分析圖譜.
利用七葉一枝花的轉(zhuǎn)錄組數(shù)據(jù)庫(kù)建立隱馬爾可夫模型,篩選出屬于糖基轉(zhuǎn)移酶基因家族的序列,HMMER軟件對(duì)其進(jìn)行提取和分析,共獲得54個(gè)UGT類似基因.CDD分析蛋白序列保守結(jié)構(gòu)域,發(fā)現(xiàn)所獲得的序列均含有UDPGT(UDP-glucoronosyl and UDP-glucosyltransferase)結(jié)構(gòu)域,檢查缺失并去除冗余序列,鑒定得到屬于UGT家族的45個(gè)基因序列片段,分別將其命名為PpUGT01~ 45.
MEME對(duì)45個(gè)UGTs進(jìn)行motif分析.除去部分較短序列外,有31條序列中含有糖基轉(zhuǎn)移酶特征盒子PSPG box(putative secondary plant glycosyltransferase box)(圖1),與植物典型的PSPG box(44個(gè)氨基酸)完全一致的氨基酸有32個(gè).其中第5位谷氨酰胺、第9位亮氨酸、第11位組氨酸、第17位苯丙氨酸、第22位甘氨酸、第28位谷氨酸、第40位脯氨酸高度保守.
圖1 45個(gè)UGT蛋白的氨基酸保守序列
45個(gè)UGTs的cDNA全長(zhǎng)在138~1437 bp之間(表2),編碼的氨基酸長(zhǎng)度在46~479之間,蛋白分子為4998.80~53406.59 D,理論等電點(diǎn)為4.36~11.12,其中有中性蛋白質(zhì)1個(gè)(PpUGT40)、堿性蛋白質(zhì)4個(gè),分別為PpUGT13、PpUGT37、PpUGT41和PpUGT45,其他均屬于酸性蛋白質(zhì).
表2 45個(gè)UGTs的理化性質(zhì)
對(duì)所得的45個(gè)UGTs和擬南芥UGT家族中的119個(gè)、北柴胡1個(gè)(BcUGT10)、人參3個(gè)(PgUGT71A27、PgUGT74AE2和PgUGT94Q2)、三七3個(gè)(Pn00082、Pn02086和Pn13895)、王不留行1個(gè)(GvUGT74M1)及蒺藜苜蓿3個(gè)(MtUGT71G1、MtUGT73K1和MtUGT85H2)、刺茄1個(gè)(SaGT4A)、馬鈴薯1個(gè)(StSGT)共177個(gè)UGTs采用NJ法構(gòu)建了系統(tǒng)發(fā)育樹.依據(jù)序列聚類關(guān)系及氨基酸序列一致性≥40%的基因歸為同一家族的分類原則[4],并參考擬南芥[5]、玉米[6]的UGT分組方式,將177個(gè)UGTs分為14個(gè)組.由圖2可知,七葉一枝花中的45個(gè)PpUGTs中有15個(gè)分布在D組(UGT73家族)中;8個(gè)UGTs分布在A組;6個(gè)UGTs分布在K組;4個(gè)UGTs分布在L組;4個(gè)分布在G組;I組、E組、UGT81家族中分別有2個(gè)UGTs;UGT80家族中有1個(gè)UGT分布.45個(gè)基因主要分布在A、D、G、L、K組中,共有38條序列,占所有序列的84%,而B、C、N、F、H組中未見PpUGT的分布.
圖2 七葉一枝花UGTs的進(jìn)化樹分析
為了進(jìn)一步了解UGT家族不同基因的表達(dá)特征及其潛在的功能,對(duì)45個(gè)基因在不同組織中的表達(dá)情況也進(jìn)行了分析(圖3).
qRT-PCR分析結(jié)果表明,七葉一枝花中的45個(gè)UGTs的表達(dá)趨勢(shì)主要分為6類:根狀莖中表達(dá)量顯著上調(diào)的UGTs有7個(gè),其中有3個(gè)UGTs(PpUGT27、PpUGT30和PpUGT40)在根中表達(dá)量也較高;葉中表達(dá)量顯著上調(diào)的UGTs共6個(gè),其中PpUGT25在根中表達(dá)量也較高,而PpUGT36在花和莖中表達(dá)量也有上調(diào);莖中表達(dá)量顯著上調(diào)的UGTs有10個(gè),其中5個(gè)UGTs(PpUGT33等)在葉中表達(dá)量也較高;種子中表達(dá)量顯著上調(diào)的UGTs有5個(gè);花中表達(dá)量顯著上調(diào)的UGTs有4個(gè);根中表達(dá)量顯著上調(diào)的UGTs有13個(gè),其中有5個(gè)UGTs(PpUGT06等)同時(shí)在莖中表達(dá)量較高,而PpUGT45花和莖中表達(dá)量均上調(diào).
研究發(fā)現(xiàn),包括UGTs在內(nèi)的多個(gè)甾體皂苷合成相關(guān)基因在葉片和果實(shí)中的表達(dá)量較高,因此葉片可能是甾體皂苷類物質(zhì)合成的主要器官[7].此外,D組和UGT80家族的基因被證明參與了皂苷的合成[8-9].因此,根據(jù)qRT-PCR結(jié)果,著重分析了在葉片中的表達(dá)量顯著升高的D組和UGT80亞家族中的UGTs成員.同時(shí)考慮到工作量以及試驗(yàn)的準(zhǔn)確性等問題,為了進(jìn)一步鎖定候選UGTs序列,重點(diǎn)關(guān)注序列長(zhǎng)度不低于800 bp的UGTs.初步篩選出了PpUGT01、PpUGT11、PpUGT18、PpUGT42和PpUGT45 5個(gè)候選基因(圖4).PpUGT01和PpUGT11在葉中表達(dá)量顯著上調(diào),且PpUGT11在根、花、莖中表達(dá)量也較高;PpUGT18基因在根、花和種子中表達(dá)量均較為顯著,在葉和莖中表達(dá)量也較高;PpUGT42基因在莖中表達(dá)量顯著上調(diào),在花、葉中表達(dá)量較根狀莖中也有所上調(diào).此外,屬于UGT80家族的PpUGT45在根、花、莖中表達(dá)量較高,葉和種子中也有表達(dá).
圖4 5個(gè)候選UGTs在不同組織中的表達(dá)量
采用SWISS-MODLE方法,對(duì)PpUGT01、PpUGT11、PpUGT18、PpUGT42和PpUGT45 5個(gè)候選基因的蛋白序列進(jìn)行了三維空間結(jié)構(gòu)的預(yù)測(cè)(圖5).結(jié)果發(fā)現(xiàn),上述5個(gè)蛋白質(zhì)均為單分子的寡肽結(jié)構(gòu),沒有配體,覆蓋率分別為91%、91%、91%、93 %和97%,利用Saves對(duì)所得模型進(jìn)行評(píng)估,Verify 3D均有超過80%的殘基有大于0.2的3D/1D值,ERRAT評(píng)分均為A,whatcheck檢測(cè)顯示5個(gè)蛋白結(jié)構(gòu)與正常結(jié)構(gòu)差異較小,5個(gè)蛋白均有三項(xiàng)指標(biāo)能通過評(píng)估,表明預(yù)測(cè)結(jié)果比較可靠.
圖5 5個(gè)候選UGT蛋白的預(yù)測(cè)三維結(jié)構(gòu)圖
植物皂苷在結(jié)構(gòu)上通常由一個(gè)或多個(gè)親水性糖殘基和疏水性類固醇或三萜類成分組成,糖殘基是皂苷化合物親水性能的決定因素[10-11].UGT可催化糖基殘基裝配皂苷元.UGT家族中的大多數(shù)成員在C末端有一個(gè)由44個(gè)氨基酸殘基構(gòu)成的PSPG box,該box是將次級(jí)代謝產(chǎn)物糖基化的植物UGT的標(biāo)志性基序[12],它被認(rèn)為是糖基轉(zhuǎn)移酶識(shí)別、結(jié)合供體分子的位點(diǎn)[13].本研究篩選得到的45個(gè)UGTs中,31條UGTs均具有典型的植物UGT的PSPG box.這表明篩選出的序列符合UGT家族特征,可用于進(jìn)一步的分析和研究.
文獻(xiàn)表明有底物催化活性的UGT主要分布在A、D、E、G、H、L六組中[4,6,14].本研究中共有34條UGTs序列分布在上述6個(gè)組中,表明這些基因可能參與七葉一枝花中次級(jí)代謝產(chǎn)物的修飾及合成.此外,甾體皂苷的骨架形成分為兩個(gè)階段,即UGT催化C-26的糖基化和β-葡糖苷酶去除葡萄糖分子以封閉F環(huán)[7].人們發(fā)現(xiàn),UGT73家族(即D組)中的基因可將糖分子連接到C-26的位置[8],在其他植物中關(guān)于UGT73家族成員的研究還有:蒺藜苜蓿UGT73K1參與三萜皂苷合成[15]、擬南芥UGT73C6參與類黃酮的糖基化[16].另外,UGT73家族的基因還參與了重樓皂苷主鏈的后期修飾[9].因此本研究中獲得的聚類在UGT73家族中的4個(gè)基因(PpUGT01、PpUGT11、PpUGT18和PpUGT42),極有可能含有參與重樓皂苷合成的UGT成員.擬南芥中UGT80A2可催化膽甾醇與UDP-葡萄糖的結(jié)合[17],UGT80B1也具有甾醇葡糖基轉(zhuǎn)移酶的活性[18],并且擬南芥UGT80家族參與甾醇糖苷和?;薮继擒盏姆e累[18].更重要的是七葉一枝花中有UGT80家族成員已經(jīng)被鑒定出,實(shí)驗(yàn)結(jié)果表明可能參與了甾體皂苷的生物合成[9].因此,本研究篩選出UGT80家族中的PpUGT45基因,或與重樓皂苷合成有密切關(guān)聯(lián).
皂苷生物合成的初始步驟可能發(fā)生在葉中,而皂苷的存儲(chǔ)等后續(xù)步驟則發(fā)生在根部[19].本實(shí)驗(yàn)篩選出PpUGT01、PpUGT11、PpUGT18、PpUGT42和PpUGT45 5個(gè)候選基因.這5個(gè)候選基因存在于葉、花、莖等組織中,表達(dá)量分析表明均有所上調(diào),推測(cè)可能與重樓皂苷自合成部位葉向儲(chǔ)存部位根的輸送有關(guān).此外,對(duì)5個(gè)候選基因的蛋白質(zhì)序列建模結(jié)果表明,所得模型均較可靠,這些結(jié)果為進(jìn)一步研究UGT蛋白的結(jié)構(gòu)與功能關(guān)系提供了理論依據(jù),同時(shí)為后期UGT候選蛋白的分析及催化底物篩選奠定了基礎(chǔ).