于浩瀅,高冉冉,徐志超,閔偉紅
(1.吉林農(nóng)業(yè)大學(xué)食品科學(xué)與工程學(xué)院 長春 130118;2.中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院藥用植物研究所中藥資源教育部工程研究中心 北京 100193;3.國家中醫(yī)藥管理局中藥資源保護(hù)重點(diǎn)研究室 北京100193)
藥用模式植物丹參(Salvia miltiorrhiza)[1]主要藥效活性成分之一為丹參酮,一種脂溶性松香烷二萜類化合物,具有抗癌、抗菌、抗病毒等作用,對心腦血管疾病的治療效果尤為顯著[2-4]。由于丹參酮化合物結(jié)構(gòu)復(fù)雜多樣及其顯著的藥理活性,丹參酮生物合成途徑和體外合成生物學(xué)研究受國內(nèi)外廣泛關(guān)注。
丹參酮作為二萜類化合物,其上游生物合成途徑主要通過位于質(zhì)體中的非甲羥戊酸途徑(2-C-methyld-erythritol-4-phosphate,MEP)來完成,由關(guān)鍵酶DXS(1-Deoxy-D-xylulose-5-phosphate synthase)、DXR(1-Deoxy-D-xylulose-5-phosphate reductoisomerase)、MCT(MEP cytidylyltransferase)、CMK(4-(cytidine-5-diphospho)-2-C-methyl-D-erythritol kinase)、MDS(2-C-methyl-D-erythritol-2,4-cyclodiphosbphate synthase)、HDS(Hydroxymethybutenyl-4-diphosphate synthase)、HDR(Hydroxymethylbutenyl-4-diphosphate reductase)逐步催化3-磷酸甘油醛(Glyceraldehyde-3-phosphate,G3P)和丙酮酸(Pyruvate)合成異戊烯基焦磷酸(Isopentenyl diphosphate,IPP);IPP 與二甲基丙烯基焦磷酸(Dimethylallyl diphosphate,DMAPP)聚合形成二萜前體牻牛兒基牻牛兒基焦磷酸(Geranylgeranyl diphosphate,GGPP);二萜合酶SmCPS 和SmKSL 催化GGPP 合成丹參酮化合物的關(guān)鍵前體次丹參酮二烯(Miltiradiene),Zhou 等[5]將丹參SmCPS1 和SmKSL1 編碼基因模塊化組裝到酵母中通過合成生物學(xué)方法合成次丹參酮二烯,產(chǎn)量達(dá)到365 mg·L-1,后經(jīng)Dai等[6]優(yōu)化酵母表達(dá)系統(tǒng)將產(chǎn)量提高至488 mg·L-1。CYP76AH1催化次丹參酮二烯合成鐵銹醇(Ferruginol),CYP76AH3和CYP76AK1 多步催化鐵銹醇生成11,20-二羥基鐵銹醇和11,20-二羥基柳杉酚,最后在細(xì)胞色素P450(Cytochrome P450 monooxygenase,CYP450)或其他氧化酶作用下產(chǎn)生丹參酮類化合物[7-14],Xu等[15]研究發(fā)現(xiàn)2-酮戊二酸依賴性雙加氧酶(2-oxo-glutarate dependent di-oxygenases,2OGDs)超家族中的2OGD5參與丹參酮生物合成。鑒于丹參酮類化合物及其中間產(chǎn)物的結(jié)構(gòu)多樣性,其生物合成途徑仍然有多個未知的氧化酶編碼基因參與,如CYP450s、SDRs(Short-chain alcohol dehydrogenases)、2OGDs等[16]?;诘⒒蚪M和轉(zhuǎn)錄組數(shù)據(jù)篩選丹參酮生物合成相關(guān)的氧化酶編碼基因,有助于丹參酮合成途徑的解析及合成生物學(xué)研究[16-18]。
CYP450 是一種血紅素-鐵硫蛋白,在植物體內(nèi)催化多種初級和次級代謝反應(yīng),如植物天然產(chǎn)物合成過程的結(jié)構(gòu)修飾,包括萜類、生物堿類、甾醇類、信號分子、色素、植物激素、脂肪酸、黃酮類和異黃酮等的合成及代謝過程[19-21]。在陸地植物中,CYP450家族被分為11個clans:CYP51clan、CYP74clan、CYP97clan、CYP710clan、CYP711clan、CYP727clan、CYP746clan、CYP71clan、CYP72clan、CYP85clan、CYP86clan。其中,CYP71clan占高等植物中所有CYP450s的一半以上[22]。已鑒定的與萜類化合物多樣性有關(guān)的CYP450家族成員大多數(shù)屬 于CYP71clan[23],如 鱷 梨(Persea americana)中 的CYP71A1 是第一個從植物中克隆出來與單萜類化合物的代謝有關(guān)的CYP450[24];百脈根(Lotus japonicus)中CYP71D353 具有氧化羽扇豆烷型五環(huán)三萜的功能[25];青蒿(Artemisia annua)中CYP71AV1兩步催化紫穗槐-4,11-二烯生成青蒿醇和青蒿醛[26,27]。丹參中參與丹參酮生物合成的SmCYP76AH1、SmCYP76AH3、SmCYP76AK1和SmCYP71D375也屬于CYP71clan[12,13,28]。
本研究基于丹參全基因組及全長轉(zhuǎn)錄組數(shù)據(jù)庫,系統(tǒng)鑒定丹參的CYP71clan 的編碼基因,通過差異表達(dá)及共表達(dá)分析,篩選可能參與丹參酮生物合成的CYP450基因,為進(jìn)一步解析丹參酮生物合成途徑奠定基礎(chǔ)。
丹參植物材料(99-3)包括根、莖、葉、花、根周皮、根韌皮部、根木質(zhì)部等組織、器官來源于中國醫(yī)學(xué)科學(xué)院藥用植物研究所實(shí)驗(yàn)田。
通過PFAM 注釋丹參基因組中的CYP450(PF00067);下載擬南芥CYP450s 的蛋白序列(http://drnelson.uthsc.edu/Arablinks.html);采用MEGA6.0 進(jìn)行蛋白序列比對并構(gòu)建NJ(Neighbor-joining)系統(tǒng)進(jìn)化樹,選擇Tones Taylor Thornton(JTT)模型,bootstrap 設(shè)置為1000次[29]。
基于CDS 序列及對應(yīng)基因組序列,利用在線服務(wù)器(http://gsds.cbi.pku.edu.cn/index.php)分析亞家族成員的基因結(jié)構(gòu)。利用MEME(Suite version 5.0.2)對亞家族成員保守基序進(jìn)行分析,參數(shù):E 值小于2×10-30,基序重復(fù)次數(shù)不限[30]。
基于丹參已發(fā)表的轉(zhuǎn)錄組數(shù)據(jù)[16-18],包括丹參根部三個組織(周皮、韌皮部、木質(zhì)部)以及根、莖、葉、花四個部位,通過HISAT2和Cufflinks計(jì)算丹參編碼基因的FPKM(Fragments per kilobase of exon model per million mapped reads)值[31],鑒定丹參CYP450s 基因的表達(dá)量。通過皮爾森相關(guān)系數(shù)(Pearson’s Correlation Tests,r)分析候選基因與SmCPS 和SmKSL 的共表達(dá)情況[32]。
利用多糖多酚植物總RNA抽提試劑盒(天根生物技術(shù)有限公司,北京,中國),提取丹參根部總RNA。取1.0 μg 總RNA,通過PrimeScript?II 1st Strand cDNA Synthesis(TAKARA)反轉(zhuǎn)錄試劑盒反轉(zhuǎn)錄得到cDNA。采用Takara Ex Taq DNA 聚合酶對候選基因進(jìn)行基因克隆,依據(jù)全長轉(zhuǎn)錄組及基因組信息設(shè)計(jì)引物(5'FATGGAGGAAATCCAATTCCATCCC/3' R-TTATGTAGTGTGAGAAGCAACTGC),反應(yīng)條件為:95℃30 sec;30 clycles:95℃5 sec,60℃34 sec,72℃2 min;72℃10 min。反應(yīng)后利用1%瓊脂糖凝膠電泳檢測,回收DNA并與pMD-18T載體連接,進(jìn)行測序驗(yàn)證。
克隆到候選基因后,通過ExPASy Proteomics Server的在線工具Protparam(http://www.expasy.ch/tools/protparam.html)預(yù) 測 其 理 化 性 質(zhì);Predictprotein(https://www.predictprotein.org)預(yù)測蛋白的二級結(jié)構(gòu);PFAM(http://pfam.xfam.org/search/batch)預(yù)測蛋白保守結(jié)構(gòu)域;利用SWISS-MODEL(https://swissmodel.expasy.org/interactive)進(jìn)行蛋白質(zhì)的三維同源建模,并使用Pymol 軟件進(jìn)行蛋白三級結(jié)構(gòu)模型比對處理。
圖1 丹參CYP71clan系統(tǒng)進(jìn)化分析
參考2.3 的試驗(yàn)方法,分別提取丹參根三個組織(周皮、韌皮部和木質(zhì)部)以及丹參不同器官(根、莖、葉、花)的總RNA,并合成cDNA。利用Primer Premier 6 軟件設(shè)計(jì)實(shí)時(shí)定量PCR 特異引物(5'F-CCGCTGATGCTTCTTCACTT/3'R-CAGTATTCGCCGTAAGGAGAG),以丹參SmACTIN 作為內(nèi)參基因,采用2-△△Ct方法計(jì)算基因在丹參不同組織部位的相對表達(dá),one-way ANOVA(IBM SPSS v20)分析多樣品間的差異顯著性。
本研究基于PFAM結(jié)構(gòu)域(PF00067)從丹參基因組注釋到331個CYP450s,占全基因組編碼基因的1%[16],高于擬南芥中報(bào)道的CYP450s的數(shù)量(246)[33],且與大豆中CYP450s數(shù)量(332)[34]近乎一致。將丹參CYP450蛋白序列與擬南芥CYP71clan蛋白序列比對構(gòu)建系統(tǒng)發(fā)育樹,鑒定到161個丹參CYP71clan成員。根據(jù)擬南芥家族分類,將丹參CYP71clan 分為16 個家族:CYP701、CYP703、CYP706、CYP71、CYP73、CYP75、CYP76、CYP77、CYP78、CYP79、CYP81、CYP82、CYP84、CYP89、CYP92、CYP93,各家族成員數(shù)分別為2、1、4、64、2、3、28、4、8、7、12、8、3、1、10、1 個,其中CYP71家族成員最多,CYP76家族次之(圖1)。已驗(yàn)證功能的丹參SmCYP76AH1、SmCYP76AH3、SmCYP76AK1基因分別對應(yīng)SMil_00020972、Mil_00029757、SMil_00003277,屬于CYP71clan 的CYP76 家族;SmCYP71-D375(SMil_00024363)屬于CYP71clan的CYP71家族。
圖2 SmCYP71家族成員在丹參不同組織部位中的差異表達(dá)圖譜
在丹參的根組織中,23%(77/331)的CYP450s 基因的表達(dá)水平FPKM >10,49%的CYP450s 基因沉默表達(dá)(FPKM <1)。此外,丹參CYP71clan 中36%(58/161)的基因在丹參根部組織或其他部位高表達(dá)(FPKM >10),其中CYP71 家族和CYP76 家族數(shù)量最多,各14 個 基 因,CYP81 家 族7 個 基 因,CYP75、CYP92、CYP98、CYP706 家 族 各3 個 基 因,CYP78、CYP82、CYP84 家 族 各2 個 基 因,CYP73、CYP77、CYP79、CYP701、CYP89家族各1個基因。62個基因在丹參根、莖、葉、花、根周皮、根韌皮部和根木質(zhì)部中全部沉默表達(dá)。CYP84 家族中的SMil_00026853 基因在丹參莖中特異表達(dá);CYP76家族中的Smil_00024737基因與CYP706 家族中的SMil_00028777 基因在丹參葉片中特異表達(dá);CYP98 家族中的SMil_00026146 基因在花中特異表達(dá)。丹參根及根周皮是丹參酮的合成和積累部位[16],丹參酮合成途徑關(guān)鍵酶CPS、KSL、CYP76AH1、CYP76AH3、CYP76AK1 編碼基因在丹參的根及根周皮中顯著高表達(dá)[12,13,28,35]。本研究中,CYP71家 族 的CYP71D375(SMil_00024363)、CYP71AU66(SMil_00019862)、SMil_00024176 基因在丹參根及根周皮顯著表達(dá),且與SmCPS1 和SmKSL1 基因共表達(dá)(r=0.99)。
丹參CYP71家族是CYP71clan中數(shù)量最多的家族,在差異表達(dá)分析結(jié)果高表達(dá)基因中占比也最高,浦[30]等已鑒定到丹參CYP71 家族中的SmCYP71D375 參與丹參酮生物合成。丹參中64 個CYP71 家族成員的基因結(jié)構(gòu)較為相似,從圖中看,大部分基因含有1個內(nèi)含子,10 個基因有兩個內(nèi)含子,9 個基因無內(nèi)含子。SMil_00018381含有4個內(nèi)含子,是家族中內(nèi)含子數(shù)量最多的基因,(圖3A)。利用MEME(Suite version 5.0.2)對SmCYP71 家族基因進(jìn)行基序預(yù)測,總共預(yù)測了12個保守基序,其中23 個CYP71 家族成員含有全部12個基序,11個CYP71家族成員保守存在基序1、4、7、8、9、10、12,(圖3B)。
SmCYP71AU66(SMil_00019862)在丹參根及根周皮顯著高表達(dá),且與SmCPS 和SmKSL 顯著共表達(dá)。SmCYP71AU66 定位在丹參基因組sacffold 3314,基因組DNA 序列長度1585bp。本研究克隆獲得SmCYP71AU66長度1503bp,編碼500個氨基酸。
SmCYP71AU66 基因編碼的蛋白理化性質(zhì)在線分析推測該蛋白分子式為C2537H4040N684O724S21,分子量56.4kD,原子總數(shù)為8006,等電點(diǎn)6.72,帶正電殘基(Arg+Lys)63,負(fù)電殘基(Asp+Glu)61。SmCYP71AU66蛋白不穩(wěn)定系數(shù)為38.91,脂肪系數(shù)為98.28,親水性系數(shù)為-0.128。蛋白質(zhì)二級結(jié)構(gòu)中存在50.80%α-螺旋,8.60%β-折疊和40.60%的無規(guī)則卷曲。經(jīng)PFAM 預(yù)測SmCYP71AU66 在37~486 位點(diǎn)具有CYP450 保守結(jié)構(gòu)域(PF00067)。用SWISS-MODEL預(yù)測SmCYP71AU66蛋白三級結(jié)構(gòu),其與丹參中的SmCYP76AH1 基因(PDB ID:5ylw.1)同源性最高,為36.51%,故選其為模板,在第45-492 位氨基酸處建模,模型覆蓋率為88%。運(yùn)用Pymol 軟件將同源建模的模型與模板進(jìn)行比對,黃色為SmCYP71AU66 蛋白三級結(jié)構(gòu),藍(lán)色為SmCYP76AH1 蛋白三級結(jié)構(gòu),紅色為模型與模板的差異,(圖4)。
圖3 丹參CYP71家族基因結(jié)構(gòu)特征和保守基序分布
通過對SmCYP71AU66 在丹參根的周皮、韌皮部、木質(zhì)部和丹參的不同器官根、莖、葉、花中的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行差異表達(dá)分析,根周皮表達(dá)量最高,其次是根韌皮部和根,根木質(zhì)部中表達(dá)量略少,在莖、葉、花中SmCYP71AU66 基因的表達(dá)沒有被檢測到(圖5A),根周皮表達(dá)量是韌皮部的12.3倍,SmCYP71AU66的表達(dá)集中在根部,與藥典中丹參以根莖入藥相符[36]。
針對SmCYP71AU66 進(jìn)行實(shí)時(shí)定量PCR 分析,(圖5B)所示,SmCYP71AU66的表達(dá)量最高的是根周皮,根韌皮部次之,在根、根木質(zhì)部、花、葉、莖中表達(dá)量依次遞減,根周皮表達(dá)量約為韌皮部的5倍,與轉(zhuǎn)錄組表達(dá)趨勢相符合。
圖4 SmCYP71AU66蛋白三維結(jié)構(gòu)預(yù)測
圖5 SmCYP71AU66基因在丹參不同組織器官的表達(dá)
丹參酮類化合物能夠有效治療心腦血管疾病,其生物合成途徑的解析和調(diào)控以及合成生物學(xué)研究受到廣泛關(guān)注[37]。由于丹參酮和丹酚酸等天然產(chǎn)物結(jié)構(gòu)獨(dú)特、丹參轉(zhuǎn)基因技術(shù)成熟、生長周期相對短,丹參被認(rèn)為是藥用植物次生代謝途徑合成及調(diào)控等研究的模式植物[1]。近年來,丹參二萜合酶CPS和KSL環(huán)化GGPP合成次丹參酮二烯,CYP76AH1、CYP76AH3和CYP76AK1催化次丹參酮二烯合成鐵銹醇、柳杉酚等丹參酮的中間產(chǎn)物[12,13,28,35];多個丹參bHLH和AP2/ERF轉(zhuǎn)錄因子被證實(shí)正向調(diào)控丹參酮的生物合成[38-42];丹參酮中間產(chǎn)物在酵母中的合成生物學(xué)生產(chǎn)也取得顯著進(jìn)展[5,6]。由于丹參酮類化合物的結(jié)構(gòu)多樣且具有高度氧化的特性,推測有未知的CYP450 等氧化酶家族編碼基因發(fā)揮關(guān)鍵作用。已發(fā)表的丹參基因組結(jié)構(gòu)顯示丹參酮生物合成基因不呈現(xiàn)基因簇的形式,因此基于共表達(dá)分析篩選及挖掘候選功能基因至關(guān)重要。
CYP450s是迄今為止發(fā)現(xiàn)的參與植物代謝最大的酶家族,約5100個植物CYP450序列已被注釋和命名[21],參與催化萜類、黃酮類、生物堿類等化合物的生物合成,增加植物天然產(chǎn)物化合物的結(jié)構(gòu)多樣性。例如CYP71clan的CYP71D亞家族中CYP71D13、CYP71D15和CYP71D18 基因,能夠催化薄荷屬植物中檸檬烯在不同位置發(fā)生羥基化反應(yīng)[43]。本研究基于丹參全基因組數(shù)據(jù),系統(tǒng)分析丹參CYP71clan成員,將其分為16個家族,其中CYP71 家族成員64 個,數(shù)量最多。CYP71家族在丹參中進(jìn)化較為保守,成員中大多數(shù)含有相同基序,基因結(jié)構(gòu)也較為相似。差異表達(dá)分析顯示,在高表達(dá)(FPKM >10)的基因中CYP71家族成員占比最大,其中,SmCYP71AU66 基因在丹參根中顯著高表達(dá),且根周皮中表達(dá)最高,與丹參二萜合酶SmCPS和SmKSL基因呈顯著共表達(dá),與丹參酮在丹參不同組織、器官中的分布及積累規(guī)律一致,因此預(yù)測SmCYP71AU66參與催化丹參中丹參酮的生物合成。
然而SmCYP71AU66 的具體功能和機(jī)制可以通過實(shí)驗(yàn)進(jìn)一步驗(yàn)證,如結(jié)合RNAi 或CRISPR-Cas9 基因編輯手段對SmCYP71AU66基因進(jìn)行沉默或敲除,以及過表達(dá)等經(jīng)丹參體內(nèi)遺傳轉(zhuǎn)化后,通過高效液相色譜檢測觀察丹參酮類化合物含量的變化,再通過代謝組學(xué)檢測等分析尋找相關(guān)底物,候選底物在體外進(jìn)行酶活催化反應(yīng),揭示其催化丹參酮生物合成的分子機(jī)理。也可采用化學(xué)生物學(xué)方法[44,45],利用功能分子探針進(jìn)行丹參酮合成途徑相關(guān)蛋白酶和代謝物的鑒定,推動丹參酮途徑的解析,為丹參酮合成生物學(xué)及丹參分子輔助育種奠定基礎(chǔ)。