楊 波,車玉紅,郭春苗,木巴熱克·阿尤普 , 吳津蓉,杜 鵑
(1.新疆農(nóng)業(yè)科學(xué)院園藝作物研究所, 烏魯木齊 830091;2.新疆農(nóng)業(yè)職業(yè)技術(shù)學(xué)院, 新疆昌吉 831100)
【研究意義】榅桲(CydoniaoblongaMill.)是薔薇科榅桲屬植物,具有重要的藥用價值和經(jīng)濟價值,新疆主要分布在喀什、阿克蘇等地,栽培面積在1 000 hm2以上[1-2]。榅桲果肉高度木質(zhì)化,作為水果鮮食因木質(zhì)化的口感而不能被消費者接受[3-4]?!厩叭搜芯窟M(jìn)展】果肉木質(zhì)化是木質(zhì)素在果肉中的沉積過程,與木質(zhì)素代謝密切相關(guān)[5]。在木質(zhì)素代謝途徑中4-香豆酸輔酶A連接酶(4-coumarateCoAligase,4CL)基因是關(guān)鍵酶之一, 是調(diào)控苯丙酸途徑與木質(zhì)素前體合成的關(guān)鍵支點和紐帶而備受關(guān)注[6]。近年來,4CL基因在慈竹[6]、楊樹[7]、松樹[8]、煙草[9]、非洲菊[10]、芒果[11]、葡萄[12]、棗[13]等多種植物上均已被克隆鑒定出來,對其功能和調(diào)控作用進(jìn)行了系統(tǒng)研究?!颈狙芯壳腥朦c】車玉紅等已經(jīng)對榅桲果實中與木質(zhì)素代謝相關(guān)的CAD基因[14]和C4H基因[15]進(jìn)行了克隆分析,但榅桲4CL基因的序列信息尚不明確。研究榅桲4CL基因的克隆與生物信息學(xué)?!緮M解決的關(guān)鍵問題】以榅桲果肉為研究對象,研究克隆4CL基因的序列全長,并研究其序列特征,為該基因在榅桲果實發(fā)育過程中的作用和功能奠定基礎(chǔ)。
1.1.1 榅 桲
采集地點為新疆喀什地區(qū)莎車縣伊什庫里鄉(xiāng)榅桲示范園,供試品種為大果榅桲。采集時間為榅桲落花后40 d(5月21日)的果實。樣品采集后迅速用冰塊保存送至烏魯木齊實驗室在超低溫冰箱-80℃環(huán)境下保存?zhèn)溆谩?/p>
1.1.2 試 劑
大連TaKaRa公司提供實驗所需PrimerSTAR DNA聚合酶、M-MLV反轉(zhuǎn)錄酶和T4DNA連接酶;QIAGEN公司提供質(zhì)粒提取試劑盒;北京天根公司提供榅桲果肉總RNA提取所需要的試劑盒和瓊脂糖凝膠回收試劑盒;實驗采用的其他化學(xué)試劑均為國產(chǎn)分析純試劑。
1.3.1 總RNA的提取和cDNA的合成
取榅桲果實果肉組織100 mg用液氮低溫研磨,榅桲果實樣品的總RNA進(jìn)行提取按照植物多糖多酚總RNA提取試劑盒說明書中的操作流程進(jìn)行,提取完成后,在配置1%的瓊脂糖凝膠中檢測RNA完整性,并用紫外分光光度計測定提取后的RNA濃度,根據(jù)瓊脂糖凝膠與紫外分光光度計的檢測結(jié)果,篩選出提取質(zhì)量較高的RNA樣品,將其保存于-80℃的冰箱中。得到的榅桲果實組織的總RNA模板,反轉(zhuǎn)錄得到榅桲果實組織的cDNA。
1.3.2 基因克隆
根據(jù)GeneBank數(shù)據(jù)庫中已登錄的4CL基因序列,選取以下5個物種進(jìn)行同源性比對,選擇近源物種桃(Prunuspersica,XM_007222403.2)、扁桃(Prunusdulcis,XM_034356296.1)、月季(Rosachinensis,XM_024307314.1)、甜櫻桃 (Prunusavium,XM_021954558.1)等4個序列,針對高度同源性區(qū)域,采用Oligo 6.0軟件設(shè)計了榅桲4CL基因序列的引物(4CL-senese:ATGGGACGGCGGCAGGGAT;4CL-antisenese:TCAAAGTTCGGAATAAGCAGAG)。以反轉(zhuǎn)錄獲得的榅桲果實組織的cDNA為模板,利用高保真酶PrimeStar進(jìn)行榅桲4CL基因全長編碼區(qū)擴增,反應(yīng)體系如下:cDNA 2 μL,5×PS buffer 2.5 μL,dNTP (2.5 mmol/L) 2 μL,正反向引物(10 mmol/L)各1 μL,Primer Star酶(2.5 U/μL) 1 μL,ddH2O補充反應(yīng)體系至25 μL。PCR反應(yīng)條件為:95℃、3 min,94℃、40 s,58℃、45s,72℃、1.0 min,72℃、5 min,35個循環(huán)。利用DNA膠回收試劑盒對PCR產(chǎn)物進(jìn)行回收,并將其連接至pMD-18T載體(TAKARA)上,最后將連接產(chǎn)物送至上海生物工程技術(shù)服務(wù)有限公司測序。
1.3.3 序列分析與結(jié)構(gòu)預(yù)測
采用ExPASy(http://cn.Expasy.org)的ProtParam和ScanProsite 程序?qū)X桲4CL基因編碼蛋白的氨基酸殘基數(shù)目及構(gòu)成,相對分子量、等電點、親疏水特點等理化參數(shù),進(jìn)行預(yù)測分析;分別采用PredictProtein(https://www.predictprotein.org/getqueries)和Swiss-model(http://swissmodel.expasy.org/)對榅桲4CL基因編碼蛋白中二級結(jié)構(gòu)和三級結(jié)構(gòu)進(jìn)行預(yù)測分析;用DNAMAN軟件進(jìn)行同源序列比對;利用MAGA 5.0軟件,使用Neighbor-joining法中重復(fù)1 000次抽樣的方法,對同源比對的所有序列進(jìn)行系統(tǒng)進(jìn)化樹分析,用MEGA 4軟件構(gòu)建系統(tǒng)進(jìn)化樹。
研究表明,以榅桲果實cDNA為模板進(jìn)行PCR擴增,擴增結(jié)果為產(chǎn)物條帶大小約為1 710 bp,與預(yù)期的大小相符。將PCR產(chǎn)物與pMD-19T載體進(jìn)行連接,轉(zhuǎn)化入感受態(tài)細(xì)胞后,提取質(zhì)粒,利用SalI和SmaI雙酶切后,獲得大小為1 700 bp左右的產(chǎn)物,其與預(yù)期的大小一致。圖1
注:M為1 kb標(biāo)記物;1表示4CL基因的PCR擴增產(chǎn)物;2表示4CL基因的酶切產(chǎn)物
研究表明,PCR產(chǎn)物經(jīng)回收、克隆和菌落PCR鑒定后,對其陽性克隆進(jìn)行測序的結(jié)果,結(jié)果顯示,PCR所得開放閱讀框(ORF)的長度為1 710 bp,編碼570個氨基酸,以ATG為起始密碼子,TGA為終止密碼子。圖2
圖 2 榅桲4CL基因的核苷酸和氨基酸序列Fig. 2 4CL gene nucleotide and amino sequence
2.3.1 榅桲4CL氨基酸組成及理化性質(zhì)
研究表明,甘氨酸Gly、丙氨酸Ala、亮氨酸Leu、蘇氨酸Thr和絲氨酸Ser等氨基酸的使用頻率較高,這5種氨基酸在氨基酸總量中的占比依次為8.6%、9.3%、9.9%、7.4%、7.7%。榅桲4CL蛋白的氨基酸總數(shù)為570個,分子質(zhì)量為68.4 kD。表1
表 1 榅桲4CL基因所編碼的氨基酸的組成Table 1 The composition of amino acids of 4CL protein
2.3.2 榅桲4CL基因編碼蛋白親水/疏水性
研究表明,在榅桲果實4CL蛋白氨基酸中,第87位與第450位的氨基酸殘基的疏水性均最強,分別為4.0和4.12,第370位的氨基酸殘基親水性最強,為-3.311;另外,在該蛋白中,親水性氨基酸累計有376個,疏水性氨基酸累計有194個,親水性氨基酸的數(shù)目小于疏水性氨基酸的數(shù)目,榅桲4CL蛋白為親水性蛋白。圖3
圖3 4CL基因編碼蛋白親水/疏水性的預(yù)測Fig. 3 Prediction of hydrophobicity and rophilicity of 4CL protein
研究表明,該蛋白的主要二級結(jié)構(gòu)為β折疊與無規(guī)卷曲,其中占比最多的是無規(guī)卷曲(Random coil),達(dá)到44.27%;α螺旋(Alpha helix)的占比較少,僅為26.43%;β折疊(Extended strand)的占比居中為34.1%。找到同源性最高的模板,模板氨基酸序列的一致性為55.21%,并以第4~570位氨基酸建模,模型覆蓋率為92%。圖4
圖 4 4CL 蛋白三級結(jié)構(gòu)的預(yù)測Fig. 4 Prediction of tertiary structure of the 4CL protein
2.3.4 榅桲4CL基因的同源性比對
研究表明,通過DNAMAN,將榅桲4CL基因全長編碼區(qū)序列與NCBI上公布的其他物種的氨基酸序列進(jìn)行同源性比對分,榅桲4CL基因序列與水蜜桃(Prunuspersica,XM_007222403.2)、甜杏仁(Prunusdulcis,XM_034356296.1)、梅(Prunusmume,XP_008239280.1)、甜櫻桃 (Prunusavium,XM_021954558.1)的4CL基因序列的相似度最高,均接近90%左右,分別為91.99%、90.71%、89.28%、89.48%;與黃梨(PyrusussuriensisxPyruscommunis,XM_009336035.2)、海棠(Malusdomestica,XM_008389654.3)、月季(Rosachinensis,XM_024307314.1)和可可豆(Theobromacacao,XM_007017910.2)的4CL基因序列的相似度均超過70%,分別為76.71%、77.08%、70.38%、70.17%。而與煙草、擬南芥模式植物的同源性較低,僅有55.53%和51.33%的相似性。圖5
2.3.5 榅桲4CL蛋白的氨基酸組成及進(jìn)化樹
研究表明,水蜜桃是與榅桲4CL蛋白親緣關(guān)系最近的物種,其次為甜杏仁,三者的4CL蛋白屬于同一個分支;而擬南芥、煙草等1年生草本植物的4CL蛋白與作為多年生木本果樹的榅桲4CL蛋白的親緣關(guān)系較遠(yuǎn),草本植物與木本植物間4CL蛋白存在差異。圖6
榅桲果實生育期雖長達(dá)160 d,但在果實發(fā)育早期木質(zhì)素合成快、代謝旺盛。課題組前期通過間苯三酚染色研究發(fā)現(xiàn)木質(zhì)素沉積的關(guān)鍵時期是果實發(fā)育前100 d,其中積累速度最快是第40 d左右[14],所以研究中榅桲果實的采樣時間選擇在榅桲開花后的第40 d采樣。榅桲果肉中克隆出的C4H基因與榅桲果實發(fā)育中木質(zhì)素的代謝緊密相關(guān)。
研究使用RT-PCR方法克隆獲得榅桲組織C4H基因的編碼區(qū)全序列區(qū),序列全長為1 710 bp,編碼570個氨基酸,該蛋白的相對分子質(zhì)量為68.4 kD;榅桲C4H蛋白中在該蛋白中,親水性氨基酸的數(shù)目大于疏水性氨基酸的數(shù)目(376個親水性氨基酸,有194個疏水性氨基酸),推斷為親水性蛋白質(zhì);榅桲4CL蛋白二級結(jié)構(gòu)中無規(guī)卷曲(Random coil)、α螺旋(Alpha helix)、β折疊(Extended strand)的占比分別為44.27%、26.43%和34.1%,說明榅桲4CL蛋白以無規(guī)卷曲結(jié)構(gòu)為主,這與榅桲C4H蛋白結(jié)構(gòu)特性相似[15];榅桲4CL基因與水蜜桃(Prunuspersica,XM_007222403.2)、甜杏仁(Prunusdulcis,XM_034356296.1)的4CL基因序列的相似度最高,均超過90%,達(dá)91.99%和90.71%,這與系統(tǒng)進(jìn)化樹分析榅桲C4H基因與水蜜桃親緣關(guān)系最近,甜杏次之一致。
克隆得到的榅桲果實4CL基因的全長和序列特性與慈竹[6]楊樹[7]、松[8]等林木,煙草[9]、非洲菊[10]等草本植物,以及芒果[11]、葡萄[12]、棗[13]等果樹的4CL基因均不相同,說明同一基因在不同的物種中的結(jié)構(gòu)、作用和功能間的差異性和多樣性。此外,研究只是探明了榅桲果肉木質(zhì)素代謝途徑中關(guān)鍵酶基因中4CL基因的基因序列和基因結(jié)構(gòu)特性,在榅桲果實發(fā)育過程中該基因的作用和功能,以及該基因與果肉木質(zhì)化的關(guān)系、調(diào)控等問題還有待于進(jìn)一步的深入研究。
獲得了榅桲木質(zhì)素代謝途徑中關(guān)鍵酶基因4CL基因全長編碼區(qū)序列,其開放閱讀框(ORF)序列為1 710 bp,編碼570個氨基酸,蛋白分子質(zhì)量為68.4 kD,進(jìn)化關(guān)系上與水密桃較,榅桲4CL蛋白為親水性蛋白,二級結(jié)構(gòu)中以無規(guī)卷曲(Random coil)為主。