紀(jì)小敏,李 建,李 萌,曹福祥,董旭杰
(1.中南林業(yè)科技大學(xué) 生命科學(xué)與技術(shù)學(xué)院,湖南 長沙 410004; 2.湖南農(nóng)業(yè)大學(xué) 園藝園林學(xué)院,湖南 長沙 410128)
珙桐Davidia involucrata是珙桐科珙桐屬高大喬木,我國特有的珍稀孑遺植物,國家一級保護(hù)植物[1]。珙桐種子休眠期長,敗育率高,嚴(yán)重限制了其自然更新能力。隨著分子生物學(xué)技術(shù)的快速發(fā)展,分子標(biāo)記技術(shù)在分析珙桐遺傳變異中得到應(yīng)用,Long 等[2]從珙桐葉片mRNA 轉(zhuǎn)錄本中開發(fā)基因的簡單重復(fù)序列(SSRs),共獲得了30 411個基因的SSR 位點,12 208 對引物,該研究建立和完善了珙桐表達(dá)序列標(biāo)簽數(shù)據(jù)和新SSR 標(biāo)記,為揭示珙桐物種的適應(yīng)性進(jìn)化、種群結(jié)構(gòu)和解決遺傳多樣性等問題提供依據(jù)[3-4]。珙桐中的關(guān)鍵基因也不斷被克隆鑒定,例如季紅春等[5]從珙桐cDNA 文庫中克隆獲得了一個未知基因DiRCI,實驗結(jié)果表明該基因編碼低溫誘導(dǎo)膜蛋白。劉美等[6]成功得到了珙桐熱休克蛋白18(HSP18)的基因序列,對其進(jìn)行生物信息學(xué)分析,推測該基因可能與珙桐種子對不良環(huán)境的適應(yīng)性相關(guān)。戴鵬輝等[7]克隆了一個與花青素相關(guān)且編碼MYB 轉(zhuǎn)錄因子的DiMYB1基因,表達(dá)分析發(fā)現(xiàn)DiMYB1在敗育種子中的表達(dá)量均高于正常種子,推測該基因可能在珙桐種子敗育過程中發(fā)揮重要作用。熊亞麗等[8]克隆了珙桐纖維素合酶CesA基因,表達(dá)模式分析發(fā)現(xiàn)其在敗育種子中上調(diào)表達(dá),推測該基因是調(diào)控纖維素合成的關(guān)鍵基因并且在珙桐敗育過程中起到調(diào)控作用。吳曉波等[9]克隆得到了珙桐內(nèi)果皮發(fā)育過程中差異表達(dá)基因DiCCoAOMT1, 功能分析顯示該基因可能是珙桐內(nèi)果皮木質(zhì)素合成的關(guān)鍵基因。Ren 等[10]以珙桐不同器官為材料,定量分析了珙桐不同器官中穩(wěn)定表達(dá)的內(nèi)參基因,研究結(jié)果表明苞片發(fā)育中最穩(wěn)定的內(nèi)參基因為TIP41、CAC和CSD,正常和敗育種子中最穩(wěn)定的內(nèi)參基因為SAND、CAC和eIF,不同顏色的葉片中最穩(wěn)定的內(nèi)參基因為SAND、18SrRNA和eIF。越來越多的基因被克隆鑒定,為從分子水平上研究珙桐提供了一定的理論支撐。
為研究珙桐種子發(fā)育的分子機制,本研究小組前期完成了珙桐轉(zhuǎn)錄組測序分析,構(gòu)建了珙桐unigene 庫,從unigene 庫中發(fā)現(xiàn)大量與生殖發(fā)育相關(guān)的關(guān)鍵基因。其中篩選到一個編號為c37849.graph_c0的轉(zhuǎn)錄本,其在珙桐正常種子中高量表達(dá),而在發(fā)育異常的種子中幾乎檢測不到表達(dá)。序列分析顯示,該基因是一個編碼CCCH 型鋅指蛋白的轉(zhuǎn)錄因子,同源序列比對結(jié)果表明該基因含有植物特有的RR-TZF 結(jié)構(gòu)域。
鋅指蛋白(Zinc finger protein)是由一段小分子肽鏈組成,可與Zn2+結(jié)合形成指形結(jié)構(gòu),從而發(fā)揮特定功能的轉(zhuǎn)錄因子,最早發(fā)現(xiàn)于非洲爪蟾Xenopus laevis的卵母細(xì)胞中[11-12],其指形結(jié)構(gòu)能與核酸、蛋白質(zhì)及一些小分子結(jié)合而行使調(diào)控功能。根據(jù)結(jié)構(gòu)域中半胱氨酸(Cys)及組氨酸(His)的數(shù)量與位置,鋅指蛋白可分為C2H2、C2HC、C2HC5、CCCH、C3HC4、C4、C4HC3、C6和C89個亞類[13]。其中CCCH 型鋅指蛋白在結(jié)構(gòu)上含有一個或多個由3 個半胱氨酸(Cys)和1 個組氨酸(His)按序排列組成的鋅指模體,這種結(jié)構(gòu)可以被歸納為:C-X6-14-C-X4-5-C-X3-H (X 代表任意氨基酸殘基)[14]。TZF 蛋白(Tandemn zinc finger protein)是CCCH 型鋅指蛋白的一個亞家族,具有C-X7-8-C-X5-C-X3-H-X18-C-X5-C-X4-C-X3-H 的結(jié)構(gòu)特征,如人類的hTTP、ZFP36L1 和ZFP36L2 均屬于此亞家族[15-16]。根據(jù)結(jié)構(gòu)域組成,TZF 蛋白可分為RR-TZF 與ANK-RR-TZF 2 種類型,其中RR-TZF 蛋白是其中最大的亞家族之一,是植物特有的一類TZF 蛋白,其主要特征是在TZF 結(jié)構(gòu)域上游有一段富含精氨酸的50 多個氨基酸的保守區(qū)域C-X5-H-X4-C-X3-H motif(RR)[17]。大多數(shù)植物RR-TZF 編碼的基因在不同組織的不同發(fā)育階段特異表達(dá)。例如,擬南芥Arabidopsis thaliana中的AtTZF4、AtTZF5、AtTZF6基因被發(fā)現(xiàn)參與種子萌發(fā)[18];AtSZF1和AtSZF2可以增加擬南芥鹽脅迫抗性[19]。水稻Oryza sativa中的OsLIC基因參與了葉鞘夾角形成[20];OsDOS能延緩葉片衰老[21]。 楊樹Populus deltoides中的PdC3H17基因影響次生細(xì)胞壁的形成[22]。棉花Gossypium hirsutum中的GhZFP1超量表達(dá),可通過改變鈉鉀離子平衡以增強擬南芥抗鹽脅迫的能力[23]。本研究克隆了珙桐DiZF-CCCH1的cDNA 全長序列,利用生物信息學(xué)方法對其編碼的氨基酸的理化性質(zhì)、保守功能域、磷酸化位點、信號肽結(jié)構(gòu)、二級結(jié)構(gòu)組成等進(jìn)行了分析預(yù)測,并且分析了該基因在不同組織器官和種子不同發(fā)育階段的表達(dá)模式,以期為珙桐DiZF-CCCH1基因的功能驗證和調(diào)控機制提供參考依據(jù)。
珙桐小葉、大葉、葉柄、小苞片、大苞片、生長點(頂端分生組織)、種子和花序等均取自湖南省張家界市桑植縣八大公山國家級自然保護(hù)區(qū)。7—11月為種子的采集時間,4—5月為其余組織樣品采集時間,每份樣品設(shè)置3個生物學(xué)重復(fù)。將新鮮樣品采集后迅速置于液氮中速凍,然后放置-70 ℃冰箱中保存。
選取約100 mg 樣品,加入液氮快速研磨成粉,采用E.Z.N.A.TMPlant RNA 試劑盒提取總RNA,將各樣品的RNA 的濃度稀釋至合適的范圍內(nèi)后,采用Prime ScriptTM1stStrand cDNA Synthesis Kit 試劑盒反轉(zhuǎn)錄合成cDNA,產(chǎn)物于-20 ℃條件下保存?zhèn)溆谩?/p>
使 用Primer 5.0對目的基因ORF(Open reading frame,開放閱讀框)序列設(shè)計特異引物 DiZF-F/DiZF-R(引物序列見表1),分別在引物兩端加入BamHI 和SacI 酶切位點及保護(hù)位點。以珙桐種子cDNA 為模板進(jìn)行PCR 全長擴增,將克隆片段與pMD18-T 載體連接的產(chǎn)物轉(zhuǎn)化至大腸桿菌DH5α 感受態(tài)中,將經(jīng)PCR 鑒定的陽性單菌落送至鉑尚生物技術(shù)有限公司測序。
使用Expasy-ProtParam tool、SMART 等在線軟件對NCBI 中的ORF Finder 工具預(yù)測的目標(biāo)基因編碼蛋白的相對分子質(zhì)量、氨基酸組成、理論pI 值、親水性/疏水性等理化性質(zhì)進(jìn)行初步分析。使用在線工具Netphos 3.1 server 和TMHMM Server 2.0 等對目的蛋白的磷酸位點和跨膜區(qū)域等進(jìn)行預(yù)測分析。使用軟件MEGA 7.0 對NCBI 數(shù)據(jù)庫中與目標(biāo)基因編碼的氨基酸同源性較高物種的氨基酸序列進(jìn)行序聚類分析,并采用軟件SPOMA 與Swissmodel 對目標(biāo)基因編碼的氨基酸進(jìn)行二級、三級結(jié)構(gòu)預(yù)測分析。
通過qRT-PCR 檢測目標(biāo)基因在珙桐不同組織部位以及種子不同發(fā)育階段中的表達(dá)情況,qRTPCR 反應(yīng)體系使用2×SYBR Green qPCR Master Mix(High ROX)(Biotool,US),引物序列見表1。選擇在珙桐各組織中穩(wěn)定表達(dá)的UBQ基因為內(nèi)參基因[24],每組樣品設(shè)置3 個生物學(xué)重復(fù),通過2-ΔΔCT方法[25]分析數(shù)據(jù)。
表1 引物序列及擴增信息Table 1 Primer sequences and amplification information
在珙桐轉(zhuǎn)錄組數(shù)據(jù)庫中篩選到21 個在正常種子和發(fā)育異常種子中差異表達(dá)的關(guān)鍵轉(zhuǎn)錄本,對它們的表達(dá)模式進(jìn)行分析,發(fā)現(xiàn)除了c20843.graph_c1 和c39573.graph_c0 在發(fā)育異常種子中上調(diào)表達(dá)外,其余19 個轉(zhuǎn)錄本均下調(diào)表達(dá),最明顯的是c37849.graph_c0 和c41816.graph_c0,其中編號為c37849.graph_c0 的轉(zhuǎn)錄本在正常種子中高量表達(dá),而在發(fā)育異常的種子中表達(dá)量極低(圖1)。通過c37849.graph_c0 在轉(zhuǎn)錄組中的功能注釋及其序列在NCBI 中的比對結(jié)果,預(yù)測該基因編碼一個與種子發(fā)育相關(guān)的CCCH 型鋅指蛋白,將其選擇為本研究的目的基因。
分別以珙桐gDNA 和cDNA 為模板,通過PCR 擴增得到了2 條長度約為700 bp 的DNA 片段(圖2),測序發(fā)現(xiàn)gDNA 中擴增獲得的片段與從cDNA 中擴增獲得的片段序列完全相同。結(jié)果證明該基因無內(nèi)含子,ORF 長度為711 bp,編碼236 個氨基酸。通過測序及BLAST 比對,確定該基因編碼一個CCCH 型鋅指蛋白,將其命名為DiZF-CCCH1。
2.3.1 蛋白質(zhì)氨基酸序列的預(yù)測
通過ProParam 在線軟件分析DiZF-CCCH1編碼蛋白的理化性質(zhì),結(jié)果表明,DiZF-CCCH1編碼的蛋白分子質(zhì)量為26.74 kDa,理論等電點(PI)為9.02,包括3 656 個原子,分子式為C1184H1770N352O337S13。蛋白的脂肪指數(shù)為47.20,親水指數(shù)為-0.664,不穩(wěn)定指數(shù)為44.24,為不穩(wěn)定蛋白。在DiZF-CCCH1 蛋白中含有2 個CCCH 鋅指結(jié)構(gòu),C-x7-C-x5-Cx3-H 和C-x5-C-x4-C-x3-H 位于83 ~133 處(圖3),由16 個氨基酸隔開,也就是TZF 結(jié)構(gòu)域(C-X7-8-C-X5-C-X3-H-X16-C-X5-C-X4-C-X3-H)。TZF 結(jié)構(gòu)域上游有一段富含精氨酸的50 多個氨基酸保守區(qū)域C-x5-H-x4-C-x3-H,位于48 ~63 處,并且含2 個高度保守的結(jié)構(gòu)域SHDWTEC 和ARRRDPR,分 別 位 于53 ~59 和68 ~74 處,因此DiZF-CCCH1 屬于植物特有的RR-TZF 蛋白。
圖1 珙桐種子發(fā)育相關(guān)關(guān)鍵轉(zhuǎn)錄本的表達(dá)模式Fig.1 Expression patterns of selected transcripts in normal and aborted seeds of Davidia
圖2 DiZF-CCCH1 基因的克隆Fig.2 Cloning of DiZF-CCCH1gene
圖3 推導(dǎo)出的DiZF-CCCH1 蛋白的氨基酸序列Fig.3 Deduced amino acid sequence of DiZF-CCCH1
2.3.2 序列分析及聚類分析和亞細(xì)胞定位
利用軟件MEGA 7.0 構(gòu)建系統(tǒng)發(fā)育樹,對DiZF-CCCH1 蛋白進(jìn)行序聚類分析,結(jié)果顯示,DiZF-CCCH1 與來源于甜橙Citrus sinensis的親緣關(guān)系最近,在一個支,與蓮Nelumbo nucifera、銀白楊Populus alba和毛果楊樹Populus trichocarpa親緣關(guān)系較近(圖4)。用TargetP 1.1 Server 對DiZF-CCCH 蛋白進(jìn)行亞細(xì)胞定位,結(jié)果顯示,該蛋白定位于葉綠體的概率為0.134,定位于線粒體的概率為0.010,定位于細(xì)胞核或其他細(xì)胞器的概率為0.236,作為信號肽的概率為0.502。
2.3.3 磷酸化位點的預(yù)測和跨膜區(qū)域的預(yù)測
通過Netphos 3.1 server(http://www.cbs.dtu.dk/services/NetPhos/)軟件預(yù)測了珙桐DiZF-CCCH1蛋白的磷酸化位點,結(jié)果(圖5A)顯示,DiZFCCCH1基因編碼的氨基酸序列可能發(fā)生磷酸化的位點有20 個,絲氨酸(Ser)可能發(fā)生磷酸化的位點有11 個,蘇氨酸(Thr)可能發(fā)生磷酸化的位點有5 個,酪氨酸(Tyr)可能發(fā)生磷酸化的位點有4 個。利用TMHMM Server 2.0 在線預(yù)測珙桐DiZF-CCCH1基因編碼的氨基酸序列的跨膜結(jié)構(gòu)域(圖5B),發(fā)現(xiàn)其不存在跨膜結(jié)構(gòu),由此推測DiZF-CCCH1 蛋白不經(jīng)過跨膜轉(zhuǎn)運。
圖4 DiZF-CCCH1 蛋白的系統(tǒng)進(jìn)化分析Fig.4 Phylogentic analysis of DiZF-CCCH1
圖5 DiZF-CCCH1 磷酸化位點的預(yù)測和跨膜區(qū)域的預(yù)測Fig.5 Transmembrance domain prediction and phosphotylation site prediction of DiZF-CCCH1
2.3.4 二級結(jié)構(gòu)和三級結(jié)構(gòu)的預(yù)測
通過SOPMA 對DiZF-CCCH1 的二級結(jié)構(gòu)進(jìn)行預(yù)測,結(jié)果如圖6A所示。在其二維結(jié)構(gòu)組分中,α-螺旋(H)占13.50%,β-折疊(E)占17.30%,無規(guī)則卷曲(C)占68.78%,其他結(jié)構(gòu)占0.42%。無規(guī)則卷曲是該蛋白質(zhì)二級結(jié)構(gòu)中最大的結(jié)構(gòu)元件。運 用SWISS-MODEL(http://swissmodel.expasy.org/)在線軟件對DiZF-CCCH1 蛋白的三維結(jié)構(gòu)進(jìn)行預(yù)測,結(jié)果如圖6B 所示。
使用qRT-PCR 在珙桐各組織中對DiZFCCCH1基因的表達(dá)量進(jìn)行分析,結(jié)果表明,DiZF-CCCH1基因在種子中的表達(dá)量顯著高于其他組織,在小葉、大葉、生長點中表達(dá)量較低,在葉柄、小苞片、大苞片、花序和子房中表達(dá)量極低。種子中DiZF-CCCH1基因的表達(dá)量約為小葉的6 倍,約為大葉、生長點的15 倍,約為葉柄、小苞片、大苞片、花序和子房中的80 倍(圖7)。對珙桐種子不同發(fā)育階段DiZF-CCCH1基因的表達(dá)量進(jìn)行分析發(fā)現(xiàn),DiZF-CCCH1基因在種子發(fā)育各個時期中均有表達(dá),其中在發(fā)育前期種子中的表達(dá)量最高,約為在發(fā)育中期和后期種子中的2 倍,暗示該基因可能主要在種子發(fā)育前期發(fā)揮功能。
圖6 DiZF-CCCH1 蛋白的二級結(jié)構(gòu)和三級結(jié)構(gòu)的預(yù)測Fig.6 Prediction of secondary structure and three-dimensional structure of DiZF-CCCH1
圖7 DiZF-CCCH1 基因在不同組織中的表達(dá)水平Fig.7 Expression levels of DiZF-CCCH1gene in different tissues
本研究克隆了在珙桐種子中差異表達(dá)明顯的基因DiZF-CCCH1,序列分析發(fā)現(xiàn)該基因ORF 長度為711 bp,編碼236 個氨基酸,無內(nèi)含子。分析DiZF-CCCH1編碼蛋白的理化性質(zhì),發(fā)現(xiàn)DiZFCCCH1編碼的蛋白分子質(zhì)量為26.74 kDa ,理論等電點(PI)為9.02,包括3 656 個原子,分子式為 C1184H1770N352O337S13。蛋白的脂肪指數(shù)為47.20,親水指數(shù)為-0.664,不穩(wěn)定指數(shù)為44.24,為不穩(wěn)定蛋白,屬于植物特有的RR-TZF 蛋白。DiZFCCCH1 蛋白的系統(tǒng)進(jìn)化分析結(jié)果表明,DiZFCCCH1 與來源于甜橙Citrus sinensis的親緣關(guān)系最近。DiZF-CCCH1基因編碼的氨基酸序列可能發(fā)生磷酸化的位點有20 個且不存在跨膜結(jié)構(gòu),無規(guī)則卷曲是DiZF-CCCH1 二級結(jié)構(gòu)中最大的結(jié)構(gòu)元件。qRT-PCR 結(jié)果表明,DiZF-CCCH1基因在種子中的表達(dá)量顯著高于其他組織,在其他組織中僅有微量表達(dá),在種子發(fā)育前期的表達(dá)量最高約為發(fā)育中期和后期的2 倍,暗示該基因可能主要在種子發(fā)育前期發(fā)揮功能。
3.2.1 珙桐DiZF-CCCH1 結(jié)構(gòu)域分析
本研究從珙桐中克隆到一個編碼CCCH 型鋅指蛋白轉(zhuǎn)錄因子的基因DiZF-CCCH1,對該基因的核苷酸序列及其編碼產(chǎn)物進(jìn)行生物信息學(xué)分析,發(fā)現(xiàn)DiZF-CCCH1基因編碼的蛋白含有2 個C-X6-14- C-X4-5-C-X3-H 結(jié)構(gòu)域,并且在這2 個CCCH 結(jié)構(gòu)域的上游還含有一段富含精氨酸的50 多個氨基酸保守區(qū)C-X5-H-X4-C-X3-H,因此認(rèn)為該蛋白屬于RR-TZF 型鋅指蛋白。RR-TZF 是植物特有的一類TZF 蛋白,其在玉米、水稻、擬南芥、楊樹等基因組分布廣泛,玉米基因組中有68 個編碼CCCH 鋅指結(jié)構(gòu)蛋白的基因,分為7 個亞家族,其中有12 個基因編碼RR-TZF 蛋白[26];水稻中有67 個編碼TZF 蛋白的基因,分為8 個亞家族,其中有9 個基因編碼RR-TZF 蛋白[14];擬南芥中有68 個編碼TZF 蛋白的基因,分為11 個亞家族,其中有11 個基因編碼 RR-TZF 蛋白[14];楊樹含有91 個編碼TZF 蛋白的基因,分為13 個亞家族,其中有16 個結(jié)構(gòu)保守的RR-TZF 蛋白[27]。目前關(guān)于珙桐CCCH1基因及其功能還未見報道,因此對DiZFCCCH1功能的研究有利于豐富對CCCH 型鋅指蛋白功能的認(rèn)識。
3.2.2DiZF-CCCH1 在珙桐種子中的特異性表達(dá)
有研究發(fā)現(xiàn),CCCH 型鋅指蛋白可參與植物種子發(fā)育,例如:擬南芥AtTZF4、AtTZF5、AtTZF6在種子中特異表達(dá),并且參與種子的萌發(fā),對種子的萌發(fā)調(diào)節(jié)至關(guān)重要[18];擬南芥的PEI1是胚胎特異性轉(zhuǎn)錄因子,主要在胚胎頂端區(qū)域發(fā)揮作用,參與胚的發(fā)育[28]。本研究分析DiZF-CCCH1表達(dá)模式,發(fā)現(xiàn)其在種子發(fā)育前期的表達(dá)量最高,后期表達(dá)量降低,在其他組織中僅有微量表達(dá),并且該基因是珙桐種子中差異表達(dá)顯著的一個基因,意味著該基因可能在種子發(fā)育中具有一定的功能。本研究對珙桐DiZF-CCCH1基因的克隆與表達(dá)分析,為研究該基因在珙桐種子發(fā)育過程中的功能鑒定奠定了基礎(chǔ),對珙桐DiZF-CCCH1基因進(jìn)行的生物信息學(xué)分析,為后續(xù)驗證DiZF-CCCH1基因的功能提供了參考,但該基因的功能及調(diào)控機制尚不明確。下一步將通過載體構(gòu)建和遺傳轉(zhuǎn)化擬南芥,以期明確DiZF-CCCH1的具體功能。