周艷 莫雨杏 劉淑藝 李衛(wèi)錦 黎海利 劉鍇棟
關鍵詞:番荔枝;生長素響應因子;生物信息學分析;花發(fā)育;表達分析
中圖分類號:S667.9 文獻標識碼:A
番荔枝(Annona squamosa L.),也稱為釋迦果,屬番荔枝科植物,是熱帶、亞熱帶地區(qū)的著名水果,分布于福建、廣西、廣東、海南、云南等地[1]。由于番荔枝的葉柄抱嵌著葉芽,所以葉片不脫落,葉芽則無法萌發(fā)[2-3]。番荔枝的花具有雌雄異熟且雌蕊先熟的特點,常常出現(xiàn)花發(fā)育異常和畸形花現(xiàn)象,導致“花而不實”、結果率低等問題,從而限制了番荔枝產業(yè)的發(fā)展[4-6]。
生長素響應因子(auxin response factor, ARF)位于生長素信號傳遞途徑中的核心位置,能夠通過調控生長素信號,以調控生長素相應基因的表達,從而影響植物的生長發(fā)育[7-8]。ARF 基因一般以基因家族的形式存在,通常有3 個經典的蛋白保守結構域:DNA 結合結構域(DBD),中間結構域(MR)和C 末端二聚化結構(CTD)[8]。ARF 通過識別并且結合位于生長素響應基因啟動子中的生長素響應元件AuxREs(TGTCTC),抑制或激活下游響應基因的表達[9],并且ARF 能夠通過與AUX/IAA 形成二聚體,影響ARF 蛋白質間的相互作用[8]。近年來,越來越多的ARF 被報道可能參與了植物花的發(fā)育。番茄SlARF1、SlARF9、SlARF11、SlARF15 和SlARF16 參與調控花的發(fā)育,均在花發(fā)育過程中表達,且SlARF16在花芽中表達量最高[10]。番茄SlARF2 在花蕾中具有最高的表達量,但是不影響花的形成[11]。果梅中PmARF11 基因在轉基因煙草的花瓣中具有高表達水平,且顯著影響花瓣顏色、邊緣深裂和萼片變化,由此可以預測PmARF11 基因在花瓣發(fā)育過程發(fā)揮重要作用[12]。黃瓜CsARF10b 和CsARF10c 在雌花中不顯著表達,在雄花中表達水平較高,預測CsARF10b 和CsARF10c 基因能夠調控雄花發(fā)育[13]。在番木瓜中,CpARF1、CpARF2、CpARF4、CpARF5 和CpARF10 基因在花發(fā)育的早期高表達,隨后則呈現(xiàn)下降趨勢,而CpARF6的表達則隨著花發(fā)育的進程不斷上升[8]。雖然番荔枝的全基因組測序尚無報道,但是由于轉錄組測序技術的快速發(fā)展為研究番荔枝ARF 基因家族提供了良好的平臺。
本課題組前期對番荔枝花發(fā)育4 個時期進行了轉錄組測序,獲得71 948 條unigenes 序列信息,平均長度為825.4 bp,將獲得的unigenes 序列與已知數(shù)據(jù)庫進行比對,共有24 911 條unigenes 被注釋到[14]。本研究基于此數(shù)據(jù)庫,在轉錄組層面利用生物信息學方法對番荔枝ARF 家族基因成員進行鑒定,分析番荔枝ARF 家族蛋白的系統(tǒng)進化、理化性質、亞細胞定位、二級三級結構等,并通過qRT-PCR 分析番荔枝ARF 家族基因在花發(fā)育不同階段和畸形花中的表達,為今后番荔枝ARF 家族基因的克隆和功能研究,深入探索番荔枝ARF 家族基因調控花發(fā)育的機制奠定基礎,有助于解決番荔枝產業(yè)上出現(xiàn)的“花而不實”、結果率低等問題。
1 材料與方法
1.1 材料
番荔枝(Annona squamosa L.)種植于嶺南師范學院熱帶果樹試驗地,常規(guī)栽培管理。于2018年7 — 8 月分別采摘花芽期( I , 1 mm<花芽<2 mm)、花蕾期(II,5 mm<花蕾<6 mm)、開花前期(III,花瓣輕微張開)、開花期(IV,花瓣張開)4 個階段的花。于2019 年7—8 月分別采摘正常的花蕾(NF)和畸形的花蕾(MF)。不同花的材料重復3 次,取樣后立即用液氮速凍后保存于–80 ℃冰箱儲存?zhèn)溆谩?/p>
1.2 方法
1.2.1 RNA 提取與轉錄組測序 把1.5 mL 離心管放置冰上預冷,分別加入1 mL TRNzol 液,搖勻后加入氯仿/異戊醇混合液200 μL、巰基乙醇8 μL,將研磨得到的(花芽期、花蕾期、開花前期、開花期)花樣品各100 mg 加入上述離心管中。
將樣品震蕩混合, 在4 ℃下, 12 000×g 離心10 min。取上清液750 μL,加入等體積的水飽和酚/氯仿/異戊醇,震蕩混勻,在4 ℃下,12 000×g離心10 min。重復上述步驟2 遍。取上清液650 μL,加入等體積異丙醇,65 μL 醋酸鈉溶液,置于–20 ℃,沉淀30 min。冰浴后的樣本,在4 ℃下,12 000×g 離心20 min,棄上清液,加入500 μL75%乙醇,洗滌沉淀,離心10 min,并重復2 遍。洗滌后的樣本,吸干乙醇,自然晾干后備用。
建庫用的RNA 需除去污染DNA。方法如下:加入42 μL RNA-free 的DNA 酶,直至全部溶解。在37 ℃水浴消化30 min 后,再加入550 μL 的RNA-free 水至600 μL,在加入水飽和酚/氯仿/異戊醇沉淀,離心棄上清液。重復上述洗滌步驟。RNA 充分溶解后,稀釋10 倍,進行1%瓊脂糖凝膠電泳,檢測RNA 質量。
番荔枝花發(fā)育不同階段(花芽、花蕾、開花前期、開花期)轉錄組數(shù)據(jù)由基迪奧生物公司進行測序獲得,后續(xù)分析基于此測序結果數(shù)據(jù)。
1.2.2 番荔枝ARF 的系統(tǒng)進化分析 利用GeneStructure Display Server ( http://gsds.cbi.pku.edu.cn/index. Php)在線軟件對基因結構進行分析。擬南芥ARF 基因序列從生物信息資源網站TAIR( https://www. arabidopsis.org/ ) 直接下載。使用MEGA7.0(https://www.megasoftware.net/mega5)、TreeView1.6(http://www.brc.dcs.gla.ac.uk/ser-vices/)在線軟件預測蛋白結構域,并通過鄰接法,校驗參數(shù)(bootstrap)設置為1000,構建系統(tǒng)進化樹。使用ClustalW(http://www.ebi.ac.uk/Tools/msa/clustalw2/)對ARF 蛋白氨基酸進行多重序列比對。
1.2.3 番荔枝ARF 基因家族理化性質及蛋白結構分析 利用在線軟件Prot Param(http://web.expasy.org/protparam/)分析預測番荔枝ARF 蛋白序列的分子量、等電點、不穩(wěn)定系數(shù)、脂肪指數(shù)和疏水性等基本的理化性質。利用在線軟件Prabi(NPS@:SOPMA secondary structure prediction,https://npsa- prabi.ibcp.fr/cgi-bin /npsa_automat.pl?page=npsa_sopma.html)對ARF 蛋白質序列進行二級結構α-螺旋、延伸鏈、β-轉角、無規(guī)則卷曲進行預測。利用在線軟件SWISS-MODEL(https://swissmodel. expasy.org/)對ARF 蛋白質序列進行三級結構分析。利用在線軟件NCBI 的CD-search( https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析番荔ARF 家族蛋白的保守結構域。利用MEGA 7.0 軟件分析ARF 中間結構域(MR)的氨基酸組成。
1.2.4 番荔枝ARF 蛋白的亞細胞定位分析 利用在線軟件SoftBerry ( http://linux1.softberry.com/berry.phtml?topic=protcomppl&group=prgrams&subgroup=proloc)對ARF 蛋白進行亞細胞定位分析。同時將得到的AsARF2 、AsARF3a 和AsARF6a 全長序列編碼區(qū)CDS 序列克隆到pCAMBIA1302-35S-GFP 載體中。使用pCAMBIA1302- 35S-GFP 空載體為陰性對照。將構建完畢的載體和GFP 空載體轉化農桿菌GV3101 感受態(tài)細胞,挑取單克隆菌落,進行PCR驗證,并通過搖床大量培養(yǎng)。以陽性克隆擴增后的菌液注射本氏煙煙草葉片。以培養(yǎng)48 h 后的煙草葉片制作臨時裝片,在激發(fā)光波長為488 nm 和發(fā)射光波長為625~725 nm 的條件下用激光共聚焦顯微鏡下進行熒光信號檢測。觀察產生的綠色熒光在煙草表皮細胞內的分布情況。
1.2.5 番荔枝ARF 家族基因在花發(fā)育中的表達分析 分別提取番荔枝花發(fā)育4 個階段花器官、正常花以及畸形花的總RNA,逆轉錄成cDNA,以實時熒光定量PCR 技術檢測AsARF 家族基因的表達。按照SYBR?Premix Ex TaqTM操作,以AsActin 為內參基因,在熒光定量PCR 儀上進行PCR 擴增,檢測基因的表達量。反應條件:96 ℃1 min,95 ℃ 15 s,55 ℃ 30 s,72 ℃ 45 s,共40次循環(huán)。每個樣品重復3 次。反應結束后分析熒光值變化曲線和熔解曲線。相對定量分析采用比較Ct 法,目的基因的相對表達水平為2–ΔΔCT。具體引物信息見表1。
1.3 數(shù)據(jù)處理
使用SPSS 17.0 軟件對數(shù)據(jù)進行單因素方差分析(ANOVA)和差異顯著性檢驗(Duncans 法)。
2 結果與分析
2.1 番荔枝ARF 家族基因的鑒定及系統(tǒng)進化分析
基于番荔枝花發(fā)育不同階段轉錄組測序數(shù)據(jù),在NR、NT、Swiss-Prot 和PFAM 4 個數(shù)據(jù)庫進行注釋,初步注釋到18 個ARF 轉錄因子相關基因,通過NCBI Blast 和SMART 軟件預測,去除重復序列及冗余轉錄本后,最終得到11 個ARF轉錄因子。
為了研究番荔枝11 個ARF 蛋白家族的進化關系與功能,利用MEGA7.0 軟件構建番荔枝和擬南芥ARF 蛋白家族的系統(tǒng)進化樹,根據(jù)進化樹將2 個物種的ARF 家族蛋白進行聚類分析,共分為5 組(圖1A)。對于番荔枝來說,第1 組包括1 個AsARF 基因家族成員(AsARF2),占基因家族成員總數(shù)的9.09%;第2 組包括2 個AsARF 基因家族成員(AsARF3a、AsARF3b),占基因家族成員總數(shù)的18.18%;第3 組包括3 個AsARF 基因家族成員(AsARF5a、AsARF5b、AsARF7),占基因家族成員總數(shù)的27.27%;第4 組包括4 個AsARF 基因家族成員(AsARF6a、AsARF6b、AsARF6c、AsARF6d),占基因家族成員總數(shù)的36.36%;第5 組包括1 個AsARF 基因家族成員(AsARF7),占基因家族成員總數(shù)的9.09%。
進一步分析表明,大部分AsARF 包含3 個經典的結構域,分別是DNA 結合結構域(DBD)、中間區(qū)域結構域(MR)和C-末端二聚化結構域(CTD)。AsARF3a、AsARF6a 和AsARF6b 只含有DNA 結合結構域和中間區(qū)域結構域,不含有C-末端二聚化結構域,其他AsARF 均含有3 個完整的結構域(圖1B)。
通過ClustalW 軟件進行比對,如圖2 所示,可以得出大部分ARF 蛋白家族包含3 個特有的保守結構域,即DNA 結合結構域(DBD)、中間區(qū)域結構域(MR)、C-末端二聚化結構域(CTD),證實上述蛋白序列具有極高的序列相似度。
2.2 番荔枝ARF基因家族理化性質分析
如表2 所示,番荔枝ARF 家族成員理論分子量在73.85~112.51 kDa 之間, 氨基酸數(shù)量在677~1007 aa 之間,等電點分布在5.42~7.63 之間,11 個ARF 蛋白的平均等電點為6.28。有8 個番荔枝ARF 蛋白呈酸性,3 個番荔枝ARF 蛋白呈堿性,預測在酸性亞細胞環(huán)境中,大部分番荔枝ARF蛋白才會發(fā)揮作用。11 個番荔枝ARF 蛋白的脂肪系數(shù)大小在62.66~77.1 之間;番荔枝ARF 蛋白親水系數(shù)大小在–0.648~0.351 之間,屬于親水性蛋白;所有ARF 的不穩(wěn)定系數(shù)均大于40,預測番荔枝ARF 蛋白為不穩(wěn)定蛋白。
番荔枝ARF 家族蛋白二級結構中,-螺旋和無規(guī)則卷曲所占比例比較大,所占比例從大到小排序:無規(guī)則卷曲>-螺旋>延伸鏈>-轉角。采用SWISS-MODEL對番荔枝ARF 蛋白三級結構進行分析,結果表明番荔枝ARF 蛋白主要由無規(guī)則卷曲、-螺旋、-轉角等構成三級結構(圖3)。
2.3 番荔枝ARF 蛋白的氨基酸組成及分類
番荔枝AsARF 蛋白的氨基酸組成如圖4A 所示,絲氨酸、谷氨酰胺、脯氨酸、亮氨酸、甘氨酸等在AsARF 蛋白中的含量較高。根據(jù)中間區(qū)域結構域(MR)的氨基酸組成和是否存在C-末端二聚化結構域(CTD),可以把11 個AsARF 分為三類(圖4B)。第1 類包括DNA結合結構域(DBD)和CTD 結構域,MR 結構域為激活域(AD)的AsARF 蛋白, 包括AsARF5a 、AsARF5b 、AsARF6c、AsARF6d、AsARF7 和AsARF16;第2 類包括DBD 結構域和CTD 結構域,MR 結構域為抑制域(RD)的AsARF 蛋白,包括AsARF2和AsARF3b;第3 類包括DBD 結構域,MR 結構域為RD 抑制域,且缺乏CTD 結構域的AsARF蛋白,包括AsARF3a、AsARF6a 和AsARF6b。
2.4 亞細胞定位分析
轉錄因子通過與靶基因的啟動子元件相結合,調節(jié)靶基因的轉錄表達,通常定位于細胞核中。通過在線軟件SoftBerry 分析亞細胞定位,結果如表3 所示,11 個番荔枝ARF 蛋白都為潛在的細胞核定位蛋白。隨機選取AsARF2、AsARF3a和AsARF6a 構建亞細胞定位載體,利用農桿菌介導的轉化技術浸潤本氏煙煙草葉片,在激光共聚焦顯微鏡下對綠色熒光信號(GFP)進行觀察。結果顯示,AsARF2、AsARF3a 和AsARF6a 蛋白都定位在細胞核中(圖5)。這一結果表明,轉錄因子AsARF 蛋白具有細胞核定位的特征。
2.5 番荔枝ARF 基因家族在花發(fā)育不同階段的表達分析
通過qRT-PCR技術分析了AsARF 基因在花發(fā)育4 個階段的基因表達模式,結果表明AsARF3a、AsARF3b 、AsARF5a 、AsARF5b 、AsARF6a 和AsARF7 在花芽期表達量高,在花蕾期、開花期、開花前期的表達量呈下降趨勢。AsARF2 和AsARF6b 的表達量在花蕾期比較高,在開花前期和開花期呈下降趨勢。此外,AsARF6c 和AsARF6d在整個開花前期表現(xiàn)出較高的表達水平。而AsARF16 在花芽期和開花期呈現(xiàn)高表達(圖6)。
2.6 番荔枝ARF 基因家族在正?;ê突位ㄖ械谋磉_分析
利用qRT-PCR分析AsARF 基因在番荔枝正?;ê突位ㄖ械谋磉_, 結果發(fā)現(xiàn), AsARF2、AsARF3a、AsARF5a、AsARF5b、AsARF6b、AsARF6c和AsARF16 基因在正常花中呈現(xiàn)高表達,而AsARF3b、AsARF6a、AsARF6d、AsARF7 則在畸形花中表達量更高(圖7)。
3 討論
生長素作為一類植物生長發(fā)育相關的重要激素,而其中生長素響應因子ARF 是為植物生長素響應的關鍵調節(jié)因子之一,也是核心的正負調控因子[9, 15]。通過對植物的ARF 家族進行鑒定分析,有助于深入研究ARF 在植物生長發(fā)育各個環(huán)節(jié)的調控機制。近年來,隨著基因組測序技術的不斷推進,為基因家族分析提供了很大的便利性。但是番荔枝作為熱帶亞熱帶地區(qū)著名果樹[1-2, 14],其基因組序列還未得到測序解析,這在很大程度上限制了控制其重要性狀基因的研究。因此從轉錄組測序數(shù)據(jù)獲得相關基因家族成員成為研究的熱點之一。
目前在番茄中發(fā)現(xiàn)了17 個ARF 家族成員[11]、黃瓜中18 個[16]、蘋果中29 個[17]、番木瓜中11個[8]。本研究基于番荔枝花發(fā)育不同階段轉錄組測序數(shù)據(jù),篩選并鑒定出番荔枝ARF 轉錄因子家族成員11 個。系統(tǒng)進化分析顯示番荔枝和擬南芥的ARF 形成6 對旁系同源基因對,這為研究番荔枝ARF 基因功能提供了有價值的信息。生物信息學分析顯示番荔枝ARF 蛋白的蛋白特性、氨基酸長度有較大差異,說明番荔枝ARF 家族蛋白的特性不一,可能具有多樣化的生物學功能。本研究鑒定的番荔枝AFR 蛋白大部分含有3 個保守結構域,分別是DNA 結合結構域(DBD)、中間區(qū)域結構域(MR)和C-末端二聚化結構域(CTD),但AsARF3a、AsARF6a 和AsARF6b 等3 個成員僅有2 個保守結構域,CTD 結構域缺失,上述特性與前人研究的番木瓜、荔枝等[8, 18-19]ARF 家族蛋白的性質一致。研究表明,DBD 結構域具有DNA 結合活性,可以與生長素反應基因啟動子上的作用元件結合,進而通過與MR 結構域激活或抑制相關基因的表達。CTD 結構域是一個介導蛋白質–蛋白質互作的結構域,另一個在生長素信號途徑中起抑制作用的AUX/IAA 蛋白中也具有類似結構域,2 個蛋白可以通過該結構域的互作而形成ARF-ARF、ARF-Aux/IAA 和 Aux/IAA-Aux/IAA同源或異源寡聚體[8-9]。但番荔枝中AsARF3a、AsARF6a 和AsARF6b 的CTD 結構域缺失的ARF功能如何還有待進一步研究。
對番荔枝ARF 編碼蛋白二級結構進行預測后發(fā)現(xiàn),該基因編碼的蛋白質中無規(guī)則卷曲所占比例最大,其次是-螺旋;在蛋白質三級結構中,發(fā)現(xiàn)番荔枝ARF 編碼蛋白為多鏈折疊蛋白,以無規(guī)則卷曲為主,這與石榴和水仙[18-19]ARF 編碼蛋白的二級、三級結構預測結果基本一致。根據(jù)ARF蛋白MR 的氨基酸組成,可以預測ARF 為轉錄抑制子或轉錄激活子。前人研究發(fā)現(xiàn)AtARF1、AtARF2、AtARF3、AtARF4 和AtARF9 蛋白非保守的中間區(qū)域富含甘氨酸(G)、絲氨酸(S)、亮氨酸(L)和脯氨酸(P)殘基,能夠發(fā)揮轉錄抑制作用,為轉錄抑制子,而AtARF5-8 和AtARF19中間區(qū)域富含谷氨酰胺(Q)、絲氨酸(S)和亮氨酸(L)殘基,發(fā)揮轉錄激活作用,為轉錄激活子[20-22] 。本研究中, AsARF5a 、AsARF5b 、AsARF6c、AsARF6d、AsARF7 和AsARF16 蛋白的中間區(qū)域富含Q、S、L,推測這6 個蛋白可能為轉錄激活子。而AsARF2、AsARF3a、AsARF3b、AsARF6a 和AsARF6b 這5 個蛋白推測為轉錄抑制子。但是番荔枝ARF 家族基因中是促進或抑制生長素響應基因表達的具體功能分析還有待進一步探究。
亞細胞定位預測結果顯示,番荔枝ARF 蛋白主要定位在細胞核中,具有轉錄因子的定位特征。對AsARF2、AsARF3a 和AsARF6a 蛋白的亞細胞定位試驗結果也顯示,AsARF2、AsARF3a 和AsARF6a 蛋白定位于細胞核,這與其他物種ARF蛋白定位[23-24]基本一致。
ARF 家族基因在花發(fā)育的過程中也發(fā)揮著重要的作用,擬南芥的AtARF2、AtARF5 可以調節(jié)雌性和雄性配子體發(fā)育[25],AtARF2 突變體表現(xiàn)出延遲開花的表型[26]。本研究中AtARF2 的同源基因AsARF2 主要在花蕾期表達,AtARF5 同源基因AsARF5a 、AsARF5b 主要在花芽期表達, 且AsARF2、AsARF5a 和AsARF5b 三個基因在正?;ㄖ械谋磉_顯著高于畸形花, 推測番荔枝AsARF2、AsARF5a 和AsARF5b 具有調控早期花發(fā)育和花器官的正常發(fā)育的功能。此外,有研究報道擬南芥中AtARF3 在花發(fā)育早期起到顯著的作用[27]。番荔枝中AsARF3a 和AsARF3b 兩個基因的表達主要集中在花芽期,這說明AsARF3a 和AsARF3b 很可能也參與了早期花發(fā)育。在擬南芥中AtARF6 還被證實能夠促進雄蕊花絲伸長、花藥開裂和雌核成熟[28]。在其他物種中, 多個AtARF6 的同源基因得到了鑒定, 如辣椒CaARF6A、CaARF6B、CaARF6C,它們被證明參與了調控花發(fā)育與成熟過程[29]。在本研究中,AsARF6a 主要在花芽期高度表達,AsARF6b、AsARF6c 和AsARF6d 則多集中于花蕾期和開花前期表達,這在客觀上證實了番荔枝這幾個同源基因在維持花器官發(fā)育中起到一定的作用。同時AsARF6b、AsARF6c 在正?;ㄖ斜磉_量高,而AsARF6a、AsARF6d 在畸形花中表達量更高,說明它們在花的正常發(fā)育中的具體功能可能不同。
4 結論
ARF 家族在植物生長和發(fā)育的整個過程中都發(fā)揮著重要的作用,本研究基于番荔枝花發(fā)育不同階段轉錄組研究為背景,對ARF 家族基因進行篩選、生物信息學和表達模式分析。但由于番荔枝基因組數(shù)據(jù)缺乏和轉錄組測序的局限性,更多番荔枝ARF 家族基因還有待進一步挖掘鑒定,同時將來需要進行轉基因試驗等進行深入的功能驗證分析,以揭示ARF 家族基因在花的正常發(fā)育中的具體功能。本研究結果為進一步了解番荔枝中ARF 轉錄因子家族成員調控花發(fā)育的相關機制奠定基礎,并為解決番荔枝產業(yè)上出現(xiàn)的“花而不實”、結果率低等問題提供研究思路。