国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

蓖麻miR396基因家族及其靶基因GRF生物信息學分析及鑒定

2022-05-13 08:26邢海彥唐杰松于聳鄭志民
中國油料作物學報 2022年2期
關鍵詞:蓖麻擬南芥結構域

邢海彥,唐杰松,于聳,,鄭志民*

(1.東北林業(yè)大學生命科學學院,東北 鹽堿植被恢復與重建教育部重點實驗室,黑龍 江哈爾濱, 150040;2.東北林業(yè)大學林學院,林木 遺傳育種國家重點實驗室,黑龍 江哈爾濱, 150040)

MicroRNAs(miRNAs)是一類真核生物體內普 遍存在的內源性非編碼小RNA,一般由21~22 個核苷酸組成。植物中的miR396高度保守,很多植物的miR396家族已經被鑒定,如擬南芥,水稻,番茄,大豆,楊樹,煙草,小麥等[1~7]。miRNA 在轉錄后水平通過剪切或翻譯抑制對其靶基因進行調控。植物中miR396主要靶基因是GRF轉錄因子家族,GRF是一類生長調節(jié)因子。GRF的N端由兩個高度保守的結構域組成——QLQ 和WRC[8,9]。其中miR396 可識別GRF 的mRNA 上與之互補的序列,更準確的說是編碼WRC 的最后一個氨基酸[10~12]。WRC 具有核定位信號,其特征是具有Trp-ArCys 基序和Cys 和His 殘基的鋅指狀間隔(CX9CX10CX2H)[8~14]。另一個保守的QLQ 結構域含有芳香疏水性氨基酸結構,與酵母的SWI/SNF 的N端部分相似,介導了GRF和GIF(GRF-Interacting Factor)的結合[15,16]。番茄降解組分析發(fā)現(xiàn),8個番茄GRF成員可被miR396剪切[17]。

先前的研究表明,miR396及其靶基因GRF參與調節(jié)細胞增殖[16],葉片大小[18],葉形態(tài)發(fā)生[19],細胞分裂[20],花器官發(fā)育[21],種子大小[22],根生長[23]等。據(jù)報道,在擬南芥中過表達miR396a不僅會導致花瓣和雄蕊數(shù)目均減少,表型嚴重時雌蕊由兩心皮變?yōu)閱涡钠ぃ視斐蓴M南芥角果變小[24]。在擬南芥中超表達miR396b,葉面積明顯變小,細胞數(shù)目減少。當GRF上miR396的靶位點發(fā)生突變時(rGRF突變,通常設計為同義突變),miR396將不能識別rGRF,擬南芥葉面積明顯增大,細胞數(shù)目増多,細胞面積基本不變[16]。大籽粒秈稻與小籽粒粳稻進行雜交后,Duan 等發(fā)現(xiàn)一個非常重要的QTL--GS2,編碼轉錄因子OsGRF4,秈稻中的GS2在OsmiR396g/h/i的靶位點處突變了2個堿基,堿基由TC變成了AA,OsmiR396g/h/i對GS2AA的抑制作用解除。在粳稻ZH11超表達GS2AA后,OsGRF4表達上調,ZH11籽粒明顯變大[25]。

miR396及其靶基因GRF不僅在植物生長發(fā)育過程中發(fā)揮重要作用,它還參與響應植物的生物脅迫和非生物脅迫[1,3,26~29]。干旱脅迫下,過表達miR396可提高擬南芥和煙草的存活率[1,3,30~31]。當受到紫外線UV-B 的照射時,miR396表達被誘導,而其靶基因AtGRF1、AtGRF2和AtGRF3表達下調,葉面積減小。過表達miR396和特定的grf突變可導致水稻[32]、煙草[3]和擬南芥對病原體更加敏感,而rGRF/GRF的過表達則增強了擬南芥和水稻對真菌和細菌病原體的抗性[31,33]。

蓖麻(Ricinus communisL.),大戟科蓖麻屬單屬種植物,雙子葉,一年生草本或多年生木本植物,其種子含油量可達45%~54%[34]。蓖麻油為世界十大油料和四大不可食用的油料之一,酸值低、粘度大、比重高(0.958~0.968 g/cm3)、燃點高(322℃以上)、凝固點低(-18℃以下),是具有雙鍵的十八碳羥基脂肪酸的唯一來源,享有“生物石油”的美譽。蓖麻具有耐旱、耐脊薄、耐鹽堿等突出特點,因而適宜作為生物柴油原料[35]。但目前關于蓖麻中miR396 家族和其靶基因GRF家族的研究還未見報道。本研究中,我們在蓖麻基因組中鑒定了4 個miR396家族成員和11個GRF家族成員,并分析了GRF的系統(tǒng)發(fā)育關系,染色體分布和進化關系。同時利用RNA-seq數(shù)據(jù),對GRF基因家族成員的表達模式進行了分析,為后續(xù)深入研究蓖麻中miR396-GRF 的生物學功能奠定了基礎。

1 材料與方法

1.1 蓖麻miR396的預測

蓖麻全基因組數(shù)據(jù)由本實驗室測序組裝完成。從miRBase 數(shù)據(jù)庫(http://www. mirbase. org/ftp. shtml/)下載所有miRNA 成熟序列,篩選出所有植物中miR396成熟序列。將蓖麻基因組與所有植物中miR396成熟序列進行blastp(https://blast.ncbi.nlm.nih. gov/Blast. cgi)比對,篩選出錯配堿基數(shù)小于等于3 的相似序列[36,37]。將獲取的相似序列剔除重復位置,通過TBtools 工具(https://github. com/CJChen/TBtools)獲取相似序列上下游各200 bp的一段序列,作為候選的RcmiR396前體序列。根據(jù)miRNA二級結構特征,利用UNAFold(http://unafold.rna.albany. edu/? q=mfold/RNA-Folding-Form)在 線 工具,對候選RcmiR396前體序列進行二級結構的預測,去除無典型發(fā)卡結構的序列,從而獲得蓖麻miR396家族成員。

1.2 蓖麻GRF基因家族成員的預測

從PlantTFDB 數(shù)據(jù)庫(http://planttfdb. cbi. pku.edu.cn/)下載擬南芥的GRF轉錄因子蛋白序列。將蓖麻注釋蛋白序列與擬南芥GRF 蛋白序列進行blastp(https://blast. ncbi. nlm. nih. gov/Blast. cgi)比對,獲取E-value<e-5相似序列[38]。使用Pfam 在線分析工具(http://pfam.xfam.org/)進一步驗證,去除不完整GRF 結構域序列,從而獲得蓖麻GRF 轉錄因子家族成員。使用ExPASy(https://web. expasy. org/compute_pi/)在線工具預測RcGRF 蛋白的等電點(pI)和相對分子質量(MW)。

1.3 RcmiR396與靶基因RcGRF的作用位點分析

將RcGRF的基因序列和RcmiR396 的成熟序列輸入到在線靶位點分析軟件psRNATarget(http://plantgrn.noble.org/psRNATarget/)中,分析兩者的作用位點。

1.4 蓖麻GRF轉錄因子家族系統(tǒng)進化分析

為了進一步探究蓖麻GRF 轉錄因子家族成員在基因組內和在基因組間的進化關系,從PlantTFDB 數(shù)據(jù)庫下載擬南芥、大豆、水稻、毛果楊和木薯的GRF 轉錄因子蛋白序列,構建系統(tǒng)發(fā)育樹。用MEGA 10.0 自帶的ClustalW 工具分別對包括蓖麻在內的84 個GRF 蛋白序列(擬南芥9 個,大豆21 個,木薯17 個,毛果楊14 個,水稻12 個)進行多序列比對,采用了基于bootstrap 抽樣的鄰接法(neighbor—joining,NJ),重復值設定為1000。并且通過MEGA 10.0 對蓖麻GRF 蛋白序列進行多序列比對,構建進化樹,輔助分析基因結構和保守基序、順式作用元件。

1.5 蓖麻GRF轉錄因子家族的結構與保守基序分析

從蓖麻基因注釋信息GFF 文件中獲取蓖麻GRF 的CDS 序列序列,使用TBtools 工具(https://github.com/CJ-Chen/TBtools)將其轉換為蛋白序列,通過NCBI CDD-search 在線工具對GRF家族成員的保守結構域進行預測,獲取其保守結構域和位置信息。同時將蓖麻GRF 蛋白序列上傳至MEME-5.0.4 在線分析工具(http://meme-suite. org/),預測其保守基序,參數(shù)為默認值,最后將二者合并,通過TBtools工具對其進行可視化展示[39]。

1.6 蓖麻GRF轉錄因子家族啟動子順式作用元件分析

利用TBtools 工具,從蓖麻基因組注釋文件中提取蓖麻GRF家族基因起始密碼子ATG 上游2 kb 作為潛在的啟動子區(qū)域,將上述啟動子區(qū)域序列提交至PlantCARE 工具(http://bioinformatics. psb. ugent.be/webtools/plantcare/html/),預測該區(qū)域存在的順式作用元件,篩選保留其中的生長調控、激素和非生物脅迫響應元件(包括:ACE、LTR、TCA-element、ABRE、ARE、AuxRR-core、RY-element、CGTCA-motif、TGACG-motif、O2-site、GCN4_motif、TATA-box、GARE-motif、P-box、AACA_motif、MBS、MBSI、MRE)進行分析和展示。

1.7 蓖麻GRF家族基因的表達模式分析

采用FPKM(fragments per kilobases per millionfragments)衡量基因的表達水平,篩選出RcGRF 基因,通過TBtools實現(xiàn)基因表達層次聚類。

2 結果與分析

2.1 蓖麻miR396家族的預測

通過多序列比對,獲得了105 個非冗余的蓖麻miR396 成熟序列候選序列。通過對105 個候選序列的二級結構預測,得到了4 個RcmiR396 家族成員,分別命名為RcmiR396a、b、c、d,如圖1 所示,4 個RcmiR396 均具有經典的發(fā)卡結構。如表1 所示,RcmiR396序列較為保守。

表1 RcmiR396基因家族的成熟序列及其在染色體上的位置Table 1 Mature sequence of RcmiR396 gene family and their location in chromosome

圖1 RcmiR396家族成員的二級結構預測Fig.1 Secondary structure predictions of RcmiR396 family

2.2 蓖麻miR396靶基因GRF家族成員的鑒定和命名

通過blastp 序列比對與Pfam 保守結構域驗證,共獲得11 個蓖麻GRF家族基因(表2),根據(jù)他們在染色體上的位置,分別命名為RcGRF1—RcGRF11。這11個GFR基因均包含完整的WRC和QLQ保守結構域,其中RcGRF5上存在兩個WRC 結構域,他們的蛋白質長度在318~619 aa 之間,理論等電點在5.54~9.34 之間,分子量最小為35 179.57 Da,最大值則為67 639.97 Da,由此可見,蓖麻GRF在基因結構相對保守的情況下,理化性質又各不相同,這可能暗示著蓖麻GRF不盡相同的功能。

表2 鑒定的11個RcGRF家族成員Table 2 List of 11 RcGRF genes identified

2.3 蓖麻miR396 與其靶基因RcGRF 作用位點的分析

根據(jù)在線工具預測,結果如表3 所示,RcmiR396a,b 靶向相同的6 個RcGRF成員(RcGRF2、3、4、6、8、11),RcmiR396d 則可以靶向其余5 個GRF成員,RcmiR396c 僅靶向RcGRF3。同時,蓖麻GRF 家族成員的靶點大多位于外顯子區(qū)和3′UTR區(qū),僅Rc?GRF3的靶點在內含子區(qū),這也與在水稻中的研究一致。

表3 RcmiR396的靶基因Table 3 Target genes of RcmiR396

2.4 蓖麻GRF 轉錄因子家族的系統(tǒng)發(fā)育分析和分類

通過構建來自五種植物GRF 蛋白序列的系統(tǒng)進化樹,分析GRF 基因家族間進化關系。結果如圖2 所示,84 個基因聚類為5 個亞族,蓖麻GRF 在五個亞族中均有分布,擬南芥中的GRF 分布在第II、III、IV、V 亞族中,水稻中的GRF 分布在第I、II、III、V 類中,并且IV 亞族中GRF 成員均來自于雙子葉植物,表明亞族II、III、V 亞族在單子葉雙子葉分化之前已經存在,在單子葉分化之后產生了IV 亞族,而Rc-GRF 在IV 亞族分布最多,這也說明了蓖麻在進化上與同屬雙子葉植物的大豆、木薯、毛果楊進化關系更為緊密。如圖3 所示,蓖麻GRF 轉錄因子每個亞家族成員間WRC 和QLQ 結構域氨基酸序列相對保守。不僅如此,RcGRF2 和3 在C 端包含F(xiàn)FD、TQL和GGPL 結構域,RcGRF6、8、10 則分別包含了部分的結構域。

圖2 RcGRF基因家族的系統(tǒng)發(fā)育分析Fig.2 Phylogenetic analysis of RcGRF gene family

圖3 RcGRF家族成員保守結構域WRC和QLQ的氨基酸序列比對Fig.3 Alignment of multiple RcGRF WRC and QLQ domain amino acid sequences

2.5 蓖麻GRF轉錄因子家族的基因結構分析

為進一步探究RcGRF基因結構特征,本研究中闡明了該家族基因的內含子數(shù)量、外顯子個數(shù)和保守基序。如圖4 所示,11 個RcGRF基因中,均含有內含子,RcGRF1,5,7,9均包含2 個內含子,其余RcGRF成員包含3 個內含子,RcGRF成員外顯子個數(shù)也在4~5 個之間。不同基因之間開放閱讀框(ORF)中內含子-外顯子結構差異不大。本研究中使用MEME 在線分析工具共鑒定出RcGRF 轉錄因子中的10 個保守基序,其中,Motif1 是WRC 結結構域,Motif2是QLQ結構域。

圖4 蓖麻GRF家族的進化樹,保守基序和基因結構Fig.4 Phylogenetic tree,motif distribution and gene structure of RcGRF gene family

2.6 RcGRF家族啟動子順式作用元件的預測

對RcGRFs啟動子序列的分析結果顯示,多個RcGRF啟動子區(qū)富集了GA 響應、ABA 響應、IAA 響應、茉莉酸甲酯響應、水楊酸響應、干旱脅迫、厭氧誘導響應、胚乳表達調控、低溫響應、分生組織表達、光響應等順式作用元件(圖5)。RcGRF啟動子序列共包含了4種激素響應元件,5種非生物脅迫響應元件和3 種生長發(fā)育相關調控元件。所有的Rc?GRF啟動子序列均包含厭氧誘導響應元件和GA 響應元件,某些基因可能含有多個某一順式作用元件,RcGRF4和10均含有8 個響應茉莉酸甲酯的元件,RcGRF2和5均含有4 個響應ABA 的元件。這表明RcGRF的功能可能涉及調控生長發(fā)育過程、激素信號轉導與環(huán)境脅迫響應。

圖5 蓖麻GRF家族成員啟動子順式作用元件的預測Fig.5 Prediction of cis-regulatory elements of the GRFs in Ricinus communis

2.7 蓖麻GRF的組織表達差異分析

GRF 轉錄因子家族成員廣泛參與調控植物對根、莖、葉、花等組織的發(fā)育。為探究該家族基因與蓖麻生長發(fā)育的關系,本研究根據(jù)實驗室已有的轉錄組測序數(shù)據(jù),系統(tǒng)分析了RcGRF基因在根、莖、葉、花中的表達模式。結果如圖6 所示,除RcGRF4外,其余蓖麻GRF 成員在蓖麻的各個組織中均有表達,RcGRF4在蓖麻各個組織中未檢測到表達,可能是具有時空表達特異性。蓖麻葉片和莖、花中表達量最高的為RcGRF9,種子中表達量最高的為Rc?GRF6,根中表達量最高的為RcGRF2。聚類分析表明,RcGRF成員在花和莖中的表達模式相似且表達量相對較高,葉和根、種子中的表達模式更為一致表達量更低,這可能暗示著蓖麻GRF 在調控株高和發(fā)育方面的作用。同時,RcGRF5、RcGRF7和Rc?GRF9在進化上與OsGRF1、3、4、6、10更為緊密,而水稻這些GRF成員已被報道對開花時間和花器官發(fā)育及莖伸長有明顯影響,蓖麻GRF成員在花和莖中的表達明顯高于其他組織中,與在水稻中研究一致,這可能暗示了蓖麻GRF在花和莖發(fā)育中起到的作用。

圖6 RcGRF基因家族表達模式圖Fig.6 Expression pattern of RcGRF gene family

3 討論

蓖麻種子含油量可達45%~54%,我國蓖麻產量位居世界前列,然而對蓖麻分子生物學的研究較少。主要原因是受限于蓖麻基因組信息的不完整及缺乏高效穩(wěn)定的遺傳轉化體系,實驗室在前期的研究中組裝了高質量染色體級別的蓖麻基因組,為蓖麻生物學研究和功能基因的挖掘奠定了基礎。在水稻和擬南芥中對miR396-GRF的研究已十分清晰,miR396-GRF 參與調控植物的生長發(fā)育過程包括葉形態(tài)發(fā)生、花器官發(fā)育、株高、籽粒大小,所以對于蓖麻中miR396及其靶基因GRF家族成員的研究是十分重要且又有現(xiàn)實意義的。

本研究利用實驗室測序組裝的蓖麻基因組數(shù)據(jù)鑒定了4 個miR396和11 個GRF家族成員,并對miR396的二級結構和GRF家族成員特征進行了全面分析。結果發(fā)現(xiàn),4 個miR396 前體序列均可以形成發(fā)卡結構,且與已發(fā)現(xiàn)的miR396 成熟序列相比,錯配堿基數(shù)在1~3 個,RcmiR396a、b也僅有一個堿基的差別,這表明了miR396的保守性。RcmiR396與RcGRFs 作用位點的分析顯示RcmiR396a、b、d可以靶向不同的的RcGRF家族成員,這暗示了不同的miR396家族成員在蓖麻中可能發(fā)揮不同的作用。從組織表達分析結果來看,RcmiR396a、b、d靶向了多個RcGRF成員,而這些RcGRF在不同組織中的表達并不一致。如RcmiR396d的靶基因中組織表達模式可分為兩類,RcGRF1、5、7、9在花和莖中均表達量最高,而RcGRF10僅在種子中有較高表達,這說明了RcGRF的表達多樣性。擬南芥中進化分析表明,6個物種共84個GRF 聚類為5個亞族,蓖麻GRF在五個亞族中均有分布。在RcGRF 分布最多的IV亞族中,大豆、木薯、毛果楊GRF 成員數(shù)目占比明顯增多,這也說明了蓖麻在進化上與同屬雙子葉植物的大豆、木薯、毛果楊進化關系更為緊密。在部分RcGRF的C 端包含TQL、FFD 和GGPL 結構域,這在擬南芥[40]、水稻[8]、卷心菜[41]和玉米[42]中都有發(fā)現(xiàn)。

RcmiR396通過調控RcGRF的表達量來影響植物的生長發(fā)育,因此對蓖麻GRF 家族成員表達模式的分析有助于研究其功能。在水稻中,大部分GRF成員在多個組織中表達,并參與水稻生長過程中多種生理過程。對RcGRF啟動子順式作用元件分析表明,RcGRF對激素誘導、脅迫響應、生長發(fā)育均有響應,這也與前人在水稻和擬南芥中的研究一致。系統(tǒng)發(fā)育分析表明,RcGRF1、7在進化上與OsGRF6較近,水稻中的研究證明OsGRF6在調控株高和莖伸長中發(fā)揮著重要作用[43]。在RcGRF1、6、7啟動子區(qū)存在分生組織表達調控元件,組織表達分析表明這些RcGRF在莖組織中的表達量較高,這可能暗示了它們在莖生長中起著重要調節(jié)作用。在蓖麻中,GRF4在各個組織中均無表達,這暗示GRF的表達可能有時空特異性。除RcGRF4、6、10外,其余GRF成員在花中均表達量很高,這暗示了RcGRF成員可能調控了蓖麻從營養(yǎng)生長到生殖生長的轉變。

猜你喜歡
蓖麻擬南芥結構域
細菌四類胞外感覺結構域的概述
擬南芥START 結構域亞家族生物信息學分析及功能
擬南芥栽培關鍵技術研究
UBR5突變與淋巴瘤B細胞成熟
母校那棵蓖麻樹
星空 (外一首)
擬南芥
巧嘴繞口令
口水暴露了身份
DEP結構域的功能研究進展
易门县| 金沙县| 鹰潭市| 荔浦县| 蕲春县| 永泰县| 大城县| 富顺县| 灵宝市| 乌拉特后旗| 赤城县| 浮梁县| 阳春市| 若羌县| 乌兰察布市| 连州市| 临泽县| 舒城县| 阳春市| 璧山县| 奎屯市| 庆阳市| 合川市| 高州市| 闵行区| 苗栗市| 铜川市| 新郑市| 喀喇沁旗| 吉林省| 遂川县| 南安市| 永寿县| 义马市| 石阡县| 星座| 梁平县| 临西县| 卢龙县| 怀仁县| 沙田区|