耿翡翡,孟超敏,卿桂霞,周佳敏,張富厚,劉逢舉
(1.河南科技大學(xué)農(nóng)學(xué)院/洛陽市作物遺傳改良與種質(zhì)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,河南洛陽 471000;2.中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所/棉花生物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,河南安陽 455000)
【研究意義】磷是許多分子中的關(guān)鍵成分,如ATP,核酸,蛋白質(zhì)和磷脂等[1]。磷參與植物能量代謝,光合作用和呼吸[2]。雖然土壤中的總磷含量很高,但磷是植物生長(zhǎng)的限制因素之一,因其在許多自然和農(nóng)業(yè)生態(tài)系統(tǒng)中被土壤成分迅速固定[3]。土壤中的磷主要以兩種形式存在,即無機(jī)磷酸鹽(Pi,主要是H2PO4-和HPO42-)和有機(jī)磷酸鹽,但植物獲得的大部分磷以無機(jī)磷酸鹽的形式吸收[4-5]。為應(yīng)對(duì)土壤磷酸鹽可用性低的狀況,植物已經(jīng)進(jìn)化出許多生理生化方面的改變來優(yōu)化磷從土壤中的獲取以及植物體內(nèi)的磷活化,使植物能夠有效地適應(yīng)低磷環(huán)境[6-7]。發(fā)掘及利用磷誘導(dǎo)的相關(guān)基因?qū)μ岣咦魑锬偷土啄芰哂兄匾饬x[8]?!厩叭搜芯窟M(jìn)展】MYB家族成員在植物的發(fā)育過程和抗逆反應(yīng)中起著核心作用。MYB蛋白參與許多生理和生化過程,包括調(diào)節(jié)代謝,控制細(xì)胞發(fā)育和細(xì)胞周期,參與響應(yīng)各種生物和非生物脅迫,激素合成和信號(hào)轉(zhuǎn)導(dǎo)[9]。在植物中,MYB轉(zhuǎn)錄因子家族包含4種[10],其中R2R3型MYB基因代表了MYB結(jié)構(gòu)域轉(zhuǎn)錄因子的主要類型,具有兩個(gè)重復(fù)序列(R)[11-12],且此類基因能夠調(diào)節(jié)植物中的多種發(fā)育和脅迫反應(yīng)[13-15]。在擬南芥中,MYB30已被證明可以調(diào)節(jié)多種脅迫反應(yīng)[16],包括通過信號(hào)通路調(diào)節(jié)植物在氧化和高溫脅迫下的反應(yīng)[17]。在擬南芥,番茄和水稻中,其他MYB轉(zhuǎn)錄因子,包括AtMYB68,LeAN2以及OsMYB55,已被發(fā)現(xiàn)參與高溫、干旱脅迫[18]。小麥MYB80的表達(dá)已被證明與轉(zhuǎn)基因擬南芥的耐熱性有關(guān)[19]。在水稻中,OsMYB1過表達(dá)導(dǎo)致對(duì)熱和鹽度脅迫的耐受性增加[20]?!颈狙芯壳腥朦c(diǎn)】培育耐低磷高效棉花品種對(duì)提高棉花新品種選育有重要意義,有助于提高棉花效益[21]。需研究陸地棉磷高效基因GhMYB4的克隆與表達(dá)分析?!緮M解決的關(guān)鍵問題】以陸地棉新陸早19號(hào)為材料,克隆GhMYB4基因,采用生物信息學(xué)工具研究其編碼蛋白理化性質(zhì),分析其表達(dá)特性,為研究棉花GhMYB4基因的生物學(xué)功能及培育磷高效利用的棉花新品種提供基因資源。
采用前期研究篩選出的磷高效棉花品種新陸早19號(hào)為材料,在河南科技大學(xué)農(nóng)學(xué)院(34°59′ N,112°42′ E)進(jìn)行大田種植,選取長(zhǎng)勢(shì)一致的新陸早19號(hào)植株采集根、莖、葉、花組織,用于分析GhMYB4基因在陸地棉新陸早19號(hào)植株4個(gè)不同組織中的表達(dá)情況。
1.2.1 引物設(shè)計(jì)
在NCBI網(wǎng)站的EST數(shù)據(jù)庫中檢索差異表達(dá)基因序列得到該基因的相似序列,將所得相似性序列(覆蓋率>50%,相似度>90%)使用DNASTAR的Seqman進(jìn)行拼接得到重疊群,將所得序列繼續(xù)檢索與拼接直至沒有新的相似序列出現(xiàn),所得即為結(jié)果序列conting,利用ORFfinder在線平臺(tái)查找開放閱讀框,進(jìn)行目標(biāo)基因GhMYB4的克隆與分析。
根據(jù)ORFfinder在線平臺(tái)查找的開放閱讀框,使用Primer 5.0軟件設(shè)計(jì)引物,由生工生物工程有限公司合成。表1
表1 所用引物信息
1.2.2 基因組DNA的克隆
1.2.2.1 基因組DNA的提取
取液氮速凍整株新陸早19號(hào)植株后在研缽中迅速研磨成粉末轉(zhuǎn)移至離心管,利用CTAB法提取陸地棉新陸早19號(hào)的基因組DNA,向其中添加200 μL的TE緩沖液溶解后置于-20℃下保存?zhèn)溆谩?/p>
1.2.2.2 基因克隆與測(cè)序
以新陸早19的基因組DNA為模板設(shè)計(jì)如下PCR擴(kuò)增反應(yīng)體系(20 μL),冰上操作:2X M5 HiPer plusTaqHiFi PCR mix (with blue dye) 10 μL,Sense primer(10 μM) 0.5 μL,Anti-sense primer(10 μM) 0.5 μL,Template DNA 0.5 μL,Nuclease-free ddH2O 8.5 μL。反應(yīng)程序?yàn)?5℃ 3 min;94℃ 25 s,56℃ 25 s,72℃ 40 s,32個(gè)循環(huán);72℃ 5 min;-4℃低溫保存。120 V,25 min,1%瓊脂糖凝膠電泳檢測(cè)。將目的DNA片段進(jìn)行膠回收純化后連接pTOPO-T載體,體系(10 μL):M5 HiPer pTOPO-TA Vector 1 μL,10×Enhancer 1 μL,純化后的PCR產(chǎn)物3 μL,滅菌水5 μL。取5 μL連接產(chǎn)物轉(zhuǎn)化50 μL大腸桿菌DH5ɑ感受態(tài)細(xì)胞,將菌液涂布在含AMP的LB固體培養(yǎng)基上,37℃培養(yǎng)過夜。隨機(jī)挑取單菌落,擴(kuò)大培養(yǎng)4 h。以所得菌液作模板進(jìn)行菌液PCR反應(yīng),體系(20 μL):2× M5 HiPer plusTaqHiFi PCR mix (with blue dye) 10 μL,M13F 0.5 μL,M13R 0.5 μL,Template DNA 0.5 μL,Nuclease-free ddH2O 8.5 μL。反應(yīng)程序同上,檢測(cè)符合后送至生工生物工程有限公司測(cè)序。
1.2.3 cDNA的克隆
1.2.3.1 總RNA的提取及cDNA的合成
取液氮速凍整株新陸早19號(hào)植株后在研缽中迅速充分研磨成粉末,后續(xù)步驟依照所用試劑盒說明書進(jìn)行,150 V,15 min,1%瓊脂糖凝膠電泳檢測(cè)。詳細(xì)步驟參考試劑盒說明書完成cDNA的合成,-20℃保存?zhèn)溆谩?/p>
1.2.3.2 基因克隆與測(cè)序
以新陸早19號(hào)的cDNA為模板設(shè)計(jì)如下PCR擴(kuò)增反應(yīng)體系(20 μL),冰上操作:2× M5 HiPer plusTaqHiFi PCR mix (with blue dye) 10 μL,Sense primer(10μM) 0.5 μL,Anti-sense primer(10 μM) 0.5 μL,cDNA 1 μL,Nuclease-free ddH2O 8 μL。PCR反應(yīng)程序?yàn)?95℃ 3 min;94℃ 25 s,56℃ 25 s,72℃ 35 s,35個(gè)循環(huán);72℃ 5 min;-4℃低溫保存。120 V,25 min,1%瓊脂糖凝膠電泳檢測(cè)。將目的DNA片段進(jìn)行膠回收純化后連接pTOPO-T載體,體系(5 μL):M5 HiPer pTOPO-TA Vector 0.5 μL,10×Enhancer 0.5 μL,純化后的PCR產(chǎn)物1.8 μL,滅菌水2.2 μL。取5 μL連接產(chǎn)物轉(zhuǎn)化50 μL大腸桿菌DH5ɑ感受態(tài)細(xì)胞,培養(yǎng)后隨機(jī)挑取單菌落擴(kuò)大培養(yǎng)后進(jìn)行菌液PCR反應(yīng),電泳檢測(cè)符合后送至生工生物工程有限公司進(jìn)行測(cè)序。
1.2.4 生物信息學(xué)
使用在線平臺(tái)及軟件對(duì)基因進(jìn)行生物信息學(xué)分析,預(yù)測(cè)分析基因的結(jié)構(gòu)、性質(zhì)等。
1.2.5 半定量RT-PCR
利用半定量RT-PCR技術(shù),分析GhMYB4基因在根、莖、葉、花4個(gè)不同組織中的表達(dá)狀況。以新陸早19號(hào)各組織的cDNA為模板,GhActin作內(nèi)參基因。設(shè)計(jì)PCR擴(kuò)增反應(yīng)體系(20 μL),冰上操作:2×M5 HiPer plusTaqHiFi PCR mix (with blue dye) 10 μL,GhMYB4-F(10 μM) 0.5 μL,GhMYB4-R(10 μM) 0.5 μL,cDNA 1 μL,Nuclease-free ddH2O 8 μL。PCR反應(yīng)程序?yàn)?5℃ 3 min;94℃ 25 s,60℃ 25 s,72℃ 10 s,35個(gè)循環(huán);72℃ 5 min;-4℃低溫保存。120 V,25 min,1%瓊脂糖凝膠電泳檢測(cè)。表1
1.2.6 熒光定量PCR
采用實(shí)時(shí)熒光定量PCR技術(shù)檢測(cè)基因在根、莖、葉、花不同的4個(gè)組織中的表達(dá)情況。以陸地棉新陸早19號(hào)植株的4個(gè)不同組織的cDNA為模板,GhActin作為內(nèi)參基因,進(jìn)行定量分析。采用SYBR?Green ProTaqHS預(yù)混型qPCR試劑盒進(jìn)行熒光定量,使用的熒光定量PCR儀器型號(hào)是CFX96,數(shù)據(jù)分析采用2-ΔΔcT法。表1
研究表明,共檢索發(fā)現(xiàn)并下載了16條相似序列,利用DNASTAR將所得序列全部進(jìn)行拼接,得到了一個(gè)新的conting重疊群,序列長(zhǎng)度為1 052 bp。
研究表明,克隆得到GhMYB4基因的CDS,其條帶符合目的條帶大小。通過無縫克隆連接到pTOPO-T載體上,挑選陽性克隆測(cè)序。獲得DNA序列1 000 bp左右與conting序列的一致性較高,為97.08%。獲得cDNA序列800 bp左右與congting序列比對(duì)一致性為99.88%。開放閱讀框?yàn)殚L(zhǎng)度為774 bp,共編碼257個(gè)氨基酸。圖1
注:M:Marker 2000;1:DNA的PCR擴(kuò)增片段;2:cDNA的PCR擴(kuò)增片段
研究表明,該基因編碼序列包含5′與3′非編碼序列,僅含有1個(gè)內(nèi)含子,2個(gè)外顯子。圖2
圖2. GhMYB4基因結(jié)構(gòu)
2.4.1 基因編碼蛋白的理化性質(zhì)
研究表明,該基因共編碼了257個(gè)氨基酸,該基因所編碼蛋白的分子式是C1262H2005N375O382S13,脂肪族氨基酸指數(shù)是72.92,分子量是28 959.86D等電點(diǎn)為8.87,屬于堿性蛋白。其中亮氨酸的含量占比最大,為10.1%,共26個(gè)。在該蛋白中帶負(fù)電荷的氨基酸有31個(gè),另外有38個(gè)帶正電荷。氨基酸組分會(huì)直接影響蛋白的親疏水性,總親水性平均系數(shù)為-0.689,不穩(wěn)定系數(shù)是42.19,屬親水性不穩(wěn)定蛋白。此蛋白中精氨酸(Arg)親水性最強(qiáng),親水指數(shù)為-4.500,異亮氨酸(Ile)疏水性最強(qiáng),親水指數(shù)為+4.500 0。
2.4.2 基因編碼蛋白的保守結(jié)構(gòu)域
研究表明,此基因編碼蛋白匹配所屬的超家族是PLN03091,該家族被歸類為可能包括多個(gè)結(jié)構(gòu)域的模型。該基因?qū)儆贛YB基因家族,利用SMART分析GhMYB4在13-63、66-114氨基酸處存在兩個(gè)SANT結(jié)構(gòu)域,GhMYB4基因可能屬于R2R3-MYB亞族。該基因與其他物種的MYB4氨基酸序列同源性較高,物種間MYB蛋白氨基酸長(zhǎng)度基本一致,同源性達(dá)71.19%,2個(gè)SANT結(jié)構(gòu)域所在的氨基酸幾乎完全一致。圖3
圖3 GhMYB4與其他物種MYB家族同源蛋白的多序列比對(duì)
2.4.3 基因編碼蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè)
研究表明,在NPS@:SOPMA secondary structure prediction網(wǎng)站預(yù)測(cè)該蛋白二級(jí)結(jié)構(gòu),其中占比最大的無規(guī)則卷曲占58.37%,包含150個(gè)氨基酸,其次是α-螺旋占比為32.68%,包含84個(gè)氨基酸;此蛋白還含有少部分延伸鏈(Extended strand)和β-轉(zhuǎn)角(Beta turn),其中β-轉(zhuǎn)角占比為4.67%,有12個(gè)氨基酸,延伸鏈有11個(gè)氨基酸,占比為4.28%。此蛋白的二級(jí)結(jié)構(gòu)由α-螺旋和無規(guī)則卷曲占據(jù)主體地位所組成,各結(jié)構(gòu)在各個(gè)區(qū)間分布較為均勻,由于無規(guī)則卷曲占比較多,預(yù)測(cè)其結(jié)構(gòu)比較復(fù)雜。
2.4.4 基因編碼蛋白的三級(jí)結(jié)構(gòu)預(yù)測(cè)
研究表明,QMEAN值為0.79,GMQE值為0.33,預(yù)測(cè)其含有轉(zhuǎn)錄因子WER,與R2R3-MYB轉(zhuǎn)錄因子識(shí)別靶基因的結(jié)構(gòu)類似。蛋白的三級(jí)結(jié)構(gòu)與二級(jí)結(jié)構(gòu)分析結(jié)果一致,均以α螺旋和無規(guī)則卷曲為主體。圖4
圖4 GhMYB4蛋白的三級(jí)結(jié)構(gòu)預(yù)測(cè)
2.4.5 基因編碼蛋白跨膜結(jié)構(gòu)與信號(hào)肽
研究表明,該基因所編碼蛋白不含有跨膜結(jié)構(gòu)域,屬于非跨膜蛋白,并未形成跨膜螺旋區(qū)。此基因編碼蛋白有信號(hào)肽的概率是0.001 1,其他的可能性高達(dá)0.998 9。257位氨基酸中并未出現(xiàn)典型的信號(hào)肽趨勢(shì),即該蛋白不存在信號(hào)肽。
2.4.6 基因編碼蛋白的亞細(xì)胞定位
基因編碼蛋白的亞細(xì)胞研究表明,預(yù)測(cè)定位在細(xì)胞核(Nucleus)。該蛋白是一個(gè)核蛋白,直接位于細(xì)胞核發(fā)揮作用。
2.4.7 基因蛋白互作網(wǎng)絡(luò)預(yù)測(cè)
研究表明,獲得的基因編碼蛋白能夠預(yù)測(cè)到蛋白質(zhì)的相互作用網(wǎng)絡(luò),預(yù)測(cè)該基因可能是通過多個(gè)蛋白互作調(diào)控。
2.4.8 N-糖基化與磷酸化位點(diǎn)
研究表明,N-糖基化對(duì)蛋白穩(wěn)定及功用均會(huì)產(chǎn)生及其重要的影響作用。獲得的基因編碼序列位于該蛋白質(zhì)69~72、233~236位點(diǎn)處存在2個(gè)潛在的N-糖基化位點(diǎn)。磷酸化位點(diǎn)與蛋白的功能、結(jié)構(gòu)都有很大的關(guān)系,此蛋白中占比最大的是絲氨酸和蘇氨酸磷酸化位點(diǎn),而酪氨酸占比較少。
2.4.9 基因編碼蛋白序列系統(tǒng)進(jìn)化樹
研究表明,在NCBI數(shù)據(jù)庫利用BLASTp檢索氨基酸序列的同源序列,下載了另外13條不同物種的蛋白序列,木槿(Hibiscussyriacus)、可可樹(Theobromacacao)、榴蓮(Duriozibethinues)、桃樹(Prunuspersica)、蘋果樹(Malusdomestica)、月季(Rosachinensis)、擬南芥(Arabidopsisthaliana)、冬瓜(Benincasahispida)、黃瓜(Cucumissativus)、枇杷(Rhaphiolepisbibas)、梅花(Prunusmume)、芝麻(Sesamumindicum)、核桃(Juglansregia)。棉花蛋白序列與木槿、可可樹、榴蓮的親緣關(guān)系最近,與其余物種的親緣關(guān)系較遠(yuǎn),不在一個(gè)大支上。圖5
圖5 GhMYB4基因系統(tǒng)進(jìn)化樹
研究表明,GhMYB4基因高表達(dá)于根,微量表達(dá)于花,中量表達(dá)于莖和葉。圖6
注:M:Marker 2000
研究表明,棉花磷高效基因在根、莖、葉和花4個(gè)組織中都有一定量的表達(dá);但GhMYB4基因在新陸早19號(hào)植株的不同組織中的表達(dá)情況各不相同,其中在新陸早19號(hào)的根系中的相對(duì)表達(dá)量最高,其次是葉,而在花組織的表達(dá)相對(duì)較少,莖中的表達(dá)量略高于花,根中的表達(dá)量約為花中表達(dá)量的2倍。圖7
圖7 GhMYB4在棉花不同組織中的相對(duì)表達(dá)
磷影響植物的生物調(diào)節(jié)(如能量代謝、信號(hào)轉(zhuǎn)導(dǎo)和酶調(diào)節(jié))和生理過程(如花青素積累和向根際釋放有機(jī)酸)。為了在缺磷條件下維持細(xì)胞內(nèi)磷穩(wěn)態(tài),植物主要是通過從土壤中獲取磷、磷從根到芽的轉(zhuǎn)移以及植物體內(nèi)部磷的再活化來實(shí)現(xiàn)的[22]。盡管許多研究報(bào)告了磷相關(guān)的轉(zhuǎn)錄因子,但在磷脅迫中直接調(diào)節(jié)磷酸轉(zhuǎn)運(yùn)蛋白的幾種轉(zhuǎn)錄因子的功能與分子調(diào)控機(jī)制仍未在棉花中得到表征[23]。MYB蛋白包括一大家族的植物轉(zhuǎn)錄因子,其成員在植物生物過程中執(zhí)行多種功能。尚未在棉花中對(duì)該基因家族進(jìn)行全基因組鑒定。第一個(gè)植物MYB基因是從玉米中分離出來的,其編碼參與花青素生物合成的c-MYB樣轉(zhuǎn)錄因子,隨后在許多植物中鑒定出越來越多的植物R2R3-MYB基因成員[24]。研究表明,R2R3-MYB家族基因除了參與各種生理活動(dòng)外,還在植物對(duì)非生物脅迫的反應(yīng)中起重要作用[25]。
所得基因序列與擬南芥中的MYB家族中的MYB4基因同源性較高,從陸地棉新陸早19號(hào)中克隆得到了一個(gè)MYB4類似基因,并將其命名為GhMYB4,該基因?qū)儆贛YB超家族成員。該基因的結(jié)構(gòu)相對(duì)較為簡(jiǎn)單,僅有一個(gè)內(nèi)含子,GhMYB4蛋白相對(duì)分子質(zhì)量(Molecular weight)是28 959.86D,理論等電點(diǎn)(Theoretical pI)為8.87,是堿性蛋白,具備不穩(wěn)定性與親水性。此蛋白的二級(jí)結(jié)構(gòu)由α-螺旋和無規(guī)則卷曲占據(jù)主體地位所組成,通過同源建??芍摶蛉?jí)結(jié)構(gòu)預(yù)測(cè)其含有轉(zhuǎn)錄因子WER。該基因編碼蛋白不存在信號(hào)肽和跨膜結(jié)構(gòu)域。該蛋白存在2個(gè)潛在的N-糖基化位點(diǎn)和多個(gè)磷酸化位點(diǎn)。亞細(xì)胞定位結(jié)果顯示該基因編碼蛋白在細(xì)胞核中,預(yù)測(cè)其能夠通過蛋白質(zhì)的相互作用參與調(diào)控。該基因在棉花根中的表達(dá)量是最大的,在花中表達(dá)相對(duì)較小,中量表達(dá)于莖和葉,GhMYB4基因在根系發(fā)揮作用,在棉花的磷高效利用信號(hào)調(diào)控過程中具有重要作用。