郭丹丹 李保云
(中國(guó)農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院/北京市作物遺傳改良重點(diǎn)實(shí)驗(yàn)室/教育部作物雜種優(yōu)勢(shì)研究與利用重點(diǎn)實(shí)驗(yàn)室,北京 100193)
小麥?zhǔn)鞘澜缟现匾娜蠹Z食作物之一。小麥具有面筋蛋白,所以能夠被加工成面條、面包、饅頭和餅干等各種面食品。面筋蛋白主要由單體形式的醇溶蛋白和多聚體形式的谷蛋白組成。根據(jù)在酸性聚丙烯酰胺凝膠電泳(Acid polyacrylamide-gel electrophoresis,A-PAGE)中遷移率的不同,醇溶蛋白可分為α-、β-、γ-和ω-醇溶蛋白4種類型,其中α-、β-、γ-醇溶蛋白中脯氨酸、苯丙氨酸和谷氨酰胺的含量較少,但是含硫氨基酸較多,因此被稱為富硫醇溶蛋白,其中的半胱氨酸是維持單肽及肽鏈間二硫鍵的重要因素;而ω-醇溶蛋白通常不含半胱氨酸,無(wú)法參與鏈內(nèi)或鏈間二硫鍵的形成,多數(shù)只含1個(gè)甲硫氨酸殘基,因此被稱為貧硫醇溶蛋白,有少數(shù)ω-醇溶蛋白含有奇數(shù)個(gè)半胱氨酸殘基,能夠參與谷蛋白聚合體的形成,導(dǎo)致面粉的品質(zhì)變劣[1-3]。醇溶蛋白含有能夠誘發(fā)麩質(zhì)不耐受人群乳糜瀉(Celiac disease,CD)疾病的肽段,主要類型是α-、β-和γ-醇溶蛋白,在ω-醇溶蛋白中也含有部分肽段[4]。通過(guò)RNAi介導(dǎo)使醇溶蛋白含量降低或沉默,能夠在不影響總蛋白和淀粉含量的前提下達(dá)到降低CD毒性的目的[5]。因此克隆ω-醇溶蛋白基因?qū)π←溒焚|(zhì)的遺傳改良具有重要意義。
ω-醇溶蛋白基因的基本結(jié)構(gòu),包括信號(hào)肽、N末端非重復(fù)區(qū)、占肽段90%~96%的中間重復(fù)區(qū)及C末端非重復(fù)區(qū)4部分[6]。六倍體小麥可能含有 15~18 個(gè)ω-醇溶蛋白基因[7],編碼基因位于第1部分同源染色體短臂上[8],由1A、1D染色體基因編碼的蛋白在A-PAGE上的遷移率較慢,稱為ω1,2-醇溶蛋白(46~58 ku),推導(dǎo)的氨基酸序列N末端前3個(gè)通常為ARE/Q或KEL;由1B染色體基因編碼的蛋白在A-PAGE上的遷移率較快,稱為ω5-醇溶蛋白(55~65 ku),N末端前3個(gè)氨基酸為SRL[9-10]。ω1,2-醇溶蛋白在中間重復(fù)區(qū)的重復(fù)單元類型與ω5-醇溶蛋白有明顯區(qū)別,這種差異也表現(xiàn)在氨基酸組成上,ω1,2-醇溶蛋白的谷氨酰胺與脯氨酸殘基個(gè)數(shù)比為4∶3,而ω5-醇溶蛋白的比值為5∶2[11]。
ω-醇溶蛋白基因最早被克隆,是由于與γ-醇溶蛋白具有交叉雜交的性質(zhì),才會(huì)在對(duì)γ-醇溶蛋白基因進(jìn)行克隆時(shí)被鑒定到[12]。利用電泳或RP-UPLC等方法對(duì)醇溶蛋白分離后回收,再進(jìn)行N末端測(cè)序或質(zhì)譜鑒定也鑒定到一些醇溶蛋白[13-14]。通過(guò)免疫化學(xué)方法制備特定醇溶蛋白的單克隆抗體,對(duì)ω-醇溶蛋白的分離和鑒定也發(fā)揮了重要作用[14]。通過(guò)基因組水平、轉(zhuǎn)錄水平和蛋白水平相結(jié)合的方法在二倍體祖先種烏拉爾圖小麥中鑒定到2個(gè)ω-醇溶蛋白基因及其蛋白[4]。同樣,利用三代全長(zhǎng)轉(zhuǎn)錄組測(cè)序技術(shù)結(jié)合質(zhì)譜技術(shù),也鑒定到六倍體普通小麥品種‘小偃81’中有5個(gè)能夠表達(dá)的ω-醇溶蛋白[15];通過(guò)將‘中國(guó)春’基因組進(jìn)行De Novo BioNano組裝,結(jié)合RNA-seq數(shù)據(jù)同樣獲得19條ω-醇溶蛋白基因的序列信息[16]。目前對(duì)小麥高分子量谷蛋白亞基(High molecular weight glutenin subunit, HMW-GS)和低分子量谷蛋白亞基(Low molecular weight glutenin subunit, LMW-GS)基因的調(diào)控研究已經(jīng)較為深入[17-20]。但是,ω-醇溶蛋白基因家族龐大,相似性較高,假基因比例高,基因中間重復(fù)區(qū)含有較多的重復(fù)單元,GC含量較高,這些因素導(dǎo)致相關(guān)研究更加困難。已有研究多數(shù)集中在區(qū)分不同ω-醇溶蛋白及其基因的差異,對(duì)不同ω-醇溶蛋白基因啟動(dòng)子的差異比較研究報(bào)道較少,本研究以春小麥‘Fielder’為材料,通過(guò)PCR和克隆測(cè)序法分離ω-醇溶蛋白基因,分析編碼區(qū)和啟動(dòng)子序列差異,旨在探明小麥中不同ω-醇溶蛋白基因的啟動(dòng)子序列差異,以期為ω-醇溶蛋白基因的轉(zhuǎn)錄調(diào)控機(jī)理研究奠定基礎(chǔ)。
本試驗(yàn)所用六倍體普通小麥(TriticumaestivumL.) 品種‘Fielder’和‘中國(guó)春’(CS)均由本實(shí)驗(yàn)室保存。
1.2.1蛋白質(zhì)提取
取1粒小麥種子充分碾碎,置于1.5 mL離心管中,加入800 μL 75%乙醇,室溫震蕩過(guò)夜,提取醇溶蛋白。
1.2.2A-PAGE的制備及電泳
采用FeSO4-Vc-H2O2催化系統(tǒng)制備A-PAGE[21],500 V穩(wěn)壓電泳3.5 h,對(duì)醇溶蛋白進(jìn)行分離。
1.2.3DNA提取
將小麥種子播種在培養(yǎng)皿上,暗培養(yǎng)1周左右,取4葉1心期的葉片,用CTAB法提取基因組DNA。
1.2.4引物設(shè)計(jì)及擴(kuò)增
根據(jù)已經(jīng)公布的‘CS’ω-醇溶蛋白基因上下游序列[16],分別設(shè)計(jì)能夠擴(kuò)增不同基因組上的ω-醇溶蛋白基因及啟動(dòng)子的引物,詳見(jiàn)表1。
其中上游引物位于ω-醇溶蛋白基因起始密碼子上游1 kb左右;下游引物位于終止密碼子下游100 bp左右。
采用大連寶生物(Takara)公司的Tks GflexTMDNA Polymerase高保真酶,按說(shuō)明書(shū)進(jìn)行PCR擴(kuò)增。
表1 ω-醇溶蛋白基因編碼區(qū)和啟動(dòng)子克隆引物及測(cè)序引物Table 1 The ω-gliadin genes cloning primers andsequencing primers
1.2.5目的片段回收與連接轉(zhuǎn)化
將擴(kuò)增產(chǎn)物在1%瓊脂糖凝膠上進(jìn)行分離,用瓊脂糖凝膠回收試劑盒(北京天根生化科技有限公司)回收目的條帶,與pEasy-Blunt Zero載體(北京全式金生物公司)連接,將連接產(chǎn)物轉(zhuǎn)化大腸桿菌Trans-T1感受態(tài)細(xì)胞(北京全式金生物公司),涂布于含卡那霉素(Kan)的LB培養(yǎng)基上,37 ℃倒置培養(yǎng)過(guò)夜。
1.2.6重組克隆篩選
挑取一定數(shù)量的單克隆,用M13引物進(jìn)行菌落PCR檢測(cè),將陽(yáng)性克隆送北京擎科生物科技有限公司測(cè)序。首先用載體上的M13F和M13R引物進(jìn)行測(cè)序,再根據(jù)ω-醇溶蛋白基因非重復(fù)區(qū)差異設(shè)計(jì)引物,對(duì)不同基因組的ω-醇溶蛋白基因進(jìn)行測(cè)序,引物信息詳見(jiàn)表1。
1.2.7序列分析
采用NCBI(https:∥www.ncbi.nlm.nih.gov/)和DNAMAN軟件對(duì)測(cè)序結(jié)果進(jìn)行比對(duì)、拼接及翻譯。利用MegaX軟件(https:∥www.megasoftware.net/)進(jìn)行系統(tǒng)發(fā)生樹(shù)的構(gòu)建,啟動(dòng)子序列提交PlantCARE網(wǎng)站(http:∥bioinformatics.psb.ugent.be/webtools/plantcare/html/)進(jìn)行motif分析。
提取‘CS’和‘Fielder’種子的醇溶蛋白進(jìn)行A-PAGE。從圖1看出,2個(gè)材料的ω-醇溶蛋白譜帶差異較大?!瓹S’在ω1,2-醇溶蛋白區(qū)有2條帶;在ω5-醇溶蛋白區(qū)有3條帶,其中有2條帶非常接近,共5條ω-醇溶蛋白條帶?!瓼ielder’在ω1,2-醇溶蛋白區(qū)有2條帶,并且這2條帶的遷移率與‘CS’非常接近;在ω5-醇溶蛋白區(qū)有5條帶,其中有2條帶非常接近,共7條ω-醇溶蛋白條帶。
α-、β-、γ-和ω-分別表示按遷移率不同劃分的4組醇溶蛋白類型;ω1,2-和ω5-分別為ω-醇溶蛋白的2種類型。1和2分別為‘Fielder’和‘CS’。α-, β-, γ- and ω- are the four types of wheat gliadin;ω1,2- and ω5- are the two types of ω-gliadin. Lane 1 and 2 are ‘Fielder’ and ‘CS’.圖1 小麥種子醇溶蛋白的A-PAGEFig.1 The A-PAGE of wheat grain gliadin
利用3組ω-醇溶蛋白基因特異引物(表1),以‘Fielder’的基因組DNA為模板進(jìn)行PCR擴(kuò)增,得到約2 kb左右的目的條帶(圖2)。將目的條帶回收后,連接T載體并轉(zhuǎn)化至大腸桿菌中,挑選陽(yáng)性單克隆進(jìn)行序列測(cè)定,共獲得11種序列。將這些序列在NCBI網(wǎng)站進(jìn)行Blast,相似性較高的是ω-醇溶蛋白基因,進(jìn)一步分析發(fā)現(xiàn)這些序列含有ω-醇溶蛋白基因的基本結(jié)構(gòu),即均為ω-醇溶蛋白基因及其啟動(dòng)子序列(GenBank登錄號(hào):MN441496~MN441506)。
這些基因序列可以分為2組,ARE/Q和SRL型ω-醇溶蛋白基因。編碼區(qū)長(zhǎng)度、推導(dǎo)的氨基酸數(shù)目以及重復(fù)單元種類和數(shù)量各不相同(表2)。
ARE/Q型ω-醇溶蛋白基因編碼區(qū)長(zhǎng)度范圍在 972 ~1 158 bp,推導(dǎo)的氨基酸主要含有PQQPFP和PFPQQPQQ這2種類型的重復(fù)單元;SRL型ω-醇溶蛋白基因編碼區(qū)的長(zhǎng)度變異范圍為1 303~1 419 bp,主要重復(fù)單元為FPQQQ和PQQQFP。
M,1 kb ladder,1、2和3分別為ωA、ωB和ωD引物的擴(kuò)增產(chǎn)物。M is 1 kb ladder. Lane 1, 2 and 3 show the amplifications of primer pairs of ωA, ωB and ωD, respectively.圖2 ω-醇溶蛋白基因擴(kuò)增產(chǎn)物Fig.2 The amplification of ω-gliadin genes
表2 ω-醇溶蛋白基因及推導(dǎo)的氨基酸序列比較Table 2 The comparison of gene and deduced amino acid sequences of ω-gliadin
2.2.1ω-醇溶蛋白基因編碼區(qū)分析
A和D基因組上的ω-醇溶蛋白基因相似性較高,從‘Fielder’中利用基因組特異性引物共擴(kuò)增得到的ARE和ARQ型ω-醇溶蛋白基因序列分別有3種(表2),不同類型和數(shù)量的Indel是造成不同基因編碼區(qū)長(zhǎng)度變異的主要因素。其中MN441497和MN441505的編碼區(qū)長(zhǎng)度最長(zhǎng),為1 158 bp。在其余4種ARE/Q型基因序列中,共有5種類型的Indel,長(zhǎng)度分別為15、18、24、48和123 bp(圖3)。MN441503中含有123、48和15 bp 3種類型Indel;MN441504中含有18、48和15 bp 3種類型Indel;MN441496中只含有18 bp的Indel;MN441506中只含有24 bp的Indel。共有70處SNP位點(diǎn)分布于這6種ω-醇溶蛋白基因序列之間,其中22個(gè)SNP為同義突變,48個(gè)SNP為非同義突變。這些Indel堿基數(shù)均為3的倍數(shù),SNP變異也沒(méi)有引入額外的終止密碼子,因此6種ARE/Q型ω-醇溶蛋白基因序列均含有完整編碼框。不同長(zhǎng)度和數(shù)量的Indel組合以及不同的SNP變異,使基因呈現(xiàn)多態(tài)性。其中MN441496和MN441497只有18 bp Indel的差異。
圖3 ARE/Q型和SRL型ω-醇溶蛋白基因模式圖Fig.3 The schematic diagram of ARE/Q and SRL type ω-gliadin genes
MN441499在135 bp處有1個(gè)18 bp的Indel,在151 bp處插入了1個(gè)堿基A,導(dǎo)致推導(dǎo)的氨基酸序列與醇溶蛋白相似性較低,推測(cè)其可能為移碼突變的假基因。在另外4種SRL型ω-醇溶蛋白基因的中間重復(fù)區(qū)共發(fā)現(xiàn)了3種類型的Indel(圖3)。MN441500和MN441502在303 bp處均有1個(gè)3 bp的Indel,MN441498、MN441499、MN441500和MN441501在相距12 bp后的位置有1個(gè)18 bp的Indel,MN441498、MN441499、MN441501和MN441502在相距552 bp后的位置有1個(gè)102 bp的Indel,這些Indel堿基數(shù)均是3的倍數(shù),沒(méi)有引起移碼突變。在4種SRL型ω-醇溶蛋白基因中共發(fā)現(xiàn)27個(gè)SNP位點(diǎn),其中有7個(gè)SNP為同義突變,17個(gè)為非同義突變。還有3個(gè)位點(diǎn)的SNP引入了提前終止密碼子,造成推導(dǎo)的氨基酸序列變短,其中1個(gè)SNP位點(diǎn)位于MN441498序列ATG下游1 260 bp處,三聯(lián)體密碼子TAC突變?yōu)門AA;另外2個(gè)位點(diǎn)位于MN441501序列編碼區(qū)274和 1 279 bp 處,編碼脯氨酸的密碼子CAG和CAA突變?yōu)榻K止密碼子TAG和TAA。
2.2.2ω-醇溶蛋白基因的進(jìn)化樹(shù)分析
將克隆的ω-醇溶蛋白基因序列在NCBI的NR數(shù)據(jù)庫(kù)中進(jìn)行Blast,并與44條來(lái)源于不同小麥屬具有完整編碼框的ω-醇溶蛋白基因構(gòu)建Neighbor-joining系統(tǒng)發(fā)生樹(shù)。從圖4可知,系統(tǒng)發(fā)生樹(shù)被分成2個(gè)分支,6種ARE/Q型ω-醇溶蛋白基因主要與普通小麥(TriticumaestivumL.)、山羊草屬(AegilopstauschiiL.)、烏拉爾圖小麥(TriticumurartuL.)及圓錐小麥(TriticumturgidumL.)中的ω-醇溶蛋白基因聚類在1個(gè)大分支上,而4種SRL型ω-醇溶蛋白基因主要與普通小麥(TriticumaestivumL.)和二粒小麥(TriticumdicoccoidesL.)中的ω-醇溶蛋白基因聚在1個(gè)分支上。通過(guò)進(jìn)化樹(shù)分析可以看到ARE/Q型ω-醇溶蛋白基因在進(jìn)化上與SRL型ω-醇溶蛋白基因相對(duì)獨(dú)立。
2.2.3ω-醇溶蛋白基因啟動(dòng)子分析
ω-醇溶蛋白基因與小麥中其他儲(chǔ)藏蛋白基因啟動(dòng)子區(qū)類似[17-18,22],ATG上游序列包含有許多保守的motif,其中ARE/Q型ω-醇溶蛋白基因啟動(dòng)子含有29種motif;SRL型ω-醇溶蛋白基因啟動(dòng)子含有27種motif(表3),相同的motif有19種,但是分布的位置不同,這些motif是SPA、MYB、DOF和B3等重要轉(zhuǎn)錄因子的識(shí)別序列。
在ARE/Q型ω-醇溶蛋白基因中,MN441496和MN441497、MN441503和MN441504以及MN441505和MN441506的啟動(dòng)子序列分別相同,SRL型ω-醇溶蛋白基因的5種啟動(dòng)子序列均不相同。ARE/Q和SRL型基因啟動(dòng)子序列差異較大(表3),但是存在保守的motif組合,比如P-box和N-motif組成的endosperm box只出現(xiàn)在ARE/Q型醇溶蛋白基因啟動(dòng)子序列的-300 bp處,但出現(xiàn)在SRL型醇溶蛋白基因啟動(dòng)子序列的-300 bp和 -600 bp 處。有些motif只特定出現(xiàn)在1種序列中,比如ARE/Q型ω-醇溶蛋白基因-137、-172、-389、-498、-499、-675、-946和-968 bp處的motif,SRL型-187、-367、-626和-933 bp處的motif。這些motif出現(xiàn)在不同基因啟動(dòng)子的不同位置,可能會(huì)對(duì)基因的表達(dá)產(chǎn)生不同的影響。
數(shù)字表示可信度。The numbers in the figure indicate the credibility.圖4 克隆的ω-醇溶蛋白基因與非冗余ω-醇溶蛋白基因進(jìn)化樹(shù)分析Fig.4 Phylogenic tree analysis based on the cloned genes and non-redundant ω-gliadins
表3 ARE/Q和SRL型醇溶蛋白基因啟動(dòng)子區(qū)保守motif分布Table 3 The distribution of conserved motif in ARE/Q and SRL type ω-gliadin genes promoter region
表3(續(xù))
不同小麥材料中的ω-醇溶蛋白基因拷貝數(shù)不同,研究表明,六倍體普通小麥中的ω-醇溶蛋白基因數(shù)量在15~18個(gè)[7]。根據(jù)重新組裝的基因組信息、2-DE(雙向蛋白電泳)和RNA-seq信息,‘CS’共有5種能夠轉(zhuǎn)錄并且表達(dá)的ω-醇溶蛋白基因[16],因此在A-PAGE上可以看到5條清晰的ω-醇溶蛋白條帶(圖1)。‘Fielder’在A-PAGE上共有7條ω-醇溶蛋白條帶,推測(cè)至少應(yīng)有7種能夠表達(dá)的ω-醇溶蛋白,因此根據(jù)‘CS’中ω-醇溶蛋白基因的上下游序列信息,對(duì)‘Fielder’中的ω-醇溶蛋白基因的編碼區(qū)和啟動(dòng)子序列進(jìn)行克隆,共得到了11條序列,其中1條為移碼突變的假基因,2條含有提前終止密碼子,8條具有完整編碼框。由于ω-醇溶蛋白有限的水解位點(diǎn),質(zhì)譜分析相對(duì)困難[23],更為重要的是ω-醇溶蛋白基因等位變異廣泛,但數(shù)據(jù)庫(kù)中完整的基因數(shù)量較少,大部分預(yù)測(cè)的蛋白分子量較小,可能是丟失了一部分中間重復(fù)區(qū)[10]。本研究采用單克隆測(cè)序的方法,能夠準(zhǔn)確知道每條DNA序列的長(zhǎng)度,并且通過(guò)拼接不同位置的測(cè)序結(jié)果,大大降低了缺失中間重復(fù)區(qū)的可能。這種通過(guò)簡(jiǎn)單的PCR進(jìn)行克隆的方法,避免了2-DE和質(zhì)譜等繁瑣的試驗(yàn)過(guò)程,即可獲得ω-醇溶蛋白基因序列,簡(jiǎn)單易行且成本較低。缺點(diǎn)是需要避開(kāi)高GC含量的中間重復(fù)區(qū)設(shè)計(jì)出合適的引物進(jìn)行測(cè)序,并且由于重復(fù)單元較多,需要設(shè)計(jì)多對(duì)引物對(duì)測(cè)序結(jié)果反復(fù)驗(yàn)證,避免拼接結(jié)果缺失部分重復(fù)單元,另外得到的基因序列并不能與A-PAGE上的條帶一一對(duì)應(yīng)。
含奇數(shù)個(gè)半胱氨酸的醇溶蛋白可能作為鏈內(nèi)終止劑,參與谷蛋白大聚體的形成[3]。本研究克隆的ω-醇溶蛋白基因中,MN441506推導(dǎo)的氨基酸序列含有1個(gè)半胱氨酸和甲硫氨酸,MN441502在C末端含有1個(gè)半胱氨酸,這2個(gè)ω-醇溶蛋白可能通過(guò)分子間二硫鍵對(duì)谷蛋白大聚體的形成及穩(wěn)定性產(chǎn)生影響,進(jìn)而影響小麥品質(zhì)性狀。
Glu-1基因啟動(dòng)子中的順式作用元件可以組成保守的順式作用調(diào)控模塊(conserved cis-regulatory modules,CCRM)對(duì)基因表達(dá)進(jìn)行精確調(diào)控,并且表達(dá)量較高的x-型HMW-GS除了保守的CCRM外,還含有能夠被R2R3-MYB轉(zhuǎn)錄因子識(shí)別的motif[16,22]。LMW-GS基因啟動(dòng)子也含有保守的非編碼調(diào)控元件,大部分的s-和i-型LMW-GS基因呈現(xiàn)逐漸增加的表達(dá)模式,而m-型LMW-GS基因則呈先升高再降低的表達(dá)模式,不同基因表達(dá)模式的差異與啟動(dòng)子區(qū)motif的數(shù)量和分布密切相關(guān)[17]。本研究克隆的ω-醇溶蛋白基因啟動(dòng)子區(qū)也含有大量保守的motif,不同種類基因之間motif的數(shù)量和分布不同(表3),相同種類基因之間也在一些motif上有差異。其中由GCN4和P-box這2種motif組成的endosperm box對(duì)儲(chǔ)藏蛋白基因的表達(dá)起到非常重要的作用,LMW-GS基因啟動(dòng)子區(qū)GCN4和P-box motif的數(shù)量和組合多態(tài)性使同一類型的基因呈現(xiàn)不同的表達(dá)模式[17]。在本研究克隆的ω-醇溶蛋白基因中也發(fā)現(xiàn)了類似的現(xiàn)象,ω1,2-醇溶蛋白基因啟動(dòng)子區(qū)含有這2種motif組成的3種組合類型,每種類型所含的motif種類和數(shù)量不同。ω1,2-醇溶蛋白基因啟動(dòng)子只含有1個(gè)典型的endosperm box,而ω5-醇溶蛋白基因則含有2個(gè)。這些motif的組合形式也可能會(huì)造成ω-醇溶蛋白基因之間的差異表達(dá),有待進(jìn)一步研究。
中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào)2020年7期