徐麗娟,熊 勇
(云南民族大學(xué) 民族醫(yī)藥學(xué)院,云南 昆明 650500)
天人菊(GaillardiapulchellaFoug.)屬于菊科(Asteraceae)天人菊屬(Gaillardia)植物,別名虎皮菊、老虎皮菊,原產(chǎn)北美,中國(guó)廣泛栽培并歸化[1].天人菊作為推廣的綠化景觀植物,抗旱能力強(qiáng),是良好的防風(fēng)固沙植物.研究和培育耐旱、耐貧瘠的天人菊,不僅可以節(jié)約資源成本,擴(kuò)大城市綠化面積, 還能提高生態(tài)效益和社會(huì)效益[2-3].
葉綠體中的matK(maturase kinase)基因進(jìn)化速度快、具有高度多態(tài)性,是植物物種進(jìn)化和鑒定過(guò)程中的一種重要的分子標(biāo)記[4].研究表明,matK基因快速進(jìn)化過(guò)程中,會(huì)存在堿基替換、堿基缺失和插入突變,從而導(dǎo)致遺傳變異,這也是物種進(jìn)化的重要?jiǎng)恿5-7].基因組測(cè)序數(shù)據(jù)從核苷酸水平上提供了變異和突變的詳細(xì)信息,通過(guò)同源性比較,可進(jìn)行物種鑒定和判斷基因組中是否存在特殊突變從而影響其表型改變[8].
植物的系統(tǒng)進(jìn)化分析和親緣關(guān)系鑒定一直是植物學(xué)的研究熱點(diǎn).菊科植物進(jìn)化過(guò)程中存在雜交和分化等特點(diǎn),使得其科內(nèi)種類(lèi)繁多,其系統(tǒng)發(fā)育關(guān)系的建立需要大量的遺傳信息數(shù)據(jù)支持[9].其中,天人菊的具體基因信息研究較少,有待進(jìn)一步的完善.本研究通基因克隆技術(shù),獲取完整的天人菊基因matK信息,為后續(xù)天人菊的分子生物學(xué)研究提供數(shù)據(jù).再通過(guò)一系列的生物信息學(xué)方法將天人菊的氨基酸序列與同源性較高的12條氨基酸序列進(jìn)行比較,從遺傳進(jìn)化角度探討天人菊matK基因序列變異對(duì)其蛋白分子功能和生物學(xué)過(guò)程的影響,進(jìn)一步探索matK基因的特征與進(jìn)化規(guī)律,評(píng)估葉綠體基因組對(duì)于植物系統(tǒng)進(jìn)化研究的貢獻(xiàn).
8月份獲取天人菊種子,采摘地點(diǎn)為云南省呈貢區(qū),于次年4月初在實(shí)驗(yàn)室進(jìn)行天人菊種子萌發(fā)培養(yǎng),20~24 ℃ 條件下10~15 d 出苗[10],待發(fā)芽后將幼苗移栽到盆中,長(zhǎng)出嫩葉時(shí),方可采摘天人菊嫩葉部分進(jìn)行DNA提取.
根據(jù)相關(guān)文獻(xiàn)[11],設(shè)計(jì)3對(duì)引物用于擴(kuò)增天人菊matK基因的完整基因,具體的引物信息如表1所示.
表1 引物信息
1.2.1 天人菊DNA提取及檢測(cè)
將天人菊嫩葉清洗干凈,加入液氮快速研磨使細(xì)胞破碎,用改良SDS法提取DNA,然后用1.5%瓊脂糖凝膠電泳檢測(cè)DNA質(zhì)量及純度[12].
1.2.2 天人菊matK基因PCR擴(kuò)增
反應(yīng)體系及反應(yīng)條件如下表2所示,待反應(yīng)結(jié)束后,各取產(chǎn)物 8 μL 于1.5%膠進(jìn)行瓊脂糖凝膠電泳檢測(cè)[13].
表2 PCR反應(yīng)體系及反應(yīng)條件的設(shè)定
1.2.3 PCR產(chǎn)物回收、克隆及測(cè)序
用多功能DNA純化回收試劑盒對(duì)PCR擴(kuò)增產(chǎn)物進(jìn)行膠回收純化,用Pbm16A pBM16A-ToPo Cloning Smart Kit試劑盒進(jìn)行克隆,將回收的DNA片段連接到pBM16A-ToPo載體上,室溫下(20~30 ℃)反應(yīng)5~30 min,取連接產(chǎn)物轉(zhuǎn)化到融化的DH5α感受態(tài)細(xì)胞中,加入無(wú)菌的不含抗生素的LB于 37 ℃ 下培養(yǎng),再將菌液涂布在含有IPTG,X-gal的LB氨芐平板上,挑選克隆子,菌落PCR方法鑒定陽(yáng)性克隆,用M13通用引物對(duì)陽(yáng)性質(zhì)粒進(jìn)行測(cè)序分析[14].
1.3.1 測(cè)序結(jié)果處理
采用MEGA 6.0將天人菊matK基因堿基序列翻譯成蛋白質(zhì)氨基酸序列,在NCBI中進(jìn)行blast比較,獲得到了12條同源性較高的氨基酸序列.
1.3.2 生物信息學(xué)分析
利用下表3中的一系列生物信息學(xué)軟件,對(duì)實(shí)驗(yàn)中所有的基因序列進(jìn)行分析.
表3 生物信息學(xué)分析軟件
圖1 重組質(zhì)粒M13PCR檢測(cè)電泳結(jié)果
重組質(zhì)粒M13PCR檢測(cè)電泳結(jié)果如圖1所示(M為DNA標(biāo)準(zhǔn)物DL2000+1500;1為空載質(zhì)粒;2~4為引物1、2、3重組質(zhì)粒M13 PCR檢測(cè)結(jié)果),空載質(zhì)粒PCR條帶大小約為 200 bp,天人菊重組質(zhì)粒PCR產(chǎn)物條帶大小約為 1 000~1 500 bp[5],說(shuō)明轉(zhuǎn)化成功,2、3、4處的條帶為目標(biāo)基因,對(duì)重組子PCR產(chǎn)物進(jìn)行測(cè)序,獲取重組子的基因序列.
經(jīng)測(cè)序獲取天人菊堿基序列 2 631 bp(見(jiàn)圖2),利用在線(xiàn)工具ORFfinder-NCBI分析,結(jié)果顯示matK基因 801 bp 的ATG為起始密碼子,2 096 bp 的TGA為終止密碼子,總長(zhǎng)度為 1 296 bp,獲得432個(gè)氨基酸序列(包含一個(gè)終止子),如下圖3所示.
圖2 天人菊matK基因堿基序列
圖3 天人菊matK基因氨基酸序列
2.3.1 天人菊matK基因氨基酸序列二級(jí)結(jié)構(gòu)
應(yīng)用軟件包DNAStarLasergene 7.1中protean分析天人菊matK蛋白二級(jí)結(jié)構(gòu),結(jié)果如圖4所示,采用Chou-Fasman預(yù)測(cè)方法得到該氨基酸序列約有12個(gè)α-螺旋、20個(gè)β-折疊和31個(gè)無(wú)規(guī)則卷曲組成.
圖4 matK蛋白二級(jí)結(jié)構(gòu)組成
使用SOPMA軟件對(duì)13條matK蛋白進(jìn)行分析(圖5),結(jié)果顯示構(gòu)成α-螺旋的氨基酸數(shù)量最多,占總氨基酸數(shù)量的42.89%~50.59%;無(wú)規(guī)則卷曲數(shù)量次之,占26.74%~32.02%;延伸鏈占比18.18%~22.40%;最少的是β-轉(zhuǎn)角,僅有3.36%~5.59%.
2.3.2 天人菊matK基因氨基酸序列三級(jí)結(jié)構(gòu)
應(yīng)用Swiss-Model對(duì)天人菊matK蛋白構(gòu)建三級(jí)結(jié)構(gòu)[15-16],其序列一致性為17.77%,下載PDB格式,并在PyMOL中打開(kāi),三級(jí)結(jié)構(gòu)模型見(jiàn)圖6.matK蛋白三級(jí)模型的拉氏圖(見(jiàn)圖7).圖中A,B,L區(qū)顯示有273個(gè)氨基酸,占總氨基酸數(shù)的70.4%; a,b,l,p區(qū)顯示有98個(gè)氨基酸,占25.3%;允許區(qū)為8個(gè),非允許區(qū)為9個(gè);末端殘基(不包括Gly和Pro)為2個(gè);甘氨酸殘基16個(gè);脯氨酸殘基12個(gè).
2.3.3 天人菊matK氨基酸序列的理化特征分析
使用在線(xiàn)軟件PredictProtein分析天人菊matK基因的亞細(xì)胞定位(見(jiàn)圖8),圖中綠色部分為葉綠體亞細(xì)胞定位,發(fā)現(xiàn)matK基因只存在于真核生物的葉綠體中,符合目前matK基因的相關(guān)研究結(jié)果[17].
圖5 天人菊matK蛋白與其他12種蛋白的二級(jí)結(jié)構(gòu) 圖6 matK蛋白三級(jí)結(jié)構(gòu)
圖7 matK蛋白三級(jí)模型的拉氏圖 圖8 matK蛋白進(jìn)行亞細(xì)胞定位結(jié)果
靶位點(diǎn)分析表明有7個(gè)蛋白結(jié)合區(qū),分別位于83、114、182、202、203、325、406、426位氨基酸,無(wú)多核苷酸結(jié)合區(qū)(圖9).
利用軟件Protparam和TMHMM2.0[18-19],對(duì)天人菊與其他12種不同蛋白的理化性質(zhì)進(jìn)行比較,表4顯示,matK基因全長(zhǎng)為 1 290 ~1 500 bp,編碼430~500個(gè)氨基酸,理論等電點(diǎn)為大于9.6,不穩(wěn)定指數(shù)大于40,平均疏水性為負(fù)值,matK蛋白是堿性不穩(wěn)定親水性蛋白,無(wú)跨膜結(jié)構(gòu),無(wú)信號(hào)肽,亞細(xì)胞定位于真核生物的葉綠體中.
圖9 matK蛋白氨基酸序列結(jié)合區(qū)結(jié)果
表4 天人菊matK蛋白與其他12種蛋白的理化特征
2.3.4 同源性分析
天人菊matK蛋白保守結(jié)構(gòu)域預(yù)測(cè)分析見(jiàn)圖10.圖10表明,本實(shí)驗(yàn)所克隆的天人菊matK蛋白屬于matK家族.將天人菊matK氨基酸序列輸入NCBI進(jìn)行blast 比對(duì),與之相似性在96%以上的基因皆來(lái)自于菊科植物,從遺傳角度說(shuō)明matK基因在菊科植物中具有一定的保守性,得到該蛋白的同源性(見(jiàn)表5).
通過(guò)BLAST獲取氨基酸序列,選擇同源性排序較高的菊科物種8個(gè)(Chrysanthemumindicum,Chrysanthemumxmorifolium,Chrysanthemumindicum,Artemisiafrigida,Artemisiamontana,Launaeasarmentosa,Prenanthespurpurea,Oncosiphongrandifloras),和同源性排序較高的非菊科物種4個(gè)(Cacosmiahieronymi,Cacosmiarugose,Rosacalifornica,Rubusursinus),用于鑒定天人菊的親緣關(guān)系.
圖10 天人菊matK蛋白保守結(jié)構(gòu)域預(yù)測(cè)分析
表5 天人菊matK基因氨基酸同源性比較
利用MEGA 6.0軟件將天人菊matK氨基酸序列與12種氨基酸序列一起構(gòu)建N~J系統(tǒng)進(jìn)化樹(shù)(圖11).并在表6中展示了它們之間的遺傳距離,其中,天人菊與野菊花的遺傳距離最近為0.006,與加州玫瑰的遺傳距離最遠(yuǎn)為0.032.圖11分類(lèi)顯示,第1大類(lèi)是天人菊matK氨基酸序列與3個(gè)菊屬、2個(gè)艾屬及1個(gè)大翅薊屬的matK氨基酸序列很好地聚成了一類(lèi),這6個(gè)菊科物種聚為一類(lèi)符合形態(tài)學(xué)的分類(lèi)研究結(jié)果[9],其中,大翅薊屬下的Oncosiphon grandifloras(遺傳距離為0.009)在第1大類(lèi)下單獨(dú)成為一個(gè)分支.第2大類(lèi)由遺傳距離同為0.013的蔓莖栓果菊和盤(pán)果菊組成一支與另一支遺傳距離同為0.014的Cacosmiahieronymi和Cacosmia rugose 2個(gè)物種一起構(gòu)成姐妹類(lèi)群關(guān)系,表明同一科內(nèi)物種的屬間聚類(lèi)并不一致,因此在構(gòu)建系統(tǒng)進(jìn)化樹(shù)時(shí)不能只選取單個(gè)基因序列或2個(gè)基因序列,而應(yīng)選擇多個(gè)屬間、屬內(nèi)物種共同構(gòu)建系統(tǒng)進(jìn)化樹(shù),才能使鑒定結(jié)果更準(zhǔn)確.第3大類(lèi)為遺傳距離較遠(yuǎn)的加州玫瑰和北美黑莓聚為一類(lèi).分類(lèi)結(jié)果證實(shí)了實(shí)驗(yàn)獲得的天人菊matK基因歸屬于菊科植物,還表明了matK氨基酸序列在不同的生物種類(lèi)中具有高度的保守性[5],因此才能在葉綠體中能表達(dá)出相似的生物學(xué)功能.
圖11 天人菊與12個(gè)物種matK氨基酸序列的系統(tǒng)進(jìn)化樹(shù)
2.3.5 天人菊matK基因氨基酸變異位點(diǎn)分析
使用Clustal X 1.83軟件和MEGA 6.0軟件對(duì)天人菊matK基因氨基酸序列和其他12條氨基酸序列進(jìn)行比對(duì),圖12結(jié)果顯示,總共有163處差異氨基酸.其中,天人菊與遺傳距離較近的5條菊科植物氨基酸序列(Chrysanthemumindicum、Artemisiafrigida、Chrysanthemumxmorifolium、Chrysanthemumindicum、Artemisiamontana)比對(duì),發(fā)現(xiàn)天人菊在第14和15位缺失2個(gè)谷氨酰胺(Q),而在第80、81和82位多出了蘇氨酸(T)、脯氨酸(P)、苯丙氨酸(F)這3個(gè)氨基酸,對(duì)比發(fā)現(xiàn),有且僅有15處差異氨基酸,且基因的5′端氨基酸變異頻率低于3′端,說(shuō)明matK基因在屬間和屬內(nèi)差異性不大.而在相隔較遠(yuǎn)的加州玫瑰(Rosacalifornica)和北美黑莓(Rubusursinus)中,存在138處差異氨基酸,說(shuō)明matK基因在不同科的生物中存在一定程度的分化.
表6 天人菊與其他12種不同基因之間的遺傳距離
圖12 天人菊matK基因氨基酸變異位點(diǎn)分析
2.3.6matK蛋白基因本體論分析
通過(guò)PredictProtein軟件分別對(duì)天人菊matK蛋白以及其他12種來(lái)自不同物種的matK蛋白進(jìn)行分析[20],其分子功能(表7)和生物學(xué)過(guò)程(表8)的可靠度區(qū)間為60%~70%,說(shuō)明matK蛋白功能在不同生物中具有較高的一致性.分子功能表現(xiàn)為結(jié)合活性,包括:雜環(huán)化合物結(jié)合、有機(jī)環(huán)化合物結(jié)合、核酸結(jié)合、RNA結(jié)合.生物學(xué)過(guò)程包括:細(xì)胞過(guò)程、細(xì)胞代謝過(guò)程、細(xì)胞氮化合物代謝過(guò)程、細(xì)胞內(nèi)芳香族化合物代謝過(guò)程、代謝過(guò)程、主要代謝過(guò)程、雜環(huán)代謝過(guò)程、含核酸的化合物代謝過(guò)程、氮化合物代謝過(guò)程、有機(jī)物代謝過(guò)程、有機(jī)環(huán)化合物代謝過(guò)程、大分子代謝過(guò)程、核酸代謝過(guò)程、基因表達(dá)、RNA剪接、RNA過(guò)程、RNA代謝過(guò)程、ncRNA過(guò)程、ncRNA代謝過(guò)程、mRNA過(guò)程、mRNA代謝過(guò)程、tRNA過(guò)程、tRNA代謝過(guò)程.matK蛋白參與了眾多生物學(xué)過(guò)程,說(shuō)明它在葉綠體執(zhí)行功能的過(guò)程中扮演著極其重要的角色[21].
表7 天人菊matK蛋白分子功能本體分析及可靠度 %
表8 天人菊matK蛋白生物學(xué)過(guò)程本體分析及可靠度 %
續(xù)表8
天人菊具有較強(qiáng)的抗旱性,能夠適應(yīng)山地及荒野等貧瘠土地.目前,對(duì)天人菊的研究主要集中于種子萌發(fā)、抗旱性評(píng)價(jià)、栽培管理等方面.潘立雪等[22]對(duì)天人菊種子鹽堿脅迫的耐受性研究,以及抗寒性天人菊品種的育種研究,都是從宏觀進(jìn)化的層面來(lái)選育天人菊,若從微觀進(jìn)化的層面著手,可探索不同地區(qū)、不同抗寒抗旱能力的天人菊基因變化規(guī)律,追蹤其分子功能和生物學(xué)過(guò)程,為優(yōu)化育種和種植資源保護(hù)提供新思路.本研究通過(guò)對(duì)天人菊matK基因克隆并測(cè)序,獲得了一條總長(zhǎng)度為 1 296 bp的核苷酸序列,編碼432個(gè)氨基酸,并建立其三級(jí)結(jié)構(gòu)模型,為后續(xù)研究其他品種天人菊基因并進(jìn)行遺傳變異的規(guī)律性探究提供了數(shù)據(jù)支撐.將天人菊與其他12種不同matK蛋白進(jìn)行比較,得知天人菊matK氨基酸序列與遺傳距離較近的菊科植物相比,存在15處氨基酸變異位點(diǎn),科內(nèi)氨基酸變異位點(diǎn)較少.唐萍等[6]研究通過(guò)indels和核苷酸替代方式可實(shí)現(xiàn)基因突變,假設(shè)優(yōu)化天人菊育種時(shí),尋找優(yōu)良品種的變異位點(diǎn),人為定向干預(yù)天人菊基因突變,使天人菊性狀隨之發(fā)生變化,最終可達(dá)到篩選優(yōu)良品種的目的.而天人菊與遺傳距離較遠(yuǎn)的玫瑰等其他的生物相比,氨基酸變異位點(diǎn)大于30%,與以往研究結(jié)果一致,表明matK氨基酸序列在不同的生物中存在一定程度的分化[21].
植物的matK基因作為葉綠體基因組中的重要基因,是植物DNA條形碼中的核心序列,廣泛的用于植物的物種親緣關(guān)系研究和物種的鑒定,matK基因結(jié)構(gòu)相對(duì)保守,在同屬類(lèi)植物中同源性較高而進(jìn)化速率較慢,可應(yīng)用于下一級(jí)種的分類(lèi)與鑒定[23].朱斌等[9]用CDS、rbcL基因序列、rbcL+matK基因序列對(duì)20個(gè)屬50種菊科植物親緣關(guān)系進(jìn)行了分析.黃瓊林等[24]將matK基因用于有效地鑒別高良姜及其同屬混偽品.戚華沙等[25]利用trnH-psbA序列和matK序列結(jié)合對(duì)普通油茶和越南油茶與其他供試油茶物種進(jìn)行了有效的鑒別.菊科是雙子葉植物綱下面的第一大科,其科內(nèi)等級(jí)劃分和系統(tǒng)學(xué)研究存在巨大挑戰(zhàn)[9],陳芙蓉等[26]將psbA-trnH+matK+trnL組合序列作為DNA條形碼,建立了一種快速鑒定野菊和藥用菊的方法.本研究在天人菊中克隆得到的matK基因,可有效應(yīng)用于天人菊屬的下一級(jí)種的分類(lèi)研究,解決天人菊種植資源鑒定問(wèn)題,為天人菊的分子鑒定提供了數(shù)據(jù),為天人菊育種提供了新思路,也為菊科植物分子生物學(xué)研究提供了相關(guān)的理論依據(jù).