王娟,石大川,陳皓寧,3,吳麗青,閆彩霞,陳靜,趙小波,孫全喜,苑翠玲,牟藝菲,單世華*,李春娟
(1.山東省花生研究所,山東 青島, 266100;2.山東省青島市農(nóng)業(yè)科學(xué)研究院,山東 青島, 266100;3.中國(guó)海洋大學(xué)食品科學(xué)與工程學(xué)院,山東 青島, 266000;4.山東省菏澤市農(nóng)業(yè)科學(xué)研究院,山東 青島, 274000)
氮素在植物體內(nèi)參與了蛋白質(zhì)、核酸等生物大分子的合成,對(duì)其產(chǎn)量和品質(zhì)的影響較大[1]。同時(shí),提高氮素利用效率(NUE,nitrogen use efficiency)也是發(fā)展綠色生態(tài)農(nóng)業(yè)的熱點(diǎn)問題。近年來,為了穩(wěn)產(chǎn)增產(chǎn),過量施用氮肥導(dǎo)致花生(Arachis hypogaeaL.)自身固氮能力下降,還造成一系列的環(huán)境污染問題,如土壤酸化、板結(jié)、水體污染、溫室氣體排放等[2]。因此,從生理與分子角度揭示相關(guān)基因功能及其分子作用機(jī)制,通過遺傳改良提高花生氮素利用效率,在增加花生產(chǎn)量的同時(shí)減少施肥對(duì)環(huán)境造成的壓力,對(duì)綠色生態(tài)農(nóng)業(yè)的實(shí)現(xiàn)具有重要的理論及生產(chǎn)意義。
土壤中,植物所利用的氮素形式分為銨態(tài)氮(NH4+)和硝態(tài)氮(NO3-)。多種旱地作物(煙草、小麥、大豆、油菜、木薯、白菜等)氮吸收的相關(guān)研究表明,硝態(tài)氮(NO3-)是旱地作物吸收利用的主要氮源。植物從土壤中吸收硝態(tài)氮的能量主要來源于質(zhì)子電化學(xué)勢(shì)梯度:NO3-濃度高于1 mmol/L時(shí),其吸收主要依靠低親和轉(zhuǎn)運(yùn)系統(tǒng)(the low-affinity transport system,LATS)完成;NO3-濃度低于1 mmol/L 時(shí),其吸收主要依靠高親和轉(zhuǎn)運(yùn)系統(tǒng)(the high-affinity transport system,HATS)完成,分別由硝酸鹽轉(zhuǎn)運(yùn)蛋白(NRT)的NPF(NRT1/PTR)和NRT2兩大轉(zhuǎn)運(yùn)蛋白家族負(fù)責(zé)執(zhí)行。NPF 家族除了轉(zhuǎn)運(yùn)硝酸鹽,還可以轉(zhuǎn)運(yùn)氨基酸、多肽、硫配糖體、生長(zhǎng)素以及脫落酸等[3],而NRT2 轉(zhuǎn)運(yùn)蛋白是位于原生質(zhì)膜上的膜蛋白,具有典型的跨膜轉(zhuǎn)運(yùn)蛋白結(jié)構(gòu)[4,5]。所有的NRT2 均為高親和性的轉(zhuǎn)運(yùn)體,且只把硝酸鹽作為特異性底物[6]。
目前,就植物高親和硝酸鹽轉(zhuǎn)運(yùn)蛋白(NRT2)基因家族鑒定方面,在模式植物擬南芥(Arabidopsis thaliana)中發(fā)現(xiàn)了7 個(gè)NRT2 基因家族成員[7~9]。作物中,水稻(Oryza sativa)挖掘到5 個(gè)NRT2 成員[10];大麥(Hordeum vulgare)通過基因克隆到4 個(gè)NRT2成員[11];谷子(Setaria italica)中發(fā)現(xiàn)了7 個(gè)NRT2 成員;高粱(Sorghum bicolor)中檢測(cè)到4個(gè)NRT2 成員;玉米(Zea mays)中找到了3 個(gè)NRT2 成員。豆科植物中,蒺藜苜蓿(Medicago truncatula)中發(fā)現(xiàn)了3 個(gè)NRT2 成員[12,13];大豆(Glycine max)中發(fā)現(xiàn)了3 個(gè)NRT2 成員。但是,花生NRT2家族基因相關(guān)研究尚未見報(bào)道[14]。
栽培種花生除了根瘤菌固氮,通過根系吸收土壤中的硝酸氮也是氮素利用的重要方式。栽培種花生全基因組以及轉(zhuǎn)錄組等數(shù)據(jù)的釋放為重要性狀基因的鑒定和發(fā)掘提供有利條件[15~18]。本研究前期通過全基因組水平的關(guān)聯(lián)分析(nenome wide association study,GWAS)與QTL 定位(QTL mapping)的聯(lián)合分析對(duì)花生產(chǎn)量性狀相關(guān)基因進(jìn)行錨定。在參考水稻、大豆等作物產(chǎn)量性狀基因驗(yàn)證結(jié)果的基礎(chǔ)上,從數(shù)目龐大的候選基因中篩選出花生高親和硝酸鹽轉(zhuǎn)運(yùn)蛋白基因?yàn)楫a(chǎn)量性狀相關(guān)候選基因[19]。在此,以高親和硝酸鹽轉(zhuǎn)運(yùn)蛋白(NRT2)基因家族為研究對(duì)象,通過生物信息學(xué)揭示NRT2 基因家族特征及表達(dá)模式,為進(jìn)一步研究花生NRT2 基因家族成員的生物學(xué)功能奠定基礎(chǔ)。
以栽培種花生(Arachis hypogaeaL.)為研究對(duì)象,NRT2基因序列信息來源于花生基因組數(shù)據(jù)庫Peanutbase(https://peanutbase. org/)及NCBI 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/)。
1.2.1 NRT2 蛋白基因家族的查詢和確認(rèn) 在花生基因組數(shù)據(jù)庫以“Nitrate transporter 2”為關(guān)鍵詞,搜索得到花生NRT2 基因家族在A.duranensis、A.ipaensis及栽培種花生(A. hypogaeaL.)的所有候選成員序列,將其在花生基因數(shù)據(jù)庫Peanutbase(https://www. peanutbase. org/)和NCBI 數(shù)據(jù)庫(http://www.ncbi. nlm. nih. gov/)中進(jìn)行Blastp 檢索(e 值≤10-15)。然后在NCBI(https://www.ncbi. nlm. nih. gov/)以擬南芥NRT2 基因家族7 個(gè)成員序列對(duì)比以上花生NRT2基因進(jìn)行序列同源性對(duì)比[7,8],去除冗余成員后,作為基因家族候選成員。
通過Pfam 在線軟件(http://pfam.janelia.org/)的sequence search 功能[20]與SMART 在線軟件的normal model P 模塊(http://smart.embl-heidelberg.de/)進(jìn)行NRT2基因家族蛋白結(jié)構(gòu)域預(yù)測(cè)[21]。該家族屬于MFS(major facilitator superfamily)超家族成員之一,由此對(duì)獲得的蛋白序列進(jìn)一步確認(rèn),篩除不具有典型結(jié)構(gòu)域(PLN00028 super family)的基因,得到了花生NRT2的基因家族成員。
1.2.2 基因特性分析及染色體定位分析 通過Peanutbase 數(shù)據(jù)庫里花生基因組的gff3 文件中提取NRT2 基因家族的染色體起始、結(jié)束位置以及基因長(zhǎng)度;利用NCBI 在線Blast 工具搜索獲得擬南芥NRT2 蛋白的同源信息。利用ExPASy-ProtParam(http://web. expasy. org/protparam/)線 上 分 析 花 生NRT2基因家族成員的分子量、等電點(diǎn)等理化性質(zhì)。利用MapInspect 在線軟件(http://www. plantbreeding. wur. nl/UK/soft-ware_mapinspect. htm)進(jìn)行染色體物理分布圖的繪制,獲得NRT2 基因家族成員的染色體物理位置信息。
1.2.3 基因進(jìn)化分析 利用花生NRT2 基因家族成員與大豆、苜蓿、水稻及擬南芥等物種NRT2 基因家族成員的蛋白序列,在MEGA v7.0 上對(duì)NRT2基因家族進(jìn)行序列比對(duì),采用鄰接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹,采用Bootstraping 法對(duì)進(jìn)化樹進(jìn)行評(píng)估與分組得到花生與各物種間親緣關(guān)系。校驗(yàn)參數(shù):no of different,重復(fù)5000次。
1.2.4 基因結(jié)構(gòu)及保守基序分析 Peanutbase 數(shù)據(jù)庫可獲得花生NRT2基因的核苷酸全長(zhǎng)及CDS 區(qū)域在基因結(jié)構(gòu)預(yù)測(cè)。通過可視化工具Gene Structure Display Server 2.0(http://gsds. cbi. pku. edu.cn/),利用Sequence(FASTA)格式繪制基因結(jié)構(gòu)圖。利用在線軟件MEME Suite 5.1.0(http://meme.nbcr.net/meme/cgi-bin/meme.cgi)根據(jù)基因家族成員的氨基酸序列預(yù)測(cè)花生NRT2 基因家族保守基序,參數(shù)設(shè)定為classic mode,motif數(shù)目為10。
1.2.5 不同組織的基因表達(dá)量分析 在花生全生育期22 個(gè)不同發(fā)育時(shí)間不同組織中基因表達(dá)情況轉(zhuǎn)錄組數(shù)據(jù)基礎(chǔ)上[22],提取的花生NRT2基因的FPKM(fragments per kilobase of exon model pre million mapped reads)數(shù)值通過Excel進(jìn)行l(wèi)og2的數(shù)據(jù)轉(zhuǎn)化,利用熱圖制作軟件HemI 進(jìn)行Hierarchical clustering(HCL)聚類繪制熱圖來展示花生NRT2基因表達(dá)量情況。根據(jù)花生NRT2基因在不同組織不同發(fā)育時(shí)期的基因表達(dá)量,預(yù)測(cè)不同NRT2基因的表達(dá)水平。
通過對(duì)NRT2基因典型結(jié)構(gòu)域篩選,人工去除不完整序列或較短序列的基因,最終確定了10個(gè)花生NRT2基因。與二倍體野生種花生相比,A. dura?nensis中發(fā)現(xiàn)有5 個(gè)NRT2基因,A. ipaensis含有12個(gè)NRT2基因。為了更加直觀地了解NRT2基因家族在染色體上的位置信息,我們繪制了栽培種花生及二倍野生花生的染色體分布圖(圖1),顯示該基因家族成員分布不均勻。A. ipaensis基因組上分布有12 個(gè)NRT2基因,其家族成員分布密度最高。四倍體栽培種花生A 基因組與A. duranensis基因組相比,有三對(duì)基因(Chr01:AhNRT2.6c/AdNRT2.4d;Chr03:AhNRT2.5c/AdNRT2.4a; Chr06:AhNRT2.7b/AdNRT2.2a)存在同源關(guān)系;四倍體栽培種花生B 基因組與A. ipaensis有五對(duì)基因(Chr11:AhNRT2.6a/Chr01:AiNRT2.2b; Chr12:AhNRT2.6b/ Chr02:Ai?NRT2.6b; Chr13:AhNRT2.5b/ Chr03:AiNRT2.4d;Chr16:AhNRT2.7a/ Chr06:AiNRT2.2a; Chr20:AhNRT2.5a/ Chr10:AiNRT2.4f)存在同源關(guān)系。栽培種花生全基因組上,3 號(hào)(AhNRT2.5c)和13 號(hào)(AhNRT2.5b)染色體,6 號(hào)(AhNRT2.7b)和16 號(hào)(AhNRT2.7a)染色體上的基因存在同源關(guān)系。
圖1 栽培種花生NRT2基因在染色體上的分布Fig.1 Distribution of NRT2 genes on chromosomes in peanut
利用MEGA v7.0 將栽培種花生的10 個(gè)NRT2蛋白序列與7 個(gè)擬南芥(At)NRT2 蛋白序列,3 個(gè)大豆(Gm)NRT2 蛋白序列,4 個(gè)水稻(Os)NRT2 蛋白序列以及3 個(gè)苜蓿(Mt)NRT2 蛋白序列等進(jìn)行多重序列比對(duì)并構(gòu)建系統(tǒng)進(jìn)化樹。以與其它物種NRT2 序列的相似性高低與基礎(chǔ),將這些NRT2 分為5 支,分別命名Clade 1,2,3,4,5(圖2)。除Clade 4 外,花生NRT2 蛋白序列并未因物種差異而單獨(dú)聚類。Clade 1,栽培種花生AhNRT2.4 與大豆GmNRT2.4親緣關(guān)系較近;Clade 2,栽培種花生AhNRT2.5b,AhNRT2.5c 與苜蓿MtNRT2.7c 聚為一小支;Clade 3,栽培種花生AhNRT2.7a 和AhNRT2.7b 與擬南芥AtNRT2.7 及水稻OsNRT2.4 聚為一支; 最后以AhNRT2.6c單獨(dú)為一支。
根據(jù)基因注釋與ProtParam 進(jìn)一步分析,我們發(fā)現(xiàn)這10 個(gè)NRT2 編碼蛋白中,大部分成員編碼的蛋白氨基酸長(zhǎng)度在69~553 aa之間。其中,AhNRT2.5a基因的轉(zhuǎn)錄本2 編碼最短,僅為69 個(gè)氨基酸,其分子量為7.8 kD,序列不完整;AhNRT2.5b 編碼最長(zhǎng),氨基酸長(zhǎng)度為553,分子量為55.24 kD。具有10~12個(gè)跨膜區(qū)的家族成員有5 個(gè),分別是AhNRT2.4,AhNRT2.5b,AhNRT2.5c,AhNRT2.7a 和AhNRT2.7 b。除AhNRT2.6c 外,各成員等電點(diǎn)在8.52~9.85之間,變化幅度較小?;ㄉ鶱RT2 蛋白基因家族的理化性質(zhì)與其他物種NRT2 蛋白家族的理化性質(zhì)基本一致。
基于花生NRT2基因家族10 個(gè)氨基酸序列及CDS 序列文件,利用MEGA 7.0、GSDS 2.0 與MEME在線軟件構(gòu)建了花生NRT2 基因家族進(jìn)化樹、保守結(jié)構(gòu)域與保守基序結(jié)構(gòu)圖(圖3)。在GSDS 在線軟件上通過CDS 序列與基因序列比對(duì)可得到CDS 序列中各外顯子在基因上的定位信息。結(jié)果表明花生各個(gè)NRT2 基因家族成員之間結(jié)構(gòu)相似,大致可以分成五類。不同類型間保守基序分布順序不同,保守基序也各有不同。在線軟件MEME Suite 5. 1. 0 可以預(yù)測(cè)基因保守基序,對(duì)花生NRT2 基因家族10 個(gè)成員保守基序分析結(jié)果顯示共存在10 種保守基序?;ㄉ鶱RT2基因家族分為4個(gè)亞組,基序分析結(jié)果顯示,組內(nèi)具有相似或相同的基序類型和排序順序。Group A 和Group C 的組內(nèi)基因家族成員的各保守基序分布順利和類型完全一致,但內(nèi)含子長(zhǎng)度有所差異;Group B 的基序分布類型相似,但基序數(shù)目有差異,分布有2~5 個(gè)基序;Group D 僅包含1個(gè)成員,有3個(gè)保守基序。
圖3 栽培種花生NRT2基因結(jié)構(gòu)及保守基序分析Fig.3 Genic structure and conserved motifs analysis of NRT2 genes in peanut
表1 花生NRT2基因家族成員信息Table 1 Identification of NRT2 gene family in peanut
以栽培種花生22 個(gè)組織中基因表達(dá)數(shù)據(jù)為基礎(chǔ)[22],提取NRT2基因相關(guān)數(shù)據(jù)進(jìn)行組織表達(dá)模式分析,利用HemI 軟件將數(shù)據(jù)進(jìn)行聚類分析和可視化處理。熱圖表明:在不同組織中和發(fā)育時(shí)期的表達(dá)具有明顯的組織特異性(圖4)。AhNRT2.5a基因在花生22個(gè)組織中整體表達(dá)量偏高;而AhNRT2.6b和AhNRT2.2整體表達(dá)量偏低。AhNRT2.6a僅在主莖葉片和根中有少量表達(dá),同樣,AhNRT2.6c在葉、莖、花、種子等組織某些部位不產(chǎn)生表達(dá)。其它基因表達(dá)量因組織、發(fā)育時(shí)期表達(dá)量有差異,相比之下基因表達(dá)量居中。硝酸鹽轉(zhuǎn)運(yùn)蛋白與氮轉(zhuǎn)運(yùn)相關(guān)的有四個(gè)基因AhNRT2.4、AhNRT2.5a、AhNRT2.5b和AhNRT2.5c,在組織根中表達(dá)量相對(duì)較高,表明它們?cè)诟牡罩邪l(fā)揮重要作用。
圖4 花生NRT2基因組織特異性表達(dá)分析Fig.4 Tissue-specific expression of NRT2 in peanut
氮素利用效率影響著花生的產(chǎn)量。同時(shí),提高氮素利用效率也有助于推動(dòng)綠色生態(tài)農(nóng)業(yè)的發(fā)展。硝酸鹽轉(zhuǎn)運(yùn)蛋白有NPF(NRT1/PTR)和NRT2 兩大轉(zhuǎn)運(yùn)蛋白家族,分別在低親和以及高親和轉(zhuǎn)運(yùn)系統(tǒng)中負(fù)責(zé)硝酸鹽的吸收。錢瑜等[14]通過對(duì)8 種經(jīng)過全基因組測(cè)序的物種(大白菜、大豆、楊樹、葡萄、玉米、水稻、高粱、二穗短柄草)NRT2 的同源基因分析,表明大白菜NRT2 家族經(jīng)歷了基因組三倍化及基因片段丟失事件?;ㄉ陨蟽纱蠡蚣易宓南嚓P(guān)研究,僅檢索到孔偉偉等[23]從花生基因組中找出37 個(gè)NRT1(NPF)基因,不同組織中的表達(dá)具有明顯的組織特異性,而NRT2 基因家族的研究未見報(bào)道。
本研究利用花生基因組數(shù)據(jù)庫Peanutbase 及NCBI 數(shù)據(jù)庫搜索,鑒定到10 個(gè)栽培種花生NRT2基因,分別位于9個(gè)染色體上。與野生二倍體NRT2基因家族成員的分布比對(duì)指出,3 號(hào)和13 號(hào)染色體,6號(hào)和16 號(hào)染色體上的NRT2基因分別存在同源關(guān)系。所構(gòu)建的花生NRT2 基因家族進(jìn)化樹可分為五個(gè)分支,各分支包含NRT2 家族成員,這說明該家族成員并未因物種差異而單獨(dú)聚類。各分支的內(nèi)含子數(shù)量及基因結(jié)構(gòu)相似,保守基序的排序和類型保持高度的一致性,這與水稻[10]、大豆[24]、苜蓿[13,14]等作物NRT2 基因家族的結(jié)構(gòu)和特征相似?;ㄉ鶱RT2基因在各個(gè)組織不同時(shí)期表達(dá)量存在較大差異。其 中,AhNRT2.4,AhNRT2.5a,AhNRT2.5b和AhNRT2.5c四個(gè)基因在根中有較高表達(dá)量,推測(cè)這些NRT2基因在根系的硝酸鹽吸收和轉(zhuǎn)運(yùn)中發(fā)揮重要作用。值得注意的是,AhNRT2.5a還在根瘤、葉、繁殖性莖尖、果柄形態(tài)、果殼形態(tài)、種子形態(tài)各組織中某個(gè)時(shí)期表達(dá)量水平均高,這說明它在花生多個(gè)生物學(xué)過程起著重要的基礎(chǔ)作用。另外,預(yù)測(cè)到AhNRT2.4、AhNRT2.5b和AhNRT2.5c的 跨 膜 區(qū) 有10~12 個(gè),屬于典型的跨膜蛋白,這是參與氮轉(zhuǎn)運(yùn)的前提,可作為后續(xù)功能研究的重點(diǎn)對(duì)象。
目前,硝酸鹽轉(zhuǎn)運(yùn)蛋白基因的功能研究?jī)H在擬南芥、水稻、煙草等模式植物中有較為深入的研究[25,26]。例如,F(xiàn)an 等[27]水稻pH 值依賴的高親和硝酸轉(zhuǎn)運(yùn)基因OsNRT2.3過表達(dá)時(shí),能夠提高氮固定效率,增加水稻產(chǎn)量。Tang[28]通過結(jié)合三年產(chǎn)量表型數(shù)據(jù)的全基因組關(guān)聯(lián)分析,經(jīng)過表達(dá)和基因敲除等功能驗(yàn)證,克隆了雙親和硝酸根轉(zhuǎn)運(yùn)子OsNPF6.1,發(fā)現(xiàn)OsNPF6.1 的優(yōu)異單倍型增強(qiáng)氮素吸收和提高氮素利用效率從而提高水稻在低硝酸鹽濃度下的產(chǎn)量?;ㄉδ芑虻难芯?,相對(duì)于水稻、大豆、油菜等作物研究較為滯后。隨著栽培種花生全基因組測(cè)序數(shù)據(jù)釋放和共享,花生重要性狀相關(guān)候選基因陸續(xù)被發(fā)掘和驗(yàn)證[16,17]。例如,Zhao 等利用3 個(gè)粉紅種皮與深紫色種皮花生雜交的分離群體,通過全基因組重測(cè)序方法發(fā)現(xiàn)深紫色種皮性狀是由單基因AhTc1控制的,該基因?qū)儆赗2R3-MYB轉(zhuǎn)錄因子,在煙草中過量表達(dá)該基因能夠增加轉(zhuǎn)基因煙草花青素的積累[29]。同時(shí),隨著實(shí)驗(yàn)技術(shù)手段的不斷創(chuàng)新,花生遺傳轉(zhuǎn)化體系和基因編輯技術(shù)也有了進(jìn)展?;ㄉ鶱PF/NRT2 基因家族作為氮轉(zhuǎn)運(yùn)重要基因,其功能研究還有待于在此基礎(chǔ)上深入,本研究為后續(xù)研究提供了一定的參考依據(jù)。