張大勇,王象然,2,吳雨恒,赫晨宇,楊柳,賈璐,莊靜而
(1.東北農(nóng)業(yè)大學農(nóng)學院,哈爾濱 150030;2.黑龍江省農(nóng)業(yè)科學院佳木斯分院/國家大豆產(chǎn)業(yè)技術(shù)體系佳木斯綜合試驗站/三江平原主要作物育種栽培重點實驗室,黑龍江 佳木斯 154007)
大豆是我國主要油料及經(jīng)濟作物,富含優(yōu)質(zhì)植物蛋白及油脂,是食品加工及畜禽飼料重要來源[1]。其品質(zhì)改善和產(chǎn)量提高是當代大豆育種家共同育種目標。光合作用是促使作物干物質(zhì)形成主要途徑,將二氧化碳和水同化并生成有機物同時釋放氧氣[2]。葉綠素是光合作用關(guān)鍵色素,對作物產(chǎn)量形成具有重要影響[3]。
大豆中葉綠素含量是影響光合速率重要因素,二者呈正相關(guān)趨勢[4]。而光合速率與產(chǎn)量呈顯著正相關(guān)[5],因此葉綠素含量測定對預測和提高大豆產(chǎn)量至關(guān)重要。崔世友等利用151個RIL家系在4個不同生育時期下結(jié)合大豆籽粒產(chǎn)量分析葉綠素含量,結(jié)果發(fā)現(xiàn)在生育后期大豆葉綠素含量與籽粒產(chǎn)量呈極顯著正相關(guān)[6]。張恒善利用400多份大豆品種,測定其葉綠素含量(a+b),按年度、熟期分組與產(chǎn)量作相關(guān)分析,結(jié)果表明各組相關(guān)程度不同,總體呈正相關(guān)趨勢[7]。全基因組關(guān)聯(lián)分析(Genome wide association analysis,GWAS)是目前發(fā)現(xiàn)復雜農(nóng)藝性狀基因變異的有效新策略。Rish等首次提出全基因組關(guān)聯(lián)分析概念[8],在糧食、經(jīng)濟、油料等作物中得到廣泛運用[9]。薦紅舉等以588份重測序油菜種質(zhì)資源為材料,連續(xù)兩年測定其苗期葉綠素含量并通過全基因組關(guān)聯(lián)分析最終得到23個候選基因,其中4個基因參與葉綠素合成途徑,BnaA10g02050D(BnaPOR C)基因與氧化還原酶活性有關(guān),編碼原葉綠素氧化還原酶;BnaC02g01240D(BnaHEMC)基因編碼膽色素原脫氨酶參與血紅素生物合成;BnaC05g38600D(Bna-HEME2)基因與血紅素代謝相關(guān);BnaC09g54390D(BnaHEMG2)基因與氧化還原酶活性有關(guān),編碼原卟啉原氧化酶2[10]。史大坤等以538份玉米自交系構(gòu)成的關(guān)聯(lián)群體為研究對象,利用GWAS解析玉米葉綠素含量遺傳基礎,發(fā)現(xiàn)兩個基因參與葉綠素代謝,GRMZM2G178859(COX10)基因參與血紅素生物合成過程;GRMZM2G168858(CPR2)基因具有鐵氧還蛋白還原酶型FAD結(jié)合域,編碼NADPH-細胞色素p450還原酶[11]。樊慶琦等在缺鐵脅迫下對小麥苗期葉片葉綠素含量進行全基因組關(guān)聯(lián)分析,在對照未受脅迫條件下得到23個顯著SNP位點,并認為在3B染色體上發(fā)現(xiàn)4個顯著SNP與葉綠素合成相關(guān)[12]。
全基因組關(guān)聯(lián)分析在大豆遺傳分析中應用日益廣泛[13]。Wen等對兩個大豆群體進行基因分型共獲得52 041個SNP,通過對單株莢數(shù)進行全基因組關(guān)聯(lián)分析檢測到1個顯著相關(guān)SNP(Gm01-55794390)[14]。張友誼以224份大豆微核心種質(zhì)為試驗材料,對多個與產(chǎn)量有關(guān)性狀進行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)與產(chǎn)量相關(guān)聯(lián)的36個基因位點[15]。
近年來,學者多利用全基因組關(guān)聯(lián)分析進行大豆抗性性狀及產(chǎn)量方面的研究,對大豆葉綠素含量遺傳基礎方面研究也僅限基于雙親本分離群體進行QTL定位分析[16]。由此可見,除大多數(shù)在生理生化水平上測定大豆葉綠素含量外,利用全基因組關(guān)聯(lián)分析對大豆葉綠素相關(guān)基因定位研究較少。
本研究以196份國內(nèi)外大豆種質(zhì)資源組成的自然群體為試驗材料,測定大豆葉片葉綠素含量,并結(jié)合高密度SNP標記,運用混合線性模型(Mixed linear model)作全基因組關(guān)聯(lián)分析,對影響大豆葉綠素含量相關(guān)基因進行預測與篩選,為探究大豆葉綠素含量遺傳機理提供理論參考。
1.2.1 田間試驗方法
該群體于2021年5月種植于黑龍江省哈爾濱市東北農(nóng)業(yè)大學向陽試驗示范基地,每小區(qū)60行,行長3 m,行距65 cm,株距6 cm,同當?shù)卮筇锾镩g管理。
1.2.2 表型數(shù)據(jù)采集
對該自然群體每一個株行中隨機選取第五片三出復葉完全展開且長勢相同的連續(xù)5株,選取頂部第四片三出復葉中間小葉,利用慧諾瑞德(北京)科技有限公司多功能植物測量儀MultispeQ在其完全伸展的葉片中間部位測定SPAD值(葉綠素相對含量),重復3次,3次測量均值作為該葉片葉綠素含量;5株對應葉片葉綠素含量均值作為該品種對應葉片葉綠素含量,并用于后續(xù)表型一般統(tǒng)計分析和全基因組關(guān)聯(lián)分析。
續(xù)表
1.2.3 數(shù)據(jù)處理與分析
利用Excel 2016對大豆自然群體葉綠素含量統(tǒng)計分析并剔除離群值,利用SPSS 22.0分析基因相對表達量數(shù)據(jù)并作獨立樣本T檢驗。
1.2.4 基因型鑒定
以往學者將孟子性善論理解為“孟子認為人性是善的”,實際上《孟子》一書中只說“孟子道性善”“言性善”,而后者是不能等同于“人性是善的”。如果一定要用命題表述的話,也應表述為:人皆有善性;人應當以此善性為性;人的價值和意義即在于充分擴充與實現(xiàn)自己的性。
材料通過Illumina HiSeqTM測序平臺進行測序,流程按照Illumina公司提供標準協(xié)議執(zhí)行。對獲得的59 071個SNP標記按等位基因頻率條件(maf)<0.05進行質(zhì)量篩選共獲得52 391個高質(zhì)量SNP。利用Haploview 4.2軟件對質(zhì)控后SNP進行連鎖不平衡分析,劃分單倍型塊。
1.2.5 群體結(jié)構(gòu)親緣關(guān)系分析
在RStudio中采用GAPIT軟件[17]對該自然群體進行群體結(jié)構(gòu)、親緣關(guān)系分析。
1.2.6 全基因組關(guān)聯(lián)分析
GWAS分析在RStudio中利用GAPIT軟件MLM模型作分析[17]。
1.2.7 候選基因篩選
根據(jù)大豆參考基因組,在獲得葉片葉綠素含量顯著關(guān)聯(lián)的SNP標記上下游各100 kb內(nèi)搜索基因,利用網(wǎng)站(https://www.soybase.org/)對所搜索到的基因進行GO分子功能注釋,利用網(wǎng)站(https://www.genome.jp/kegg/pathway.html)對搜索到的基因進行KEGG途徑注釋,將已獲得基因與擬南芥基因進行序列對比(https://phytozome-next.jgi.doe.gov/),進行功能注釋以篩選與葉綠素含量相關(guān)的候選基因。
1.2.8 表達量分析
設計候選基因的qRT-PCR引物序列(http://biodb.swu.edu.cn/qprimerdb),引物序列由睿博興科生物技術(shù)有限公司合成(見表1)。
表1 葉綠素含量相關(guān)候選基因引物Table 1 Primers of candidate genes related to chlorophyll content
根據(jù)各品種葉綠素含量,在葉綠素含量高低兩類極端材料中連續(xù)選擇各10個品種,選取苗期葉片提取RNA(Simgen公司UItra Pure Total RNA Extration Kit試劑盒),設置3次生物學重復。將提取的RNA反轉(zhuǎn)錄合成cDNA(Simgen公司cDNA第一鏈合成試劑盒)。使用Gene Copoeia公司BlazeTaqTM SYBR?Green qPCR Mix 2.0試劑盒進行候選基因相對表達量驗證。每個樣品設置3次重復,在Bio-Rad CFX96定量PCR儀上進行qRT-PCR擴增。
對196份大豆品種構(gòu)成的自然群體,隨機選取長勢相同的連續(xù)5株,選取頂部第四片三出復葉的中間小葉,測定其完全伸展的葉片中間部位葉綠素含量。該自然群體綠素平均含量為49.37,含量變化范圍在39.48~58.57,標準差為3.12,變異系數(shù)為6.31%,偏度值和峰度值為-0.26和0.16,并且偏度值和峰度值絕對值均小于1,說明葉綠素含量出現(xiàn)連續(xù)正態(tài)分布,符合多基因控制的數(shù)量性狀特征,結(jié)果如圖1所示。
圖1 大豆自然群體葉片葉綠素含量頻次分布Fig.1 Frequency distribution of chlorophyll content in leaves of soybean natural population
分析該自然群體的群體結(jié)構(gòu),PCA主成分分析結(jié)果表明該自然群體無明顯分層,種質(zhì)間親緣關(guān)系均衡,從親緣關(guān)系Kinship圖也可看出,群體間無顯著群體結(jié)構(gòu)。選前3個主成分作協(xié)變量對群體結(jié)構(gòu)進行校正,結(jié)果如圖2所示。
圖2 主成分和大豆遺傳數(shù)據(jù)親緣關(guān)系分析Fig.2 Principal component and kinship analyses of soybean genetic data
利用GAPIT對該自然群體葉綠素含量采用MLM模型進行全基因組關(guān)聯(lián)分析,并繪制Manhattan圖與QQ-Plot,結(jié)果如圖3所示。
圖3 葉綠素含量全基因組關(guān)聯(lián)分析Manhattan圖與QQ-Plot Fig.3 Manhattan graph and QQ-Plot of genome wide association analysis on chlorophyll content
設P=0.5/52 391為顯著關(guān)聯(lián)SNP閾值,共篩選得到顯著SNP共37個,分別位于2、3、4、7、10、13、16號染色體上。其中2號染色體上存在4個SNP;3號染色體上存在26個SNP;4號染色體上存在1個SNP;7號染色體上存在2個SNP;10號染色體上存在1個SNP;13號染色體上存在1個SNP;16號染色體上存在2個SNP,結(jié)合Block進行分類,結(jié)果見表2。
表2 葉綠素含量顯著關(guān)聯(lián)SNP位點Table 2 SNP sites significantly associated with chlorophyll content
對閾值以上SNP位點在其上下游各100 kb范圍內(nèi)根據(jù)大豆基因組數(shù)據(jù)庫搜索到基因194個,通過GO功能富集分析以及KEGG代謝通路富集分析,與擬南芥基因進行序列對比,根據(jù)前人研究的擬南芥同源基因功能,篩選出可能影響葉綠素含量基因11個,結(jié)果見表3。其中2號染色體1個;3號染色體2個;7號染色體3個;10號染色體3個;13號染色體1個;16號染色體1個。
表3 葉綠素含量候選基因以及注釋信息Table 3 Candidate genes and annotation information for chlorophyll content
將篩選出的11個基因在葉綠素含量差異極端的兩類材料中驗證相對表達量,結(jié)果見表4。
表4 品種名稱及葉綠素含量Table 4 Variety name and chlorophyll content
結(jié)合T檢驗分析結(jié)果得出4個基因Glyma.02G185300、Glyma.03G085000、Glyma.10G259900、Glyma.16G037100在兩類材料中具有顯著差異,結(jié)果如圖4所示。
圖4 大豆葉綠素含量候選基因定量分析Fig.4 Quantitative analysis of candidate genes for soybean chlorophyll content
相對于低葉綠素含量材料中,4個基因在高葉綠素含量材料中基因表達量相對較高。其中包括Glyma.10G259900編碼TXND9與細胞氧化還原穩(wěn)態(tài)相關(guān),介導四吡咯生物合成并參與葉綠素合成;Glyma.02G185300編碼葉綠體NTRC參與葉綠素代謝與光周期生長調(diào)控。
葉綠素合成代謝過程十分復雜,本研究以196份國內(nèi)外大豆品種組成的自然群體為試驗材料,結(jié)合高密度SNP位點,對葉綠素含量進行全基因組關(guān)聯(lián)分析,通過GO功能富集分析、KEGG代謝通路富集分析、基因功能注釋以及qRT-PCR篩選鑒定出4個與大豆葉綠素含量相關(guān)候選基因。葉綠素屬于四吡咯物質(zhì),基因Glyma.10G259900具有硫氧還蛋白結(jié)構(gòu)域,編碼硫氧還蛋白,存在于從胞膜到類囊體腔的所有葉綠體隔室中,介導四吡咯生物合成,直接參與葉綠素代謝[18],這一研究結(jié)果與史大坤等研究理論相符合[11]。基因Glyma.02G185300具有硫氧還蛋白結(jié)構(gòu)域,編碼葉綠體NADPH硫氧還蛋白還原酶(NTRC),NTRC是一種高效氧化還原系統(tǒng),為保護植物葉綠體免受氧化損傷,可控制包括葉綠素生物合成的關(guān)鍵代謝和調(diào)節(jié)途徑,且與擬南芥光周期生長控制之間具有聯(lián)系[19-20],其他作物中與該基因功能及結(jié)構(gòu)相似的相關(guān)候選基因尚未見報道。這兩個基因同屬于硫氧還蛋白(Trx)家族,研究表明該家族參與光合作用、葉綠素含量調(diào)控[21-22]?;騁lyma.16G037100屬于肽酶M50家族,編碼EGY1金屬蛋白酶,是葉綠體發(fā)育必需基因,參與葉綠體發(fā)育和光合作用過程,如影響捕光復合物I和II(Lhca和Lhcb)的葉綠素a/b結(jié)合蛋白的積累,該蛋白定位在葉綠體膜、類囊體膜上參與光捕獲[23],在其他作物中與之功能及結(jié)構(gòu)特征相似的相關(guān)候選基因尚未見報道。研究發(fā)現(xiàn),肽酶M50家族基因具有影響葉綠體發(fā)育以及葉綠素含量的功能[24]。在3號染色體上檢測到的編碼細胞色素P450的基因Glyma.03G085000(CYP82C4),細胞色素P450超家族(CYP)是一大類血紅素蛋白。血紅素與葉綠素是具有不同金屬元素的化合物,結(jié)構(gòu)與特征相似。CYP通過將氧氣還原為水(使用NADH或NADPH)催化有機物質(zhì)氧化,并與金屬攝取/轉(zhuǎn)運密切相關(guān)[25],這一結(jié)果與史大坤等在玉米中研究結(jié)果與葉綠素相關(guān)基因功能相似[11],有研究表明該基因家族在葉綠素含量調(diào)控方面發(fā)揮作用[26-27]。本研究利用全基因組關(guān)聯(lián)分析對影響大豆葉綠素含量基因進行預測,為探究大豆葉綠素含量遺傳機理提供理論參考。為進一步探究與大豆葉綠素含量相關(guān)候選基因,后期將對候選基因功能進行有效驗證,為大豆分子育種提供有效依據(jù)。