蔣家煥,朱永生,陳麗萍,鄭燕梅,蔡秋華,謝華安,王愛榮,張建福,
[1. 福建省農(nóng)業(yè)科學(xué)院水稻研究所/農(nóng)業(yè)農(nóng)村部華南雜交水稻種質(zhì)創(chuàng)新與分子育種重點實驗室/福州(國家)水稻改良分中心/福建省作物分子育種工程實驗室/福建省水稻分子育種重點實驗室,福建 福州 350003;2. 福建農(nóng)林大學(xué)植物保護(hù)學(xué)院,福建 福州 350002]
【研究意義】水稻(Oryza sativa)是全世界最主要的糧食作物之一,全球有超過50%的人口以大米為主食,水稻的高產(chǎn)和穩(wěn)產(chǎn)是保障糧食安全的重要因素。而在農(nóng)業(yè)生產(chǎn)中,水稻等禾谷類作物的產(chǎn)量95%來自葉片光合作用[1]。近年來,隨著不斷增長的人口壓力、各種生物和非生物逆境脅迫以及城鎮(zhèn)化帶來的耕地面積不斷縮小等因素均對水稻的產(chǎn)量構(gòu)成了嚴(yán)重的威脅[2,3]。植物的生長發(fā)育的過程受到各種內(nèi)外因素的影響。外因方面,某些物理和化學(xué)因素,如射線、強光、高溫、鹽、堿及干旱等環(huán)境因素可能會引起植物細(xì)胞的滲透脅迫,導(dǎo)致葉片的枯萎甚至早衰,進(jìn)而影響作物的光合作用和代謝,造成作物的產(chǎn)量受到影響[4]。在遺傳因素上,植物葉片早衰突變癥狀是常見的突變類型,這是因為某些與植物葉綠體的合成、發(fā)育和降解相關(guān)的重要基因發(fā)生了突變,失去了相應(yīng)的基因功能,最后致使水稻葉色異?;蛟缢?,進(jìn)而導(dǎo)致水稻產(chǎn)量的下降。水稻作為單子葉植物分子研究的模式植物,其全基因組測序已經(jīng)完成[5],我們可從中獲取大量可利用的全長cDNA 相關(guān)信息用于指導(dǎo)育種和生產(chǎn)。因此,開展水稻早衰突變體相關(guān)基因的克隆并進(jìn)行其早衰機理的研究,深入了解水稻葉片衰老所參與的信號通路和調(diào)控機制,對于選育延緩衰老、抗衰老的水稻品種,保證糧食安全具有重要意義?!厩叭搜芯窟M(jìn)展】衰老同時受到遺傳基因與外界環(huán)境的影響,但在植物衰老過程中,遺傳往往占據(jù)主導(dǎo)因素,這是植物在漫長的進(jìn)化過程中建立的一種自我保護(hù)形式[6]。從植物葉片早衰數(shù)據(jù)庫查詢結(jié)果顯示,在水稻中已鑒定出近160 個與葉片衰老相關(guān)的基因,其中經(jīng)遺傳轉(zhuǎn)化驗證或互補驗證的與葉片早衰相關(guān)的調(diào)控基因僅占三分之一[7]。在其中21 個已克隆的水稻葉片早衰相關(guān)基因中,多數(shù)基因參與葉綠素降解[8]、過氧化反應(yīng)[9]、激素合成及信號傳導(dǎo)[10]和逆境脅迫[11]等途徑。研究結(jié)果顯示,早衰突變體多數(shù)是因為植物抗氧化系統(tǒng)功能下降,導(dǎo)致葉片衰老。因此,克隆和研究更多導(dǎo)致水稻早衰突變體的相關(guān)基因,并進(jìn)行其遺傳機理的深入研究,有利于構(gòu)建和完善植物早衰的遺傳調(diào)控網(wǎng)絡(luò)。然而,當(dāng)前這些早衰相關(guān)基因大多是通過經(jīng)典的正向遺傳和圖位克隆的方法獲得的,傳統(tǒng)的圖位克隆方法存在研究周期長、通量低、工作量大等缺點?!颈狙芯壳腥朦c】為加快水稻早衰基因的定位和克隆,本研究在前期工作通過傳統(tǒng)圖位克隆方法,已獲得了早衰突變體w14 的目標(biāo)基因精細(xì)定位區(qū)間,因區(qū)間內(nèi)包含有8 個功能基因,無法最終確定其候選基因[12]。為了進(jìn)一步確定早衰突變體的目標(biāo)候選基因,同時也對圖位克隆的結(jié)果進(jìn)行驗證,本研究通過BSA-Seq 的方法從中尋找可能影響水稻出現(xiàn)早衰突變的位點?;旌先后w分離分析法(Bulked segregant analysis,BSA)是基于臨時(如F1、F2分離群體)或永久群體(如重組自交系、近等基因系)表現(xiàn)出明顯差異的個體,通過構(gòu)建DNA 混池進(jìn)行基因定位。BSA 已被應(yīng)用于水稻質(zhì)量性狀基因[13]和數(shù)量性狀基因(QTL)[14?15]的定位。但利用BSA對水稻早衰突變體的相關(guān)基因進(jìn)行定位和遺傳學(xué)分析相關(guān)研究鮮見報道?!緮M解決的關(guān)鍵問題】本研究以w14 和日本晴分別作為早衰突變體和野生型,配制 F2代遺傳群體,種植于田間到抽穗期開始調(diào)查表型。依據(jù)w14 和野生型日本晴作為調(diào)查早衰表型的標(biāo)準(zhǔn),選出極端材料構(gòu)建基因池。 通過BSA-seq 分析,初步確定w14 中早衰相關(guān)基因的連鎖區(qū)間,為早衰突變體w14 的衰老相關(guān)基因 的精細(xì)定位及基因克隆奠定基礎(chǔ)。
日本晴為本課題組保有的粳稻常規(guī)品種。野生型粳稻品種云引(YY)自云南省農(nóng)業(yè)科學(xué)院引進(jìn),經(jīng)0.8% EMS 誘變處理后從中篩選得到一個穩(wěn)定遺傳的 早衰突變體,命名為w14。
1.2.1 BSA-Seq 群體構(gòu)建 將早衰突變體w14 與粳稻品種日本晴雜交得到F1雜交種,F(xiàn)1套袋自交并分單株收獲得到F2種子,F(xiàn)2群體種植于田間生長至孕穗期時進(jìn)行表型調(diào)查和取樣,早衰突變型單株和野生型單株各取100 個,分別提取DNA,進(jìn)行DNA 濃度測定后稀釋成相同的濃度再等量混合,分別構(gòu)成隱性基因池和顯性基因池,再加突變體w14 共3 個樣品委托廣州基迪奧生物科技有限公司進(jìn)行重測序分析,日本晴利用參考基因組用模塊版本:IRGSP 1.0?;蚣⑨尠姹荆篗SU 7.0。水稻參考基因組大小為374 471 240 bp,共有12 條染色體。水稻12 條染色體的長度信息將用于統(tǒng)計量擬合和可視化,我們將染色體長度的信息保存在04.mapping/00.chr_length.t ab 文件中。
1.2.2 測序數(shù)據(jù)的評估和處理 對測序得到的原始測序讀段(Sequenced reads 或者Raw reads),里面含有帶接頭的、低質(zhì)量的數(shù)據(jù)。為了保證信息分析質(zhì)量,必須對原始測序讀段過濾,得到待分析數(shù)據(jù),后續(xù)分析都基于待分析數(shù)據(jù)。數(shù)據(jù)處理的步驟如下:
(1)去除帶接頭(Adapter)的數(shù)據(jù)對;
(2)當(dāng)單端測序數(shù)據(jù)中含有的N 的含量超過該條數(shù)據(jù)長度比例的10%時,需要去除此對成對數(shù)據(jù);
(3)當(dāng)單端測序數(shù)據(jù)中含有的低質(zhì)量(Q≤5)堿基數(shù)超過該條數(shù)據(jù)長度比例的50%時,需要去除此 對成對數(shù)據(jù)。
1.2.3 測序數(shù)據(jù)的質(zhì)量修剪 先經(jīng)過FASTQC 的質(zhì)控評估后如果發(fā)現(xiàn)待分析數(shù)據(jù)中依然含有一些接頭與低質(zhì)量的序列,利用TRIMMOMATIC 對待分析數(shù)據(jù)進(jìn)行質(zhì)量修剪,修剪后的讀段稱為刪節(jié)數(shù)據(jù)(Trimmed data)。
TRIMMOMATIC 的處理內(nèi)容主要包括以下方面:
(1)繼續(xù)去除數(shù)據(jù)中的接頭(Adapter)序列;
(2)以7 bp 的滑窗掃描數(shù)據(jù),若滑窗的Qphred均值低于20,則去除該窗口及其之后的序列(默認(rèn)采用Q20 標(biāo)準(zhǔn));
(3)在成對數(shù)據(jù)中,當(dāng)某一單端數(shù)據(jù)修剪后長度 低于30 bp 時,需要去除此成對數(shù)據(jù)。
1.2.4 讀段比對 通過bwa mem 程序?qū)⒎治鰯?shù)據(jù)比對到參考基因組,利用samtools sort 工具對匹配項(Alignment)按參考序列的順序進(jìn)行排序,利用Picard的Mark Duplicate 去除比對結(jié)果中的重復(fù),屏蔽PCR duplication 的 影 響, 并 通 過 GATK 進(jìn) 行 InDel Realignment,即對存在插入缺失的位點附近進(jìn)行局部重新比對,校正由于插入缺失引起的比對錯誤。
將各樣本的比對結(jié)果(bam 文件)存放在01.bam目錄中。在Linux 操作系統(tǒng)下,安裝了samtools 之后,用samtools view 及l(fā)ess 命令瀏覽bam 文件,命令如下:samtools view-h sample.bam less 或者用IGV 等基 因組瀏覽器載入bam 文件,可視化瀏覽比對結(jié)果。
1.2.5 基因組序列擴增與比對分析 應(yīng)用NCBI 及http://rice.plantbiology.msu.edu 等網(wǎng)站的數(shù)據(jù)庫分析水稻LOC_Os03g49200 的基因序列,利用引物設(shè)計軟件Primer Premier 6 設(shè)計引物擴增目標(biāo)基因的基因組序列全長,并在上述網(wǎng)站下載該基因序列,在DNAMAN 中進(jìn)行序列比對分析。所設(shè)計的分段擴增目標(biāo)基因的基因組序列全長的引物序列如表1。
表1 用于 OsBRCA1 基因組全長分段擴增的引物序列Table 1 Primer sequences for genome full-length fragment amplification on OsBRCA1
在之前的工作中,我們通過傳統(tǒng)的基因圖位克隆方法,獲得了早衰突變體w14 目標(biāo)基因所在的精細(xì)定位區(qū)間,但該區(qū)間包括8 個可能的候選基因,因而仍無法最終確定候選基因[12]。為了進(jìn)一步確定目標(biāo)基因的候選基因同時也對圖位克隆的結(jié)果進(jìn)行驗證,我們通過BSA-Seq 的方法,即通過分別對F2群體中的顯性單株構(gòu)成的野生型基因池和隱性單株構(gòu)成的突變型基因池(各取100 個單株)進(jìn)行重測序分析,擬從中尋找可能影響水稻出現(xiàn)早衰突變的位點。
重測序分析SNP 位點是如今進(jìn)行基因序列差異分析和基因克隆的重要輔助手段。但是基因組測序的數(shù)據(jù)質(zhì)量往往會對后續(xù)的分析造成重要的影響。在本研究中,除了其中一個親本使用日本晴的網(wǎng)絡(luò)數(shù)據(jù)庫序列信息之外,我們分別對突變體w14、隱性基因池和顯性基因池進(jìn)行了測序分析,同時對這3 個樣本的測序數(shù)據(jù)量及測序質(zhì)量進(jìn)行了統(tǒng)計分析,結(jié)果表明,剔除低質(zhì)量的數(shù)據(jù)后獲得的過濾數(shù)據(jù)都在95%以上,其中Phred 數(shù)值大于20、30 的堿基占總體堿基的百分比分別超過95%和91%(表2)。
表2 測序數(shù)據(jù)和測序質(zhì)量的統(tǒng)計分析Table 2 Statistical analysis on sequencing data and quality
在測序質(zhì)量評估上,以樣本w14 的測序結(jié)果為例,Qphred值的箱線圖(zip 文件中Images/per_base_quality.png)(圖1),其中圖1A 是正向數(shù)據(jù)的Qphred值,圖1B 是反向數(shù)據(jù)的Qphred值。從圖可知,測序的質(zhì)量值總體在Q30 以上,測序的質(zhì)量值分布正常,可用于進(jìn)一步的分析。
圖1 突變體 w14 測序數(shù)據(jù)的質(zhì)量評估Fig. 1 Statistical analysis on sequencing data and quality on w14
根據(jù)設(shè)計的BSA-seq 分析的基因克隆方案,進(jìn)行了單基因定位和突變基因的鑒定。對顯性基因池和隱性基因池進(jìn)行基因頻率分析結(jié)果可知,單基因主峰位于Chr3(圖2)。進(jìn)一步對Chr3 基因統(tǒng)計量擬合曲線分析,候選區(qū)間初步估計為Chr3:27.5~29.5 Mb(圖3)。這包含了我們前述的利用傳統(tǒng)分子標(biāo)記技術(shù)所定位的區(qū)間,并形成相互驗證的結(jié)果。但為保守起見,上下游各擴0.5 Mb,即挑選Chr3 的27 Mb 至30 Mb 的范圍進(jìn)行因果變異的鑒定。
圖2 基因池間等位頻率分析尋找目標(biāo)基因的主峰位置Fig. 2 Allele frequency between gene pools for locating main peak in target gene注:A:隱性純合池;B:顯性雜合池;C:兩個混池之間的差異;D:目標(biāo)基因的基因主峰。Note: A: recessive homozygous pool; B: dominant heterozygous pool; C: difference between two mixed pools; D: main peak in target gene.
圖3 測序結(jié)果中3 號染色體的AF 及AFD 擬合曲線Fig. 3 AF and AFD fitting curves of Chr 3 in sequencing
綜合精細(xì)定位的區(qū)間,在目標(biāo)區(qū)域內(nèi)共找到2 個符合條件的候選因果變異(表3)。并且利用snpEff 對候選因果變異進(jìn)行注釋,注釋結(jié)果如表4所示,在Chr3 上的兩個候選基因中,其中LOC_Os03g48626 位于染色體27726166 的物理位置上,突變位點由野生型YY 的C 突變?yōu)門,但該突變發(fā)生在內(nèi)含子中。另一候選基因LOC_Os03g49210 位于Chr3的28129631 物理位置上,突變位點也是由野生型的C 突變?yōu)門,且該突變位于候選基因的第3 外顯子上,屬于錯義突變,造成了該基因編碼的第20 個氨基酸由T(蘇氨酸)變成I(異亮氨酸),從而可能導(dǎo)致了基因功能的改變。遂將該基因定位本研究的目 標(biāo)基因,因與人BRCA1 同源,命名為OsBRCA1。
表3 目標(biāo)染色體的因果變異鑒定結(jié)果Table 3 Causal variant identification on target chromosome
表4 利用snpEff 對候選因果變異進(jìn)行注釋的結(jié)果Table 4 Annotated candidate causal variant by snpEff
根據(jù)BSA-Seq 結(jié)果,通過數(shù)據(jù)庫查找目標(biāo)基因OsBRCA1 的基因組序列,設(shè)計9 對引物(表1)分別分段擴增突變體w14、野生型云引及日本晴的OsBRCA1 基因組序列,以對BSA-Seq 結(jié)果進(jìn)行驗證。電泳后回收片段進(jìn)行DNA 測序。調(diào)取NCBI 數(shù)據(jù)庫中水稻的LOC_Os03g49210 序列,用DNAMAN 軟件進(jìn)行分段比對,將測序結(jié)果拼接比對LOC_Os03g49210的CDS 序列在日本晴、YY 及w14 中是否存在差異。對比結(jié)果表明在突變體w14 中該基因CDS 的第62 位堿基處有一個SNP 位點,由野生型YY 的C 突變成T(圖4A),造成了其編碼的氨基酸序列的第21 位由蘇氨酸突變?yōu)楫惲涟彼幔▓D4B)。該測序結(jié)果與上述BSA-seq 分析結(jié)論相一致,這也進(jìn)一步說明測序和分析結(jié)論的具有較高的可靠性。
圖4 OsBRCA1 在野生型和突變體w14 的序列比對分析Fig. 4 Sequence alignment between OsBRCA1 in wild-type and mutant w14注:A:基因組序列比對結(jié)果;B:氨基酸序列比對結(jié)果。Note: A: genome sequence alignment; B: amino acid sequence alignment.
水稻葉片的衰老直接影響水稻的產(chǎn)量和品質(zhì),水稻早衰的研究成為熱點領(lǐng)域之一。當(dāng)前,在水稻中已經(jīng)鑒定了超過150 個的衰老相關(guān)基因,這些早衰相關(guān)基因分布在除了第1、8 和12 染色體之外的其他9 條染色體,其中已被克隆的僅占三分之一。與前人研究相比較,本研究中的突變體w14 的表型與已報道的早衰突變體均不同。在前期工作中,我們通過傳統(tǒng)圖位克隆方法,獲得了早衰突變體w14 的目標(biāo)基因精細(xì)定位區(qū)間,但該區(qū)間內(nèi)包含有8 個功能基因,因此無法最終確定其候選基因[12]。為了進(jìn)一步確定早衰突變體的目標(biāo)候選基因,同時也對圖位克隆的結(jié)果進(jìn)行驗證,本研究中我們通過BSASeq 的方法從中尋找可能影響水稻出現(xiàn)早衰突變的位點,并最終在目標(biāo)區(qū)域內(nèi)找到2 個符合條件的候選因果變異,其中LOC_Os03g48626 該突變發(fā)生在內(nèi)含子中,另一候選基因LOC_Os03g49210 的突變位于第2 外顯子上,屬于錯義突變,造成該基因編碼的氨基酸發(fā)生改變。BSA-seq 分析結(jié)論與傳統(tǒng)圖位克隆方法所得到的結(jié)果相一致,這也進(jìn)一步說明BSAseq 及分析結(jié)論具有較高的可靠性。錯義突變基因與人BRCA1 同源,命名為OsBRCA1,該基因為一個保守基因,目前已在13 650 多個物種上被發(fā)現(xiàn),在水稻中尚未見該基因的相關(guān)報道。在擬南芥中也存在BRCA1 的同源基因,AtBRCA1,包含一個N 端環(huán)狀結(jié)構(gòu)域,兩個C 端BRCT 和p300/CBP 互作結(jié)構(gòu)域,其結(jié)構(gòu)域與分子特性都與BRCA1 高度相似,極易受伽馬射線誘導(dǎo),在DNA 修復(fù)和細(xì)胞周期控制中起重要作用[16]。擬南芥中存在兩個BRCA1 的互作基因即AtBRCC36A 和AtBRCC36B,這兩個基因功能同時存在或同時敲除時,擬南芥都是完全可育的且并無發(fā)育缺陷,而單突變體則具有明顯的HR 缺陷[17]。BRCA2同源基因不僅參與減數(shù)分裂中DNA重組,還通過與鏈交換蛋白RAD51 的互作參與病原相關(guān)(PR)基因的轉(zhuǎn)錄調(diào)控[18]。暴露在X 射線遭受高劑量輻射時,擬南芥中BRCA1 和RAD51 在慢階段DNA 損傷修復(fù)過程中表達(dá)滯后[19],從而影響植物的生長發(fā)育。因此OsBRCA1 的突變也可能造成水稻DNA復(fù)制時的錯配、雙鏈DNA 斷裂和DNA 損傷修復(fù)受阻,從而引起水稻的發(fā)育異常,導(dǎo)致水稻的葉片早衰癥狀。