趙松子
(江西省林業(yè)科學(xué)院·江西省油茶種質(zhì)資源保護與利用實驗室,江西 南昌 330013)
種子大小是對作物產(chǎn)量具有重要影響的數(shù)量性狀,擬南芥(Arabidopsis thaliana)CYP78A 亞基因家族基因參與種子大小的遺傳控制,該調(diào)控機制在植物中似乎是相當(dāng)保守的。擬南芥有6 個CYP78A 基因,分別 為KLU/CYP78A5、EOD3/CYP78A6、CYP78A7、CYP78A8、CYP78A9 和CYP78A10;CYP78A5 通過增加細(xì)胞分裂來促進葉、花和種子的生長,CYP78A5 功能缺失突變體的細(xì)胞分裂停止較早,導(dǎo)致花瓣、萼片、葉、莖等器官變小[1-4];CYP78A6 在幾乎所有組織或器官遍在性地表達(dá),功能缺失突變體沒有突變表型,過表達(dá)能增加種子大小[5];CYP78A7 功能缺失突變體似乎具有正常表型,但CYP78A5 和CYP78A7 的雙突變體產(chǎn)生胚柄向胚的轉(zhuǎn)換并常在胚期死亡,幸存的植株矮小,并且不能產(chǎn)生種子[2];CYP78A8 和CYP78A9 的雙突變體產(chǎn)生種子數(shù)量較少[6];CYP78A9 過表達(dá)導(dǎo)致果莢變大,只產(chǎn)生少量種子[7],通過RNAi 沉默櫻桃(Prunus avium)PaCYP78A9 可以使果實變小[8];大豆(Glycine max)GmCYP78A10(CYP78A51)是CYP78A10的同源基因,野生大豆(G.soja)GmCYP78A10 的野生等位型與大豆的高產(chǎn)等位型間存在3 個SNP,等位型的不同導(dǎo)致種子重量7.2%的差異[9]。
油茶是山茶科山茶屬(Camellia)中油用物種的總稱,主要包括普通油茶(Camellia oleifera)、小果油茶(C.oleiferavar.monosperma)、攸縣油茶(C.yuhsienensis)、越南油茶(C. vietnamensis)、浙江紅花油茶(C.chekiangoleosa)、廣寧紅花油茶(C. semiserrata)、宛田紅花油茶(C. polydonta)、騰沖紅花油茶(C. reticulata)等[10-11]。油茶種子大小在物種內(nèi)和物種間均存在明顯差異,并且物種間的差異大于物種內(nèi)的差異。黃勇等調(diào)查了小果油茶18 個不同群體,種子長度為12.75~19.52 mm,種子寬度為10.82~16.23 mm[12];馬力等調(diào)查了11 種山茶屬植物,最大的為越南油茶,種子千粒質(zhì)量為1 878.77 g,最小的為攸縣油茶,千粒質(zhì)量為450.55 g[13]。簡單重復(fù)序列(SSR)主要是以1~6 個核苷酸為基本重復(fù)單位的串聯(lián)重復(fù)序列,利用SSR 差異可以開發(fā)SSR 標(biāo)記,具有多態(tài)性高、重復(fù)性好及共顯性等優(yōu)點。油茶物種間雜交具有較高的親和力,如越南油茶×小果油茶的座果率達(dá)36.6%[10],物種間種子大小的巨大差異為超高產(chǎn)雜交育種提供了良好的材料,鑒別油茶種子大小等產(chǎn)量性狀相關(guān)基因,開發(fā)與之緊密連鎖的SSR 標(biāo)記,可以開展分子標(biāo)記輔助育種,有助于實現(xiàn)產(chǎn)量性狀相關(guān)優(yōu)良等位基因的聚合,大幅提高油茶產(chǎn)量。
從種植于江西省林業(yè)科學(xué)院院內(nèi)的油茶良種“贛無1 號”采收成熟種子,室內(nèi)發(fā)芽后采集長約0.5 cm的根尖組織進行轉(zhuǎn)錄組分析。
采集油茶根尖組織,委托深圳華大基因科技服務(wù)有限公司提取RNA 并進行轉(zhuǎn)錄組測序,共得到40 529 966 條讀段,讀長為90 nt,去除的低質(zhì)數(shù)據(jù)后得到37 184 398 條讀段。經(jīng)過SOAP 軟件的拼接,獲得90 698 條Unigene。經(jīng)與NR、NT、SwissProt、KEGG、COG 及GO 等6 個數(shù)據(jù)庫比對,確定CDS 有63 008 條。
利用BLAST 軟件,以擬南芥的CYP78A10 蛋白質(zhì)序列搜索油茶良種贛無1 的幼葉、未成熟種仁、花蕾、根轉(zhuǎn)錄組CDS 數(shù)據(jù)庫[14-16],得到同源基因的部分CDS 序列及其蛋白質(zhì)序列,用Boetie2[17]軟件將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到CDS 序列,根據(jù)讀段編號用自編的Perl 腳本提取成對的讀段,在默認(rèn)狀態(tài)下用Cap3 軟件[18]進行序列拼接,獲得同源基因的mRNA 序列;再用Boetie2軟件將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到mRNA 序列,提取成對的讀段,用Cap3 軟件再進行序列拼接,獲得新的mRNA 序列;重復(fù)上述過程,直到mRNA 序列不再延伸。
用油茶CYP78A10 同源基因的mRNA 序列搜索油茶良種贛無1 基因組三代測序數(shù)據(jù)[19],得到含有油茶CYP78A10 同源基因mRNA 序列的亞讀段;亞讀段經(jīng)過校正后,用Augustus[20]軟件進行基因預(yù)測,得到油茶CYP78A10 同源基因的全長CDS 序列。
利用COBALT[21]軟件對油茶CYP78A10 同源基因及玉米(Zea mays)、大豆、松樹(Pinus radiata)、擬南芥、水稻(Oryza sativa)、苔蘚(Physcomitrella patens)等植物中已鑒別的CYP78A 進行蛋白質(zhì)序列比對,構(gòu)建CYP78A 蛋白質(zhì)系統(tǒng)進化樹(Neighbor-joining 法)。
用Boetie2 軟件將15 個油茶良種(贛無1、贛無2、贛190、贛447、贛70、贛撫20、贛6、贛永5、贛8、贛石84-3、贛石83-4、贛石84-8、贛無12、興46、贛無15)的GBS 分析數(shù)據(jù)[22]以及油茶幼葉、未成熟種仁、花蕾、根轉(zhuǎn)錄組數(shù)據(jù)[14-16]比對到油茶CYP78A10 同源基因的基因組序列或mRNA 序列。用自編的Perl 腳本對比對結(jié)果進行統(tǒng)計分析,提取成對比對、讀段距離小于300bp、僅比對1 次的讀段用于搜索SSR 序列。
搜索SSR 序列:用自編的Perl 腳本對油茶CYP78A10 同源基因的基因組序列及提取的GBS 和轉(zhuǎn)錄組讀段進行SSR 序列搜索;搜索SSR 序列的條件為:單核苷酸的重復(fù)次數(shù)≥16,二核苷酸的重復(fù)次數(shù)≥8,三核苷酸的重復(fù)次數(shù)≥5,四核苷酸的重復(fù)次數(shù)≥4,五核苷酸的重復(fù)次數(shù)≥3,六核苷酸的重復(fù)次數(shù)≥3。
以擬南芥的CYP78A10 基因序列分別搜索油茶幼葉、未成熟種仁、花蕾、根轉(zhuǎn)錄組CDS 數(shù)據(jù)庫,各得到1條最佳匹配序列,合計4 條序列,經(jīng)過序列比對,從花蕾和根中得到的2 條序列為CYP78A10 的同源基因;將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到油茶CYP78A10 的同源基因序列,提取成對讀段,用Cap3 軟件進行序列拼接,獲得油茶CYP78A10 同源基因的mRNA 序列。
用油茶CYP78A10 同源基因的mRNA 序列分別搜索油茶基因組三代測序數(shù)據(jù),得到2 條亞讀段,亞讀段經(jīng)過校正后,長度分別為40817bp(GenBank 登錄號:MW143063)、15341bp(GenBank 登錄號:MW143061),用Augustus 軟件進行基因預(yù)測,得到油茶CYP78A10同源基因的全長mRNA 序列、全長CDS 序列及aa 序列,其結(jié)果與轉(zhuǎn)錄組測序數(shù)據(jù)的拼接結(jié)果基本一致,2個基因分別命名為CoCYP78A10a(GenBank 登錄號:MW143062)、CoCYP78A10b (GenBank 登錄 號:MW143060),其aa 序列相似度為81.02%。
用油茶CYP78A10 同源基因及其它植物中CYP78A 亞基因家族的29 條蛋白質(zhì)構(gòu)建進化樹(表1、圖1),結(jié)果表明,CoCYP78A10a 和CoCYP78A10b 與CYP78A10、GmCYP78A10(CYP78A51)、CYP78A68 在一個分支,是CYP78A10 的同源基因,可能參與油茶種子大小的調(diào)控。
表1 系統(tǒng)進化樹中的CYP78A 蛋白質(zhì)及其編號Tab. 1 CYP78A proteins in phylogenetic tree and their accession numbers.
對CoCYP78A10a 和CoCYP78A10b 的基因組序列進行分析,分別搜索到7、15 個SSR 位點(表2)。用贛無1 等15 個油茶良種(表3)的GBS 分析數(shù)據(jù)與SSR位點的序列進行比對,結(jié)果(表3)表明:CoCYP78A10a的7 個SSR 位點在GBS 數(shù)據(jù)中未檢測到;CoCYP78A10b 的15 個SSR 位點中,在GBS 數(shù)據(jù)中檢測到5 個,其中,SSR8、SSR17 和SSR18 具有多態(tài)性。SSR18 與CoCYP78A10b 的轉(zhuǎn)錄、翻譯起始位點分別距離814bp、1009bp;SSR18 的基本重復(fù)單位為TTTCT,具有4 種重復(fù)序列,即4 個等位位點,分別為:(TTTCT)3、(TTTCT)4、(TTTCT)5、(TTTCT)6,不同等位位點測序深度的比例基本合理。
圖1 油茶及其它植物中CYP78A 蛋白質(zhì)的系統(tǒng)進化樹Fig. 1 Neighbor-joining phylogenetic tree of CYP78A proteins in Camellia oleifera and other plants
在CoCYP78A10a 的7 個SSR 位點中,SSR7 位于第1 外顯子5’端的非翻譯區(qū),與翻譯起始位點距離35bp,用油茶幼葉、未成熟種仁、花蕾、根轉(zhuǎn)錄組數(shù)據(jù)與CoCYP78A10a 的mRNA 序列進行比對,結(jié)果(表4)表明:SSR7 具有多態(tài)性;基本重復(fù)單位為CT,具有8 種重復(fù)序列,即8 個等位位點,分別為:即(CT)9、(CT)10、(CT)11、(CT)13、(CT)14、(CT)15、(CT)17、(CT)18;花蕾中有3 個等位位點,代表油茶良種贛無1 中SSR7 的多態(tài)性;根和種仁中分別有5、3 個等位位點,其中5 個等位位點是花蕾中所沒有的,由于油茶是異花授粉,根和種仁是贛無1 與其它品系雜交所得,其等位位點代表油茶群體中SSR7 的多態(tài)性。
表2 CoCYP78A10a 和CoCYP78A10b 基因組序列中的SSR位點Tab. 2 SSR loci in CoCYP78A10a and CoCYP78A10b genome sequences
本研究從油茶轉(zhuǎn)錄組CDS 數(shù)據(jù)庫中鑒定出2 條與擬南芥CYP78A10 基因同源的CDS 序列,從油茶基因組三代測序數(shù)據(jù)中得到其完整的基因組序列及全長CDS 序 列,并分別命名 為 CoCYP78A10a、CoCYP78A10b。經(jīng)與其它植物的CYP78A 基因序列進行比對分析并構(gòu)建進化樹,結(jié)果表明,CoCYP78A10a、CoCYP78A10b 與CYP78A10、GmCYP78A10 在一個分支,是CYP78A10 的同源基因,可能參與種子大小的調(diào)控。
對CoCYP78A10a 和CoCYP78A10b 的基因組序列進行SSR 位點信息分析,分別搜索到7、15 個SSR 位點。用贛無1 等15 個油茶良種的GBS 數(shù)據(jù),以及油茶幼葉、未成熟種仁、花蕾、根轉(zhuǎn)錄組數(shù)據(jù)對SSR 位點的多態(tài)性進行分析,SSR7、SSR8、SSR17 和SSR18 具有多態(tài)性;SSR7 位于CoCYP78A10a 第1 外顯子5’端的非翻譯區(qū),與翻譯起始位點距離35bp;SSR18 位于CoCYP78A10b 的啟動子區(qū),與轉(zhuǎn)錄、翻譯起始位點分別距離814bp、1009bp。
表3 SSR18 等位位點在不同良種中的測序深度Tab. 3 Sequencing depth of SSR18 alleles in different cultivars
表4 SSR7 等位位點在不同組織中的測序深度Tab. 4 Sequencing depth of SSR7 alleles in different tissues
總體而言,油茶SSR 標(biāo)記開發(fā)比較盲目,成功率比較低,主要原因是沒有PCR 產(chǎn)物或PCR 產(chǎn)物沒有多態(tài)性,如:Jia 等合成了150 對SSR 引物,檢測了20 個品種,只有52 對具有多態(tài)性[23];李海波等合成了89 對SSR 引物,只有32 對能有效擴增[24];閆蕊等用163 對SSR 引物檢測了5 個品種,48 對引物具有多態(tài)性[25]。利用油茶基因組數(shù)據(jù)搜索SSR 位點,結(jié)合GBS 數(shù)據(jù)和轉(zhuǎn)錄組數(shù)據(jù)統(tǒng)計分析SSR 位點的多態(tài)性,有利于提高SSR 標(biāo)記開發(fā)的成功率。未來將圍繞CoCYP78A10a、CoCYP78A10b 挖掘出更多的多態(tài)性位點,并轉(zhuǎn)換成分子標(biāo)記,以便對油茶種質(zhì)資源群體進行種子大小的關(guān)聯(lián)分析,研究CoCYP78A10a 和CoCYP78A10b 的功能。