周新成 夏志強(qiáng) 陳新 鄒枚伶 盧誠(chéng) 王海燕 王文泉
摘? 要:基因組學(xué)的發(fā)展,不僅能獲得物種個(gè)體水平染色體的精準(zhǔn)DNA序列,解析生命科學(xué)的基本問題,而且其超高通量技術(shù)使得在群體水平詮釋物種遺傳多樣性成為可能,從而改變了現(xiàn)代生命科學(xué)的進(jìn)程和研究方式。本文概述了基因組技術(shù)的最新進(jìn)展,以及與相關(guān)組學(xué)技術(shù)結(jié)合,在物種群體遺傳結(jié)構(gòu)多樣性、功能基因發(fā)掘、生物進(jìn)化以及精準(zhǔn)育種領(lǐng)域的廣泛應(yīng)用;同時(shí)簡(jiǎn)述了熱帶作物的生物學(xué)特性、基因組研究進(jìn)展及其存在的問題,并對(duì)未來基因組學(xué)發(fā)展與新的應(yīng)用領(lǐng)域進(jìn)行了簡(jiǎn)評(píng)。
關(guān)鍵詞:基因組學(xué);第三代測(cè)序技術(shù);遺傳多樣性;進(jìn)化;精準(zhǔn)育種;熱帶作物
中圖分類號(hào):Q-1? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract: Genomics not only makes the development of genetics up to the ultimate dream, to obtain precision DNA sequence in chromosome level for individual species, resolve the basic problems of life science, but also, the ultra-high throughput sequencing technology makes it easy and accuracy to interprete the population genetic diversity for a species, thus changing the way and the process of modern life science and research. Here is an overview of the latest progress of genome technology and its extensive application in the fields of genetic structure diversity of species populations, functional gene exploration, biological evolution and precision breeding in combination with relevant omics technology, so as to comprehensively analyze biological inheritance and character variation. Meanwhile, the biological characteristics, genome research progress and existing problems of tropical crops were briefly reviewed, and perspective the future development and new applications of genomics.
Keywords: genomics; the third generation sequencing technology; genetic diversity; evolution; precision breeding; tropical crops
DOI: 10.3969/j.issn.1000-2561.2020.10.019
1? 基因組學(xué)的概念、內(nèi)涵與外延
自美國(guó)進(jìn)化生物學(xué)家托馬斯·亨特·摩爾根創(chuàng)作的《基因論》(1926年)為標(biāo)志的遺傳學(xué)問世,近百年來基因概念經(jīng)歷了深度的發(fā)展,從單基因遺傳因子,到DNA雙螺旋結(jié)構(gòu)、轉(zhuǎn)座子、細(xì)胞遺傳學(xué)、群體遺傳學(xué)到表觀遺傳學(xué),分子生物學(xué)技術(shù)的進(jìn)步催生了基因組學(xué)(genomics)。美國(guó)科學(xué)家Thomas Roderick提出基因組學(xué)的概念(1986年),是指對(duì)物種所有基因進(jìn)行基因組作圖、核苷酸序列分析、基因定位和基因功能分析的一門科學(xué)。基因組學(xué)是現(xiàn)代遺傳學(xué)的基本形式,特別是核苷酸高通量測(cè)序技術(shù)的發(fā)展,以有限的成本測(cè)定所有經(jīng)濟(jì)物種基因組序列成為現(xiàn)實(shí),進(jìn)而從基因組草圖升級(jí)為基因組精細(xì)圖譜,結(jié)合生物學(xué)相關(guān)技術(shù)的進(jìn)步,基因組學(xué)的內(nèi)涵發(fā)生了顯著的變化,已成為生命科學(xué)的前沿和熱點(diǎn)領(lǐng)域。狹義的基因組學(xué)包括結(jié)構(gòu)基因組、功能基因組和比較基因組學(xué)幾個(gè)方面,而廣義的基因組學(xué)還包括由生物學(xué)中心法則演化的生物遺傳信息流的整合研究。如測(cè)定全基因組特定時(shí)空和組織器官的基因表達(dá)譜,即轉(zhuǎn)錄組學(xué),也包括全基因組范圍mRNA指導(dǎo)完成的蛋白質(zhì)合成與調(diào)控,即蛋白質(zhì)組學(xué),還包括新興的代謝組學(xué),及由生物蛋白酶系統(tǒng)組織完成的數(shù)量更加復(fù)雜的代謝產(chǎn)物分析及其與遺傳關(guān)系的研究[1]。有的學(xué)者贊同后者是基因組學(xué)研究的外延,這種外延還包括在DNA、RNA和蛋白質(zhì)水平修飾的甲基化、泛素化、磷酸化等,及非編碼RNA介導(dǎo)的遺傳調(diào)控相關(guān)表觀遺傳學(xué)[1]?;蚪M學(xué)從個(gè)體或者細(xì)胞的單個(gè)基因研究上升到對(duì)相關(guān)基因群和全部基因的協(xié)同作用研究,構(gòu)建特定生物學(xué)過程的基因網(wǎng)絡(luò),促進(jìn)了可量化的系統(tǒng)生物學(xué)發(fā)展。尚包括針對(duì)物種群體的基因組解析,挖掘物種水平的遺傳變異及其進(jìn)化信息。
2? 基因組學(xué)技術(shù)改變了生命科學(xué)進(jìn)程
2.1? 基因組學(xué)技術(shù)將生命科學(xué)推進(jìn)到精準(zhǔn)研究的時(shí)代
2007年第二代基因組測(cè)序技術(shù)取得突破,以454、Illumina測(cè)序技術(shù)為代表的高通量短片段測(cè)序與拼接技術(shù),將DNA/RNA序列分析成本大大降低,導(dǎo)致迄今主要經(jīng)濟(jì)物種基因組草圖全面問世,物種演化和遺傳多樣性等基礎(chǔ)生物學(xué)問題取得大量數(shù)據(jù)和全新的進(jìn)展,非編碼RNA和表觀遺傳學(xué)調(diào)控初見端倪;然而由于物種基因組的復(fù)雜性,特別是重復(fù)序列的大量存在,使得現(xiàn)有基因組草圖只具有參考價(jià)值,基因組大都不夠完整,全基因組測(cè)序覆蓋度一般為65%~90%[2],并且不可避免存在許多堿基序列錯(cuò)誤和拼接次序的錯(cuò)誤。2017年以Pac-Bio和Oxford Nanopore為代表的第三代測(cè)序儀取得顯著的改進(jìn),Pac-Bio目前允許單個(gè)片段測(cè)序讀長(zhǎng)達(dá)到15 kb,測(cè)序通量和準(zhǔn)確率進(jìn)一步提升,這樣將可以解決基因組重復(fù)序列的障礙;Bionano單分子納米孔測(cè)序及光學(xué)物理圖譜技術(shù),則通過對(duì)大片段基因組DNA分子特定位點(diǎn)的標(biāo)記,建立高覆蓋度的光學(xué)物理圖譜,適度拼裝可以達(dá)到N50為5 Mb的超長(zhǎng)序列[3]。該項(xiàng)技術(shù)不僅能夠?yàn)榇蠡蚪M組裝提供精確的骨架,整合三代測(cè)序數(shù)據(jù)組裝染色體級(jí)別的物種基因組精細(xì)圖,而且通過基因轉(zhuǎn)錄起始區(qū)、甲基化、特定類型基因等多重標(biāo)記,能夠?yàn)槲锓N群體提供功能性狀的染色體鏡像,解決長(zhǎng)期以來細(xì)胞學(xué)與分子水平遺傳研究的銜接問題[4]。這些三代測(cè)序技術(shù)與二代測(cè)序技術(shù)及Hi-C技術(shù)的整合,可以有限成本將物種基因組組裝到染色體級(jí)別的精細(xì)圖譜,覆蓋度達(dá)到90%~99%,Scaffold N50達(dá)到30~50 Mb[4],標(biāo)志著基因組學(xué)研究進(jìn)入精準(zhǔn)科學(xué)時(shí)代,許多基因組草圖將被改寫為基因組精細(xì)圖譜。蛋白質(zhì)組學(xué)中iTRAQ技術(shù)發(fā)展使得單次測(cè)序獲得6000~10000個(gè)蛋白質(zhì)片段[5],這些新技術(shù)的組合和綜合應(yīng)用,建立了精準(zhǔn)生命科學(xué)研究的技術(shù)基礎(chǔ)。以精準(zhǔn)生命科學(xué)的基因組學(xué)、表觀遺傳學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)、基因組編輯技術(shù)等為基礎(chǔ)的生命科學(xué)即將進(jìn)入一個(gè)全新的時(shí)代。揭示生命活動(dòng)的精細(xì)調(diào)控,生物重構(gòu),經(jīng)濟(jì)作物產(chǎn)量與品質(zhì)調(diào)節(jié),實(shí)現(xiàn)精準(zhǔn)人類健康管理等精準(zhǔn)操作,并將衍生大量的應(yīng)用性技術(shù)乃至產(chǎn)業(yè)?;蚪M學(xué)技術(shù)在未來的應(yīng)用圖景歸納為圖1。
2.2? 高分辨率群體基因型分析破解物種多樣性終極變異及其演化
群體基因型分析從傳統(tǒng)的分子標(biāo)記(RAPD,SSR,AFLP等)、芯片技術(shù)逐步轉(zhuǎn)向簡(jiǎn)化重測(cè)序和重測(cè)序,其檢測(cè)通量成等比級(jí)數(shù)上升,而分析成本則成等比級(jí)數(shù)下降。芯片雜交技術(shù)由于信號(hào)的噪聲問題,加上需要多個(gè)重復(fù)增加了成本,而逐漸被重測(cè)序取代。全基因組重測(cè)序是對(duì)基因組序列已知的個(gè)體進(jìn)行全基因組范圍的測(cè)序,并在個(gè)體或群體水平上進(jìn)行差異性分析的方法。過去10年由于重測(cè)序成本尚比較高,幾種簡(jiǎn)化重測(cè)序技術(shù)應(yīng)運(yùn)而生。最典型的是康內(nèi)爾大學(xué)推出的genotyping by sequencing(GBS)技術(shù)[6],在對(duì)物種DNA酶切基礎(chǔ)上的隨機(jī)擴(kuò)增,獲取基因組約5%~7%的序列,并采用加barcode混合樣本測(cè)序策略,測(cè)序成本大大降低;另外一種AFSM技術(shù),進(jìn)一步選擇了對(duì)甲基化敏感的酶切位點(diǎn),且對(duì)基因區(qū)有一定偏置性,可同時(shí)檢測(cè)全基因組的甲基化水平[7]。簡(jiǎn)化重測(cè)序技術(shù)主要用于解析物種大群體遺傳多樣性變異(SNPs,InDels)和性狀關(guān)聯(lián)分析,以及育種群體的標(biāo)記選擇,目前已得到廣泛的應(yīng)用。隨著基因組測(cè)序成本的進(jìn)一步降低,采用二代測(cè)序技術(shù)的完全重測(cè)序及其新型建庫(kù)技術(shù)得到更多的應(yīng)用,可以獲得幾乎完整的基因區(qū)序列信息,并可以部分檢測(cè)基因組一些結(jié)構(gòu)變異SV(小于50 bp)信息[8],在作物物種群體遺傳多樣性、育種標(biāo)記檢測(cè)、人類疾病的致病突變研究及物種演化中有越來越多的應(yīng)用,具有重大的科研和產(chǎn)業(yè)價(jià)值?,F(xiàn)將若干種應(yīng)用分述如下。
2.2.1? 全基因組重測(cè)序?qū)崿F(xiàn)目標(biāo)性狀的精細(xì)標(biāo)記? 第二(NGS)、第三代測(cè)序技術(shù)與遺傳學(xué)的結(jié)合,加快了作物農(nóng)藝性狀相關(guān)基因的識(shí)別和分離。由于標(biāo)記密度的顯著增大,提高了QTL位置的分辨率,有助于確定基因的功能性變異。通過重測(cè)序可以發(fā)現(xiàn)大量的單核苷酸多態(tài)性位點(diǎn)(SNPs)、拷貝數(shù)變異(copy number variation,CNV)、插入缺失(insertions/deletions,InDels)、結(jié)構(gòu)變異(structure variation,SV)等變異位點(diǎn)?;谝陨献儺愇稽c(diǎn)作為分子遺傳標(biāo)記,在人類復(fù)雜疾病、動(dòng)植物經(jīng)濟(jì)性狀和育種研究及物種起源、馴化、群體歷史動(dòng)態(tài)等方面具有重要的指導(dǎo)意義[9-10]。一系列在獲取物種基因組精細(xì)圖基礎(chǔ)上,對(duì)栽培及野生種大群體重測(cè)序解析育種重要性狀QTL和關(guān)聯(lián)位點(diǎn)的研究問世,包括對(duì)于桃樹主要品質(zhì)性狀的系統(tǒng)研究[11],這些研究在方法學(xué)上采用批量分離分析(BSA)、基因組遺傳多態(tài)數(shù)據(jù)庫(kù)的構(gòu)建,結(jié)合多年多點(diǎn)表型數(shù)據(jù)以精確QTL和關(guān)聯(lián)位點(diǎn)的檢測(cè)[12]。全基因組重測(cè)序基礎(chǔ)上的GWAS分析已經(jīng)取得顯著的成果,在生物醫(yī)學(xué)領(lǐng)域揭示了數(shù)百個(gè)復(fù)雜的疾病性狀,可以肯定未來的GWAS將以全基因組測(cè)序?yàn)榛A(chǔ)[13]。
2.2.2? 群體重測(cè)序發(fā)現(xiàn)新基因? 通過經(jīng)濟(jì)物種自然群體基因型標(biāo)記與表型性狀的全基因組關(guān)聯(lián)分析,或者實(shí)驗(yàn)群體的QTL定位獲取性狀的分子標(biāo)記,進(jìn)而通過圖位克隆是新基因發(fā)掘的重要方法。然而傳統(tǒng)意義上由于群體遺傳標(biāo)記密度過低問題,基因圖位克隆需要輔之以大片段DNA文庫(kù)篩選,以及染色體步移等復(fù)雜的技術(shù)程序,通過圖位克隆獲得動(dòng)植物基因[14]。隨著群體重測(cè)序技術(shù)的廣泛應(yīng)用,一次性獲得物種超高密度的單倍型圖譜變得簡(jiǎn)單可行,一旦有可靠的群體表型數(shù)據(jù),圖位克隆過程變得比過去更為簡(jiǎn)單,因而更加實(shí)用。迄今在大豆、木豆、油菜、棉花及動(dòng)物山羊等經(jīng)濟(jì)物種中有大量成功的范例,獲得具有重要經(jīng)濟(jì)價(jià)值的基因資源[12, 15-18]。
高分辨率基因組分析技術(shù)為農(nóng)作物基因組的結(jié)構(gòu)多樣性提供了前所未有的視角。除了用于復(fù)雜農(nóng)藝性狀的遺傳作圖或全基因組關(guān)聯(lián)研究外,高密度基因分型陣列也非常適用于基因組選擇策略,它們還能以前所未有的染色體尺度分辨率描述作物多樣性。這些研究深入了解了作物進(jìn)化和選擇的歷史,同時(shí)發(fā)現(xiàn)了新的多樣性以提高產(chǎn)量和雜種優(yōu)勢(shì)[19]。
2.2.3? 全基因組重測(cè)序解析生物適應(yīng)性進(jìn)化? 對(duì)于物種演化研究,到目前為止,大部分知識(shí)來自基于短片段測(cè)序的分析,而長(zhǎng)讀測(cè)序技術(shù)正開始應(yīng)用于所有物種的基因組分析,其遺傳變異信息接近完整,也包括在染色體水平的基因組結(jié)構(gòu)變異,會(huì)在更大尺度上影響基因組功能,展示基因組進(jìn)化圖景[20]。在獲得物種參考基因組基礎(chǔ)上,對(duì)多個(gè)基因組深度重測(cè)序,特別是野生與栽培類型的比較解析,提供了栽培物種進(jìn)化、馴化和物種形成的更加完整的證據(jù)[21]。如迄今在辣椒[22]、桃樹[23]和鷹嘴豆[24]等物種所發(fā)現(xiàn)的演化途徑,揭示了選擇性刪除(selective sweeping)、轉(zhuǎn)座調(diào)控等在物種演化與形成中具有重要的作用。
在相關(guān)研究中,首先,需要獲取物種地域分布演化過程群體的原始樣本,一般具有栽培類型的祖先種(亞種)或近緣種群體,加上農(nóng)家種和改良品種,每個(gè)類型選擇具有統(tǒng)計(jì)學(xué)意義的小群體,栽培類型適當(dāng)增加,總居群數(shù)量應(yīng)在100份以上。通過對(duì)若干代表性樣本的精細(xì)圖譜構(gòu)建,結(jié)合群體全部居群的重測(cè)序,能夠獲得百萬至千萬級(jí)別的SNPs、InDels多樣本變異標(biāo)記,以及部分SV信息(小于50 bp),從而構(gòu)建全基因組單倍型圖譜,通過栽培種內(nèi)部及與野生祖先種的比較,可以清晰構(gòu)建種群結(jié)構(gòu)圖,解析物種演化歷程,發(fā)現(xiàn)進(jìn)化中的關(guān)鍵事件[25]。如對(duì)72個(gè)牦牛野生和馴化群體的重測(cè)序研究,比較了中國(guó)26個(gè)地區(qū)野牦牛和家養(yǎng)牦牛的全基因組遺傳變異圖譜,發(fā)現(xiàn)人們?cè)缭诠?300年前新石器早期的青藏高原就已馴化了野生牦牛,而馴化數(shù)量則在公元3600年前增長(zhǎng)了約6倍。該項(xiàng)研究還估算出牦牛種群大量增加和全新世晚期人類群體在此地理區(qū)域的擴(kuò)散是同時(shí)發(fā)生的;研究還發(fā)現(xiàn)家養(yǎng)牦牛的基因組中,大約有200個(gè)基因受到了人為的馴化選擇,這些選擇可能影響到了動(dòng)物的行為,尤其是溫順性。而這種馴化基因與狗等其他馴化動(dòng)物中發(fā)現(xiàn)的基因也十分相似[26]。
2.3? 泛基因組測(cè)序——整合物種完全遺傳變異信息
泛基因組(pan genome)是指涵蓋物種各種生物類型群體的整合基因組。迄今,物種的參考基因組已經(jīng)達(dá)到精細(xì)圖譜水平,但是其對(duì)于物種群體遺傳變異的代表性仍然具有局限性。過去5年大量的重測(cè)序、簡(jiǎn)化重測(cè)序信息為在群體水平挖掘遺傳變異、發(fā)現(xiàn)育種標(biāo)記提供了巨大的機(jī)遇,在結(jié)構(gòu)基因組領(lǐng)域發(fā)揮了重要作用。然而,其主要檢測(cè)的是SNP和InDel(小于50 bp)的多樣性,對(duì)于基因組SV信息,包括大的插入/缺失、倒位、轉(zhuǎn)位和重復(fù)等,尚不足以解析。隨著第三代測(cè)序技術(shù)的進(jìn)步,以及測(cè)序成本的大幅度下降,針對(duì)物種平行性測(cè)定多個(gè)基因型序列,并獨(dú)立組裝注釋,繪制物種泛基因組結(jié)構(gòu)圖景,并挖掘其SV取得顯著進(jìn)展[27]。為此,生物信息學(xué)專家設(shè)計(jì)了專門的算法和軟件應(yīng)用于不同程度多基因組序列的整合和注釋[28]。由26個(gè)大豆品系獨(dú)立組裝的泛基因組中,每個(gè)品系平均有約16%序列是不存在的[29],而在油菜8個(gè)獨(dú)立組裝的泛基因組分析中,發(fā)現(xiàn)僅有76%~84%的共線性序列存在于參考基因組中[30]。植物中受到復(fù)雜基因組、多倍化等影響,泛基因組結(jié)構(gòu)可以涵蓋多個(gè)來源基因組序列信息,發(fā)現(xiàn)新的基因、新的大尺度SV,揭示染色體水平的基因重排和劑量效應(yīng)。
在技術(shù)方面,泛基因組主要依賴于第三代單分子測(cè)序技術(shù),包括Pac-Bio的天然DNA鏈的單分子實(shí)時(shí)(SMRT)測(cè)序[31],牛津大學(xué)的Nanopore單分子技術(shù)[32]。它們可以克服第二代短鏈高通量測(cè)序技術(shù)的3個(gè)基本缺陷:即重復(fù)序列區(qū)排序錯(cuò)誤而不能檢測(cè)大的結(jié)構(gòu)變異、組裝引入非隨機(jī)誤差阻礙了基因變異的檢測(cè)以及包括聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增的偏倚和測(cè)序覆蓋范圍的非均勻分布[33]。當(dāng)然,已有的技術(shù)并不能夠解決所有的讀長(zhǎng)問題,光學(xué)物理圖譜(BioNano)及基于二代測(cè)序的特有組裝策略10×Genomics等為泛基因組分析提供了補(bǔ)充方法。在計(jì)算層面,泛基因組數(shù)據(jù)具有“大數(shù)據(jù)”的所有標(biāo)準(zhǔn)屬性,由于所生成的測(cè)序數(shù)據(jù)的巨大規(guī)模、數(shù)據(jù)的極端異質(zhì)性和不同層次上復(fù)雜的交互作用,泛基因組學(xué)給算法和軟件開發(fā)帶來了巨大的挑戰(zhàn)。國(guó)際癌癥基因組聯(lián)合會(huì)在短短5年內(nèi)積累了一套超過2兆字節(jié)的數(shù)據(jù)集,其結(jié)論是一般以云層存儲(chǔ)數(shù)據(jù),提供了一種以廉價(jià)、靈活、可靠和安全的方式處理數(shù)據(jù)的彈性、動(dòng)態(tài)和并行方式[34]。在基因組測(cè)序技術(shù)不斷發(fā)展的今天,獲取物種所有可能的基因組已經(jīng)成為可能,將很快在許多物種、群體和癌癥基因組中實(shí)現(xiàn)。換句話說,生命科學(xué)已經(jīng)進(jìn)入了“泛基因組學(xué)”的時(shí)代,這個(gè)時(shí)代的特征是了解一組感興趣的基因組的所有重大遺傳變異。如何挖掘和分析這些令人難以置信的知識(shí)財(cái)富,以及如何使其走向應(yīng)用是一項(xiàng)神圣的使命。
2.4? 轉(zhuǎn)錄組學(xué)建立生物特定時(shí)空基因表達(dá)全景
轉(zhuǎn)錄組學(xué)(transcriptomics),或RNA-seq測(cè)序及分析,肇始于第二代高通量測(cè)序技術(shù),理論上可以揭示生物組織、器官在特定時(shí)間基因組上所有轉(zhuǎn)錄本,進(jìn)而用于建立一定信號(hào)調(diào)節(jié)生物學(xué)過程中相關(guān)基因的共表達(dá)網(wǎng)絡(luò)(Co-expression network),從而發(fā)現(xiàn)起到交互作用的節(jié)點(diǎn)基因(hub genes)。在過去的10年中,轉(zhuǎn)錄組測(cè)序(RNA-seq)已經(jīng)成為分析差異基因表達(dá)和mRNAs差異剪接的不可缺少的工具[35]。轉(zhuǎn)錄組分析應(yīng)用于動(dòng)植物、微生物生長(zhǎng)發(fā)育的所有方面,主要獲取基因轉(zhuǎn)錄本類型、數(shù)量及表達(dá)豐度。轉(zhuǎn)錄組與基因組、表型組、代謝組等大數(shù)據(jù)的整合,衍生了更多具有生物學(xué)意義的基因組信息。通過試驗(yàn)設(shè)計(jì),多組學(xué)及生物學(xué)技術(shù)分析,如與表型、DNA序列及基因組甲基化的關(guān)聯(lián)分析,分別解析群體E-QTLs,甲基化偏好的基因表達(dá)信息,能夠有效獲取特定生物學(xué)過程相關(guān)關(guān)鍵基因和代謝途徑,已經(jīng)有廣泛的應(yīng)用,如在水稻產(chǎn)量品質(zhì)[36]、葡萄黃酮類代謝途徑[37]及人類遺傳病[38]等方面的高效解析。
隨著第三代基因組測(cè)序技術(shù)的發(fā)展,RNA- seq方法可用于研究RNA生物學(xué)的許多不同方面,包括單細(xì)胞基因的表達(dá)、翻譯組(translatome)和RNA結(jié)構(gòu)。新的長(zhǎng)讀和直接RNA-seq技術(shù),提供了無擴(kuò)增的、單分子的cDNAs測(cè)序,可以在不需要裝配步驟的情況下展示完整的轉(zhuǎn)錄本。長(zhǎng)片段測(cè)序技術(shù)可能最終還原復(fù)雜cDNAs的全長(zhǎng)及其豐度[39]。結(jié)合更好的數(shù)據(jù)分析計(jì)算工具,轉(zhuǎn)錄組學(xué)的創(chuàng)新有助于更全面地理解RNA生物學(xué),從轉(zhuǎn)錄發(fā)生的時(shí)間和地點(diǎn)等問題到控制RNA功能的折疊和分子間相互作用。
最近,單細(xì)胞轉(zhuǎn)錄組測(cè)序成為熱點(diǎn),尤其在人類醫(yī)學(xué)和動(dòng)物研究領(lǐng)域。如免疫系統(tǒng)是由一個(gè)復(fù)雜層次的細(xì)胞類型組成,以保護(hù)機(jī)體免受疾病和維持動(dòng)態(tài)平衡。識(shí)別免疫細(xì)胞的異質(zhì)性是了解免疫系統(tǒng)的關(guān)鍵。先進(jìn)的單細(xì)胞RNA測(cè)序(scRNA-seq)技術(shù)正在徹底改變我們研究免疫學(xué)的能力,通過在單細(xì)胞水平上測(cè)量轉(zhuǎn)錄水平,能夠比常規(guī)方法更詳細(xì)地識(shí)別細(xì)胞異質(zhì)性[40]。在植物中單細(xì)胞RNA測(cè)序同樣前景廣闊,但目前主要受到單細(xì)胞材料分離的障礙。傳統(tǒng)的原生質(zhì)體技術(shù)在許多物種中進(jìn)行了嘗試,針對(duì)維管束細(xì)胞的分離已經(jīng)具有成熟的材料與測(cè)序分析技術(shù)[41]。
2.5? 表型組學(xué)成為精確解析遺傳效應(yīng)的新趨勢(shì)
表型組(phenome)是指某一生物的全部性狀特征,表型組學(xué)(phenomics)是一門在基因組水平上系統(tǒng)研究某一生物或細(xì)胞在各種不同環(huán)境條件下所有表型的學(xué)科。Steven A Garan(1996)首次提出了phenomics(表型組學(xué))這一概念,比利時(shí)Crop Design公司成立并肇始研發(fā)植物性狀評(píng)價(jià)的高通量技術(shù)平臺(tái)(1998)。該公司發(fā)表了具有里程碑意義的論文,詳細(xì)闡述了稱之為“性狀工廠”(trait mill)的可大規(guī)模自動(dòng)化分析全生育期植物表型的技術(shù)設(shè)施(2005)。2009年,第一屆國(guó)際植物表型組大會(huì)在澳大利亞堪培拉成功舉辦。南京農(nóng)業(yè)大學(xué)與美國(guó)科學(xué)促進(jìn)會(huì)聯(lián)合出版的《Plant Phenomics》正式發(fā)刊(2019年),標(biāo)志著表型組學(xué)學(xué)科已經(jīng)成為生物學(xué)研究的熱點(diǎn)領(lǐng)域,將是精準(zhǔn)植物遺傳研究的重要工具。
基于消除遺傳學(xué)研究中不可控環(huán)境因素引起的表型數(shù)據(jù)噪聲的需要,表型組學(xué)發(fā)展出一套系統(tǒng)的研究方法。其范圍涵蓋高通量數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)解釋、建模和集成應(yīng)用5個(gè)方面[42]。在技術(shù)層面,除了在控制環(huán)境下進(jìn)行表型數(shù)據(jù)獲取外,更重要的是發(fā)展了新型植物生長(zhǎng)發(fā)育及品質(zhì)性狀檢測(cè)的專門設(shè)備。高通量數(shù)據(jù)獲取目前有室內(nèi)固定平臺(tái)、室外移動(dòng)監(jiān)測(cè)平臺(tái)、無人機(jī)監(jiān)測(cè)平臺(tái)、田間大型固定監(jiān)測(cè)平臺(tái)、田間全自動(dòng)表型機(jī)器人等多種設(shè)備。室內(nèi)固定平臺(tái)集成了多光譜相機(jī)、RGB相機(jī)、激光雷達(dá)、熱成像儀以及高光譜相機(jī)等,采用“sensor-to-plant”的工作方式[43];室外表型監(jiān)測(cè)平臺(tái),通常還研發(fā)有車載及背包式移動(dòng)平臺(tái)、田間固定監(jiān)測(cè)平臺(tái)和無人機(jī)監(jiān)測(cè)平臺(tái)。車載移動(dòng)平臺(tái)將傳感器裝載在遙控的移動(dòng)智能小車或大型特制車輛上,可實(shí)現(xiàn)長(zhǎng)距離、大范圍的樣本數(shù)據(jù)采集[44];背包式移動(dòng)平臺(tái),將傳感器裝載在簡(jiǎn)易的背負(fù)系統(tǒng)上,可方便、靈活地完成目標(biāo)區(qū)域的數(shù)據(jù)采集;田間固定監(jiān)測(cè)平臺(tái),可長(zhǎng)期、固定地對(duì)有效測(cè)區(qū)作物進(jìn)行觀測(cè)[45];無人機(jī)監(jiān)測(cè)平臺(tái),可快速獲取大面積的作物三維點(diǎn)云,用于廣泛、復(fù)雜的農(nóng)田冠層數(shù)據(jù)收集[46]。新型技術(shù)包括采用多種光譜技術(shù)檢測(cè)地上部光合作用、生長(zhǎng)狀況及生物積累量。最新的3D激光掃描模塊能夠耐受全日照輻射而不影響測(cè)量,在高精度測(cè)量三維點(diǎn)云信息的同時(shí),測(cè)量400~900 nm范圍內(nèi)4個(gè)波段的多光譜成像,使得我們可以得到植物在X、Y和Z軸上所有坐標(biāo)點(diǎn)的多光譜信息,通過對(duì)光譜信息進(jìn)行完美的校準(zhǔn),從而獲得更加精準(zhǔn)的數(shù)據(jù)[47]。紅外和近紅外熱成像技術(shù)用于對(duì)植物水分狀況及脅迫性狀的監(jiān)測(cè)[48];根系CT成像模塊,可成功實(shí)現(xiàn)原位監(jiān)測(cè)植株根系狀態(tài),并對(duì)花盆內(nèi)自然土壤中的根系進(jìn)行掃描和重建[49]。表型組數(shù)據(jù)處理依賴生物信息學(xué)技術(shù),將原始數(shù)據(jù)還原為有效性狀,涵蓋計(jì)算機(jī)視覺、信息過程、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、生理等,然后通過對(duì)生態(tài)生理過程的詳細(xì)描述,對(duì)植物結(jié)構(gòu)及其動(dòng)態(tài)和植物功能進(jìn)行建模。
植物和作物模擬模型是預(yù)測(cè)氣候變化、創(chuàng)新的作物管理實(shí)踐以及基于性狀或基因的新育種技術(shù)對(duì)作物生產(chǎn)和農(nóng)業(yè)系統(tǒng)的影響的強(qiáng)大工具,部分模型已經(jīng)有實(shí)證數(shù)據(jù)的支持,用于彌合基因、基因型和表型之間的差距[42]。對(duì)闊葉果樹葡萄果穗及葉型的群體光譜檢測(cè),與實(shí)際測(cè)量數(shù)據(jù)的擬合程度達(dá)到95%[47],然而表型組工具在作物上的應(yīng)用還剛剛開始[50],尚有大量的跨學(xué)科的技術(shù)空間需要完善,以期實(shí)現(xiàn)性狀的精確標(biāo)記和分子育種建模,從而指導(dǎo)作物遺傳改良與新品種選育進(jìn)入精準(zhǔn)設(shè)計(jì)育種時(shí)代。
3? 熱帶作物及其基因組學(xué)研究
3.1? 熱帶作物基因組特性
熱帶地區(qū)是人類馴化經(jīng)濟(jì)物種的主要起源中心之一,最典型的是茄科、葫蘆科、大戟科和禾本科作物,包括起源于南美洲的玉米、木薯、橡膠樹、馬鈴薯、番茄、辣椒等,以及起源于東南亞的水稻、甘蔗等。除了人類長(zhǎng)期馴化已經(jīng)全球分布的大宗作物外,木薯、橡膠樹、甘蔗、杧果、菠蘿等典型熱帶作物具有極其重要的經(jīng)濟(jì)、社會(huì)價(jià)值。熱帶植物適應(yīng)熱帶高光、高溫及充沛的降雨環(huán)境,形成高生物轉(zhuǎn)化能力,一般具有高生物量、高營(yíng)養(yǎng)利用和環(huán)境適應(yīng)力強(qiáng)等共性生物學(xué)特征。它們?cè)谶m應(yīng)其生存環(huán)境的長(zhǎng)期過程中演化出多樣性的形態(tài)學(xué)、遺傳學(xué)適應(yīng)機(jī)制。在基因組結(jié)構(gòu)層面,由于其多數(shù)的開放授粉、營(yíng)養(yǎng)體繁殖和生長(zhǎng)周期長(zhǎng)等習(xí)性,大多數(shù)熱帶植物基因組具有高雜合度,物種群體具有復(fù)雜的遺傳多樣性[21,51]。熱帶作物群體中一般連鎖不平衡(LD)相對(duì)較低,長(zhǎng)期無性繁殖和開放授粉在不同程度上積累了遺傳冗余和不利的遺傳變異,使得育種所需求的優(yōu)良等位基因位點(diǎn)分散在不同的自然品系群體中。這樣通過常規(guī)育種選擇優(yōu)良變異聚合的新類型效率一般較低[52]。按照傳統(tǒng)的植物品種馴化與資源利用方式,開發(fā)新的品種和利用方式需要經(jīng)過漫長(zhǎng)的過程。熱帶作物雜合基因位點(diǎn)中有利等位基因挖掘需要依賴群體的基因型和表型數(shù)據(jù)解析,充分利用現(xiàn)代基因組、蛋白質(zhì)組、代謝組學(xué)和表型組學(xué)方法,發(fā)現(xiàn)熱帶作物中高生物積累,具有人類健康、營(yíng)養(yǎng)和環(huán)保價(jià)值的活性物質(zhì),挖掘代謝途徑,發(fā)掘基因資源,并通過設(shè)計(jì)育種培育新品種,將為資源利用開辟全新的途徑。
3.2? 熱帶作物基因組學(xué)研究進(jìn)展
3.2.1? 主要熱帶農(nóng)業(yè)生物基因組測(cè)序與精細(xì)圖譜繪制? 2008年首個(gè)熱帶水果番木瓜基因組草圖問世,此后先后繪制了油棕、椰棗、木薯、香蕉A、B基因組,以及菠蘿、橡膠樹、麻瘋樹、鐵皮石斛、甘蔗等基因組草圖;近年完成并公布了杧果、菠蘿、狼尾草等熱帶作物的基因組精細(xì)圖譜,據(jù)不完全統(tǒng)計(jì)26個(gè)重要熱帶作物完成基因組測(cè)序與注釋(表1),為相關(guān)物種的生物學(xué)研究和遺傳改良奠定了基礎(chǔ)。隨著第三代基因組技術(shù)的進(jìn)步,基因組測(cè)序成本大大降低,速度加快,基因組組裝難度下降,組裝水平提升,獲得基因組精細(xì)圖譜已經(jīng)成為新的技術(shù)標(biāo)準(zhǔn)。越來越多的熱帶農(nóng)業(yè)物種基因組圖譜將被公布,為熱帶作物的遺傳多樣性評(píng)價(jià)、基因挖掘和精準(zhǔn)育種提供了全新的基礎(chǔ)?;蚪M數(shù)據(jù)與其它多組學(xué)數(shù)據(jù)的整合,在熱帶作物中尚很少報(bào)道。目前基因組測(cè)序工作大都依賴為數(shù)不多的生物技術(shù)公司,研究機(jī)構(gòu)對(duì)于基因組學(xué)技術(shù)的認(rèn)知程度有限,從業(yè)人數(shù)較少,在基因組研究方案設(shè)計(jì)、材料選擇及所能夠解決的科學(xué)問題認(rèn)知方面均存在較多問題,特別是對(duì)于基因組學(xué)的地位和價(jià)值認(rèn)識(shí)不足,短視行為普遍,往往片面追求論文,而忽視數(shù)據(jù)價(jià)值。
基因組學(xué)新技術(shù)的發(fā)展,允許一個(gè)基礎(chǔ)研究落后的物種,直接完成染色體級(jí)別的精細(xì)參考基因組,同時(shí)借助重測(cè)序和簡(jiǎn)化重測(cè)序技術(shù),解析其核心種群的遺傳多樣性、物種起源與演化、關(guān)鍵經(jīng)濟(jì)農(nóng)藝性狀的遺傳結(jié)構(gòu),開展原創(chuàng)性研究。從熱帶作物育種研究的頂層設(shè)計(jì),組織相關(guān)研究計(jì)劃對(duì)于從根本上改變其遺傳改良的技術(shù)水平,提升育種效率,可以起到事半功倍的效應(yīng)。
3.2.2? 熱帶作物基因組數(shù)據(jù)庫(kù)建設(shè)? 基因組測(cè)序的真正價(jià)值不是一篇文章,而是大數(shù)據(jù)庫(kù)。美國(guó)生物技術(shù)中心(NCBI Genbank數(shù)據(jù)庫(kù))成為全球農(nóng)業(yè)與生物學(xué)研究者無可替代的信息源,此外歐洲生物技術(shù)研究所數(shù)據(jù)庫(kù),日本生物技術(shù)數(shù)據(jù)庫(kù),美國(guó)能源部的基因組數(shù)據(jù)庫(kù)等確立了在全球?qū)W術(shù)領(lǐng)域的地位。所有一流期刊發(fā)表文章均要求提供原始數(shù)據(jù)到三大數(shù)據(jù)庫(kù)。我國(guó)北京基因組研究所,華大基因及相關(guān)大學(xué)也建立了不同程度的基因組數(shù)據(jù)庫(kù),但與基因組學(xué)技術(shù)發(fā)展相匹配的更加專業(yè)化數(shù)據(jù)庫(kù)仍然欠缺。上述數(shù)據(jù)庫(kù)更多為基礎(chǔ)數(shù)據(jù)庫(kù),承擔(dān)數(shù)據(jù)淀積、基因序列檢索、文獻(xiàn)查詢等功能。而針對(duì)物種從基因組完全序列,到轉(zhuǎn)錄組、蛋白組、代謝組到性狀的全景信息,及整合育種需求的指導(dǎo)性方案,鮮有報(bào)道。在熱帶作物領(lǐng)域,重要國(guó)際研究機(jī)構(gòu)、相關(guān)大學(xué)擁有分散的、相對(duì)簡(jiǎn)單的數(shù)據(jù)庫(kù),如康內(nèi)爾大學(xué)建立的木薯育種數(shù)據(jù)庫(kù)(Cassavabase. org)[81]。中國(guó)熱帶農(nóng)業(yè)科學(xué)院建立了木薯的基因組數(shù)據(jù)庫(kù)(Cassava-genome. cn),并通過國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目與北京基因組研究所合作建立熱帶作物的整合基因組數(shù)據(jù)庫(kù)。建立一個(gè)熱帶作物的專業(yè)數(shù)據(jù)庫(kù)和分子育種服務(wù)平臺(tái)極為重要,其必要性在于:(1)基因組數(shù)據(jù)是極為重要的資源和知識(shí)產(chǎn)權(quán),需要搜集和整合針對(duì)重要熱帶經(jīng)濟(jì)作物的基因組和多組學(xué)數(shù)據(jù),并不斷豐富完善,提供更加有價(jià)值的服務(wù);(2)大數(shù)據(jù)的服務(wù)功能,隨著數(shù)據(jù)庫(kù)的進(jìn)一步完善,現(xiàn)代基礎(chǔ)生物學(xué)研究和遺傳改良將更加依賴數(shù)據(jù)庫(kù),成為必不可少的工具;(3)基因組數(shù)據(jù)庫(kù)是新型科學(xué)形式,機(jī)器學(xué)習(xí)和系統(tǒng)化將讓數(shù)據(jù)庫(kù)自我完善,具有智能特征,衍生多元化功能。
3.2.3? 熱帶作物基因組研究中存在的問題? 盡管高通量、低成本的基因組測(cè)序技術(shù)已經(jīng)為全面解析物種遺傳特性和遺傳育種提供了全新的工具,但是新技術(shù)應(yīng)用的廣泛性和效率仍然存在許多不確定因素。主要包括:(1)研究者特別是應(yīng)用研究專家對(duì)基因組技術(shù)的認(rèn)知度不夠。由于技術(shù)更新很快,且高通量測(cè)序技術(shù)依賴于生物信息學(xué)專家的大數(shù)據(jù)處理,海量數(shù)據(jù)與常規(guī)研究方法的契合點(diǎn)常常不能夠被有效認(rèn)知;(2)新技術(shù)的規(guī)模化應(yīng)用還未達(dá)到成熟的階段,數(shù)據(jù)迅速積累,理論需要不斷完善。針對(duì)大多數(shù)經(jīng)濟(jì)物種,在群體水平精準(zhǔn)解析性狀遺傳位點(diǎn)需要花費(fèi)大量的人力和物力,特別是表型性狀易受到環(huán)境因素影響,需要在多個(gè)環(huán)境下或者不同群體中加以驗(yàn)證。因此基因組選擇育種還沒有在多數(shù)物種中應(yīng)用;(3)大群體重測(cè)序和表型數(shù)據(jù)獲取的成本仍然較高。盡管相關(guān)測(cè)定與數(shù)據(jù)分析的成本已經(jīng)大幅度下降,但是若要完成數(shù)百份種質(zhì)的群體重測(cè)序和所有育種表型性狀,從單個(gè)實(shí)驗(yàn)室來看,確實(shí)難以承受,但是國(guó)家針對(duì)物種的研究計(jì)劃若能夠從源頭系統(tǒng)進(jìn)行,則成本就在可控范圍;(4)缺乏高效、完整的數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)?;蚪M及多組學(xué)數(shù)據(jù)除了那些典型的性狀關(guān)聯(lián)區(qū)域外,其全基因組變異特征及其與多種表型特征的對(duì)應(yīng)關(guān)系需要信賴生物信息學(xué)專家的數(shù)據(jù)處理與圖形化等一系列的數(shù)據(jù)管理工作。現(xiàn)有全球性基因組數(shù)據(jù)庫(kù)一般均比較綜合,尚未達(dá)到針對(duì)物種的全景式數(shù)據(jù)服務(wù)水平。因此,針對(duì)特定作物的基因組數(shù)據(jù)庫(kù)是未來作物育種的必然條件。
4? 基因組學(xué)技術(shù)的應(yīng)用前景
4.1? 結(jié)構(gòu)基因組學(xué)將成為傳統(tǒng)線性遺傳學(xué)的終結(jié),走向三維空間遺傳學(xué)
物種全基因組精細(xì)圖譜構(gòu)建,不僅可以闡明控制物種性狀的基因位點(diǎn)在全套染色體上的分布,構(gòu)建染色體DNA序列圖譜,而且能夠提供物種群體在染色體上所有位點(diǎn)堿基序列的變異譜;同時(shí),注釋在不同生育環(huán)境下基因位點(diǎn)甲基化、泛素化和磷酸化等修飾導(dǎo)致基因“閉合”與開放表達(dá)的信息。然而,真核生物的細(xì)胞核是一個(gè)復(fù)雜的三維環(huán)境,基因組的功能不僅依賴于調(diào)控序列元件的線性排列,還依賴于它們的空間組織來有效控制基因表達(dá)。轉(zhuǎn)錄調(diào)控部分是通過調(diào)控元件和基因啟動(dòng)子的空間鄰近發(fā)生的,這些相互作用對(duì)于真核生物的機(jī)體發(fā)育和對(duì)環(huán)境刺激的反應(yīng)至關(guān)重要。全基因組染色質(zhì)接觸圖為基因組的三維組織與基因表達(dá)之間的關(guān)系提供了重要的見解[82]。出于對(duì)生物細(xì)胞核整體染色體組織的興趣,科學(xué)家提出3D基因組的觀點(diǎn),借助物理學(xué)技術(shù),審查沿染色體和染色體之間的通信[83]。相關(guān)研究開始受到重視,并在轉(zhuǎn)錄因子蛋白與DNA結(jié)合算法等方面取得了可喜的進(jìn)展[84]。
4.2? 多組學(xué)數(shù)據(jù)整合構(gòu)建生物物種遺傳調(diào)控的信號(hào)網(wǎng)絡(luò)
植物生長(zhǎng)、發(fā)育、繁殖和適應(yīng),反應(yīng)到分子層面是一個(gè)極為復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。如果說傳統(tǒng)遺傳學(xué)只是在挖掘單個(gè)的遺傳調(diào)控點(diǎn),迄今的結(jié)構(gòu)基因組成果構(gòu)建了一個(gè)線性的多基因結(jié)構(gòu),而多組學(xué)可能提供不同的平面遺傳結(jié)構(gòu)。如何建立復(fù)雜遺傳系統(tǒng)中多基因的互作關(guān)系?實(shí)驗(yàn)生物學(xué)經(jīng)過漫長(zhǎng)的積累,根據(jù)生物產(chǎn)物化學(xué)結(jié)構(gòu)的邏輯關(guān)系建立主要生物學(xué)過程如光合作用、呼吸作用、免疫應(yīng)答等的代謝通路。借助人工誘導(dǎo)和遺傳轉(zhuǎn)化突變體庫(kù)及蛋白互作等正向遺傳學(xué)分析,發(fā)現(xiàn)許多代謝途徑的調(diào)控相關(guān)蛋白基因,初步形成單個(gè)過程與相關(guān)環(huán)境信號(hào)因子、內(nèi)源激素基因的互作網(wǎng)絡(luò),但是這些網(wǎng)絡(luò)還遠(yuǎn)不夠完善。多組學(xué)數(shù)據(jù)可以大大加快多基因互作網(wǎng)絡(luò)的構(gòu)建。轉(zhuǎn)錄組學(xué)數(shù)據(jù)真實(shí)反應(yīng)物種在特定環(huán)境和生育時(shí)期哪些基因表達(dá)和不表達(dá),以及控制生物過程的大量基因之間是如何協(xié)同表達(dá)。共同表達(dá)網(wǎng)絡(luò)(gene co-expression network,GCN)分析是解釋大型轉(zhuǎn)錄數(shù)據(jù)集的最強(qiáng)大的方法之一,它能夠映射功能相關(guān)基因的共同表達(dá)基因模塊的特性。一個(gè)針對(duì)擬南芥和玉米葉片發(fā)育的全轉(zhuǎn)錄組比較分析,在近1000個(gè)同源基因群中鑒定出19個(gè)轉(zhuǎn)錄因子家族,提供了雙子葉和單子葉植物間葉片發(fā)育的共性功能基因網(wǎng)絡(luò)[85]?;蚬脖磉_(dá)網(wǎng)絡(luò)(GCN)分析被廣泛應(yīng)用于生物醫(yī)學(xué)鑒定特定疾病的特異性生物標(biāo)志物。針對(duì)前列腺癌的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),采用加權(quán)相關(guān)網(wǎng)絡(luò)分析(WGCNA)鑒定出29個(gè)基因模塊,結(jié)合雄性激素受體(AR)基因篩選發(fā)現(xiàn)兩個(gè)新基因具有AR結(jié)合位點(diǎn),并用雄激素治療試驗(yàn)證明其可以作為前列腺癌的早期靶標(biāo),具有重要的醫(yī)學(xué)價(jià)值[86]。
蛋白質(zhì)、代謝組學(xué)數(shù)據(jù)的積累,同樣可為生物學(xué)過程中多基因關(guān)系提供豐富的互作信息[87]。蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PIN)是系統(tǒng)研究細(xì)胞內(nèi)復(fù)雜生物活性的有用工具。隨著測(cè)序、晶體學(xué)、光譜分析和雙雜交篩選等領(lǐng)域的發(fā)展,包括病毒、細(xì)菌、植物、動(dòng)物和人類,大量的蛋白質(zhì)-蛋白質(zhì)相互作用(PPIs)被發(fā)現(xiàn)?;谛蛄泻突诮Y(jié)構(gòu)的PPI預(yù)測(cè)工具發(fā)揮重要的作用,而真實(shí)豐富的數(shù)據(jù)庫(kù)資源是基礎(chǔ)[88]。
建立在實(shí)驗(yàn)生物學(xué)基礎(chǔ)上的植物環(huán)境信號(hào)感知以及多基因調(diào)控的信號(hào)網(wǎng)絡(luò)是了解生命過程的前沿。植物對(duì)環(huán)境信號(hào)反應(yīng)的最新研究表明,非生物脅迫作用于單個(gè)葉片時(shí),植物會(huì)產(chǎn)生一種全面的應(yīng)激特異性系統(tǒng)反應(yīng),包括許多不同的應(yīng)激特異性轉(zhuǎn)錄產(chǎn)物和代謝物的積累,且植物可以整合不同的局部和系統(tǒng)組合信號(hào)高效地適應(yīng)環(huán)境[89]。根毛發(fā)育相關(guān)基因調(diào)節(jié)網(wǎng)絡(luò)描述了控制細(xì)胞命運(yùn)和(或)根毛細(xì)胞生長(zhǎng)的關(guān)鍵轉(zhuǎn)錄調(diào)節(jié)因子[90]。同時(shí),非編碼小分子RNA在過程調(diào)節(jié)中的作用也會(huì)耦合其間。這樣從基因組、轉(zhuǎn)錄組、蛋白質(zhì)組及表觀組,就構(gòu)建了生命過程的立體結(jié)構(gòu),闡釋了物種特異性及其過程的復(fù)雜性,在組學(xué)水平建立物種的遺傳調(diào)控網(wǎng)絡(luò),這些均需要體現(xiàn)在專門的基因組數(shù)據(jù)庫(kù)中,為生物基礎(chǔ)研究及應(yīng)用服務(wù)。
4.3? 基因組學(xué)技術(shù)與實(shí)驗(yàn)生物學(xué)的結(jié)合驅(qū)動(dòng)生物功能模塊解析
實(shí)驗(yàn)生物學(xué)在建立基因的精確功能及生物遺傳修飾走向應(yīng)用等方面具有不可替代性。基因組學(xué)的發(fā)展不僅加速了功能基因的發(fā)現(xiàn),而且可以規(guī)模化建立基因之間的互作關(guān)系,結(jié)合多組學(xué)及其整合技術(shù)為生物功能研究提供愈益直接而強(qiáng)有力的支持?;蚪M學(xué)除了解析物種精細(xì)遺傳結(jié)構(gòu)外,在功能基因挖掘方面也有顯著的進(jìn)展。在大量物種基因組注釋信息不斷積累基礎(chǔ)上,人們開發(fā)了專門富集DNA結(jié)合蛋白、轉(zhuǎn)錄因子等調(diào)節(jié)蛋白的實(shí)驗(yàn)流程,并采用深度學(xué)習(xí)方法建?;蚪M調(diào)控景觀中的復(fù)雜依賴關(guān)系,并為遺傳變異的調(diào)用和解釋提供預(yù)測(cè)因子[91]。深度學(xué)習(xí)主要應(yīng)用是在功能基因組學(xué)中預(yù)測(cè)DNA和RNA結(jié)合蛋白以及增強(qiáng)子和順式調(diào)控蛋白的序列特異性區(qū)域,甲基化狀態(tài)和剪接的控制。人類基因組中已經(jīng)可以通過高通量功能分析鑒定功能性遺傳變異和預(yù)測(cè)性狀(如有害變異和疾病)[92]。由于實(shí)驗(yàn)生物學(xué)研究受到材料、單基因突變、環(huán)境均一性等諸多限制因素,實(shí)證基因功能及其互作關(guān)系進(jìn)展緩慢;事實(shí)上,植物整合廣泛的細(xì)胞、發(fā)育和環(huán)境信號(hào)來調(diào)節(jié)復(fù)雜的基因表達(dá)模式,進(jìn)而形成多樣化的蛋白體和代謝產(chǎn)物,因而在特定實(shí)驗(yàn)設(shè)計(jì)下,基因表達(dá)譜、蛋白譜集合代謝產(chǎn)物變異譜,就可以用于對(duì)基因間調(diào)控相互作用網(wǎng)絡(luò)進(jìn)行推斷,這些基因調(diào)控網(wǎng)絡(luò)用于可視化調(diào)控因子與其下游靶基因之間的因果調(diào)控關(guān)系,而對(duì)于相關(guān)結(jié)果的實(shí)驗(yàn)驗(yàn)證是必不可少的[93]。生物定向遺傳改良是傳統(tǒng)育種家的夢(mèng)想,而不斷改進(jìn)的基因組編輯系統(tǒng)提供了一種以精確和可預(yù)測(cè)的方式快速修改基因組的方法,使直接改進(jìn)優(yōu)良品種成為可能[94]。
4.4? 精準(zhǔn)育種,群體結(jié)構(gòu)單倍型分析建立設(shè)計(jì)育種及全基因組選擇育種基礎(chǔ)
建立在物種精細(xì)參考基因組及種質(zhì)資源群體大規(guī)模重測(cè)序基因型分析基礎(chǔ)上,作物遺傳改良即將進(jìn)入精準(zhǔn)設(shè)計(jì)和快速選擇的時(shí)代[95]。而基因組編輯技術(shù)(genome editing)將為單個(gè)基因或者寡基因控制性狀改良提供精確的手術(shù)刀[96]。無論作物類型、染色體遺傳結(jié)構(gòu)和雜合程度,擁有多樣化的遺傳資源始終為遺傳改良的第一步。綜合傳統(tǒng)遺傳學(xué)、現(xiàn)代分子遺傳和表觀遺傳學(xué)的知識(shí),所有育種目標(biāo)性狀的調(diào)控基因均存在于物種遺傳群體,而且大多數(shù)性狀會(huì)受到系列多基因調(diào)控,作物在生長(zhǎng)周期的不同階段均對(duì)環(huán)境因子做出響應(yīng),并通過復(fù)雜的內(nèi)源激素直接或間接作用于多個(gè)生物學(xué)過程,形成產(chǎn)量、品質(zhì)和抗逆的表型。過去對(duì)于生物基因型的檢測(cè)有如大海撈針掛一漏萬,所以育種家依賴直覺和抓主要矛盾培育新品種,而今,基因型分析技術(shù)已經(jīng)可以達(dá)到無遺漏的監(jiān)測(cè),只是我們對(duì)于生物基因功能的認(rèn)知尚沒有達(dá)到完全的水平,一般物種中尚有約20%~30%的注釋基因功能未知,需要整體的知識(shí)積累;而表型分析成為育種瓶頸,這就是為什么代謝組學(xué)和表型組學(xué)會(huì)成為生物育種的熱點(diǎn)技術(shù)。借助于物理學(xué)和材料科學(xué)的進(jìn)步,基因組和育種學(xué)者希望通過過程解析將育種目標(biāo)性狀進(jìn)行分解,獲取更有價(jià)值的中間性狀基因調(diào)控基因,支持最終產(chǎn)量、品質(zhì)和抗逆表型。這里對(duì)如何通過群體的重測(cè)序和多年多點(diǎn)表型分析、結(jié)合控制環(huán)境下的表型解析,構(gòu)建針對(duì)特定物種的育種指標(biāo)體系,進(jìn)而篩選親本群、多重雜交、標(biāo)記選擇、品系鑒定再結(jié)合基因組編輯實(shí)現(xiàn)精準(zhǔn)育種繪制一個(gè)策略圖(圖2),為基因組和育種專家提供參考。
參考文獻(xiàn)
詹姆森, 魏? 瑪, 維斯特霍夫. 系統(tǒng)生物學(xué)方法(導(dǎo)讀版)[M]. 1版. 北京: 科學(xué)出版社, 2013.
Bolger M E, Weisshaar B, Scholz U, et al. Plant genome sequencing - applications for crop improvement[J]. Current Opinion in Biotechnology, 2014, 26: 31-37.
Sedlazeck F J, Rescheneder P, Smolka M, et al. Accurate detection of complex structural variations using single- molecule sequencing[J]. Nature Methods, 2018, 15(6): 461-468.
Bocklandt S, Hastie A, Cao H. Bionano genome mapping: High-throughput, ultra-long molecule genome analysis system for precision genome assembly and haploid-resolved structural variation discovery[J]. Advances in Experimental Medicine and Biology, 2019(1129): 97-118.
Castey T M, Khan J M, Bringans S D, et al. Analysis of reproducibility of proteome coverage and quantitation using isobaric mass tags (iTRAQ and TMT)[J]. Journal of Proteome Research, 2017, 16(2): 384-392.
Elshire R J, Glaubitz J C, Sun Q, et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species[J]. PLoS One, 2011, 6(5): e19379.
Xia Z Q, Zou M L, Zhang S K, et al. AFSM sequencing approach: a simple and rapid method for genome-wide SNP and methylation site discovery and genetic mapping[J]. Scientific Reports, 2014(4): 7300.
Iqbal N, Liu X, Yang T, et al. Genomic variants identified from whole-genome resequencing of indicine cattle breeds from Pakistan[J]. PLoS One, 2019, 14(4): e0215065.
Bentley D R. Whole-genome re-sequencing[J]. Current Opinion in Genetics & Development, 2006, 16(6): 545-552.
Sònia Casillas, Antonio Barbadilla. Molecular population genetics[J]. Genetics, 2017, 205(3): 1003-1035.
Li Y, Cao K, Zhu G, et al. Genomic analyses of an extensive collection of wild and cultivated accessions provide new insights into peach breeding history[J]. Genome Biology, 2019, 20: 36.
Nguyen K L, Grondin A, Courtois B, et al. Next-generation sequencing accelerates crop gene discovery[J]. Trends in Plant Science, 2019, 24(3): 263-274.
Visscher P M, Wray N R, Zhang Q, et al. 10 years of GWAS discovery: Biology, function and translation[J]. American Journal of Human Genetics, 2017, 101(1): 5-22.
Remington D L, Ungerer M C, Purugganan M D. Map-based cloning of quantitative trait loci: progress and prospects[J]. Genetical Research, 2001, 78(3): 213-218.
Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nature Biotechnology, 2015, 4(33): 408-414.
Fang L, Wang Q, Hu Y, et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits[J]. Nature Genetics, 2017, 49(7): 1089-1098.
Varshney R K, Saxena R K, Upadhyaya H D, et al. Whole- genome resequencing of 292 pigeonpea accessions identifies genomic regions associated with domestication and agronomic traits[J]. Nature Genetics, 2017, 49(7): 1082-1088.
Li X, Yang J, Shen M, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits[J]. Nature Communications , 2020, 11(1): 2815.
Voss-Fels K, Snowdon R J. Understanding and utilizing crop genome diversity via high-resolution genotyping[J]. Plant Biotechnology Journal, 2016, 14(4): 1086-1094.
Guirao-Rico S, González J. Evolutionary insights from large scale resequencing datasets in Drosophila melanogaster[J]. Current Opinion in Insect Science, 2019, 31: 70-76.
Silva-Junior, Orzenil B, Grattapaglia D. Genome-wide patterns of recombination, linkage disequilibrium and nucleotide diversity from pooled resequencing and single nucleotide polymorphism genotyping unlock the evolutionary history of Eucalyptus grandis[J]. New Phytologist, 2015, 208(3): 830-845.
Qin C, Yu C, Shen Y, et al. Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(14): 5135-5140.
Yu Y, Fu J, Xu Y, et al. Genome re-sequencing reveals the evolutionary history of peach fruit edibility[J]. Nature Communications, 2018, 9: 5404.
Varshney R K, Thudi M, Roorkiwal M, et al. Resequencing of 429 chickpea accessions from 45 countries provides insights into genome diversity, domestication and agronomic traits[J]. Nature Genetics, 2019, 51(5): 857-864.
Guo S, Zhao S, Sun H, et al. Resequencing of 414 cultivated and wild watermelon accessions identifies selection for fruit quality traits[J]. Nature Genetics, 2019, 51(11): 1616-1623.
Qiu Q, Wang L, Wang K, et al. Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions[J]. Nature Communications, 2015(6): 10283.
Yang Z, Ge X, Yang Z, et al. Extensive intraspecific gene order and gene structural variations in upland cotton cultivars[J]. Nature Communications, 2019(10): 2989.
The computational pan-genomics consortium. Computational pan-genomics: Status, promises and challenges[J]. Briefings in Bioinformatics, 2018, 19(1): 118-135.
Liu Y, Du H, Li P, et al. Pan-genome of wild and cultivated soybeans[J]. Cell, 2020, 182(1): 162-176.
Song J M, Guan Z, Hu J, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nature Plants, 2020, 6(1): 34-45.
Chaisson M J P, Huddleston J, Dennis M Y, et al. Resolving the complexity of the human genome using single-molecule sequencing[J]. Nature, 2015, 517: 608-611.
Schneider G F, Dekker C. DNA sequencing with nanopores[J]. Nature Biotechnology, 2012, 30(4): 326-328.
Snyder M W, Adey A, Kitzman J O, et al. Haplotype- resolved genome sequencing: experimental methods and app lications[J]. Nature Reviews Genetics, 2015, 16(6): 344-358.
Stein L D, Knoppers B M, Campbell P, et al. Data analysis: Create a cloud commons[J]. Nature, 2015, 523(7559): 149- 151.
Stark R, Grzelak M, Hadfield J. RNA sequencing: the teenage years[J]. Nature Reviews, Genetics, 2019, 20(11): 631-656.
Wang J, Yu H, Weng X, et al. An expression quantitative trait loci-guided co-expression analysis for constructing regulatory network using a rice recombinant inbred line population[J]. Journal of Experimental Botany, 2014, 65(4): 1069-1079.
Huang Y F, Vialet S, Guiraud J L, et al. A negative MYB regulator of proanthocyanidin accumulation, identified through expression quantitative locus mapping in the grape berry[J]. The New Phytologist, 2014, 201(3): 795-809.
Westra H J, Peters M J, Esko T, et al. Systematic identification of trans eQTLs as putative drivers of known disease associations[J]. Nature Genetics, 2013, 45(10): 1238-1243.
SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the sequencing quality control consortium[J]. Nature Biotechnology, 2014, 32(9): 903-914.
Chen H, Ye F, Guo G. Revolutionizing immunology with single-cell RNA sequencing[J]. Cell & Molecular Immunology, 2019, 16(3): 242-249.
Rodriguez-Villalon A, Brady S M. Single cell RNA sequencing and its promise in reconstructing plant vascular cell lineages[J]. Current Opinion in Plant Biology, 2019, 48: 47-56.
Muller B, Martre P. Plant and crop simulation models: Powerful tools to link physiology, genetics, and phenomics[J]. Journal of Experimental Botany, 2019, 70(9): 2339-2344.
Kuchen E E, Fox S, de Reuille P B, et al. Generation of leaf shape through early patterns of growth and tissue polarity[J]. Science, 2012, 335: 1092-1096.
Rebetzke G J, Jimenez-Berni J A, Bovill W D, et al. High-throughput phenotyping technologies allow accurate selection of stay-green[J]. Journal of Experimental Botany, 2016, 67: 4919-4924.
Virlet N, Sabermanesh K, Sadeghi-Tehran P, et al. Field scanalyzer: An automated robotic field phenotyping platform for detailed crop monitoring[J]. Funct Plant Biol, 2016, 44: 143-153.
Liebisch F, Kirchgessner N, Schneider D, et al. Remote, aerial phenotyping of maize traits with a mobile multi-sensor approach[J]. Plant Methods, 2015, 11: 9.
Rist F, Herzog K, Mack J, et al. High-precision phenotyping of grape bunch architecture using fast 3D sensor and automation[J]. Sensors (Basel), 2018, 18(3): 763.
Gennaro S F D, Rizza F, Badeck F W, et al. UAV-based high-throughput phenotyping to discriminate barley vigour with visible and near-infrared vegetation indices[J]. Int J Remote Sens, 2018, 39: 5330-5344.
Jeudy C, Adrian M, Baussard C, et al. Rhizotubes as a new tool for high throughput imaging of plant root development and architecture: test, comparison with pot grown plants and validation[J]. Plant Methods, 2016, 12: 31.
Tardieu F, Cabrera-Bosquet L, Pridmore T, et al. Plant phenomics, from sensors to knowledge[J]. Current Biology, 2017, 27(15): R770-R783.
Wang W, Feng B, Xiao J, et al. Cassava genome from a wild ancestor to cultivated varieties[J]. Nature Communications, 2014(5): 5110.
Zhang J, Zhang X, Tang H, et al. Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.[J]. Nature Genetics, 2018, 50(11): 1565-1573.
Ming R, Hou S, Feng Y, et al. The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus)[J]. Nature, 2008, 452(7190): 991-996.
Motamayor J C, Mockaitis K, Schmutz J, et al. The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color[J]. Genome Biology, 2013, 14(6): r53.
Bredeson J V, Lyons J B, Prochnik S E, et al. Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity[J]. Nature Biotechnology, 2016, 34(5): 562-570.
Wu G A, Prochnik S, Jenkins J, et al. Sequencing of diverse mandarin, pummelo and orange genomes reveals complex history of admixture during citrus domestication[J]. Nature Biotechnology, 2014, 32(7): 656-662.
Xu Q, Chen L L, Ruan X, et al. The draft genome of sweet orange (Citrus sinensis)[J]. Nature Genetics, 2013, 45(1): 59-66.
Denoeud F, Carretero-Paulet L, Dereeper A, et al. The coffee genome provides insight into the convergent evolution of caffeine biosynthesis[J]. Science, 2014, 345(6201): 1181- 1184.
Myburg A A, Grattapaglia D, Tuskan G A, et al. The genome of Eucalyptus grandis[J]. Nature, 2014, 510(7505): 356-362.
Jain M, Misra G, Patel R K, et al. A draft genome sequence of the pulse crop chickpea (Cicer arietinum L.)[J]. The Plant Journal, 2013, 74(5): 715-729.
Wu P, Zhou C, Cheng S, et al. Integrated genome sequence and linkage map of physic nut (Jatropha curcas L.), a biodiesel plant[J]. The Plant Journal, 2015, 81(5): 810-821.
Ha J, Shim S, Lee T, et al. Genome sequence of Jatropha curcas L., a non-edible biodiesel plant, provides a resource to improve seed-related traits[J]. Plant Biotechnology Journal, 2019, 17(2): 517-530.
Kim S, Park M, Yeom S I, et al. Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J]. Nature Genetcs, 2014, 46(3): 270-278.
Hu L, Xu Z, Wang M, et al. The chromosome-scale reference genome of black pepper provides insight into piperine biosynthesis[J]. Nature Communications, 2019, 10(1): 4702.
Lin Y, Min J, Lai R, et al. Genome-wide sequencing of longan (Dimocarpus longan Lour.) provides insights into molecular basis of its polyphenol-rich characteristics[J]. GigaScience, 2017, 6(5): 1-14.
Rahman A Y, Usharraj A O, Misra B B, et al. Draft genome sequence of the rubber tree Hevea brasiliensis[J]. BMC Genomics, 2013, 14: 75.
Tang C, Yang M, Fang Y, et al. The rubber tree genome reveals new insights into rubber production and species adaptation[J]. Nature Plants, 2016, 2(6): 16073.
D Hont A, Denoeud F, Aury J M, et al. The banana (Musa acuminata) genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(7410): 213-217.
Wang Z, Miao H X, Liu J H, et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019, 5(8): 810-821.
Wang P, Luo Y, Huang J, et al. The genome evolution and domestication of tropical fruit mango[J]. Genome Biology, 2020, 21(1): 60
Singh R, Ong-Abdullah M, Low E T, et al. Oil palm genome sequence reveals divergence of interfertile species in old and New worlds[J]. Nature, 2013, 500(7462): 335-339.
Xiao Y, Xu P, Fan H, et al. The genome draft of coconut (Cocos nucifera)[J]. GigaScience, 2017, 6(11): 1-11.
Ming R, VanBuren R, Wai C M, et al. The pineapple genome and the evolution of CAM photosynthesis[J]. Nature Genetics, 2015, 47(12): 1435-1442.
Chen L Y, VanBuren R, Pairs M, et al. The bracteatus pineapple genome and domestication of clonally propagated crops[J]. Nature Genetics, 2019, 51(10): 1549-1558.
Garsmeur O, Droc G, Antonise R, et al. A mosaic monoploid reference sequence for the highly complex genome of sugarcane[J]. Nature Communications, 2018(9): 2638.
Rendón-Anaya M, Ibarra-Laclette E, Méndez-Bravo A, et al. The avocado genome informs deep angiosperm phylogeny, highlights introgressive hybridization, and reveals pathogen- influenced gene space adaptation[J]. Proceedings of the National Academy of Sciences of the United States of America, 2019, 116(34): 17 081-17 089.
Tian Y, Zeng Y, Zhang J, et al. High quality reference genome of drumstick tree (Moringa oleifera Lam.), a potential perennial crop[J]. Science China, Life Sciences, 2015, 58(7): 627-638.
Yan L, Wang X, Liu H, et al. The genome of Dendrobium officinale illuminates the biology of the important traditional Chinese Orchid Herb[J]. Molecular Plant, 2015, 8(6): 922-934.
Varshney R K, Shi C, Thudi M, et al. Pearl millet genome sequence provides a resource to improve agronomic traits in arid environments[J]. Nature Biotechnology, 2017, 35(10): 969-976.
Zhang S, Xia Z, Zhang W, et al. Chromosome-scale genome assembly provides insights into speciation of allotetraploid and massive biomass accumulation of elephant grass (Pennisetum purpureum Schum.)[J]. BioRxiv Online, 2020, doi: https://doi.org/10.1101/2020.02.28.970749.
Tecle I Y, Edwards J D, Menda N, et al. solGS: a web-based tool for genomic selection[J]. BMC Bioinformatics, 2014, 15(1): 398.
Rowley M J, Corces V G. The three-dimensional genome: Principles and roles of long-distance interactions[J]. Current Opinion in Cell Biology, 2016, 40: 8-14.
Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication[J]. Cell, 2016, 164(6): 1110- 1121.
Xu H, Zhang S, Yi X, et al. Exploring 3D chromatin contacts in gene regulation: The evolution of approaches for the identification of functional enhancer-promoter interaction[J]. Computational and Structural Biotechnology Journal, 2020, 18: 558-570.
Vercruysse J, Van Bel M, Osuna-Cruz C M, et al. Comparative transcriptomics enables the identification of functional orthologous genes involved in early leaf growth[J]. Plant Biotechnology Journal, 2020, 18(2): 553-567.
Chen X, Hu L, Wang Y, et al. Single cell gene co-expression network reveals fech/crot signature as a prognostic marker[J]. Cells, 2019, 8(7): 698.
Yilmaz L S, Walhout A J. Metabolic network modeling with model organisms[J]. Current Opinion in Chemical Biology, 2017, 36: 32-39.
Gemovic B, Sumonja N, Davidovic R, et al. Mapping of protein-protein interactions: Web-based resources for revea ling interactomes[J]. Current Medicinal Chemistry, 2019, 26(21): 3890-3910.
Zandalinas S I, Fichman Y, Devireddy A R, et al. Systemic signaling during abiotic stress combination in plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(24): 13 810-13 820.
Shibata M, Sugimoto K. A gene regulatory network for root hair development[J]. Journal of Plant Research, 2019, 132(3): 301-309.
Telenti A, Lippert C, Chang P C, et al. Deep learning of genomic variation and regulatory network data[J]. Human Molecular Genetics, 2018, 27(R1): R63-R71.
Zou J, Huss M, Abid A, et al. A primer on deep learning in genomics[J]. Nature Genetics, 2019, 51(1): 12-18.
Haque S, Ahmad J S, Clark N M, et al. Computational prediction of gene regulatory networks in plant growth and development[J]. Current Opinion in Plant Biology, 2019, 47: 96-105.
Hua K, Zhang J, Botella J R, et al. Perspectives on the application of genome-editing technologies in crop breeding[J]. Molecular Plant, 2019, 12(8): 1047-1059.
Varshney R K, Pandey M K, Bohra A, et al. Toward the sequence-based breeding in legumes in the post-genome sequencing era[J]. Theoretical and Applied Genetics, 2019, 132(3): 797-816.
Chen K, Wang Y, Zhang R, et al. CRISPR/Cas genome editing and precision plant breeding in agriculture[J]. Annual Review of Plant Biology, 2019, 70: 667-697.