国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

園林樹木基因組學研究進展

2021-11-13 06:31:54林授鍇林海蘭陳璘霞溫麗娟林順權(quán)
莆田學院學報 2021年5期
關(guān)鍵詞:毛果基因組學樹木

林授鍇,林海蘭,陳璘霞,溫麗娟,林順權(quán),3

(1.莆田學院 環(huán)境與生物工程學院,福建 莆田 351100;2.莆田市城市園林發(fā)展集團有限公司,福建 莆田 351100;3.華南農(nóng)業(yè)大學 園藝學院,廣東 廣州 510642)

0 引言

園林樹木是指適合在園林中栽培應(yīng)用的木本植物。園林樹木多數(shù)為具有觀賞價值的樹種,也包括不以美觀見長但具有衛(wèi)生防護和改善環(huán)境等作用的樹種[1]?;蚪M學(genomics)是一門進行生物基因組研究和利用的學科,通過分析基因組DNA序列或其表達產(chǎn)物等來解讀基因組信息,對于整合生命科學各學科分支,深化與開拓生命科學新的研究方向具有極其重大的意義[2]。

2000年擬南芥全基因組測序完成并公開,這是第一個基因組被完全測序的植物;2001年人類基因組計劃公布了人類基因組草圖;2002年水稻基因組測序完成[3]。園林樹木的基因組學研究是在人類基因組計劃和擬南芥、水稻等模式植物基因組計劃取得成功的基礎(chǔ)上開展起來的。

木本的模式植物毛果楊(Populus trichocarpa)是園林樹木最早完成基因組測序的物種。2006年,Tuskan等測序并組裝獲得約485 Mb的毛果楊基因組序列,注釋蛋白編碼基因約45 000個;比對毛果楊(木本植物)和擬南芥(草本植物)基因組發(fā)現(xiàn),有10%的毛果楊基因在擬南芥基因組中沒找到對應(yīng)部分[4]。園林樹木在毛果楊測序完成之后有一個間斷期,直到2012年我國學者完成了第一個木本花卉植物梅花(Prunus mune)的全基因組測序[5]。隨后,學者們又陸續(xù)完成了馬纓杜鵑(Rhododendron delavayi)[6]、櫻花(Prunus yedoensis)[7]、月季(Rosa chinensis)[8]及其近緣種等的基因組測序。近年來,被測序的園林樹木的種類越來越多。

本文將綜述園林樹木的基因組測序進展,介紹結(jié)構(gòu)基因組學和功能基因組學的基本框架及其在園林樹木上的應(yīng)用進展,并對園林樹木的基因組學研究進行展望。

1 園林樹木基因組測序的主要進展

據(jù)筆者統(tǒng)計,截至2020年4月,至少已有175個科255種園藝植物被測序,表1選取其中的55種園林樹木。

表1 (續(xù))

表1 (續(xù))

表1 全基因組序列已被發(fā)表的部分園林樹木名錄

2 園林樹木結(jié)構(gòu)基因組學與功能基因組學

園林樹木基因組學研究可大致分為結(jié)構(gòu)基因組學和功能基因組學兩方面。

2.1 結(jié)構(gòu)基因組學

結(jié)構(gòu)基因組學以獲得全基因組序列為目標,力求實現(xiàn)高效、準確的基因組測序。物種全基因組序列的獲得是通過基因組測序與拼裝來實現(xiàn)的,主要流程包括基因組的調(diào)查、測序、拼接、組裝和組裝質(zhì)量評估[2]。

2.1.1 基因組調(diào)查

基因組調(diào)查,是在測序前對尚未進行基因組測序的物種的基因組狀況進行調(diào)查,以評估目標基因組大小、倍性、雜合性等特征,為更好地選擇合適的測序策略提供必要參考[2]。流式細胞術(shù)和高通量測序技術(shù)是最常用的兩種基因組調(diào)查技術(shù)。段一凡等通過流式細胞術(shù)對14個桂花代表品種及其3個近緣種的倍性及基因組大小進行分析比對研究[9]。張月婷等通過高通量測序技術(shù)發(fā)現(xiàn)園林樹種浙江楠基因組較大,且雜合率較高,需要利用二代與三代測序技術(shù)相結(jié)合的方式獲得基因組[10]。陳雙雙等利用流式細胞術(shù)和高通量測序技術(shù)估測繡球主栽品種“Bailer”的基因組,發(fā)現(xiàn)繡球基因組較大且為雜合度較高的復雜基因組[11]。

2.1.2 基因組測序

Sanger法測序為第一代測序技術(shù)的主要代表,其對DNA片段的測序長度可達1000 bp,單個堿基的測序準確性高達99.99%,一直被廣泛應(yīng)用于生命科學領(lǐng)域。但其測序成本高、通量低、速度慢等缺點嚴重影響了其在基因組測序中的應(yīng)用[12]。在園林樹木中,僅毛果楊[4]、桃花[13]等極少數(shù)物種使用該法進行全基因組測序。

而自Sanger法測序誕生以來,經(jīng)過近半個世紀的發(fā)展,測序技術(shù)取得了革命性進展。新產(chǎn)生的測序技術(shù),根據(jù)出現(xiàn)時間、讀長和通量等特征,被稱作第二代、第三代測序技術(shù)等,也被統(tǒng)稱為新一代測序技術(shù)[14]。

第二代測序技術(shù)又稱高通量測序技術(shù),以高通量、短讀長和低成本為特征。絕大多數(shù)的高通量測序數(shù)據(jù)是由Illumina測序平臺產(chǎn)生的,其測序準確性一般在99.5%以上[12]。通過純二代測序獲得基因組的園林樹木有棗椰樹[15]、梅花[5]等。但第二代測序技術(shù)存在GC偏好性及讀長較短等缺陷,特別是對于具有高重復序列、高雜合、多倍體等特點的許多園林樹木來說,在測序數(shù)據(jù)拼接環(huán)節(jié)中會受到一定的限制[2]。對此,早期研究者們采用了第二代結(jié)合第一代測序技術(shù)的策略加以應(yīng)對,獲得成功的園林樹木有可可[16]等。

第三代測序技術(shù)是基于單個分子信號檢測的DNA測序技術(shù),完全跨過了第二代測序技術(shù)依賴于PCR擴增的信號放大過程,真正具備了讀取單個熒光分子的能力。目前主流的第三代測序平臺有PacBio公司的Sequel平臺和Nanopore公司的PromethION平臺等。第三代測序技術(shù)無堿基偏好性,讀長可達8~25 kb,解決了第二代測序技術(shù)很多無法解決的問題,但是測序成本和測序錯誤率偏高。因此,在園林樹木基因組測序中,第二代和第三代測序數(shù)據(jù)混合拼接的策略仍常被采用,以兼顧測序準確性、成本、拼接的連續(xù)性和拼接質(zhì)量指標[12]。在園林樹木中,垂枝樺[17]、小墊柳[18]等的基因組測序均采用第二代和第三代測序技術(shù)相結(jié)合的策略。近年來,隨著第三代測序成本的不斷下降及第三代測序數(shù)據(jù)的自糾錯算法的不斷發(fā)展,越來越多的園林樹木僅采用第三代測序技術(shù)獲取基因組序列,如月季[8]等。

2.1.3 基因組拼接

一個完整的基因組序列對目標物種的研究至關(guān)重要,但目前的基因組測序技術(shù)獲得的序列普遍較短,到了現(xiàn)在的第三代測序技術(shù)也才8~25 kb,相對于一條染色體幾十M(兆)的長度,如何通過短序列拼接獲得高質(zhì)量的全基因組序列是一個巨大的挑戰(zhàn)。在目標物種全基因組序列排列順序未知的情況下,需要通過計算機和特殊算法,把測序獲得的序列拼接起來以獲得基因組的真實序列,即從頭拼接?;蚪M拼接的主要步驟包括:全基因組鳥槍法測序、原始序列質(zhì)量控制、基因組從頭拼接和基因組拼接質(zhì)量提升[2,12]。限于篇幅,此處從略。

2.1.4 基因組組裝

對于一個物種基因組,Scaffold水平的基因組草圖是不夠的,還需要通過添加額外的測序數(shù)據(jù)進行染色體水平的基因組組裝。早期通常利用傳統(tǒng)的遺傳圖譜來進行基因組的輔助組裝,但使用遺傳圖譜輔助組裝需要構(gòu)建遺傳群體,構(gòu)圖周期長且具有一定的難度。因此,許多新的技術(shù)(如Hi-C、Chicago、10×Genomics Linked-reads和BioNano光學圖譜等)被開發(fā)出來應(yīng)用于基因組的輔助組裝[2,12]。多種輔助組裝新技術(shù)也常常聯(lián)用以獲得盡可能高質(zhì)量的染色體水平基因組,如使用BioNano光學圖譜結(jié)合Hi-C技術(shù)將杜梨基因組組裝到染色體水平[19],采用10×Genomics Linked-reads和Hi-C技術(shù)獲得了蠟梅的染色體水平精細基因組[20]。

2.1.5 基因組組裝質(zhì)量評估

基因組組裝完成后,需要對基因組質(zhì)量進行評估,常見的方法有指標評估、一致性評估、完整性評估和準確性評估等。其中,指標評估主要評估Contig N50和Scaffold N50指標,指標越高說明基因組的連續(xù)性越好。準確性評估可以通過遺傳圖譜、BAC序列、Hi-C和光學圖譜等其他類型的數(shù)據(jù)與組裝結(jié)果進行比對來驗證組裝結(jié)果的正確性,其一致性越高,基因組越準確[2,12]。

2.2 功能基因組學

功能基因組學利用結(jié)構(gòu)基因組學提供的序列信息,在基因組水平上進行高通量的序列分析和基因功能鑒定。功能基因組學的研究內(nèi)容主要包括基因組注釋、功能基因定位、候選功能基因分析和基因功能驗證等[2,12]。

2.2.1 基因組注釋

在基因組測序組裝完成后,首先就要對基因組進行注釋?;蚪M注釋是利用生物信息學方法和工具,對基因組中所有基因的結(jié)構(gòu)進行鑒定(基因組結(jié)構(gòu)注釋),并對基因的生物學功能進行注釋(基因組功能注釋)。一個完整的注釋包括在基因組中鑒定出其功能元件(蛋白質(zhì)編碼基因、RNA基因、重復序列和假基因等),并盡可能地確定這些元件所對應(yīng)的生物學功能[21]。限于篇幅,此處從略。

2.2.2 功能基因定位

目前在植物中常用的功能基因定位方法有兩種:一種是從上而下的方法,通過表型差異來找到對應(yīng)的突變基因并揭示其功能,包括連鎖分析、全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)、混池分離分析(bulked segregant analysis,BSA)等;另一種是從下而上的方法,通過檢測基因組上的選擇信號來定位功能基因,包括基因組選擇信號分析等[12]。

連鎖分析是利用連鎖的原理研究基因與遺傳標記的關(guān)系?;谶B鎖分析,基因或者遺傳標記在染色體上以一定的順序排列構(gòu)成一張遺傳圖譜。遺傳圖譜是進行植物基因組結(jié)構(gòu)分析與功能研究的基礎(chǔ)[12]。一些園林樹木已構(gòu)建了高質(zhì)量的遺傳圖譜,如梅花[22]、桂花[23]和月季[24]等。

GWAS主要在全基因組水平分析各位點與復雜性狀遺傳變異的關(guān)聯(lián)強弱。它以連鎖不平衡為基礎(chǔ),通過分析數(shù)百或數(shù)千個體的高密度SNP分子標記的分離特征,篩選出與復雜性狀表現(xiàn)型變異相關(guān)聯(lián)的分子標記,進而分析這些分子標記對表現(xiàn)型變異的遺傳效應(yīng)[2,12]。文[25]應(yīng)用GWAS定位了園林樹木毛果楊與發(fā)芽時間有關(guān)的關(guān)鍵位點;文[26]應(yīng)用GWAS定位了大葉桉樹高性狀的SNP位點;文[27]利用GWAS進一步確定了桂花橙色花性狀相關(guān)的SNP位點和候選基因。

BSA是利用極端表型個體進行功能基因挖掘的一種定位方法。隨著第二代測序技術(shù)的發(fā)展,SNP標記開發(fā)和測序成本不斷下降,BSA技術(shù)已成為連鎖分析和GWAS以外的另一個定位功能基因的有效工具。不同于連鎖分析和GWAS,BSA基于表型分組,可以分別針對質(zhì)量性狀主效基因和數(shù)量性狀基因座(quantitative trait locus,QTL)進行定位。對主效基因定位,可以簡單基于兩個差異表型進行分組;對于QTL定位,可以基于極端表型群體混合并分組[2,12]。BSA技術(shù)已被應(yīng)用于北方黑云杉[28]等少數(shù)園林樹木的QTL定位。

在進化過程中,自然或人工選擇在基因組上留下了各種選擇印跡,這些印跡稱為選擇信號。選擇主要包括正選擇、負選擇和平衡選擇等3個類型。其中正選擇是生物適應(yīng)性進化的主要機制,且往往在基因組上留下明顯的選擇信號[12]。文[29]便應(yīng)用基因組選擇分析,揭示了毛果楊在廣泛緯度范圍內(nèi)適應(yīng)性變異的基因組基礎(chǔ)。

2.2.3 候選功能基因分析

在基因組水平上有一系列方法可以定位功能基因,但均具有一定的局限性,因此需要綜合其他數(shù)據(jù)進一步分析以縮小候選功能基因范圍。隨著高通量測序技術(shù)、質(zhì)譜技術(shù)和表型測量技術(shù)的發(fā)展,大規(guī)模獲取轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組和表型組數(shù)據(jù)都為候選功能基因分析提供了強有力的支撐[12]。如綜合基因組和轉(zhuǎn)錄組數(shù)據(jù),挖掘到了控制梅花花瓣顏色的候選功能基因MYB108[30]。

2.2.4 基因功能驗證

基因功能研究大致可以分為正向遺傳學和反向遺傳學兩類。正向遺傳學是從表型變化研究基因變化,反向遺傳學則是從基因變化研究表型變化。反向遺傳學實驗技術(shù)通過對特定基因的敲除、敲入、過表達或沉默來尋找關(guān)聯(lián)表型,進而分析基因的功能。對于通過功能基因定位、候選功能基因分析等技術(shù)尋找并篩選出的候選功能基因,往往會采用基因編輯、過表達或沉默等反向遺傳學基因功能分析技術(shù)來對其基因功能進行驗證[12]。

然而,能進行穩(wěn)定遺傳轉(zhuǎn)化獲得轉(zhuǎn)基因植株的園林樹木仍然較少,并且實驗周期較長。如一項為期近20年的研究工作發(fā)現(xiàn),在3種楊樹中過表達毛果楊SVL基因可以顯著延遲楊樹開花,并減少花芽豐度[31]。對于許多遺傳轉(zhuǎn)化體系還不成熟的園林樹木,驗證基因功能往往在擬南芥等模式植物中進行異源轉(zhuǎn)化。如在擬南芥中過表達胡楊PeuLAC2基因可以增強植物抗氧化酶活性、降低活性氧含量、提高莖水勢、提高植物對水分的運輸能力,從而增強植物的抗旱能力[32]。

3 展望

毛果楊作為木本模式植物2006年便被測序,成為了最先被測序的園林樹木。數(shù)年后才有人完成其他一些園林樹木的全基因組測序,而且主要是具有觀賞價值的果樹,如棗椰樹、梅樹、桃樹等??上驳氖?我國科學家率先發(fā)表梅花等的全基因組序列。近年來隨著測序技術(shù)的迅猛發(fā)展和測序成本的大幅降低,研究者對越來越多的園林樹木進行了全基因組測序。

在結(jié)構(gòu)基因組學研究上,由于許多園林樹木測序時間較晚,基于模式植物、果樹等的測序經(jīng)驗,以及使用更為先進的測序與組裝技術(shù),多數(shù)園林樹木的全基因組測序結(jié)果較為理想。隨著越來越多的園林樹木獲得研究者的關(guān)注,對缺乏參考基因組的園林樹木進行測序以獲得全基因組序列,是園林樹木基因組學研究的一個重要方向。

結(jié)合結(jié)構(gòu)基因組研究,一些基本的功能基因組研究往往同時開展,如基因組功能注釋、基于自然群體的基因定位和少數(shù)候選功能基因的挖掘。除此以外,多數(shù)園林樹木功能基因組學的研究進展是緩慢的,主要原因在于:一是園林樹木不但基因高度雜合,而且有性生殖周期很長,遺傳群體構(gòu)建困難,這與果樹類似;二是除模式植物毛果楊等少數(shù)樹種外,多數(shù)園林樹木受到的關(guān)注較少,再生體系尚未建立,使得其功能驗證受限。因此,對園林樹木功能基因組學的研究,要充分開發(fā)和利用復雜遺傳群體非依賴性的基因定位和挖掘技術(shù),并在不同園林樹木樹種的再生體系上爭取突破。

總體而言,除了木本模式植物毛果楊外,園林樹木的基因組學研究進展整體上是慢于果樹的,這或許與人們更加關(guān)注果樹的經(jīng)濟效益有關(guān)。植物基因組學研究的先進水平,與物種的重要性息息相關(guān)。模式植物擬南芥是最先進的,然后是糧食作物,之后才是包括園藝植物在內(nèi)的其他經(jīng)濟作物,過去是這樣,將來仍將是這樣。但是,在未來,園藝植物內(nèi)部可能會發(fā)生變化,過去是果樹較為先進,但是隨著城市化進程的加快,加上一些園林樹木在離體再生方面比果樹更方便,整體上園林樹木的基因組學和分子生物學研究進展有可能追上甚至超過果樹。

園林樹木不但具有豐富多彩的觀賞性狀,特別是開花性狀方面具有高度的多樣性,而且其生態(tài)價值在未來必將得到更大的重視,因此,有理由相信將會有更多的研究者致力于園林樹木的基因組研究。

猜你喜歡
毛果基因組學樹木
住在樓上的老馬(三)
基于基因組學數(shù)據(jù)分析構(gòu)建腎上腺皮質(zhì)癌預后模型
樹木之最
系統(tǒng)基因組學解碼反芻動物的演化
科學(2020年2期)2020-08-24 07:56:44
辨認樹木
樹木也睡覺
微波輻射-溶劑回流法提取/HPLC法測定倒提壺中天芥菜堿與毛果天芥菜堿的含量
樹木之最
營養(yǎng)基因組學——我們可以吃得更健康
生物進化(2014年3期)2014-04-16 04:36:41
毛果魚藤黃酮類化合物提取工藝及抑菌作用的研究
中成藥(2014年11期)2014-02-28 22:30:08
上蔡县| 新巴尔虎左旗| 南木林县| 汤原县| 南丰县| 全南县| 左权县| 察雅县| 新昌县| 呼图壁县| 安陆市| 渭南市| 望奎县| 阳朔县| 水富县| 且末县| 南丰县| 梅河口市| 崇阳县| 田林县| 皋兰县| 鄂托克前旗| 德安县| 建宁县| 盐城市| 新绛县| 皋兰县| 南雄市| 乌兰浩特市| 乌恰县| 茂名市| 娄烦县| 梧州市| 秀山| 唐河县| 西安市| 库车县| 正镶白旗| 芜湖市| 神池县| 淮安市|