許晨璐,張守攻,孫曉梅
(中國林業(yè)科學(xué)研究院 林業(yè)研究所 林木遺傳育種國家重點(diǎn)實(shí)驗(yàn)室,北京 100091)
林木遺傳育種是在研究林木遺傳變異的基礎(chǔ)上開展的遵循其遺傳變異規(guī)律來改良林木的遺傳組成,進(jìn)而培育林木新品種的一項(xiàng)活動(dòng)。隨著全球木材供需矛盾和能源、生態(tài)壓力的增加,加速林木育種進(jìn)程,提高林木生產(chǎn)力是當(dāng)前面臨的重要的世界性研究課題。與農(nóng)作物育種不同,林木遺傳育種不僅起步較晚,而且有其自身的特點(diǎn)。首先,林木育種周期長,如美國南部的松樹育種,盡管歷時(shí)近百年時(shí)間,現(xiàn)在也才進(jìn)行到第3輪選育和子代測定,而同樣的進(jìn)展在許多農(nóng)作物中可能1 a內(nèi)就能完成;其次,林木育種需營建大型子代測定林,而營建以及后期的管護(hù)費(fèi)用都很高;再次,林木許多重要經(jīng)濟(jì)性狀僅在輪伐期才能得以完全有效地評定。這些特點(diǎn)決定林木遺傳育種不能僅靠常規(guī)育種的表型選擇策略,更需借助現(xiàn)代育種新技術(shù)來輔助常規(guī)育種,加速育種進(jìn)程?;蚪M資源(genomic resources)包括全基因組序列、轉(zhuǎn)錄組序列[表達(dá)序列標(biāo)簽(EST)、全長-cDNA(FL-cDNA)和單一基因(UniGene等)]和DNA分子標(biāo)記等。EST,F(xiàn)L-cDNA和UniGene來自表達(dá)基因,是基因序列的一部分,避免了內(nèi)含子和基因間區(qū)域?qū)?shù)據(jù)分析的干擾[1],對應(yīng)于功能已知或未知基因,所含基因功能信息豐富[2]。DNA分子標(biāo)記是DNA水平上遺傳變異的直接反映,與其他遺傳標(biāo)記相比,具有多態(tài)性高、數(shù)量豐富和重復(fù)性好等許多優(yōu)點(diǎn)[3]。由EST數(shù)據(jù)庫和DNA分子標(biāo)記等可構(gòu)建遺傳連鎖圖譜、數(shù)量性狀位點(diǎn)(QTL)圖譜和物理圖譜等新的基因組資源,大量的基因組資源使得結(jié)構(gòu)基因組學(xué)、功能基因組學(xué)、比較基因組學(xué)、群體基因組學(xué)和進(jìn)化基因組學(xué)發(fā)展迅速,對基因多態(tài)性、遺傳定位、表達(dá)、調(diào)控和功能的研究也更加深入全面,這些資源及其各種基因組學(xué)研究成果已轉(zhuǎn)化成新的研究工具運(yùn)用到林木遺傳育種領(lǐng)域。本文主要針對針葉樹基因組資源研究進(jìn)展及其在林木遺傳育種中的應(yīng)用作簡要綜述。
針葉樹是高等植物進(jìn)化過程中一支古老而多變的分支,也是裸子植物中最大和最重要的一支,共包含6個(gè)科601個(gè)樹種[4],雖然樹種數(shù)量不多,但陸地生態(tài)系統(tǒng)的重要樹種大部分出自于此。針葉樹和被子植物至少在3億年前就已經(jīng)分離[5],并由此逐漸進(jìn)化出不同的形態(tài)特征和生活周期。過去20 a中,林木基因組學(xué),特別是針葉樹基因組學(xué)研究滯后于模式植物和作物。相對于其他植物基因組學(xué)研究,如擬南芥 Arabidopsis thaliana,水稻 Oryza sativa,玉米 Zea mays,小麥 Triticum aestivum和番茄 Solanum lycopersicum,數(shù)百甚至數(shù)千名研究人員研究某一單一物種而言,全世界參與林木基因組學(xué)研究不超過1000人,并只針對數(shù)十個(gè)樹種。雖然林木至少有10萬個(gè)樹種,但基因組學(xué)研究被限制在少數(shù)溫帶和高度馴化的樹種,這些樹種主要來自4個(gè)科:裸子植物的松科Pinaceae和被子植物的楊柳科Salicaceae,桃金娘科Myrtaceae,殼斗科Fagaceae和其下的7個(gè)屬,即松屬Pinus,云杉屬Picea,黃杉屬Pseudotsuga, 楊屬 Populus, 桉屬 Eucalyptus, 櫟屬 Quercus 和栗屬 Castanea[6]。
毛果楊Populus trichocarpa以其相對較小的基因組(約為擬南芥的4倍)和作為生物燃料原料的潛力,首次被美國能源部聯(lián)合基因組研究所(JGI)選中用于全基因組測序[7],楊樹全基因組序列的獲得[8]使得楊樹高通量基因組學(xué)技術(shù)得到廣泛應(yīng)用并促進(jìn)了比較和進(jìn)化基因組學(xué)研究[9],由此進(jìn)一步鞏固了楊樹作為樹木生物學(xué)模式植物的地位[10];鑒于桉樹在林木中的重要地位,美國能源部也開展了巨桉Eucalyptus grandis的全基因組測序工作,并于2010年公布了其8倍覆蓋度的基因組草圖[11];美洲栗Castanea dentata的全基因組測序計(jì)劃也已經(jīng)展開[12]。相比闊葉樹種和經(jīng)濟(jì)林,針葉樹由于基因組巨大(10000~40000 Mb,相對于楊樹的485 Mb)[13],等位基因間變異豐富,世代周期更長,遺傳轉(zhuǎn)化體系缺乏,正向遺傳學(xué)(如突變技術(shù))和反向遺傳學(xué)(如基因敲除或過表達(dá)技術(shù))等研究手段有限,加之研究經(jīng)費(fèi)相對不足,其基因組學(xué)研究遠(yuǎn)遠(yuǎn)落后于已處于后基因組時(shí)代的闊葉樹種。
盡管全基因組測序落后于闊葉樹種,但木本植物中首例公開的高通量EST測序項(xiàng)目卻是在針葉樹中開展的。早在1998年,北卡州立大學(xué)的研究人員就獲得了超過70000條與火炬松 Pinus taeda木材形成相關(guān)的 EST 序列[14]。 此后, 主要針葉樹種如火炬松[15-17],海岸松 Pinus pinaster[18], 輻射松 Pinus radiata[19], 白云杉 Picea glauca[20],北美云杉 Picea sitchensis[21]和日本柳杉 Cryptomeria japonica[22]等相繼開展了大規(guī)模EST測序項(xiàng)目。
近年來,在遺傳改良項(xiàng)目和林木在生態(tài)系統(tǒng)中作用越發(fā)受到關(guān)注的驅(qū)動(dòng)下[23],林業(yè)發(fā)達(dá)國家啟動(dòng)了更大規(guī)模的針葉樹基因組學(xué)相關(guān)研究項(xiàng)目,如美國國家科學(xué)基金會(huì)植物基因組研究計(jì)劃(PGRP)資助的“Accelerating Pine Genomics”項(xiàng)目[24],美國加州大學(xué)戴維斯分校尼爾實(shí)驗(yàn)室(Neale Lab)聯(lián)合多家科研機(jī)構(gòu)開展的“Pine Reference Sequences”[25], “Allele Discovery of Economic Pine Traits”[26]和“Conifer Comparative Genetics”等項(xiàng)目[27], 加拿大拉瓦爾大學(xué)開展的 Arborea 項(xiàng)目[28]和哥倫比亞大學(xué)開展的“Treenomix”項(xiàng)目[29],澳大利亞和新西蘭聯(lián)合開展的“Monterey Pine Genome”項(xiàng)目等。在此背景下,某些針葉樹種全基因組測序計(jì)劃已經(jīng)啟動(dòng), 如火炬松[30], 花旗松 Pseudotsuga menziesii[31],歐洲云杉 Picea abies[32]和北美喬松Pinus strobus[33]等,其中火炬松被認(rèn)為是針葉樹全基因組測序的模式樹種,研究也最為深入。與毛果楊全基因組測序一樣,針葉樹種的全基因組測序仍然主要采用全基因組鳥槍法和傳統(tǒng)的Sanger測序,但研究期間不斷有新的思路提出,如Krutovsky等[34]提出了用單倍體組織(雌配子體)測序的策略來減少雜合性,以減少巨大的基因組和豐富的等位基因間變異對于序列拼接和組裝的干擾;新一代測序技術(shù)(next generation sequencing,簡稱 NGS)也被引進(jìn)到測序項(xiàng)目中[35]。
截至目前,包含針葉樹基因組資源的公共數(shù)據(jù)庫有美國國立生物技術(shù)信息中心(NCBI)創(chuàng)立的Gen-Bank[36], 歐洲生物信息研究所(EBI)創(chuàng)立的 EMBL Nucleotide Sequence Database[37], 日本信息技術(shù)中心(CIB)創(chuàng)立的 DDBJ[38], DFCI(Dana Farber Cancer Institute, 目前已取代由 Craig Venter創(chuàng)建的 TIGR)的The Gene Index database(TGI)[39], 美國國家科學(xué)基金會(huì)資助的 PlantGDB[40], NCBI 的 Gene Expression Omnibus[41]和 UniGene[42], 其中 NCBI的 UniGene 只包含 3 個(gè)松柏綱 Coniferopsida 樹種, 分別是白云杉、北美云杉和火炬松。
除公共數(shù)據(jù)庫外,專門收錄針葉樹基因組資源數(shù)據(jù)庫有Gymnosperm Database[4],邁阿密大學(xué)牛津分校創(chuàng)辦的 Conifer GDB(含 ConiferEST)[43-44], 加州大學(xué)戴維斯分校 Neale Lab 創(chuàng)辦的 TreeGenes[45]等, 其中TreeGenes數(shù)據(jù)庫是包含有各種類型數(shù)據(jù)的面向?qū)ο蟮臄?shù)據(jù)庫,允許復(fù)雜的檢索和查詢操作。分樹種所建的數(shù)據(jù)庫有EuroPineDB[46](包含海岸松、歐洲赤松Pinus sylvestris和意大利松Pinus pinea等3個(gè)樹種,但主要針對海岸松)和 SpruceDB[47](主要包含白云杉)等。
隨著基因序列不斷獲得,針葉樹DNA分子標(biāo)記的發(fā)展亦非常迅速。早期的遺傳標(biāo)記為限制性片段長度多態(tài)性(RFLP),第2代標(biāo)記為隨機(jī)擴(kuò)增多態(tài)性DNA標(biāo)記(RAPD)技術(shù)和擴(kuò)增片段長度多態(tài)性(AFLP)標(biāo)記,但作為顯性標(biāo)記,它們的應(yīng)用具有一定的局限性。簡單序列重復(fù)(SSR)標(biāo)記是分散在全基因組上的成簇的短串聯(lián)重復(fù)核苷酸,但由于傳統(tǒng)的SSR標(biāo)記開發(fā)包括構(gòu)建富集SSR的文庫、克隆和測序等步驟,開發(fā)成本較高。被稱為第3代遺傳標(biāo)記的單核苷酸多態(tài)性(SNP)位點(diǎn)豐富,遺傳穩(wěn)定性高,已成為醫(yī)學(xué)研究中的重要工具,雖然在針葉樹中的應(yīng)用起步較晚[48],但發(fā)展非常迅速。目前,收錄針葉樹分子標(biāo)記的數(shù)據(jù)庫有PlantMarkers[49],美國加州大學(xué)戴維斯分校Neale Lab創(chuàng)建的PineSAP[50]和加拿大拉瓦爾大學(xué)創(chuàng)建的TreeSNPs[51]。它們分別是針對松屬和云杉屬開發(fā)的SNP標(biāo)記為主的數(shù)據(jù)庫;法國農(nóng)科院林木遺傳育種實(shí)驗(yàn)室創(chuàng)建了包含來自海岸松和歐洲云杉的SSR和SNP標(biāo)記的數(shù)據(jù)庫[52-53],EuroPineDB也含有海岸松的SSR和SNP標(biāo)記的信息[46]。
基因組學(xué)是遺傳學(xué)的重要分支,作物育種學(xué)家提出了“基因組學(xué)輔助育種”(genomics-assisted breeding)的策略來強(qiáng)調(diào)基因組資源對育種的重要作用[54],其核心內(nèi)容是用各種基因組學(xué)工具和策略實(shí)現(xiàn)由基因型預(yù)測表型的目的[55],這一策略使基因組資源在提高作物育種效率和精度方面發(fā)揮了重要作用[56-57]。歷史上,數(shù)量遺傳學(xué)被認(rèn)為是指導(dǎo)林木育種的唯一有效工具,基因組資源并不受重視。然而傳統(tǒng)的數(shù)量遺傳學(xué)方法用于指導(dǎo)林木育種的實(shí)踐并不是完美無缺的[58],伴隨著林木基因組學(xué)的不斷發(fā)展,日益豐富的林木基因組資源也改變著林木遺傳育種的思路、策略和實(shí)踐。
由于林木世代周期長,幼-成期變化大,有些性狀(如抗病、產(chǎn)量以及與環(huán)境存在很強(qiáng)互作的性狀)很難從表型入手進(jìn)行選擇,亦或選擇成本很高,尋求有效的早期(或間接)選擇方法一直是林木遺傳育種學(xué)家努力的目標(biāo)。以遺傳標(biāo)記信息為基礎(chǔ)的間接選擇(首先建立分子標(biāo)記與性狀的關(guān)聯(lián),通過選擇分子標(biāo)記達(dá)到篩選具有優(yōu)良表型性狀基因型的目的),即分子標(biāo)記輔助選擇(marker-assisted selection,簡稱MAS)在縮短育種周期,降低育種成本,提高選擇強(qiáng)度和效率中開始逐漸發(fā)揮重要作用。
由于林木中由單基因控制的重要性狀不多,林木遺傳學(xué)家和育種學(xué)家更關(guān)注數(shù)量性狀,因此,在“基因組學(xué)輔助育種”應(yīng)用之前,需要把數(shù)量性狀剖分到各個(gè)單個(gè)基因組分,進(jìn)而弄清單個(gè)基因?qū)?fù)雜性狀的作用,像研究質(zhì)量性狀一樣對控制數(shù)量性狀的多個(gè)基因分別進(jìn)行研究。林木分子性狀解析開始于20世紀(jì)90年代,普遍采用的方法是在構(gòu)建高密度遺傳連鎖圖譜的基礎(chǔ)上進(jìn)行數(shù)量性狀位點(diǎn)定位(QTL mapping),這一方法可以確定控制數(shù)量性狀的基因數(shù)目、在染色體上的位置、各位點(diǎn)作用貢獻(xiàn)的大小以及基因間相互關(guān)系。eQTL(expression QTL)將分離群體中每個(gè)基因的表達(dá)量作為數(shù)量性狀[59],是研究復(fù)雜性狀分子機(jī)制和調(diào)控網(wǎng)絡(luò)的新手段,QTL定位和eQTL定位都可以獲得與性狀關(guān)聯(lián)的候選基因信息,借助與QTLs緊密連鎖的分子標(biāo)記,就能夠在育種群體中對有關(guān)QTLs的遺傳行為進(jìn)行動(dòng)態(tài)跟蹤,從而加強(qiáng)育種工作者對數(shù)量性狀的遺傳操作能力,提高育種中對數(shù)量性狀優(yōu)良基因型選擇的準(zhǔn)確性和預(yù)見性。 目前, 針葉樹 QTL 定位研究已在火炬松[60]、 海岸松[61]、 輻射松[62]、 歐洲赤松[63]、 白云杉[64]和花旗松[65]等樹種中開展,研究的性狀集中在生長、材性和抗逆等方面。
以往林木遺傳育種工作者很少留意建立并保存高世代的育種群體,缺少合適的群體成為林木圖譜構(gòu)建進(jìn)而開展QTL定位研究的最大障礙。而且林木基因組巨大,連鎖不平衡(linkage disequilibrium)水平較低,數(shù)量性狀的表達(dá)在不同環(huán)境下會(huì)出現(xiàn)波動(dòng),而普遍采用的分離群體不大(大約100個(gè)),導(dǎo)致QTL區(qū)間太大,以至于可能包含數(shù)以千計(jì)的基因,QTL作用貢獻(xiàn)普遍被高估;加之只能進(jìn)行家系內(nèi)選擇,不能進(jìn)行家系間選擇,這一方法很難直接應(yīng)用到林木育種實(shí)踐中[66-67]。此外,QTL作圖面臨的一個(gè)致命缺陷是缺少驗(yàn)證,因此很難知道已經(jīng)報(bào)道的QTLs假陽性有多少。進(jìn)行QTL驗(yàn)證的方法之一是在不同群體中進(jìn)行比較作圖,隨著基因組全測序及高密度遺傳圖譜的構(gòu)建,這種方法將變得越來越重要。如要弄清單個(gè)基因?qū)?fù)雜性狀的作用,還需要對QTL進(jìn)行圖位克隆和互補(bǔ)測驗(yàn)(complementation test),QTL的圖位克隆也將因高密度的遺傳連鎖圖譜及宏基因組平臺(tái)的建立而變得容易。
關(guān)聯(lián)分析(association analysis)能揭示天然群體中表型變化的分子基礎(chǔ),是有效的林木分子育種策略[66]。在關(guān)聯(lián)分析研究中,分子標(biāo)記被認(rèn)為與復(fù)雜的數(shù)量性狀之間有很強(qiáng)的連鎖,通過檢測群體內(nèi)連鎖位點(diǎn)間等位基因的非隨機(jī)關(guān)聯(lián)來解析復(fù)雜性狀,闡明與表型性狀有關(guān)的候選基因及其等位基因,挖掘出優(yōu)異的等位基因。關(guān)聯(lián)分析利用的是自然群體,不需要構(gòu)建特殊的作圖群體,避免了QTL定位對作圖群體要求的限制。由于針葉樹基本上處于半野生狀態(tài),大多數(shù)樹種具有理想的自然群體材料,核酸多樣性水平豐富(基因編碼區(qū)域的SNP頻率大概是在1/50的數(shù)量級水平),連鎖不平衡下降快速(R2經(jīng)常在1~2 kb的區(qū)間內(nèi)就下降到≤0.20[66])。這意味著一旦經(jīng)關(guān)聯(lián)分析發(fā)現(xiàn)并證實(shí)了標(biāo)記/性狀之間的連鎖,很可能標(biāo)記與功能變異體(functional variant)的物理距離非常近,甚至可能其本身就是功能變異體,這就為目的基因的精細(xì)定位提供了可能;結(jié)合SNP檢測技術(shù),科學(xué)家甚至可以直接將效應(yīng)位點(diǎn)與單個(gè)核苷酸突變關(guān)聯(lián)起來,進(jìn)行數(shù)量性狀寡核苷酸(quantitative trait nucleotide,簡稱QTN)作圖,因此,此方法也被稱作基因輔助選擇(gene-assisted selection)[68]。
與QTL定位這種正向基因組學(xué)方法(forward genomics approaches)不同,關(guān)聯(lián)分析屬于反向基因組學(xué)方法(reverse genomics approaches),它的成功應(yīng)用需要大量的基因組信息來對同一群體內(nèi)的多個(gè)個(gè)體進(jìn)行基因分型(genotyping)實(shí)驗(yàn)。開展關(guān)聯(lián)研究有2種策略[69-70]:在無法獲得高密度分子標(biāo)記的階段,只能采用基于候選基因的關(guān)聯(lián)分析(gandidate-gene association)策略。所謂候選基因?yàn)榕c某種性狀相關(guān)聯(lián)的基因,它包括位置關(guān)聯(lián)型和功能關(guān)聯(lián)型2種類型。目前,此策略已在火炬松[71]、白云杉[72]和花旗松[73]等針葉樹種中開展。然而這是一種只對候選基因進(jìn)行SNP基因分型的單個(gè)標(biāo)記/性狀之間的關(guān)聯(lián)分析,只能解釋部分遺傳變異(很少超過10%);比其更有效的是全基因組關(guān)聯(lián)研究(genome-wide association studies,簡稱GWAS),但由于針葉樹中連鎖不平衡下降快速,需開發(fā)高密度的(如至少100萬)SNP用于基因分型才能開展GWAS,這顯然限制了在針葉樹中開展[6]。雖然關(guān)聯(lián)分析研究彌補(bǔ)了QTL定位中的許多固有缺陷,但是目前的關(guān)聯(lián)研究也存在著種種不足,如只開發(fā)了基因的編碼區(qū)域,忽視了調(diào)控區(qū)域;只能分析中高頻率的等位基因,稀有等位基因在現(xiàn)有的群體規(guī)模(一般幾百個(gè)個(gè)體)和統(tǒng)計(jì)方法中無法分析,而稀有等位基因被認(rèn)為是重要的育種資源。
作物育種學(xué)家把“分子標(biāo)記輔助育種”的概念外延到“基因組學(xué)輔助育種”,實(shí)際上是在強(qiáng)調(diào)基因組學(xué)對作物育種的巨大潛力和越來越重要的作用。轉(zhuǎn)錄本(包括EST,F(xiàn)L-cDNA和UniGene)除了作為一種分子標(biāo)記類型外,其本身及其功能注釋作為計(jì)算基因組學(xué)(computational genomics)的產(chǎn)物,對育種來說就是一筆寶貴的資源?,F(xiàn)在已經(jīng)獲得了一些模式植物的全基因組序列,而且一些基因的功能已被注釋,如擬南芥、水稻和楊樹等,通過與模式植物基因組的同源性比較,可以獲得未知基因的功能并可查找到其基因序列。研究發(fā)現(xiàn),林木特別是針葉樹,種間基因的同線性和共線性很強(qiáng),基因組保守性較高,遺傳信息可以在親緣關(guān)系比較近的樹種間轉(zhuǎn)移,這使同源比對的可行性大幅增加。而在蛋白質(zhì)數(shù)據(jù)庫中的同源搜索(如BlastX))則有望獲得功能關(guān)聯(lián)型的候選基因。除了能為關(guān)聯(lián)分析研究提供候選基因外,還可以作為基因工程的基因試劑(genetic reagents)[74]。由于某些重要性狀(如抗松皰銹病Cronartium ribicola)被認(rèn)為主要受1~2個(gè)主效基因所控制,因此,根據(jù)注釋信息可以篩選出對改良性狀起重要作用的基因,通過在自然群體中進(jìn)行等位基因開發(fā),或者借助基因工程手段實(shí)現(xiàn)性狀的定向改良[75];借助堆垛轉(zhuǎn)基因(stacking transgenes)策略,針對一個(gè)基因型還可以同時(shí)進(jìn)行多個(gè)性狀的遺傳改良[76]。
隨著針葉樹基因組資源的不斷積累,功能基因組學(xué)研究也已經(jīng)進(jìn)入了高通量分析階段。目前,基因組學(xué)信息為在基因組水平上全面系統(tǒng)分析某一生命活動(dòng)過程提供了強(qiáng)大工具,林木功能基因組研究在林木遺傳育種和研究領(lǐng)域具有廣闊的應(yīng)用前景和發(fā)展空間。借助功能基因組學(xué)研究工具如DNA微陣列及最近發(fā)展起來的數(shù)字表達(dá)譜技術(shù),針葉樹育種中的許多關(guān)鍵問題如雜種優(yōu)勢[77]、木材形成[78-82]、生長與休眠期的轉(zhuǎn)換[83]、 扦插生根[84]、 抗旱[85-87]和抗寒[88-89]等可以在鑒定基因并通過反向遺傳學(xué)的手段揭示基因功能的基礎(chǔ)上得以闡述。
由已經(jīng)獲得功能注釋的EST或基因序列開發(fā)出來的SNP和SSR很可能與基因功能直接相關(guān),因此也被稱為功能標(biāo)記(functional marker)[2]。由于一個(gè)分子標(biāo)記位點(diǎn)來自一個(gè)特定的等位基因,并與該基因控制的性狀相聯(lián)系,這些標(biāo)記要比隨機(jī)標(biāo)記(random marker)有優(yōu)勢,因?yàn)樗鼈兺耆c某一特定性狀的等位基因相連鎖,不需要借助QTL定位等方法獲得性狀與分子標(biāo)記的關(guān)聯(lián)就能在不同遺傳背景下進(jìn)行選擇,且功能標(biāo)記在物種間的轉(zhuǎn)移能力很強(qiáng),甚至可以被用作比較作圖的錨定標(biāo)記 (anchor markers)[90],由此也獲得了“完美標(biāo)記”(perfect marker)的稱謂。完美標(biāo)記使得育種工作者能夠在家系或群體內(nèi)追蹤特定的等位基因,減小感興趣基因兩翼的連鎖累贅(linkage drag),通過對分子標(biāo)記的篩選即能對性狀進(jìn)行篩選,提高了分子標(biāo)記輔助育種的效率。
傳統(tǒng)的開發(fā)基因資源的實(shí)驗(yàn)室方法包括克隆、構(gòu)建cDNA文庫和文庫擴(kuò)增等許多勞動(dòng)力密集型的Sanger測序步驟[91], 既耗時(shí)又成本高昂[1,92]。 正因如此, 最初的酵母 Saccharomyces cerevisiae, 擬南芥和人類基因組測序及高通量EST測序項(xiàng)目都為多個(gè)實(shí)驗(yàn)室聯(lián)合完成。盡管如此,這種方法所獲得的EST質(zhì)量也不高,如楊樹基因組計(jì)劃所預(yù)測的大部分(約75%)基因不為EST序列信息所支持[93];低豐度的基因容易丟失,即使是包含數(shù)個(gè)植物組織數(shù)以萬計(jì)cDNA克隆所得序列的覆蓋度也很有限,僅僅為40%[94-95]。
在Sanger技術(shù)統(tǒng)治DNA測序領(lǐng)域近30 a之后,新一代測序技術(shù),包括Roche/454的Genome Sequencer FLX Instrument,Illumina Solexa公司的Illumina Hiseq 2000和Applied Biosystem公司的SOLiD系統(tǒng),自2004年開始逐漸推出并面向市場[96-97]。它們省去了很多Sanger測序法耗時(shí)的步驟,通過大規(guī)模平行測序(massively parallel sequencing)技術(shù)使測序速度大幅提升,并使成本至少下降2個(gè)數(shù)量級[98-99]。隨著后基因組時(shí)代的到來,新一代測序技術(shù)已向從事生命科學(xué)研究的工作者展示了其巨大的潛力,單個(gè)實(shí)驗(yàn)室就可以開展基因組學(xué)研究[100]。Roche/454技術(shù)憑借較長的閱讀長度(read length),已被廣泛應(yīng)用到許多樹種的基因組資源開發(fā),如美國能源部聯(lián)合基因組研究組(JGI)開展的conifer EST project對包括火炬松在內(nèi)的 12 個(gè)針葉樹種進(jìn)行轉(zhuǎn)錄組測序[101], 美國黑松 Pinus contorta[102], 白云杉[103], 巨桉[104], 橡樹 Quercus[105]和板栗 Castanea mollissima[74]等樹種也應(yīng)用了這一技術(shù);Solexa技術(shù)也在桉樹的從頭測序中得以應(yīng)用[106]。
隨著新一代測序技術(shù)(NGS)和表達(dá)序列標(biāo)簽-簡單序列重復(fù)(EST-SSR)標(biāo)記技術(shù)的出現(xiàn),SSR標(biāo)記的開發(fā)成本已大幅下降,應(yīng)用日漸增多[102,107-108],用新一代測序技術(shù)挖掘的SNP標(biāo)記,包括對候選基因重測序挖掘 SNP, 亦已得到廣泛應(yīng)用[102,104,109-111]。
新一代測序技術(shù)的出現(xiàn)使得獲得基因組資源的時(shí)間縮短,成本大幅下降。目前,單個(gè)實(shí)驗(yàn)室開展全基因組重測序已成為可能[98,112-113]。正如David B.Neale[6]所預(yù)言,針葉樹基因組學(xué)研究將進(jìn)入一個(gè)重要和多產(chǎn)的時(shí)期。對于林木這種馴化時(shí)間不長、雜合度高的物種來說,如果沒有足夠多的參考序列,等位基因和直系同源基因變異將很難找出,進(jìn)而會(huì)影響基因組信息的準(zhǔn)確性;新一代測序技術(shù)的出現(xiàn)使得對同一樹種成百上千個(gè)基因型的轉(zhuǎn)錄組測序成為可能,由基因型預(yù)測表型的準(zhǔn)確度和效率大大提升,基因組學(xué)輔助育種已經(jīng)迎來新的發(fā)展勢頭[56,112]。前文提到的GWAS策略的實(shí)施需要高密度分子標(biāo)記,而高通量轉(zhuǎn)錄組測序獲得的分子標(biāo)記也是高密度的,這無疑有助于全基因組關(guān)聯(lián)研究的開展。而均勻覆蓋整個(gè)基因組的高密度分子標(biāo)記的獲得也將使基因組選擇(genomic selection,簡稱GS)成為可能,它將比傳統(tǒng)的BLUP選擇更準(zhǔn)確、有效[114]。隨著更準(zhǔn)確及全面的表型數(shù)據(jù)的獲得,基因組輔助育種的方法有望由分子標(biāo)記輔助選擇育種將擴(kuò)大到“理想型”育種的領(lǐng)域[115]。
隨著基因組資源獲取速度的加快,國際間合作交流也將變得更頻繁。受美國農(nóng)業(yè)部資助,旨在為林木育種工作者提供基于基因組的工具以提升傳統(tǒng)林木育種效率和效果的“針葉樹翻譯基因組網(wǎng)絡(luò)”(conifer translational genomics network,簡稱CTGN))計(jì)劃已于2007年9月開展?;蚪M學(xué)的快速發(fā)展也使得樹種之間遺傳改良的差距逐漸縮小,對于非主要改良樹種來說,優(yōu)良基因的快速獲得將加快這些樹種的改良步伐。
[1]BOUCK A, VISION T.The molecular ecologist’s guide to expressed sequence tags [J].Mol Ecol, 2007, 16 (5):907-924.
[2]ANDERSEN JR, LUBBERSTEDT T.Functional markers in plants [J].Trends Plant Sci, 2003, 8 (11): 554-560.
[3]PHILIPS R L, VASIL I K.DNA-Based Markers in Plants [M].Dordrecht; Kluwer Academic Publishers, 2001.
[4]EARLE C J.The gymnosperm database [ED/OL].2010-10-14[2011-08-25].http://www.conifers.org/zz/pinales.htm.
[5]TROITSKY A V, MELEKHOVETS Y F, RAKHIMOVA G M, et al.Angiosperm origin and early stages of seed plant evolution deduced from rRNA sequence comparisons [J].J Mol Evol, 1991, 32: 253-261.
[6]NEALE D B, KREMER A.Forest tree genomics: growing resources and applications [J].Nat Rev Genet, 2011, 12:111-122.
[7]WULLSCHLEGER S D, JANSSON S, TAYLOR G.Genomics and forest biology: Populus emerges as the perennial favorite [J].Plant Cell, 2002, 14: 2651-2655.
[8]TUSKAN G A, DIFAZIO S, JANSSON S, et al.The genome of black cottonwood, Populus trichocarpa (Torr&Gray)[J].Science, 2006, 313: 1596-1604.
[9]YANG Xiaohan, KALLURI U C, DIFAZIO S P, et al.Poplar genomics: state of the science [J].Crit Rev Plant Sci,2009, 28: 285-308.
[10]JANSSON S, DOUGLAS CJ.Populus: a model system for plant biology [J].Annu Rev Plant Biol, 2007, 58: 435-458.
[11]DOE J G I.Eucalyptus DB [ED/OL].2010-07-01[2011-08-25].http://eucalyptusdb.bi.up.ac.za/.
[12]FAGACEAE PROJECT.Fagaceae genomics web [EB/OL].[2011-08-25].http://fagaceae.org/node/23730.
[13]AHUJA M R, NEALE D B.Evolution of genome size in conifers [J].Silv Genet, 2005, 54: 126-137.
[14]ALLONA I, QUINN M, SHOOP E, et al.Analysis of xylem formation in pine by cDNA sequencing [J].Proc Nat Acad Sci USA, 1998, 95 (16): 9693-9698.
[15]ZHANG Yi, SEDEROFF R R, ALLONA I.Differential expression of genes encoding cell wall proteins in vascular tissues from vertical and bent loblolly pine trees [J].Tree Physiol, 2000, 20 (7): 457-466.
[16]KIRST M, JOHNSON A F, BAUCOM C, et al.Apparent homology of expressed genes from wood-forming tissues of loblolly pine (Pinus taeda, L.) with Arabidopsis thaliana [J].Proc Natl Acad Sci USA, 2003, 100: 7383-7388.
[17]LORENZ W W, SUN Feng, LIANG Chun, et al.Identification of drought response genes in loblolly pine (Pinus taeda L.) by analysis of expressed sequence tag libraries [C]//Town&Country Convention Center.Plant&Animal Genomes XIII Conference.San Diego: Town&Country Convention Center, 2005.
[18]DUBOS C, PLOMION C.Identification of water-deficit responsive genes in maritime pine (Pinus pinaster Ait.) roots[J].Plant Mol Biol, 2003, 51: 249-262.
[19]LI Xingguo, WU H X., DILLON S K, et al.Generation and analysis of expressed sequence tags from six developing xylem libraries in Pinus radiata, D.Don [J].BMC Genomics, 2009, 10: 41.doi: 10.1186/1471-2164-10-41.
[20]PAVY N, PAULE C, PARSONS L, et al.Generation, annotation, analysis and database integration of 16500 white spruce EST clusters [J].BMC Genomics, 2005, 6: 144.doi: 10.1186/1471-2164-6-144.
[21]RALPH S G, CHUN H J, KOLOSOVA N, et al.A conifer genomics resource of 200000 spruce (Picea spp.) ESTs and 6, 464 high-quality, sequence-finished full-length cDNAs for Sitka spruce (Picea sitchensis) [J].BMC Genomics,2008, 9: 484.doi:10.1186/1471-2164-9-484.
[22]FUTAMURA N, TOTOKI Y, TOYODA A, et al.Characterization of expressed sequence tags from a full-length enriched cDNA library of Cryptomeria japonica male strobili[J].BMC Genomics, 2008, 9: 383.doi: 10.1186/1471-2164-9-383.
[23]DOE J G I.Why sequence conifers? [EB/OL].2008-03-11 [2011-08-25].http://www.jgi.doe.gov/sequencing/why/99195.html.
[24]PETERSON D G.Accelerating pine genomics [EB/OL].2009-04-14[2011-08-25].http://www.pine.msstate.edu/.
[25]USDA/NIFA.Pine reference sequences [EB/OL].2012-01-14[2012-01-16].http://www.pinegenome.org/pinerefseq/.
[26]NEALE L A B.Allele discovery of economic pine traits [EB/OL].2002-08-01[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/adept/.
[27]KRUTOVSKY K V, TROGGIO M, BROWN G R, et al.Comparative mapping in the Pinaceae [J].Genetics, 2004,168:447-461.
[28]LAVAL UNIVERSITY.Arborea project[EB/OL].[2011-08-25].http://www.arborea.ulaval.ca/.
[29]UNIVERSITY OF BRITISH COLUMBIA.TREENOMIX: Conifer forest health project. [2011-08-25].http: //www.treenomix.ca/.
[30]NEALE L A B.Loblolly pine genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/lpgp/.
[31]NEALE L A B.Douglas-fir genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/dfgp/.
[32]UPSC.Spruce genome project[EB/OL].[2011-08-25].http://www.congenie.org/.
[33]NEALE L A B.White pine genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/wpgp/.
[34]KRUTOVSKY K V, TRETYAKOVA I N, CHUBUGINA I V, et al.“Shrinking” the giants: an innovative approach for de novo sequencing of conifer genomes[R].Town&Country Convention Center.Plant&Animal GenomesⅩⅩConference.San Diego: Town&Country Convention Center, 2012.
[35]WETTERBOM A L.The repetitive DNA of conifers-lessons from the Norway spruce (Picea abies) genome and resequencing of 5 other conifers[C]//Town&Country Convention Center.Plant&Animal GenomesⅩⅩ Conference.San Diego:Town&Country Convention Center,2012.
[36]NCBI.GenBank [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/genbank/.
[37]EMBL Nucleotide sequence database [ED/OL].[2011-08-25].http://www.ebi.ac.uk/embl/.
[38]DDJB.DNA data bank of Japan [ED/OL].[2011-08-25].http://www.ddbj.nig.ac.jp/index-e.html.
[39]DFCI.The gene index database [ED/OL].[2011-08-25].http://compbio.dfci.harvard.edu/tgi/plant.html.
[40]DUVICK J P.PlantGDB [ED/OL].[2011-08-25].http://www.plantgdb.org/.
[41]NCBI.Gene expression omnibus [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/geo/.
[42]NCBI.UniGene [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/sites/entrez? db=unigene.
[43]MIAMI UNIVERSITY, OHIO.Conifer genome database (ConiferGDB) [ED/OL].[2011-08-25].http://www.conifergdb.org/cgdb3p1/tiki-index.php.
[44]LIANG Chun, WANG Gang, LIU Guoli, et al.ConiferEST: an integrated bioinformatics system for data reprocessing and mining of conifer expressed sequence tags (ESTs) [J].BMC Genomics, 2007, 8: 134.doi: 10.1186/1471-2164-8-134.
[45]NEALE L A B.TreeGenes [ED/OL].[2011-08-25].http://dendrome.ucdavis.edu/treegenes/.
[46]UNIVERSIDAD DE MáLAGA.EuroPine DataBase [ED/OL].[2011-12-25]..http://www.scbi.uma.es/pindb/.
[47]CCGB, UNIVERSITY OF MINNESOTA.SpruceDB [ED/OL].[2011-08-25].http://ccgb.umn.edu/Pub_SpruceDB/.
[48]SAVOLAINEN O, PYHAJARVI T.Genomic diversity in forest trees [J].Curr Opin Plant Biol, 2007, 10: 162-167.
[49]RUDD S, SCHOOF H, MAYER K.PlantMarkers-a database of predicted molecular markers from plants [J].Nucl Acids Res, 2005, 33: 628-632.
[50]WEGRZYN J L, LEE J M, LIECHTY J, et al.PineSAP-sequence alignment and SNP identification pipeline [J].Bioinformatics, 2009, 25 (19): 2609-2610.
[51]CLéMENT S, FILLON J, BOUSQUET J, et al.TreeSNPs: a laboratory information management system (LIMS)dedicated to SNP discovery in trees [J].Tree Genetics&Genomics, 2010, 6 (3): 435-438.
[52]CHAGNE D, CHAUMEIL P, RAMBOER A, et al.Cross-species transferability and mapping of genomic and cDNA SSRs in pines [J].Theoret Appl Gens, 2004, 109: 1204-1214.
[53]DANTEC L L, CHAGNE D, POT D, O, et al.Automated SNP detection in expressed sequence tags: statistical considerations and application to maritime pine sequences [J].Plant Mol Biol, 2004, 54: 461-470.
[54]VARSHNEY R K, GRANER A, SORRELLS M E.Genomics-assisted breeding for crop improvement [J].Trends Plant Sci, 2005, 10: 621-630.
[55]VARSHNEY R K, HOISINGTON D A, TYAGI A K.Advances in cereal genomics and applications in crop breeding[J].Trends Biotechnol, 2006, 24: 490-499.
[56]VARSHNEY R K, NAYAK S N, MAY G D, et al.Next-generation sequencing technologies and their implications for crop genetics and breeding [J].Trends Biotechnol, 2009, 27: 522-530.
[57]CATTIVELLI L, RIZZA F, BADECK F W, et al.Drought tolerance improvement in crop plants: an integrated view from breeding to genomics [J].Field Crop Res, 2008, 115: 1-14.
[58]WU Rongling, YIN Tongming, HUANG Minren, et al.The application of marker-assisted selection to tree breeding[J].Sci Silv Sin, 2000, 36 (1): 103-113.
[59]DARVASI A.Genomics: gene expression meets genetics [J].Nature, 2003, 422: 269-270.
[60]KAYA Z, SEWELL M M, NEALE D B.Identification of quantitative trait loci influencing annual height-and diameter-increment growth in loblolly pine (Pinus taeda, L.) [J].Theor Appl Genet, 1999, 98: 586-592.
[61]MARKUSSEN T, FLADUNG M, ACHERE V, et al.Identification of QTLs controlling growth, chemical and physical wood property traits in Pinus pinaster (Ait.) [J].Silv Gen, 2003, 52: 8-15.
[62]EMEBIRI L C, DEVEY M E, MATHESON A C, et al.Interval mapping of quantitative trait loci affecting NESTUR, a stem growth efficiency index of radiata pine seedlings [J].Theor Appl Genet, 1998, 97: 1062-1068.
[63]HURME P, SILLANPA¨A¨M J, ARJAS E, et al.Genetic basis of climatic adaptation in Scots pine by Bayesian quantitative trait locus analysis [J].Genetics, 2000, 156: 1309-1322.
[64]PELGAS B, BOUSQUET J, MEIRMANS P G, et al.QTL mapping in white spruce: gene maps and genomic regions underlying adaptive traits across pedigrees, years and environments[J].BMC Genomics, 2011, 12: 145.doi: 10.1186/1471-2164-12-145.
[65]JERMSTAD K D, BASSONI D L, JECH K S, et al.Mapping of quantitative trait loci controlling adaptive traits in coastal Douglas fir(Ⅲ) Quantitative trait loci-by-environment interactions [J].Genetics, 2003, 165: 1489-1506.
[66]NEALE D B, SAVOLAINEN O.Association genetics of complex traits in conifers [J].Trends Plant Sci, 2004, 9:325-330.
[67]CERVERA M T, GUEVARA M A, GONZáLEZ-MARTíNEZ S C, et al.Genomics applied to the study of adaptation in pine species [J].Invest Agrar Sist Recur For, 2005, 14 (3): 292-306.
[68]WILCOX P L, ECHT C E , BURDON R D.Gene-assisted selection: applications of association genetics for forest tree breeding [G]//ORAGUZIE N C, RIKKERINK E H A, GARDINER S E, et al.Association Mapping in Plants.New York: Springer, 2007: 211-247.
[69]TABOR H K, RISCH N J, MYERS R M.Candidate gene approaches for studying complex genetic traits: practical considerations [J].Nat Rev Genet, 2002, 3: 391-396.
[70]HIRSCHORN J N, DALY M J.Genome-wide association studies for common disease and complex traits [J].Nat Rev Genet, 2005, 6: 95-108.
[71]GONZALEZ-MARTINEZ S C, HUBER D, ERSOZ E, et al.Association genetics in Pinus taeda, L.(Ⅱ) carbon isotope discrimination [J].Heredity, 2008, 101: 19-26.
[72]BEAULIEU J, DOERKSEN T, BOYLE B, et al.Association genetics of wood physical traits in the conifer white spruce and relationships with gene expression [J].Genetics, 2011, 188: 197-214.
[73]ECKERT A J, BOWER A D, WEGRZYN J L, et al.Association genetics of coastal Douglas fir (Pseudotsuga menziesu var.menziesii, Pinaceae) (Ⅰ) cold-hardiness related traits [J].Genetics, 2009, 182: 1289-1302.
[74]BARAKAT A, DILORETO D S, ZHANG Yi, et al.Comparison of the transcriptomes of American chestnut (Castanea dentata) and Chinese chestnut (Castanea mollissima) in response to the chestnut blight infection [J].BMC Plant Bioly, 2009, 9: 51.doi: 10.1186/1471-2229-9-51.
[75]BOERJAN W.Biotechnology and the domestication of forest trees [J].Curr Opin Biotechnol, 2005, 16: 159-166.
[76]HALPIN C, BOERJAN W.Stacking transgenes in forest trees [J].Trends Plant Sci, 2003, 8: 363-365.
[77]LI Ai, FANG Mengdie, SONG Wenqin, et al.Gene expression profiles of two intraspecific Larix lines and their reciprocal hybrids [J].Mol Boil Rep, 2011, 39 (4): 3773-3784.
[78]EGERTSDOTTER U, ZYL L M, MACKAY J, et al.Gene expression during formation of early wood and latewood in loblolly pine: expression profiles of 350 genes [J].Plant Biol, 2004, 6: 654-663.
[79]PAIVA J A, GARNIER-GERE P H, RODRIGUES J C, et al.Plasticity of maritime pine (Pinus pinaster)wood-forming tissues during a growing season [J].New Phytol, 2009, 179: 1180-1194.
[80]PAIVA J A, GRACéS M, ALVES A, et al.Molecular and phenotypic profiling from the base to the crown in maritime pine wood-forming tissue [J].New Phytol, 2008, 178: 283-301.
[81]YANG S H, van ZYL L, NO E G, et al.Microarray analysis of genes preferentially expressed in differentiating xylem of loblolly pine (Pinus taeda) [J].Plant Sci, 2004, 166: 1185-1195.
[82]PAVY N, BOYLE B, NELSON C, et al.Identification of conserved core xylem gene sets: conifer cDNA microarray development, transcript profiling and computational analyses [J].New Phytol, 2008, 180: 766-786.
[83]KNAUS B J, DOLAN P C, DENVER D, et al.Transcriptome Dynamics in the Dormancy-spring Growth Transition of Douglas-fir Needles[R].San Diego: Forest Tree workshop, PAG XX, 2012.
[84]BRINKER M, van ZYL L, LIU Wenbin, et al.Microarray analyses of gene expression during adventitious root development in Pinus contorta [J].Plant Physiol, 2004, 135: 1526-1539.
[85]HEATH L S, RAMAKRISHNAN N, SEDEROFF R R, et al.Studying the functional genomics of stress responses in loblolly pine with the Expresso microarray experiment management system [J].Comp Func Gen, 2002, 3: 226-243.
[86]FOSSDAL C G, NAGY N E, JOHNSEN,et al.Local and systemic stress responses in Norway spruce:similarities in gene expression between a compatible pathogen interaction and drought stress [J].Physiol Mol Plant Pathol,2007, 70: 161-173.
[87]LORENZ W W, ALBA R, YU Y S, et al.Microarray analysis and scale-free gene networks identify candidate regulators in drought-stressed roots of loblolly pine (P.taeda L.) [J].BMC Genomics, 2011, 12: 264.doi: 10.1186/1471-2164-12-264.
[88]JOOSEN R V L, LAMMERS M, BALK P A, et al.Correlating gene expression to physiological parameters and environmental conditions during cold acclimation of Pinus sylvestris,identification of molecular markers using cDNA microarrays [J].Tree Physiol, 2006, 26: 1297-1313.
[89]HOLLIDAY J A, RALPH S G, WHITE R, et al.Global monitoring of autumn gene expression within and among phenotypically divergent populations of Sitka spruce (Picea sitchensis) [J].New Phytol, 2008, 178: 103-122.
[90]VARSHNEY R K, GRANER A, SORRELLS M E.Genic microsatellite markers in plants: features and applications[J].Trends Biotechnol, 2005, 23: 48-55.
[91]SANGER F, NICKLEN S, COULSON A R.DNA sequencing with chain-terminating inhibitors [J].Proc Natl Acad Sci USA, 1977, 74: 5463-5467.
[92]MARIONI J, MASON C, MANE S, et al.RNA-Seq: an assessment of technical reproducibility and comparison with gene expression arrays [J].Genome Res, 2008, 18: 1509-1517.
[93]PLOMION C, RICHARDSON T, MACKAY J.Advances in forest tree genomics [J].New Phytol, 2005, 166: 713-717.
[94]SUN Miao, ZHOU Guolin, LEE S, et al.SAGE is far more sensitive than EST for detecting low-abundance transcripts [J].BMC Genomics, 2004, 5: 1.doi: 10.1186/1471-2164-5-1.
[95]GOWDA M, LI H, ALESSI J, et al.Robust analysis of 5’-transcript ends (5’-RATE): a novel technique for transcriptome analysis and genome annotation [J].Nucl Acid Res, 2006, 34: e126.
[96]SHENDURE J, MITRA R D, VARMA C, et al.Advanced sequencing technologies: methods and goals[J].Nat Genet,2004, 5: 335-344.
[97]MARGULIES M, EGHOLM M, ALTMAN W E, et al.Genome sequencing in microfabricated high-density picolitre reactors [J].Nature, 2005, 437: 376-380.
[98]HUDSON M.Sequencing breakthroughs for genomic ecology and evolutionary biology [J].Mol Ecol Resour, 2008, 8:3-17.
[99]MOROZOVA O, HIRST M, MARRA M A.Applications of new sequencing technologies for transcriptome analysis[J].Annu Rev Genomics Hum Genet, 2009, 10: 135-151.
[100]SCHUSTER S C.Next-generation sequencing transforms today’s biology [J].Nature Method, 2008, 5: 16-18.
[101]LORENZ W W, JOHNSON V E, AYYAMPALAYM S, et al.Progress on enhanced EST resources for loblolly pine(Pinus taeda L.) and other conifers [C]//BRUNNER A.Proceeding of the 30th Southern Forest Tree Improvement Conference.Blacksburg: Southern Forest Tree Improvement Conference, 2009.
[102]PARCHMAN T L, GEIST K S, GRAHNEN J A, et al.Transcriptome sequencing in an ecologically important tree species: assembly, annotation, and marker discovery [J].BMC Genomics, 2010, 11: 180.doi: 10.1186/1471-2164-11-180.
[103]RIGAULT P, BOYLE B, LEPAGE P, et al.A white spruce gene catalog for conifer genome analyses [J].Plant Physiol, 2011, 157: 14-28.
[104]NOVAES E, DROST D R, FARMERIE W G, et al.High-throughput gene and SNP discovery in Eucalyptus grandis, an uncharacterized genome [J].BMC Genomics, 2008, 9: 312.doi: 10.1186/1471-2164-9-312.
[105]UENO S, PROVOST G L, LéGER V, et al.Bioinformatic analysis of ESTs collected by Sanger and pyrosequencing methods for a keystone forest tree species: oak [J].BMC Genomics, 2010, 11: 650.doi: 10.1186/1471-2164-11-650.
[106]MIZRACHI E, HEFER C A, RANIK M, et al.De novo assembled expressed gene catalog of a fast-growing Eucalyptus tree produced by Illumina mRNA-Seq [J].BMC Genomics, 2010, 11: 681.doi: 10.1186/1471-2164-11-681.
[107]FERNáNDEZ-POZO N, CANALES J, GUERRERO-FERNáNDEZ D, et al.EuroPineDB: a high-coverage web database for maritime pine transcriptome [J].BMC Genomics, 2011, 12: 366.doi: 10.1186/1471-2164-12-366.
[108]KAUR S, COGAN N O, PEMBLETON L W, et al.Transcriptome sequencing of lentil based on second-generation technology permits large-scale unigene assembly and SSR marker discovery [J].BMC Genomics, 2011, 12: 265.doi:10.1186/1471-2164-12-265.
[109]BARBAZUK W B, EMRICH S J, CHEN H D, et al.SNP discovery via 454 transcriptome sequencing [J].Plant J,2007, 51 (5): 910-918.
[110]IMELFORT M, DURAN C, BATLEY J, et al.Discovering genetic polymorphisms in next-generation sequencing data [J].Plant Biotechnol J, 2009, 7: 312-317.
[111]VERA J C, WHEAT C W, FESCEMYER H W, et al.Rapid transcriptome characterization for a nonmodel organism using 454 pyrosequencing [J].Mol Ecol, 2008, 17: 1636-1647.
[112]MARDIS E R.The impact of next-generation sequencing technology on genetics [J].Trends Genet, 2008, 24: 133-141.
[113]GUPTA P K.Ultrafast and low-cost DNA sequencing methods for applied genomics research [J].Proc Natl Acad Sci India, 2008, 78: 91-102.
[114]GRATTAPAGLIA D, RESENDE M D V.Genomic selection in forest tree breeding [J].Tree Genetics&Genomes,2011, 7: 241-255.
[115]NELSON C D, JOHNSEN K H.Genomic and physiological approaches to advancing forest tree improvement [J].Tree Physiol, 2008, 28: 1135-1143.
浙江農(nóng)林大學(xué)學(xué)報(bào)2012年5期