苗作云 楊 赟 劉攀峰 鄭新芳 杜紅巖 朱景樂*
(1.中國林業(yè)科學研究院經(jīng)濟林研究開發(fā)中心,鄭州 450003; 2.黃河科技學院,鄭州 450063; 3.河南農(nóng)業(yè)大學,鄭州 450002; 4.華南農(nóng)業(yè)大學,廣州 510642)
基于轉錄組數(shù)據(jù)的杜仲紅葉性狀SSR分子標記分析
苗作云1,2楊 赟3劉攀峰1鄭新芳4杜紅巖1朱景樂1*
(1.中國林業(yè)科學研究院經(jīng)濟林研究開發(fā)中心,鄭州 450003;2.黃河科技學院,鄭州 450063;3.河南農(nóng)業(yè)大學,鄭州 450002;4.華南農(nóng)業(yè)大學,廣州 510642)
對‘華仲12號’杜仲的幼嫩葉片(綠色)和成熟葉片(紅色)及‘華仲11號’杜仲成熟葉片(綠色)進行轉錄組測序,進行測序數(shù)據(jù)的拼接和組裝,且對轉錄組獲得的基因(Unigenes)進行SSR分析。研究得到54 517條平均長度為806.90 bp的Unigenes,其中25 993條Unigenes在Nr、Swiss-Prot、KEGG和COG蛋白數(shù)據(jù)庫獲得功能注釋,占所有Unigenes的47.68%。參照KEGG數(shù)據(jù)庫,可將注釋到的6 910條Unigenes劃分到122個代謝途徑分支,其中花色苷代謝途徑相關酶基因39個,類黃酮代謝途徑38個,類胡蘿卜素合成途徑34個。54 517條Unigenes中共包含17 010個完整型SSR位點,占總SSR位點的96.28%。完整型SSR位點共包含67種重復基元,其中出現(xiàn)頻率最高的重復基元類型為單核苷酸重復中的A/T(7 747個),其次是AG/CT(5 039個)和AT/AT(850個)從花色苷代謝途徑、類黃酮代謝途徑及類胡蘿卜素代謝途徑中共找到13個SSR位點。為今后杜仲遺傳多樣性分析、遺傳圖譜構建及杜仲紅葉性狀分子標記開發(fā)等方面奠定了分子基礎。
杜仲;紅葉;微衛(wèi)星;轉錄組;高通量測序
杜仲(EucommiaulmoidesOliv.)屬杜仲科(Eucommiaceae),單科單屬單種,是中國重要的名貴經(jīng)濟樹種,雌雄異株,風媒花。其在我國27個省(區(qū)、市)均有分布,不但是中國分布最廣的膠源植物和名貴中藥材[1],還是一種理想的城市綠化和庭院觀賞樹種[2]。‘華仲12號’杜仲是中國林科院經(jīng)濟林中心審定的觀賞與藥用價值兼?zhèn)涞亩胖倭挤N,雄株,花量大,葉片呈紫紅色[3~4]。除了‘華仲12號’杜仲外,尚有一些關于紅(紫)葉性狀的報道[5~6],且這些報道稱發(fā)現(xiàn)紅葉性狀單株的位置距離很遠,陜西和湖南都有發(fā)現(xiàn)[7~8],隨著對杜仲紅葉性狀的關注,不斷有新的具有該性狀的杜仲單株被發(fā)現(xiàn)。但所報道的具備紅葉性狀的資源親緣關系如何,其是在各自群體發(fā)生基因突變?亦或通過種子異地調(diào)運等方式將攜帶的遺傳信息帶到其他省份等原因尚未可知,目前尚無關于如何鑒定這些紅葉單株親緣關系的報道,亦未見關于紅葉性狀分子標記開發(fā)的報道。
微衛(wèi)星分子標記又稱 SSR 分子標記技術,因其具備多態(tài)性高、共顯性和特異性強等優(yōu)點,在遺傳多樣性分析、DNA指紋圖譜的構建、基因定位、分子標記輔助育種等方面得到廣泛應用[9~10]。隨著轉錄組測序技術的成熟及成本降低,根據(jù)生物的轉錄組序列開發(fā)SSR標記日益受到研究者青睞,其不但具有時空特異性,且開發(fā)的分子標記與某一性狀連鎖性強,從而使其在用于植物遺傳多樣性和分子標記輔助育種研究的準確性更高[11]。
本研究擬在‘華仲12號’杜仲的幼嫩葉片和成熟葉片及‘華仲11號’杜仲成熟葉片6個樣品轉錄組測序的基礎上,采用生物信息學方法對拼接組裝后的微衛(wèi)星特征分析等,為開發(fā)杜仲葉片的紅葉性狀分子標記奠定理論基礎。
本研究以1年生‘華仲12號’杜仲和‘華仲11號’杜仲嫁接苗為對象,從中選擇‘華仲12號’杜仲幼嫩葉片(呈綠色,編號H1),‘華仲12號’杜仲成熟葉片(呈紅色,編號H3)及‘華仲11號’杜仲成熟葉片(呈綠色,編號L4),將3個葉片混合成一個樣品,生物學重復2次,共計6個樣品,樣品編號方法為取樣狀態(tài)—重復號,如H1-1即為‘華仲12號’杜仲幼嫩葉片的第一個生物學重復,依次類推。
6個樣品分別提取總RNA,使用Trizol Kit(Promega,USA)試劑盒提取RNA,并對通過Agilent 2100 Bioanalyzer檢測RNA濃度及峰值,判斷所得RNA是否達到RNA-Seq的試驗標準(總量≥20 ng、質量濃度≥400 ng·μL-1、OD260/280為1.8~2.2、RNA integrity number值≥8、28S/18S>1.0)。
各樣品分別構建cDNA文庫,通過Agilent 2100儀器檢測文庫的長度,并用熒光定量PCR儀測定文庫的濃度,合格的文庫用Illumina HiSeq2000分別進行測序。
對原始測序數(shù)據(jù)進行過濾后(去除含adaptor的reads、N的比例大于10%的reads及低質量reads(質量值Q≤5的堿基數(shù)占整個read的50%以上)),采用Trinity(20140717)軟件對所得數(shù)據(jù)進行混合從頭組裝,得到杜仲葉片的Unigenes序列。
通過blastx(2.2.29+)將Unigenes序列比對到蛋白數(shù)據(jù)庫Nr、Swiss-Prot、KEGG和COG(E-value<0.000 01),獲得Unigenes在4大數(shù)據(jù)庫中的功能注釋。根據(jù)Nr注釋信息,使用Blast2GO(2.3.5)軟件得到Unigenes的GO注釋信息[12]。然后用WEGO軟件對所有Unigenes做GO功能分類統(tǒng)計[13]。根據(jù)Unigenes的kegg功能注釋結果,對所有的Unigenes進行代謝通路分析[14]。
采用MISA(version 1.0)軟件(Microsatellite identificantion tool,http://pgrc. ipk-gatersleben .de /misa)搜索杜仲葉片轉錄組中Unigenes的簡單重復序列SSR[15],并對SSR重復基元類型進行特征分析。查找標準為單核苷酸基元最少重復10次,而二、三、四、五和六核苷酸基元則最少重復6、5、4、4和4次。
RNA濃度及峰值的Agilent 2100檢測結果見圖1,所提RNA條帶清晰,濃度、RIN值及RNA總量均達到測序標準,具有明顯的檢測峰,符合RNA測序的需求,可直接進行下一步測序。
對杜仲葉片RNA測序后共得到331 016 720條clean reads,GC含量為50.68%,Q20值為96.03%,各項指標均符合轉錄組測序的要求。利用Trinity軟件[16]對樣品數(shù)據(jù)進行組裝共得到54 517條Unigenes,組裝的N50為1 377 nt,平均長度為806.90 nt,組裝效果較好。其中GC含量為42.17%,長度為200~300 nt的序列最多,有15 902條,其次為300~400和400~500 nt的序列,具體的Unigenes的長度分布見圖2。
圖2 杜仲葉片的Unigene長度分布圖Fig.2 Unigene length distribution of E.ulmoides ‘Hongye’
圖3 四大數(shù)據(jù)庫注釋維恩圖Fig.3 Four database notes Venn diagram
利用BLAST軟件[17]將Unigenes序列分別與NR、GO、COG和KEGG數(shù)據(jù)庫比對分析,后統(tǒng)計每個庫上注釋到的Unigenes數(shù)目。統(tǒng)計結果顯示共有25 993條Unigenes得到注釋,28 524條Unigenes未得到注釋,注釋比例僅為47.68%,其中Nr數(shù)據(jù)庫中注釋的有25 929條,在Swissprot數(shù)據(jù)庫中注釋到的有18 070,在COG數(shù)據(jù)庫中注釋到的有8 674條,在KEGG數(shù)據(jù)庫中注釋到的有6 910條。上述基因中有27 732條基因能編碼蛋白序列,占總Unigenes數(shù)量的50.87%。
將所有Unigenes在Nr、Swiss-Prot、KEGG和COG四大數(shù)據(jù)庫中的最佳比對結果的比對E值進行統(tǒng)計,將其分為6個范圍,并統(tǒng)計每個范圍內(nèi)的基因個數(shù)比對E值(Unigenes與數(shù)據(jù)庫中匹配序列為同源序列的假陽性概率),具體信息見圖4,從中可知Nr數(shù)據(jù)庫中信息更加可靠。
圖4 Unigene注釋結果分別在4大數(shù)據(jù)庫中的E值分布圖Fig.4 The distribution of the E values in the 4 databases
圖5 物種分布統(tǒng)計圖(只展示前十種)Fig.5 Species distribution map (showing only the first ten)
利用blastx將組裝出來的Unigenes序列與Nr數(shù)據(jù)庫進行比對后,取每個Unigenes在Nr庫中比對結果最好(E值最低)的那一條序列為對應同源序列(如有并列,取第一條),確定同源序列所屬物種,統(tǒng)計比對到各個物種的同源序列數(shù)量見圖5,同源基因比對得到杜仲中有6 032條Unigenes與葡萄(Vitisvinifera)數(shù)據(jù)庫中信息接近,其Unigenes數(shù)量占Nr數(shù)據(jù)庫注釋的總Unigenes數(shù)量的23.26%,說明與葡萄屬的親緣關系更近,其次是可可樹(Theobromacacao)和番茄(Solanumlycopersicum),接近的Unigenes數(shù)量分別為4 535條和3 638條,所占的比例分別是17.49%和14.03%。在后期的研究中可優(yōu)先參考這幾個物種的遺傳信息。
2.4.1 Unigenes的GO分類
為了進一步研究Unigenes的功能,將所得Unigenes向GO數(shù)據(jù)庫的各個term進行映射,發(fā)現(xiàn)共有12 421個Unigenes在生物過程(biologicalprocess)、細胞組分(cellularcomponent)和分子功能(molecularfunction)分類中得到了GO注釋。其中,在生物過程中,涉及代謝過程(metabolic process)、細胞過程(cellular process)和刺激響應(response to stimulus)的Unigenes數(shù)較多,分別占GO注釋Unigenes數(shù)的52.20%(6484 Unigenes)、48.59%(6 035 Unigenes)和19.31%(2 399 Unigenes);在細胞組分中,涉及細胞(cell)、細胞部分(cell part)和細胞器(organelle)的Unigenes較多,分別占GO注釋Unigenes的55.29%(6 868 Unigenes)、55.29%(6 868 Unigenes)和38.63%(4 799 Unigenes);在分子功能中,涉及催化活性(catalytic activity)和結合(binding)的Unigenes較多,分別占GO注釋Unigenes的52.17% (6480 Unigenes)和47.37%(5 884 Unigenes)。
2.4.2 Unigenes的COG分類
利用COG數(shù)據(jù)庫比對分析共得到13434條杜仲Unigenes的同源序列,它們分為25個類別(圖7),其中復制、重組和修飾(1 342,9.99%)、轉錄(1 238,9.22%)和信號轉導(1 077,8.02%)等與生物過程相關的Unigenes數(shù)量最多;其次是與功能預測類別相關的Unigenes基因(2 438,18.15%);此外,與代謝相關的Unigenes基因數(shù)量為2 931條,占總Unigenes數(shù)量的21.82%。
圖6 GO功能顯著性富集分析Fig.6 Enrichment analysis of GO function
圖7 COG功能分類圖Fig.7 COG function classification
2.4.3 KEGG pathways分析
根據(jù)KEGG數(shù)據(jù)庫注釋信息及對非冗余Unigenes的pathway進行富集性分析,共識別出6 910條Unigenes,可歸為122個信號途徑。與植物葉片顏色及葉片生長直接相關的代謝途徑(注釋的Unigenes數(shù)量)分別有類黃酮代謝途徑(38條)、光合作用途徑(97條)、光合生物中的碳固定途徑(89條)、葉綠素代謝途徑(53條)、光合作用—天線蛋白合成途徑(43條)、花色苷代謝途徑(39條)及類胡蘿卜素的生物合成途徑(34條)等。
表1 杜仲轉錄組的KEGG代謝途徑分類圖(部分)
2.5.1 微衛(wèi)星的種類和數(shù)量分布
利用MISA軟件對杜仲轉錄組的54 517條Unigenes(總長度為43 989 941 bp)進行SSR搜索,在54 517條Unigenes中共發(fā)現(xiàn)17 667個SSR位點(其中包含657個混合型的SSR和17 010個完整型SSR位點),其中包含2個及以上SSR位點的Unigenes共有3 121條。其發(fā)生頻率(即含SSR位點的Unigenes占總Unigenes的百分比)為23.64%,平均每2.5 kB就出現(xiàn)一個SSR位點,其出現(xiàn)頻率(即檢測出的SSR位點個數(shù)占總Unigenes的百分比)為32.41%。
完整型SSR位點共有17 010個,占總SSR位點的96.28%(圖8)。完整型SSR位點共包含67種重復基元,二核苷酸至六核苷酸分別有4、10、14、16、21種(表2)。其中,完整型SSR重復基元的重復次數(shù)均在4~27次,其中以重復10次(3 685個)的最多,占總SSR的20.86%;其次為重復次數(shù)6、7、11、5和8次,其SSR位點個數(shù)分別為3 115、1 864、1 766、1 412和1 198。重復5~10次的SSR位點有12 144個,占總SSR的68.74%;重復11次以上的SSR位點有4 866個,占27.54%。
表2杜仲SSR中6種重復基元的類型及頻率
Table2SixtypesofSSRrepeatmotifsandtheirfrequencyinE.ulmoides
重復基元類型Repeatmotif重復次數(shù)Repeatnumber567891011>11總計Total頻率Frequency(%)A/T311116143022774745.54C/G6843711821.07AC/GT34518412281712938354.91AG/CT18271175908691369672503929.62AT/AT32321513895661218505CG/CG2194340.2AAC/GTT812810111210.71AAG/CTT42420897217324.3AAT/ATT83442531550.91ACC/GGT153844142821.66ACG/CGT561562790.46ACT/AGT3094430.25AGC/CTG1013315111510.89AGG/CCT1637941712911.71ATC/ATG100441841660.98CCG/CGG12233181731.02AAAC/GTTT82100.06AAAG/CTTT92110.06AAAT/ATTT214250.15AACC/GGTT220.01AAGG/CCTT1120.01AATC/ATTG2130.02AATG/ATTC110.01AATT/AATT110.01ACAT/ATGT92110.06ACCG/CGGT110.01ACTC/AGTG1120.01AGAT/ATCT741120.07AGCG/CGCT330.02AGGG/CCCT8190.05AAAAC/GTTTT110.01AAACC/GGTTT110.01AAAGG/CCTTT110.01AAAGT/ACTTT110.01AAATT/AATTT110.01AACCT/AGGTT110.01AAGAC/CTTGT110.01AAGAT/ATCTT110.01AAGTG/ACTTC110.01ACCCC/GGGGT110.01ACCCT/AGGGT110.01ACCTC/AGGTG110.01AGCAT/ATGCT110.01AGGAT/ATCCT110.01AGGCG/CCTCG110.01AGGGG/CCCCT110.01AAAAAC/GTTTTT110.01AAAACG/CGTTTT110.01AAAGTG/ACTTTC110.01AAATTG/AATTTC110.01AACAGC/CTGTTG110.01AACCCT/AGGGTT110.01AACTTC/AAGTTG110.01AAGCAC/CTTGTG110.01AAGGGC/CCCTTG110.01AAGTAG/ACTTCT110.01AAGTGG/ACTTCC110.01AATCAC/ATTGTG110.01ACACCG/CGGTGT110.01ACACGC/CGTGTG110.01ACCAGC/CTGGTG110.01ACCATC/ATGGTG110.01ACCTCC/AGGTGG110.01AGAGGC/CCTCTG110.01AGAGGG/CCCTCT110.01AGCATC/ATGCTG110.01AGGGCG/CCCTCG110.01總計Total141231151864119887036851766310017010100頻率Frequency(%)8.318.3110.967.045.1121.6610.3818.22100
圖8 杜仲完整型SSR種類和數(shù)量分布圖Fig.8 Types and numbers of complete SSR in E.ulmoides
2.5.2 微衛(wèi)星不同重復基序的頻率
杜仲葉片轉錄組中完整型SSR種類豐富(圖8),單核苷酸到六核苷酸的重復類型都存在,但其出現(xiàn)頻率差異較大。其中以A/T類型為主的單核苷酸重復所占的比例最高(7 747個,45.54%);其次是以AG/CT類型為主的二核苷酸重復(5 039個,29.62%);再次是以AAG/CTT類型為主的三核苷酸重復(732個,4.3%),四核苷酸重復類型為93個,以AAAT/ATTT類型為主;五和六核苷酸重復基元的類型較多,但數(shù)量都很少,出現(xiàn)頻率均較低。對檢測到的SSR位點分析顯示,出現(xiàn)頻率最高的5類基序依次為:A/T(4 597個,47.78%)、AG/CT(5 039個,29.62%)、AT/AT(850個,5.00%)、AC/GT(835個,4.91%)和AAG/CTT(732個,4.30%)(表2)。
杜仲2種單堿基微衛(wèi)星重復基元的統(tǒng)計結果顯示:A/T為主要的重復基元,共有7 747個,占45.54%,C/G僅占1.07%(圖9A)。二堿基重復基元有4種(AC/GT、AG/CT、AT/AT、CG/CG),其中AG/CT的重復基元數(shù)量最多(5 039個),占總體的29.62%;其次是AT/AT(850個)和AC/GT(835個),分別占5.00%和4.91%。最少的是CG/CG(34個,0.2%)(圖9(B))。三堿基重復類型共有10個,AAG/CTT的數(shù)量最多,共732個,占總體的4.30%;其次是AGG/CTT(291個)和ACC/GGT(282個),分別占1.71%和1.66%;再次是CCG/CGG(173個,1.02%)、ATC/ATG(166個,0.98%),其他重復類型則相對較少(表2)。在14種四堿基重復類型中,AAAT/ATTT的數(shù)量最多(25個),占總體的0.15%;其次是AGAT/ATCT(12個,0.07%);再次是AAAG/CTTT、ACAT/ATGT,均占0.06%。五堿基和六堿基重復類型分別有16和21種,但每種類型均只有1個。
表3是杜仲葉片顏色形成相關基因的SSR重復基元信息,我們從所有的SSR重復信息中找出來與類黃酮代謝途徑有關的2條,與花色苷合成途徑有關的Unigenes 2條,與類胡蘿卜素合成的Unigenes 8條,并從中找到13個SSR位點。利用找出來的這13個位點可以為進一步開發(fā)杜仲葉片紅色性狀的分子標記做準備。
表3 杜仲葉片顏色形成相關基因的SSR重復基元信息
圖9 單堿基和二堿基微衛(wèi)星的頻率Fig.9 Frequency of mononucleotide and dinucleotide repeat SSRs
轉錄組測序技術(RNA-seq)是近期興起的一種新技術,其靈敏度高,且利用其研究轉錄組時對材料的遺傳背景要求低,較常規(guī)方法具有明顯的優(yōu)勢[18]。由于杜仲是單科單屬單種,關于杜仲轉錄組測序方面的研究報道較少。李鐵柱、趙德剛、馮延芝等分別構建了杜仲葉片、果實、芽及樹皮等器官在不同發(fā)育時期的轉錄組數(shù)據(jù)庫,并對杜仲轉錄組數(shù)據(jù)中相關基因功能、代謝通路等進行了初步研究[19~22]。相比前人的研究,本次轉錄組測序得到54 517條Unigenes。由于本研究僅選用‘華仲12號’品種不同時期及‘華仲11號’的葉片,而前人的研究均為多器官的混合樣品,所以得到的Unigenes數(shù)量雖少,但組裝Unigenes的N50為1 377 nt,平均長度806.90 nt,堿基Q20均在95%以上,組裝效果更好,后期的分析也更加可靠。
隨著轉錄組測序技術的成熟,通過其開發(fā)分子標記及后期基因功能研究也成為一種主要的方式。黃海燕、吳敏等在轉錄組測序的基礎上進行相關SSR分子標記的開發(fā),并對其遺傳多樣性、親緣關系、群體遺傳學、性別鑒定等方面開展了系統(tǒng)研究[11,23~24]。林開勤、申響寶及馮延芝等通過MISA軟件對杜仲轉錄組測序所得Unigenes進行微衛(wèi)星特征分析,并開發(fā)系列引物,為杜仲不同種群間的遺傳結構和遺傳多樣性分析研究提供了依據(jù)[22,25~26]。本研究共得到17 010個完整型SSR位點,占總SSR的96.28%,其出現(xiàn)頻率為32.41%,高于紅豆杉(2.24%)[27],楠木(13.97%)[28]〗和刺梨(20.37%)[29]等,低于芙蓉李(54.51%)等[30],其原因可能是基因庫中不同植物的數(shù)據(jù)有所差異或者計算的方法有很大不同。此外,本研究發(fā)現(xiàn)杜仲SSR序列重復基元類型存在比較嚴重的偏倚性,這與馮延芝在杜仲果實轉錄組SSR分子標記研究中所得結論相同,原因可能是由于這些基元本身組成的SSR單位長度的限制。
葉片顏色是一個復合性狀,其最終由葉綠素、類胡蘿卜素及花色苷等植物色素的含量和比例所決定[31]。研究控制這些色素合成的關鍵基因及相關的SSR位點信息,可針對此開發(fā)相應引物,開展紅葉性狀的分子標記,不但可以進行種質資源的早期選擇,還可以結合紅葉性狀是形態(tài)標記的特點,對開發(fā)的分子標記進行驗證。本研究利用高通量測序技術建立了杜仲葉片紅葉性狀的轉錄組數(shù)據(jù)庫,經(jīng)代謝通路分析和SSR位點分析,找與葉片顏色形成相關的12個基因和13個SSR,為下一步開發(fā)杜仲紅葉性狀SSR分子標記提供參考,在分子基礎上鑒定杜仲葉片的呈色性狀上邁進一步。
致謝感謝廣州基迪奧生物科技有限公司對文章的測序工作和生物信息分析工作的協(xié)助。
1.杜紅巖.我國的杜仲膠資源及其開發(fā)潛力與產(chǎn)業(yè)發(fā)展思路[J].經(jīng)濟林研究,2010,28(3):1-6.
Du H Y.Discussion on industry development and exploration potential of gutta-percha resource in China[J].Nonwood Forest Research,2010,28(3):1-6.
2.杜紅巖,胡文臻,俞銳.杜仲產(chǎn)業(yè)綠皮書:中國杜仲橡膠資源與產(chǎn)業(yè)發(fā)展報告[M].北京:社會科學文獻出版社,2013.
Du H Y,Hu W Z,Yu R.Green book of Eucommia industry:The report on development of China’sEucommiarubber resources and industry[M].Beijing:Social Sciences Academic Press,2013.
3.杜紅巖.中國杜仲圖志[M].北京:中國林業(yè)出版社,2014:367.
Du H Y.ChinaEucommiapictorial[M].Beijing:China Forestry Publishing House,2014:367.
4.朱景樂,杜紅巖,李芳東,等.3個杜仲品種葉片性狀及活性成分質量分數(shù)[J].東北林業(yè)大學學報,2014,42(3):42-44.
Zhu J L,Du H Y,Li F D,et al.Leaf traits and active component content in three varieties ofEucommiaulmoides[J].Journal of Northeast Forestry University,2014,42(3):42-44.
5.彭少兵,張春賀,任利益,等.紫葉杜仲葉色變異研究[J].浙江林業(yè)科技,2013,33(3):61-66.
Peng S B,Zhang C H,Ren L Y,et al.Analysis on leaf color variation ofEucommiaulmoides[J].Journal of Zhejiang Forestry Science and Technology,2013,33(3):61-66.
6.董娟娥,杜紅巖,張康健,等.觀賞與藥用杜仲無性系的選擇[J].林業(yè)科學,2008,44(5):165-169.
Dong J E,Du H Y,Zhang K J,et al.Selection of ornamental and officinal clones ofEucommiaulmodies[J].Scientia Silvae Sinicae,2008,44(5):165-169.
7.胡篤敬.湖南的杜仲[J].植物生理學通訊,1956(2):26-27.
Hu D J.TheEucommiaulmodiesof Hunan[J].Plant Physiology Journal,1956(2):26-27.
8.周政賢,郭光典.我國杜仲類型、分布及引種[J].林業(yè)科學,1980,16(S1):84-91.
Zhou Z X,Guo G D.The form,distribution and introduction ofEucommiaulmoidesin China[J].Scientia Silvae Sinicae,1980,16(S1):84-91.
9.羅冉,吳委林,張旸,等.SSR分子標記在作物遺傳育種中的應用[J].基因組學與應用生物學,2010,29(1):137-143.
Luo R,Wu W L,Zhang Y,et al.SSR marker and its application to crop genetics and breeding[J].Genomics and Applied Biology,2010,29(1):137-143.
10.Kalia R K,Rai M K,Kalia S,et al.Microsatellite markers:an overview of the recent progress in plants[J].Euphytica,2011,177(3):309-334.
11.黃海燕,杜紅巖,烏云塔娜,等.基于杜仲轉錄組序列的SSR分子標記的開發(fā)[J].林業(yè)科學,2013,49(5):176-181.
Huang H Y,Du H Y,Wuyun T N,et al.Development of SSR molecular markers based on transcriptome sequencing ofEucommiaulmoides[J].Scientia Silvae Sinicae,2013,49(5):176-181.
12.Conesa A,G?tz S,García-Gómez J M,et al.Blast2GO:a universal tool for annotation,visualization and analysis in functional genomics research[J].Bioinformatics,2005,21(18):3674-3676.
13.Ye J,Fang L,Zheng H K,et al.WEGO:a web tool for plotting GO annotations[J].Nucleic acids research,2006,34(S2):W293-W297.
14.安文燕,孫君靈,龔文芳,等.陸地棉矮化突變體Ari1327莖尖的轉錄組分析[J].植物遺傳資源學報,2014,15(5):1046-1052.
An W Y,Sun J L,Gong W F,et al.Transcriptome analysis of stem apex of an upland cotton dwarf mutant Ari1327[J].Journal of Plant Genetic Resources,2014,15(5):1046-1052.
15.賈新平,葉曉青,梁麗建,等.基于高通量測序的海濱雀稗轉錄組學研究[J].草業(yè)學報,2014,23(6):242-252.
Jia X P,Ye X Q,Liang L J,et al.Transcriptome characteristics ofPaspalumvaginatumanalyzed withIlluminasequencingtechnology[J].Acta Prataculturae Sinica,2014,23(6):242-252.
16.Grabherr M G,Haas B J,Yassour M,et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology,2011,29(7):644-652.
17.Altschul S F,Madden T L,Sch?ffer A A,et al.Gapped BLAST and PSI-BLAST:a new generation of protein database search programs[J].Nucleic Acids Research,1997,25(17):3389-3402.
18.周華,張新,劉騰云,等.高通量轉錄組測序的數(shù)據(jù)分析與基因發(fā)掘[J].江西科學,2012,30(5):607-611.
Zhou H,Zhang X,Liu T Y,et al.Data processing and gene discovery of high-throughput transcriptome sequencing[J].Jiangxi Science,2012,30(5):607-611.
19.李鐵柱,杜紅巖,劉慧敏,等.杜仲幼果和成熟果實轉錄組數(shù)據(jù)組裝及基因功能注釋[J].中南林業(yè)科技大學學報,2012,32(10):9-17.
Li T Z,Du H Y,Liu H M,et al.Transcriptome data assembly and gene function annotation ofEucommiamature fruits and young fruits[J].Journal of Central South University of Forestry & Technology,2012,32(10):9-17.
20.李鐵柱,杜紅巖,劉慧敏,等.杜仲果實和葉片轉錄組數(shù)據(jù)組裝及基因功能注釋[J].中南林業(yè)科技大學學報,2012,32(11):122-130.
Li T Z,Du H Y,Liu H M,et al.Transcriptome data assembly and gene function annotation ofEucommiafruits and leaves[J].Journal of Central South University of Forestry & Technology,2012,32(11):122-130.
21.趙德剛,李巖,趙懿琛,等.杜仲雌雄株轉錄組測序數(shù)據(jù)組裝及基因功能注釋[J].山地農(nóng)業(yè)生物學報,2015,34(1):1-13.
Zhao D G,Li Y,Zhao Y C,et al.Transcriptome data assembly and gene function annotation of female and male plants inEucommiaulmoides[J].Journal of Mountain Agriculture and Biology,2015,34(1):1-13.
22.馮延芝,李芳東,魏琦琦,等.基于RNA-Seq的杜仲轉錄組微衛(wèi)星特征分析[J].中國農(nóng)業(yè)大學學報,2016,21(9):68-79.
Feng Y Z,Li F D,Wei Q Q,et al.Microsatellites characteristics of transcriptomic sequences fromEucommiaulmoidesOliv.based on RNA-Seq[J].Journal of China Agricultural University,2016,21(9):68-79.
23.吳敏,杜紅巖,烏云塔娜,等.杜仲基因組微衛(wèi)星特征及SSR標記開發(fā)[J].林業(yè)科學研究,2015,28(3):387-393.
Wu M,Du H Y,Wuyun T N,et al.Characterization of genomic microsatellites and development of SSR markers ofEucommiaulmoides[J].Forest Research,2015,28(3):387-393.
24.林開勤,趙德剛,李巖,等.杜仲性別相關EST-SSR標記的開發(fā)[J].林業(yè)科學,2016,52(10):146-152.
Lin K Q,Zhao D G,Li Y,et al.Development of gender-related EST-SSR markers inEucommiaulmoides[J].Scientia Silvae Sinicae,2016,52(10):146-152.
25.林開勤,李巖,趙德剛.杜仲轉錄組SSR發(fā)掘及標記開發(fā)[J].分子植物育種,2016,14(6):1548-1558.
Lin K Q,Li Y,Zhao D G.SSR mining and marker development inEucommiaulmoidesOliver transcriptome[J].Molecular Plant Breeding,2016,14(6):1548-1558.
26.申響保,閆文德,梁小翠,等.杜仲轉錄組微衛(wèi)星特征分析[J].經(jīng)濟林研究,2016,34(4):47-51.
Shen X B,Yan W D,Liang X C,et al.Characteristic analysis of microsatellites inEucommiaulmoidestranscriptome[J].Nonwood Forest Research,2016,34(4):47-51.
27.李炎林,楊星星,張家銀,等.南方紅豆杉轉錄組SSR挖掘及分子標記的研究[J].園藝學報,2014,41(4):735-745.
Li Y L,Yang X X,Zhang J Y,et al.Studies on SSR molecular markers based on transcriptome ofTaxuschinensisvar.mairei[J].Acta Horticulturae Sinica,2014,41(4):735-745.
28.時小東,朱學慧,盛玉珍,等.基于轉錄組序列的楠木SSR分子標記開發(fā)[J].林業(yè)科學,2016,52(11):71-78.
Shi X D,Zhu X H,Sheng Y Z,et al.Development of SSR markers based on transcriptome sequence ofPhoebezhennan[J].Scientia Silvae Sinicae,2016,52(11):71-78.
29.鄢秀芹,魯敏,安華明.刺梨轉錄組SSR信息分析及其分子標記開發(fā)[J].園藝學報,2015,42(2):341-349.
Yan X Q,Lu M,An H M.Analysis on SSR information in transcriptome and development of molecular markers inRosaroxburghii[J].Acta Horticulturae Sinica,2015,42(2):341-349.
30.方智振,葉新福,周丹蓉,等.‘芙蓉李’轉錄組SSR信息分析與分子標記開發(fā)[J].果樹學報,2016,33(4):416-424.
Fang Z Z,Ye X F,Zhou D R,et al.Analysis on SSR information in‘Furongli’plum transcriptome and development of molecular markers inPrunussalicinaLindl[J].Journal of Fruit Science,2016,33(4):416-424.
31.朱書香,楊建民,王中華,等.4種李屬彩葉植物色素含量與葉色參數(shù)的關系[J].西北植物學報,2009,29(8):1663-1669.
Zhu S X,Yang J M,Wang Z H,et al.Relationship between pigment contents and leafcolor parameters of four leaf-colored species ofPrunus[J].Acta Botanica Boreali-Occidentalia Sinica,2009,29(8):1663-1669.
State Key Laboratory of Forest Genetics and Breeding(Chinese Academy of Forestry)(TGB2015002);Special Fund for Basic Business Expenses of the Central Level Public Welfare Research Institutes of the Chinese Academy of forestry(CAFYBB2014QA037);The forest tree germplasm resources SURVEY of henan province
introduction:MIAO Zuo-Yun(1976—),female,Master,lecturer,mainly engaged in the breeding and cultivation ofEucommiaulmoides.
date:2017-04-02
AnalysisofRedLeafColorSSRMolecularMarkersbyTranscriptomeSequencingofEucommiaulmoides
MIAO Zuo-Yun1,2YANG Yun3LIU Pan-Feng1ZHENG Xin-Fang4DU Hong-Yan1ZHU Jing-Le1*
(1.Non-timber Forest Research and Development Center of Chinese Academy of Forestry,Zhengzhou 450003; 2.Huanghe Science and Technology College,Zhengzhou 450063; 3.Henan Agricultural University,Zhengzhou 450002; 4.South China Agricultural University,Guangzhou 510642)
The transcriptomes ofEucommiaulmoides‘Huazhong 12’ young and mature leaves and ‘Huazhong 11’ mature leaves were sequenced. The transcriptome data was assembled and classified by function, and microsatellites characteristics from obtained Unigenes and analyzed. The Unigenes were assembly generated a total of 54 517 Unigenes with an average length of 806.90 bp. Among them, 25 993 Unigenes accounted for 47.68% were annotated by comparing the assembled Unigenes with the Nr, Swiss-Prot, KEGG, and COG protein databases. KEGG pathway analysis presented that 6 910 annotated Unigenes divided into 122 classes according to its function. Among them, the Unigenes of ascorbate and aldarate metabolism was 39, flavonoid biosynthesis was 38, carotenoid biosynthesis was 34. There were 17 010 complete SSR located in 54 517 Unigenes accounted for 96.28% of the total SSR. The complete SSR included 67 frequent motifs, and the highest repeat of complete SSR type was A/T(7 747), following by AG/CT(5 039), AT/AT(850). There were 13 SSR located in ascorbate and aldarate metabolism, flavonoid biosynthesis and carotenoid biosynthesis. Our study would provide the molecular basis for genetic diversity analysis, genetic map construction and red leaf molecular marker development ofE.ulmoides.
Eucommiaulmoides;red leaf;microsatellites;transcriptome;high-throughput sequencing
林木遺傳育種國家重點實驗室(中國林業(yè)科學研究院)開放課題(TGB2015002);中國林科院中央級公益性科研院所基本業(yè)務費專項資金(CAFYBB2014QA037);河南省林木種質資源普查
苗作云(1976—),女,碩士,講師,主要從事杜仲育種與栽培。
* 通信作者:E-mail:zhujingle1982@126.com
2017-04-02
* Corresponding author:E-mail:zhujingle1982@126.com
S727.3
A
10.7525/j.issn.1673-5102.2017.06.013