田懷志, 郭 豪, 田 浩, 熊興偉, 張素勤, 耿廣東,3*
( 1. 貴州大學 農(nóng)學院, 貴陽 550025; 2. 遵義市農(nóng)業(yè)科學研究院, 貴州 遵義 563000; 3. 貴州大學辣椒產(chǎn)業(yè)技術研究院, 貴陽 550025 )
辣椒(Capsicumannuum)作為世界上第二大茄科蔬菜,是我國種植面積最大的蔬菜(鄒學校等,2020)。伴隨著辣椒用途的不斷開發(fā)和加工型產(chǎn)業(yè)的快速發(fā)展,其已成為我國鄉(xiāng)村振興的重要支柱產(chǎn)業(yè)之一。但是,辣椒屬于淺根系作物,根系不發(fā)達,再生能力弱,耐澇能力差。長江中下游地區(qū)澇害頻繁發(fā)生,導致辣椒減產(chǎn)減收嚴重(劉周斌等,2015)。目前,對辣椒耐澇脅迫方面的研究較少且主要集中于生理方面,對其分子機理的研究更少。耐澇是受多基因控制的性狀,難以定位,僅基于表型很難快速地將這些性狀加以利用。利用分子標記進行預選可減少群體規(guī)模,并可在辣椒生長早期篩選出理想的基因型,可加速辣椒新品種培育進程。
轉(zhuǎn)錄組測序(RNA-seq)技術利用高通量測序進行基因表達水平分析,可以反映基因的轉(zhuǎn)錄水平,能快速有效地獲得基因序列。其因高通量、準確性和可重復性等優(yōu)點,現(xiàn)已被廣泛應用到分子生物學領域。RNA-seq技術加速了新基因表達模式和功能的分析(Jain et al., 2016),是分析生物體基因表達量變化的重要工具(Zhang et al., 2017),其對非模式植物的基因挖掘和分子標記開發(fā)均具有重要意義,是探究植物耐澇分子機制的有力工具。Kinga等(2021)對兩個耐澇性不同的黃瓜品種進行轉(zhuǎn)錄組分析,發(fā)現(xiàn)在耐澇品種中所鑒定的基因與增強糖酵解、氨基酸代謝和不定根發(fā)育相關。Xu等(2017)對黃瓜轉(zhuǎn)錄組進行分析,發(fā)現(xiàn)耐澇植株表現(xiàn)出更高的碳水化合物代謝以及三磷酸腺苷和還原型輔酶Ⅰ的再生,以應對水澇脅迫帶來的能量危機。Pimprapai等(2011)研究了兩個不同耐澇性豌豆品種的分子響應變化,通過對根的轉(zhuǎn)錄組研究,發(fā)現(xiàn)能量代謝通路、激素、細胞壁修飾、膜轉(zhuǎn)運蛋白和過氧化物酶相關的多個差異表達基因可能有助于豌豆的耐澇。Li等(2022)通過轉(zhuǎn)錄組分析發(fā)現(xiàn)耐澇獼猴桃根系通過調(diào)節(jié)碳水化合物和氨基酸代謝來應對水澇脅迫。另外,葉鵬等(2019)通過對金花茶轉(zhuǎn)錄組數(shù)據(jù)的挖掘,獲得SSR位點分布特征,為SSR引物設計與篩選提供依據(jù)。
SSR因其具有豐富的數(shù)量、較高的多態(tài)性、良好的重復性以及共顯性等優(yōu)點而被廣泛應用(羅冉等,2010),但SSR標記的開發(fā)需要經(jīng)過構建文庫、篩選和測序等工作,既昂貴又繁瑣。如今,大規(guī)模開展的cDNA測序工作以及飛速發(fā)展的生物信息學,使得EST(expressed sequence tag)為SSR標記的開發(fā)提供了一種經(jīng)濟、方便的方法。隨著測序技術的迅速發(fā)展,EST數(shù)量逐步增加,使得EST-SSR標記越來越豐富。與傳統(tǒng)SSR相比,EST-SSR具有開發(fā)便宜、共顯性、穩(wěn)定、通用性好等優(yōu)點,被廣泛應用于基因標記(Varshney et al., 2005;姜春芽等,2009)?,F(xiàn)已在木瓜(伍越等,2021)、香合歡(安琪等,2022)、黃精(陳友吾等,2020)、龍眼(胡文舜等,2019)、川芎(袁燦等,2017)、紅麻(萬雪貝等,2017)、楓香(李輝等,2023)等植物上開發(fā)與應用,并廣泛應用于分子標記輔助育種、基因定位、遺傳多樣性分析和遺傳連鎖圖譜的構建等研究。已有研究基于公共數(shù)據(jù)庫或轉(zhuǎn)錄組有限的辣椒EST序列開發(fā)了一些引物,并在實踐中得到了應用(傅鴻妃等,2018;管俊嬌等,2019),但辣椒可公開獲得的SSR標記有限(Huang et al., 2000),已公開報道可利用的SSR標記僅有500多個(李永平等,2016),開發(fā)數(shù)量偏少,難以適應辣椒高密度作圖的要求,亟需開發(fā)更多的SSR標記用于遺傳圖譜構建、種質(zhì)鑒定以及分子輔助育種等。
本研究在水澇脅迫下從耐澇辣椒轉(zhuǎn)錄組數(shù)據(jù)中檢測差異表達基因(differentially expressed genes, DEGs),并對其進行組裝與功能注釋;通過RNA-seq技術獲得豐富的辣椒SSR位點信息,進行辣椒EST-SSR引物設計,隨后采用PCR擴增及聚丙烯酰胺凝膠電泳技術篩選出多態(tài)性好、穩(wěn)定的辣椒EST-SSR引物,并通過對不同辣椒品種的遺傳多樣性進行分析以驗證引物的應用效果。擬探討:(1)辣椒對水澇脅迫應答的分子機制;(2)辣椒EST-SSR位點的分布及序列特征;(3)辣椒多態(tài)性EST-SSR引物。本研究以期為今后辣椒遺傳圖譜構建、種質(zhì)資源評價、系統(tǒng)進化分析、功能基因標記和分子輔助育種等研究奠定基礎。
試驗材料為‘ZHC1’(不耐澇朝天椒)、‘ZHC2’(耐澇朝天椒)和‘大方皺椒’(線椒)?!甖HC1’和‘ZHC2’為遵義市農(nóng)業(yè)科學院惠贈的純系材料,‘大方皺椒’為貴州當?shù)胤N植的常規(guī)辣椒品種。
以耐澇‘ZHC2’辣椒為試驗材料,其培養(yǎng)及淹水處理參考郭豪等(2022)的方法。待辣椒植株長至5片葉時,分別進行淹水6 h(T1)、淹水24 h(T2)和恢復1 h(T3)3個處理,并以正常培養(yǎng)的辣椒材料作為對照(CK)。試驗包括3次生物學重復,每次生物學重復由10株長勢一致的辣椒根系混合而成,取樣后立即放入液氮中快速冷凍,然后放入-80 ℃超低溫冰箱中保存,使用TRIzol?試劑盒[天根生化科技(北京)有限公司]提取總RNA,用于轉(zhuǎn)錄組測序。測序文庫的構建在華大基因技術服務有限公司進行,使用Illumina HiSeq 2000測序平臺、Trinity軟件分別進行轉(zhuǎn)錄組的雙末端測序、Clean reads組裝以及聚類去冗余,獲得單基因(Unigene)。對DEGs進行KEGG(Kyoto Encyclopedia of Genes and Genomes)和GO(Gene Ontology)功能注釋,對Unigene與NT(NCBI non-redundant nucleotide sequence database)、NR(NCBI non-redundant protein sequences database)、SwissProt、Pfam(protein family)和KOG(euKaryotic Ortholog Groups)公共數(shù)據(jù)庫中的序列進行同源性分析。
使用MISA V1.0在線軟件測定Unigene中的SSR,限定單核苷酸至六核苷酸序列SSR的重復次數(shù)至少為12個、6個、5個、5個、4個和4個;并限定復合微衛(wèi)星形成的標準為兩個微衛(wèi)星之間的距離小于100 bp(Thiel et al., 2003)。使用Primer 3在線工具設計引物(Andreas et al., 2012),引物設計原則:(1)引物長度為18~24 bp;(2)產(chǎn)物大小為80~300 bp;(3)退火溫度為55~62 ℃,上下游引物退火溫度差值小于5 ℃;(4)GC含量為40%~60%;避免引物二級結構的出現(xiàn)。從中任意挑選30對引物進行擴增。引物由生工生物工程(上海)股份有限公司進行合成。
以‘ZHC1’‘ZHC2’和‘大方皺椒’為材料,待植株長至5葉1心時,采集頂部兩三片葉,液氮速凍后于-80 ℃中保存。通過CTAB法進行DNA提取,用于引物的有效性篩選。PCR反應體系與反應程序見表1,PCR反應在T100TMThermal Cycler PCR儀(BIO-RAD公司)上進行。
表 1 PCR反應體系和反應程序Table 1 PCR reaction system and procedure
用10%非變性聚丙烯酰胺凝膠(PAGE)電泳檢測PCR擴增產(chǎn)物。于120 V電泳2.0 h后,進行銀染顯色和照相,分析EST-SSR標記的多態(tài)性效果。
從耐澇‘ZHC2’辣椒不同淹水處理樣品中分離RNA,并對原始Reads進行過濾和組裝,總共構建了12個cDNA文庫。由表2可知,每個處理中Q20的比例均高于Q20規(guī)定的極限值(>80%),GC含量均低于50%,表明測序質(zhì)量良好。
對不同處理的辣椒植物根系進行轉(zhuǎn)錄組測序,構建了12個cDNA文庫,獲得Clean reads共153.99 Gb,對其組裝去冗余后,得到128 939個Unigene(圖1)。總長度、平均長度、GC含量依次為55 082 725、1 101 bp和40.57%。在所有的Unigene中,57 243個基因長度介于200~1 000 bp之間,所占比例為44.40%,35 213個基因長度介于1 000~2 000 bp之間,所占比例為27.31%,19 321個基因長度介于2 000~3 000 bp之間,所占比例為14.98%,17 162個基因長度大于3 000 bp,所占比例為13.31%。
將Unigene比對到NR、NT、SwissProt、KOG、KEGG、GO和Pfam數(shù)據(jù)庫(表3)中,分別有102 123個(79.20%)、110 157個(85.43%)、70 203個(54.45%)、73 539個(57.03%)、77 646個(60.22%)、77 442個(60.06%)以及68 216個(52.91%)Unigene獲得功能注釋,被任意一個數(shù)據(jù)庫注釋的Unigene有116 057個,占Unigene總數(shù)的90.01%。
圖 1 辣椒單基因長度分布Fig. 1 Distribution of Unigene length in hot pepper
表 2 辣椒轉(zhuǎn)錄組測序結果Table 2 Results of hot pepper transcriptome sequencing
將水澇脅迫與對照相比的DEGs進行GO功能注釋。共有43 446個DEGs被注釋在GO數(shù)據(jù)庫中(圖2),可分成分子功能、細胞組分以及生物過程三大類。分子功能中主要方面是結合、催化活性及轉(zhuǎn)運蛋白活性。細胞組分中主要方面是細胞解剖實體、細胞內(nèi)以及蛋白質(zhì)復合物。在生物過程中細胞過程占據(jù)主導地位,其次是代謝過程和生物調(diào)節(jié)。13 702個DEGs被注釋到KEGG通路中(圖3)。其中碳水化合物代謝、脂質(zhì)代謝與氨基酸代謝是主要的代謝途徑。與代謝相關的DEGs有8 404個,包含碳水化合物(16.52%)、氨基酸(9.22%)、脂質(zhì)(7.03%)、其他次級代謝物的生物合成(6.08%)以及能量代謝(4.99%)等;在遺傳信息處理中,主要為翻譯和折疊、分類和降解以及轉(zhuǎn)錄3個過程;在環(huán)境信息處理途徑中主要是信號轉(zhuǎn)導與跨膜運輸;運輸和分解代謝及環(huán)境適應是細胞過程和有機系統(tǒng)中的主要途徑。這說明在淹水過程中辣椒受到碳水化合物代謝、脂質(zhì)代謝、氨基酸代謝、信號轉(zhuǎn)導等途徑的協(xié)同作用,這些通路可能在辣椒水澇脅迫應答中起到重要作用。
EST-SSR的長度范圍為12~110 bp,其中12 bp和15 bp分布最多,分別有5 331個(20.06%)和5 523個(20.78%)SSR位點(圖4)。在單核苷酸和二核苷酸中,最常見的片段長度為12 bp,在單核苷酸中有2 909個(10.95%)位點,二核苷酸中有2 422個(9.11%)位點。單核苷酸和二核苷酸最長的片段分別是102 bp和96 bp。在三核苷酸中,主要長度類型是15 bp和18 bp,二者分別有4 510個(16.97%)個和1 945個(7.32%)位點,二者占三核苷酸位點總數(shù)的78.36%。四核苷酸及五核苷酸均以20 bp為主,分別有235個(0.88%)和340個(1.28%)位點。六核苷酸中最長的為90 bp,檢測到4個位點,24 bp占絕大多數(shù)(568,2.14%)。在本研究中,SSR有6 018條SSR的長度大于20 bp,占SSR總數(shù)的22.65%;20 556條SSR分布于12~19 bp之間,占SSR總數(shù)的77.35%。
使用MISA V1.0在線軟件對所有的Unigene進行SSR位點檢測,共發(fā)現(xiàn)26 574個SSR位點分布在24 889個Unigene中,其中23 451個Unigene含有單一SSR,1 438個Unigene包含3 123個SSR位點,SSR位點出現(xiàn)頻率(SSR數(shù)目占Unigene總數(shù)百分比)為20.61%,SSR發(fā)生頻率(含SSR的Unigene數(shù)占Unigene總數(shù)百分比)為19.30%。從表4可以看出,辣椒EST-SSR序列主要以4~10次重復為主,共15 411個,占總EST-SSR的57.99%;其次是11~20次重復,共10 125個,占總EST-SSR的38.10%;20次以上的重復較少,共1 038個,占總EST-SSR的3.91%。在已鑒定的SSR中,單核苷酸基序SSR最豐富(9 902,37.26%),其次是三核苷酸(8 238,31.00%)、二核苷酸(6 760,25.44%)、六核苷酸(838,3.15%)、五核苷酸(466,1.75%)和四核苷酸(370,1.39%)的基序SSR。
1. 結合; 2. 催化活性; 3. 轉(zhuǎn)運蛋白活性; 4. 結構分子活性; 5. 轉(zhuǎn)錄調(diào)節(jié)活性; 6. 分子功能調(diào)節(jié)活性; 7. 抗氧化活性; 8. 翻譯調(diào)節(jié)活性; 9. 分子換能器活性; 10. 其他; 11. 細胞解剖實體; 12. 細胞內(nèi); 13. 蛋白質(zhì)復合物; 14. 細胞過程; 15. 代謝過程; 16. 生物調(diào)節(jié); 17. 對刺激的反應; 18. 生物過程的調(diào)節(jié); 19. 定位; 20. 發(fā)育過程; 21. 信號傳導; 22. 多細胞生物過程; 23. 繁殖; 24. 繁殖過程; 25. 生物過程負調(diào)節(jié); 26. 生物過程正調(diào)節(jié); 27. 多生物過程; 28. 生物間的相互作用; 29. 增長; 30. 其他。1. Binding; 2. Catalytic activity; 3. Transporter protein activity; 4. Structural molecule activity; 5. Transcription regulator activity; 6. Molecular functional regulation activity; 7. Antioxidant activity; 8. Translation regulator activity; 9. Molecular transducer activity; 10. Other; 11. Cellular anatomical entity; 12. Intracellular; 13. Protein complex; 14. Cellular process; 15. Metabolic process; 16. Biological regulation; 17. Response to stimulus; 18. Regulation of biological process; 19. Localization; 20. Development process; 21. Signaling; 22. Multicellular organismal process; 23. Reproduction; 24. Reproductive process; 25. Negative regulation of biological process; 26. Positive regulation of biological process; 27. Multibiological processes; 28. Interspecies interaction between organisms; 29. Growth; 30. Other.圖 2 辣椒DEGs的GO注釋Fig. 2 GO annotation of hot pepper DEGs
1. 核苷酸代謝; 2. 聚糖生物合成和代謝; 3. 萜類和聚酮類的代謝; 4. 輔因子和維生素的代謝; 5. 其他氨基酸的代謝; 6. 能量代謝; 7. 其他次級代謝產(chǎn)物的生物合成; 8. 脂質(zhì)代謝; 9. 氨基酸代謝; 10. 碳水化合物代謝; 11. 全局和概覽圖; 12. 復制和修復; 13. 轉(zhuǎn)錄; 14. 折疊、分類和降解; 15. 翻譯; 16. 膜運輸; 17. 信號轉(zhuǎn)導; 18. 運輸和分解代謝; 19. 環(huán)境適應。1. Nucleotide metabolism; 2. Glycan biosynthesis and metabolism; 3. Metabolism of terpenoids and polyketides; 4. Metabolism of cofactors and vitamins; 5. Metabolism of other amino acids; 6. Energy metabolism; 7. Biosynthesis of other secondary metabolites; 8. Lipid metabolism; 9. Amino acid metabolism; 10. Carbohydrate metabolism; 11. Global and overview maps; 12. Replication and repair; 13. Transcription; 14. Folding, sorting and degradation; 15. Translation; 16. Membrane transport; 17. Signal transduction; 18. Transport and catabolism; 19. Environmental adaptation.圖 3 辣椒DEGs的KEGG注釋Fig. 3 KEGG annotation of hot pepper DEGs
表 3 單基因功能注釋Table 3 Function annotation of Unigene
從辣椒EST-SSR核苷酸的基序類型來看,EST-SSR以單核苷酸為主要類型,約9 902個,占總SSR的37.26%,其次是三核苷酸8 238個(31.00%)和二核苷酸6 760個(25.44%),三者共占檢測出的SSR總數(shù)的93.70%。在單核苷酸中,A/T是主要類型,占全部單核苷酸的95.58%,其次為三核苷酸,以TTG/CAA、ACA/TGT為主要類型,分別占三核苷酸SSR的18.10%、12.71%。在二核苷酸中, 以AG/CT、TC/GA、AT和TA的比例最高,占所有二核苷酸SSR的23.30%、21.02%、20.58%和17.25%。而四核苷酸、五核苷酸、六核苷酸3種核苷酸基序出現(xiàn)頻率均較低,三者一起共占SSR總數(shù)的6.30%。在四核苷酸中,以TTTA/TAAA、AATA/TATT和AAAT/ATTT的比例最高,分別占四核苷酸SSR的13.78%、10.27%和9.73%;在五核苷酸中,以ATGGT、ACTCA所占比例最高,各占五核苷酸SSR的6.01%和4.08%;在六核苷酸中,以GAAGAG、GAGCTG的數(shù)量最多,各占六核苷酸SSR的3.82%和3.10%(表5)。
表 4 辣椒EST-SSR的類型、數(shù)量及分布頻率Table 4 Type, number and distribution frequency of EST-SSR in hot pepper
表 5 辣椒EST-SSR基序的分布Table 5 Distribution of EST-SSR motif in hot pepper
使用Primer 3在線工具對含有SSR的21 008條EST序列設計了10 002對SSR引物。為驗證其有效性,隨機選擇30對引物進行合成,引物信息見表6,以‘大方皺椒’‘ZHC1’ 和‘ZHC2’ 3個辣椒材料的DNA進行PCR擴增與引物篩選。所挑選的全部引物均可擴增,由圖5可知,其中7對引物在3個辣椒材料中可以擴增出目的條帶,占挑選引物總數(shù)的23.33%,推測可用的EST-SSR數(shù)量有2 333對,可作為后續(xù)參考使用。引物分別為Unigene12971_All_10480、CL10067.Contig1_All_6591、CL10579.Contig2_All_6940、CL10070.Contig1_All_6593、CL10751.Contig1_All_7072、CL10564.Contig1_All_6936、CL10056.Contig8_All_6589。
通過植物RNA-seq技術可以獲取大量的轉(zhuǎn)錄本信息,這為植物基因表達的綜合分析提供了合理而可信的數(shù)據(jù)資源(賈新平等,2014)。因此,在淹水脅迫下辣椒轉(zhuǎn)錄組信息的系統(tǒng)分析為全面了解辣椒耐澇分子機制和挖掘新的耐澇基因奠定基礎。本研究對不同淹水時間的辣椒根系進行轉(zhuǎn)錄組測序,對數(shù)據(jù)組裝共獲得128 939個Unigene。把這些Unigene在NR、NT、SwissProt、KEGG、KOG、Pfam和GO數(shù)據(jù)庫中加以注釋,得到注釋Unigene共有116 057個,占總Unigene的90.01%,有12 882個Unigene沒有得到注釋。與其他植物相比(夏銘澤,2022;張小紅等,2023),在水澇脅迫下辣椒轉(zhuǎn)錄組測序獲得的基因數(shù)量及注釋效率均較高。組裝得到的Unigene不能在已知相關基因數(shù)據(jù)庫中得到注釋,這種現(xiàn)象是普遍存在的,這與所得部分Unigene片段太短、相關數(shù)據(jù)庫基因注釋信息缺乏、辣椒中存在新基因等因素都有關聯(lián)(張少平等,2016)。可以進一步研究未被注釋的基因,確定這些基因在植物生長發(fā)育過程中的作用,從而豐富基因數(shù)據(jù)庫(馬彥軍等,2020)。本研究在對DEGs進行KEGG注釋時,發(fā)現(xiàn)碳水化合物、氨基酸、脂質(zhì)等代謝注釋最多,其次為翻譯、折疊、遺傳信息分類和降解以及信號轉(zhuǎn)導。植物在受到水澇脅迫的時候,植物根系缺氧導致線粒體有氧呼吸受到極大抑制。碳水化合物代謝對植物存活至關重要,在此過程中,植物通過積累易利用糖類和額外丙酮酸等物質(zhì)以保持其能量供應。氨基酸代謝在植物應對非生物脅迫中發(fā)揮著重要作用(Hildebrandt et al., 2018)。其中,對脯氨酸的研究最為廣泛, 但其他氨基酸, 如支鏈氨基酸(亮氨酸、異亮氨酸和纈氨酸)也同樣重要(Huang et al., 2017),其氧化會產(chǎn)生大量的三磷酸腺苷(Hildebrandt et al., 2015);而丙氨酸和天冬氨酸在其相應氨基轉(zhuǎn)移酶作用下通過影響草酰乙酸的量而參與丙酮酸的再生,可以為植物逆境生存提供物質(zhì)與能量,這可能是‘ZHC2’辣椒耐澇性強的原因之一。在脂質(zhì)代謝過程中,耐缺氧型個體脂質(zhì)分解加強,其分解為甘油和游離脂肪酸。甘油可用于碳和能量供應以及不定根發(fā)育,而游離脂肪酸可為新生成的細胞提供成分。當辣椒受到水澇脅迫時,碳水化合物代謝可以產(chǎn)生足夠能量使植物維持多種生理生化反應,同時植物需要合成大量的酶來催化體內(nèi)的多種生理生化反應,將受到的刺激信號進行傳導,以便植物能產(chǎn)生應激反應來應對不良環(huán)境造成的影響。試驗將進一步對重要差異基因進行分析,篩選出與辣椒耐澇緊密相關的基因,并解釋辣椒耐澇的分子機制。
1-21. 點樣順序為Unigene12971_All_10480、CL10067.Contig1_All_6591、CL10579.Contig2_All_6940、CL10070.Contig1_All_6593、CL10751.Contig1_All_7072、CL10564.Contig1_All_6936、CL10056.Contig8_All_6589引物的擴增結果,每對引物中以‘ZHC1’‘ZHC2’‘大方皺椒’的順序點樣。M. DL2000 Marker。1-21. The orders of sampling are the amplification results of Unigene12971_All_10480, CL10067.Contig1_All_6591, CL10579.Contig2_All_6940, CL10070.Contig1_All_6593, CL10751.Contig1_All_7072, CL10564.Contig1_All_6936, CL10056.Contig8_All_6589 primers, respectively. Among each pair of primers, the samples are ‘ZHC1’, ‘ZHC2’ and ‘Dafangzhoujiao’, respectively. M. DL2000 Marker.圖 5 7對EST-SSR引物的擴增結果Fig. 5 Amplification results of seven pairs of EST-SSR primers
本研究發(fā)現(xiàn),26 574個SSR位點分布于128 939個辣椒無冗余Unigene中,EST-SSR出現(xiàn)頻率為20.61%,高于Yi等(2006)、劉峰等(2012)和魏兵強等(2013)的辣椒EST-SSR結果,低于蓖麻(Qiu et al., 2010)、木薯(Kunkeaw et al., 2011)、灰氈毛忍冬(劉思思等,2021)的EST-SSR結果,這可能是由物種間SSR信息的差異所造成的,也可能是因為用于分析的EST數(shù)量在不同物種間各不相同,或者用于搜索SSR所使用的軟件算法及所設定的參數(shù)不同(吳智明等,2012)。辣椒EST-SSR單核苷酸頻率最高(37.26%),其次是三核苷酸(31.00%)和二核苷酸(25.44%)。在辣椒單核苷酸EST-SSR中,絕大部分基元為A/T,這與魏兵強等(2013)和劉峰等(2012)的結果一致。在二核苷酸重復類型中,出現(xiàn)頻率最高的是AG/CT和TC/GA,其次是AT和TA,而GC/CG出現(xiàn)頻率低,這與Yi等(2006)、Kantety等(2002)和張宇等(2010)在辣椒上的研究結果基本一致,而且與珍珠粟(Selthilvel et al., 2008)、石蒜(李青竹等,2021)、蝴蝶蘭(張水明等,2012)和毛竹(張智俊等,2011)的結果相似,說明EST-SSR在其發(fā)生和進化過程中具有高度保守性。GA/TC在mRNA水平上可以代表遺傳密碼子GAG、AGA、UCU和CUC,并可以分別翻譯成精氨酸、谷氨酸、丙氨酸和亮氨酸,而丙氨酸和亮氨酸分別以8%和10%的高頻率存在于蛋白質(zhì)中,這可能是GA/TC在EST中高頻出現(xiàn)的原因(Kantety et al., 2002)。在三核苷酸中,出現(xiàn)頻率高的是TTG/CAA和ACA/TGT,這與Kumpatla等(2005)和Yi等(2006)對辣椒EST-SSR的研究結果相符合。但劉峰等(2012)研究認為,除單核苷酸A/T重復序列外,辣椒EST-SSR最多的是三核苷酸重復序列AAC/GTT和AAG/CTT,其次是二核苷酸重復序列。這可能是由SSR搜索標準(基序長度、重復次數(shù)等)、分析軟件及數(shù)據(jù)庫大小不同所造成。
在本研究中,共有6 018條SSR長度大于20 bp,占全部SSR總數(shù)的22.65%;20 556條SSR長度介于12~19 bp之間,占所有SSR總數(shù)的77.35%,說明辣椒EST-SSR具有較好的多態(tài)性(Temnykh et al., 2001),這與盛文濤等(2019)的研究結果基本一致,可用于辣椒分子標記研究。根據(jù)26 574條EST序列設計了10 002對SSR位點特異性引物,從中隨機挑選了30對引物進行PCR驗證,都可以實現(xiàn)有效擴增,較大的數(shù)據(jù)量和較高的拼接質(zhì)量應是EST擴增效率高的原因。在30對擴增引物中,有7對(23.3%)引物在3份辣椒中表現(xiàn)出多態(tài)性,低于李永平等(2016)的研究結果(35.5%),其原因可能與本研究所選用的3份辣椒材料均為貴州地方品種,并且‘ZHC1’和‘ZHC2’為朝天椒,材料間的遺傳背景差異小有關。EST-SSR來自基因組轉(zhuǎn)錄區(qū),而轉(zhuǎn)錄區(qū)的序列通常比較保守。因此,一般來講,EST-SSR所檢測到的多態(tài)性要低于基因組SSR。多態(tài)性檢測能力的大小也與所測試的植物材料有關,如果所用的植物材料遺傳背景差異較大,則標記檢測的多態(tài)性就高,反之,則標記的多態(tài)性就會大大降低。應用EST-Genome、Phrap、Clustalw、BLAST等軟件對EST序列進行精確分析以增加供試材料的基因型與數(shù)量是提高EST-SSR標記多態(tài)性和價值性的有效途徑(張宇等,2010)。因為EST-SSR是對基因內(nèi)部變異的一種直接評價,所以它將可能與某些表型、生理生化特征或某個特定的環(huán)境適應型相聯(lián)系,反映植物基因表達的轉(zhuǎn)錄部分(姚利華等,2008)。挑選的EST-SSR標記可用于遺傳多樣性分析與分子標記輔助育種。由于其豐富的多態(tài)性信息含量,因此EST-SSR可為遺傳連鎖圖譜構建等奠定基礎。下一步可尋找與辣椒耐澇基因連鎖的EST-SSR標記,以應用于辣椒耐澇育種研究。