包國媛, 王雅瓊,2,3,4, 李文辛
(1.青海民族大學生態(tài)環(huán)境與資源學院, 西寧 810007;2.青海省生物技術與分析測試重點實驗室, 西寧 810007;3.青海省特色經(jīng)濟植物高值化利用重點實驗室, 西寧 810007;4.青藏高原資源化學與生態(tài)環(huán)境保護國家民委重點實驗室, 西寧 810007)
甜菜(Betavulgaris)、菠菜(Spinaciaoleracea)和藜麥(ChenopodiumquinoaWilld.)均屬于藜科植物,具有較高的食用及藥用價值。甜菜是我國主要的糖料作物,在我國東北、西北和華北的干旱、半干旱地區(qū)廣泛種植[1],富含氨基酸、脂肪、蛋白質、維生素、礦物質和膳食纖維等營養(yǎng)成分[2]。甜菜可以用來榨汁、做湯菜、做果漿和制做腌菜,在歐美的一些國家甜菜備受歡迎,但是在我國由于宣傳力度較低,市場上的相關產品也很少見到[3]。甜菜中含多種生物活性成分,在肝臟損傷、心血管疾病、糖尿病、癌癥等疾病的預防和治療中具有重要的藥用價值[3]。甜菜中的甜菜紅素可以作為有效的炎癥因子清除劑,治療由過量次氯酸引起的炎癥[4]。也有學者通過臨床試驗發(fā)現(xiàn)甜菜紅素有助于心血管疾病的治療[5]。菠菜是常見的蔬菜,它富含黃酮類、酚類、甾體類等多種生物活性成分;菠菜中含有少量的生物堿、皂苷、糖類等化學成分,它的提取物在抗氧化、抗腫瘤、抗炎、抗高血脂、降糖等方面有良好的效果[6]。是一種一年生植物,起源于安第斯地區(qū),在世界范圍內種植廣泛[7]。具有較高的非生物脅迫耐受性和較高的營養(yǎng)含量,被認為是一種具有重要價值的作物[8-10]。不僅富含優(yōu)質蛋白質、多糖和不飽和脂肪酸等大量營養(yǎng)素,而且含有維生素、礦物質等微量營養(yǎng)素,同時,還含有多種生物活性物質,包括皂苷、多酚類、黃酮類、甜菜堿、植物甾醇等,被譽為“全營養(yǎng)食品”[11]。
植物光合作用的主要場所是葉綠體[12],葉綠體基因組結構簡單、分子量小、拷貝多且有高度保守性,在不同物種之間或同一物種不同個體間存在著一定的局部區(qū)域的變異[13]。葉綠體是植物細胞內最重要、最普遍的質體[14]。葉綠體基因組是一個環(huán)狀的四分體結構,包括大單拷貝區(qū)(Large Single-copy Region,LSC)、小單拷貝區(qū)域(Small Single-copy Region,SSC)和反向重復區(qū)(Inverted Repeat,IR),2個IR區(qū)被LSC和SSC隔開,它們的長度雖然相等、但是方向相反[15-16]。其中最早獲得葉綠體基因組的植物是地錢(Marchantiapolymorpha)[17]和煙草(Nicotianatabacum)[18]。目前葉綠體基因組主要用于近緣植物鑒定、DNA條形碼、植物的系統(tǒng)發(fā)育及遺傳進化分析等方面[19-20]。
重復序列(Repetitive sequence)是指在整個基因組中以多個拷貝出現(xiàn)的核酸序列[21],包括簡單重復序列(cpSSR)和散在重復序列(cpIRS)。微衛(wèi)星標記(Microsatellite Makers)又被稱為短串聯(lián)重復序列(Short Tandem Repeats,STRs)或簡單重復序列(Simple Sequence Repeats,SSR),是一種以特異引物PCR為基礎的分子標記技術,一般由1~6個核苷酸為重復單位組成的小于200 bp的串聯(lián)重復序列。SSR廣泛存在于真核、原核及病毒的基因組中,其多態(tài)性高對基因組的覆蓋性好[22]。葉綠體微衛(wèi)星(cpSSR)是基于葉綠體基因組開發(fā)的一種標記,作為一種新的分子標記手段兼具葉綠體基因(cpDNA)和微衛(wèi)星標記(SSR)的優(yōu)點,廣泛應用于遺傳多樣性、群體遷移、遺傳圖譜和進化等方面[23]。重復序列在基因組不同區(qū)域具有明顯的差異,參與不同區(qū)域基因的表達與調控,生物能夠穩(wěn)定遺傳和進化與重復序列的存在具有很重要的關系[24]。
目前對于甜菜及其近緣類群的研究多集中在育種栽培、有效成分及生物活性的研究等方面,在葉綠體基因組層面的研究鮮有報道。本研究采用cpSSR技術對甜菜及其近緣類群葉綠體全基因組重復序列進行分析,為甜菜品種的選育、遺傳多樣性研究、系統(tǒng)發(fā)育的研究以及分子育種提供數(shù)據(jù)基礎。
從NCBI的GenBank數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov)篩選并下載甜菜、菠菜、藜麥、黎、豬毛菜和稻的葉綠體全基因組序列進行分析(表1)。
表1 甜菜及其近緣類群葉綠體全基因組序列分析
基于甜菜及其近緣類群葉綠體全基因組序列的注釋文件,使用在線細胞器基因組繪圖軟件Chloroplot(https://irscope.shinyapps.io/Chloroplot/;2022-11-22)[25]繪制甜菜及其近緣類群的葉綠體基因組物理圖譜,參數(shù)設置為:直接展示大單拷貝區(qū)、小單拷貝區(qū)域和反向重復區(qū)的相對大小與位置;使用不同的顏色表示所有類別基因;使用較深的顏色表示序列或基因的GC含量,較淺的同色表示AT含量;其他參數(shù)取默認值。
使用軟件MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)搜索甜菜cpSSR位點并分析其特征。參數(shù)設置如下:單堿基重復8次及以上;二堿基重復5次及以上;三堿基重復4次及以上;四堿基、五堿基和六堿基重復3次及以上;復合SSR 2個位點間最大間隔堿基數(shù)小于等于100;統(tǒng)計cpSSR分布區(qū)域;基于cpSSR的堿基類型,統(tǒng)計不同重復類型的序列長度和個數(shù),并計算數(shù)量、比例以及豐度信息。將MISA所得的結果上傳在線生信云平臺,使用其中的“MISA結果注釋軟件”(http://112.86.217.82:9919/#/tool/alltool/detail/283)基于甜菜葉綠體基因組的注釋文件對甜菜cpSSR進行注釋,注釋的結果即為cpSSR與基因的位置關系以及cpSSR在葉綠體全基因組上所處的四分體區(qū)域。
使用REPuter軟件對甜菜葉綠體基因組散在重復序列進行分析,參數(shù)設置:最小長度30 bp,海明距離(Hamming Distance)設為 3,鑒定類型為F、R、P、C。使用在線生信云平臺的“REPuter 結果注釋”軟件注釋REPuter的檢索結果。
使用MISA和REPuter軟件以上文相同的參數(shù)分析菠菜、藜麥、黎、豬毛菜和稻的葉綠體基因組重復序列,并與甜菜的葉綠體基因組重復序列進行比較分析。
葉綠體基因組物理圖譜的繪制實現(xiàn)了甜菜及其近緣類群葉綠體基因組特征的可視化(圖1):甜菜及其近緣類群葉綠體基因組全長分別為149 722 bp、150 725 bp和152 079 bp都是典型的四分體環(huán)狀結構,均由一個大單拷貝區(qū)(LSC:83 110 bp、82 719 bp、83 551 bp),一個小單拷貝區(qū)(SSC:17 793 bp、17 860 bp、18 118 bp)和一對反向重復序列(IRs:24 410 bp、25 073 bp、25 205 bp)組成。基因序列長度在基因組上的占比遠大于基因間隔區(qū),可視化的圖譜有利于查看重復序列等特殊序列的相對分布情況。
注:A為甜菜;B為菠菜;C為藜麥。
利用MISA軟件[26]對總長為149 722 bp、150 725 bp和152 079 bp的甜菜及其近緣類群葉綠體全基因組微衛(wèi)星進行分析,分別識別出195個,171個,154個cpSSR,平均每767.8 bp、881.4 bp及987.5 bp出現(xiàn)一個微衛(wèi)星。其中分別有132個、118個及101個位點分布在 LSC區(qū),該區(qū)域占SSR總位點的67.69%,69.0%及65.58%;分布在SSC區(qū)的位點分別有35個、31個及33個,占SSR位點的17.95%,18.24%及21.42%;IR區(qū)分布有28,22,20個位點,占比為14.36%,12.94%及12.98%(表2)。
表2 甜菜及其近緣類群cpSSR特征分析
甜菜的195個cpSSR中,包含179個單堿基重復序列(91.8%),6個二堿基重復序列(3.1%),1個三堿基重復序列(0.5%),8個四堿基重復序列(4.1%),1個五堿基重復序列(5.1%)。在單堿基中T基序重復最多(92個,50.8%),其次為A基序(83個,46.4%),C和G占比較少(各2個,1.1%);在二堿基中為TA/AT重復(4個,2個,66.7%,33.3%);三堿基重復序列為AAT/ATT(1個,100%);四堿基重復序列為AAAG/CTTT、AAGG/CCTT、AATT/AATT(各1個,12.5%)以及AAAT/ATTT、ACCT/AGGT重復(各2個,25%);五堿基重復序列為AAATT/AATTT(1個,100%),沒有六堿基重復序列組成的cpSSR。甜菜的cpSSR總豐度為1 302.4個/Mb,在各類型重復序列中單堿基重復序列的豐度最高,為1 195.5個/Mb,五堿基重復序列的豐度最低,為6.68個/Mb。在菠菜的171個cpSSR中,其中最多的是單堿基重復(146個,85.3%),在單堿基中T基序重復最多(81個,55.5%),其次為A基序(64個,43.8%);菠菜的cpSSR總豐度為1 134.4個/Mb,其中單堿基重復序列的豐度最高為968.7個/Mb。藜麥的154個cpSSR中,出現(xiàn)了同樣的情況,最多的也是單堿基重復(138個,89.6%),同樣也出現(xiàn)了T基序重復最多(81個,58.7%),豐度最高的為單堿基重復序列907.4個/Mb(表3)。
本研究中,甜菜cpSSR的平均長度為9.3 bp。cpSSR長度區(qū)間在8~21 bp之間分布廣泛,最長為21 bp,最短為8 bp。從總體來看,甜菜及近緣類群分布在8~12 bp占比最多(500個,96.3%),13~21 bp占比較少(19個,8.7%)。其中長度為8 bp的SSR占比最多(225個,45%)(圖2)。
圖2 微衛(wèi)星長度分布
甜菜及其近緣類群cpSSR中單堿基重復序列的基序拷貝數(shù)分布最廣,在8~21 bp 均有分布。A基序出現(xiàn)了單一最高拷貝數(shù)(21個,12個,13個);甜菜及近緣類群的基序多數(shù)為單堿基(179個,146個,138個);拷貝數(shù)與序列個數(shù)總體呈負相關,隨著拷貝數(shù)的增加基序數(shù)量減少(圖3)。
通過REPuter軟件[27]在甜菜葉綠體基因組中共檢測到2種重復序列類型,共有50個cpIRS,包括26個F型和24個P型,沒有檢測到其他重復類型的cpIRS。最長的序列為17 011 bp,最短為30 bp,它們都在甜菜葉綠體基因組的LSC區(qū)。在菠菜和藜麥葉綠體基因組中檢測到1種重復類型,均為F型,菠菜中有13個cpIRS,藜麥中有25個cpIRS(表4~表6)。
表4 甜菜葉綠體基因組中的cpIRS
表5 菠菜葉綠體基因組中的cpIRS
表6 藜麥葉綠體基因組中的cpIRS
對模式植物水稻及同科植物菠菜、藜麥、黎和豬毛菜的簡單重復序列進行比較分析。結果(表7)顯示,cpSSR位點數(shù)分別為111,171,154,163,236個,同科植物及模式植物都以單堿基A/T重復為主,并且占比最大;其中豬毛菜葉綠體基因組中檢測到的重復序列最多,在水稻葉綠體基因組中檢測到的重復序列最少。
表7 不同植物不同重復類型統(tǒng)計
與同科植物以及模式植物進行散在重復序列比較分析,結果(圖4)顯示,所有物種都有F型和P型;其中甜菜的F型最多(26個),菠菜的最少(13個),P型的水稻中最多。
圖4 不同植物cpIRS比較分析
甜菜及其近緣類群都屬于黎科,具有較高的食用和藥用價值。本研究在全長為149 722 bp的甜菜的葉綠體基因組中共檢測到195個SSR位點,平均每隔767.8 bp出現(xiàn)一個SSR位點。在同科植物菠菜、藜麥、黎、豬毛菜及水稻中分別識別出171,154,163,236,111個SSR位點,說明甜菜的SSR密度要小。位點的長度與多態(tài)性潛能有著一定的關系,當SSR長度大于等于20 bp 時,多態(tài)性就比較高[28]。甜菜及其近緣類群中長度為8~12 bp的較多,最長的為21 bp,大于等于20 bp的總共出現(xiàn)了2個位點。
SSR 位于基因上或位于基因間隔區(qū),基因序列長度在基因組上的占比遠大于基因間隔區(qū),但是在本研究中發(fā)現(xiàn)SSR 在基因間隔區(qū)和內含子區(qū)的數(shù)量大于基因組中基因上的數(shù)量。因此,可能推測SSR是比較容易變異,基因間隔區(qū)往往是更加保守的。
甜菜及其近緣類群的cpSSR中單堿基重復序列占比最大。在同科物種及模式植物中也出現(xiàn)了單堿基重復A/T基序占比大的情況。在不同物種中對狗棗獼猴桃的葉綠體微衛(wèi)星特征進行了分析,也出現(xiàn)了相同的情況[29]。甜菜的cpSSR總豐度為1 302.4個/Mb,在各類型重復序列中單堿基重復序列的豐度最高,為1 195.5個/Mb,五堿基重復序列的豐度最低,為6.68個/Mb。菠菜的cpSSR總豐度為1 134.4個/Mb,其中單堿基重復序列的豐度最高,為968.7個/Mb。藜麥的154個cpSSR中,出現(xiàn)了同樣的情況,豐度最高的也是單堿基重復序列907.4個/Mb。
甜菜葉綠體基因組中共檢測到2種重復序列類型,包括26個F型和24個P型,沒有檢測到其他重復類型的散在重復序列。在菠菜和藜麥葉綠體基因組中檢測到1種重復類型,均為F型,菠菜中有13個cpIRS,藜麥中有25個cpIRS。甜菜的重復序列大都位于LSC區(qū),這表明重復序列可能與光合作用有關,這與王文斌等[30]的研究結果一致。
本研究對甜菜的cpSSR和cpIRS進行分析,并與黎科植物和模式植物進行了比較分析,為進一步研究甜菜種質資源鑒定與遺傳多樣性的研究提供了理論依據(jù)。