国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

甜菜基因組SSR標(biāo)記特征分析

2019-10-23 10:06董玉飛劉乃新吳玉梅
中國(guó)甜菜糖業(yè) 2019年3期
關(guān)鍵詞:基序甜菜核苷酸

劉 蕊,董玉飛,劉乃新,吳玉梅

(1.黑龍江大學(xué)農(nóng)作物研究院,哈爾濱 150080; 2.東北林業(yè)大學(xué)園林學(xué)院,哈爾濱 150080;3.青海大學(xué) 農(nóng)牧學(xué)院/青海省農(nóng)林科學(xué)院 土壤肥料研究所,西寧 810016;4.黑龍江大學(xué)生命學(xué)院,哈爾濱 150080)

1 引 言

甜菜(Beta vulgaris L.)是溫帶地區(qū)重要的蔗糖作物,約占全球制糖產(chǎn)量的25%[1-2]。它也是生物燃料[3], 天然色素,食用植物和動(dòng)物飼料的重要來(lái)源。近年來(lái),作為觀賞植物的甜菜在園林配置中得到越來(lái)越多的應(yīng)用。它屬于石竹目莧科,石竹目由11510種植物組成,包括仙人掌、冰植物、其他耐旱物種[4]。到目前為止,除了甜菜以外,沒(méi)有其他的石竹目植物被測(cè)序。它是一個(gè)具有18條染色體的二倍體物種,估計(jì)基因組大小為714-758 MB[4-5]。

目前,我國(guó)每年通過(guò)鑒定/認(rèn)證6~10個(gè)甜菜品種,生產(chǎn)用甜菜品種多為國(guó)外雜交品種。品種登記是基于獨(dú)特性、一致性和穩(wěn)定性(DUS)的研究[6]。傳統(tǒng)的基于表型特征的甜菜品種鑒別方法存在諸多局限性。例如,需要調(diào)查的性狀太多;評(píng)價(jià)周期太長(zhǎng),許多表型性狀容易受到環(huán)境因素的影響;由于遺傳基礎(chǔ)狹窄,品種在外觀上非常相似[7-8]。因此,通過(guò)對(duì)形態(tài)特征的目視檢查來(lái)評(píng)估不同的甜菜品種并不容易[6]。目前通過(guò)分子標(biāo)記方法是確定不同的甜菜品種的最佳方式。

植物分子標(biāo)記技術(shù)在植物學(xué)研究中得到了廣泛的應(yīng)用[9]。微衛(wèi)星,或簡(jiǎn)單序列重復(fù)(SSRs),是在原核生物和真核生物基因組中普遍存在的1-6個(gè)核苷酸的短而重復(fù)的DNA序列[10-12]。 SSR標(biāo)記廣泛用于基因連鎖圖譜的構(gòu)建[13-15],評(píng)價(jià)基因多樣性[16-17], 標(biāo)記輔助育種[18-19],群體基因分析[19-21], 及進(jìn)化研究[22]。 它具有許多優(yōu)勢(shì),如共顯性、豐富和隨機(jī)分布在基因組內(nèi)、可生產(chǎn)和高度多態(tài)性[23-24]。此外,隨著高通量測(cè)序技術(shù)的發(fā)展,越來(lái)越多的基因組序列已經(jīng)發(fā)表,我們只需要在包含這些序列信息的數(shù)據(jù)庫(kù)中檢索SSR兩側(cè)的保守核苷酸序列,然后根據(jù)這些保守序列設(shè)計(jì)引物[25]。該方法具有操作簡(jiǎn)單、經(jīng)濟(jì)、可操作性強(qiáng)、覆蓋率高等特點(diǎn),已成為SSR引物研制的主要途徑[26]。

本研究分析了甜菜基因組中SSR基因的分布,開(kāi)發(fā)了SSR引物,為甜菜本身或相關(guān)物種的遺傳分析提供了有價(jià)值的標(biāo)記。

2 材料和方法

2.1 基因組SSR位點(diǎn)的搜索

甜菜參考基因組序列以fasta格式從NCBI數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov)下載。利用Perl語(yǔ)言環(huán)境下的misa軟件(http://pgrc.ipk-gatersleben.de/misa/)搜索全基因組ssr位點(diǎn)。搜索參數(shù)設(shè)置如下:所搜索的二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重復(fù)次數(shù)分別為6、5、5、5和5次。兩個(gè)SSR序列之間的最小間隔值為100 bp。

2.2 電子PCR引物設(shè)計(jì)

電子聚合酶鏈反應(yīng)(E-PCR)是通過(guò)計(jì)算來(lái)搜索基因組序列中的SSR位點(diǎn),每一個(gè)位點(diǎn)都由一對(duì)引物序列和預(yù)期的PCR產(chǎn)物大小決定[27]。采用電子PCR軟件(https://www.ncbi.nlm.nih.gov/tools/epcr/)設(shè)計(jì)甜菜基因組中模擬的PCR引物,并采用Perl腳本統(tǒng)計(jì)產(chǎn)品編號(hào)。

2.3 基因功能注釋

使用Agrigo(http://bioinfo.cau.edu.cn/agrigo/)執(zhí)行包含SSR位點(diǎn)的GO(基因本體)注釋?zhuān)裱到y(tǒng)默認(rèn)設(shè)置。

3 結(jié)果

3.1 甜菜SSR基因座的豐度和相對(duì)豐度

從整個(gè)基因組水平上分析,甜菜基因組中共計(jì)174218個(gè)SSR 位點(diǎn),其中二核苷酸至六核苷酸重復(fù)基序的豐度即重復(fù)基序的數(shù)量分別為35496個(gè)(占 SSR 位點(diǎn)總數(shù)的20.37%)、55396個(gè)(31.80%)、3482 個(gè)(2.00%)、58043個(gè)(33.32%)和 21801個(gè)(12.51%),SSR 位點(diǎn)相對(duì)豐度即SSR位點(diǎn)平均發(fā)生率為 463個(gè)/Mb,二核苷酸至六核苷酸重復(fù)基序的相對(duì)豐度分別為94.26,147.10,9.25,154.13,57.89。逐條染色體分析可知,二核苷酸至六核苷酸重復(fù)基序在染色體水上豐度的平均值分別為 3944.00,6155.11,386.89,6449.22,2422.33,最大、最小者分別為 6號(hào)(29180)和 3號(hào)染色體(13468);二核苷酸至六核苷酸重復(fù)基序的在染色體水平上的相對(duì)豐度平均值分別為94.26,147.11,9.25,154.14,57.90,SSR 位點(diǎn)相對(duì)豐度最大及最小者分別為3號(hào)(506.74)和 2號(hào)染色(395.61)。二核苷酸至六核苷酸重復(fù)基序豐度最大者均為6號(hào)染色體,具體數(shù)值依次為6733,9045,604,9217,3581;三核苷酸、五核苷酸、六核苷酸重讀豐度基序最小者均為3號(hào)染色體,數(shù)量分別為552、4078、4925、1551個(gè),二核苷酸重復(fù)豐度基序最小為二號(hào)染色體425個(gè),四核苷酸豐度基序最小為三號(hào)和四號(hào)染色體,均為277個(gè)。

表1 甜菜基因組SSR的類(lèi)型,數(shù)量及分布頻率Tabl.1 Type, number, distribution frequency and abundance of SSR in Sugar beet

SSR豐度/相對(duì)豐度(每Mb總重復(fù)數(shù))。

3.2 甜菜SSR類(lèi)型和頻率特征

從SSR的基序來(lái)看,甜菜基因組共包含1,596種重復(fù)基元。二至六核苷酸重復(fù)分別有8,30,89和290種。每種基序的分布并不平均。二核苷中(TA/TA)n和(AT/AT)n占的比率最高,分別占二核苷酸類(lèi)型基序總數(shù)的40.59% 和33.65%。三核苷酸中,(AAT/ATT)n,(TAA/TTA)n和(ATA/TAT)n為最多,分別占了 22.51% , 18.01%和16.50%。 四核苷酸基序分布則較為均勻,分布做多的為(ATAA/TTAT)n和(AAAT/ATTT)n,分別占了7.94%和6.91%(圖1)。

圖1 全基因組中top15 SSR motif的數(shù)目Fig.1 Number of the top15 SSR motif within whole genome

3.3 SSR引物的電子PCR(e-pcr)

本研究從NCBI收集到322對(duì)已知引物(https://www.ncbi.nlm.nih.gov/probe),在染色體密度為1.2對(duì)/MB,且在染色體上分布并不均勻(圖3)。為了增加SSR引物在染色體上密度,我們針對(duì)新預(yù)測(cè)的SSR位點(diǎn)開(kāi)發(fā)27,649對(duì)引物。并通過(guò)電子PCR檢驗(yàn)引物的準(zhǔn)確性。電子PCR結(jié)果顯示,多數(shù)引物(n=18,271)可以在甜菜基因組特異性擴(kuò)增。甜菜基因組中能夠產(chǎn)生0、1、2、3和大于3個(gè)產(chǎn)物的SSR引物數(shù)目分別為0 (0.0%)、18271 (66.1%)、2387 (8.6%)、1033(3.7%)和5958(21.6%)對(duì)。平均每對(duì)SSR引物能夠產(chǎn)生18個(gè)電子PCR產(chǎn)物,這是由于SSR所在區(qū)域?yàn)楦叨戎貜?fù)序列。另外,有24027(86.9%)對(duì)引物產(chǎn)生了不多于10個(gè)的擴(kuò)增產(chǎn)物(圖2)。

圖2 不同規(guī)模的e-PCR產(chǎn)物的平均數(shù)量Fig.2 Average number of in e-PCR products based on different scales

SSR引物中利用價(jià)值較高的是那些在基因組中的位置已知且產(chǎn)物特異的引物。甜菜基因組上設(shè)計(jì)出的27649對(duì)引物中,挑選出特異性引物18271對(duì)引物定位在甜菜基因組上,平均每Mb序列有48.52對(duì)引物。9條染色體中Chr3上引物的密度最高,為55.76對(duì)每Mb,其次是Chr4和Chr2,分別為每Mb序列50.78對(duì)和49.09對(duì);密度最低的是Chr9上,為45.83對(duì)引物每Mb(表2,圖3),與NCBI數(shù)據(jù)庫(kù)登入的SSR引物相比較,本研究將甜菜SSR分子標(biāo)記在染色體的密度提高了37倍。

紅色:下載自NCBI引物;綠色:本研究新開(kāi)發(fā)的引物圖3 引物在9條染色體上的分布Fig.3 Distribution of primer across nine chromosome

染色體編號(hào)Chromosome No.染色體長(zhǎng)度(Mb)Chromosome length (Mb)標(biāo)記數(shù)量Marker number標(biāo)記密度Marker densityChr134.941,67247.85Chr240.391,98349.09Chr326.581,48255.76Chr433.021,67750.78Chr552.462,51747.98Chr660.962,96648.65Chr744.152,05546.54Chr838.801,84447.53Chr945.272,07545.83

3.4 基因SSR的鑒定和注釋

為了闡明開(kāi)發(fā)的SSR標(biāo)記所在基因的潛在功能。我們將SSR motif位置與蛋白質(zhì)編碼基因的位置進(jìn)行了比較。發(fā)現(xiàn)有5,169(28.29%)引物位于蛋白質(zhì)編碼基因內(nèi),對(duì)應(yīng)5,137個(gè)蛋白質(zhì)編碼。通過(guò)對(duì)這些基因進(jìn)行GO (Gene Ontology)功能注釋分析,我們發(fā)現(xiàn)這些基因主要涉及了cellular process ,metabolic process以及response to stimulus,表明所開(kāi)發(fā)的標(biāo)記可能與功能基因位點(diǎn)連鎖。

圖4 含SSR蛋白編碼基因的功能注釋Fig.4 Functional annotation of protein-coding genes containing SSR

4 討論

4.1 甜菜全基因組SSR的分布

甜菜中相鄰兩個(gè)SSR位點(diǎn)的平均距離為2.21 kb,即463 SSR/Mb。在以前的研究中,擬南芥相鄰SSR位點(diǎn)之間的平均距離為1.4 kb[28],水稻是 3.6 kb[29], 在木荷中為1.54 kb[30]。這種差異可能是由于SSR搜索標(biāo)準(zhǔn)、數(shù)據(jù)庫(kù)大小和物種[31]、以及含有微衛(wèi)星的基因的表達(dá)豐度[32]。不同物種之間SSR主要重復(fù)類(lèi)型有所差異,很多植物的SSR主要以二核苷酸、三核苷酸重復(fù)單元類(lèi)型為主[33]。本研究發(fā)現(xiàn),甜菜基因組SSR重復(fù)基元類(lèi)型主要以五核苷酸為主,占全部 SSR的 33.32%,其次是三核苷酸,占全部SSR的31.80%。甜菜基因組中存在大量長(zhǎng)重復(fù)基序,表明其在生物進(jìn)化與分類(lèi)地位中處于相對(duì)較低的進(jìn)化水平[34-35]。

本研究發(fā)現(xiàn)二核苷酸對(duì)四核苷酸堿基有一定的偏好。甜菜基因組中的二核苷酸重復(fù)基序大部分是TA/TA重復(fù)基序(40.59%),這與前人的研究相似[36-37]。相反,由于保持熱力學(xué)穩(wěn)定性的必要性,CG重復(fù)次數(shù)顯著減少[38]。相反CG的含量很少,可能是由于較少的GC是維持熱力學(xué)穩(wěn)定必須的因素。三核苷酸重復(fù)基序(AAT/ATT)n,(TAA/TTA)n和(ATA/TAT)n為最多,分別占了 22.51% , 18.01%和16.50%。從以上分析得知,二核苷酸和三核苷酸重復(fù)基序均富含A和T,這與 Tóth 等對(duì)多種真核生物基因組 SSR 位點(diǎn)的研究結(jié)果相一致,可能是由于甲基化的 C 殘基轉(zhuǎn)變?yōu)?T 所致[39]。另一個(gè)原因是破壞a/t堿基對(duì)之間氫鍵的能量低于G/C堿基對(duì)之間的氫鍵,并且A/T比G/C波動(dòng)更容易[40]。

4.2 甜菜全基因組SSR多態(tài)性潛力分析

迄今為止,甜菜中可用的分子標(biāo)記物很少。本研究共鑒定出174218個(gè)SSR位點(diǎn),頻率高,類(lèi)型豐富。在新設(shè)計(jì)的27,649對(duì)引物中,18271對(duì)(66.08%)可特異性擴(kuò)增。所制備的每一個(gè)SSR引物的平均電子PCR產(chǎn)物為18個(gè),表明甜菜基因組中存在大量的SSR,具有較高的PCR效率、多態(tài)性和較好的實(shí)用性。在下一步中,我們應(yīng)該鑒定出擴(kuò)增產(chǎn)物穩(wěn)定、條帶清晰、多態(tài)性高的SSR引物,這些引物對(duì)于豐富甜菜品種、加快遺傳資源利用、建立甜菜種質(zhì)評(píng)價(jià)和改良體系、重要性狀的基因挖掘和遺傳多樣性分析具有重要價(jià)值。

4.3 SSR與生物過(guò)程的關(guān)系

基因本體(GO)旨在定義已知基因在分子、細(xì)胞和有機(jī)體水平上的功能[41]。Go數(shù)據(jù)庫(kù)包括三個(gè)相對(duì)獨(dú)立的本體,分別描述cellular component, molecular function 和biological process[42-43]。本研究中,含SSR的蛋白質(zhì)編碼基因參與了甜菜的細(xì)胞過(guò)程、代謝過(guò)程、生物調(diào)控、對(duì)刺激的反應(yīng)和生物進(jìn)程的調(diào)控等生物學(xué)過(guò)程。本研究為進(jìn)一步研究甜菜生長(zhǎng)發(fā)育過(guò)程中表達(dá)的重要基因以及甜菜基因的克隆和功能分析提供了標(biāo)志性依據(jù)。

猜你喜歡
基序甜菜核苷酸
單核苷酸多態(tài)性與中醫(yī)證候相關(guān)性研究進(jìn)展
徐長(zhǎng)風(fēng):核苷酸類(lèi)似物的副作用
帶TRS基序突變的新型冠狀病毒威脅更大
NaV1.5鈉通道C末端IQ基序的重組質(zhì)粒構(gòu)建及蛋白制備
芥藍(lán)Aux/IAA家族基因生物信息學(xué)與表達(dá)分析
辣椒甜菜,各有所愛(ài)
當(dāng)食物成為藝術(shù)創(chuàng)作的燃料
通過(guò)合成生物學(xué)可改造非豆科植物進(jìn)行固氮(2020.8.8 iPlants)
甜菜咋喂豬
Acknowledgment to reviewers—November 2018 to September 2019
长治市| 太原市| 景谷| 措勤县| 柳河县| 龙州县| 台安县| 潜江市| 台湾省| 扎赉特旗| 郯城县| 抚宁县| 鄄城县| 高要市| 西昌市| 南投县| 康保县| 抚顺县| 科技| 大名县| 娱乐| 金堂县| 远安县| 义乌市| 苗栗县| 昌宁县| 恩平市| 鄂伦春自治旗| 阳城县| 清涧县| 栖霞市| 汉沽区| 厦门市| 绥阳县| 邯郸县| 孟州市| 隆子县| 岗巴县| 青川县| 陇南市| 叙永县|