国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人參果轉(zhuǎn)錄組測序的SSR和SNP特征分析

2020-02-25 09:44陳姝欣朱浩東楊夢(mèng)思陶連德鐘啟文楊世鵬
關(guān)鍵詞:基元人參果核苷酸

陳姝欣,朱浩東,楊夢(mèng)思,陶連德,鐘啟文,楊世鵬

(青海大學(xué)農(nóng)林科學(xué)院,青海省蔬菜遺傳與生理重點(diǎn)實(shí)驗(yàn)室,青海大學(xué),青海 西寧 810016)

【研究意義】人參果(Solanummuricatum)又被稱為香瓜茄,是一種原產(chǎn)于南美洲的多年生茄科草本植物。成熟后的人參果果皮底色為玉白色或者金黃色,大部分的人參果皮上有紫色花紋,果肉金黃[1],是一種漿果類作物,不僅可以作為一種觀賞植物,且味道清甜,無酸澀感,微量元素極其豐富,特別是硒[2],而且富含維生素,對(duì)于其他水果而言具有相對(duì)較高的營養(yǎng)價(jià)值?!厩叭搜芯窟M(jìn)展】目前國內(nèi)未見人參果分子領(lǐng)域研究的報(bào)道,相關(guān)分子標(biāo)記的研究還尚在標(biāo)記開發(fā)的階段。SSR是一種微衛(wèi)星序列,主要由一到六個(gè)核苷酸的重復(fù)構(gòu)成[3]。其兩端的序列是兩段非常保守的序列,若將這2個(gè)側(cè)翼序列作為這段微衛(wèi)星序列的引物,就可擴(kuò)增出中間的重復(fù)序列,而這段微衛(wèi)星序列重復(fù)單元之間的數(shù)目通常是具有較大差異的,存在著豐富的多態(tài)性[4]。SNP標(biāo)記和SSR標(biāo)記的區(qū)別在于SNP是指單個(gè)堿基的變異,例如堿基的缺失、轉(zhuǎn)換等。最近幾年高通量測序技術(shù)發(fā)展十分昌盛,這也使得SSR及SNP技術(shù)發(fā)展迅猛,這2種分子標(biāo)記技術(shù)由于其方便快捷的特點(diǎn),已經(jīng)被廣泛地應(yīng)用于親緣關(guān)系、指紋圖譜的構(gòu)建等多個(gè)領(lǐng)域?!颈狙芯壳腥朦c(diǎn)】我國目前僅以大果、小果、長果、圓果等對(duì)人參果進(jìn)行簡單區(qū)分,命名不夠科學(xué),且常與用特定模具進(jìn)行定形后的西葫蘆人參果混淆,阻礙了人參果的推廣以及種質(zhì)資源的開發(fā)。因此,分子標(biāo)記的開發(fā)對(duì)于完善人參果遺傳圖譜的構(gòu)建和品種分類有重要意義?!緮M解決的關(guān)鍵問題】本文主要是對(duì)人參果的轉(zhuǎn)錄組通過MISA軟件[5]檢索SSR位點(diǎn)并用GATK[6]進(jìn)行SNP的識(shí)別, 通過分析其SSR位點(diǎn)和SNP位點(diǎn)的組成和特征, 從而完善人參果的分子標(biāo)記, 為今后人參果利用分子標(biāo)記進(jìn)行品種鑒定奠定基礎(chǔ)。

1 材料與過程

1.1 實(shí)驗(yàn)材料

本研究實(shí)驗(yàn)材料取自青海省農(nóng)林科學(xué)院園藝所實(shí)驗(yàn)溫室,選取室內(nèi)苗齡兩年的扦插人參果苗,將未開花、正在開花、已經(jīng)結(jié)果但果實(shí)未成熟、已有成熟果實(shí)設(shè)置為4個(gè)處理,采集處于不同時(shí)期的人參果苗的葉片各3份液氮冷凍,將材料放置于-80 ℃環(huán)境下保存。

1.2 實(shí)驗(yàn)方法

1.2.1 RNA的提取 用Trizol法[7]提取人參果總RNA,經(jīng)過電泳檢測后利用天根TGem Spectrophotomoter檢測提取的總RNA的含量是否符合轉(zhuǎn)錄組測序的標(biāo)準(zhǔn)。

1.2.2 轉(zhuǎn)錄組測序及數(shù)據(jù)組裝 提取的人參果葉片總RNA經(jīng)脫氧核糖核酸酶I (DNase I )處理后,用含oligod dt的磁珠使mRNA富集、純化。利用mRNA片段化反應(yīng)體系將mRNA打斷成短片段,以得到的短mRNA為模板合成1st Strand cDNA (cDNA第一鏈),再以第一鏈為模板加入合成序列所需緩沖液、無核苷酸酶水、第二鏈cDNA合成酶混合物,從而合成第二鏈,將得到的cDNA純化回收修復(fù)其粘性末端,在其3'端加上多聚(A)尾巴,且連接測序接頭。使用電泳技術(shù)對(duì)序列長度進(jìn)行篩選,通過PCR擴(kuò)增序列后利用Illumina Hiseq 2500精確測序平臺(tái)對(duì)所制備的文庫測序。過濾人參果葉片樣品的測序原始數(shù)據(jù),以除去包含接頭或低質(zhì)量的序列,得到干凈序列。對(duì)所有干凈序列通過Trinity(https://github.com/trinityrnaseq/trinityrnaseq/wiki)進(jìn)行組裝拼接,將拼接得到的所有序列中最長的序列作為基因組數(shù)據(jù)庫用于后續(xù)分析。

1.2.3 SSR和SNP的獲取 對(duì)提取所得人參果總RNA進(jìn)行測序得到人參果的轉(zhuǎn)錄組數(shù)據(jù),通過利用MISA軟件搜索人參果轉(zhuǎn)錄組中的SSR位點(diǎn)。同時(shí)運(yùn)用STAR[8]比對(duì)軟件對(duì)所得Reads和Unigene序列比對(duì),并利用GATK的SNP識(shí)別流程[9],識(shí)別SNP位點(diǎn)。

2 結(jié)果與分析

2.1 RNA質(zhì)量檢測

對(duì)人參果的RNA進(jìn)行提取,利用電泳對(duì)提取的RNA進(jìn)行初步檢測,能明顯看到28S、18S和5.8S的條帶。繼而用TGem Spectrophotomoter檢測RNA純度,得到的RIN值均符合測序所需純度要求,且無肉眼可見的蛋白質(zhì)以及其他雜質(zhì)等。

2.2 轉(zhuǎn)錄組數(shù)據(jù)組裝結(jié)果及統(tǒng)計(jì)

通過拼接與組裝,共得到68 891條Unigene,序列總長度為53 356 976 bp,平均長度為775 bp。在200~2000 bp分布著絕大部分的序列,這個(gè)長度范圍的序列占總序列的90.84 %。隨著Unigene長度的逐漸增加,其占有數(shù)量呈梯度下降之勢(shì),其中長度范圍在200~300 bp的序列數(shù)量居多,占總數(shù)的34.85 %,其余按占有率依次向排列是300~500、500~1000、1000~2000以及2000 bp以上序列,數(shù)量分別為24 010、16 547、12 488、9534和6312條,占所有Unigene的比例分別為34.85 %、24.02 %、18.13 %、13.84 %和9.16 %(表1)。

表1 人參果基因組數(shù)據(jù)庫長度統(tǒng)計(jì)結(jié)果

2.3 SSR特征分析

利用MISA軟件在68 891條Unigene中搜索到5282個(gè)SSR位點(diǎn),其中完整型SSR共有4947條,而復(fù)合型SSR共有335條。完整型SSR的數(shù)量約是復(fù)合型的15倍,SSR的出現(xiàn)頻率為7.18 %,分布密度為1/6148 bp,即平均約6148 bp就會(huì)出現(xiàn)1個(gè)位點(diǎn)。搜索獲得的SSR序列總長度為87.963 kb (0.27 %),SSR序列所占的比例不到整個(gè)人參果轉(zhuǎn)錄組序列的1 %。通過對(duì)搜索到的SSR進(jìn)行長度統(tǒng)計(jì),有60.53 %的SSR長度在10~14 bp,SSR的數(shù)量隨著長度的增加急劇下降,分布在15~19、20~29、30~49、50~100 bp的SSR分別占比26.96 %、6.47 %、2.37 %、2.35 %,只有1.33 %的SSR的長度超過100 bp(圖1)。

圖1 搜索得到的SSR長度統(tǒng)計(jì)結(jié)果Fig.1 SSR length statistical results

對(duì)SSR核苷酸重復(fù)次數(shù)(圖2)進(jìn)行統(tǒng)計(jì),其中單核苷酸重復(fù)的SSR共2908條 (58.78 %) ,雙核苷酸重復(fù)的SSR共805條 (16.27 %) ,三核苷酸重復(fù)的SSR共1184條 (23.93 %) ,四核苷酸重復(fù)的有33條(0.67 %)、五核苷酸重復(fù)的有2條(0.04 %)、六核苷酸重復(fù)的有15條 (0.30 %)。由此可見人參果的SSR基元類型中,單核苷酸占一半以上,二核、三核苷酸重復(fù)的SSR占比總和也不及單核苷酸的占比。僅有50個(gè)SSR重復(fù)基元的數(shù)量大于3。

圖2 搜索得到的SSR重復(fù)種類統(tǒng)計(jì)結(jié)果Fig.2 Statistical results of SSR repeat types

在單核苷酸重復(fù)類型中,A/T類型有2887個(gè)(99.28 %),C/G類型僅有21個(gè)(0.72 %);在二核苷酸重復(fù)類型中,有398個(gè)屬于AG/CT類型,這個(gè)數(shù)量占此重復(fù)類型總量的49.44 %,占總二核苷酸重復(fù)類型數(shù)量的一半。CG/CG類型的僅有2個(gè),占比0.25 %,AT/AT和AC/GT分別占總量的34.14 %和16.15 %;三核苷酸重復(fù)類型共有18種,最多的是AAG/TTC數(shù)量為235個(gè),占到總數(shù)的19.85 %,其次是AAC/TTG(113個(gè)),最少的是CGC/GCG(16個(gè));四核苷酸重復(fù)有18種,最多的是AAGA/TCTT(6個(gè)),其他種類個(gè)數(shù)均較少,1和2個(gè)的占比之和達(dá)到了58.82 %;五核苷酸重復(fù)有2種,每種分別有1個(gè);六核苷酸重復(fù)有15種,每種的數(shù)量和五核苷酸重復(fù)一樣,也是1個(gè)。

人參果轉(zhuǎn)錄組中SSR單元重復(fù)次數(shù)主要分布區(qū)間為1~25次,在此區(qū)間內(nèi)又以6~10次的重復(fù)為主,此類重復(fù)基元共有2604個(gè)(52.64 %)SSR位點(diǎn),其中單核苷酸類型的SSR有1438個(gè),占重復(fù)次數(shù)為6~10的SSR數(shù)量的55.22 %,其他類型的SSR數(shù)量趨勢(shì)隨著其核苷酸基元數(shù)量的增加而遞減;其次為11~15次的重復(fù),共有1271個(gè)SSR位點(diǎn),占總重復(fù)單元的25.69 %,單核苷酸重復(fù)類型的SSR數(shù)量為1243個(gè),占11~15次重復(fù)的97.78 %;1~5次的重復(fù)有845個(gè)SSR位點(diǎn),占SSR總數(shù)的17.08 %;16~20次的重復(fù)共有176個(gè)SSR位點(diǎn),占SSR總數(shù)的3.56 %;20次以上的重復(fù)次數(shù)最少,僅有51個(gè)SSR位點(diǎn),且這51個(gè)SSR均是單核苷酸的重復(fù)。由表2可見,當(dāng)重復(fù)次數(shù)大于5時(shí),SSR的基元均以單核苷酸為主,當(dāng)重復(fù)次數(shù)小于5時(shí),三核苷酸是主要的重復(fù)基元。

圖3 二核苷酸重復(fù)類型數(shù)量統(tǒng)計(jì)Fig.3 Statistics of dinucleotide repeat types

表2 SSR重復(fù)基元類型統(tǒng)計(jì)結(jié)果

2.4 SNP結(jié)果分析

對(duì)得到的68 891條序列進(jìn)行了SNP位點(diǎn)搜索,成功搜索到315 132個(gè)SNP位點(diǎn),SNP的分布密度為1/103 bp,即平均約103 bp就會(huì)出現(xiàn)1個(gè)SNP位點(diǎn)。在搜索得到的SNP位點(diǎn)中,屬于轉(zhuǎn)換類型的有192 575個(gè),而屬于顛換類型的有120 621個(gè)。A/G在所有變異類型中所占的比例最高,為總量的36.01 %,C/T占總量19.24 %,位居其次。觀察可得,比例較高的2種變異類型A/G和C/T均屬于轉(zhuǎn)換類型,而剩下的4種顛換類型所占的比例均低于15 %,其中A/T占總數(shù)的13.08 %,G/T占總數(shù)的12.14 %,A/C占總數(shù)的12.14 %,C/G最少,僅占總數(shù)的7.39 %。在所占比例中,轉(zhuǎn)換類型所占的比例61.10 %顯著大于顛換類型的比例38.27 %,故人參果的SNP變異類型以轉(zhuǎn)換類型為主。

3 討論與總結(jié)

在人參果的轉(zhuǎn)錄組結(jié)果中有68 891條Unigene,其中有15 846條Unigene含有SSR位點(diǎn),共有5282個(gè)SSR位點(diǎn)在搜索后被發(fā)現(xiàn),出現(xiàn)頻率為7.18 %,低于油茶(33.58 %)[9]、南酸棗(25.52 %)[10]、香椿(19.91 %)[11]、云南金花茶(19.63 %)[12]、黑枸杞(18.98 %)[13]、香蕉(18.53 %)[14]、油梨(17.05 %)[15]、馬藍(lán)(16.49 %)[16]、太子參(8.87 %)[17],比較接近于山地虎耳草的SSR位點(diǎn)出現(xiàn)頻率(7.25 %)[18],高于馬尾松(1.06 %)[19]、洋蔥(5.10 %)[20]等植物。說明人參果的SSR出現(xiàn)頻率并不高。

圖4 SNP變異類型統(tǒng)計(jì)結(jié)果Fig.4 Statistical results of variation type of SSR

在人參果SSR基元重復(fù)類型中,單核苷酸重復(fù)(58.78 %)是人參果重復(fù)類型中占比最多的一種,比例為23.93 %的三核苷酸重復(fù)僅次于單核苷酸重復(fù)。這與瓠瓜[21]、辣椒[22]和紅松[23]類似,而與黨參[24]、野三七[25]等以二核苷酸為主要重復(fù)類型的植物不同。AG/CT在SSR二核苷酸重復(fù)類型中有398個(gè),是數(shù)量最多的類型,其次為AT/AT(275個(gè)),AC/GT相對(duì)而言較少,有130個(gè),而CG/CG重復(fù)出現(xiàn)頻率極低,僅有2個(gè),這與蠟梅[26]、野三七[25]和李府貢棗[27]等植物的二核苷酸重復(fù)類型結(jié)果一致,AAG/CTT是人參果轉(zhuǎn)錄組中數(shù)量最多的三核苷酸重復(fù),這符合了雙子葉植物的普遍規(guī)律[28]。1~25次之間是SSR基元重復(fù)次數(shù)的分布范圍,以6~10次重復(fù)為主,其次為11~15次的重復(fù),1~5次的重復(fù)有845個(gè)SSR位點(diǎn),即有17.08 %的SSR單元的重復(fù)次數(shù)在1~5;16~20次的重復(fù)共有176個(gè)SSR位點(diǎn),占SSR總數(shù)的3.56 %;20次以上的重復(fù)次數(shù)最少,僅有51個(gè)SSR位點(diǎn),且以單核苷酸為主。這與寶巾花[29]、冬蟲夏草[3]等植物基本一致。

在測序所得的轉(zhuǎn)錄組中共找到SNP位點(diǎn)315 132個(gè),其分布密度為1/103 bp。SNP位點(diǎn)中轉(zhuǎn)換類型有192 575(61.49 %)個(gè),顛換類型有120 621個(gè)(38.51 %)。經(jīng)對(duì)比發(fā)現(xiàn)轉(zhuǎn)換類型的比例(61.49 %)幾乎達(dá)到了顛換類型的比例(38.51 %)的1.6倍,故人參果SNP變異類型以轉(zhuǎn)換類型為主,這與棒腺虎耳草[30]、盾葉薯蕷[31]、青楊[32]等結(jié)果一致。A/G占的比例在所有變異類型中最高,為總量的36.01 %,其次占總量19.24 %是C/T,而剩下的4種顛換類型所占的比例均低于15 %,其中A/T占13.08 %,G/T占總數(shù)的12.14 %,A/C占總數(shù)的12.14 %,C/G最少,僅占總數(shù)的7.39 %。

人參果轉(zhuǎn)錄組中得到的SNP分子標(biāo)記的發(fā)生頻率比SSR高很多,表明單核苷酸的變異在人參果的基因組中更容易發(fā)生。本次對(duì)人參果轉(zhuǎn)錄組的分析說明SSR和SNP分子標(biāo)記對(duì)于研究人參果品種有一定意義,但人參果目前SSR標(biāo)記出現(xiàn)頻率較低,數(shù)量不夠豐富,但此類SSR分子標(biāo)記將對(duì)今后的人參果研究奠定強(qiáng)有力的基礎(chǔ)。

猜你喜歡
基元人參果核苷酸
單核苷酸多態(tài)性與中醫(yī)證候相關(guān)性研究進(jìn)展
徐長風(fēng):核苷酸類似物的副作用
面向異構(gòu)履帶車輛的統(tǒng)一運(yùn)動(dòng)規(guī)劃方法
基于多重示范的智能車輛運(yùn)動(dòng)基元表征與序列生成
人參果,能補(bǔ)什么
有級(jí)轉(zhuǎn)向履帶車輛的駕駛員操控行為模型
Acknowledgment to reviewers—November 2018 to September 2019
人參果 脫貧果
吃貨媽媽
人體細(xì)胞內(nèi)存在全新DNA結(jié)構(gòu)
长顺县| 姜堰市| 安丘市| 上思县| 康平县| 甘德县| 扶绥县| 专栏| 芦溪县| 弥渡县| 遵化市| 东阿县| 合水县| 原平市| 抚松县| 金乡县| 沅陵县| 定安县| 丰顺县| 凤冈县| 额济纳旗| 诸城市| 南宁市| 汪清县| 通州市| 静宁县| 蒙城县| 教育| 浦县| 平山县| 遂溪县| 克山县| 桑日县| 鲁山县| 连山| 舒城县| 桂东县| 仲巴县| 榆中县| 丰都县| 兴安县|