国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

綠鰭馬面鲀?nèi)蚪M微衛(wèi)星分布特征

2022-06-30 08:08:02王九龍李洪莉胡振輝張盼盼
關(guān)鍵詞:微衛(wèi)星拷貝數(shù)堿基

王九龍,李洪莉,尹 碩,胡振輝,葉 苗,張盼盼

(煙臺(tái)大學(xué)海洋學(xué)院,山東 煙臺(tái) 264005)

微衛(wèi)星(Microsatellites)標(biāo)記,也稱為簡單重復(fù)序列(Simple sequence repeats, SSRs),其廣泛、隨機(jī)地分布在真核生物的基因組中,具有多態(tài)性水平和雜合度較高、共顯性遺傳、易于PCR擴(kuò)增且可重復(fù)性高等特點(diǎn),現(xiàn)已廣泛應(yīng)用于生物育種[1]、種質(zhì)鑒定及親權(quán)鑒定[2-4]、基因定位[5]等多個(gè)研究領(lǐng)域。傳統(tǒng)的微衛(wèi)星標(biāo)記開發(fā)方法存在步驟繁瑣、覆蓋率低等問題,尤其對(duì)于缺少遺傳背景信息的物種,大規(guī)模開發(fā)微衛(wèi)星標(biāo)記面臨諸多困難,通常只能獲取少數(shù)的微衛(wèi)星標(biāo)記引物用于遺傳學(xué)分析[6-7]。隨著測(cè)序技術(shù)的快速發(fā)展,公共數(shù)據(jù)庫中積累了大量生物的測(cè)序序列,利用相關(guān)軟件篩選其中的重復(fù)序列并設(shè)計(jì)引物成為一種快速篩選和開發(fā)微衛(wèi)星標(biāo)記的途徑,并已在多個(gè)物種中成功應(yīng)用[8-10]。目前,科研工作者完成了包括綠鰭馬面鲀?cè)趦?nèi)的大量物種的全基因組測(cè)序和組裝工作[11-12],為研究微衛(wèi)星標(biāo)記在全基因組中的分布特征以及大規(guī)模開發(fā)微衛(wèi)星標(biāo)記奠定了重要基礎(chǔ)。

綠鰭馬面鲀(Thamnaconusmodestus)隸屬鲀形目(Tetraodontiformes)、單角鲀科(Monacanthidae)、馬面鲀屬(Thamnaconus),主要分布在中日韓附近海域,因肉質(zhì)鮮嫩、營養(yǎng)豐富而深受人們的喜愛,具有很高的經(jīng)濟(jì)價(jià)值。由于過度捕撈和產(chǎn)卵場生態(tài)環(huán)境受到破壞等原因,綠鰭馬面鲀的種群資源銳減,漁業(yè)捕撈已不能滿足正常的市場需求,價(jià)格不斷攀升。關(guān)于綠鰭馬面鲀的研究主要集中在資源評(píng)估和分布[13]、苗種繁育[14]以及基于線粒體DNA序列的群體遺傳結(jié)構(gòu)分析[15-16]等方面,只有少量涉及微衛(wèi)星標(biāo)記開發(fā)的研究報(bào)道[17-18]。微衛(wèi)星標(biāo)記的匱乏,嚴(yán)重限制了綠鰭馬面鲀遺傳連鎖圖譜構(gòu)建及QTL定位等研究的開展。本研究根據(jù)數(shù)據(jù)庫中已公布的綠鰭馬面鲀基因組序列信息進(jìn)行微衛(wèi)星標(biāo)記的篩選,旨在闡明全基因組水平上微衛(wèi)星標(biāo)記的分布特征,深化對(duì)綠鰭馬面鲀基因組的認(rèn)識(shí),為利用微衛(wèi)星標(biāo)記開展群體遺傳學(xué)、分子標(biāo)記輔助育種等研究奠定基礎(chǔ)。

1 材料與方法

1.1 綠鰭馬面鲀?nèi)蚪M序列來源

綠鰭馬面鲀組裝基因組序列從NCBI網(wǎng)站上下載(https://www.ncbi.nlm.nih.gov/, GenBank assembly accession: GCA-009823395.1)。組裝基因組總長度為474.31 Mb,占該魚基因組估計(jì)大小的96.45%。該基因組包含242個(gè)contigs,其中contigs N50為22.46 Mb;重復(fù)序列總長度為67.35 Mb,占總基因組序列的14.2%;20條組裝為染色體水平的序列總長度占總組裝序列的99.44%。

1.2 微衛(wèi)星篩選及分析

1.2.1 微衛(wèi)星標(biāo)記統(tǒng)計(jì)術(shù)語說明 微衛(wèi)星相關(guān)術(shù)語的定義及統(tǒng)計(jì)方法參照崔建洲等[19]的研究:(1)重復(fù)類型:指重復(fù)序列中每個(gè)重復(fù)單元由幾個(gè)核苷酸組成,本研究包含單核苷酸重復(fù)、二核苷酸重復(fù)、三核苷酸重復(fù)、四核苷酸重復(fù)、五核苷酸重復(fù)和六核苷酸重復(fù);(2)重復(fù)單元類別:指各重復(fù)類型具體由哪幾個(gè)核苷酸組成,如二核苷酸重復(fù)類型中的AC與AG屬于不同的重復(fù)單元類別;(3)重復(fù)拷貝數(shù):對(duì)于某一特定微衛(wèi)星位點(diǎn),該序列中重復(fù)單元重復(fù)的次數(shù),如(AC)5代表AC這個(gè)重復(fù)單元的重復(fù)拷貝數(shù)為5;(4)重復(fù)數(shù)目:指每種重復(fù)單元類別在基因組中出現(xiàn)的次數(shù)。

在結(jié)果中對(duì)微衛(wèi)星統(tǒng)計(jì)分析時(shí),保持微衛(wèi)星原始的重復(fù)單元類別,如A與T、AC與GT、CAA與TTG雖然分別為互補(bǔ)的重復(fù)單元類別,但仍看作不同的重復(fù)單元類別,不進(jìn)行歸類而單獨(dú)統(tǒng)計(jì);而在討論部分為方便與其他研究的結(jié)果進(jìn)行比較,對(duì)重復(fù)單元類別進(jìn)行了歸類。

1.2.2 微衛(wèi)星標(biāo)記搜索及分析 采用微衛(wèi)星識(shí)別工具(Microsatellite identification tool,MISA)(http://pgrc.ipk-gatersleben.de/misa/)在參考基因組中搜索微衛(wèi)星位點(diǎn),搜索所采用的參數(shù)如下:單核苷酸重復(fù)次數(shù)≥10次,二、三、四、五、六核苷酸重復(fù)次數(shù)≥5次。使用Excel 2019以及SPSS 26進(jìn)行相關(guān)統(tǒng)計(jì)分析和作圖。

2 結(jié) 果

2.1 綠鰭馬面鲀基因組中微衛(wèi)星的分布特征

在474.31 Mb的基因組序列中共篩選得到566 561個(gè)完整型微衛(wèi)星標(biāo)記,平均每隔837個(gè)堿基有1個(gè)微衛(wèi)星標(biāo)記,微衛(wèi)星出現(xiàn)的頻率為1 195個(gè)/Mb。全部微衛(wèi)星標(biāo)記的重復(fù)序列總長度為13 754 954 bp,約占整個(gè)基因組序列的2.90%。對(duì)6種重復(fù)類型的微衛(wèi)星進(jìn)行統(tǒng)計(jì)分析,各類型微衛(wèi)星的數(shù)目分布相差較大(表1):二堿基重復(fù)類型最多,有336 653個(gè),約占微衛(wèi)星標(biāo)記總數(shù)的59.42%;其后依次是三堿基重復(fù)類型113 998個(gè)(20.12%)、單堿基重復(fù)類型70 087個(gè)(12.37%)、四堿基重復(fù)類型39 059個(gè)(6.90%)、五堿基重復(fù)類型3 694個(gè)(0.65%)和六堿基重復(fù)類型3 070個(gè)(0.54%)。雖然單堿基重復(fù)類型的微衛(wèi)星數(shù)量比四、五、六堿基重復(fù)類型多,但其微衛(wèi)星序列的平均長度卻較短,僅為四、五、六堿基重復(fù)類型微衛(wèi)星平均長度的3/10~4/10。

表1 綠鰭馬面鲀基因組中不同重復(fù)類型微衛(wèi)星統(tǒng)計(jì)

對(duì)每種重復(fù)類型微衛(wèi)星的重復(fù)單元類別進(jìn)行進(jìn)一步的統(tǒng)計(jì)分析,結(jié)果發(fā)現(xiàn)單堿基重復(fù)單元類別中以單堿基A重復(fù)單元數(shù)量最多,占單堿基微衛(wèi)星總數(shù)的45.15%;二堿基重復(fù)單元有12種類別,數(shù)量最多的是CA,占二堿基微衛(wèi)星的16.17%;三堿基重復(fù)單元有60種類別,數(shù)量最多的是GAG,占三堿基微衛(wèi)星的4.84%;四堿基重復(fù)單元有238種類別,數(shù)量最多的是AAAT,占四堿基微衛(wèi)星的3.46%;五堿基重復(fù)單元有638種類別,數(shù)量最多的是AAAAC,占五堿基微衛(wèi)星的9.87%;六堿基重復(fù)單元有520種類別,數(shù)量最多的是CCTAAC,占六堿基微衛(wèi)星的12.93%(表2)。

表2 6種重復(fù)類型中數(shù)量最多的5種微衛(wèi)星類別

2.2 微衛(wèi)星在染色體上的分布特征

此處只統(tǒng)計(jì)分析組裝為染色體水平序列上的微衛(wèi)星分布特征(表3),不考慮135條scaffold上微衛(wèi)星的分布情況。

綠鰭馬面鲀1號(hào)染色體上分布的微衛(wèi)星數(shù)量最多,有40 917個(gè),占微衛(wèi)星總數(shù)的7.12%;其次是2號(hào)和3號(hào)染色體上分別含有40 805和28 369個(gè)微衛(wèi)星。19、18號(hào)染色體上微衛(wèi)星數(shù)目較少,分別含有20 456個(gè)和19 381個(gè);20號(hào)染色體上微衛(wèi)星數(shù)量最少,為19 078個(gè),僅占微衛(wèi)星總數(shù)的3.37%。皮爾遜相關(guān)性分析表明,綠鰭馬面鲀微衛(wèi)星數(shù)量與其所在染色體DNA序列長度呈顯著的正相關(guān)關(guān)系(r=0.937)。不同染色體上微衛(wèi)星出現(xiàn)的頻率不同:微衛(wèi)星出現(xiàn)頻率最高的為2號(hào)和1號(hào)染色體,分別為1 195.13個(gè)/Mb和1 175.58個(gè)/Mb;而5號(hào)和6號(hào)染色體上微衛(wèi)星出現(xiàn)的頻率最低,分別為937.62個(gè)/Mb和939.01個(gè)/Mb。分析表明,綠鰭馬面鲀微衛(wèi)星的出現(xiàn)頻率與其所在染色體DNA序列長度不相關(guān)(r=0.029)。

表3 微衛(wèi)星在染色體上的分布特征

2.3 微衛(wèi)星重復(fù)單元的重復(fù)拷貝數(shù)及重復(fù)區(qū)序列長度分布

綠鰭馬面鲀基因組中,6種重復(fù)類型微衛(wèi)星的重復(fù)拷貝數(shù)變化范圍較大,從5~815拷貝數(shù)不等,且微衛(wèi)星數(shù)量隨核心序列拷貝數(shù)的增加而減少(圖1)。單堿基重復(fù)單元拷貝數(shù)主要分布在10~20,數(shù)量占單堿基微衛(wèi)星總數(shù)的95.52%,最大拷貝數(shù)為815;其中重復(fù)拷貝數(shù)為10的數(shù)目最多,為21 692個(gè)。二堿基重復(fù)單元拷貝數(shù)主要分布在5~30,數(shù)量占二堿基微衛(wèi)星總數(shù)的93.51%,最大拷貝數(shù)為574;其中重復(fù)拷貝數(shù)為5的數(shù)目最多,達(dá)到75 188個(gè)。三堿基重復(fù)單元拷貝數(shù)主要分布在5~20,數(shù)量占三堿基微衛(wèi)星總數(shù)的97.28%,最大拷貝數(shù)為131;其中重復(fù)拷貝數(shù)為5的數(shù)目最多,達(dá)到37 703個(gè)。四堿基重復(fù)單元拷貝數(shù)主要分布在5~15,數(shù)量占四堿基微衛(wèi)星總數(shù)的96.47%,最大拷貝數(shù)為61;其中重復(fù)拷貝數(shù)為5的數(shù)目最多,達(dá)到14 875個(gè)。五堿基重復(fù)單元拷貝數(shù)主要分布在5~9,數(shù)量占五堿基微衛(wèi)星總數(shù)的95.67%,最大拷貝數(shù)為41;其中重復(fù)拷貝數(shù)為5的數(shù)目最多,達(dá)到1 896個(gè)。

六堿基重復(fù)單元拷貝數(shù)主要分布在5~9,數(shù)量占六堿基微衛(wèi)星總數(shù)的93.62%,最大拷貝數(shù)為44;其中重復(fù)拷貝數(shù)為5的數(shù)目最多,達(dá)到1 440個(gè)。隨著重復(fù)單元中堿基數(shù)目的升高,平均重復(fù)拷貝數(shù)呈下降趨勢(shì)(圖2)。

圖2 平均重復(fù)拷貝數(shù)隨重復(fù)單元堿基數(shù)的變化

綠鰭馬面鲀基因組DNA序列中發(fā)現(xiàn)的566 561個(gè)微衛(wèi)星重復(fù)區(qū)序列長度存在極顯著差異,在10~1 148 bp之間變化。其中,59.80%的微衛(wèi)星重復(fù)區(qū)序列長度小于20 bp,重復(fù)區(qū)序列長度大于30 bp的微衛(wèi)星占總數(shù)的20.92%(圖3)。

圖3 不同重復(fù)區(qū)序列長度的微衛(wèi)星數(shù)量分布

3 討 論

3.1 影響微衛(wèi)星數(shù)量統(tǒng)計(jì)結(jié)果的因素

微衛(wèi)星識(shí)別軟件是影響微衛(wèi)星查找篩選結(jié)果和效率的重要因素之一。目前,已開發(fā)的基于生物信息學(xué)分析的微衛(wèi)星識(shí)別篩查軟件有Tandem Repeat Finder(TRF)[20]、MISA[9]以及SciRoko[21];而有些軟件,例如SSRLocator[22]和SSRPoly[23],不僅可以進(jìn)行微衛(wèi)星的挖掘,還可以進(jìn)行引物的設(shè)計(jì)。不同的軟件采用了不同的策略進(jìn)行微衛(wèi)星的挖掘,對(duì)同一基因組序列篩查微衛(wèi)星的效率和準(zhǔn)確性也差異顯著。有些軟件對(duì)長DNA序列直接分析,篩查微衛(wèi)星的速度較慢;而有些軟件將長DNA序列分割成適當(dāng)?shù)拈L度,以提高挖掘速度。軟件中微衛(wèi)星篩選的參數(shù)設(shè)置直接決定了最終得到的微衛(wèi)星數(shù)量,如微衛(wèi)星最小序列長度及最小重復(fù)次數(shù)等。EDWARDS等[24]提出,為減少方法學(xué)上的不同所造成的結(jié)果差異,可以統(tǒng)計(jì)計(jì)算相對(duì)豐度RA(relative abundance,重復(fù)單元類別的微衛(wèi)星個(gè)數(shù)除以總微衛(wèi)星個(gè)數(shù))和相對(duì)頻度RF(relative frequency,重復(fù)單元類別的重復(fù)長度除以全部微衛(wèi)星序列重復(fù)區(qū)長度,即本研究結(jié)果中的密度)兩個(gè)指標(biāo),以獲得在不同研究中具有可比性、通用性的數(shù)據(jù)。此外,微衛(wèi)星統(tǒng)計(jì)分類標(biāo)準(zhǔn)在不同研究中也有所不同,導(dǎo)致不同研究中微衛(wèi)星的數(shù)量需要重新統(tǒng)計(jì)后才可以進(jìn)行比較。有些研究將簡單重復(fù)序列及其互補(bǔ)重復(fù)序列由一種重復(fù)單元類別來表示,如重復(fù)單元類別GCC可以代表(GCC)n,(CCG)n,(CGC)n,(GGC)n,(GCG)n以及(CGG)n共6種微衛(wèi)星,并將6種微衛(wèi)星歸為一類進(jìn)行統(tǒng)計(jì)分析。按照這一標(biāo)準(zhǔn),理論上可能的不發(fā)生重復(fù)的基本單元類型減少到501類,其中單堿基有2類(A、C),二堿基有4類(AT、AG、AC、GC),三堿基有10類(AAT、AAC、AAG、ATC、ACG、ACT、AGC、GCC、AGG、ACC),四堿基有33類,五堿基有102類,六堿基有350類[25]。

3.2 綠鰭馬面鲀基因組中微衛(wèi)星分布特征分析

在綠鰭馬面鲀基因組序列中,微衛(wèi)星重復(fù)序列總長度為13 754 954 bp,約占整個(gè)基因組序列的2.90%,這一比例與人類基因組序列中微衛(wèi)星含量(3%)相近;而紅鰭東方鲀基因組中微衛(wèi)星含量僅為0.77%[19],造成兩種魚類微衛(wèi)星含量差異較大的原因可能是兩者基因組本身存在較大差異,或是因?yàn)槲⑿l(wèi)星搜索軟件及設(shè)置參數(shù)的不同所致。

在所有微衛(wèi)星中,二堿基重復(fù)類型的數(shù)量最多(59.42%),六堿基重復(fù)類型最少(0.54%)。數(shù)量最多的重復(fù)單元類別為二堿基重復(fù)的CA(CA/AC/GT/TG),達(dá)到206 045個(gè),占全部微衛(wèi)星數(shù)量的36.37%。此外,重復(fù)單元類別為CA(CA/AC/GT/TG)的微衛(wèi)星在總長度、平均長度、頻率和密度等指標(biāo)上都排名第一,這與小鼠[26]、紅鰭東方鲀[19]等物種微衛(wèi)星中重復(fù)單元類別AC最為豐富的結(jié)果相似,而在靈長類、豬、雞等物種基因組中最豐富的重復(fù)單元類別為單堿基重復(fù)的A/T[27]。

3.3 綠鰭馬面鲀不同重復(fù)單元類別特征分析

單核苷酸重復(fù)類型中,在人、果蠅、線蟲、擬南芥、黃顙魚等物種中A/T重復(fù)單元類型的數(shù)量最多,而G/C數(shù)量較少[27-28],在本研究中也得到相同的結(jié)果。二核苷酸重復(fù)類型的微衛(wèi)星在大多數(shù)物種中最為豐富,如在人類、擬南芥、酵母、紅鰭東方鲀中,數(shù)量最多的二堿基重復(fù)類型分別是AC、AT、AT、AC,而CG重復(fù)單元數(shù)量相對(duì)較少[19,27]。本研究中,綠鰭馬面鲀基因組中CA重復(fù)單元最為豐富,同樣CG重復(fù)單元數(shù)量較少,僅占全部微衛(wèi)星的0.64%。三堿基重復(fù)類型中,AGG(26 479)、AAT(14 249)是數(shù)量最多的兩種重復(fù)單元類別,最少的是ATC(2 939);而在黃顙魚和人類基因組中,數(shù)量較多的重復(fù)單元類別同為AAT、AAC和AAG;需要特別注意的是,人類的多種遺傳性疾病與三堿基微衛(wèi)星重復(fù)次數(shù)的增加有關(guān),如脆性X綜合征[29]、亨廷頓舞蹈癥[30]等。

在綠鰭馬面鲀四堿基、五堿基、六堿基重復(fù)類型中,優(yōu)勢(shì)微衛(wèi)星分別為AAAT、AAAAC和CCTAAC,同樣表現(xiàn)出A/T堿基優(yōu)勢(shì),這與蝦夷扇貝[31]、中國對(duì)蝦[32]、紅鰭東方鲀[19]和黃顙魚[28]等水產(chǎn)動(dòng)物基因組中微衛(wèi)星特征一致。關(guān)于微衛(wèi)星產(chǎn)生的機(jī)制,普遍認(rèn)可的觀點(diǎn)是DNA復(fù)制過程中發(fā)生滑移錯(cuò)配而使重復(fù)單元的重復(fù)次數(shù)發(fā)生變化,而DNA復(fù)制發(fā)生滑移錯(cuò)配的概率與序列的GC含量呈反比[33-34]。這可能是因?yàn)镃/G堿基之間通過三個(gè)氫鍵連接,而A/T之間只有兩個(gè)氫鍵,GC含量高的DNA序列需要更多能量打開雙鏈而不易發(fā)生滑動(dòng),因此,微衛(wèi)星中GC/CG類型的發(fā)生頻率較低[31]。此外,基因組DNA中CpG島中的胞嘧啶C常常是甲基化的,甲基化的胞嘧啶C易脫氨基轉(zhuǎn)換為胸腺嘧啶T,也可能是導(dǎo)致微衛(wèi)星中A/T類型較多的原因之一[33]。

3.4 綠鰭馬面鲀不同重復(fù)類型的重復(fù)拷貝數(shù)特征分析

研究結(jié)果表明,隨著重復(fù)拷貝數(shù)的增加,綠鰭馬面鲀基因組中不同重復(fù)類型微衛(wèi)星的數(shù)目隨之減少。這一現(xiàn)象也在多個(gè)物種的基因組微衛(wèi)星中出現(xiàn)[28],其原因可能是:(1)重復(fù)拷貝數(shù)減少導(dǎo)致微衛(wèi)星長度變短,其穩(wěn)定性會(huì)越高;(2)微衛(wèi)星重復(fù)拷貝數(shù)越高,發(fā)生突變的頻率也越高,使得越長的微衛(wèi)星數(shù)目減少[35]。

4 結(jié) 語

對(duì)于缺乏分子資源和分子生物學(xué)研究的綠鰭馬面鲀這一重要水產(chǎn)經(jīng)濟(jì)魚類而言,微衛(wèi)星分子標(biāo)記的開發(fā)對(duì)于其種群遺傳多樣性評(píng)估、遺傳結(jié)構(gòu)分析、經(jīng)濟(jì)性狀解析等研究領(lǐng)域都有著十分重要的意義。本研究對(duì)綠鰭馬面鲀基因組范圍內(nèi)的微衛(wèi)星分布特征進(jìn)行了分析,為后續(xù)開發(fā)高質(zhì)量綠鰭馬面鲀微衛(wèi)星標(biāo)記提供了有用信息和數(shù)據(jù)資源。下一步,我們將根據(jù)微衛(wèi)星的類型、重復(fù)次數(shù)以及側(cè)翼序列等特征設(shè)計(jì)合適的引物,篩選并驗(yàn)證具有多態(tài)性的高質(zhì)量微衛(wèi)星標(biāo)記。

猜你喜歡
微衛(wèi)星拷貝數(shù)堿基
梅花鹿基因組微衛(wèi)星分布特征研究
線粒體DNA拷貝數(shù)變異機(jī)制及疾病預(yù)測(cè)價(jià)值分析
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
胎兒染色體組拷貝數(shù)變異與產(chǎn)前超聲異常的相關(guān)性分析
生命“字母表”迎來4名新成員
生命“字母表”迎來4名新成員
林麝全基因組微衛(wèi)星分布規(guī)律研究
基于轉(zhuǎn)錄組測(cè)序的波紋巴非蛤微衛(wèi)星標(biāo)記研究
DNA序列拷貝數(shù)變化決定黃瓜性別
康保县| 梧州市| 施甸县| 巩义市| 冀州市| 兴义市| 商河县| 昌黎县| 无棣县| 子长县| 蚌埠市| 开封县| 洪江市| 台中市| 奉贤区| 漠河县| 富锦市| 呼玛县| 本溪市| 常山县| 原平市| 台东市| 金堂县| 沙洋县| 仪征市| 虹口区| 武川县| 兰州市| 濮阳市| 神木县| 孟州市| 班玛县| 涟水县| 和平县| 西贡区| 萝北县| 桂阳县| 孝义市| 吉林市| 临清市| 龙海市|