阿爾祖古麗·買買提吐爾遜,張子俊,張衛(wèi)紅
(新疆大學(xué) 生命科學(xué)與技術(shù)學(xué)院,新疆 烏魯木齊 830046)
尖緣螺屬OxylomaWesterlund,1885隸屬于腹足綱(Gastropoda),柄眼目(Pulmonata),琥珀螺科(Succineidae)。廣泛分布于非洲、歐洲、北美洲及亞洲等地。在我國尖緣螺屬僅報(bào)道有印度尖緣螺(Oxylomaindica(Pfeiffer,1849))、狹長尖緣螺(Oxylomapfeifferi(Rossmaessler,1835))[1-2]和五家渠尖緣螺(OxylomawujiaquensisLi,Guo & Zhang,2017)[3]。五家渠尖緣螺已知僅分布于新疆。
線粒體基因組具有自己特殊的遺傳物質(zhì),呈母系遺傳,結(jié)構(gòu)簡單。作為高頻率應(yīng)用于生物系統(tǒng)進(jìn)化研究的分子標(biāo)記,線粒體基因組具有編碼區(qū)高度保守、拷貝數(shù)高、重組率低等特點(diǎn)[4-5]。目前已廣泛應(yīng)用于動物系統(tǒng)發(fā)育、物種分類、群體遺傳進(jìn)化、種質(zhì)鑒定等領(lǐng)域[6]。近年來腹足綱類群線粒體基因組測序數(shù)據(jù)的增加,促進(jìn)了其系統(tǒng)演化問題的研究[7-9]。琥珀螺科的線粒體基因組目前報(bào)道僅有一種,White等[10]對肺螺亞綱10個種類的線粒體基因組進(jìn)行測序和研究,首次獲得了琥珀螺科的模式種腐敗琥珀螺(SuccineaputrisLinneaus,1758)的線粒體全基因序列。利用高通量測序技術(shù)對動植物基因組進(jìn)行測序現(xiàn)在成為新的基因組研究趨勢[11-13],本研究使用高通量測序Illumina Hiseq及Sanger技術(shù),對五家渠尖緣螺線粒體全基因組進(jìn)行研究。研究結(jié)果可為我國琥珀螺科的系統(tǒng)分類學(xué)研究提供數(shù)據(jù)基礎(chǔ)。
五家渠尖緣螺樣本(XJU S15001)于2015年6月14日采集于新疆五家渠市青格達(dá)湖湖壩邊(N44°07.736′E08°33.678′)。-20 ℃存放于無水乙醇中。
剪取軟體腹足肌肉組織約30 mg,用天根公司提供的DNA提取試劑盒提取基因組DNA。DNA經(jīng)Nanodrop 2000(Thermo Fisher Scientific,USA)檢測濃度及純度。
檢測合格的DNA樣品,通過轉(zhuǎn)座酶打斷DNA,兩端加上接頭構(gòu)建測序文庫。對文庫應(yīng)用高保真的聚合酶進(jìn)行擴(kuò)增,對獲取的產(chǎn)物進(jìn)行純化,同時利用兩步法篩選,最終篩選出片段峰值在300 bp的可測序文庫。通過Invitrogen Qubit Spectrophotometer(Thermo Fisher Scientific,USA)確定文庫的質(zhì)量,用Agilent 2100 Bioanalyzer (Agilent Technologies,USA)確定文庫的大小是否適合于測序平臺。對質(zhì)檢合格的文庫片段,在Illumina Hiseq 2500測序平臺用2×150 的雙端測序方法進(jìn)行測序。測序結(jié)果中出現(xiàn)一些缺口,因無法正確測序這些片段,因此,利用Sanger測序技術(shù),設(shè)計(jì)9對特異引物對其進(jìn)行補(bǔ)gap測序。高通量測序與Sanger測序由上海天昊生物有限公司測序完成,引物信息見表1。
表1 五家渠尖緣螺基因組測序引物Tab.1 Primers for sequencing of the mitochondrial genome of Oxyloma wujiaquensis
PCR反應(yīng)程序?yàn)椋?5 ℃預(yù)變性2 min;94 ℃變性20 s,62~64 ℃退火40 s,72 ℃延伸1~3 min,共11個循環(huán);56~58 ℃退火30 s,72 ℃延伸2 min,共24個循環(huán);72 ℃終延伸2 min,4 ℃冷卻。PCR擴(kuò)增體系包括1×GC/HotStarTaq 緩沖液1.5 μL、MgCl2(1.5 mmol/L) 1 μL、dNTP(2.5 mmol/L) 1 μL、上下游引物(10 μmol/L)各1.5 μL、HotStarTaq聚合酶(1 U/μL) 1 μL、模板DNA 1 μL、最終加ddH2O補(bǔ)足至20 μL。擴(kuò)增產(chǎn)物經(jīng)1%瓊脂糖凝膠電泳檢測后,在ABI3730XL測序儀上進(jìn)行測序。
通過測序平臺獲得的原始序列Raw reads,利用Trim galore在線過濾軟件刪除低質(zhì)量、含有帶接頭的序列,最終得到高質(zhì)量可組裝的序列Clean reads。使用BWA軟件比對至肺螺亞綱類群,按無脊椎動物組裝策略使用mito Marker組裝軟件進(jìn)行序列組裝。
通過與近緣種序列進(jìn)行比較后,選定琥珀螺科模式種腐敗琥珀螺的線粒體全基因組序列為參考基因組,應(yīng)用Genious R11.0 (Biomatters Ltd,Auckland,New Zealand)軟件及在線注釋軟件MITOS Web Server[14],對線粒體全基因組序列進(jìn)行注釋,預(yù)測tRNA的二級結(jié)構(gòu)、非編碼區(qū)域的位置等。注釋結(jié)果經(jīng)OGORAW在線作圖軟件進(jìn)行作圖,最后將注釋成功的線粒體基因組數(shù)據(jù)提交到GenBank。
利用Genious R11.0軟件對O.wujiaquensis線粒體全基因組的核苷酸序列進(jìn)行分析,計(jì)算AT和 GC偏移值[15]。通過MEGA 7.0軟件對五家渠尖緣螺密碼子使用情況進(jìn)行分析,并與腐敗琥珀螺的線粒體基因組序列相比較。以新進(jìn)腹足目Caenogastropoda的Lophinotomacerithiformis作為外群[10],選擇腹足綱的肺螺亞綱及后鰓亞綱共6個種的線粒體基因組序列(表2),用最大似然法(Maximum likelihood,ML)基于13個蛋白質(zhì)編碼基因構(gòu)建系統(tǒng)進(jìn)化樹,從基因組水平上初步探討五家渠尖緣螺與其他類群之間的系統(tǒng)關(guān)系。
表2 腹足綱部分種類線粒體基因組序列GenBank登錄號Tab.2 GenBank accession number mitochondrial genome sequences of some species in Gastropoda
通過高通量測序獲得原始序列Raw reads為31 259 236 bp,過濾后得到序列Clean reads為27 485 002 bp。經(jīng)過補(bǔ)gap測序、基因拼接和組裝最終得到了14 086 bp的五家渠尖緣螺線粒體全基因組序列(GenBank 登錄號:MT670402)?;蜃⑨尳Y(jié)果顯示,其基因組共有37個基因組成,包括了13個蛋白質(zhì)編碼基因,22個tRNA基因,2個rRNA基因(圖1)。 其線粒體全基因組序列與腐敗琥珀螺的相似性為76.1%。
五家渠尖緣螺線粒體基因組各基因的序列長度、方向及密碼子等情況見表3。在37個基因中重鏈(H)編碼15個基因,輕鏈(L)編碼22個基因,基因的排列順序與腐敗琥珀螺基因排列順序一致。五家渠尖緣螺線粒體基因組序列中有14處存在基因間隔,長度在1~237 bp;12處存在基因重疊,長度在1~59 bp。腐敗琥珀螺線粒體全基因序列15處存在基因間隔,長度在1~48 bp;12處存在基因重疊,長度在5~38 bp[10]。二者有所不同。
表4顯示了2種琥珀螺線粒體基因組序列的核苷酸特征。五家渠尖緣螺線粒體基因組序列AT含量為75.64%、GC含量為24.36%;腐敗琥珀螺的AT含量為77.00%,GC含量為23.00%,具有明顯的A、T偏向性。五家渠尖緣螺的線粒體全基因組序列的AT skew為負(fù)值,腐敗琥珀螺的為正值,GC skew均為正值,說明總體來看二者T、G堿基的使用率較高。但五家渠尖緣螺tRNA基因和rRNA基因的AT skew分別是0.03和0.01,為正數(shù),五家渠尖緣螺這兩類基因A堿基的使用頻率高于T堿基。
表3 五家渠尖緣螺線粒體基因組組成Tab.3 Organization of the mitochondrial genome of Oxyloma wujiaquensis
表3(續(xù))
表4 2種琥珀螺線粒體基因組核苷酸組成分析Tab.4 Nucleotide composition of mitochondrial genome of two species of Succineidae
五家渠尖緣螺線粒體基因組中13個蛋白質(zhì)編碼基因(Protein coding genes,PCGs)的總長為10 678 bp,AT含量75.41%,各基因的長度在132~1 680 bp。從表3得知,13個蛋白質(zhì)編碼基因使用ATG(6個)、TTG(3個)、TTA(2個)和ATT(1個) 為起始密碼子;使用TAA(8個)、T(3個)、CAT(1個)、TAG(1個)為終止密碼子。使用的密碼子類型是肺螺亞綱類群中常見的起始和終止密碼子。分析琥珀螺科2個種的線粒體基因組序列同義密碼子使用頻率發(fā)現(xiàn)(表5),五家渠尖緣螺線粒體全基因組序列共編碼3 435個密碼子,腐敗琥珀螺共編碼4 285個密碼子(不含終止密碼子),在2個線粒體基因序列中密碼子UUA(Leu)、UUU(Phe)、AUU(Ⅱe)等均有較高使用次數(shù)。根據(jù)圖2可知,甲硫氨酸(Met)在2個線粒體基因組序列中使用的密碼子有所不同,在五家渠尖緣螺基因組序列中Met使用ATA、ATG、TTG、TCT等4種密碼子,其中ATA的數(shù)量最多;在腐敗琥珀螺基因組序列中Met使用ATA、ATG、TTG等3種密碼子,其中ATA的數(shù)量最多。
五家渠尖緣螺線粒體基因組中tRNA基因數(shù)目為22個,基因總長為1 818 bp,AT為75.96%,GC為24.04%。通過MITOS預(yù)測tRNA基因的二級結(jié)構(gòu),發(fā)現(xiàn)tRNASer1、tRNASer2缺少DHU臂。其他基因均能形成經(jīng)典的三葉草結(jié)構(gòu),這與腐敗琥珀螺和其他肺螺亞綱類群tRNA基因二級結(jié)構(gòu)基本一致。多數(shù)后生動物線粒體基因組中tRNASer1基因的二級結(jié)構(gòu)缺失DHU臂,成為典型的基因結(jié)構(gòu)特征之一[15-18]。
五家渠尖緣螺線粒體基因組中的rRNA基因的位置與腐敗琥珀螺的一樣,16SrRNA位于tRNAVal、tRNAPro之間,12S rRNA位于tRNAGlu、tRNAMet之間。16SrRNA的長度為1 103 bp,12SrRNA為713 bp。rRNA基因序列的AT含量為76.75%,與腐敗琥珀螺76.58%的含量相近,具有明顯的A、T偏向性。
表5 2種琥珀螺線粒體基因組密碼子使用情況 Tab.5 Codon usage in the mitochondrial genome of two species of Succineidae
后生動物線粒體全基因組序列中存在長度及位置不同的非編碼區(qū)域,由于該區(qū)的A+T含量較高,又被稱為控制區(qū)或A+T富集區(qū),該區(qū)域負(fù)責(zé)調(diào)控線粒體基因組的復(fù)制與轉(zhuǎn)錄過程[19-20]。通過MITOS注釋軟件發(fā)現(xiàn),在五家渠尖緣螺線粒體基因組中存在控制區(qū),長度在42 bp左右,位于COX1和tRNAVal之間。腐敗琥珀螺線粒體基因組序列中存在的控制區(qū)長度在50 bp左右,位于COX3與tRNAⅡe之間。2個線粒體基因組序列控制區(qū)的長度與其他肺螺亞綱類群出現(xiàn)差異[8,10,21-23]。在線粒體基因組序列中,控制區(qū)片段的A+T含量較高,易發(fā)生堿基突變,屬于高度可變區(qū)。該區(qū)域會影響不同種的動物線粒體基因組長度的大小,甚至?xí)?dǎo)致線粒體基因組序列的測序失敗[24-26]。
系統(tǒng)進(jìn)化樹結(jié)果顯示(圖3),五家渠尖緣螺與同科的腐敗琥珀螺緊密地聚在一起,形成一支。后鰓亞綱類群聚為一支,肺螺亞綱類群沒有聚在一起。結(jié)果表明,肺螺亞綱類群并非單系類群,琥珀螺科和后鰓亞綱分別為單系類群。該結(jié)果與White等[10]的系統(tǒng)發(fā)育分析結(jié)果一致。
本研究通過高通量測序獲得了五家渠尖緣螺線粒體基因組全序列,全長為14 086 bp。通過基因注釋后得到了37個基因,基因排列順序與同科的腐敗琥珀螺線粒體基因組序列完全一致,但是在基因序列的長度、堿基含量、密碼子使用情況及非編碼區(qū)的位置和長度上存在差異。五家渠尖緣螺線粒體基因組序列中有14處存在基因間隔,長度在1~237 bp,腐敗琥珀螺線粒體全基因組序列15處存在基因間隔,長度在1~48 bp,明顯短于五家渠尖緣螺。五家渠尖緣螺線粒體基因組全序列及各基因序列的AT含量均少于腐敗琥珀螺,全序列AT含量前者為75.64%,后者為77.00%。在編碼蛋白質(zhì)的基因中,五家渠尖緣螺線粒體全基因組序列共編碼3 435個密碼子,腐敗琥珀螺共編碼4 285個密碼子。密碼子的使用情況基本相同,但編碼甲硫氨酸(MET)的密碼子有所不同,前者使用ATA、ATG、TTG、TCT等4種密碼子,后者則使用ATA、ATG、TTG等3種密碼子。終止密碼子也有所不同,五家渠尖緣螺COX3基因使用CAT為終止密碼子,腐敗琥珀螺則沒有。線粒體基因組的非編碼區(qū)域在五家渠尖緣螺中位于COX1和tRNAVal之間,長度為42 bp,腐敗琥珀螺及其他的肺螺亞綱類群的非編碼區(qū)域位于COX3與tRNAⅡe之間[10],長度為50 bp。在測序過程中發(fā)現(xiàn)五家渠尖緣螺的非編碼區(qū)域的AT含量很高,導(dǎo)致全序列測序很困難。以上表明,五家渠尖緣螺與腐敗琥珀螺線粒體基因組之間存在一定的差異,這些差異可能是測序過程的不足,或者是物種本身的基因序列特點(diǎn)引起的。由于在NCBI上琥珀螺科線粒體基因全組序列只有一條,因此無法更加系統(tǒng)地分析其在不同屬種間的差異性。有關(guān)研究有待更多數(shù)據(jù)的補(bǔ)充。
基因組學(xué)及后基因組學(xué)的不斷發(fā)展,對生物學(xué)的更深層研究帶來便利。線粒體基因組學(xué)研究作為其中的重要領(lǐng)域,廣泛應(yīng)用于物種進(jìn)化、遺傳、基因流等研究中。目前,琥珀螺科中只有腐敗琥珀螺的線粒體全基因組序列已經(jīng)完成測序,本次獲得的五家渠尖緣螺線粒體全基因組序列將增加琥珀螺科類群基因組數(shù)據(jù),為琥珀螺科的資源保護(hù)、遺傳多樣性和系統(tǒng)發(fā)育研究提供基礎(chǔ)數(shù)據(jù)。