金方彭 李光華 冷 云 吳俊頡 左鵬翔 雷春云
(云南省漁業(yè)科學研究院,昆明 650111)
近些年來,瀾滄江中上游江段梯級水電站正在建設中,有的已經(jīng)建成并完成蓄水發(fā)電,水電站的開發(fā)產(chǎn)生了巨大的經(jīng)濟效益,也促進了當?shù)亟?jīng)濟的發(fā)展,但對生態(tài)環(huán)境造成的影響也是不容忽視的,瀾滄江中上游梯級水電站的開發(fā)隔斷了流域水體,許多支流也被隔斷了與瀾滄江的聯(lián)系,因而破壞了河流的連續(xù)性,造成魚類棲息地片段化,將對其流域內(nèi)特有的土著魚類的群體遺傳多樣性產(chǎn)生很大的影響。
簡化基因組測序是通過限制性內(nèi)切酶測序的基因組DNA,獲得大量遺傳多態(tài)性標記序列,充分展示該物種全基因組的測序策略,該方法降低了基因組的復雜性、操作過程簡單且成本低。同時還可以在不依賴參考基因組的情況下獲得全基因組中的遺傳多態(tài)性標簽,因此被廣泛應用于進化學和基因?qū)W[1],它主要是通過生物信息學來設計標記及開發(fā)程序,收集具有特異性長度的片段并利用高通量測序方法得到大量標記序列的測序方法,對部分基因組進行測序,代表目標物種全基因組信息的測序方法,目前該技術已經(jīng)用于魚類等生物間進化關系的研究,成效明顯[2,3]。
光唇裂腹魚(Schizothorax lissolabiatus,Tsao),隸屬于鯉形目裂腹魚屬(Schizothorax),分布于瀾滄江中上游,元江上游及南盤江,為產(chǎn)地常見土著魚類[4],由于瀾滄江梯級水電站的開發(fā),光唇裂腹魚自然群體數(shù)量也逐漸減少。目前對光唇裂腹魚的研究主要有魚病防治、人工馴養(yǎng)繁殖、肉質(zhì)、空殼率和耐受性等方面。但對野生光唇裂腹魚的遺傳多樣性方面的研究極少,本文主要采用簡化基因組測序?qū)獯搅迅刽~變異位點、核苷酸多樣性、等位基因數(shù)、觀測雜合度、期望雜合度和近交系數(shù)等進行分析,以期了解瀾滄江不同地理群體光唇裂腹魚的遺傳多樣性,對光唇裂腹魚種質(zhì)資源方面的研究起到數(shù)據(jù)支撐作用,為今后光唇裂腹魚進一步選育提供基礎支撐。
此次實驗材料取自瀾滄江中上游苗尾-功果橋庫區(qū)、黃登-大華橋庫區(qū)、里底江段和烏弄龍江段4個地理群體的野生樣本(表1和圖1)。光唇裂腹魚體長(20±5)cm,體重(150±50)g,利用液氮將尾鰭進行固定,并及時放入-85℃度冰箱保存。
表1 瀾滄江中上游采樣點及采樣時間Tab.1 Sampling sites and sampling time in the upper Lancang River
本文采用傳統(tǒng)的苯酚-氯仿法提取基因組DNA[5],DNA的提取質(zhì)量和濃度用紫外分光光度法進行檢測。將提取的基因組DNA在-20℃的冰箱中保存[16]。
根據(jù)Sun等[6]方法,構(gòu)建SLAF-seq文庫,本文選取錦鯉(Cyprinus carpio)基因組作為酶切預測的參考基因組,其基因組大小為1.71 Gb,GC含量37.00%,(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/951/615/GCF_000951615.1_common_carp_genome/GCF_000951615.1_common_carp_genome_genomic.fna.gz),內(nèi)切酶的選擇原則是避免重復序列的內(nèi)切酶片段且片段必須均勻地分布在基因組中。此外,酶切片段的數(shù)量與SLAF標簽的預期數(shù)量保持一致。操作步驟如下:在限制性片段的3′端加上poly(A),連接一個雙索引PCR擴增的特殊測序連接器。對目標片段進行純化、混合、切割回收,Illumina Hiseq 2500用于雙末端測序(PE100)。本文選用日本晴水稻(Oryza sativassp.japonica)的基因組(http://rapdb.dna.affrc.go.jp/)作為對照組,并將同一過程進行排序以評估建庫的準確性。
根據(jù)等位基因數(shù)量與基因序列的不同,篩選具有多態(tài)性的SLAF標記,以SLAF標記中序列深度最大的作為參考序列,利用bwa將測序reads比對到參考基因組上[7],并使用GATK和samtools兩種方法開發(fā)SNP[8,9],最終會得到SNP標記交集,它便成為最終可靠的SNP標記數(shù)據(jù)集[10,11]。然后對所獲得的SNP位點進行篩選,篩選為次要基因型頻率(MAF)不小于0.05、完整度不小于0.8;滿足以上條件的SNP最終用作光唇裂腹魚的遺傳結(jié)構(gòu)和群體遺傳多樣性分析。
使用Power-Marker V3.25軟件計算觀測雜合度(Observed heterozygosity,Ho)、觀測等位基因數(shù)(Observed allele number,No)、期望雜合度(Expected heterozygosity,He)、期望等位基因數(shù)(Expected allele number,Ne)和多態(tài)性信息含量(Polymorphism information content);光唇裂腹魚的群體遺傳結(jié)構(gòu)利用Admixture軟件[12,13]進行分析,個體間的親緣關系用SPAGeDi軟件[14]進行分析,聚類分析使用MEGA5[15]中Neighbor-Joining 算法進行。
式中,n為某一位點上等位基因的數(shù)量,Pi、Pj分別為第i和第j個等位基因在群體中的頻率,j=i+1。
式中,Fis為地方群體的平均近交系數(shù);Fst為有親緣關系地方群體的平均近交系數(shù);Fit為整個群體的平均近交系數(shù)。
用限制性內(nèi)切酶對錦鯉進行酶切預測,然后確定限制性內(nèi)切酶組合RsaⅠ+HaeⅢ對光唇裂腹魚進行酶切,目標片段長度為414—464 bp,每個樣本平均獲得134500個SLAF標簽(表2)。為保證分析質(zhì)量,采用讀長為126 bp×2做數(shù)據(jù)的后續(xù)分析與評估,Control數(shù)據(jù)量為0.31 M reads。本次試驗共得到240.29 M reads數(shù)據(jù),Control數(shù)據(jù)雙端率為94.32%,酶切效率為87.19%,SLAF建庫正常。Q30平均為94.96%,GC含量平均為39.80%。reads比對率均大于70%,表明實驗過程沒有污染,插入片段長度呈正態(tài)分布(圖2),建庫正常。
圖1 瀾滄江中上游采樣點Fig.1 Sampling points in the upper and middle reaches of Lancang River
按對照雙端比對序列在基因組中的位置,計算SLAF標簽的實際讀長,繪制控制讀長插入片段的長度分布圖[16]。
SLAF標簽和SNP信息統(tǒng)計 本實驗平均測序深度為255.2553X,共獲得474390個SLAF標簽,共得到1151083個SNP,SNP完整度:31.54%—45.37%,平均完整度為36.66%,SNP的雜合率:5.55%—14.1%,平均雜合率為9.5%(表2)。
表2 樣品SLAF標簽和SNP信息統(tǒng)計Tab.2 SLAF number and SNP information statistics of sample
4個采樣點的遺傳多樣性使用Arlequin軟件進行分析,基于過濾后的SNP(過濾掉完整度小于0.5,第二等位基因頻率小于0.05的SNP)計算各組的核酸多樣性指數(shù)。序列變異位點的轉(zhuǎn)換在魚類近親中能夠更頻繁的發(fā)生,而遠親物種中更容易發(fā)生的是顛換,同一物種不同個體之間,轉(zhuǎn)換是在嘌呤和嘌呤之間的替換,或嘧啶和嘧啶之間的替換,顛換是在嘌呤和嘧啶之間的替換[17]。對4個地理群體的轉(zhuǎn)換、顛換數(shù)以及替換數(shù)作顯著性方差分析,結(jié)果顯示F(112.31)>Fcrit(4.46)且P(1.40E-06)<0.01,轉(zhuǎn)換、顛換和替換數(shù)在4個地理群體之間均呈現(xiàn)顯著性差異:每個地理群體的轉(zhuǎn)換、顛換和替換數(shù)之間F(13.75)>Fcrit(3.84)且P(0.0012)<0.01也呈現(xiàn)顯著性差異。苗尾-功果橋、黃登-大華橋、里底和烏弄龍4個地理群體都是轉(zhuǎn)換大于顛換(表3)。其中,烏弄龍地理群體的私有變異位點為5716,遠遠高于其他3個地理群體,證明在烏弄龍地理群體中存在較大變異。核苷酸多樣性總價值以烏弄龍地理群體最大,苗尾-功果橋次之,里底再次,黃登-大華橋最小。
續(xù)表 2
圖2 插入片段分布圖Fig.2 Controlreads reads insertion fragment distribution diagram
表3 核酸多樣性指數(shù)Tab.3 Nucleic aeid diversity index
根據(jù)4個分組,分別提每個分組的SNP,之后過濾掉完整度小于0.5,第二等位基因頻率小于0.05的SNP;用過濾后的SNP基于公式計算各分組的遺傳多樣性指數(shù),苗尾-功果橋、黃登-大華橋、里底和烏弄龍4個采樣點的觀測等位基因數(shù)均為2;期望等位基因數(shù)、觀測雜合度和期望雜合度(基因多樣性)均是烏弄龍地理群體最大(1.5029、0.3131和0.3115);多樣性指數(shù)里以底地理群體最大(0.3248),香濃指數(shù)和多態(tài)性信息含量(PIC)均以烏弄龍地理群體最大(0.4811和0.2553),次要基因頻率以里底地理群體最大(0.2216)詳見表4。對不同地理群體的觀測等位基因數(shù)、期望等位基因數(shù)、觀測雜合度、期望雜合度、多樣性指數(shù)、香濃指數(shù)、多態(tài)信息含量(PIC)做顯著性分析,結(jié)果顯示F(55.06)>Fcrit(3.29)且P(2.49E-08)<0.01,呈顯著性差異。
計算:
群體間遺傳距離根據(jù)測序結(jié)果60尾光唇裂腹魚樣本間的遺傳距離介于0.05—0.15,群體間成對Fst值(表5)表明,里底-烏弄龍群體的分歧最大(0.12985),苗尾、功果橋-烏弄龍群體分歧最小(-0.01496),平均為0.07629,顯著平均水平P=0.005,說明Fst值均達到顯著性水平(P<0.05)。
式中,Fis為地方群體的平均近交系數(shù);Fst為有親緣關系地方群體的平均近交系數(shù);Fit為整個群體的平均近交系數(shù)。
表4 遺傳多樣性分析Tab.4 Genetic diversity analysis
表5 光唇裂腹魚4個群體間的遺傳分化指數(shù)Tab.5 Genetic differentiation index among 4 populations of Schizothorax lissolabiatus Tsao
群體間聚類分析由圖3可以看出,苗尾-功果橋、黃登-大華橋和里底3個地理群體的個體間相互交叉聚類,烏弄龍地理群體的各個個體聚為一支。這表明苗尾-功果橋群體、黃登-大華橋群體和里底群體間遺傳關系更接近,烏弄龍群體與它們有相對較遠的遺傳距離。黃登-大華橋群體、里底群體里的個體出現(xiàn)少數(shù)幾個和烏弄龍群體交叉聚類的情況。
圖3 光唇裂腹魚自然群體進化樹Fig.3 Natural population evolution tree of Schizothorax lissolabiatus Tsao
群體間分子變異分析對光唇裂腹魚4個地理群體的控制區(qū)序列作分子生物學方差分析(AMOVE),結(jié)果顯示,群體遺傳分化指數(shù)Fst=0.10273(P>0.01),群體間的變異占10.27%,表明遺傳分化較少發(fā)生在群體間。群體內(nèi)的變異占89.73%,表明遺傳分化主要發(fā)生在每個群體內(nèi)部(表6)。
表6 光唇裂腹魚4個自然地理群體基于簡化基因組位點的分子變異分析(AMOVE)Tab.6 Molecular variation analysis(AMOVE)of four natural geographic populations of Schizothorax lissolabiatus Tsao based on simplified genomic loci
有研究表明,序列變異位點的轉(zhuǎn)換在魚類的近親中更頻繁發(fā)生,而遠親物種中更容易發(fā)生顛換,在同一物種不同個體之間,轉(zhuǎn)換通常比顛換多,比例為5﹕1,有的甚至高達10﹕1[18,19]。本研究發(fā)現(xiàn),光唇裂腹魚轉(zhuǎn)換(Ti)與顛換(Tv)的比值大于1,證明光唇裂腹魚轉(zhuǎn)換發(fā)生率大于顛換,mtDNA 控制區(qū)的變異更多的發(fā)生在嘌呤與嘌呤或者嘧啶與嘧啶之間,而嘌呤與嘧啶或嘧啶與嘌呤之間的顛換則較少發(fā)生。每個采樣點的私有變異位點顯示,在4個地理群體中,群體變異位點大小依次為烏弄龍(5716)>苗尾-功果橋(8)>里底(4)>黃登-大華橋群體(3),烏弄龍群體的變異位點遠遠高于其他3個地理群體,說明烏弄龍地理群體中存在的變異大。
對光唇裂腹魚4個地理群體的控制區(qū)序列作分子變異分析(AMOVE)表明,群體間的變異占10.27%,群體內(nèi)的變異占89.73%,表明遺傳分化主要發(fā)生在每個群體內(nèi)部,群體間雖無顯著遺傳分化,但還是一直有發(fā)生群體間的遺傳分化,與Fst分析結(jié)果相吻合。與同為裂腹魚屬的塔里木裂腹魚(群體內(nèi)變異81.01%,群體間變異占16.68%)相比較,群體內(nèi)變異程度稍高,群體間的變異程度沒有塔里木裂腹魚高[25]。
遺傳多樣性是物種進化潛力的重要指標。遺傳多樣性越高,物種適應環(huán)境變化的能力越強,進化潛力越大[20,21]。多態(tài)信息含量(PIC)主要是衡量基因位點群體多態(tài)性的重要指標,它能夠反映群體的遺傳變異程度,當多態(tài)信息含量(PIC)大于0.5時,該位點為高度多態(tài)性位點;當多態(tài)信息含量(PIC)小于0.25時,該位點為低度多態(tài)性位點,當多態(tài)信息含量(PIC)大于0.25且小于0.5時,該位點為中度多態(tài)位點[22—24]。本研究4個地理群體中,除黃登-大華橋地理群體表現(xiàn)為低度多態(tài)性,其余3個地理群體均表現(xiàn)為中度多態(tài)性,這些中度多態(tài)的標記為今后遺傳多樣性的進一步分析以及未來光唇裂腹魚遺傳連鎖圖譜的構(gòu)建有著重要的意義。另外,核苷酸多樣性(Pi)的分析時,Pi需要除以序列總長度才可以得到,但是無參序列總長不好定義,每個群的序列長度基本是一樣的,所以可以直接比較該值。
平均雜合度是群體在檢測到的位點上的雜合子頻率,用于檢測群體內(nèi)的遺傳變異,可以度量群體的雜合程度。雜合度的高低和遺傳多樣性與群體對環(huán)境的適應能力呈正相關[22],本研究中4個地理群體的觀測雜合度和期望雜合度均是烏弄龍地理群體(0.3131和0.3115)最大,黃登-大華橋群體(0.2381和0.2690)最小。4個地理群體平均觀測雜合度和期望雜合度為(0.2695和0.2892),與同一屬的短須裂腹魚相比較(0.2007和0.3160)[20]相比較,雜合度較低,遺傳變異程度低,對環(huán)境的適應能力差。
多樣性指數(shù)是群落豐富度指標,該指數(shù)越高,群落越穩(wěn)定;香濃指數(shù)是用來反應群體的多樣性的高低,指數(shù)越大,多樣性越高[21]。本研究光唇裂腹魚四個地理群體的多樣性指數(shù)在0.2868—0.3248,說明4個群體多樣性指數(shù)低,群體多樣性不穩(wěn)定,香濃指數(shù)在0.4269—0.4811,與同屬的短須裂腹魚(遺傳多樣性指數(shù)為0.3386,香濃指數(shù)為0.4827[19]),遺傳多樣性指數(shù)和香濃指數(shù)均較低,說明群體多樣性偏低。就群體之間看來,烏弄龍群體的多樣性最高,可能是烏弄龍群體收人工干擾少的緣故。
根據(jù)Thorp的一系列研究,當遺傳距離大于0.05且小于0.3時為同種不同群體;遺傳距離大于0.3且小于0.9時為同屬不同種;遺傳距離大于0.9為不同屬[21]。本研究中60個樣本的遺傳距離介于0.05—0.15,說明研究對象為同種不同群體。根據(jù)評價標準,當0<Fst<0.05時,表現(xiàn)為低等分化水平;當0.05<Fst<0.15時,表現(xiàn)為中等分化水平;當Fst>0.15時,表現(xiàn)為高等分化水平[23]。本研究中,群體間遺傳分化指數(shù)在-0.01496—0.12985,與同屬的墨脫裂腹魚(遺傳分化指數(shù)-0.014—0.771)相比較,遺傳分化指數(shù)較低[26]。群體間分化指數(shù)均值為0.07629,分化程度處于中等水平。除苗尾-功果橋、烏弄龍、黃登-大華橋和烏3個群體間分化處于低等水平外,其他群體間分化都處于中等水平。
4個群體的聚類進化結(jié)果表明,地理位置較近且想連續(xù)的苗尾-功果橋、黃登-大華橋和里底3個地理群體相互交叉聚類,烏弄龍地理群體聚為一支,這說明地理分布差距和遺傳距離呈正相關,隨著距離的變大,遺傳距離也隨之增大[24],由此可見,地理距離對光唇裂腹魚自然群體的遺傳分化程度有較大的影響,地理位置靠近,相互間基因交流較多,遺傳分化程度較低[23]。此結(jié)論與群體間遺傳分化程度的分析結(jié)果一致。此外,烏弄龍群體與它們有相對較遠的遺傳距離,黃登-大華橋群體和里底群體里的個體出現(xiàn)少數(shù)幾個和烏弄龍群體交叉聚類的情況。這可能是2013年以來魚類增殖放流活動造成的,黃登魚類增殖放流站2013年以來承擔著大華橋、黃登、拖巴、里底及烏弄龍的人工增殖放流任務,特別是近3年以來,連續(xù)開展增殖放流活動,這可能就與黃登-大華橋、里底和烏弄龍3個地理群體出現(xiàn)個別交叉聚類相關(表7)。就地理位置來看,苗尾-功果橋、黃登-大華橋和里底3個點是相互連續(xù)的,且樣品采集時電站還沒開始蓄水,因此交叉聚類也符合實際情況。
表7 各采樣點2014年以來增殖放流數(shù)量Tab.7 The number of breeding and releasing streams at different collection points from 2014 to 2018