付鵬程, 林清銀, 孫姍姍
(洛陽師范學(xué)院 生命科學(xué)學(xué)院, 洛陽 471934)
龍膽屬植物是典型的高山植物,以青藏高原及其周邊地區(qū)為分布中心和分化中心[1-2]。線葉龍膽(Gentianalawrenceivar.farreriT. N. Ho)是龍膽屬多枝組中的常見物種,多年生草本,是青藏高原特有植物,也是高山草甸的重要組成部分。線葉龍膽可用于醫(yī)藥,具有較高的藥用價值;同時其花色素雅,形態(tài)優(yōu)美,也具有較高的園藝觀賞價值。已有的進(jìn)化研究表明,線葉龍膽的葉綠體基因組存在ndh基因缺失[3];基于葉綠體片段和微衛(wèi)星標(biāo)記的群體研究表明,該物種目前的遺傳格局受到了冰川運(yùn)動及環(huán)境氣候變化的顯著影響[4]。
ITS序列(Nuclear ribosomal internal transcribed spacer)是核糖體RNA 18S、5.8S和25S的間區(qū)序列,分別為ITS1和ITS2,其中ITS1-5.8S-ITS2序列是進(jìn)化生物學(xué)中常用的分子標(biāo)記之一[5-6]。相較于葉綠體或線粒體的單親遺傳,ITS序列位于細(xì)胞核,遵循雙親遺傳規(guī)律,在揭示種間雜交等復(fù)雜進(jìn)化過程中具有重要作用。由于ITS位點(diǎn)的通用引物在不同物種中均易于擴(kuò)增,且其基因間區(qū)的序列變異較大,是重要的barcoding標(biāo)記之一[5],能較好地反映種間系統(tǒng)發(fā)育關(guān)系。ITS序列在物種居群內(nèi)往往也存在較豐富的變異,可用于群體遺傳學(xué)研究[7-8]。然而,由于ITS序列常存在雜合現(xiàn)象,經(jīng)PCR擴(kuò)增后直接Sanger法測序的結(jié)果常出現(xiàn)套峰或亂峰,導(dǎo)致無法準(zhǔn)確獲取部分物種的序列。
本研究以線葉龍膽的7個居群為研究對象,通過對部分個體進(jìn)行基因克隆與測序,探討線葉龍膽ITS序列的基本特征及其遺傳分化,研究結(jié)果將為龍膽屬植物的進(jìn)化研究提供參考。
在青海、四川和西藏等地采集線葉龍膽7個居群共39個個體。在居群內(nèi),每個個體間距至少10 m;選取幼嫩的葉子用干燥硅膠快速干燥,密封保存于-20 ℃中。
用CTAB法[9]提取總DNA,用1%瓊脂糖檢測。選用通用的ITS1a-ITS4引物[10]進(jìn)行PCR擴(kuò)增,擴(kuò)增體系和擴(kuò)增反應(yīng)見表1,得到線葉龍膽的ITS1-5.8S-ITS2序列。將PCR產(chǎn)物純化后用ABI3730xl(Applied Biosystems, USA)進(jìn)行雙端測序,發(fā)現(xiàn)測序結(jié)果存在嚴(yán)重的套峰和亂峰,可能存在高度的雜合性。
為解決序列雜合性問題,將PCR產(chǎn)物用MiniBEST膠回收試劑盒(TaKaRa, China)回收,1%瓊脂糖電泳檢測,用分光光度計(jì)NanoDrop 2000(Thermo Scientific, USA)測定濃度后,與pMD 18-T載體(TaKaRa, China)在16 ℃連接4 h,5 μL反應(yīng)體系如下:載體50 ng,PCR純化產(chǎn)物20 ng, Solution I 1.0 μL。連接后的產(chǎn)物與E.coliDH5α感受態(tài)細(xì)胞(Takara, 大連)進(jìn)行轉(zhuǎn)化,操作參見產(chǎn)品說明書。37 ℃培養(yǎng)1 h后涂平板做藍(lán)白斑篩選,37 ℃倒置過夜培養(yǎng)。每個樣品挑取3~10個陽性單克隆在LB培養(yǎng)基中培養(yǎng)3~5 h,對菌液做PCR檢測,反應(yīng)體系和擴(kuò)增程序見表1。陽性克隆用BigDye v3.1(Applied Biosystems, USA)和ABI3730xl(Applied Biosystems, USA)測序。
在軟件GENEIOUS PRO 3.5.6[11]中查看測序結(jié)果,去掉載體序列,進(jìn)行數(shù)據(jù)整理和比對。在軟件DnaSP 5.1[12]中統(tǒng)計(jì)單倍型個數(shù),在ARLEQUIN 3.5[13]中計(jì)算基因多態(tài)性(h)與核苷酸多態(tài)性(π),并通過分子變異分析(AMOVA)[14]檢測遺傳變異在居群內(nèi)和居群間的分布情況。
采用最大似然法,在IQ-TREE[15]中基于單倍型構(gòu)建系統(tǒng)發(fā)育樹,核苷酸替換模型由IQ-TREE自動計(jì)算,設(shè)置bootstrap為100。參照龍膽屬的系統(tǒng)發(fā)育關(guān)系[2],從GenBank中下載序列,以線葉龍膽的近緣類群藍(lán)玉簪龍膽(AY858677),以及龍膽屬秦艽組的麻花艽(MF579734)、粗莖秦艽(MF506958)和粗壯秦艽(KM190185),龍膽屬龍膽草組的三花龍膽(KM051451)和一年生類群的鉆葉龍膽(AY858671)為外類群。
本研究對來自7個居群的39個個體進(jìn)行基因克隆與測序,共得到81條ITS序列,長度為631~646 bp。這些序列在175個位置存在堿基變異,包含153個堿基突變和23個缺失/插入,共鑒定出76個單倍型(GenBank No. MN124292-MN124367, 表2)。在153處堿基突變中,兩種堿基間的突變有142處,3種堿基間的突變有11處,分別占92.8%和7.2%。缺失/插入的堿基片段長度從1~14 bp,其中14 bp的缺失/插入只出現(xiàn)在居群6025的一個個體(6025_8)中。在這些線葉龍膽ITS序列中,堿基變異主要來源于ITS1和ITS2這兩個間區(qū),分別包含67處和76處變異,分別占總變異位點(diǎn)的38.28%和43.43%;5.8S核糖體RNA長度為156 bp,其中包含31個單堿基突變和1個14 bp的缺失/插入,占所有變異位點(diǎn)數(shù)的18.29%。這種高度雜合性,說明在線葉龍膽中對ITS序列的PCR產(chǎn)物直接測序是無法得到高質(zhì)量結(jié)果的。
在鑒定出的76個單倍型中,僅有2個單倍型在多個克隆中共享,剩余74個單倍型均為單個克隆特有。在共享的2個單倍型中,一個單倍型分布于4123居群的2個個體中,另一個單倍型分布于6025居群的1個個體和6039居群的3個個體中。
本研究中,線葉龍膽7個居群的基因多態(tài)性為0.9429~1,核苷酸多態(tài)性為0.007 924~0.034 529,遺傳多樣性高,但居群間的差異小(表2)。AMOVA分析表明,遺傳變異中的87.61%來自居群內(nèi),僅有12.39%的遺傳變異來自居群間(表3)。由于幾乎每條序列均為一種單倍型,因此用個體名稱來描述系統(tǒng)發(fā)育樹,并將不同居群用顏色加以區(qū)分,以考察居群間是否存在譜系關(guān)系。結(jié)果顯示,線葉龍膽ITS序列構(gòu)成了5個遺傳支系,但不同支系的支持率普遍較低,其中低于60%的支持率在圖中均未標(biāo)注(圖1)。同一居群的不同個體在系統(tǒng)發(fā)育樹上并不能聚到一支,而是分散于發(fā)育樹中。
表3 基于ITS序列的線葉龍膽分子變異分析
通過基因克隆,本研究發(fā)現(xiàn)線葉龍膽居群內(nèi)ITS序列存在高度的雜合性和遺傳分化,具體主要表現(xiàn)在兩個方面。一是變異位點(diǎn)非常豐富。在線葉龍膽長度為646 bp的ITS序列中,變異位點(diǎn)占比27.24%,顯著高于青藏高原的其他特有物種[7,16-18]。相較于基于葉綠體片段得到的遺傳多樣性指數(shù)[3],本研究的研究結(jié)果明顯高于前者。二是個體間共享的單倍型少。在已鑒定的76個單倍型種,僅有2個共享單倍型,個體間以及居群間的遺傳分化大,AMOVA的分析結(jié)果也證實(shí)了這一點(diǎn)。
每個單倍型用個體標(biāo)號表示;若一個單倍型為多個個體共享時,圖中用“/”分隔;同一居群的個體用同一種顏色標(biāo)注
對于線葉龍膽居群中ITS序列的高度雜合性,可能有如下3個原因。一是擴(kuò)增與測序錯誤。本研究采用的一代測序方法,即Sanger測序法,是目前準(zhǔn)確率最高的測序方法之一,常用于高通量測序結(jié)果的驗(yàn)證。然而,由于聚合酶存在一定的錯配率,通過PCR擴(kuò)增后的產(chǎn)物可能存在一些人為突變,尤其是擴(kuò)增循環(huán)次數(shù)過大時錯誤率會增高,而測序過程本身也包括了一次PCR擴(kuò)增。因此,測序錯誤是客觀存在的,但錯誤率一般很低[18]。然而,本研究所檢測的個體,均出現(xiàn)了大量的堿基替換以及缺失,且其頻率遠(yuǎn)大于測序錯誤率,因此我們可以排除測序錯誤這一因素。二是核基因的雜合性。ITS序列是雙親遺傳,雜合性是其特征之一。雖然在部分物種中ITS序列基本上為純合,如石礫唐松草[8]等;但由于重組和自然雜交,ITS雜合性在生物中是普遍存在的,如菊葉紅景天[3]、鮮卑花屬[17]等。然而已報(bào)道的ITS序列在居群中的雜合性多為堿基突變,缺失與插入報(bào)道較少,而在本研究中發(fā)現(xiàn)個體內(nèi)存在長達(dá)14 bp的缺失與插入。三是純化選擇不完全。由于ITS是串聯(lián)重復(fù)序列,在生物體內(nèi)存在大量的拷貝,經(jīng)過長期的進(jìn)化作用,生物體內(nèi)的ITS串聯(lián)序列一般是純合的。然而,若串聯(lián)序列在復(fù)制過程中出現(xiàn)變異,且純化選擇不完全時,一個個體內(nèi)就會出現(xiàn)多種變異類型共存的情況。線葉龍膽的ITS序列的雜合度很高,可能是由核基因特性與不完全的純化選擇共同導(dǎo)致的。
ITS序列作為常用的分子標(biāo)記片段之一,廣泛用于系統(tǒng)發(fā)育樹的構(gòu)建和群體遺傳結(jié)構(gòu)分析。然而,在處理ITS雜合序列時,如果人工選取某一條序列或采用PHASE方法[19]進(jìn)行分型,都無法得到個體內(nèi)ITS序列的真實(shí)情況。由于同一個個體的不同單倍型在系統(tǒng)發(fā)育樹上并不能聚成單系群,因此從同一個個體內(nèi)的單倍型中選取一個來代表該個體的做法可能會影響系統(tǒng)發(fā)育關(guān)系重建及相關(guān)進(jìn)化分析。雖然本研究中線葉龍膽ITS序列并未形成高支持率的支系結(jié)構(gòu),但不同個體間很少共享單倍型,而居群間共享的單倍型更少,隨機(jī)取樣仍可能給后續(xù)分析產(chǎn)生影響。盡管本研究對每個個體測序的單克隆數(shù)目有限,不足以覆蓋全部的變異類型,但已充分說明線葉龍膽的 ITS序列存在高度的雜合性和豐富的遺傳變異。因此,對于ITS序列存在高度雜合的物種,深入的克隆與測序工作是有必要的。