郭新梅,董 冰,葛兆鵬,裴玉賀,趙美愛(ài),宋希云*
(1.青島農(nóng)業(yè)大學(xué),山東 青島 266019;2.青島市主要農(nóng)作物種質(zhì)資源創(chuàng)新與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,山東 青島 266019)
【研究意義】單核苷酸多態(tài)性(single nucleotide polymorphisms SNPs)指在基因組水平上由單核苷酸的變異所引起的一種DNA 序列多態(tài)性,這種變異是由單堿基的轉(zhuǎn)換、顛換及單堿基的插入或缺失所引起的[1]?!厩叭搜芯窟M(jìn)展】1994年,SNPs這個(gè)術(shù)語(yǔ)首次在人類(lèi)分子遺傳雜志上出現(xiàn),Lander正式提出SNPs為新一代分子標(biāo)記[2]。1997年,作為第三代分子標(biāo)記的SNPs的提出與應(yīng)用,在生物界引起了DNA多態(tài)性研究的新高潮。在1999年的第二次“SNPs與復(fù)雜基因組”國(guó)際會(huì)議中,新增加了群體遺傳學(xué)與信息學(xué)的領(lǐng)域[3]。隨著SNPs的飛速發(fā)展,其在動(dòng)植物中的研究開(kāi)發(fā)也越來(lái)越受到關(guān)注,各種研究迅速開(kāi)展,尤其是在重要農(nóng)作物和模式動(dòng)物中已經(jīng)取得了可喜的成績(jī)[4-6]。SNPs分子標(biāo)記得到了較好的開(kāi)發(fā)[7],由于SNPs密度高,片段短,遺傳穩(wěn)定,易于高通量、自動(dòng)化分析[8],廣泛用于繪制EST圖譜、群體遺傳學(xué)和連鎖不平衡、遺傳標(biāo)記。而SNPs的檢驗(yàn)方法有很多,測(cè)序和單鏈構(gòu)象多態(tài)性(SSCP)檢測(cè)技術(shù)已經(jīng)非常的成熟,除此之外,有很多新的檢測(cè)技術(shù)頻頻出現(xiàn),并逐漸成為主要的檢測(cè)手段。SNPs為基于測(cè)序的高密度遺傳圖譜的構(gòu)建提供了有力工具[9]。直接測(cè)序法是目前最簡(jiǎn)單的SNPs檢測(cè)方法,檢出率基本可達(dá)到100 %。除此之外,采用直接測(cè)序的方法還能得到SNPs的類(lèi)型以及準(zhǔn)確位置等SNPs分型所需的重要參數(shù)。由于DNA測(cè)序趨于自動(dòng)化以及測(cè)序成本的降低,使得直接測(cè)序法越來(lái)越多的應(yīng)用于SNPs的檢測(cè)和分型,出現(xiàn)了很多生物類(lèi)型的全基因組分型SNPs芯片,然而這種芯片對(duì)大群體的試驗(yàn)來(lái)說(shuō),費(fèi)用高,大部分實(shí)驗(yàn)室無(wú)法完成這類(lèi)全基因組SNPs分型掃描?!颈狙芯壳腥朦c(diǎn)】本試驗(yàn)利用候選基因直接測(cè)序比對(duì)后獲得SNPs位點(diǎn),并通過(guò)HRM篩選和驗(yàn)證SNPs,分析、總結(jié)直接測(cè)序結(jié)合HRM法進(jìn)行SNPs位點(diǎn)的篩選和驗(yàn)證的優(yōu)缺點(diǎn),【擬解決的關(guān)鍵問(wèn)題】以期為直接測(cè)序法進(jìn)行大規(guī)模SNPs篩選提供參考。
玉米自交系H21,糯玉米紫糯96-619及171個(gè)以H21為輪回親本、紫糯96-619為非輪回親本回交5代自交2代的H21BC5F2∶3。材料由青島農(nóng)業(yè)大學(xué)分子育種實(shí)驗(yàn)室提供。
取適量玉米種子播種于培養(yǎng)盆中,培養(yǎng)盆中沙土濕度適中,將培養(yǎng)盆放置28 ℃培養(yǎng)箱中進(jìn)行暗培養(yǎng),待玉米苗長(zhǎng)至2~3片葉片時(shí)剪取葉片, CTAB法提取DNA,將其稀釋到100 ng/μl,-80 ℃冰箱中凍存?zhèn)溆谩?/p>
候選基因sbe1(AC211441)全長(zhǎng)序列由上海生工生物工程技術(shù)服務(wù)有限公司完成。根據(jù)候選基因AGPS1a-1(bt2)(AF334959)全長(zhǎng)序列,利用Primer 5進(jìn)行引物設(shè)計(jì),共設(shè)計(jì)了8對(duì)分段引物,引物由上海生工生物工程技術(shù)服務(wù)有限公司合成,具體的引物設(shè)計(jì)情況如表1所示。
引物合成后進(jìn)行PCR擴(kuò)增,PCR反應(yīng)體系(50 μl)為:dNTP 5 μl、5×buffer 10 μl、DNA模板 4 μl、上游引物 2 μl、下游引物 2 μl、高保真酶 1 μl、ddH2O 26 μl。PCR反應(yīng)程序?yàn)椋孩?5 ℃預(yù)變性1 min;②95 ℃變性20 s;③根據(jù)不同引物退火溫度(50到55 ℃不等),退火20 s;④72 ℃延伸30 s;⑤2~4重復(fù)35個(gè)循環(huán);⑥72 ℃后延伸5 min。每一個(gè)PCR反應(yīng)重復(fù)3次,產(chǎn)物送上海生工生物工程技術(shù)服務(wù)有限公司測(cè)序部進(jìn)行測(cè)序。測(cè)序結(jié)果使用DNAMAN軟件進(jìn)行比對(duì)分析。再利用ContigExpress軟件將核實(shí)后的測(cè)序結(jié)果進(jìn)行基因片段序列的拼接,確定AGPS1a-1(bt2)的全長(zhǎng)序列。
將獲得的sbe1和bt2候選基因全長(zhǎng)核酸序列用SoftBerry軟件翻譯成氨基酸序列,比對(duì)氨基酸序列的差異性。用Antheprot 5.0軟件進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè);用SWISS MODEL網(wǎng)站進(jìn)行蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)和功能域分析。根據(jù)親本的基因序列及氨基酸序列比對(duì)結(jié)果,在SNPs位點(diǎn)設(shè)計(jì)引物,引物設(shè)計(jì)情況如表2所示。
利用表2中的引物對(duì)親本進(jìn)行普通PCR擴(kuò)增之后,確定引物的最適退火溫度。按照確定好的每對(duì)引物的最佳退火溫度用于Rotor Gene Q(QIAGEN)的HRM(高分辨率熔解曲線(xiàn)) PCR擴(kuò)增,通過(guò)與親本間曲線(xiàn)的比對(duì)情況檢測(cè)后代基因型的分型情況。
親本及部分子代DNA提取結(jié)果如圖1所示,提取的DNA的純度和質(zhì)量較好,沒(méi)有RNA和其他雜質(zhì)污染,條帶較為清晰,可以進(jìn)行后續(xù)的試驗(yàn)研究。
引物合成后進(jìn)行目的片段PCR擴(kuò)增,經(jīng)0.8 %的瓊脂糖凝膠電泳檢測(cè),部分結(jié)果如圖2所示。
表1 bt2引物序列Table 1 Information of primers for bt2
表2 SNPs引物設(shè)計(jì)情況統(tǒng)計(jì)Table 2 Information of SNPs primers for bt2 and sbe1
從圖3(封三)可以看出,bt2基因的氨基酸序列在第322處不同,H21在此處的氨基酸為甲硫氨酸,而紫糯96-619的為異亮氨酸。根據(jù)以上的氨基酸序列進(jìn)行的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果如圖4所示。
從圖4(封三)可以看出,bt2基因編碼的蛋白質(zhì)二級(jí)結(jié)構(gòu)絕大多數(shù)都是α-螺旋和β-折疊,在親本中的表現(xiàn)很相似,但是又存在不同(圖4中箭頭所示),主要是折疊的位置不同或者區(qū)域大小有差別,如左側(cè)箭頭所示位置的β-折疊,H21比紫糯96-619明顯小;如右側(cè)箭頭所示的位置H21比紫糯96-619明顯少了一段β-折疊,說(shuō)明bt2基因在親本間的差異引起了蛋白二級(jí)結(jié)構(gòu)的變化。
A:M.15000 DNA marker;1.紫糯96-619;2.H21;B:M.15 000 DNA marker;1~12:部分子代圖1 親本(A)及部分BC5 F2∶3(B)的DNA提取Fig.1 DNA extraction of parents(A)and some BC5F2∶3(B) individuals
M. 2000 bp DNA marker; 1. bt2-5 H21; 2. bt2-5 紫糯; 3. bt2-6 H21; 4. bt2-6 紫糯;5. bt2-2 H21; 6. bt2-2 H21; 7. bt2-2 紫糯; 8. bt2-2 紫糯; 9. bt2-7 H21; 10. bt2-7 H21; 11. bt2-7 紫糯; 12. bt2-7 紫糯圖2 bt2部分引物對(duì)H21和紫糯96-619的擴(kuò)增Fig.2 Partial results of H21 and ZN96-619 PCR amplification using primers of bt2
根據(jù)氨基酸序列的變化,在SWISS MODEL網(wǎng)站上應(yīng)用同源建模法對(duì)蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)的結(jié)果如圖5所示,bt2基因編碼的兩親本之間的蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)模型幾乎是一樣的,只在箭頭所示的位置有所不同。說(shuō)明bt2基因在親本間的差異影響了蛋白三級(jí)結(jié)構(gòu)。
本文利用AIS數(shù)據(jù),構(gòu)建船舶領(lǐng)域統(tǒng)計(jì)方法模型,并根據(jù)目標(biāo)船周?chē)罱暗南鄬?duì)位置分布情況,采用最小二乘法確定領(lǐng)域邊界;利用荊州AIS數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,并對(duì)比分析橫駛船舶與直航船舶的船舶領(lǐng)域,得出橫駛船舶領(lǐng)域與直航船舶領(lǐng)域形狀特征的差異;對(duì)比不同尺度的上行和下行船舶的船舶領(lǐng)域,得到船舶尺度、航速對(duì)船舶領(lǐng)域大小的影響,為船舶在水上航行時(shí)的避碰和風(fēng)險(xiǎn)研究提供一定的理論依據(jù)。
sbe1基因的氨基酸序列比對(duì)結(jié)果如圖6所示,H21在第448個(gè)氨基酸為丙氨酸,紫糯96-619為天冬氨酸。根據(jù)以上的氨基酸序列進(jìn)行的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果如圖7所示。
圖7(封三)顯示,sbe1基因編碼的蛋白質(zhì)二級(jí)結(jié)構(gòu)絕大多數(shù)都是α-螺旋和β-折疊,折疊和無(wú)規(guī)則卷曲的位置及區(qū)域大小有差別,如箭頭所示的位置H21與紫糯96-619一段β-折疊大小及位置明顯不同,說(shuō)明sbe1基因在親本間的差異引起了蛋白二級(jí)結(jié)構(gòu)的變化。
根據(jù)氨基酸序列的變化,在SWISS MODEL網(wǎng)站上應(yīng)用同源建模法對(duì)蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)的結(jié)果如圖8所示,sbe1基因編碼的兩親本之間的蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)模型幾乎是一樣的。
上述結(jié)果顯示bt2和sbe1基因編碼的各自的親本蛋白質(zhì)在空間結(jié)構(gòu)上一樣的,只是在螺旋的長(zhǎng)度和折疊的數(shù)量上有細(xì)微的差別,其編碼的蛋白質(zhì)的具體功能有待進(jìn)一步研究。
圖8 sbe1基因編碼的紫糯96-619和H21的蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)Fig.8 Spatial structure prediction of proteins encoded by gene sbe1 in ZN 96-619 and H21
根據(jù)sbe1和bt2候選基因全長(zhǎng)核酸序列比對(duì)結(jié)果,在bt2基因找到17個(gè)SNPs位點(diǎn),在sbe1基因找到3個(gè)SNPs位點(diǎn)(圖略),結(jié)合親本氨基酸序列比對(duì)結(jié)果,共設(shè)計(jì)20對(duì) SNPs引物,引物情況如表2所示。
從圖9可以看出,縱軸顯示的是熒光值,橫軸表示的是溫度,由于DNA雙鏈中有SNPs存在,因此親本之間在雙鏈解開(kāi)時(shí)候的溫度有細(xì)微差異,以此將親本間的SNPs檢測(cè)出來(lái)。如圖所示,引物bt2-5129對(duì)親本紫糯96-619擴(kuò)增出的DNA熔解峰值在76.7 ℃,對(duì)H21擴(kuò)增出的DNA熔解峰值在77.2 ℃,有較為明顯的峰值差別,在對(duì)171個(gè)子代進(jìn)行分析的過(guò)程中,絕大多數(shù)后代的基因型與親本紫糯96-619相同,只有5個(gè)與親本H21相同。而部分引物如bt2-1918對(duì)親本擴(kuò)增的基因片段熔解最適溫度差異過(guò)小(0.08 ℃),無(wú)法進(jìn)行基因分型。引物bt26271、引物bt26408擴(kuò)增出的親本基因片段熔解的最適溫度差值分別為0.18、0.16 ℃,差異較小,也不宜用于后代基因分型。
如圖10所示,引物sbe1-2240對(duì)親本紫糯96-619擴(kuò)增出的DNA熔解峰值在77.42 ℃,對(duì)H21擴(kuò)增出的DNA熔解峰值在77.02 ℃,有較為明顯的峰值差別,在對(duì)171個(gè)子代進(jìn)行分析的過(guò)程中,絕大多數(shù)后代的基因型與親本紫糯96-619相同,只有16個(gè)與親本H21相同。
如圖11所示,引物sbe1-2361對(duì)親本紫糯96-619擴(kuò)增出的DNA熔解峰值在78.33 ℃,對(duì)H21擴(kuò)增出的DNA熔解峰值在78.85 ℃,有較為明顯的峰值差別,在對(duì)171個(gè)子代進(jìn)行分析的過(guò)程中,123個(gè)后代的基因型與親本H21相同,只有48個(gè)與親本紫糯96-619相同。
圖9 引物bt2-5129對(duì)后代擴(kuò)增的高分辨率熔解曲線(xiàn)和峰值Fig.9 HRM curves and peaks of some amplication results by primers bt2-5129
圖10 引物sbe1-2240對(duì)后代擴(kuò)增的高分辨率熔解曲線(xiàn)和峰值Fig.10 HRM curves and peaks of some amplication results by primers sbe1-2240
圖11 引物sbe1-2361對(duì)后代擴(kuò)增的高分辨率熔解曲線(xiàn)和峰值Fig.11 HRM curves and peaks of some amplication results by primers sbe1-2361
本文首先利用直接測(cè)序法獲得bt2和sbe1基因的全長(zhǎng)序列(基因登錄號(hào)分別為KR337996、KR706462、KR706463和KR337995),通過(guò)親本間序列比對(duì),找到了20個(gè)SNPs位點(diǎn),通過(guò)高分辨率熔解曲線(xiàn)(HRM),成功對(duì)171個(gè)高世代回交群體的SNPs位點(diǎn)分型。
直接測(cè)序法是目前最簡(jiǎn)單的SNPs檢測(cè)方法。其原理是:通過(guò)對(duì)不同個(gè)體的同一基因或者基因片段進(jìn)行測(cè)序以及序列的比較,確定我們所研究的堿基是否變異,檢出率可達(dá)到100 %。除此之外,采用直接測(cè)序的方法還能得到SNPs的類(lèi)型以及準(zhǔn)確位置等SNPs分型所需的重要參數(shù)。變性高效液相色譜(DHPLC)技術(shù)是在SSCP基礎(chǔ)上發(fā)展起來(lái)的新技術(shù)[10],這種方法的靈敏度和自動(dòng)化程度很高,在未知SNPs位點(diǎn)的檢測(cè)方面具有明顯的優(yōu)勢(shì),并且適合較大片段DNA的分析。其缺點(diǎn)是只能檢測(cè)樣本有無(wú)SNPs,不能確定SNPs的類(lèi)型和位置,若想獲得準(zhǔn)確的SNPs類(lèi)型與位置還是要通過(guò)測(cè)序的方法才能得到[11-12]。
目前檢測(cè)SNPs的方法還有很多,如焦磷酸測(cè)序(pyrosequencing),微測(cè)序(SNaPshot)、基于雜交原理的Taqman等。這些方法各有優(yōu)勢(shì),但也存在如適宜位點(diǎn)數(shù)量少的樣本,或者準(zhǔn)確率低、費(fèi)用較高等的缺點(diǎn)[13-14]。高分辨熔解曲線(xiàn)(High Resolution Melting, HRM)于2003 年由美國(guó)Wittwer 實(shí)驗(yàn)室第一次提出[15]。這種檢測(cè)方法操作簡(jiǎn)便、快速,使用成本低,結(jié)果準(zhǔn)確,并且實(shí)現(xiàn)了真正的閉管操作而受到普遍的關(guān)注,被 廣泛用于特定突變位點(diǎn)SNPs(包括缺失、重復(fù))的篩查、基因突變掃描、等位基因頻率分析 、物種鑒定、品種鑒定 、甲基化研究 、動(dòng)植物品質(zhì)相關(guān)多態(tài)性位點(diǎn)的研究等[16-20]。
本文首先利用直接測(cè)序法獲得bt2和sbe1基因的全長(zhǎng)序列(基因登錄號(hào)分別為KR337996、KR706462、KR706463和KR337995),通過(guò)序列比對(duì)獲得詳細(xì)地SNPs位點(diǎn)信息,同時(shí)通過(guò)HRM技術(shù)快速、準(zhǔn)確地對(duì)群體后代的基因分型。通過(guò)這2種方法的結(jié)合能高效完成大群體SNPs位點(diǎn)的篩選和分型。但在自主設(shè)計(jì)引物進(jìn)行全基因擴(kuò)增獲得全序列的過(guò)程中,遇到了以下幾個(gè)問(wèn)題:一是參考基因序列顯示某些區(qū)段GC含量較高,這會(huì)導(dǎo)致PCR擴(kuò)增不出目的片段或所得的目的片段,目的條帶不夠亮,從而影響測(cè)序的結(jié)果;二是引物除擴(kuò)增出特異性片段之外還有非特異性的片段,這對(duì)測(cè)序結(jié)果的準(zhǔn)確性有一定的影響。因此,為了獲得準(zhǔn)確的測(cè)序結(jié)果,本實(shí)驗(yàn)中每個(gè)樣品測(cè)序均進(jìn)行了3次重復(fù),以上所得結(jié)果是3次重復(fù)比對(duì)之后的結(jié)果,準(zhǔn)確性較高。同時(shí)利用在通過(guò)HRM進(jìn)行后代群體分型的過(guò)程中,部分引物如bt2-1918、bt2-6271、bt2-6408由于親本基因片段熔解的最適溫度差值較小,無(wú)法進(jìn)行基因分型,需要通過(guò)重新測(cè)序或重新設(shè)計(jì)引物或可以解決,而有些位點(diǎn)受基因序列本身的影響很難設(shè)計(jì)出符合HRM分析的引物,因此,HRM技術(shù)還需要進(jìn)一步完善與發(fā)展,使其更加有效地分析突變位點(diǎn)。
[1]王 會(huì),劉 佳,付 麗,等. 單核苷酸多態(tài)性在多倍體作物油菜中的研究進(jìn)展[J]. 中國(guó)油料作物學(xué)報(bào),2014,36(3):422-429.
[2]Lander E S. The new genomics:global views of biology[J]. Science, 1996, 274:536-539.
[3]Nebert D W. Pharmacogenetics:Why is this relevant to the clinical geneticist[J]. Clin Genet, 1999, 56(4):247-258.
[4]杜春芳, 劉惠民, 李潤(rùn)植,等. 單核苷酸多態(tài)性在作物遺傳及改良中的應(yīng)用[J]. 遺傳, 2003, 25(6):735-739.
[5]郝崗平, 楊 清, 吳忠義,等. 植物的單核苷酸多態(tài)性及其在作物遺傳育種中的應(yīng)用[J]. 植物學(xué)通報(bào), 2004,21(5):618-624.
[6]Huang J M, Zhang Y, Li J, et al. Development of SNPs markers in Crassostrea hongkongensis based on the next-generation sequencing and high resolution melting analysis[J]. Conservation Genetics Resources,2014(6):559-562.
[7]Qi J, Liu X, Shen D, et al. A genomic variation map provides insights into the genetic basis of cucumber domestication and diversity[J]. Nature Genetics, 2013, 45 (12):1510-1515.
[8]Landegren U, Nilsson M, Kwork P Y. Reading bits of genetic information:methods for single nucleotide poly-morphism analysis[J]. Genome Res, 1998, 8(8):769-776.
[9]袁金紅,李俊華,黃小城,等. 基于全基因組重測(cè)序的SNPs分析在作物基因定位中的研究進(jìn)展[J]. 植物生理學(xué)報(bào),2015,51(9):1400-1404.
[10]儀軍玲,李彩霞,胡 蘭. 單核苷酸多態(tài)性及其檢測(cè)方法[J]. 證據(jù)科學(xué),2008,16(6):757-762.
[11]劉雅誠(chéng),郝金萍,嚴(yán)江偉,等. 用dHPLC技術(shù)檢測(cè)線(xiàn)粒體DNA編碼區(qū)單核苷酸多態(tài)性[J]. 中國(guó)法醫(yī)學(xué)雜志,2006,21(3):142-146.
[12]秦效英,李國(guó)選,江 濱,等. 應(yīng)用變性高效液相色譜檢測(cè)CD31563位點(diǎn)單核普酸多態(tài)性[J]. 中華檢驗(yàn)醫(yī)學(xué)雜志,2006,29(7):627-630.
[13]張素華,李 莉,李成濤,等. TaqMan 探針技術(shù)用于X-SNPs 位點(diǎn)的分型[J]. 法醫(yī)學(xué)雜志,2010(1):22-25.
[14]王冬梅,李 俊,楊紅敏,等. 高分辨率熔解曲線(xiàn)HRM 在SNPs 檢測(cè)中的應(yīng)用[J]. 基因組學(xué)與應(yīng)用生物學(xué),2015,34(4):892-895.
[15]Vossen R H, Van D M, Daha M R, et al. High-throughput genotyping of mannose-binding lectin variants using high-resolution DNA-melting analysis[J]. Human Mutation, 2010, 31(4):1286-1293.
[16]Chen X, Kong F, Wang Q, et al.Rapid detection of isoniazid, rifampin, and ofloxacin resistance in mycobacterium tuberculosis clinical isolates using high-resolution melting analysis[J]. Journal of Clinical Microbiology, 2011,49(10):3450-3457.
[17]李 琛,許岸高,甘愛(ài)華,等. 高分辨率溶解曲線(xiàn)分析與基因測(cè)序檢測(cè)糞便DNA 對(duì)大腸癌篩查作用的比較[J].臨床消化病雜志,2011(6):356-358.
[18]吳 波,楊潤(rùn)婷,朱世平,等.寬皮柑橘單核苷酸多態(tài)性的高分辨率熔解曲線(xiàn)分型[J]. 園藝學(xué)報(bào), 2012(4):777-782.
[19]武 林,王 艷,孫夢(mèng)陽(yáng),等. 大豆脂肪酸Fad3a 基因HRM 檢測(cè)體系優(yōu)化研究[J]. 大豆科學(xué),2012(6):882-886.
[20]肖正龍,張龔煒,楊 宇,等. 家兔ATG16L1基因多態(tài)性與非特異性消化道紊亂易感性的研究[J]. 華北農(nóng)學(xué)報(bào),2013(4):234-238.