劉 青,潘浩研,黃家麗,JOHN Seymour Heslop Harrison
(1中國科學院 華南植物園,植物資源保護與可持續(xù)利用重點實驗室,廣東 廣州 510650;2 中國科學院 核心植物園,廣東 廣州 510650;3 中國科學院大學,北京 100049;4 華南農(nóng)業(yè)大學 生命科學學院,廣東 廣州 510642;5 萊斯特大學 遺傳學和基因組生物學系,英國 萊斯特 LE1 7RH)
核型分析(karyotype)是一種基于物種特有的一組或一套染色體,來構(gòu)建染色體形態(tài)學模式圖的研究方法,其在細胞遺傳學、分類學、染色體工程學中應用廣泛[1]。常規(guī)核型分析按照體細胞分裂中期的染色體長度、臂比、著絲點位置以及核型表達模式來進行分類[2-3]。然而對于染色體數(shù)目較多,或單條染色體間區(qū)別特征不明顯的物種,通過傳統(tǒng)核型分析無法識別該物種所有染色體。
隨著電子顯微鏡發(fā)明和計算機技術(shù)的進步,其促生了染色體顯帶技術(shù)(chromosome banding)。這是一種通過顯帶染色處理,使染色體一定部位顯示出深淺不同的帶紋,從而來分辨染色體細微特征的方法[4]。常見的有Q帶[5]、C帶[6]、N帶[7]、G帶[8]。熒光原位雜交(fluorescent in situ hybridization,F(xiàn)ISH)技術(shù)是一種基于堿基互補配對原則,采用熒光素標記DNA或RNA探針,再與單鏈的靶DNA或RNA分子雜交的方法[9]。染色體熒光顯帶(chromosome fluorochrome banding)技術(shù)是FISH技術(shù)的補充,該技術(shù)中常用復染劑的作用機理與DNA分子的堿基組成有關(guān),如4′,6-二脒基-2-苯基吲哚(4′,6-diamidino-2-phenylindole,DAPI)和色霉素A3(chromomycin A3,CMA3)可分別結(jié)合雙鏈DNA中的AT和CG堿基對,顯示染色體的特異標記信息[10]。
目前針對葫蘆科、秋英屬(Cosmos)等部分物種已開展染色體分子核型研究[11-12]。根據(jù)染色體形態(tài)特征,已解決茄屬(Solanum)、松屬(Pinus)種間親緣關(guān)系、柚(Citrusmaxima)的基因組核型鑒定問題[13-15]。但對于基因組內(nèi)染色體小且形態(tài)相似,或者基因組間分化程度小的物種鑒定,該方法尚有缺陷。如孫桂芳等[12]對秋英屬波斯菊(Cosmosbipinnata)與硫華菊(Cosmossulphureus)物種進行了研究,發(fā)現(xiàn)品種“風景(Scenery)”和“優(yōu)雅(Elegant)”與“凱萊(Sensation Gloria)”和“白蛋撻(Cupcakes White)”的核型不對稱系數(shù)相似,但卻屬于2個完全不同的形態(tài)種。
基因組學技術(shù)的飛速發(fā)展使作物科學理論與技術(shù)不斷實現(xiàn)新突破。全球30%的作物增產(chǎn)得益于野生近緣種在作物育種中的應用[16],作物野生種的遺傳多樣性呈現(xiàn)動態(tài)變化,因此一些潛在應用價值和適應意義,以及只有在特定環(huán)境下表達的隱藏遺傳變異很難被發(fā)現(xiàn)。研究表明,不同作物基因組大小差異較大,但其二倍體野生種中基因數(shù)量相似,均為3萬~4萬個[17],這可為植物染色體進化研究提供遺傳標記?;蚪M數(shù)據(jù)的積累,提供了越來越多染色體組型及帶型的DNA序列信息,也因此推動了遺傳標記開發(fā)的研究[18]。文章綜述了利用單拷貝序列染色體涂染(single-copy sequence based chromosome painting)和寡核苷酸熒光原位雜交(oligonucleotide-FISH,Oligo-FISH)技術(shù)合成新型探針池的方法,總結(jié)其在比較基因組學研究中的應用案例,以期為植物染色體分子核型研究提供參考。
染色體核型(karyotype)分析是指一個物種的染色體組在有絲分裂中期的表型,包括染色體數(shù)目、長度、著絲點位置、臂比、隨體有無等特征總和,是細胞遺傳學領(lǐng)域最基礎(chǔ)的研究內(nèi)容[2]。核型分析可以為細胞遺傳分類、物種間親緣關(guān)系以及染色體重組研究提供重要依據(jù)[19]。目前新技術(shù)正在被運用到核型分析中,特別是它與基因組學的結(jié)合日益緊密,建立染色體核型主要有根尖壓片法和熒光原位雜交技術(shù)。
植物細胞有絲分裂中期染色體標本的制備通常采用根尖壓片法[2,20],對根尖進行預處理、固定、解離[21-22],在顯微鏡下觀察染色體數(shù)量和形態(tài)特征。用Adobe Photoshop[23]等軟件統(tǒng)計染色體長度、臂比、著絲粒指數(shù)及核型不對稱系數(shù)[19,24-25],以推測物種親緣關(guān)系[26]與染色體重組[27]。如張超等[20]采用根尖壓片法,發(fā)現(xiàn)三倍體在山西太行山野生萱草(Hemerocalisfulva)中廣泛存在,提出核型不對稱系數(shù)與染色體倍性無關(guān)。張穎等[26]發(fā)現(xiàn)8個樣地的假臭草(Praxelisclematidea)具有4種不對稱核型,說明地理距離影響了假臭草的核型進化。Medeiros-Neto等[27]提出蘭科植物不對稱核型可能是染色體重組的原因之一。
采用FISH技術(shù)[28]可以鑒定作物外源遺傳物質(zhì)[29-30],判斷染色體間配對關(guān)系[31-32],闡明物種間親緣關(guān)系[33],并提高核型分析的精細程度[34-35],有助于深入了解基因組結(jié)構(gòu)和進化關(guān)系,輔助基因組組裝積累資源,有效地推動了核型分析工作。如王坤波等[36]采用亞洲棉(Gossypiumarboreum)總DNA對海島棉(Gossypiumbarbadense)體細胞染色體進行FISH試驗,明確了四倍體棉A與D亞基因組染色體長度的差別。Liu等[37]發(fā)現(xiàn)燕麥(Avenasativa)染色體具有C、A、D 3個亞基因組核型,且亞基因組間有頻繁易位現(xiàn)象(圖1)。
鑒定植物單條染色體是染色體進化研究的里程碑。在植物中應用最普遍的是物種間高度保守的基因家族核糖體RNA基因(rDNA),包括18S-5.8S-25S rDNA(簡稱45S rDNA),或其轉(zhuǎn)錄單元內(nèi)的一部分,如25S rDNA以及5S rDNA,此外還有端粒相關(guān)序列(telomere-associated sequences, TAS)、著絲粒區(qū)域特異重復序列和微衛(wèi)星序列。利用以上探針組合,黑麥(Secalecereale)、小麥(Triticumaestivum)、短柄草(Brachypodiumdistachyon)和燕麥(Avenasativa)中的部分染色體和染色體區(qū)域得以分辨[38-41]。但由于缺乏染色體水平基因組數(shù)據(jù),因此尋找單條染色體上特異的重復序列位點相當困難。隨著基因組測序技術(shù)進步和成本逐漸降低,部分植物類群已實現(xiàn)了單染色體鑒定,主要采用單拷貝基因染色體涂染技術(shù)和寡核苷酸熒光原位雜交技術(shù)完成。
單拷貝基因染色體涂染技術(shù)可為構(gòu)建細胞學圖譜提供直接證據(jù)。Lou等[42]采用單拷貝基因染色體涂染技術(shù),糾正了黃瓜(Cucumissativus)4號染色體遠端約2.16 Mb的基因組組裝錯誤。Wang等[43]標記9個單拷貝基因片段,用FISH技術(shù)完成了玉米(Zeamays)9號染色體上的基因定位。Danilova等[44]采用單拷貝基因染色體涂染技術(shù),發(fā)現(xiàn)了小麥A基因組特異的染色體間易位(T4AL/5AL和3AtL/4AtL)。這些研究均采用單拷貝基因染色體涂染技術(shù)驗證了基因組序列組裝結(jié)果,實現(xiàn)了核型精細結(jié)構(gòu)分析。
寡核苷酸熒光原位雜交技術(shù)(Oligo-FISH)在植物基因組內(nèi)單條染色體識別和染色體特定區(qū)域鑒定中獨具優(yōu)勢[45]。最早該技術(shù)被應用于大麥(Horedeumvulgare)和黑麥端粒序列的定位研究[46],1995年Doudrick等[47]用寡核苷酸熒光原位雜交技術(shù)開展?jié)竦厮?Pinuselliottiivar.elliottii) rDNA序列的定位研究,1996年Kamm等[48]完成了Tyl-copia反轉(zhuǎn)座子元件和rRNA序列在濕地松染色體上的定位研究。1997年在白云杉(Piceaglauca)和北美云杉(Piceasitchensis)基因組結(jié)構(gòu)研究中,首次提到分子核型(molecular karyotype)的概念[49],標志著植物染色體進化研究進入分子核型時代。研究者對寡核苷酸熒光原位雜交技術(shù)進行優(yōu)化,高分辨率多重寡核苷酸熒光原位雜交技術(shù)和非變性寡核苷酸原位雜交(non-denaturing fluorescent in situ hybridization,ND-FISH)技術(shù)逐漸得以應用。
Cui等[50]采用多重寡核苷酸熒光原位雜交技術(shù)鑒定了小麥、中間偃麥草(Thinopyrumintermedium)單條染色體。Huang等[51]采用高分辨率多重寡核苷酸熒光原位雜交技術(shù),在148個中國小麥品種中發(fā)現(xiàn)了14個結(jié)構(gòu)重組以及167個多態(tài)染色體區(qū)域。寡核苷酸熒光原位雜交技術(shù)還推動了基因組學的進步。Zhou等[52]對人參(Panaxginseng)開展了寡核苷酸熒光原位雜交研究,鑒定了人參基因組結(jié)構(gòu),追溯了人參的起源及分化歷史。Piperidis等[53]采用Oligo-FISH技術(shù)分析了甘蔗屬(Saccharum)不同品種及候選親本物種的基因組結(jié)構(gòu),揭示甜根子草(S.spontaneum) 5號染色體與甘蔗(S.officinarum) 8號染色體之間發(fā)生了易位事件。Liu等[45]采用Oligo-FISH技術(shù)發(fā)現(xiàn),野生稻3號染色體一個片段易位到5號染色體上,并鑒定了水稻不同品系非整倍體染色體的起源。Agrawal等[54]采用Oligo-FISH技術(shù)完成了蕓苔屬蔓菁(Brassicarapa)的單染色體鑒定。因此,Oligo-FISH技術(shù)在染色體進化研究中逐漸成為應用主流。
另外,也有研究采用ND-FISH方法來鑒定植物外源染色體。Fu等[55]將Oligo-1162、Oligo-pSc200和Oligo-pSc250探針用于ND-FISH研究,代替黑麥基因組DNA探針,以區(qū)分黑麥和小麥染色體。Ren等[56]采用5種寡核苷酸探針,鑒定了小麥全部染色體。An等[57]采用ND-FISH方法鑒定小麥WR35的B和D基因組以及B和A基因組之間發(fā)生的染色體易位事件。以上研究說明利用ND-FISH方法能夠鑒別染色體來源和結(jié)構(gòu)變異。
單拷貝序列染色體涂染技術(shù)對所標記片段的長度有限制,一般應在10 kb以下,且在實驗操作以及探針設(shè)計上有兩點需要注意:一是為得到覆蓋整條染色體的遺傳標記,須設(shè)計細菌人工染色體(bacterial artificial chromosome,BAC)片段,這需要耗費大量時間和較高的PCR擴增成本[58];二是對于重復序列占比較高且染色體數(shù)目較多的植物,單拷貝片段篩選往往成為技術(shù)瓶頸[4,59]。為解決上述難題,需要已知染色體水平的正確組裝序列,篩選每條染色體上足夠數(shù)量的單拷貝序列,保證篩選的序列信號達到可視化[46]。寡核苷酸熒光原位雜交技術(shù)是鑒定復雜基因組植物單染色體的前沿技術(shù),可有效解決這些問題。
與傳統(tǒng)探針相比,寡核苷酸探針庫對無參考基因組的植物具有重要應用價值,依據(jù)某種植物基因組設(shè)計的寡核苷酸探針可在其近緣物種中得到應用。如Han等[58]采用黃瓜(Cucumissativus) Oligos探針庫鑒定了野生黃瓜的單條染色體;Braz等[60]使用陽芋(Solanumtuberosum) Oligos探針庫,在番茄(Solanumlycopersicum)染色體上得到了特異染色體信號。Tang等[61]使用Oligo-pAs1-1探針,對小麥和小麥×黑麥雜交種進行了FISH研究,極大地節(jié)約了成本。寡核苷酸探針庫還可用于鑒別多倍體物種同源染色體之間的親緣關(guān)系,如四倍體柳枝稷(Panicumuirgatum)染色體對4a與4b(同源序列大于90%),其寡核苷酸探針庫FISH信號強度大于染色體對8a與8b(同源序列大于70%)[62],證明同源序列占比高的FISH結(jié)果相對準確,在異源多倍體植物染色體進化研究中獨辟蹊徑。
寡核苷酸熒光原位雜交技術(shù)受到眾多研究者青睞,是因為其有如下優(yōu)點:(1) 單拷貝序列的特異性高。設(shè)計探針時可以去除基因組中的重復序列(包括同源序列、rDNA、葉綠體DNA等),不加封阻DNA也不會產(chǎn)生背景信號。(2) 可以準確識別染色體精細結(jié)構(gòu)。因寡核苷酸探針短,因此可牢固地結(jié)合染色體上的目標區(qū)域。(3) 探針庫設(shè)計靈活。通過生物信息學軟件分析染色體水平基因組數(shù)據(jù),即可獲得不同探針庫。(4) 探針庫穩(wěn)定性強。該技術(shù)適用于跨物種熒光原位雜交,如水稻(Oryzasativa)、黃瓜(Cucumissativus)、雷蒙德氏棉(Gossypiumraimondii)等已實現(xiàn)單染色體準確鑒定[45,58,63]。因此,寡核苷酸熒光原位雜交技術(shù)成為單染色體圖譜構(gòu)建不可替代的技術(shù)[60]。
但在Oligo-FISH技術(shù)應用中,探針數(shù)目多少決定著信號質(zhì)量的優(yōu)劣。有研究者認為,中期染色體寡核苷酸探針密度為0.1~0.5 oligos/kb較為合適;對于小于10 kb的目標區(qū)域需選擇盡可能多的寡核苷酸短片段[62]。對于大型基因組或者高比例重復序列的植物而言,篩選特異探針庫的難度較大。這是因為重復序列占比較高時,寡核苷酸探針密度下降,在染色體上的熒光強度也隨之下降,導致寡核苷酸信號檢測相對困難。如果信號放大,在非目標基因序列中則可能出現(xiàn)背景信號(非特異雜交片段),導致假陽性。如劉玉玲等[63-64]采用地高辛標記的雷蒙德氏棉D(zhuǎn)501染色體探針庫的信號結(jié)果相對彌散,某些區(qū)域可能是假陽性。因此,設(shè)計優(yōu)質(zhì)探針庫是應用寡核苷酸原位雜交技術(shù)的關(guān)鍵。前期研究發(fā)現(xiàn),選擇目標區(qū)域時應遵循以下規(guī)則:(1) 盡量避開重復序列占比較高的染色體區(qū)域[37]。(2) 設(shè)計的寡核苷酸序列GC含量在30%~66%。(3) 寡核苷酸(短)片段內(nèi)相同堿基連續(xù)重復數(shù)目一般不多于6個。(4) 寡核苷酸片段與非目標區(qū)域(或片段)的相似度不高于80%。(5) 寡核苷酸片段的退火溫度與潛在發(fā)夾結(jié)構(gòu)退火溫度之差大于10 ℃。
染色體上的編碼基因是作物改良的“密碼本”,單染色體鑒定是作物改良的基礎(chǔ),因此單染色體鑒定是染色體進化研究的必然趨勢。單拷貝基因染色體涂染技術(shù)可用于鑒定單染色體,在重復序列占比較高的植物中應用效果較好。如大麥基因組重復序列達80%以上[65],采用單拷貝基因染色體涂染技術(shù),分析大麥(H.vulgare)和球莖大麥(H.bulbosum) 3H染色體共線性[66],揭示了單拷貝序列探針對染色體特殊結(jié)構(gòu)鑒定的應用價值。
除單拷貝基因染色體涂染外,植物染色體分子核型的輔助標記還有重復DNA序列和低拷貝短序列。例如2019年楊婷等[67]用來源于黑麥近端粒區(qū)域的pSc200與pSc250重復序列進行原位雜交,鑒定了林保小黑麥(Triticalerimpau)14條染色體。曾艷華等[68]用重復序列對自交系300玉米(Zeamays)開展熒光原位雜交試驗,發(fā)現(xiàn)了10條染色體有較強信號。周湘英[69]使用A基因組重復序列pAs120a鑒定了燕麥A基因組14條染色體。雖然重復序列熒光原位雜交可以有效地區(qū)分染色體組,但利用重復序列無法鑒定單條染色體。對于重復序列占比較高的植物單染色體進行鑒定,亟待開發(fā)物種通用寡核苷酸庫,這是該領(lǐng)域未來研究的主要方向。
未來植物染色體分子核型研究需要關(guān)注的重點有:(1) 提高基因組裝配準確度,包括重復序列庫及著絲粒和端粒區(qū)域(序列)的鑒定。(2) 提高單拷貝探針序列的特異性,前期試驗證明,含有同源序列探針、探針密度低等均是造成探針庫特異性不高的主要原因[45,54],因此應該選擇多于2 000個寡核苷酸片段的目標區(qū)域,且同源序列≤80%的短片段集合設(shè)計探針庫。(3) 為鑒定染色體組間及染色體內(nèi)部的重組變異,目標區(qū)域應該定位在染色體重組熱點區(qū)域,以便提供染色體間或者染色體內(nèi)部的重組證據(jù)。(4)染色體分子核型研究亟需多物種研究的案例積累,并深入研究探針設(shè)計策略,以實現(xiàn)精準識別單條染色體及染色體特定區(qū)域重組變異。
志謝:感謝揚州大學龔志云和張韜教授提供寡核苷酸引物設(shè)計方法。