顧京晶
(1,湖南農業(yè)大學動物科技學院 410128;2,禽畜遺傳改良湖南省重點實驗室 410128)
馬的基因組計劃起源于20世紀90年代。1995年位于萊克星頓的肯塔基大學獸醫(yī)研究所為了從基因水平上研究馬的毛色基因及馬遺傳疾病發(fā)起此項研究。包括美國,法國,澳大利亞及英國等25個實驗室,超過100名的科研人員國家參與了馬基因圖譜計劃。隨著這項計劃的進行,美國國家人類基因組計劃研究中心終于2006年在馬的基因圖譜計劃后正式展開了馬的參考基因組計劃。
科學家們通過借鑒人類基因組中的一些手段來進行預測和繪制草圖。Bailey,Penedo,Caetano,Shiue,Swinburne,Raudsepp,Bowling,Lear,Milenkovic等學者在馬的基因組草圖的構建上做出巨大貢獻。這些草圖可以幫助后續(xù)研究者們將基因定位到染色體,定位基因之間的距離及鑒別基因的順序。然后通過這些信息的整理和組裝可以定位出馬的染色體標記,通過這些標記可以和人類參考基因組進行比較。
一匹位于紐約州名字叫做的Twilight的純血母馬是此項研究的目標。科學家們通過其血液的白細胞中提取DNA進行測序工作。2006年其測序數據被正式公開,到2009年其完整的注釋信息和其中研究過程發(fā)表在Science雜志上[1]。其完全組裝序列,基因注釋信息及和其他物種的比較發(fā)布在了ENSEMBL,EBI和NCBI等數據庫中。
馬的基因表達信息很少,所以基因注釋信息大多來自于其他物種,尤其是人類[2]。通過評估,馬的蛋白編碼基因有20449個。研究馬基因組的一個重要目的是鑒定覆蓋馬所有染色體的遺傳標記。在早期血液檢測中發(fā)現了大約50個馬的基因變異,而全基因組測序的好處是可以覆蓋到更多信息,以提供標準化的參考供人們研究馬的遺傳信息。為此學者們另選取了其他七匹馬進行部分測序,這7匹馬分別是Akhal-Teke(汗血馬),Andalusian(安達露西亞),Arabian(阿拉伯馬),Icelandic horse(冰島馬),Quarter horse(夸特馬),Standardbred(標準馬)及Thoroughbred(純血馬),綜合這些信息建立出SNP集。
比如毛色基因研究中的奶油稀釋,香檳稀釋,3種基礎毛色,黑,栗,黑紅色的表達都是由于基因中的SNP改變了構成蛋白質的氨基酸,而這些氨基酸的改變又會改變受體功能或影響酶的功能。通過參考基因組還可以研究序列的缺失,比如Lavender Foal Syndrome涉及到了蛋白編碼的缺失[1],這些缺失導致神經系統的紊亂,使馬匹死亡。此外還可以研究其他馬匹中基因結構的變化,比如Sabino毛色的突變,這種突變會導致馬毛色在某些區(qū)域產生特定白斑。這種突變發(fā)生在內含子和外顯子之間的區(qū)域,其突變擾亂了下一個外顯子加入到蛋白中的信號,雖然蛋白質仍然在運行,但改變了色素沉著功能,導致某些特定區(qū)域的白斑。另一研究是有關于Tobiano毛色基因的突變,這種突變主要是由于染色體重排造成的,將Tobiano毛色的馬匹基因序列和參考基因組進行比較,研究者們發(fā)現,在這個基因附近有50M左右的基因序列與其他馬匹相反,推測這種變化導致了Tobiano白色斑點的產生[2]。當然,馬參考基因組也被運用于轉錄組學的研究中,有超過30種的RNA在細胞中執(zhí)行功能,通過和參考基因組比較,我們可以研究其對基因表達和病毒抑制的機制。馬參考基因組可以廣泛運用于動物遺傳育種、動物遺傳疾病及動物營養(yǎng)學的研究中。