胡皓夫
關鍵詞:基因組 測序 鳥類 演化
地球上現(xiàn)存的幾千種各式各樣的美麗可愛的鳥。它們都是如何演化的,之間的親緣關系又是怎樣的。它們適應不同環(huán)境的能力背后有什么樣的遺傳物質基礎??茖W家利用最新的基因組學技術。從分子層面為人們解開鳥類多樣性背后的分子機理。
鳥類在人們心中一直有著重要的地位,在許多古代文明中都是重要的崇拜對象。它的圖騰常常出現(xiàn)在出土的陶器、玉器和古代壁畫上。像《山海經》中就有“湯谷上有扶木,一日方至,一日方出,皆載于烏”這樣的記載,這里的“烏”就是指中國古代神話中棲于太陽中的三足鳥。鳥類在生物科學的發(fā)展中也一直扮演著重要的角色。達爾文在加拉帕戈斯群島上發(fā)現(xiàn)的13種相似但又形態(tài)各異的鳥是他提出進化論的靈感來源。現(xiàn)在,雞、斑馬雀等鳥類已成為現(xiàn)代生物學研究中重要的模式生物,各種家禽在社會生活中也具有重大的經濟價值。因此,鳥類的研究在科學、經濟和文化方面都很有意義。但鳥類身上仍有許多未解的謎團:比如說鳥類的演化歷史是怎么樣的?現(xiàn)存的紛繁復雜的鳥類是如何發(fā)展出來的?它們間的親緣關系怎樣?造成這些鳥類多樣性背后的分子機理是什么?像南極的企鵝,又是怎么演化出適應各自環(huán)境的特征?這些問題都很有趣,但要回答清楚則不容易。
鳥類的演化
人們開始尋找和推測鳥類的祖先是從1861年在德國發(fā)現(xiàn)的始祖鳥化石開始的。這個可以追溯到侏羅紀晚期大約1.5億年前的化石,在雙臂和尾巴上出現(xiàn)了羽毛。但與鳥類不一樣的是,它有牙齒和由骨頭組成的尾巴,這是一種處于爬行動物和鳥類之間的中間狀態(tài)。隨著更多化石的發(fā)現(xiàn),比如中華龍鳥化石,鳥類和爬行動物之間的聯(lián)系漸漸變得清晰起來?,F(xiàn)在普遍認為鳥類起源于恐龍中的一支——獸腳亞目。然而,這些化石并不是現(xiàn)代鳥類的直系祖先?,F(xiàn)代鳥類的祖先出現(xiàn)于白堊紀,并且演化出了一些現(xiàn)代鳥類的特征。比如沒有牙齒,但出現(xiàn)了喙,尾骨縮短,有由羽毛組成的扇形尾巴等。在白堊紀。所有現(xiàn)代鳥類的祖先發(fā)生了第一次分化,出現(xiàn)了一些飛行能力不太強的鳥類祖先,其中包括鴕鳥的祖先。這次分化后形成的另外一支又出現(xiàn)一次分化,成為如今的雞、鴨、鵝的祖先。這是目前可以比較確定的結果。
之后鳥類的祖先經歷了生物演化史上一次重大事件——距今6600萬年前的白堊紀末生物大滅絕事件。它使恐龍成為歷史,也讓幸存的鳥類祖先獲得前所未有的生存空間。之后約1500萬年內。鳥類和哺乳動物一起迅速占領了地球上的每一個角落。除雞、鴨、鴕鳥這些已經分化出來的物種外,代表其余95%現(xiàn)代鳥類的物種在這一事件后迅速出現(xiàn)。這是一次鳥類生物多樣性爆發(fā)式增長,約萬余種鳥快速出現(xiàn),這是鳥類適應地球上各種環(huán)境的結果,也給鳥類的演化歷史研究提出許多挑戰(zhàn)性問題。首先,這些鳥類的親緣關系怎樣?哪些出現(xiàn)早。哪些后出現(xiàn)?由于在極短的時間內分化出眾多物種,使得這些問題很難回答。人們在這些問題上做過許多研究,但答案從來就沒有統(tǒng)一過。還有,鳥類能適應各種環(huán)境的背后,其遺傳物質DNA發(fā)生了哪些變化?人們仍知之甚少。要從分子水平回答這些問題,獲得鳥類基因組序列就顯得非常重要。
由來自深圳華大基因研究院和中國國家基因庫、美國杜克大學、霍華德·休斯醫(yī)學研究所、丹麥自然歷史博物館等機構的國際鳥類基因組聯(lián)盟,提出了一個針對整個鳥類基因組的研究計劃,嘗試解決這些問題。該研究計劃包括對鳥類所有目總計48個物種的基因組研究,比如烏鴉、隼、鸚鵡、企鵝、朱鹛、啄木鳥、鷹、鴨等,囊括了現(xiàn)代鳥類的主要分支。
測序技術的飛躍
龐大的基因組研究計劃如果沒有新的測序技術的支持,幾乎不可能完成。1990年啟動2003年完成的人類基因組計劃耗時13年、花費30億美元,旨在解開人類基因組所有30億個堿基對,當時運用的是第一代測序技術——桑格測序法。桑格測序法成本比較高,而且通量低(可同時進行序列測定的DNA分子較少),不適合進行大規(guī)模的基因組分析。鳥類基因組研究要完成基因組測序量是人類基因組計劃的十多倍,必須依賴更先進的第二代測序技術,它可以同時對上百萬甚至幾十億條DNA片段同時測序。這種高通量的平行測序法可以在短時間內獲得大量序列,從而降低成本。按最多的數(shù)據產出測算,一臺測序儀一天可產出4000億個堿基序列,相當于完成10個人的基因組測序。這些序列大多是幾百個堿基的短片段,在超級計算機的幫助下,可以將它們拼接成基因組序列的草圖。
目前,幾乎所有的主要生物類群都有其代表性物種的基因組序列結果。但對同一類群物種基因組測序和演化歷程的分析還從未有過。鳥類基因組的研究計劃是迄今為止對同一類群物種最大規(guī)模的基因組演化歷程分析,該計劃歷時4年,由上千名各國科學家參與,于2014年末得以完成。
對鳥類家譜的追本溯源
地質歷史時期中每次生物大滅絕事件之后,生物都會經過生態(tài)演替而發(fā)生一次較大而迅速的適應輻射,形成生物的爆發(fā)式的進化分異,從而導致地球上形成新的生物種群類型和群落結構,使全球生物面貌發(fā)生巨大變化。在白堊紀末大滅絕之后的地質歷史時期,被子植物、哺乳動物、鳥類、真骨魚類等成為重要的生物門類,空前繁盛,取代了中生代的爬行動物。
鳥類生物多樣性呈現(xiàn)爆發(fā)式的增長對推斷鳥類的演化歷史帶來很大困難。通常來說,在比較同一祖先物種后代的遺傳信息時,它們發(fā)生分離的時間愈早,之間的遺傳信息差異就愈大,分離較晚,則差異較小。這是利用DNA序列建立物種系統(tǒng)演化樹的基礎。然而這是一種假設在祖先群體剛剛開始發(fā)生分化后,分離的后代群體繼承了祖先群體所有的遺傳信息,并經歷足夠長的自然選擇下的理想情況。實際上,分離的群體存在沒有繼承全部祖先群體遺傳信息的概率,這在群體遺傳學上稱為不完全種系分離,它使得DNA序列的差異不能真實反映物種分化的事件。如果物種分化的事件在很短的時間內發(fā)生了很多次,那么不完全種系分離發(fā)生的概率就很高。鳥類在白堊紀大滅絕之后恰恰經歷了這樣一個時期,它們的基因組片段應該發(fā)生了許多這樣的事件。以前只是利用10到20個基因來推斷鳥類的演化關系,太少的基因序列無法代表鳥類整體的演化歷史。不完全種系分離產生的序列差異在判斷親緣關系時相當于“噪音”,如果選取的序列太少,就沒有足夠多的能和“噪音”區(qū)分開的反映物種演化的序列差異。如果用整個基因組的信息來分析,就可找到足夠多的差異來克服這些“噪音”的影響,從而得到更可靠的結果。
用基因組序列來推斷物種間的親緣關系,首先要找出序列上的同源區(qū)域。所謂同源區(qū)域就是由同一段祖先序列分化而來的分布于各物種基因組中的序列,這些序列的差異代表了物種演化過程中經歷的變化。通過這些差異可以推斷物種間從開始分化以來,DNA序列經歷了多少次堿基的替換,這些序列之間發(fā)生堿基替換的概率代表著物種之間的親緣關系,概率大表示親緣關系遠。通過這些關系,就可以找到最可能的系統(tǒng)演化樹。大多數(shù)用基因組比較的方法來構建系統(tǒng)演化樹的研究,使用的是編碼區(qū)的序列。但編碼區(qū)的序列往往變化較少,對鳥類來說,由于物種間分化的過程相對又很短,因此使用編碼區(qū)序列推斷鳥類分化時,由于序列間差異很少,不足以建立可靠的系統(tǒng)演化樹。所以需要再比較一些不那么保守的序列,比如內含子和基因間區(qū)里相對保守的序列,這樣物種間才有足夠大的差異用以區(qū)分。
通過每種鳥的全基因組數(shù)據來構建鳥類系統(tǒng)演化樹,這個想法要實現(xiàn)起來并不那么容易。鳥類平均有10億個堿基對,14000個基因。要處理這樣龐大的海量數(shù)據,需要更高效的計算方法。研究人員重新設計了算法,使巨大的數(shù)據可以在超級計算機上充分利用并行運算來處理。除了蛋白質編碼區(qū)的基因序列,還要加入內含子、基因間區(qū)來增加樣本量。這樣,計算任務更加龐大。因此,研究人員運用了華大基因、慕尼黑超算中心、得克薩斯高級計算中心和圣地亞哥高級計算中心等幾個超級計算中心的計算機進行并行運算才完成任務。有些分析任務甚至需要1萬億字節(jié)(TB)內存的超級計算機才能實現(xiàn)。
基于全基因組數(shù)據構建的鳥類分子系統(tǒng)演化樹是有史以來可信度最高的。這棵新的鳥類系統(tǒng)演化樹不但解決了鳥類的早期分化問題,還有一些新的發(fā)現(xiàn)。比如說,火烈鳥和白鷺雖然有很相似的在淺灘覓食的習性,但它們卻是親緣關系很遠的兩支,這是鳥類為適應水生環(huán)境獨立進化出了類似的特點。還有人們熟悉的鴨子、鵝,它們都有適應水生環(huán)境的特征,但親緣關系很遠,是典型的趨同進化。另外,根據演化樹,有些物種的傳統(tǒng)分類可能需要做出調整。比如雖然鷹和隼都是猛禽屬于隼型目,但它們不是近親,鷹與布谷鳥、啄木鳥比較接近,而隼與鸚鵡、烏鴉比較接近。
全基因組數(shù)據不但可以推斷現(xiàn)代鳥類的親緣關系,也可以推測現(xiàn)代鳥類的擴張時間。分析結果表明,現(xiàn)代鳥類的擴張發(fā)生在6600萬年前的大滅絕事件前后。這次大滅絕事件殺死了地球上絕大多數(shù)恐龍,只有部分鳥類存活下來,后來演化出1萬多種鳥。之前通過對部分DNA測序推斷,現(xiàn)代鳥類的擴張發(fā)生在大滅絕之前1000萬-8000萬年,而基于全基因組DNA分析的結果則否定了這一推斷,且與化石證據較吻合。大滅絕事件釋放的生存空間也許為鳥類新物種的形成創(chuàng)造了良好條件,它們在不到1500萬年的時間里快速繁盛起來。
從基因組中尋找鳥類演化的痕跡
鳥類在經歷了漫長的自然選擇后成了今天的樣子,其中的變化過程一定會在基因組中留下痕跡,通過比較分析基因組的序列就可以看到這些痕跡。鳥類雖然與哺乳動物一樣具有各種復雜的生物學特征,但是與哺乳動物相比,它的基因組可以稱得上非常簡潔。其基因組只有哺乳動物的三分之一大小,像內含子和基因間區(qū)這樣的非編碼序列比哺乳動物的少很多:基因組中轉座元件很少,只占基因組的4%-10%,而哺乳動物卻有34%-52%。在經歷了同樣漫長的演化過程后,鳥類之間基因組的差異比哺乳動物基因組之間的差異要少得多。這說明鳥類基因組的結構在演化過程中是很穩(wěn)定的,且基因組的演化速率也比哺乳動物的慢。
鳥類的特征在基因組中是怎么體現(xiàn)出來的呢?研究人員發(fā)現(xiàn),鳥類祖先從爬行動物中分化出來后丟失了成百上千的基因。這些基因在人類中都有很重要的功能,比如在維持生殖系統(tǒng),骨骼生成和肺部系統(tǒng)等方面不可或缺。這一發(fā)現(xiàn)出人意料,通常認為演化過程中新的遺傳物質是生物演化出新性狀必不可少的條件。然而鳥類的演化卻告訴人們,有些表型卻可能是通過基因丟失產生的。這是否是鳥類基因組比較簡潔的原因呢?目前還不得而知。
雖然整體上看鳥類的基因組變化得慢,但發(fā)現(xiàn)在一些特定區(qū)域卻有極其快速的演化。比如與骨骼形成相關的基因在鳥類中就發(fā)生了快速的變化,這關系到鳥類飛翔所需的輕便而強韌的骨骼的形成。鳥類羽毛的多彩多樣與控制羽毛顏色的基因的快速演化是分不開的。更有趣的是,一些具有相似生活習性或表型的鳥類,比如鳴禽、鸚鵡、蜂鳥等具有聲音學習能力的鳥,其部分基因組區(qū)域同時表現(xiàn)出極其快速的演化速率。這是首次在DNA水平上發(fā)現(xiàn)聲音學習趨同進化的證據。這些親緣關系很遠的鳥類獨立演化出相同表型的分子機制。
鳥類演化的細節(jié)
通過對基因組的比較,不但可從整體上對鳥類演化有一定了解,且對于回答很多具體問題也很有幫助。許多人們一直以來感興趣的課題可通過對一些特定種類的鳥或控制特定性狀的基因進行分析來尋找答案。
鳥類的聲音學習能力
鳴禽,鸚鵡和蜂鳥是除人、海豚等為數(shù)不多的動物之外具有聲音學習能力的動物。這些動物不但可以記住聽到的聲音并且可以學會它。鸚鵡和八哥就是其中的佼佼者。這項動物界少見的特殊技能一直是人們感興趣的話題。通過研究聲音學習能力的鳥類,可以幫助了解大腦是怎么處理學習的過程的,甚至對人們了解人類的語言學習能力有很大幫助。通過對鳥類基因組的研究,發(fā)現(xiàn)有聲音鳴唱學習能力的鳥類的大腦中,與聲音學習相關的基因調控回路和人類大腦中語言相關區(qū)域的基因呈相似的表達和演化歷史,說明鳥類和人在這方面有不少相似之處。而且這些變化很有可能與神經聯(lián)結的形成有關。這些區(qū)域表達的基因具有加強聲樂學習和聲帶驅動神經的聯(lián)系功能,能讓鳥和人類一樣完成更復雜的聲帶運動,從而發(fā)出豐富的聲音。鸚鵡更加特殊,它有一套獨特的鳴唱學習系統(tǒng),其中嵌套著另一套聲音學習系統(tǒng)。這也許就是它們具模仿人類語言的強大能力的原因。
性染色體的演化人類的性別由X染色體和Y染色體控制,而鳥類的性別則由Z染色體和W染色體來控制。W染色體是雌鳥特有的,好比Y染色體是男性特有的。大多數(shù)哺乳動物的Y染色體都經歷了相同的演化史,這些Y染色體絕大多數(shù)基因都已經退化且失去功能,只有很少一部分與雄性性狀相關的功能基因有活性。而鳥類卻與哺乳動物截然不同,鳥類基因組中半數(shù)以上的W染色體仍包含大量功能基因。
研究人員還發(fā)現(xiàn)不同鳥類的性染色體處于不同的演化階段中。例如,鴕鳥和鴯鹋,都屬于鳥類家族中相對古老的一支。其性染色體跟祖先狀態(tài)非常相似,大部分基因都有功能。然而,一些演化上相對年輕的種類,如家雞和斑馬雀,其性染色體則只包含少量功能基因。這為研究性染色體的進化歷程提供了絕好的材料。鳥類的兩性差異又是怎么通過性染色體表現(xiàn)出來的呢?比如,為什么雄孔雀和雌孔雀外表差異非常大,而雌雄烏鴉則很難辨別。這些問題有待進一步研究。
鳥沒有牙齒 所有的現(xiàn)代鳥類都沒有牙齒,說明牙齒在鳥類祖先中就已經沒有了。研究人員在基因組中找到了原因。在現(xiàn)存鳥類中,與脊椎動物形成牙釉質、牙本質相關的基因都發(fā)生了突變,導致它們失去了作用。
根據DNA序列之間的差異推斷,現(xiàn)存鳥類的共同祖先丟失牙齒的時間是在白堊紀末大滅絕之前。牙釉質丟失是在距今1.16億年前,整個牙齒的丟失不晚于距今1億年前。綜合化石和基因組的證據,推斷鳥類先是上頜牙齒丟失和上頜喙的產生,然后形成完全的喙,并丟失全部牙齒。至于牙齒為何丟失,研究認為這與鳥類適應新環(huán)境和生活方式有關。鳥類用喙獲取并快速吞下食物,同時演化出嗉囊和砂囊來儲存和研磨食物。這一消化方式使鳥類可在得到食物后繼續(xù)飛行以尋找新目標,從而帶來生存優(yōu)勢,也導致牙齒逐步退化。牙齒丟失還可起到減重功效,配合骨骼的輕量化,使鳥的身體重心從頭部向后下方轉移,使飛行更穩(wěn)定。
從鳥身上尋找恐龍的痕跡
作為從恐龍中發(fā)展出來的一支,鳥類或多或少保留著一些恐龍的痕跡。通過鳥類基因序列,還可以一探恐龍的究竟。比如,鱷魚作為活化石,其基因組是演化速率最慢的基因組之一。比較鳥類和鱷魚的基因組,可以推斷鳥類和鱷魚的共同祖先的基因組序列。這些序列對研究神秘恐龍?zhí)峁┝艘欢ǖ幕A。
與哺乳動物不同,鳥類具有大量的小染色體,這些小且富含基因的染色體也廣泛存在于爬行動物和魚類中,推測它們也同樣存在于恐龍中。研究人員通過分析家雞、火雞、北京鴨、斑馬雀和虎皮鸚鵡在全基因組上的染色體重組位點,來推斷鳥類祖先的染色體結構是怎樣的。結果發(fā)現(xiàn),雞具有和鳥類共同祖先最相似的染色體結構。從而可以看到演化成鳥的那一支恐龍具有怎樣的染色體結構。
幫助保護瀕危鳥類
鳥類是對環(huán)境變化極其敏感的動物,環(huán)境的快速變化有時甚至會導致其滅絕。在近代,人類活動所造成的環(huán)境變化是許多鳥類滅絕的主要原因。已有150種鳥類因為人類活動而滅絕,目前有差不多10%約1200種鳥類正面臨滅絕危險。通過對瀕危鳥類的基因組的研究,可以找出這些鳥類在基因組上的變化特點。為瀕危物種的保護工作提供理論指導。
朱鸚曾經遍布整個東亞地區(qū),但由于過度捕殺和棲息地的丟失,物種幾乎滅絕?,F(xiàn)在約2000只朱鵯是從1981年在秦嶺發(fā)現(xiàn)的僅有的一對可育個體恢復過來的。研究發(fā)現(xiàn),與大熊貓相比,朱鸚免疫系統(tǒng)相關基因多樣性很低,說明其免疫系統(tǒng)十分脆弱,導致整個群體對很多疾病和寄生蟲的抵抗能力較弱,物種仍處于較危險的狀態(tài)。有趣的是,在新恢復的朱鹮群體中,與大腦功能和新陳代謝相關基因具有更快的演化速率。這可能是朱鸚在經歷滅絕和恢復的過程中適應了新環(huán)境,改變了覓食的行為而造成的。也可能是當年重新發(fā)現(xiàn)的朱鸚因為改變了習性才得以幸存。
鳥類基因組攜帶的病毒序列
一些逆轉錄病毒會在感染后將自己的序列插入到宿主的基因組內。哺乳動物攜帶有大量的由于病毒感染后插入宿主基因組中的DNA“化石”,這些“化石”被稱作內源性病毒元件。人類基因組中約有8%的這種序列。研究人員發(fā)現(xiàn),鳥類的內源性病毒元件數(shù)量是哺乳動物的1/13到1/6,這與鳥類基因組比哺乳動物小的事實相符。而這個結果似乎也表明,鳥類要么更不容易被病毒入侵,要么能更好地把病毒清除出基因組序列。
企鵝如何在南極生存
鳥類存在于各種各樣的生態(tài)系統(tǒng)中,而且每種鳥都有其獨特的生存之道。企鵝是最值得一提的例子。企鵝有許多異于其他鳥類的特殊形態(tài)結構:不能飛翔,有獨特的翅膀結構和光滑且短的羽毛等。了解企鵝如何適應南極的嚴寒,對了解物種在適應環(huán)境的過程中所發(fā)生的分子水平上的變化很有幫助。為適應嚴寒,企鵝擁有厚厚的皮下脂肪,且儲存和消耗脂肪的能力出眾,這已反映在與脂肪代謝相關的基因變化上。此外,企鵝的視覺與其他鳥類稍有不同,由于主要在海里覓食,為適應海水里的光線,它們感受綠光的感光蛋白已失去功能。研究人員通過企鵝與其他鳥類的基因組比較分析,發(fā)現(xiàn)了與企鵝羽毛、翅膀相關的基因變化。
基因組學研究的重大突破
鳥類基因組研究計劃是由全球一百多個研究機構共同協(xié)作完成的。世界各地的許多博物館和機構在過去30年中收集的凍存鳥類組織樣本也為獲取DNA樣品提供了極大便利。這項計劃在正式開始前。就已做了大量的前期工作:組織樣本的收集和整理,DNA的提取,樣本質量檢測,測序,以及巨大數(shù)據的管理。
鳥類基因組研究計劃是第一次對同一類群物種進行全面分析,也是利用比較基因組學揭示生物宏觀演化歷史的一次重要嘗試。此外。相關性狀多樣性的研究也充分揭示了鳥類演化過程中分子水平上的遺傳多樣性基礎。其研究的全部數(shù)據將進入各個數(shù)據庫,通過大數(shù)據的分析和挖掘,為全球的研究人員從分子層面對鳥類進行研究提供方便。
對鳥類的研究計劃并不會止步于此。萬種鳥類基因組計劃是在鳥類基因組計劃基礎上,針對鳥類基因組更全面的測序計劃,會覆蓋鳥類中的每一科。針對其他類群動物的全面分析計劃也在越來越多地開展,比如已在進行的萬種動植物基因組測序計劃。隨著這些計劃的進行,基因組學的研究數(shù)據會更多,覆蓋的物種會更全面,得到的結果會更可靠,相關的研究會更加深入。基因組學研究的新時代即將來臨。