古DNA是指從古代樣本中獲取的任何遺傳物質(zhì),年代從數(shù)十萬(wàn)年到數(shù)百年不等。其研究對(duì)象包括線粒體DNA、Y染色體DNA和核基因組。線粒體DNA是存在于細(xì)胞核之外的小型環(huán)狀DNA,包含約16 500個(gè)堿基對(duì),具有多拷貝、高突變率、易受遺傳漂變的影響等特性,在高度降解的樣本中更容易被檢測(cè)到,有助于科學(xué)家們追蹤母系血統(tǒng)的歷史及人類進(jìn)化過(guò)程中微小的遺傳變化。Y染色體DNA是男性特有的,全長(zhǎng)約為60Mb,主要通過(guò)父系遺傳,其大部分區(qū)域不與X染色體發(fā)生同源重組,在構(gòu)建譜系樹(shù)和追蹤父系血統(tǒng)方面具有極高的分辨率,其顯著的地理分布特異性為研究特定地域人群的遺傳特征提供了寶貴的信息。核基因組是指存儲(chǔ)在細(xì)胞核內(nèi)的全部遺傳物質(zhì),大約有30億個(gè)堿基對(duì),包含22對(duì)常染色體和1對(duì)性染色體,在劃分精細(xì)人群結(jié)構(gòu)、估算人群混合時(shí)間和推斷人群混合程度等方面存在較大優(yōu)勢(shì)。近年來(lái),隨著古DNA提取、建庫(kù)、捕獲以及第二代測(cè)序技術(shù)(next-generation sequencing, NGS)的快速發(fā)展,研究人員可以從古代遺骸中直接獲取數(shù)以千兆堿基的信息。這些信息為我們提供了一個(gè)了解過(guò)去生物體、環(huán)境和事件的直接窗口,也是分子考古學(xué)這門交叉學(xué)科得以建立的基礎(chǔ)。
古基因組學(xué)的研究始于從古代遺骸中提取和分析DNA技術(shù)的發(fā)展。1984年伊格奇(R. Higuchi)等首次從已滅絕的斑驢(quagga)的皮膚中鑒定出一段229個(gè)堿基對(duì)的線粒體DNA,標(biāo)志著古DNA研究的開(kāi)始[1]。瑞典科學(xué)家帕博(S. P??bo)從一具距今約2400年的埃及木乃伊中提取出DNA[2],盡管埃及木乃伊的DNA序列現(xiàn)在看來(lái)很可能是來(lái)自現(xiàn)代的污染物,但它為古DNA技術(shù)的發(fā)展奠定了重要基礎(chǔ)。聚合酶鏈?zhǔn)椒磻?yīng)(PCR)技術(shù)的發(fā)展使得從古代樣本中擴(kuò)增微量DNA成為可能。結(jié)合新的提取技術(shù),PCR可以用于分析來(lái)自骨骼、牙齒等鈣化遺骸的DNA,這極大地?cái)U(kuò)展了古DNA研究的范圍,也為后來(lái)古基因組學(xué)研究奠定了重要基礎(chǔ)。然而,古DNA的高度降解及PCR對(duì)污染的敏感性也導(dǎo)致了一系列的假陽(yáng)性結(jié)果。進(jìn)入2000年后,古基因組學(xué)迎來(lái)了重大突破,科學(xué)家們成功檢測(cè)了古代人類和已滅絕的猛犸象的基因組。第二代測(cè)序技術(shù)的發(fā)展極大地提高了DNA測(cè)序的效率和精度,使科學(xué)家們可以從古代樣本中獲取完整的基因組序列,推動(dòng)了古基因組學(xué)的發(fā)展。這一系列技術(shù)進(jìn)步使得我們可以更深刻地理解過(guò)去的生物群體及其進(jìn)化歷史,同時(shí)也推動(dòng)了古DNA在多個(gè)科學(xué)領(lǐng)域的應(yīng)用。
隨著第二代測(cè)序技術(shù)的發(fā)展及檢測(cè)成本的顯著降低,古基因組學(xué)在重構(gòu)人類歷史中發(fā)揮著越來(lái)越重要的作用:揭示了世界范圍內(nèi)人群的遷徙混合歷史、人類適應(yīng)性突變的興起與發(fā)展、疾病的起源與傳播及社會(huì)組織結(jié)構(gòu)的變化等。
人群遷徙混合歷史
近年來(lái),隨著大量古基因組學(xué)數(shù)據(jù)的發(fā)表,歐亞大陸西部、內(nèi)亞地區(qū)、西伯利亞、美洲及東亞和東南亞地區(qū)的人群歷史逐漸被勾勒出來(lái)。相比歐亞大陸西部,東亞地區(qū)古基因組的研究相對(duì)薄弱。已有研究顯示,末次盛冰期之后,東亞大陸開(kāi)始出現(xiàn)古代東亞北部人群和古代東亞南部人群,二者之間的分化時(shí)間至少在1萬(wàn)年前。進(jìn)入新石器時(shí)代之后,東亞南部人群和北部人群之間的交流逐漸增強(qiáng),東亞北部人群向南方擴(kuò)張。筆者所在課題組一直著力于對(duì)東亞地區(qū)新石器時(shí)代人群歷史的研究。最近,我們重建了山東地區(qū)6000年以來(lái)的人群歷史,發(fā)現(xiàn)大汶口時(shí)期的山東人群主要由黃河中游農(nóng)業(yè)人群、部分山東本地采集狩獵人群和中國(guó)南方古代人群三種祖先成分混合形成。該研究支持了嚴(yán)文明先生早年提出的“重瓣花朵式假說(shuō)”,黃河中游的新石器農(nóng)業(yè)人群作為花心,在史前不同北方人群的遺傳結(jié)構(gòu)中產(chǎn)生著重瓣花朵式的影響,而龍山時(shí)期的山東人群與大汶口時(shí)期的人群保持著遺傳上的連續(xù)性[3]。
對(duì)于歷史名人遺傳結(jié)構(gòu)的研究,有助于我們研究一些古代族群的來(lái)源問(wèn)題。筆者所在課題組近年先后對(duì)阿史那皇后、北周武帝宇文邕、高賓等歷史名人的基因組進(jìn)行了研究,為揭示鮮卑、突厥等古代族群的來(lái)源問(wèn)題提供了重要的依據(jù),對(duì)歷史發(fā)展進(jìn)程中的胡漢融合問(wèn)題也有了更深刻的理解。例如,通過(guò)對(duì)木桿可汗的女兒阿史那皇后基因組的研究,解決了關(guān)于突厥阿史那部祖源的問(wèn)題,明確了突厥阿史那部起源于東北亞,即今天的中國(guó)東北到俄羅斯貝加爾湖區(qū)域,否定了歐亞大陸西部起源說(shuō)和多重起源說(shuō)。另外,阿史那氏與鐵器時(shí)代以后的通古斯語(yǔ)人群和蒙古語(yǔ)游牧人群共享更多的基因,如柔然、鮮卑、契丹和黑水靺鞨,與其他古突厥人有顯著的遺傳差異,顯示了突厥汗國(guó)內(nèi)部的多重來(lái)源。最后,突厥阿史那部對(duì)現(xiàn)代突厥語(yǔ)人群的遺傳貢獻(xiàn)非常有限,再次確定了突厥語(yǔ)為文化傳播模式,而非人群擴(kuò)張模式[4]。對(duì)北周武帝宇文邕的研究則揭示了武帝及其家族的族源,對(duì)于理解鮮卑人的起源意義重大。鮮卑人的外貌長(zhǎng)相是歷史學(xué)界較具爭(zhēng)議的話題之一,一些史料表明“鮮卑人具有須發(fā)茂盛、發(fā)色偏黃、高鼻深目等西域胡人特征”,也有史料記載“鮮卑人與東北亞人群長(zhǎng)相沒(méi)有差別”。我們根據(jù)與色素沉積相關(guān)的位點(diǎn),發(fā)現(xiàn)武帝是黑色頭發(fā)、黃色皮膚和棕色眼睛,符合典型的東北亞、東亞人長(zhǎng)相,這也為我們解開(kāi)了一些歷史上的謎題。
人類適應(yīng)性
自然選擇是一個(gè)非隨機(jī)的、定向的過(guò)程,會(huì)導(dǎo)致與表型相關(guān)的等位基因頻率增加,從而在特定環(huán)境下賦予適應(yīng)性優(yōu)勢(shì)。人類是如何進(jìn)化以應(yīng)對(duì)他們?cè)跀U(kuò)張過(guò)程中遇到的新環(huán)境?史前人類是否在生物學(xué)上適應(yīng)了文化變化,例如與農(nóng)業(yè)相關(guān)的飲食變化?這一過(guò)程通過(guò)古代DNA的研究可以更加準(zhǔn)確地追蹤和分析,揭示現(xiàn)代人類遺傳多樣性的形成過(guò)程。
經(jīng)典的生物文化適應(yīng)的例子是進(jìn)入成年期持續(xù)產(chǎn)生乳糖消化酶與收集和消費(fèi)來(lái)自馴養(yǎng)動(dòng)物如牛奶及其乳制品的文化習(xí)慣共同演化的過(guò)程。如果沒(méi)有乳糖耐受性,食用乳糖的成年人可能會(huì)出現(xiàn)包括腹瀉在內(nèi)的腸道癥狀,甚至導(dǎo)致?tīng)I(yíng)養(yǎng)損失,無(wú)法從乳糖消化中獲得直接的能量益處。人類乳糖耐受性在全球多個(gè)地區(qū)獨(dú)立進(jìn)化,根據(jù)現(xiàn)代歐洲人的基因數(shù)據(jù),賦予乳糖耐受性的調(diào)控突變始于大約7500年前[5],與新石器時(shí)代(農(nóng)業(yè))文化向該地區(qū)的傳播相吻合。然而,古DNA數(shù)據(jù)表明,這種適應(yīng)性變體的頻率增加和地理分布僅發(fā)生在過(guò)去5000年。古DNA所揭示的乳糖耐受性基因的變化對(duì)我們理解史前人類健康和行為方式具有重要意義。
人類疾病史
長(zhǎng)期以來(lái),傳染病的研究是通過(guò)對(duì)考古發(fā)掘中的骨骼進(jìn)行古病理學(xué)評(píng)估來(lái)進(jìn)行的。然而,這種方法存在很大的局限性,因?yàn)樵S多感染不會(huì)在骨骼上留下可見(jiàn)的痕跡,這導(dǎo)致疾病的出現(xiàn)率往往被低估,鑒定的準(zhǔn)確性也較低。第二代測(cè)序技術(shù)的出現(xiàn)極大地彌補(bǔ)了這一缺陷,該技術(shù)不僅可以獲得人類群體的遺傳信息,還可以研究病原體的基因組。病原體基因組分析對(duì)于我們理解病原體如何以及何時(shí)出現(xiàn)和進(jìn)化很有價(jià)值。迄今為止,鼠疫耶爾森菌(鼠疫)、天花病毒(天花)、霍亂弧菌(霍亂)、HBV(乙型肝炎病毒)、結(jié)核分枝桿菌(結(jié)核病)和麻風(fēng)分枝桿菌(麻風(fēng)?。┑裙糯≡w都得到了廣泛的關(guān)注和研究。
麻風(fēng)病被認(rèn)為是已知最古老的人類疾病之一,如今在亞洲、非洲和南美洲依然流行,每年有超過(guò) 20萬(wàn)例病例,其主要病原體是麻風(fēng)分枝桿菌。該疾病的特征是顱骨損傷(鼻頜骨綜合征)和手腳畸形,但是在骨骼遺骸中診斷麻風(fēng)病很困難,因?yàn)槊范竞豌y屑病關(guān)節(jié)炎也會(huì)引起類似的骨骼變化。由于麻風(fēng)分枝桿菌是一種專性病原體,因此在古人的遺骸中存在該分枝桿菌被認(rèn)為是感染麻風(fēng)病的明確證據(jù)。莫諾(M. Monot)等基于對(duì)不同區(qū)域大量現(xiàn)代樣本的比較遺傳分析,發(fā)現(xiàn)所有的麻風(fēng)病病例都可歸類于一個(gè)簇,并描述了4種主要的麻風(fēng)分枝桿菌菌株。根據(jù)這些菌株的傳播情況,提出了一種假設(shè),即該疾病出現(xiàn)于東非或中東,隨后在人口遷移過(guò)程中傳播[7]。后有研究人員從中世紀(jì)歐洲各個(gè)地區(qū)的麻風(fēng)病患者遺骸中獲得了10株麻風(fēng)分枝桿菌的基因組,并對(duì)麻風(fēng)分枝桿菌的遺傳多樣性和種群結(jié)構(gòu)進(jìn)行了分析[8]。
來(lái)自這些病原體的基因組數(shù)據(jù)補(bǔ)充了古病理學(xué)家以前獲得的信息,不僅可以識(shí)別古代流行病的病原體,而且還可以識(shí)別現(xiàn)已滅絕的病原體譜系,細(xì)化病原體在人群中出現(xiàn)的年表,并重建今天仍然與公共衛(wèi)生相關(guān)的病原體的進(jìn)化歷史。
親屬關(guān)系
隨著大規(guī)模人群遷徙問(wèn)題逐漸得到解決,近年來(lái)的研究重點(diǎn)逐漸轉(zhuǎn)向微觀現(xiàn)象。這些現(xiàn)象所涉范圍從婚姻習(xí)俗、埋葬習(xí)俗到社會(huì)組織結(jié)構(gòu),甚至社會(huì)沖突。其中親屬關(guān)系是人們通過(guò)生育、婚姻、收養(yǎng)或其他形式的社會(huì)化建立的家庭關(guān)系網(wǎng)。雖然關(guān)于親屬關(guān)系的推論可以來(lái)自文本記錄,但在沒(méi)有文本材料的社會(huì)中,親屬關(guān)系可以從基因組中推斷出來(lái)。通過(guò)對(duì)遺址中不同個(gè)體之間、同一區(qū)域不同遺址間個(gè)體親緣關(guān)系的分析,可以構(gòu)建不同時(shí)期的家庭組織結(jié)構(gòu)、社會(huì)組織結(jié)構(gòu)和婚姻關(guān)系網(wǎng)絡(luò)。
基于低覆蓋度的古基因組數(shù)據(jù)親屬關(guān)系分析方法的不斷改進(jìn),為基于古DNA數(shù)據(jù)的親屬關(guān)系研究打下了堅(jiān)實(shí)的基礎(chǔ),這些研究從各個(gè)方面揭示了過(guò)去人類社會(huì)的各種社會(huì)關(guān)系。例如,一項(xiàng)對(duì)公元5~7世紀(jì)意大利北部和匈牙利兩個(gè)墓地出土人骨的研究表明,這些墓地的布局圍繞著一個(gè)以豐富隨葬品為特征的中心親屬群體組織起來(lái),與本地人群相比,這些墓葬的人群表現(xiàn)出更高比例的中歐血統(tǒng)。這種血統(tǒng)的存在與羅馬帝國(guó)滅亡后從潘諾尼亞遷移到意大利北部的過(guò)程相一致,表明這些新移民家庭對(duì)當(dāng)?shù)卦∶袢后w施加了顯著的社會(huì)影響[9]。
古基因組學(xué)研究為我們提供了深入了解過(guò)去生物體、環(huán)境和歷史事件的獨(dú)特視角,從根本上改變了多個(gè)學(xué)科領(lǐng)域。它在揭示人類起源與遷徙、種群動(dòng)態(tài)、疾病演變、動(dòng)植物馴化等方面發(fā)揮了重要作用。這些研究不僅幫助我們更好地理解人類和其他物種的歷史,還為當(dāng)今的生物多樣性保護(hù)和疾病防治提供了寶貴的歷史經(jīng)驗(yàn)。隨著技術(shù)的不斷進(jìn)步,古基因組學(xué)將繼續(xù)為我們揭開(kāi)更多歷史的奧秘,推動(dòng)科學(xué)的前沿探索。
[1]Higuchi R, Bowman B, Freiberger M, et al. DNA sequences from the quagga, an extinct member of the horse family. Nature, 1984, 312: 282–284.
[2]P??bo S. Molecular cloning of ancient Egyptian mummy DNA. Nature, 1985, 314: 644–645.
[3]Du P, Zhu K, Qiao H, et al. Ancient genome of the Chinese Emperor Wu of Northern Zhou. Current Biology, 2024, 34: 1587-1595.
[4]Yang X M, Meng H L, Zhang J L, et al. Ancient genome of Empress Ashina reveals the Northeast Asian origin of G?ktürk Khanate. Journal of Systematics and Evolution, 2023, 61(6): 1056-1064.
[5]Itan Y, Powell A, Beaumont M A, et al. The origins of lactase persistence in Europe. PLoS Comput Biol, 2009, 5: e1000491.
[6]Marciniak S, Perry G H. Harnessing ancient genomes to study the history of human adaptation. Nature Reviews Genetics, 2017, 18(11): 659-674.
[7]Monot M, Honoré N, Garnier T, et al. On the origin of leprosy. Science, 2005, 308: 1040–1042.
[8]Schuenemann V J, Avanzi C, Krause-Kyora B, et al. Ancient genomes reveal a high diversity of Mycobacterium leprae in medieval Europe. PLoS Pathog, 2018, 14: 1–17.
[9]Amorim C E G, Vai S, Posth C, et al. Understanding 6thcentury barbarian social organization and migration through paleogenomics. Nature Communications, 2018, 9(1): 3547.
關(guān)鍵詞:古基因組學(xué) 人群歷史 人類適應(yīng)性 古病原體 親屬關(guān)系 ■