鄧 曉 華,楊 曉 霞,高 天 俊
(廈門大學 1.人類學與民族學系;2.中文系;福建 廈門 361005)
語言的演化分類又稱“譜系分類”、“系屬分類”,是根據(jù)語言間的發(fā)生學關系對現(xiàn)有語言進行的分類。演化分類是描述語言親屬關系,窺視語言演化歷史的重要方法。
一直以來,語言的演化分類主要采用譜系樹模型來描述,而譜系樹模型脫胎自生物學中的生物樹模型。早在1837年,達爾文就在他的筆記中①見達爾文的“B”筆記本“物種的變化(Transmutation of Species)”第36頁。,首次用一棵假想的樹描繪了生物演化的方式。1859年,代表其進化論思想形成的《物種起源》一書出版,他在書中首次正式發(fā)表了第一張生物演化樹圖(Darwin 1859:116-117),并用這棵“生命之樹”(tree of life)闡述了他關于物種競爭、演化的思想:“同一綱中一切生物的親緣關系常常用一株大樹來表示。我相信這種比擬法甚為真實。綠色的、生芽的小枝可以代表現(xiàn)存的物種;數(shù)年前生長出來的枝條可以代表長期連續(xù)的絕滅物種……這巨大的‘生命之樹’在其傳代中也是這樣,這株大樹用它的枯落的枝條填充了地殼,并且用它的分生不息的美麗枝條遮蓋了地面。”(達爾文1963/1859:152-153)此后,演化樹的觀念深入人心,成為描述生物之間親緣關系和演化歷程的最常用的方法。
語言的演化與生物的演化具有許多平行相似之處,生物學中的許多理論與方法也早已被廣泛應用于語言研究之中。達爾文的進化論是現(xiàn)代生物學的基石之一,早在進化論產(chǎn)生之初,達爾文就將生物演化和語言演化聯(lián)系在了一起。他在物種起源中就提出過這樣一個設想:“如果我們擁有關于人類的完整的譜系,那末人種的系統(tǒng)的排列就會對于現(xiàn)在全世界所用的各種不同語言提供最好的分類”(達爾文1963/1859:514-515)。達爾文關于語言譜系分類的思想很快傳入語言研究領域,在物種起源出版后的第四年(1863年),德國語言學家August Schleicher(奧古斯特·施萊歇爾)就將演化論引入語言學中。他將語言與生物有機體進行類比,提出“達爾文就動植物種屬提出的理論,至少在最基本的方面也同樣適用于各類語言的有機體”,同時他還借用達爾文的生物演化樹圖方法,為“印度-日耳曼語系”畫出了第一張樹圖,描繪了“這個語系逐漸形成的圖景”(奧古斯特·施萊歇爾2008/1863)。自此,譜系樹(family tree①family tree一般用來表達物種(語言)之間的親緣關系,同時還用來描述種群的演化過程,因此又稱“演化樹”,在系統(tǒng)發(fā)生學中稱“種系發(fā)生樹”,在語言學領域一般譯為“譜系樹”。)理論成為描述語言演化歷史的最重要的理論模型之一。在此后的一百多年里,語言學家據(jù)此為世界上絕大多數(shù)語系確立了譜系關系。
譜系樹模型結構簡單明確,不但能夠清晰地表現(xiàn)出物種之間的親緣關系,還能直觀的表現(xiàn)整個種系演化的歷史。然而,譜系樹模型對演化模式的定義還存在一些缺陷,此外它也無法兼容諸如水平基因轉移、重組之類的“特殊”演化事件。
首先,譜系樹模型只能描述分化式演化。正如施萊歇爾(1863)所總結的,演化論認為“種是通過逐漸的分化而產(chǎn)生的”,這正是生物學中譜系樹理論的基本思想。生物譜系樹理論假定同屬的物種都由一個共同的祖先(common ancestor)演變、分化而來,即分化是物種產(chǎn)生的主要途徑。然而新物種的產(chǎn)生并不總是以分化的方式進行的,在植物界廣泛存在的雜交現(xiàn)象就是一個反例。不同種屬的植物雜交后,不同種的染色體組合在一起而產(chǎn)生染色體倍數(shù)的變異(異源多倍化,allopolyploidization),在少數(shù)情況下可以產(chǎn)生與其祖輩生殖隔離的新的物種。
圖1 分化與雜交的不同演化模式
另外,譜系樹模型無法兼容于生物演化過程中廣泛存在的水平基因轉移(horizontal gene transfer)、基因重組等網(wǎng)狀演化現(xiàn)象。20世紀60年代,蛋白質測序技術出現(xiàn),生物學進入分子時代,對生物演化歷史的研究也開始進入微觀層面。演化生物學家開始利用核酸和蛋白質的序列信息,研究物種之間的演化關系,推斷和構建生物譜系樹。在分子水平上構建的生物演化樹比傳統(tǒng)的根據(jù)生物表型特征(如生物形態(tài)、結構、功能等)推斷的演化樹更加科學、可靠。20世紀90年代以來,一種“新的”基因傳遞現(xiàn)象——水平基因轉移,開始受到演化生物學家的重視。水平基因轉移指基因由一個有機體直接轉移到另一個有機體的過程。和一般的垂直基因轉移(基因由親代轉移到子代)不同,水平基因轉移可以在沒有親緣關系的物種之間進行。水平基因轉移的發(fā)現(xiàn)使生物學界關于物種的分化遺傳是演化的主要過程的觀點受到挑戰(zhàn)。而在生物譜系樹的構建方面,水平基因轉移現(xiàn)象也給分子系統(tǒng)發(fā)生學②系統(tǒng)發(fā)生(又稱種系發(fā)生、系統(tǒng)發(fā)育),指生物形成或進化的歷史。系統(tǒng)發(fā)生學是研究物種之間的進化關系的學科。分子系統(tǒng)發(fā)生學則是在分子層面通過核酸、蛋白質序列推斷生物之間的演化關系,構建生物演化樹以研究生物形成和演化的歷史的學科。的研究帶來了困難:水平基因轉移在原核生物界發(fā)生非常頻繁,即使在關系非常疏遠的物種之間也可以發(fā)生。此外,近年來更多的研究發(fā)現(xiàn)病毒之間的種間基因重組現(xiàn)象非常普遍。因此,基于同一種群的不同基因(可能和其他物種之間發(fā)生水平基因轉移或重組)生成的演化樹可能差異非常大(Huson 2010)。此時樹狀模型只考慮縱向遺傳而無法兼容橫向(水平)傳遞的弱點開始顯現(xiàn)。于是,生物學家開始重視水平基因轉移等網(wǎng)狀演化現(xiàn)象,并重新審視樹狀演化模型的真實性和適用性。
新的更復雜的生物演化模式的發(fā)現(xiàn)對傳統(tǒng)的演化理論產(chǎn)生沖擊,許多生物學家開始反思樹狀模型在理論基礎和方法論上存在的弱點,正如Huson等(2006)所指出的:“(演化樹模型)對更復雜的演化場景的描繪可謂簡陋。并且即使生物演化真的是以樹狀模式進行的,使用強制返回樹狀結果或者將結果假定為樹狀的分析方法也并不是最佳方案?!睘榇耍飳W家開始探索既能描述縱向傳遞(由親代向子代的遺傳傳遞),又能兼容橫向傳遞(水平基因轉移、雜交等演化模式)的新的演化模型。近三十年來,演化網(wǎng)絡研究逐步興起,演化網(wǎng)絡模型開始成為替代樹狀模型的一個新的方案。目前,在有水平基因轉移、基因重組等網(wǎng)狀演化事件發(fā)生的情境下,演化網(wǎng)絡已成為描述演化歷史的主流模型。此外,NeighborNet、Split-Decomposition、Median Network等多種演化網(wǎng)絡重建方法已被開發(fā)出來,并已被廣泛應用于生物種系研究之中。
同樣,在文化和語言的演化中,譜系樹模型也開始受到挑戰(zhàn)。進化論在被引入文化領域后,發(fā)展出許多全新的文化演化理論,而文化的傳遞和生物的傳遞具有許多顯著的差異:文化的傳遞并不局限于由母代向子代遺傳的縱向模式,跨代的甚至無親緣關系的個體之間的橫向文化傳遞現(xiàn)象非常普遍。作為一種社會文化現(xiàn)象的語言也具有這樣的特點。從觀來看,人群的接觸導致語言的接觸,不同語言間的借用現(xiàn)象在語音、詞匯和語法等諸多層面都有發(fā)生,語言的融合現(xiàn)象在歷史上也并不少見;從微觀來看,個體的語言習得并不僅來源于父母,社會中的其他人群不可避免的會對幼兒的語言產(chǎn)生影響,而二語的習得、語言元素的借用更是可以在整個社會人群中發(fā)生。因此,在語言演化的歷程中,橫向傳遞和縱向傳遞同樣重要,而僅能反映縱向傳遞的語言譜系樹模型,或許并不能表現(xiàn)語言演化的真實歷史。
在語言的親緣關系研究中,自施萊歇爾繪出首張語言譜系樹圖以來,樹狀模型就成為描述語言演化歷史和親緣關系的默認模型,一直在歷史語言學界占據(jù)統(tǒng)治地位。然而,同生物學一樣,語言學譜系樹理論也只考慮世系的分化,忽略了語言之間相互的接觸影響,將語言演化的歷程簡單化了。因此,即使在印歐語這個非常適合于樹狀模型的語系中,也會遇到與樹狀模式相沖突的現(xiàn)象。為解釋這些沖突現(xiàn)象,施萊歇爾的學生施密特(J.Schmidt 1872)提出了著名的“波浪說(wave theory)”,他認為:一個新的語言的特征(或創(chuàng)新)可以像波浪一樣以同心圓的方式向周圍擴散開去,離中心越遠,影響越弱。波浪說著眼于語言間的接觸影響,能夠很好地解釋語言在空間上的傳播問題,補充了樹狀模型的不足。因此,在后來的語言研究中,這兩種模型都被廣泛應用,成為描繪語言發(fā)展歷史和變化機制的最重要、最基礎的兩種模型。
施密特希望波浪理論能成為譜系樹理論的替代品,然而事實上波浪模型只反映了語言演化過程中的另一重要的傳遞模式:橫向傳遞。橫向傳遞與縱向傳遞是相互補充而不是相互對立的關系(徐通鏘 1991:223),它們在演化史上互相交割,共同塑造了語言的歷史。因此,單獨的譜系樹模型或波浪模型都無法完整地描述語言演化的真實歷史。另一方面,“混合語”等語言演化中的一些“特殊”情況,也常使樹狀模型陷入尷尬的境地,而波浪模型對其也無能為力。
很自然的,我們希望能夠有一個能同時描述語言的縱向分化和橫向接觸這兩種演化模式的新的模型。迪克森(Dixon 1997)在生物學中的間或打斷的平衡模式(punctuated equilibrium model)的啟發(fā)下,將語言演化的譜系樹模型和語言擴散的區(qū)域模型結合在一起,提出了一個類似的間或打斷的穩(wěn)態(tài)模型——“裂變-聚變模型”。他認為在人類語言演化的十多萬年間,穩(wěn)態(tài)聚變是常態(tài),而“聚變穩(wěn)態(tài)會時不時地被一些大事情打破,這會導致語言局勢的徹底改變,也可能引發(fā)多重‘分裂和擴張’”,使得語言演變進入裂變期,在裂變期結束后,又會開始新一輪的聚變期,如此循環(huán)往復。迪克森的語言演化模型在一個非常大的時間尺度(十萬多年)上,描述了語言的觀演化模式,對解釋澳洲、美洲和非洲等地的語言演化歷史具有很強的說服力。但是,我們認為,“裂變-聚變模型”只是將樹狀模型和波浪模型在更大的時間尺度上進行了展開,卻并未考慮在較小時間尺度上分裂和擴散同時進行的情況。比如,在裂變的過程中往往也會伴隨著語言的接觸和擴散現(xiàn)象,正如迪克森自己在該書第四章系族分枝部分所描述的那樣(見圖2)。在中國境內語言的演化歷史上,上述問題的存在可能非常普遍。比如南方漢語方言中普遍存在的古南方民族語底層表明,在南方漢語方言形成的歷史上,北方移民和南方土著之間存在著廣泛而深刻的語言接觸與互動。具體比如閩客方言的形成歷史中既有分裂自古北方漢語的過程,又有北方移民語言和南方土著語言的交互作用影響(鄧曉華、王士元2003b)。迪克森的模型將分(裂變)與合(聚變)兩種演化模式截然分開,使得它對于更復雜的語言演化場景的解釋力仍顯不足。
圖2 迪克森關于系族分枝和區(qū)域影響的假想圖① 資料來源:Dixon Robert M.W.1997 The rise and fall of languages,Cambridge University Press:51.
綜上所述,我們仍迫切地需要一個能夠同時解釋和描述分裂機制和波浪機制的模型。生物學中新提出的生物種系網(wǎng)絡(phylogenetic network)模型或許就是一個可資借鑒的方案。
經(jīng)典的譜系樹模型是在印歐語研究的經(jīng)驗下產(chǎn)生的,過去的研究也已經(jīng)證明譜系樹模型能很好地描述印歐語演化的歷史。最近采用新的生物學種系生成方法對印歐語譜系分類進行的研究進一步印證了它的適用性(Gray&Atkinson 2003)。此外,譜系樹模型在南島語系的譜系重建上也顯示出較好的解釋力,無論是使用經(jīng)典的比較研究方法,還是采用基于詞源統(tǒng)計的定量研究方法(Gray&Jordan 2000),都能得出相當一致的樹狀拓撲結構。
漢藏語系的演化歷史與印歐語,特別是南島語存在著顯著的差異。印歐語是在相對獨立的環(huán)境下從原始印歐語發(fā)展而來的,其分化歷史上未受其他語系太大影響,語言之間的語音對應規(guī)律線索受破壞較少,線索仍比較清晰。南島語的演化歷史線索則更為清晰:南島語族群在太平洋群島上遷徙、擴散的路徑可以用“快車模型(Express Train)”來描述,即操(古)南島語的人從一個島擴散到另一個島,他們到達新的陸地后,很少和故鄉(xiāng)聯(lián)系,從而形成一種鏈狀的遷徙路徑。在南島族群遷徙的過程中,語言也隨之擴散、演化,由于各島嶼之間接觸很少,橫向的語言擴散在南島語系中影響很小,這使得南島語系的演化歷史體現(xiàn)出較純粹的以縱向傳遞為主的特點,也使得其歷史非常適合于譜系樹模式。
漢藏語系諸語言所處的地理環(huán)境以及其演化歷程與歐洲、大洋洲有著很大的差異。一直以來,東亞、東南亞地區(qū)都有諸多民族雜處混居,語言接觸頻繁,語言特征的橫向擴散與縱向遺傳混雜在一起,語言的分化式演化和融合式演化這兩種模式相互糾葛、難以區(qū)分。另一方面,本區(qū)域內部的各民族語言近兩千年來一直受到強大的漢文化的影響,大量的漢語成分與特征滲入相關語言中,語言的接觸甚至換用頻繁發(fā)生,極大地改變了該地區(qū)的語言關系面貌。
因此,在將譜系樹的概念應用于“漢藏語系”諸語言,提出“漢藏語系”的概念,重建其演化樹時,就難免會遇到一些問題。首先,由于分類標準的不同,不同學者對同一語族的分類結果往往存在差異,爭議難平;其次,白語、畬語、臨高話等演化歷史復雜的語言的系屬地位問題仍未解決;另外,倒話、五屯話、五色話等“混合語”的系屬問題仍有隱憂。而另一方面,在漢藏語譜系關系研究的過程中,越來越多地遇到方法上的甚至理論基礎上的難題。印歐語譜系分類中得到成功應用的同構和語音對應標準在漢藏語研究中遇到困難,而同源詞標準則面臨著“同源關系和接觸關系的區(qū)分在譜系樹模型內部無法解決”的困境(陳保亞1996、1998)。人們開始反省譜系樹模型在“漢藏語系”中的適用性問題,如王均(1989)對漢藏語系的理論基礎問題提出這樣的詰難:“語言的發(fā)展能不能說就是‘從一到多’?……認為在古代只有前后相繼,而無語言之間的相互影響和社會變異,這是難以想象的……但我懷疑漢藏語系語言譜系樹形圖的實際意義?!贝鲬c廈(1990)則重新定義了親屬關系的概念,提出漢藏語系內部的親屬關系的形成有原始母語分化(藏緬語和漢語)和語言影響形成(壯侗語和漢語)兩種途徑。如果承認語言接觸影響也會導致親屬關系的形成,那么譜系樹模型就不是一個完善的描述語言親屬關系的演化模型了。
所以,我們有必要在漢藏語語言演化模式方面進行新的探索,以期更好地描述亞洲語言演變的歷史,理解復雜的族群遷徙互動環(huán)境下的語言演化規(guī)律。目前,生物學中的種系網(wǎng)絡模型已被應用于印歐語(Bryant,Filimon et al.2005)、南島語(Bryant 2006)、漢語方言(Hamed&Wang 2006)等語系的研究中,他們的研究都表明,網(wǎng)狀方法對于確實是樹狀的語群,能正確返回樹狀圖,而對于更復雜的情況則能返回更復雜的網(wǎng)狀圖。因此,此類方法的應用一方面可以用來驗證傳統(tǒng)的樹狀譜系模型的可靠性,另一方面還能用于發(fā)現(xiàn)語言關系中的網(wǎng)狀成分,進而為探索更完善的語言演化模型提供參考。
藏緬語是漢藏語系中分布最為廣泛、涉及語言最多的語族之一。藏緬語分布地區(qū)地理環(huán)境的多樣性及其發(fā)展歷史上人群遷徙、接觸的復雜性,使得藏緬語族語言呈現(xiàn)出許多復雜的特點:(1)從縱向的語言遺傳演化來看,藏緬語各語言演化發(fā)展的速度不一,不同語言中不同語言成分從祖語中分化出來的時間層次不一,各語言之間的演化關系非常復雜。這成為藏緬語分類眾說紛紜的一個重要原因。(2)從橫向來看,藏緬語所處地區(qū)民族眾多,歷史上不同族群的接觸、融合屢見不鮮。伴隨著人群接觸而產(chǎn)生的深刻的語言接觸也非常普遍,語言的借用乃至換用頻繁發(fā)生,橫向傳遞與縱向傳遞交割混雜,難以區(qū)分,使得白語等接觸深刻語言的系屬問題爭議難平。
基于以上原因,譜系樹模型是否適合于描述藏緬語的歷史,已成為一個亟需思考與驗證的問題。目前,在藏緬語的演化分類研究中,不論是采用定性的分類方法,還是采用基于數(shù)理統(tǒng)計和生物學種系發(fā)生研究的定量分類方法,默認的都會給出一棵譜系樹。然而,先入為主的將藏緬語的演化模式確定為樹狀的,默認返回樹狀結果,在方法論上也是有問題的。生物學中新發(fā)展出來的演化網(wǎng)生成方法,則能在一定程度上避免這種問題。為此,我們嘗試使用已在印歐語、南島語和漢語方言等語言(方言)中成功應用的NeighborNet法,進行了藏緬語演化網(wǎng)圖的重建和分析。
我們采用鄧曉華、王士元(2003a)發(fā)表的12種藏緬語族語言的Swadesh 100核心詞表為基本材料,通過優(yōu)選同源詞,編制同源詞表,計算每對語言的同源百分比,生成12種語言的同源百分比相似矩陣,進而將相似矩陣轉換為距離矩陣,作為生成演化網(wǎng)圖的基本數(shù)據(jù)材料。
我們采用的是Bryant&Moulton(2002)所提出的NeighborNet演化網(wǎng)重建方法,該算法已被集成于SplitsTree4軟件包中(Huson et al.2006)。
基于以上材料與方法,我們重建了藏緬語演化網(wǎng)圖:
圖3 12種藏緬語演化網(wǎng)圖
圖3展示了由NeighborNet法生成的12種藏緬語演化網(wǎng)圖(圖右)及由Neighbor-Joining法生成的藏緬語演化樹圖(圖左下。引自鄧曉華、王士元2003a)。NeighborNet網(wǎng)圖所顯示出的語言聚類與過去采用Neighbor Joining樹狀方法得到的聚類一致,且與戴慶廈等(1989)所提出的分類完全一致。同時,網(wǎng)圖族簇分枝清晰、層次明朗,呈現(xiàn)出明顯的樹狀特征,這表明藏緬語演化的可能仍然是以樹狀分化模式為主的。此外,網(wǎng)圖中還包含許多盒狀信號,盒狀信號是接觸的表征,這反映出各語言及語群在演化歷史上曾有廣泛的接觸過程。
一直以來,白語的系屬問題都是學界爭論的焦點,白語應劃入藏緬語族(戴慶廈等1989、Matisoff 2003、吳安其2002等)還是應歸入漢語族(如鄭張尚芳1999)聚訟已久,而爭論的根源就是縱向傳遞和橫向傳遞的區(qū)分問題。網(wǎng)狀方法相對于樹狀方法最大的優(yōu)點在于它們能同時描述語言演化歷史上的縱向遺傳和橫向接觸,這可以為理解白語等接觸深刻語言的演化歷史提供一個新的視角。因此,我們在材料中加入了古漢語的數(shù)據(jù),構成13支語言,并重新生成了一幅演化網(wǎng)圖(圖4)。
圖4所展示出的聚類與圖3基本一致,古代漢語數(shù)據(jù)的加入并未影響其他聚類的分合,說明古代漢語與藏緬語整體發(fā)生學關系較遠。特別的是,白語和古漢語被聚為一簇,這可能暗示白語和古漢語有直接的發(fā)生學關系,是在從原始漢藏語分離出來后才分離的,因此應歸于同一語族,這與鄭張尚芳(1999)等的觀點一致。同時,二者之間還表現(xiàn)出強烈的接觸信號,這說明白、漢分離后,又進行了長期而深刻的語言接觸。由于我們的研究是基于Swadesh 100核心詞的,核心詞中白語和漢語同源和借用的鑒別問題目前仍有不同意見,因此白語和漢語從原始漢藏語分離出來的時間點以及分離的層次仍然難下定論。更科學的結論還有賴關系詞對應層次研究的進一步發(fā)展。
圖4 12種藏緬語及古代漢語的演化網(wǎng)圖
漢藏語系語言演化歷史的復雜性使得我們有必要在新的語言演化理論方面展開探索,生物學中新發(fā)展出來的演化網(wǎng)思想和演化網(wǎng)生成方法的提出,則為重新審視漢藏語演化的歷史提供了一個新的視角,也為同時描述縱向和橫向傳遞這兩種同樣重要的語言傳遞機制提供了一個可視化的表達方案。我們就藏緬語演化網(wǎng)的重建與分析表明,NeighborNet等演化網(wǎng)生成方法適用于漢藏語系語言演化分類和演化歷史的研究,演化網(wǎng)圖能更科學、更真實地描述漢藏語的演化歷史。演化網(wǎng)理論與方法在語言演化研究上的探索與應用上的價值值得進一步深入發(fā)掘。
奧古斯特?施萊歇爾 達爾文理論與語言學——致耶拿大學動物學教授、動物學博物館館長恩斯特???藸栂壬?,姚小平譯,《方言》2008年第4期。
陳保亞 1996 《論語言接觸與語言聯(lián)盟》,語文出版社。
陳保亞 1998 百年來漢藏語系譜系研究的理論進展,《語言學論叢》第21輯,商務印書館。
達爾文 1859 《物種起源》,周建人、葉篤莊、馬宗熙譯,商務印書館,1963年。
戴慶廈 1990《藏緬語族語言研究》,云南民族出版社。
戴慶廈、劉菊黃、傅愛蘭 1989 關于我國藏緬語族系屬分類問題,《云南民族學院學報》第3期。
鄧曉華、王士元 2003a 藏緬語族語言的數(shù)理分類及其分析,《民族語文》第4期。
鄧曉華、王士元 2003b 古閩、客方言的來源以及歷史層次問題,《古漢語研究》第2期。
王均 1989 《民族語文》前程似錦——在《民族語文》創(chuàng)刊10周年學術交流會上的講話,《民族語文》第1期。
吳安其 2002 《漢藏語同源研究》,中央民族大學出版社。
徐通鏘 1991 《歷史語言學》,商務印書館。
鄭張尚芳 1999 白語是漢白語族的一支獨立語言,《中國語言學的新拓展——慶祝王士元教授六十五歲華誕》,香港城市大學出版社。
Bryant,D. 2006 Radiation and network breaking in Polynesian linguistics,Phylogenetic Methods and the Prehistory of Languages,McDonald Institute Press.
Bryant,D.,F.Filimon&R.D.Gray 2005 Untangling our past:languages,trees,splits and networks,The evolution of cultural diversity:phylogenetic approaches,Left Coast Press.
Bryant,D.&V.Moulton 2002NeighborNet:An agglomerative method for the construction of planar phylogenetic networks,Algorithms in Bioinformatics,Springer.
Darwin,C. 1859On the origin of species by means of natural selection,or the preservation of favoured races in the struggle for life,John Murray.
Dixon,R.M.W.1997The rise and fall of languages,Cambridge University Press.
Gray,R.D.&Q.D.Atkinson 2003 Language-tree divergence times support the Anatolian theory of Indo-European origin,Nature(6965).
Gray,R.D.&F.M.Jordan 2000 Language trees support the express-train sequence of Austronesian expansion,Nature(6790).
Hamed,M.B.&F.Wang 2006 Stuck in the forest:trees,networks and Chinese dialects,Diachronica(1).
Huson,D.H.,D.Bryant 2006 Application of phylogenetic networks in evolutionary studies,Molecular Biology and Evolution(2).
Huson,D.H.,R.Rupp&C.Scornavacca 2010Phylogenetic networks:concepts,algorithms and applications,Cambridge University Press.
Matisoff J.A. 2003Handbook of Proto-Tibeto-Burman:System and Philosophy of Sino-Tibetan Reconstruction,UC Publications in Linguistics.
Schmidt,J.1872Die Verwandtschaftsverh?ltnisse der indogermanischen Sprachen,B?hlau.