国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從復(fù)雜網(wǎng)絡(luò)看漢字句法功能的演變

2015-11-30 04:00:14陳芯瑩
關(guān)鍵詞:單字網(wǎng)絡(luò)分析古漢語

陳芯瑩

(西安交通大學(xué) 外國語學(xué)院,陜西 西安 710049)

一 引言

有關(guān)語言,人類從未停止過對(duì)如下幾個(gè)問題的思考:為什么只有人類有語言?語言是如何出現(xiàn)、演變和發(fā)展的?語言為何是現(xiàn)在的這個(gè)樣子?這些問題都屬于語言演化研究的范疇。語言演化研究根據(jù)時(shí)間尺度的不同,又可劃分為宏觀史、中觀史和微觀史研究[1]。語言如何隨著人類的文明累積,經(jīng)過幾萬年的演化發(fā)展并涌現(xiàn)出來是宏觀史的研究問題。中觀史則將時(shí)間尺度縮短,更加關(guān)注同一語言或不同語言之間的演化和相互關(guān)系,例如語言家族的研究,歷時(shí)音變的研究等等。每一個(gè)活的語言作為動(dòng)態(tài)復(fù)雜適應(yīng)系統(tǒng)[2],都是在不停地變化的。而語言演化的微觀史研究則更多地在考察正在發(fā)生的演化現(xiàn)象,例如語言的社會(huì)變體,雙語地區(qū)的語言競爭等等。與語言學(xué)的其他研究方向相類似,無論是哪一類的語言演化研究,由于缺乏必要的科學(xué)研究手段和實(shí)證數(shù)據(jù),傳統(tǒng)上更為側(cè)重內(nèi)省式研究。然而,隨著眾多學(xué)科在技術(shù)上的進(jìn)步和發(fā)展,語言研究逐漸引入實(shí)證方法。同時(shí)借助豐富的自然語言語料和先進(jìn)的技術(shù),從不同學(xué)科不同方法來研究語言演化問題已經(jīng)成為可能。

有關(guān)漢語歷時(shí)演變的研究主要集中在語音演變、漢字或詞匯演變、語法演變等幾個(gè)方面。由于漢語的書面語在較早的時(shí)期已經(jīng)趨于穩(wěn)定,漢語在相當(dāng)長的一段歷時(shí)發(fā)展時(shí)期都采用了類似的文字書寫系統(tǒng),因此,傳統(tǒng)的漢語歷時(shí)演化研究更多地把注意力放在了漢語語音的演化研究上。這類側(cè)重語音、兼顧詞匯與語法變化的傳統(tǒng)漢語演變研究取得了不少成果[2-3]。基于語音、詞匯和語法的變化,語言學(xué)家將漢語演化歷史劃分為四個(gè)時(shí)期:上古漢語,中古漢語,近代漢語和現(xiàn)代漢語[2-3]。除去對(duì)漢語史進(jìn)行劃分,語言學(xué)家們還采用案例分析的方法對(duì)漢字、漢語詞匯和語法的變化進(jìn)行了研究,并取得了不錯(cuò)的成果[4-7]。例如,經(jīng)過研究發(fā)現(xiàn)了漢語詞匯的雙音節(jié)化演變趨勢(shì)[8]。除此之外,也有基于漢語歷時(shí)語料庫和定量分析的漢語歷時(shí)演化研究[9],但較少見。而基于網(wǎng)絡(luò)分析方法的漢語歷時(shí)演化研究僅有一例,有研究者[10]通過構(gòu)建字同現(xiàn)網(wǎng)絡(luò)模型,模擬和考察了漢字在漢語歷時(shí)發(fā)展過程中的演化趨勢(shì),發(fā)現(xiàn)了高頻的漢字更可能被重復(fù)使用來組成新詞??傮w來說,諸如統(tǒng)計(jì)分析、網(wǎng)絡(luò)分析之類的現(xiàn)代跨學(xué)科研究方法仍然沒有在這一研究領(lǐng)域得到廣泛的應(yīng)用。

與此同時(shí),網(wǎng)絡(luò)分析,一個(gè)非?,F(xiàn)代化和典型的跨學(xué)科研究方法,已經(jīng)被應(yīng)用到了漢語共時(shí)研究的許多其他方向,如現(xiàn)代漢語漢字網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)研究,現(xiàn)代漢語詞匯和短語網(wǎng)絡(luò)的小世界特點(diǎn)研究,漢語語音網(wǎng)絡(luò)的統(tǒng)計(jì)特性研究,漢語音節(jié)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn),漢語句法網(wǎng)絡(luò)的復(fù)雜網(wǎng)絡(luò)特性,漢語句法網(wǎng)絡(luò)的中心節(jié)點(diǎn)研究,漢語句法網(wǎng)絡(luò)中的詞類配價(jià)模式研究,以及漢語語義網(wǎng)絡(luò)的統(tǒng)計(jì)特性研究等等[11-13]。

將網(wǎng)絡(luò)分析方法用于語言研究的優(yōu)勢(shì)不僅僅在于其先進(jìn)強(qiáng)大的數(shù)據(jù)統(tǒng)計(jì)和分析能力,更在于它將語言材料作為一個(gè)整體結(jié)構(gòu)來進(jìn)行描述分析的獨(dú)特視角。語言是一個(gè)復(fù)雜系統(tǒng),這一被普遍接受的語言學(xué)觀點(diǎn)直至網(wǎng)絡(luò)分析方法的出現(xiàn),才真正地實(shí)現(xiàn)了從理論探討到實(shí)證研究的突破。而研究實(shí)踐也已經(jīng)證明,網(wǎng)絡(luò)分析方法可以被成功地應(yīng)用到各類漢語共時(shí)研究當(dāng)中,并獲得了較為豐富的研究成果。僅有的一例基于網(wǎng)絡(luò)分析的漢語歷時(shí)演化研究也顯示了網(wǎng)絡(luò)分析放在漢語演化研究當(dāng)中的巨大潛力。

語言演化是一個(gè)連續(xù)的過程,而現(xiàn)有的研究成果和知識(shí)是對(duì)這一連續(xù)過程中的個(gè)別語言現(xiàn)象的片段描述,是若干分散于各個(gè)歷史時(shí)期的語言演化的局部“快照”。鮮有從語言系統(tǒng)的宏觀、整體角度的研究和認(rèn)識(shí),而一般用來模擬語言整體演變的模型過于簡單,很難真實(shí)地反映出語言演變的趨勢(shì)。如何通過累積不同時(shí)間尺度的快照,并將其合理地拼合成一幅完整而連貫的真實(shí)全景畫面,用以解釋人類語言的演變和發(fā)展,是當(dāng)下語言演化研究面臨的一個(gè)重大命題。網(wǎng)絡(luò)分析方法所提供的宏觀視角,為語言演化的“全景式寫真快照”提供了可能。本文正是以此為目標(biāo),嘗試著將網(wǎng)絡(luò)分析方法進(jìn)一步地應(yīng)用到漢語的歷時(shí)演化研究當(dāng)中,具體地說,是應(yīng)用到漢語漢字的句法功能演化研究當(dāng)中。

網(wǎng)絡(luò)分析方法是典型的跨學(xué)科研究方法。將它運(yùn)用到漢語演化研究當(dāng)中不但有助于漢語研究方法的現(xiàn)代化,還能增加漢語研究與其他學(xué)科研究之間的交流,促進(jìn)相關(guān)研究的發(fā)展。同時(shí),用現(xiàn)代科學(xué)的方法來研究探索人類所獨(dú)有的語言系統(tǒng),也是現(xiàn)代科學(xué)研究認(rèn)識(shí)人類本質(zhì)的必經(jīng)之路。只有采用科學(xué)的研究方法,才能對(duì)人類語言的獨(dú)有性和人類本質(zhì)這些根本問題有更為深入和透徹的理解。

二 研究方法與過程

本文的研究思路如圖1 所示,包含了:(1)制定語料收集方案;(2)收集語料樣本;(3)對(duì)文本錯(cuò)誤進(jìn)行清理、校正;(4)根據(jù)文本語料庫構(gòu)建同現(xiàn)網(wǎng)絡(luò);(5)利用各類網(wǎng)絡(luò)分析工具PAJEK 分析不同時(shí)期的語言結(jié)構(gòu)特征,對(duì)比數(shù)據(jù)并總結(jié)漢語系統(tǒng)的歷時(shí)演化趨勢(shì);(6)分析“在”和“人”兩個(gè)單字詞在不同時(shí)期的語言特征變化,對(duì)比數(shù)據(jù)并總結(jié)兩個(gè)單字詞的演化趨勢(shì);(7)結(jié)合語言網(wǎng)絡(luò)的整體參數(shù)的變化和兩個(gè)單字詞的參數(shù)變化,進(jìn)行系統(tǒng)與單字詞的共演分析,總結(jié)描述漢語單字詞的句法功能演化趨勢(shì)。

圖1 應(yīng)用網(wǎng)絡(luò)分析方法研究漢字句法功能演化的方法與流程

本研究主要依據(jù)王力[2]和向熹[3]先生的漢語史分期體系,隨機(jī)選擇了分屬上古漢語、中古漢語、近代漢語和現(xiàn)代漢語的真實(shí)文本語料作為研究所用的樣本語料。其中,上古漢語選取的語料是:荀子的《正名篇》。中古漢語選取的語料是:韓愈的《師說》和《進(jìn)學(xué)解》、柳宗元的《捕蛇者說》、王勃的《滕王閣序》以及魏征的《諫太宗十思疏》。近代漢語選取的語料是:馬建忠的《馬氏文通》?,F(xiàn)代漢語選取的語料是:劉海濤的《計(jì)量語言學(xué)的現(xiàn)狀、理論與方法》。為了增加可對(duì)比性,所選語料均為論述文,且四個(gè)時(shí)期的語料規(guī)模大致相當(dāng),約為2800 字。

以上述真實(shí)文本為基礎(chǔ),本研究分別構(gòu)建了四個(gè)不同時(shí)期的漢字同現(xiàn)網(wǎng)絡(luò)。由于“同現(xiàn)”可以有不同定義,構(gòu)建同現(xiàn)網(wǎng)絡(luò)的方法也有很多種,而本研究中定義的“同現(xiàn)”指兩個(gè)漢字在上述文本中的相鄰關(guān)系。如若兩個(gè)漢字在一個(gè)句子中先后相鄰出現(xiàn),則在代表這兩個(gè)漢字的網(wǎng)絡(luò)節(jié)點(diǎn)間建立聯(lián)系。由此類推,可以將上述的真實(shí)文本語料轉(zhuǎn)換成代表四個(gè)不同漢語時(shí)期的漢字同現(xiàn)網(wǎng)絡(luò)。下頁圖2 是一個(gè)簡易的字同現(xiàn)網(wǎng)絡(luò)的構(gòu)建原理示意圖。

圖2 字同現(xiàn)網(wǎng)絡(luò)的構(gòu)建原理示意圖

在構(gòu)建了四個(gè)不同漢語時(shí)期的漢字同現(xiàn)網(wǎng)絡(luò)后,本研究分別對(duì)四個(gè)網(wǎng)絡(luò)的整體特征進(jìn)行了分析,測量了它們的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)、平均度、聚類系數(shù)、平均路徑長度、直徑、網(wǎng)絡(luò)中心度和密度等網(wǎng)絡(luò)參數(shù)。通過對(duì)比分析這些網(wǎng)絡(luò)參數(shù)的歷時(shí)變化,來描述漢語語言系統(tǒng)的歷時(shí)演化。

同時(shí),本研究還選取了“在”和“人”兩個(gè)高頻單字詞作為研究對(duì)象,分別觀察了它們?cè)诓煌瑫r(shí)期的同現(xiàn)網(wǎng)絡(luò)中的語言結(jié)構(gòu)特征,測量了它們的節(jié)點(diǎn)度數(shù)在不同漢語時(shí)期的變化。之所以選擇“人”和“在”作為研究對(duì)象,是因?yàn)樗鼈儚墓胖两褚恢倍际菃巫衷~,受漢語雙音節(jié)化的影響相對(duì)較小。同時(shí),“在”在漢語發(fā)展史中有明顯的語法化趨勢(shì),而“人”則在句法和詞義上都無明顯變化,一直是實(shí)詞,沒有經(jīng)歷語法化的過程,這使得本研究可以在同現(xiàn)網(wǎng)絡(luò)中觀察單字詞語法化所帶來的網(wǎng)絡(luò)參數(shù)變化,并比較兩個(gè)不同單字詞的演化差異。

在考察了語言系統(tǒng)的整體變化,與“在”和“人”兩個(gè)單字詞的演化趨勢(shì)后,我們將兩者相結(jié)合分析,對(duì)漢語系統(tǒng)整體與具體語言現(xiàn)象之間的共同演化進(jìn)行了描述,總結(jié)了漢字句法功能的歷時(shí)演變。

雖然本研究在討論具體語言現(xiàn)象的演化差異時(shí)僅僅集中討論了“在”和“人”兩個(gè)單字詞,但同樣的方法可以被應(yīng)用到對(duì)其他漢字或單詞、短語的演化研究當(dāng)中。研究雖然落腳在“在”與“人”兩個(gè)單字詞上,但卻實(shí)現(xiàn)了語言局部快照(單字詞演化)與語言全景快照(語言系統(tǒng)演化)的拼合,為語言演化研究成果的整合提供了一條新的途徑,為當(dāng)下語言演化研究發(fā)展所急需的知識(shí)整合方案提供了新思路。

三 語言復(fù)雜網(wǎng)絡(luò)的整體演化

對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)分析研究來說,最常用的網(wǎng)絡(luò)參數(shù)是平均路徑長度、聚集系數(shù)、平均度、直徑等等[11-13]。本研究分別統(tǒng)計(jì)了不同歷史時(shí)期的四個(gè)漢字同現(xiàn)網(wǎng)絡(luò)的6 個(gè)主要網(wǎng)絡(luò)參數(shù),并對(duì)其作了對(duì)比分析,見圖3。

圖3 漢字同現(xiàn)網(wǎng)絡(luò)主要參數(shù)的變化趨勢(shì)

雖然四個(gè)不同時(shí)期的實(shí)驗(yàn)文本規(guī)模相似,但據(jù)此所構(gòu)建的四個(gè)字同現(xiàn)網(wǎng)絡(luò)的規(guī)模(不同漢字的數(shù)量)卻有著較為顯著的差異。本研究中,字同現(xiàn)網(wǎng)絡(luò)的節(jié)點(diǎn)是指不同的漢字。圖3 顯示,中古漢語的字同現(xiàn)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)要明顯大于其他三個(gè)時(shí)期的字同現(xiàn)網(wǎng)絡(luò)。由于文本規(guī)模相似,用字更為豐富的文本在轉(zhuǎn)換成字同現(xiàn)網(wǎng)絡(luò)時(shí),則會(huì)擁有更多的節(jié)點(diǎn)。由此可知,本研究的中古漢語文本中所使用到的漢字要明顯比其他時(shí)期的文本更為豐富。一部分的原因可能是因?yàn)橹泄艥h語部分的文本是由多個(gè)文本組合而成,所涉及的主題更為多樣化。更為本質(zhì)、重要的原因則可能是因?yàn)檫@一時(shí)期的漢語書面語與日常口語的距離更大。這一時(shí)期的文學(xué)創(chuàng)作追求詞匯豐富、結(jié)構(gòu)緊密的風(fēng)尚使得這一時(shí)期的文本大多篇幅短小,遣字用詞豐富而考究。這些文學(xué)創(chuàng)作特點(diǎn)被保存在了中古漢語的文本里,在本研究當(dāng)中則體現(xiàn)在了字同現(xiàn)網(wǎng)絡(luò)的規(guī)模差異上。

網(wǎng)絡(luò)的節(jié)點(diǎn)平均度數(shù)在本研究當(dāng)中指的是每個(gè)漢字平均與幾個(gè)其他不同的漢字相鄰。在這四個(gè)不同時(shí)期的漢語文本當(dāng)中,每個(gè)漢字平均與約5 -7 個(gè)不同的其他漢字有著同現(xiàn)關(guān)系(即前后相鄰的線性關(guān)系)。這一參數(shù)反映的是某一漢字的線性組合多樣性。漢字原本是單字詞,可以獨(dú)立擔(dān)當(dāng)某些句法功能,在古代漢語中的漢字線性組合關(guān)系其實(shí)更多反映的是當(dāng)時(shí)漢語的句法組合關(guān)系。但中古漢語時(shí)期,由于文本中的漢字豐富程度增加,不同的漢字分擔(dān)了原本由一個(gè)或少數(shù)漢字通常承擔(dān)的句法功能,由此造成了漢字線性組合多樣性的下降。從中古漢語到近代漢語時(shí)期,漢語書面語與口語的距離再次逐漸拉近,漢字的句法功能不再像中古漢語那樣分散;同時(shí)漢語中的雙音節(jié)詞開始占據(jù)主導(dǎo)地位,整體上來說,漢字本身的句法功能顯著減少,但構(gòu)詞功能明顯增加,很多漢字都必須要與其他漢字組合才能擔(dān)當(dāng)一定的句法功能。這些都增加了漢字線性組合的多樣性。近代漢語到現(xiàn)代漢語時(shí)期,漢語延續(xù)了上述的變化趨勢(shì),因此漢字線性組合的多樣性進(jìn)一步得到了增強(qiáng)。

在字同現(xiàn)網(wǎng)絡(luò)中,聚類系數(shù)反映的是與某一漢字具有同現(xiàn)關(guān)系的兩個(gè)漢字之間也存在線性關(guān)系的可能性。當(dāng)這個(gè)參數(shù)大于相似規(guī)模的隨機(jī)網(wǎng)絡(luò)的聚類系數(shù)時(shí),我們就稱之為小世界網(wǎng)絡(luò)。即任何兩個(gè)漢字之間都有可能通過少數(shù)的幾個(gè)漢字而串聯(lián)起來。小世界網(wǎng)絡(luò)特性廣泛地存在于各類真實(shí)網(wǎng)絡(luò)當(dāng)中,例如社交網(wǎng)絡(luò)、萬維網(wǎng)絡(luò)、作者引用網(wǎng)絡(luò)等等。本研究中的四個(gè)網(wǎng)絡(luò)的聚類系數(shù)都要遠(yuǎn)遠(yuǎn)大于相似規(guī)模的隨機(jī)網(wǎng)絡(luò)的聚類系數(shù)。因此,可以初步判斷說這四個(gè)字同現(xiàn)網(wǎng)絡(luò)均具有小世界網(wǎng)絡(luò)的特性。

平均路徑長度是聚類系數(shù)相關(guān)聯(lián)的一個(gè)參數(shù)。它在同現(xiàn)網(wǎng)絡(luò)中描述的是,任意兩個(gè)漢字最少需要通過多少個(gè)不同漢字串聯(lián)起來。根據(jù)圖3 可知,這四個(gè)字同現(xiàn)網(wǎng)絡(luò)中的任意2 個(gè)節(jié)點(diǎn)之間的平均漢字個(gè)數(shù)不會(huì)超過4 個(gè)。結(jié)合對(duì)聚類系數(shù)的考察,可以確定它們都是小世界網(wǎng)絡(luò)。

密度這個(gè)概念在同現(xiàn)網(wǎng)絡(luò)中描述的是不同漢字之間的組合緊密程度。更通俗地講,就是兩個(gè)不同漢字同時(shí)出現(xiàn)的頻率高低。同現(xiàn)頻率高則密度更高,同現(xiàn)頻率低則密度更低。圖3 顯示,中古漢語的漢字線性組合最為松散,也就是說,漢字的組合搭配更為多樣,相對(duì)來說沒有那么固定。其次是近代漢語和上古漢語,現(xiàn)代漢語的漢字線性組合最為緊密。這可能與漢語詞匯的雙音節(jié)化有著較大的關(guān)系。詞匯的雙音節(jié)化使得漢字搭配更為固定,從而導(dǎo)致了網(wǎng)絡(luò)密度的增加。

網(wǎng)絡(luò)中心度參數(shù)在同現(xiàn)網(wǎng)絡(luò)中其實(shí)反映的是“超級(jí)明星漢字”存在的概率,即是不是有一些或者有多少出現(xiàn)頻率特別高、組合性特別強(qiáng)的明星漢字。依據(jù)圖3,網(wǎng)絡(luò)中心度:中古漢語<近代漢語<上古漢語<現(xiàn)代漢語。也就是說,中古漢語中明星漢字的數(shù)量或者使用頻率最少,而現(xiàn)代漢語中這類明星漢字的數(shù)量或者使用頻率最大。

直徑描述的是同現(xiàn)網(wǎng)絡(luò)中將組合出現(xiàn)頻率最低的兩個(gè)漢字串聯(lián)起來所需要的漢字?jǐn)?shù)。這個(gè)參數(shù)其實(shí)描述了文本中低頻漢字的組合特點(diǎn)。低頻詞出現(xiàn)得越多,直徑就有可能越大。前面圖3 顯示,中古漢語的直徑最大而現(xiàn)代漢語的直徑最小。

盡管不同參數(shù)的變化趨勢(shì)和幅度各有不同,但從圖3 的折線形狀可以看出,所有的網(wǎng)絡(luò)參數(shù)變化都表明:漢語在從上古漢語發(fā)展到中古漢語后出現(xiàn)了轉(zhuǎn)折式的變化。同時(shí),除了聚類系數(shù)外,其余網(wǎng)絡(luò)參數(shù)的變化曲線都表明,自中古漢語的“轉(zhuǎn)向”之后,這一變化趨勢(shì)一直延續(xù)到了近代漢語和現(xiàn)代漢語當(dāng)中。為什么中古漢語在各個(gè)語言網(wǎng)絡(luò)特征指標(biāo)上都明顯異于其他時(shí)期的漢語呢?可能的原因是,基于先秦口語發(fā)展起來的書面語文言在該時(shí)期開始脫離實(shí)際生活中的漢語口語,并越來越嚴(yán)重。這類與真實(shí)口語相分離的漢語書面語,直到1919年的五四運(yùn)動(dòng)之后,才通過改革運(yùn)動(dòng)又開始重新適應(yīng)真實(shí)口語[2]。由于本研究的漢字同現(xiàn)網(wǎng)絡(luò)是基于文本構(gòu)建的,所以反映的更多的是漢語書面語的歷時(shí)變化。而書面語與實(shí)際口語的脫離程度可能會(huì)影響到書面語的發(fā)展。例如,因?yàn)橛懈嗟臅r(shí)間組織語言,對(duì)于文章易讀程度與審美傾向的取舍和側(cè)重等等,當(dāng)書面語與實(shí)際口語相距較遠(yuǎn)時(shí),可能出現(xiàn)詞匯豐富程度增加,句子結(jié)構(gòu)更為多樣等特征。而這些文本特征可能反映到了字同現(xiàn)網(wǎng)絡(luò)的參數(shù)當(dāng)中。值得注意的是,研究語料的體裁、篇幅、風(fēng)格等特點(diǎn)也都可能影響到文本的網(wǎng)絡(luò)參數(shù)。網(wǎng)絡(luò)數(shù)據(jù)的差異變化是不是主要由書面語與口語的背離發(fā)展所帶來的,則需要通過進(jìn)一步的研究來證實(shí)。

盡管關(guān)于中古漢語書面語與口語相背離發(fā)展的觀點(diǎn)已被普遍接受,但先前的描述和理解都是內(nèi)省式的。這類背離式的發(fā)展如何影響漢語的書面語?多大程度上影響了書面語的變化等問題?雖然不少針對(duì)個(gè)別作者或名著的微觀分析論證研究可以被認(rèn)為是對(duì)這些問題的初步探討,但仍然缺乏宏觀的針對(duì)整個(gè)漢語系統(tǒng)的研究,或是相關(guān)探討由于缺乏真實(shí)數(shù)據(jù)的支持而未能對(duì)上述問題進(jìn)行令人信服的、深入的分析和解答。以真實(shí)的語言數(shù)據(jù)為基礎(chǔ),利用網(wǎng)絡(luò)分析方法,可以從系統(tǒng)宏觀的角度,真實(shí)地捕捉住并展現(xiàn)漢語書面語發(fā)展過程中的“轉(zhuǎn)向”現(xiàn)象,從而為描述和解答漢語書面語的演化問題,提供新的數(shù)據(jù)和方法參考。該研究方法因此而具有重大價(jià)值,值得進(jìn)一步的嘗試和探討。

四“在”和“人”在語言復(fù)雜網(wǎng)絡(luò)中的演化

在觀察對(duì)比了漢字同現(xiàn)網(wǎng)絡(luò)整體特征的發(fā)展趨勢(shì)后,我們將目光轉(zhuǎn)向了語言系統(tǒng)當(dāng)中的一類具體單位:單字詞。本研究考察了“在”和“人”這兩個(gè)單字詞的特征變化數(shù)據(jù)。

“在”與“人”在漢語的不同時(shí)期均是高頻漢字,并一直都是單字詞。雖然它們也受到漢語詞匯雙音節(jié)化的影響,但作為單字詞,它們?cè)诮?jīng)歷了變化后仍然保有比較完整的句法功能。因此較具對(duì)比性。

本研究測量了“在”和“人”的節(jié)點(diǎn)度數(shù)。所謂節(jié)點(diǎn)度數(shù),指的其實(shí)是在文本中與“在”和“人”相鄰出現(xiàn)的不同漢字的個(gè)數(shù)。從語言學(xué)的角度來說,字同現(xiàn)網(wǎng)絡(luò)中的節(jié)點(diǎn)度數(shù)描述的是一個(gè)漢字與其他不同漢字之間的線性組合關(guān)系的多樣性。度數(shù)越高,說明該漢字可以與更多的其他漢字產(chǎn)生相鄰的線性組合關(guān)系。為盡量減少網(wǎng)絡(luò)規(guī)模對(duì)數(shù)據(jù)的影響,使不同時(shí)期的數(shù)據(jù)之間更具對(duì)比性,本研究對(duì)所有數(shù)據(jù)都進(jìn)行了標(biāo)準(zhǔn)化處理,見圖4。

圖4 “在”與“人”網(wǎng)絡(luò)參數(shù)的歷時(shí)變化

由圖4 可知,雖然均是高頻詞,除現(xiàn)代漢語時(shí)期外,“在”的度數(shù)要明顯低于“人”的度數(shù)。也就是說,“在”的線性組合能力要遠(yuǎn)小于“人”的組合能力。但這一情況到現(xiàn)代漢語時(shí)期有了變化,“在”的線性組合能力經(jīng)過發(fā)展,在現(xiàn)代漢語中已經(jīng)具有與“人”相似的組合能力。觀察和對(duì)比圖4 中的曲線變化趨勢(shì)可知,“在”與“人”的曲線變化遵循相似的規(guī)律:從上古漢語發(fā)展到中古漢語,“在”與“人”的度數(shù)均有所降低;從中古漢語到近代漢語再到現(xiàn)代漢語,兩個(gè)漢字的度數(shù)都一再增加。明顯的不同點(diǎn)是:“在”從近代漢語到現(xiàn)代漢語時(shí)期的度數(shù)增加要明顯快于“人”同時(shí)期的度數(shù)增長。

經(jīng)過分析對(duì)比,本研究認(rèn)為,造成這一變化差異的原因主要是“在”的語法化。作為高頻單字詞,“在”與“人”的區(qū)別是:“人”在漢語的歷時(shí)發(fā)展過程中,意義變化不大,一直都是實(shí)詞;而“在”則表現(xiàn)出了語法化的傾向,發(fā)展出了新的含義,在現(xiàn)代漢語中“在”既是實(shí)詞也是虛詞。語法化并不是一個(gè)連續(xù)、勻速變化的過程,它在某些階段的發(fā)展可能相較于其他階段更快或者更慢甚至停滯[7]。王偉的研究表明,“在”在上古漢語和中古漢語時(shí)期主要是作為動(dòng)詞使用;在近代漢語時(shí)期它開始從動(dòng)詞虛化成介詞和副詞;而在現(xiàn)代漢語時(shí)期它進(jìn)一步地虛化,可作為“詞內(nèi)結(jié)構(gòu)”來使用。例如,名詞“在讀博士”[7]。同時(shí),依據(jù)趙元任[14]的研究,由于受英語和英語翻譯的影響,“在”在現(xiàn)代漢語中被用作介詞的頻率大大增加。由于漢語是孤立語,實(shí)詞缺乏表示語法意義的形態(tài)變化,虛詞(和語序)作為表達(dá)漢語語法功能的主要手段,尤為重要。因此,作為虛詞的“在”比作為實(shí)詞的“在”能夠連接更多不同的詞,亦即虛詞“在”與實(shí)詞“在”相比,能夠與更多不同的漢字或詞產(chǎn)生線性組合關(guān)系,從而造成節(jié)點(diǎn)度數(shù)的增加。這可能是圖4 中,“在”與“人”在現(xiàn)代漢語時(shí)期發(fā)展趨勢(shì)不同的重要原因。

圖4 所示的數(shù)據(jù)允許我們對(duì)不同漢字(或單字詞)的演化過程進(jìn)行對(duì)比。但語言作為一個(gè)完整的系統(tǒng)也是不停地處于動(dòng)態(tài)變化之中的。例如,隨著新事物的出現(xiàn)和社會(huì)的發(fā)展,越來越多的新詞語出現(xiàn)在漢語的書面語當(dāng)中。這些系統(tǒng)性的變化當(dāng)然也會(huì)影響到系統(tǒng)當(dāng)中的個(gè)體。所以,當(dāng)我們?cè)谘芯亢涂疾熘T如“語法化”之類的語言演化現(xiàn)象時(shí),除了觀察和對(duì)比不同個(gè)體的變化,也應(yīng)該考慮到語言系統(tǒng)變化對(duì)個(gè)體的影響,從而更為準(zhǔn)確地區(qū)分出被考察個(gè)體的“真正”變化和它對(duì)動(dòng)態(tài)語言系統(tǒng)的適應(yīng)性變化。為此,本研究對(duì)比考察了圖4 兩條曲線和前面圖3 中平均度曲線的變化趨勢(shì),見下頁圖5。

圖5 “在”與“人”以及字同現(xiàn)網(wǎng)絡(luò)系統(tǒng)的歷時(shí)變化

前文已經(jīng)提到,平均度描述的是網(wǎng)絡(luò)中所有節(jié)點(diǎn)平均擁有的鄰居節(jié)點(diǎn)數(shù),亦即度數(shù)。因此,它是與“在”和“人”的度數(shù)相對(duì)應(yīng)的一個(gè)描述語言系統(tǒng)的指標(biāo)。如果我們認(rèn)為,節(jié)點(diǎn)平均度從某個(gè)角度實(shí)際上描述了不同時(shí)期漢語書面語的整體變化的話,則節(jié)點(diǎn)平均度的曲線可以被作為一個(gè)基線,用來衡量“在”和“人”的度數(shù)變化是“真正”的變化還是只是一種對(duì)系統(tǒng)變化的適應(yīng)。從下頁圖5 可知?!叭恕睆纳瞎艥h語到中古漢語時(shí)期的變化基本與基線相符,很可能只是一種對(duì)語言系統(tǒng)性變化的適應(yīng),而從中古漢語到近代漢語時(shí)期,“人”的曲線變化要快于基線,這可能說明“人”在該階段時(shí)期的線性組合能力有明顯的提高,而從近代漢語到現(xiàn)代漢語時(shí)期的“人”的變化速率又趨于與基線一致?!霸凇睆纳瞎艥h語到中古漢語時(shí)期的變化相較于基線要小,也就是說,當(dāng)漢字的平均線性組合能力均下降時(shí),“在”的線性組合能力相對(duì)下降較小。而從中古漢語時(shí)期到近代漢語時(shí)期的曲線對(duì)比則表明,“在”的線性組合能力在該階段只有小幅的上升,而且因?yàn)槠渖仙纫∮谙到y(tǒng)平均幅度,“在”的相對(duì)的線性組合能力其實(shí)是“明升實(shí)降”的。而從近代漢語到現(xiàn)代漢語時(shí)期,“在”的線性組合能力突然有了顯著性的提高。這一變化必然不是“在”對(duì)語言系統(tǒng)性變化的適應(yīng)造成的,而本研究認(rèn)為,“在”在此階段的快速語法化很可能是產(chǎn)生這一現(xiàn)象的重要原因。

五 結(jié)束語

通過網(wǎng)絡(luò)分析方法,利用各類網(wǎng)絡(luò)參數(shù)的對(duì)比,我們可以觀察到并定量地描述漢語系統(tǒng)整體變化的趨勢(shì)和速度。通過對(duì)四個(gè)不同時(shí)期的漢字同現(xiàn)網(wǎng)絡(luò)的平均度、聚類系數(shù)、平均路徑長度、直徑、網(wǎng)絡(luò)中心度和密度等網(wǎng)絡(luò)參數(shù)的分析和對(duì)比,描述了漢語書面語在中古漢語時(shí)期的發(fā)展轉(zhuǎn)向現(xiàn)象。傳統(tǒng)的歷時(shí)演變研究,由于研究方法的局限,沒辦法對(duì)漢語系統(tǒng)整體的變化進(jìn)行類似的、比較精確的描述。同時(shí),對(duì)“在”和“人”兩個(gè)漢字的節(jié)點(diǎn)度數(shù)的演化對(duì)比研究,說明了“語法化”的演化過程是非線性的,“在”在近代漢語到現(xiàn)代漢語的發(fā)展過程中,“語法化”的速度和程度都明顯增加。同時(shí),本研究還首次實(shí)現(xiàn)了具體語言現(xiàn)象與語言系統(tǒng)變化的共演對(duì)比研究,研究結(jié)果更為精確,可信度更高。

本研究最主要的目的是利用新興的網(wǎng)絡(luò)分析方法來研究漢語的歷時(shí)演化發(fā)展,從而加深對(duì)相關(guān)研究問題的理解。利用網(wǎng)絡(luò)分析方法來進(jìn)行研究的核心優(yōu)勢(shì)是,它為語言研究提供了一種新的系統(tǒng)性分析方法。現(xiàn)代語言學(xué)理論的一個(gè)核心假設(shè)是:語言是一個(gè)復(fù)雜適應(yīng)系統(tǒng)[15]。但是這個(gè)被廣泛接受的觀點(diǎn),由于缺乏合適的、實(shí)際可操作的方法,一直保持在一個(gè)純理論的討論水平。由于語言是一個(gè)復(fù)雜適應(yīng)系統(tǒng),它必然有一些規(guī)則特征是無法直接從個(gè)體單位的特征中觀察到的。以真實(shí)文本為基礎(chǔ),構(gòu)建并分析語言網(wǎng)絡(luò),為系統(tǒng)地觀察語言系統(tǒng)的宏觀特征提供了一個(gè)行之有效的操作方法,并為研究語言系統(tǒng)與語言單位個(gè)體之間的聯(lián)系提供了新的手段。盡管本研究僅對(duì)兩個(gè)單字詞“在”和“人”的句法功能的歷時(shí)演化進(jìn)行了探討,但同樣的方法可以被應(yīng)用到任何一個(gè)漢字、詞、短語等的研究當(dāng)中。這類研究方法從系統(tǒng)整體的角度將原本已有的語言演化“局部快照”,合理地拼合起來,從而提供一種對(duì)語言系統(tǒng)“全景式”的變化描述。字詞等具體語言單位的研究在該方法下被統(tǒng)一到整個(gè)語言系統(tǒng)的研究當(dāng)中,從而使得我們可以對(duì)語言系統(tǒng)整體及局部細(xì)節(jié)都有更加深入的理解。

網(wǎng)絡(luò)分析方法已在其他學(xué)科研究領(lǐng)域當(dāng)中展現(xiàn)了巨大的潛力,它為語言學(xué)研究所帶來的新視角,也必將推進(jìn)漢語歷時(shí)演化研究的發(fā)展,為未來的相關(guān)研究提供先進(jìn)的研究方法,并使研究結(jié)果無論為本研究領(lǐng)域還是其他學(xué)科研究領(lǐng)域提供更有意義的對(duì)比參考。網(wǎng)絡(luò)分析方法的引入,將為漢語的歷時(shí)演化研究翻開新的一頁。

[1]王士元.語言演化的三個(gè)尺度[J].科學(xué)中國人,2013(1):16 -20.

[2]王 力.漢語史稿[M].北京:中華書局,1980.

[3]向 熹.簡明漢語史[M].北京:高等教育出版社,1993:2.

[4]韓玉強(qiáng).“在+L+VP”結(jié)構(gòu)中處所介詞形成的語法化歷程和機(jī)制[J].語文研究,2011(1):21 -27.

[5]沈家煊.“語法化”研究綜觀[J].外語教學(xué)與研究,1994(4):17 -24.

[6]文 旭.《語法化》簡介[J].當(dāng)代語言學(xué),1998(3):47 -48.

[7]王 偉.論“在”的語法化[J].西安外國語大學(xué)學(xué)報(bào),2009(3):27 -31.

[8]呂叔湘.現(xiàn)代漢語單雙音節(jié)問題初探[J].中國語文,1963(1):1.

[9]劉丙麗,劉海濤.基于語料庫的漢語動(dòng)詞句法配價(jià)歷時(shí)研究[J].語言教學(xué)與研究,2011(6):83 -89.

[10]Liang W,Shi Y,Huang Q.Modeling the Chinese language as an evolving network[J].Physica A,2014(393):268 -276.

[11]Cong J,Liu H.Approaching human language with complex networks[J].Physics of Life Reviews,2014(4):598 -618.

[12]劉海濤.語言網(wǎng)絡(luò):隱喻,還是利器[J].浙江大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版,2011(2):169 -180.

[13]陳芯瑩,劉海濤.漢語句法網(wǎng)絡(luò)的中心節(jié)點(diǎn)研究[J].科學(xué)通報(bào),2011(1):735 -740.

[14]Chao Y R.A grammar of spoken Chinese[M].Berkeley:University of California Press,1968.

[15]Kretzschmar W A.The linguistics of speech[M].New York:Cambridge University Press,2009.

猜你喜歡
單字網(wǎng)絡(luò)分析古漢語
基于ISM模型的EPC項(xiàng)目風(fēng)險(xiǎn)網(wǎng)絡(luò)分析
古漢語疑問句末“為”字補(bǔ)證
河北大名話單元音韻母、單字調(diào)及雙音節(jié)非輕聲詞連調(diào)的實(shí)驗(yàn)語音學(xué)初探
上古漢語“施”字音義考
鐵路有線調(diào)度通信的網(wǎng)絡(luò)分析
2016年社交網(wǎng)絡(luò)分析
“對(duì)仗不宜分解到單字”毋庸置疑——答顧紳先生“四點(diǎn)質(zhì)疑”
中華詩詞(2016年11期)2016-07-21 14:56:16
鹽城方言單字調(diào)聲學(xué)實(shí)驗(yàn)研究
大班幼兒同伴交往的社會(huì)網(wǎng)絡(luò)分析
談?wù)劰艥h語的翻譯
語言與翻譯(2014年1期)2014-07-10 13:06:11
郑州市| 龙州县| 东乡县| 淄博市| 夏津县| 兴隆县| 准格尔旗| 壶关县| 泰兴市| 舞阳县| 乌鲁木齐市| 滨州市| 永仁县| 江达县| 奈曼旗| 伊金霍洛旗| 加查县| 太白县| 永仁县| 乡城县| 黔西县| 石泉县| 东兴市| 宁陵县| 陈巴尔虎旗| 澄城县| 德州市| 台北市| 漯河市| 阿克| 紫阳县| 南安市| 皋兰县| 江西省| 滦南县| 全南县| 汕尾市| 韶山市| 宜都市| 恩施市| 上饶县|