肖自輝 范俊軍
語言生態(tài)近十年來已成為語言學研究的新熱點。為應對語言生態(tài)問題,促進語言資源的保護和利用,我們曾提出語言生態(tài)監(jiān)測觀點,a肖自輝、范俊軍:《語言生態(tài)的監(jiān)測與評估指標體系——生態(tài)語言學應用研究》,《語言科學》2011年第3期。并對語言生態(tài)監(jiān)測的概念、內涵、目標和內容作了闡述。近年來,通過對一些區(qū)域的語言生態(tài)狀況進行持續(xù)調查和觀察,我們感覺到,建立語言生態(tài)監(jiān)測的可操作模式,對于語言生態(tài)監(jiān)測和語言生態(tài)的保護很有必要。
語言多樣性是語言生態(tài)的一個重要特性,通常是指一定地理區(qū)域內不同語言的數(shù)量。bLewis, M. Paul(ed.), Ethnologue: Language of the World.16th edn, Dallas: SIL International, 2009,Online: http://www.ethnologue.com/。語言的數(shù)量反映了語言豐富度,但它只是語言多樣性的一個方面。語言多樣性還包含語言使用的均勻度,即語言使用人口的分布情況。例如,甲地和乙地都使用著10種活態(tài)語言,說明這兩個地區(qū)的語言豐富度相同。但甲地每種語言的使用人口均占總人口10%,而乙地90%的人口使用同一種語言,10%的人口使用其他9種語言,顯然甲地的語言均勻度要高于乙地。
語言多樣性還意味著語言種屬的多樣性和結構形態(tài)的多樣性。這與自然界生物圈的物種多樣性類似。語言種屬多樣性是指語言譜系多樣性(phylogenetic diversity),或者說“在某區(qū)域內語言所屬的不同譜系的數(shù)量”。Nettle指出,譜系可以定義為不同層次,如語族、語系等。aDaniel. Nettle, Linguistic diversity]. Oxford:Oxford University Press, 1999, pp.149-150.語言結構多樣性(structural diversity)是指語言結構的變體數(shù)量,如語序、形態(tài)、音類等等。語言作為一個復雜的符號系統(tǒng),其結構類型具有多樣性。因此,衡量某個地域或某個社群的語言多樣性,應從多方面要素考察。本文主要討論語言多樣性的豐富度和均勻度及其相關要素的計量測定,而譜系多樣性和結構多樣性的測度問題留待另文討論。
語言多樣性測量和評估在語言生態(tài)監(jiān)測中有重要地位。語言多樣性監(jiān)測是對特定區(qū)域的語言豐富度、均勻度、譜系多樣性和結構差異度等要素進行周期性調查、觀察和測量,對相關數(shù)據(jù)進行量化分析,揭示一定區(qū)域語言多樣性等級狀況,展示語言數(shù)量、語言轉用、語言接觸、語言消長等狀況和趨勢,對語言生態(tài)系統(tǒng)評估和預警,為語言生態(tài)保護提供決策依據(jù)。
語言多樣性監(jiān)測對象具有地域性,它包括一定地域范圍的全部語言(或方言)及其自然和社會環(huán)境系統(tǒng),而非只針對某個單一語言或方言。語言多樣性監(jiān)測的內容至少包括三方面:一是區(qū)域內語言和方言的數(shù)目;二是區(qū)域內語言和方言的使用人口數(shù),包括各語言和方言的總使用人口,以及不同語言能力者的數(shù)量;三是區(qū)域內各語言和方言使用人口所占總人口的比例。
語言多樣性監(jiān)測評估,具體要回答以下問題。1.一定區(qū)域的語言和方言多樣性現(xiàn)狀如何?哪些區(qū)域是語言多樣性保護的熱點?2.一定區(qū)域內的語言和方言多樣性在過去幾十年內發(fā)生了多大程度的變化?哪些區(qū)域語言生態(tài)的變化較為突出?語言多樣性變化的方向、數(shù)量、程度和速度如何?3.語言文字政策會促使語言和方言多樣性怎樣變化?4.本土傳統(tǒng)語言和方言的數(shù)量和使用人口的現(xiàn)狀及變化趨勢如何?外來語言的數(shù)量和使用人口情況如何?
針對這些問題,我們參考國外有關語言多樣性問題的研究,借鑒自然生態(tài)學的生物多樣性監(jiān)測評估方法和模式,提出語言多樣性監(jiān)測的工作內容,包括:(1)明確語言多樣性監(jiān)測與評估所針對的具體語言問題;(2)確立語言多樣性監(jiān)測的指標體系;(3)選取和設置語言多樣性監(jiān)測區(qū)域;(4)統(tǒng)一調查方法;(5)語言多樣性數(shù)據(jù)的采集和分析處理;(6)語言多樣性評級;(7)建立語言多樣性監(jiān)測數(shù)據(jù)信息網(wǎng)絡。
就我們所見到的文獻而言,美國的世界民族語文研究院(SIL)b網(wǎng)址:https://www.sil.org/。和語界組織(Terralingua)c網(wǎng)址:http://terralingua.org/。開展了語言多樣性的調查和計量研究。SIL發(fā)布的《民族語》(Ethnologue: Languages of the World)d網(wǎng)址:http://www.ethnologue.com/。提供了世界語言的數(shù)量,各語言使用人口的數(shù)量、分布等數(shù)據(jù),并定期修訂。2000年第14版開始用計量方法測定每個國家語言多樣性指數(shù)。例如,2009年第16版列出中國語言多樣性指數(shù)是0.536。語界2010年發(fā)布了《語言多樣性指數(shù)》報告,eDavid Harmon, Jonathan, The Index of Linguistic Diversity: A New Quantitative Measure of Trends in the Status of the World’s Languages. Language Documentation and Conservation, http://n fl rc.hawaii.edu/ldc, 2010,4: 97–151, Archived from the original (PDF) on 18 November 2014.這可能是世界語言多樣性趨勢的第一個計量分析報告。該報告包括兩項測量:一是世界語言多樣性測量;二是本土語言多樣性測量。從全球7299種語言中隨機選取1500種作為統(tǒng)計樣本,通過人口數(shù)據(jù)對不同年份的語言多樣性指數(shù)進行計算,得出各年指數(shù)以及發(fā)展變化趨勢。該報告指出,1970年至2005年全球語言多樣性減少20%,本土語言多樣性在世界大多數(shù)地區(qū)急劇減少;世界上16種最強勢語言則增加了45%—55%的使用人口。
國際上對語言多樣性調查和監(jiān)測及相關政策的制定,都依賴于語言多樣性指數(shù)(diversity index)這個多樣性數(shù)值指標。計算語言多樣性指數(shù)的方法有兩種:一是葛林伯格(greenberg)評估法,二是語界的評估法。
美國語言學家葛林伯格于1956年提出了語言多樣性的計量方法。aGreenberg, Joseph H.,“The Measurement of Linguistic Diversity”,Language, 1956, 32 (1)這種方法主要計量一定區(qū)域語言多樣性狀況及族群交流概率。他提出了八種計量模式。實際上,只有前面七種用于評估語言多樣性,最后一種用于評估語言交流率,即隨機選擇兩個個體能互相通話(即有共同語)的概率。七種計量模式中,模式A和模式B最常用。
模式A: 單語不加權法。在某地隨機選擇兩個人,將他們說同一種語言的概率作為計算語言多樣性指標。若人人都說同一種語言,兩人說同一種語言的概率就是1;若人人都說不同的語言,概率就是0,因此指數(shù)在0~1之間。單語不加權計算公式為:
b A就是單語不加權法得出的多樣性指數(shù),∑i(i2)就是區(qū)域內所有語言各自使用人口除以總人口數(shù)平方的加和。比如,既定區(qū)域有M、N、O三種語言,有1/8的人說M,3/8說N,1/2說O,則A=1-[(1/8)2+(3/8)2+(1/2)2]=0.593。
模式B:單語加權法。單語加權法考慮了語言相似度。若兩對語言的分布概率相同,差別越大則語言多樣性越高。設rMN表示語言M、N的相似度,M、N相似率越大,rMN越大。確定權重(相似率)的方法是:隨機選擇若干固定的基本詞匯,計算不同語言中這些詞匯的相似比(數(shù)值在0~1之間)。公式為:
c mn是在全體人口中隨機有序的抽取兩個單語人,第一個人使用語言M,第二個人使用N的概率。rMN就是配對的兩種語言之間的相似率。
模式A和B都是基于每個人只使用一種語言(母語)的假定,而其他模式則考慮多語狀況。例如,模式C和D是拆分人數(shù)計量法。在計算語言使用人數(shù)時,將每個雙語人等價為2個單語人,如使用M、N的雙語人,等價為使用M語的單語人和使用N語的單語人;三語人等價為3個單語人,如此類推。這種計量模式也分加權和不加權兩種,分別采用上面模式A和B的計算公式計算。
模式E和F:隨機說話人計量法。將使用人口按其實際語言能力情況分類,如某地有M、N、O三種語言,根據(jù)語言能力將語言使用者分成:使用M的單語人,使用N的單語人,使用O的單語人,使用M、N的雙語人,使用M、O的雙語人,使用N、O的雙語人,使用M、N、O的三語人。這種模式也分加權和不加權,分別采用式(1)、(2)計算。區(qū)別在于,計算前要先對每種等價單語人進行有序配對,多語人組合對應的每種等價的單語人配對均分多語人組合的概率。
模式G:隨機說話人—聽話人計量法。這種方法考慮到多語者交流時語言互懂情況,僅有不加權模式,與方法E類似,區(qū)別在于假設多語人等概率使用其自身某種語言。
語界的多樣性指數(shù),計算不同年份全球所有語言使用人口各占全球人口的比例平均數(shù)的變化,它反映了語言多樣性歷時變化。計算過程如下:
(1)計算出某年不同語言的使用者占全球(區(qū)域)總人口的比例。計算公式是:Fly=Nly/Py。
式中,Nly=某年(y)將語言l作為母語使用人口數(shù)量;Pym=某年(y)的區(qū)域總人口。
(2)計算人口比例F的幾何平均數(shù),計算公式是:M = (F1.F2.F3...Fn)1/n。n=語言總數(shù)。
(3)得出語言多樣性指數(shù),計算公式是:Iy=Iy-1(My/My-1)。
式中,Iy=某年(y)語言多樣性的指數(shù);
My=某年F值的幾何平均數(shù);
My-1=前一年F值的幾何平均數(shù)。
將1970年的多樣性指數(shù)設置為1.0,此后每年指數(shù)增加,說明多樣性增加;指數(shù)減少,則說明多樣性減少。如果維持初始值,則表明全球變化趨勢較為平坦。當全球指數(shù)是0.8時,表示多樣性指數(shù)比1970年下降了20%。
上述模式數(shù)據(jù)主要基于每種語言使用者占總人口的比例,即語言均勻度。這種方法雖然簡便,但存在以下問題:兩個模式只考慮語言多樣性,不考慮方言多樣性,因而對大區(qū)域(如國家、地區(qū)甚至全球)評估比較合適,對小區(qū)的評估卻有所不便。語界評估法只考慮母語,葛林伯格評估法考慮了多語,但都沒有考慮母語和其他語言的地位和作用差別。兩個計量模式的指標也過于單一,沒有考慮傳統(tǒng)本土語言在語言多樣性系統(tǒng)中起到的價值和作用,也沒有考慮到外來語言情況及其對語言多樣性的影響。因此,我們認為,語言多樣性計量評估應是多指標綜合評估,以豐富度和均勻度為基礎,兼顧本土語言和方言豐富度、外來語言數(shù)量和方言滲透度等要素,建立相應要素權重來計量和測定。
綜合計量評估性設立四個指標。1.語言和方言a本文所指的方言是少數(shù)民族語言的大方言、漢語大方言的方言片,如藏語的康方言、粵方言廣府片等,不含次方言、方言小片和方言點。豐富度指標,測定一定空間范圍內的語言和方言數(shù)目以表達語言的豐富程度,數(shù)據(jù)主要是一定區(qū)域的語言和方言數(shù)。2.語言和方言均勻度指標,判斷語言和方言的使用者分布情況的數(shù)值。3. 傳統(tǒng)本土語言和方言b本文所指的傳統(tǒng)本土語言和方言,是指在當?shù)厥褂脮r間在10代及以上的語言和方言。的豐富度指標,測定區(qū)域內本土語言和方言的數(shù)量,用于比較語言的特殊價值。4. 外來語言和方言的比例指標,測定區(qū)域內外來語言和方言使用人口與區(qū)域總人口之比,用于比較語言多樣性系統(tǒng)的潛在受干擾程度。
具體評估步驟如下。
第一步:設計指標權重。語言多樣性指標權重是權衡指標內容項相對重要程度的量值。指標權重關系是否科學合理,直接影響計量評估結果的效度和信度。我們采用專家咨詢法確定權重,選擇語言學、生態(tài)學、環(huán)境科學等領域29位專家,獨立對各項指標進行兩兩比較,按百分制打分,最后計算各專家權重平均值,確定各要素指標的最終權重。權重系數(shù)如表1所示。
表1 語言多樣性的指標權重
第二步:明確評價指標的歸一化處理。
語言多樣性各指標的具體數(shù)據(jù)來源不同、數(shù)值不同,需要歸一化處理。計算式如下:
S = S' /Amax; A = 1/Amax
式中 S 為歸一化后的評價指標; S’為歸一化前的評價指標; A 為歸一化系數(shù);Amax為某指標歸一化處理前的最大值。
第三步:計算語言多樣性綜合評估指數(shù)。
語言多樣性綜合評估指數(shù)是語言和方言豐富度、語言和方言均勻度、特有的本土語言和方言的豐富度、外來語言和方言的數(shù)量和比例4個評價指標的加權求和,其計算過程如下。
(1)計算語言和方言豐富度指數(shù)。
語言和方言豐富度,即區(qū)域內語言和方言的數(shù)量,再作歸一化處理。計算式是:
SF= ( Sy×A1+ Sf×A2)/2
Sy是區(qū)域內語言的數(shù)量,Sf是區(qū)域內方言的數(shù)量;A1是語言數(shù)量的歸一化系數(shù),A2是方言數(shù)量的歸一化系數(shù)。
(2)計算語言均勻度??紤]到計算的語言類別包括語言和方言兩類,而語言又包括了下屬的方言,為避免重復計算,此處的語言均勻度實際就是方言均勻度。均勻度采用葛林伯格的單語加權法或隨機言語者加權法。計算式是:SJ=1-∑ab(ab)(rAB)
ab是將兩種方言配對(包括兩種相同的方言),能夠隨機選擇到說這種方言的兩個人概率。rAB就是配對的兩種方言之間的相似率。
(3)計算傳統(tǒng)本土語言和方言的豐富度。傳統(tǒng)本土語言和方言的豐富度即傳統(tǒng)本土語言和方言的數(shù)量。計算式是:ST= ( S3×A3+ S4×A4)/2。式中,ST為歸一化后的傳統(tǒng)本土語言和方言豐富度;S3為傳統(tǒng)本土語言種數(shù);A3為傳統(tǒng)本土方言歸一化系數(shù);S4為傳統(tǒng)本土語言種數(shù);A4為傳統(tǒng)本土方言歸一化系數(shù)。
(4)計算外來語言和方言滲入度。外來語言和方言滲入度是指既定區(qū)域外來語言和方言的使用人口與總人口數(shù)之比。計算式為:SW=S5/S0×A5。式中,S5是外來語言和方言的使用人口數(shù);S0為區(qū)域內總人口數(shù);A5是外來語言和方言歸一化系數(shù)。
(5)加權求和。最后對這幾個指標值進行除權相加。其中,外來語言和方言的數(shù)量和比例為本型指標,即指標的屬性值越小越好,故對其作適當轉換。語言多樣性綜合型指數(shù)為:
EI = SF× 0. 41+ SJ× 0.37+ ST×0. 11 + ( 1 - Sw)×0. 11
第四步:對語言多樣性狀況分級。
語言多樣性的最終評估,采用層級劃分比較直觀和方便,尤其是對象樣本較少的時候,可直接對語言多樣性狀況作出定性判斷,得出具體區(qū)域語言多樣性的現(xiàn)狀,并對該區(qū)域語言多樣性狀況進行定級。這樣可以對語言生態(tài)保護的政策制定和實施行動提供切實的依據(jù)。為避免分級限制過細和出現(xiàn)過多跨級現(xiàn)象,我們將語言多樣性分為高、中、一般和低四個等級。語言多樣性計量指數(shù)在0至1之間,而且數(shù)值越接近1,表明多樣性越高。因此,語言多樣性等級與對應的數(shù)值分配情況具體見表2所示。
表2 語言多樣性狀況分級表
有時,為盡快了解某個區(qū)域語言多樣性大概狀況,通??刹捎谜Z言多樣性快速監(jiān)測評估法——單語不加權法,即利用隨機取樣的兩個個體說不同語言的概率來對語言多樣性進行快速監(jiān)測與評估。此法原型來自生物學的辛普森指數(shù),它在自然生物學中常用來快速測定群落物種多樣性指數(shù)。a陳廷貴、張金屯:《十五個物種多樣性指數(shù)的比較研究》,《河南科學》1999年第17期。
綜合計量評估模式需要復雜而長期的數(shù)據(jù),如單語人數(shù)量、雙語人數(shù)量、外來語言數(shù)量及使用人口等等。因此,應建立一個語言生態(tài)的周期普查系統(tǒng)和工作機制,以逐漸實現(xiàn)在科學時間密度內擴大數(shù)據(jù)樣本的范圍和種類,使語言生態(tài)的監(jiān)測評估更科學有效。語言生態(tài)監(jiān)測還處于探索階段,目前沒有科學的指標體系和有效的計量模式。無論采用何種方式,只要有科學性、客觀性和可操作性,都值得一試。