胡韌奮,曹 冰,杜健一
(1.北京師范大學(xué) 中文信息處理研究所,北京 100875;2. 百度,北京 100085;3. 香港大學(xué)教育學(xué)院,香港)
據(jù)統(tǒng)計(jì),甲骨文當(dāng)中有20%為形聲字,在《說文解字》中已經(jīng)有80%的字是形聲字,現(xiàn)代漢字中85%以上都屬于形聲字[1]。造字之初,形聲字讀音隨聲符保持一致。而伴隨語音系統(tǒng)的演變、漢字形體的變化以及各種方言的匯入影響,形聲字聲符的表音度悄然生變。可以說,日常生活中聲符的表音作用正在漢語教學(xué)中處于一種十分尷尬的境地: 一方面它是標(biāo)音讀字的重要依據(jù)和工具,另一方面,根據(jù)聲符讀字又屢屢鬧出笑話。這種問題對于學(xué)習(xí)漢語的外國學(xué)生而言尤為突出。
有學(xué)者曾研究指出,漢字教學(xué)應(yīng)根據(jù)由易到難,由常用到次常用的原則,聲符字的安排順序應(yīng)取決于聲符字和形聲字的關(guān)系[2]。即對于同一聲旁形聲字教學(xué)順序的安排需要考慮聲旁和所構(gòu)形聲字之間的語音相似度。語音相似度高的形聲字在前,相似度低的在后[3]。因此,我們有必要加強(qiáng)形聲字的研究,從不同角度出發(fā)進(jìn)行形聲字聲符在普通話中表音度的測查。本文的研究成果——以表音度為綱的形聲字類聚,不僅可以作為現(xiàn)代漢字規(guī)范制定的佐證,也可以幫助漢語教學(xué)工作者循序漸進(jìn)地實(shí)施漢字教學(xué),以實(shí)現(xiàn)教學(xué)效果的最優(yōu)化。
從上世紀(jì)60年代起,國內(nèi)學(xué)者便開始關(guān)注形聲字聲符的表音狀況,并開始引入統(tǒng)計(jì)學(xué)的方法進(jìn)行分析和討論。1965年,葉楚強(qiáng)先生最早對形聲字聲旁的表音度進(jìn)行測查,并統(tǒng)計(jì)了《新華字典》中表音功能較強(qiáng)的漢字?jǐn)?shù)量,得出聲旁能完全表音的形聲字的占總數(shù)的23.6%[4]。但其測查方式主要基于人工計(jì)數(shù),且對形聲字的分類是根據(jù)聲韻調(diào)的特征是否相同,忽略了這些特征的影響比例,故而沒有對聲旁的表音度形成直觀呈現(xiàn)。
周有光先生于1978年發(fā)表《現(xiàn)代漢字中聲旁的表音功能問題》,并于1980年出版《漢字聲旁讀音便查》一書,同樣對《新華字典》中聲旁的表音情況進(jìn)行統(tǒng)計(jì),他計(jì)算出聲旁的有效表音率為39%[5]。周先生雖然進(jìn)行了精細(xì)的量化研究,但是他把部首意外的半邊一概視為聲旁,但漢字的合體字中除了形聲字外,還有會意字等,所以這種方法是不夠嚴(yán)謹(jǐn)?shù)腫6]。
上世紀(jì)90年代中期,李燕和康加深以《現(xiàn)代漢語通用字表》為對象,根據(jù)聲韻調(diào)是否相同統(tǒng)計(jì)出相應(yīng)8種情況下的字次。他們的研究考慮到聲母和韻母對發(fā)音的影響要大于調(diào)值,故而在權(quán)重賦值上進(jìn)行了調(diào)整: 只同調(diào)的計(jì)0.1分,聲同或韻同的計(jì)0.45分,聲、調(diào)同或韻、調(diào)同計(jì)0.5分,聲、韻兩項(xiàng)同的計(jì)0.9分,聲、韻、調(diào)全同計(jì)1分,聲、韻、調(diào)全不同的計(jì)0分[7]。這樣的賦值與此前學(xué)者的分析統(tǒng)計(jì)相比可算向前進(jìn)了一大步,但是,他們沒有考慮到聲母和韻母對于發(fā)音的影響效果不盡相同,且不同的聲母或韻母間還因發(fā)音部位或發(fā)音方法之間的同或似有著一定的相關(guān)性。
上世紀(jì)90年代末,王小寧以《現(xiàn)代漢語常用字表》的 2 500 個(gè)常用字為字料,將1 290個(gè)形聲字按語音相似(此標(biāo)準(zhǔn)將只有韻同的字也包括在內(nèi))的標(biāo)準(zhǔn)進(jìn)行統(tǒng)計(jì),結(jié)論是64.4%的形聲字可以通過它的聲旁提示出讀音[8]。王小寧的研究結(jié)果從整體上揭示了聲旁表音情況,但未對其分布進(jìn)行具體的分類和討論。
2008年,種一凡以《漢語水平詞匯與漢字等級大綱》為研究對象,在定量的基礎(chǔ)上根據(jù)現(xiàn)代漢字的形、音、義做了形聲字理想分類考察。它遵循音義并重的原則,對1 945個(gè)可分析的形聲字從表音、表義兩個(gè)維度綜合考察,賦值測算,最后分出了理想狀況下的六個(gè)形聲字小類[9]。
綜上來看,前輩學(xué)者從上世紀(jì)60年代起便開始將定量研究的方法引入形聲字聲符研究范疇,試圖在統(tǒng)計(jì)的基礎(chǔ)上對聲符的表音度進(jìn)行直觀的呈現(xiàn)。40多年來,研究者們對這一問題持續(xù)關(guān)注,并在該領(lǐng)域不斷耕耘,取得了很大的進(jìn)步,但是在聲符表音度的測查上還存在以下幾點(diǎn)不足: (1)未能考慮到聲母和韻母對于發(fā)音的影響比重不同,在實(shí)際測算中將二者效用等同;(2)未能考慮到由于語音的流變,音節(jié)的聲母或韻母會向其發(fā)音相近的聲韻母轉(zhuǎn)變,故而,不能簡單地按照聲、韻、調(diào)同或不同來對其表音情況進(jìn)行分類,而是需要考慮聲韻相似的諸種因素;(3)未能對樣本中每個(gè)形聲字聲符的表音度進(jìn)行測算,研究多偏向完全表音形聲字比例的測算,這樣一來便失去了對樣本整體的處理和呈現(xiàn);(4)研究很大程度上依靠人工辨認(rèn)和統(tǒng)計(jì),需要耗費(fèi)大量的人力和時(shí)間。
故而,本文擬針對以上四點(diǎn)不足,在分類時(shí)將聲調(diào)的關(guān)系分為“相同”和“不同”兩個(gè)類型,而將聲母、韻母的關(guān)系改分為“相同”、“相似”和“不同”三個(gè)類型,其中聲母“相似”的程度充分考慮其發(fā)音部位、發(fā)音方法對發(fā)音的影響,而韻母相似程度則從介音、韻腹和韻尾三個(gè)維度進(jìn)行相似度考量。同時(shí),考慮到聲、韻、調(diào)相似度對表音度大小的影響程度不同,需要制定三個(gè)不同的影響系數(shù)。最后,根據(jù)聚類分析結(jié)果得到以表音度為綱的形聲字基本分類體系。
為了適應(yīng)語文教學(xué)、辭書編纂以及漢字機(jī)械處理和信息處理等各方面的需要,國家語言文字工作委員會、國家教育委員會共同制定并發(fā)布了《現(xiàn)代漢語常用字表》,包括常用字(2 500字)和次常用字(1 000字)兩部分,共3 500字。經(jīng)計(jì)算機(jī)抽樣檢測,常用字在語料中的覆蓋率達(dá)到99.48%,可以說,掌握了常用字就達(dá)到了利用漢語的基本要求。本文正是以《現(xiàn)代漢語常用字表》中的3 500字為研究對象,對其中形聲字的聲符表音度進(jìn)行考察。
一個(gè)漢字的讀音由聲、韻、調(diào)三種元素組成,形聲字的聲符對所構(gòu)字的表音度的大小由兩者聲、韻、調(diào)的相似程度決定。因此,若想根據(jù)表音程度的大小對各種表音情況進(jìn)行分級歸類,可以將分類標(biāo)準(zhǔn)分為以下三個(gè)性狀:
I(initial)——聲符和所構(gòu)字的聲母相似程度;
F(final)——聲符和所構(gòu)字的韻母相似程度;
T(tone)——聲符和所構(gòu)字的聲調(diào)相似程度。
由于聲符和所構(gòu)字聲、韻、調(diào)的相似程度對表音度大小的決定程度并不相同,因此,須先設(shè)w1、w2、w3三個(gè)系數(shù)分別代表聲、韻、調(diào)對表音度的影響程度。考慮到韻母的影響程度大于聲母,且前兩者遠(yuǎn)遠(yuǎn)大于聲調(diào),令w1=0.35,w2=0.55,w3=0.1。那么,聲符對所構(gòu)字的表音度可表示為
假設(shè)有兩個(gè)形聲字A和B,它們的性狀數(shù)據(jù)表示如表1所示:
表1 形聲字性狀賦值表
如果以三個(gè)性狀作為坐標(biāo)軸,由性狀狀態(tài)的數(shù)值表示坐標(biāo)值,那么形聲字A和形聲字B可以表示為三維空間中的兩個(gè)點(diǎn)。我們可用兩點(diǎn)間的距離表示他們的相似性,定義A和B的距離為
若兩點(diǎn)距離較近,那么它們的相似性較好;反之,相似性較差。將形聲字按照性狀值在三維空間標(biāo)出它們的坐標(biāo),屬于同一類別的形聲字距離應(yīng)該較小,這樣一來,不同類別的形聲字集合應(yīng)該占據(jù)著不同的空間區(qū)域。
接下來,本文將討論形聲字I、F、T三個(gè)性狀值的求解,由于聲、韻、調(diào)各自的影響發(fā)聲機(jī)制不同,故下面對三者相似度判定分別展開討論。
從語音學(xué)角度看來,我們可以知道,聲母的發(fā)音與發(fā)音部位和發(fā)音方法有關(guān)。發(fā)音部位指氣流受阻的部位,發(fā)音方法則需從三個(gè)方面進(jìn)行分析: 氣流的強(qiáng)弱(送氣/不送氣)、聲帶的振動與否(清/濁)、形成和克服阻礙的方法(塞/擦/塞擦/鼻/邊/閃/顫/半元音)[10]。特別值得注意的是,在漢語普通話音系中,發(fā)音部位的影響普遍大于發(fā)音方法。
不同發(fā)音部位、發(fā)音方法相似度可由圖論解決,具體標(biāo)準(zhǔn)如表2所示(不含半元音y和w):
表2 聲母發(fā)音表(發(fā)音部位、方法)
圖1為發(fā)音部位帶權(quán)無向圖P(place),設(shè) p(i,j) 代表從Pi到Pj的最短距離。
圖2為發(fā)音方法帶權(quán)無向圖M(manner),設(shè)m(i, j)代表從Mi到Mj的最短距離。對于發(fā)音部位和發(fā)音方法來說,兩點(diǎn)之間距離越近代表二者發(fā)音越相近。
圖1 發(fā)音部位帶權(quán)無向圖P
圖2 發(fā)音方法帶權(quán)無向圖M
設(shè)兩個(gè)聲母Ii和Ij,其發(fā)音部位和發(fā)音方法分別對應(yīng)頂點(diǎn)Pi、Mi、Pj、Mj,則兩個(gè)聲母之間的相似度可表示為
I(i,j)=100-p(i,j)-m(i,j)
另設(shè)半元音y和w與其他聲母之間相似度為0,y和w之間相似度為80。
一個(gè)音節(jié)中的韻母,通常可以分為介音(又稱韻頭)、韻腹和韻尾三個(gè)部分[11]。任何一個(gè)音節(jié)都一定有韻腹,但不一定有介音和韻尾。一般來說,每一個(gè)部分均由一個(gè)單元音韻母承擔(dān)。其對應(yīng)關(guān)系如表3所示。
表3 韻母分類表
按照國際音標(biāo)的分類, 現(xiàn)用漢語拼音中的單元音韻母基本屬于舌面元音,其發(fā)音主要由舌位的高低、舌位的前后和唇型的圓展來分類。如圖3,國際上通行的舌面元音舌位圖生動地為我們展示了各單元音韻母的類別和發(fā)音方式。根據(jù)此圖可以整理韻母發(fā)音如表4所示。
圖3 舌面元音舌位圖
表4 韻母發(fā)音表
基于以上分析,我們可以構(gòu)建表示介音、韻腹、韻尾各自單元音韻母之間相似度的無向圖,如圖4、圖5、圖6所示。同理,兩點(diǎn)之間距離越短,表示二者發(fā)音越相近。
圖4 介音相似度無向圖
圖5 韻腹相似度無向圖
圖6 韻尾相似度無向圖
韻母由介音、韻腹和韻尾三部分組成,由于韻腹是指復(fù)韻母中開口度最大、發(fā)音最響亮的元音,也叫主要元音,因此它占據(jù)最重要的地位。我們可以設(shè)置參數(shù)c1、c2、c3來代表三個(gè)組成部分對韻母整體發(fā)音的影響程度,其值分別為25%、50%、25%。
設(shè)兩個(gè)韻母F1和F2,它們的介音、韻腹和韻尾分別為F11、F12、F13,F(xiàn)21、F22、F23,則兩個(gè)韻母之間的相似度為
F(F1,F2)=c1×F′(F11,F21)+c2×F′(F12,F22)
+c3×F′(F13,F23)
聲調(diào)對音節(jié)的影響顯然小于聲母和韻母,而且四個(gè)聲調(diào)調(diào)值之間相似程度也不相同。普通話有四種基本調(diào)值,可以歸并為四個(gè)調(diào)類。根據(jù)古今調(diào)類演變的對應(yīng)關(guān)系,定名為陰平、陽平、上聲和去聲[12]。具體描寫如下:
1) 陰平: 高平調(diào),發(fā)音時(shí)由5度到5度,簡稱55;
2) 陽平: 中升調(diào),發(fā)音時(shí)由3度到5度,簡稱35;
3) 上聲: 降升調(diào),發(fā)音時(shí)由2度降到1度,再升到4度,簡稱214;
4) 去聲: 全降調(diào),發(fā)音時(shí)由5度到1度,簡稱51。
具體發(fā)音情況如圖7所示。
圖7 四聲調(diào)值圖
我們可以利用調(diào)值線之間的平均距離推導(dǎo)出兩個(gè)聲調(diào)之間的相似程度T(tone),如圖8所示。
圖8 聲調(diào)相似度無向圖
本文從3 500個(gè)常用字中挑出2 305個(gè)標(biāo)準(zhǔn)形聲字,并按照上述模型對待分類的形聲字進(jìn)行分類,得出結(jié)果如下。
如圖9所示,相似度100%(聲母完全相同)的形聲字有1 314個(gè);相似度在70%到100%之間的形聲字有705個(gè);相似度在35%到70%之間的形聲字有32個(gè);相似度在0%到35%之間的形聲字有254個(gè)。
圖9 聲符與本字聲母相似度分析圖
如圖10所示,相似度100%(韻母完全相同)的形聲字有1 603個(gè);相似度在70%到100%之間的形聲字有211個(gè);相似度在35%到70%之間的形聲字有359個(gè);相似度在0%到35%之間的形聲字有132個(gè)。
圖10 聲符與本字韻母相似度分析圖
如圖11所示,相似度100%(聲調(diào)完全相同)的形聲字有1 193個(gè);相似度在70%到100%之間的形聲字有366個(gè);相似度在35%到70%之間的形聲字有517個(gè); 相似度在0%到35%之間的形聲字有229個(gè)。
如圖12所示,表音度100%(聲韻調(diào)完全相同)的形聲字有749個(gè);表音度在80%到100%之間的形聲字有830個(gè);表音度在50%到80%之間的形聲字有539個(gè);相似度在0%到50%之間的形聲字有187個(gè)。
圖11 聲符與本字聲調(diào)相似度分析圖
圖12 聲符與本字讀音相似度分析圖
結(jié)合上文中聲符和所構(gòu)字聲、韻、調(diào)相似度分析及表音度分析結(jié)果,我們可以生成以聲符表音度為綱的形聲字分級聚類,并定義聲符表音程度的五大級標(biāo)準(zhǔn)及十小級標(biāo)準(zhǔn),如表5所示。
表5 聲符表音度分類結(jié)果
續(xù)表
注1: 當(dāng)聲、韻不完全相同的時(shí)候,聲調(diào)在聲符表音度界定中起到的作用遠(yuǎn)低于聲母和韻母,故在其后的定級分類中將其作用忽略不計(jì)。
注2: 通過對圖9和圖10中的曲線進(jìn)行斜率分析,我們將相似度達(dá)到70%及以上的一對聲母界定為“相似”,相似度達(dá)到65%及以上的一對韻母界定為相似。低于70%及65%的聲母、韻母則被界定為“不同”。
本文從聲、韻、調(diào)三個(gè)維度分別展開討論,運(yùn)用統(tǒng)計(jì)分析的方法對三者進(jìn)行了精確的相似度分析,并以Matlab制圖方式呈現(xiàn)。根據(jù)數(shù)據(jù)分析結(jié)果,我們將聲調(diào)的關(guān)系劃分為“相同”和“不同”兩個(gè)類型,而將聲母、韻母的關(guān)系劃分為“相同”、“相似”和“不同”三個(gè)類型,并對三者分別進(jìn)行了具體的數(shù)據(jù)界定: “相同”均為100%,“相似”為分別達(dá)到70%和65%,余下的則劃入“不同”范疇。在以上數(shù)據(jù)分析和理論知識的基礎(chǔ)上,本文制定了較為客觀精確的形聲字聲符表音度分級標(biāo)準(zhǔn),并按此將3 500個(gè)常用漢字中的2 305個(gè)形聲字分成A~E五大等級、10小類別,從而利用程序得出每個(gè)等級、類別的形聲字?jǐn)?shù)量,并組成各級、各類的形聲字表。
綜觀整個(gè)數(shù)據(jù)分析過程,本文在精確的一手?jǐn)?shù)據(jù)和語音學(xué)、文字學(xué)專業(yè)知識的基礎(chǔ)上,充分運(yùn)用數(shù)學(xué)和計(jì)算機(jī)方法進(jìn)行科學(xué)的定量分析研究,從而對現(xiàn)代漢語中形聲字的表音度完成了一次系統(tǒng)而全面的測查。測查結(jié)果直觀、詳細(xì),可在一定程度上為現(xiàn)代漢字規(guī)范制定和漢語教學(xué)提供參考和佐證。然而,在此過程中,一些參數(shù)的制定仍然存在一定主觀因素的影響,需要進(jìn)行更為嚴(yán)謹(jǐn)?shù)目茖W(xué)驗(yàn)證。
[1] 王寧. 古代漢語[M]. 北京出版社, 2006:40-38.
[2] 萬業(yè)馨. 略論形聲字聲旁與對外漢字教學(xué)[J]. 世界漢語教學(xué). 2000, (1):62-69.
[3] 李艷霞. 對外漢語形聲字教學(xué)之我見[J]. 安陽師范學(xué)院學(xué)報(bào). 2012, (3):132-134.
[4] 葉楚強(qiáng). 現(xiàn)代通用漢字讀音的分析統(tǒng)計(jì)[J]. 中國語文, 1965, (3):201-205.
[5] 周有光. 現(xiàn)代漢字中聲旁的表音功能問題[J]. 中國語文, 1978, (3):172-177.
[6] 廖才高. 現(xiàn)代形聲字表義音功能研究述評[J]. 長沙鐵道學(xué)院學(xué)報(bào)(社會科學(xué)版), 2003, 4(4):141-144.
[7] 李燕, 康加深. 現(xiàn)代漢語形聲字聲符研究[C]. 語言文字應(yīng)用研究論文集(Ⅰ), 1995年: 29-36.
[8] 王小寧. 從形聲字聲旁的表音度看現(xiàn)代漢字的性質(zhì)[J]. 清華大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版), 1999,14(1):66-69.
[9] 種一凡. 形聲字的理想分類初探[J]. 語言教學(xué)與研究, 2008, (5):16-23.
[10] 黃伯榮, 廖序東. 現(xiàn)代漢語(上)[M ]. 北京: 高等教育出版社, 1997.
[11] 岑運(yùn)強(qiáng). 語言學(xué)基礎(chǔ)理論[M]. 北京: 北京師范大學(xué)出版社,2005.
[12] 周同春. 漢語語音學(xué)[M]. 北京師范大學(xué)出版社, 2003.