李 甜,侯 敏
(1. 中國傳媒大學(xué) 文學(xué)院,北京 100024;2. 中國傳媒大學(xué) 國家語言資源監(jiān)測與研究有聲媒體中心,北京 100024)
字母詞形式特征分析
李 甜1,侯 敏2
(1. 中國傳媒大學(xué) 文學(xué)院,北京 100024;2. 中國傳媒大學(xué) 國家語言資源監(jiān)測與研究有聲媒體中心,北京 100024)
摘 要:字母詞與傳統(tǒng)漢語詞匯在形式上有很大的區(qū)別,在詞長和內(nèi)部組合上獨(dú)具特點(diǎn)。統(tǒng)計發(fā)現(xiàn),字母詞平均詞長為3.92字符,長于漢語詞匯的平均詞長,長度為3的字母詞數(shù)量最多;每個字母詞中平均有3.15個字母,其中含3個字母的字母詞數(shù)量最多;每個含有漢字的字母詞中平均有2.25個漢字,其中含2個漢字的字母詞數(shù)量最多。隨著字母詞中字母個數(shù)的增加,帶漢字的情況會減少。
關(guān)鍵詞:字母詞;詞長;字母;漢字
字母詞的產(chǎn)生和發(fā)展經(jīng)歷了從萌芽到擴(kuò)散再到穩(wěn)固的過程,而關(guān)于字母詞的研究也經(jīng)歷了從起步到關(guān)注再到成熟的階段。迄今,與字母詞有關(guān)的學(xué)術(shù)論文包括對字母詞定義和分類的研究,從語音、詞匯等角度對字母詞的研究,對字母詞使用狀況的調(diào)查等[1-6]。但縱觀前人研究發(fā)現(xiàn),對字母詞形式的認(rèn)識還停留在內(nèi)省階段,基于語料對字母詞的形式進(jìn)行量化分析的研究較少。因此,為更好地了解字母詞的使用狀況,有必要對字母詞的形式進(jìn)行量化分析。
詞長和組合方式作為字母詞中最直觀的兩種形式,對字母詞使用狀況的影響不可小覷。本文基于真實語料,初步探討了實際運(yùn)用中字母詞的詞長特征和組合方式,以期為下一步研究字母詞的形式對字母詞使用狀況的影響奠定基礎(chǔ),也試圖為字母詞規(guī)范提供依據(jù)。
本文主要采用定量和對比的研究方法分析真實語料中的字母詞形式特征。字母詞來源復(fù)雜,形式多樣,實際運(yùn)用中也花樣百出。根據(jù)不同的研究目的,語料的選擇標(biāo)準(zhǔn)以及字母詞的選取和統(tǒng)計標(biāo)準(zhǔn)也有所不同。
在字母詞的選取和統(tǒng)計過程中,明確了幾個問題:
第一,單個字母和符號不算字母詞,如A、¥等。因為其要和特定的成分共同使用,不能單獨(dú)使用,不符合詞的定義,因此單個字母和符號不算字母詞[7]。
第二,調(diào)查過程中,不對一詞多義現(xiàn)象進(jìn)行區(qū)分。如“ABC”一詞,有“美國廣播公司、美國出生的中國人”等5個不同的義項。由于現(xiàn)代技術(shù)的局限,目前無法自動區(qū)分一詞多義,且調(diào)查字母詞的形式特征,不考慮語義上的不同,故對一詞多義不做區(qū)分,認(rèn)為是一個詞條。
第三,將“ATM機(jī)”和“ATM”認(rèn)為是兩個不同的詞條。此舉便于調(diào)查字母詞中漢字使用情況。
本文選取中國最具權(quán)威性、發(fā)行量最大的綜合性報紙《人民日報》作為語料。《人民日報》作為機(jī)關(guān)報,在字母詞用詞方面較為謹(jǐn)慎。通過分析《人民日報》中字母詞的形式,可以更好地說明大眾媒體中使用字母詞的具體情況。調(diào)查共計采集2011-2014年《人民日報》145 032個文本文件、160 161 737字次。
鄒玉華根據(jù)認(rèn)知語言學(xué)原型范疇化理論,認(rèn)為字母詞是個復(fù)雜的原型概念,從形式和語言詞的維度上看,有典型和非典型之分[3,p15]。本文主要對典型字母詞的形式特征進(jìn)行計量分析,暫不考慮非典型字母詞。研究認(rèn)為典型字母詞須具備以下條件:
第一,形式上要典型。鄒玉華指出,字母詞有四個形式特征:與漢字組合;讀字母名稱音;形體大寫;縮略[3,p61-66]。符合兩個以上特征的字母詞是典型字母詞。
第二,語言運(yùn)用上要典型。侯敏指出,語言詞要符合三個條件:具有較強(qiáng)的概括性;具有一定的公眾性;在公眾傳播中具有較高的使用頻度[8]。符合這三個條件的字母詞也是典型字母詞。
本文主要從字母詞的詞長和組合方式兩方面對字母詞的形式特征進(jìn)行了分析。詞長分析主要包括平均詞長、詞長極限區(qū)間以及頻次最高的詞長。組合方式主要從字母詞所含字母和漢字的個數(shù)及其組合方式三個角度進(jìn)行分析。
(一)字母詞詞長
研究字母詞詞長,可以從不同的角度進(jìn)行考察。如“APEC會議”一詞,從音節(jié)角度來看,它的長度為4;而從所用字符的個數(shù)來看,它的長度為6。由于字母詞中,部分字母讀字母音,部分則讀拼合音,從音節(jié)角度分析容易造成混淆。因此,本文從所用字符個數(shù)的角度對字母詞的詞長特征進(jìn)行計量分析。
對語料中全部字母詞和共有字母詞各詞長區(qū)間的詞種及其比例進(jìn)行了統(tǒng)計,詳見表1。
由表1可見,詞長為3的字母詞在全部字母詞中占39.17%,在共有字母詞中占43.96%,比例最高。也就是說,在字母詞中,詞長為3的字母詞數(shù)量最多。這與英語和漢語詞語的詞長使用特點(diǎn)有所差別。據(jù)鄧耀臣、馮志偉的研究,在英語和漢語中,音節(jié)長度為2的詞數(shù)量最多[9]。研究對詞長為3的字母詞做了進(jìn)一步觀察,發(fā)現(xiàn)詞長為3的字母詞基本都是外文縮略語,且讀字母音,音節(jié)長度大于等于3,比英語和漢語詞語的音節(jié)長度長。研究認(rèn)為,這與字母詞的功能有一定關(guān)聯(lián)。
表1 各詞長區(qū)間的詞種比例
字母詞的主要功能是以簡便的方式表達(dá)較復(fù)雜或未曾接觸過的事物。一般而言,較為復(fù)雜和未曾接觸過的事物全稱較長,需要由3個左右的外文單詞來描述,如“NBA”的全稱是“National Basketball Association”;此外,部分字母詞在進(jìn)入漢語系統(tǒng)時會被半漢化,如在后面加上漢字義標(biāo)等,如“pH值”在進(jìn)入漢語系統(tǒng)時,在縮略后加上漢字義標(biāo)“值”。
我們還發(fā)現(xiàn),在全部字母詞中,詞長區(qū)間2-4字符的字母詞有76.06%;而在共有字母詞中,詞長區(qū)間2-4字符的字母詞有86.53%。數(shù)據(jù)表明,詞長較長的字母詞使用頻次相對而言較低,使用時長也較短,與詞長區(qū)間2-4字符的字母詞差異較大。
在全部字母詞中,詞長為4的字母詞占23.54%,詞長為2的字母詞占13.35%;而在共有字母詞中,詞長為2的字母詞占23.99%,詞長為4的字母詞占18.58%??梢?,雖然在全部字母詞中詞長為4的字母詞比詞長為2的字母詞多,但是詞長為4的字母詞穩(wěn)定性差,連續(xù)三年以上使用的詞數(shù)量較少。
我們對全部字母詞和共有字母詞的平均詞長進(jìn)行了計算,計算公式如下:
其中,n為最大詞長,type(k)為詞長為k的字母詞的詞種數(shù),type為總詞種?;诠?,我們計算出,全部字母詞的平均詞長為3.92字符,而共有字母詞的平均詞長為3.31字符,長于漢語詞匯的平均詞長,這與長度為3的字母詞較多有直接原因。
語料中,全部字母詞的詞長最大值達(dá)到了22;而共有字母詞的詞長最大值僅為9。對比兩份數(shù)據(jù)中詞長最大值可發(fā)現(xiàn):在全部字母詞中,通常會出現(xiàn)由兩個或多個字母詞組合構(gòu)成的字母詞,其長度一般較長,在9-22字符之間,如“TD—HSPA/TD—SCDMA多模通信芯片”是由“TD—HSPA”和“TD—SCDMA”及漢字“多模通信芯片”組合而成。這類字母詞基本都是不常見的專有名詞,出現(xiàn)頻次非常低,多為一次性用詞。
(二)字母詞組合方式
字母詞的要素有字母(拉丁字母和希臘字母)、數(shù)字、漢字、符號等。據(jù)統(tǒng)計,語料中僅有12.4%字母詞含有數(shù)字,10%含有符號,比例較小。因此本文主要考察字母和漢字這兩個主要構(gòu)成要素在字母詞中的個數(shù)及其組合方式。要素的個數(shù)直接影響字母詞的長度,而組合方式也可以看出字母詞對各構(gòu)成要素的限制。
1. 字母詞中字母的個數(shù)
字母詞,顧名思義,一定要有字母。有的字母詞只含有一個字母,有的字母詞則含有多個字母。我們對語料中字母詞所含字母數(shù)量進(jìn)行了統(tǒng)計,詳見表2。
表2 字母詞中各字母個數(shù)的比例
表2中的數(shù)據(jù)表明,不管是在全部字母詞還是共有字母詞中,含有3個字母的字母詞都是最多的。這與字母詞的詞長有關(guān)。詞長為3的字母詞中83.63%都是由三個字母組成的。在全部字母詞中,含有4個字母的字母詞占21.46%,僅次于含有3個字母的字母詞。但在共有字母詞中,含有1個字母的字母詞所占比例比含有4個字母的字母詞高。研究認(rèn)為,雖然含有4個字母的字母詞總數(shù)量比含有1個字母的字母詞高,但穩(wěn)定性不及含有1個字母的字母詞。這主要因為含有4個字母的字母詞大多數(shù)是專有名詞和新興事物,使用領(lǐng)域較窄,且使用時長較短,不利于傳播和使用。
研究還發(fā)現(xiàn),在全部字母詞中,字母詞最多含有14個字母。如“LTE—Advanced TDD制式”,該詞是由“LTE”“—”“Advanced”“TDD”“制式”組成,其中,“LTE”和“TDD”是獨(dú)立的縮略字母詞,“Advanced”是英文詞,“制式”是漢字義標(biāo)。這種半縮略字母詞一般字母個數(shù)比較多,但因其詞長較長,不符合語言經(jīng)濟(jì)性原則,故而使用頻次較低,穩(wěn)定性較差。而在共有字母詞中,字母詞最多含有7個字母,如“TD-SCDMA”?!癟D-SCDMA”是英文縮略語,是典型的字母詞,在四年中均有使用,雖使用頻次不高,但較為穩(wěn)定。
研究計算字母詞中的平均字母個數(shù),公式如下:
m為最大字母個數(shù),type(p)為有p個字母的字母詞的個數(shù),type為總詞種。由公式2計算得出,全部字母詞的平均字母個數(shù)為3.15,共有字母詞的平均字母個數(shù)為2.55。
2. 字母詞中漢字的個數(shù)
在字母詞進(jìn)入漢語的過程中,有些字母詞會經(jīng)歷半漢化的過程,即在字母代碼的前后加上漢字。如“IC卡”的全稱為“Integrated Circuit Card”,取前兩個單詞的首字母“IC”,并對最后一個單詞“Card”進(jìn)行意譯,最后便形成了字母詞“IC卡”。
在字母詞中,漢字的位置并不固定,有時在字母代碼前,有時在字母代碼后。研究就漢字在字母詞中的位置進(jìn)行了統(tǒng)計,詳見表3。
表3 字母詞中漢字的位置分布
從表3來看,在含漢字的字母詞中,漢字的位置絕大部分都在字母代碼的后面。研究對字母詞中漢字的個數(shù)進(jìn)行了統(tǒng)計,統(tǒng)計結(jié)果見表4。
表4 字母詞中各漢字個數(shù)的比例
通過表4可以看出,全部字母詞中字母詞最多可含11個漢字,如“抗β—內(nèi)酰胺酶抗菌素復(fù)合物”,這種詞專業(yè)性較強(qiáng),使用領(lǐng)域較窄,一次性使用率較高,較難也沒有必要對其進(jìn)行簡化或改進(jìn)。共有字母詞中,字母詞最多可含6個漢字,即“GPS衛(wèi)星定位系統(tǒng)”。
在含漢字字母詞中,90%以上字母詞只含有1-3個漢字,且含有2個漢字的字母詞最多,其次是含有1個漢字的字母詞。在漢語中,二字詞的數(shù)量和使用頻次都是最高的,也就是人們最常使用的,那么在對字母詞進(jìn)行半漢化時,也就習(xí)慣于加上2個漢字的后綴,如“iPS細(xì)胞”等。此外,在只含有1個漢字的字母詞中,該漢字大部分都是語素,且重復(fù)使用率很高。在這些語素中,絕大部分是后綴。這些漢字基本都是漢語語素,且構(gòu)詞能力非常強(qiáng)?!凹墶笔褂么螖?shù)最多的語素,它一般可與字母和數(shù)字搭配,組合成表示排序的字母詞,如“A級”、“4A級”等。
在含有漢字的字母詞中,字母詞的平均漢字個數(shù)計算公式如下:
l為最大漢字個數(shù),type(q)為有q個漢字的字母詞的個數(shù),type為總詞種。由公式3計算得出,在含有漢字的字母詞中,全部字母詞的平均漢字個數(shù)為2.25,共有字母詞的平均漢字個數(shù)為1.83。
3. 字母詞中字母和漢字的組合方式
通過對字母詞中字母和漢字的個數(shù)的統(tǒng)計和分析可以發(fā)現(xiàn),90%以上的詞字母個數(shù)在4以內(nèi),漢字個數(shù)在3以內(nèi),但近90%的字母詞總詞長在4以內(nèi)。那么,字母詞中的漢字和字母是怎么組合使用的呢?
研究認(rèn)為,在字母詞中,字母的個數(shù)對漢字影響較大。字母個數(shù)為1的字母詞中,有80.37%的字母詞都含有漢字;字母個數(shù)為2的字母詞中,有24.34%的字母詞含有漢字;字母個數(shù)為3的字母詞中,有12.07%的字母詞含有漢字。由此研究發(fā)現(xiàn),隨著字母詞中字母個數(shù)的增加,含漢字的情況也會減少。這是因為字母越少的字母詞表示的義項越多,為了清楚地表示某一義項,就要加上相應(yīng)的漢字義標(biāo)。如“IPS”只有3個字母,可以表示“Internet Protocol Suite(互聯(lián)網(wǎng)協(xié)議群)”、“induced pluripotent stem cells(誘導(dǎo)多能干細(xì)胞)”等多個義項,但在“IPS”后加上“細(xì)胞”構(gòu)成的“IPS細(xì)胞”一詞,就只表示“誘導(dǎo)多能干細(xì)胞”這一個義項。隨著字母個數(shù)的增加,所表示的義項越來越單一化,就不需要漢字義標(biāo)來加以說明。
通過對字母詞的詞長、字母個數(shù)和漢字個數(shù)及其組合方式的統(tǒng)計及分析,研究發(fā)現(xiàn)字母詞的平均詞長為3.92字符,長于現(xiàn)代漢語詞匯的平均詞長,其中詞長為3的字母詞數(shù)量最多,較為穩(wěn)定使用的字母詞詞長極限為2-9字符;每個字母詞中平均有3.15個字母,含有3個字母的字母詞數(shù)量最多,較為穩(wěn)定的字母詞最多含有7個字母;在含漢字的字母詞中,每個字母詞平均有2.25個漢字,其中含2個漢字的字母詞數(shù)量最多,較為穩(wěn)定的字母詞最多含有6個漢字。隨著字母詞中字母個數(shù)的增加,帶漢字的情況會減少。
本文對字母詞的形式特征進(jìn)行分析,試圖為字母詞研究提供語料借鑒。依據(jù)數(shù)據(jù)分析,研究認(rèn)為典型字母詞的詞長應(yīng)為2-9字符,對鄒玉華提出的字母詞的形式特征有補(bǔ)充作用[3,p61-66]。從人類認(rèn)知的角度看,人們傾向于選擇更便于理解和使用的詞匯,大多數(shù)字母詞比漢語釋義更簡潔,便于使用,但并非所有字母詞都適合長期使用。很多學(xué)者經(jīng)實驗發(fā)現(xiàn),第二語言的詞長越長,越不利于記憶和使用。經(jīng)上述統(tǒng)計發(fā)現(xiàn),詞長區(qū)間為2-4的字母詞可以覆蓋75%以上的使用頻次,且與詞長大于4的字母詞在使用上有階段性的差異。因此研究認(rèn)為,就字母詞的使用規(guī)范而言,應(yīng)推薦使用詞長為2-4字符的字母詞,對于長度大于4的字母詞可考慮選擇相應(yīng)的漢語詞匯代替。
[參考文獻(xiàn)]
[1] 陳佳璇.我國新聞?wù)Z言中字母詞的易讀性研究[D].上海:華東師范大學(xué),2003:13.
[2] 柴靜.試論漢語字母詞[D].西安:陜西師范大學(xué),2006:7-9.
[3] 鄒玉華.現(xiàn)代漢語字母詞研究[M].北京:語文出版社,2012: 15-91.
[4] 胡明揚(yáng).關(guān)于外文字母詞和原裝外文縮略語問題[J].語言文字應(yīng)用,2002(2):98-101.
[5] 陳佳璇,胡范鑄.我國大眾傳媒中字母詞使用狀況的調(diào)查與分析[J].修辭學(xué)習(xí),2003(4):1-4.
[6] 王秋萍.近二十年來漢語書面語中字母詞使用狀況調(diào)查[D].北京:中國傳媒大學(xué),2011:38-81.
[7] 潘雪蓮.略論字母詞的定義與定位[J].科技術(shù)語研究,2006 (2):27-29.
[8] 國家語言資源監(jiān)測與研究中心.中國語言生活狀況報告2006(下編)[R].北京:商務(wù)印書館,2007:37.
[9] 鄧耀臣,馮志偉.詞匯長度與詞匯頻數(shù)關(guān)系的計量語言學(xué)研究[J].外國語,2013(3):29-39.
(責(zé)任編輯、校對:朱 燕)
An Analysis on the Formal Features of Letter Words
LI Tian1, HOU Min2
(1. College of Literature, The Communication University of China, Beijing 100024, China; 2. National Broadcast Media Language Resources Monitoring & Research Center, Communication University of China, Beijing 100024, China)
Abstract:Letter words have significant differences in form with traditional Chinese vocabulary, especially in length and internal combination. After analysis, some characteristics are found. The average length of letter words is 3.92, which is longer than the average length of Chinese word. And most letter words’ length is 3. The average number of letter in letter words is 3.15, most of which have 3 letters. The average number of Chinese word in letter words is 2.25, most of which have 2 Chinese words. In letter words, with the increase of the number of letter, the number of Chinese words is cutting down.
Key Words:letter words; length of word; letter; Chinese words
作者簡介:李甜(1990-),女,山東菏澤人,碩士研究生,研究方向為應(yīng)用語言學(xué)。
收稿日期:2015-01-23
DOI:10.3969/j.issn.1009-9115.2015.04.010
中圖分類號:H109.4
文獻(xiàn)標(biāo)識碼:A
文章編號:1009-9115(2015)04-0039-04