国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

試論語料庫介入詞典編纂的優(yōu)勢及相關問題——以常用詞“發(fā)酵”“神話”“厲害”為例

2016-11-29 08:22:56劉欣彤
現(xiàn)代語文 2016年31期
關鍵詞:國家語委常用詞發(fā)酵

○苗 寧 劉欣彤

試論語料庫介入詞典編纂的優(yōu)勢及相關問題——以常用詞“發(fā)酵”“神話”“厲害”為例

○苗 寧 劉欣彤

以“發(fā)酵”“神話”“厲害”三個常用詞為例,分別利用國家語委現(xiàn)代漢語語料庫和北大中文語料庫,調(diào)查其義項及排序。再將調(diào)查結(jié)果與《現(xiàn)代漢語詞典》(第6版)相關詞語進行對比,結(jié)果顯示,該詞典提供的義項存在諸多不足。同時,兩個語料庫之間的調(diào)查結(jié)果對比顯示,只有北大中文語料庫才能較好地滿足該類詞典的修訂要求。

詞典編纂 語料庫 義項 對比分析

得益于計算機及相關技術(shù)的飛速發(fā)展,語料庫這一強有力的技術(shù)手段被引入,詞典的編纂和修訂速度得以加快,其所提供的新語言信息、自然語言實例可以使詞的釋義更加完整和準確。一般而言,盡管傳統(tǒng)辭書編纂在長期實踐中已積累了大量的寶貴經(jīng)驗,但由于客觀條件的限制,其義項除了可能疏漏之外,往往還具有主觀性、趨同性等不足之處。這在很大程度上制約了辭書釋義的準確性和全面性。借助于語料庫的巨大規(guī)模、真實可靠的語料以及技術(shù)分析等優(yōu)勢,上述問題可以得到較為有效的解決。不過,鑒于當下漢語語料庫種類繁多,在詞典編撰過程中,選擇合適的語料庫至關重要。因為編撰不同的詞典對語料庫有不同的要求。反過來,語料庫的大小、時限、代表性問題等都可能影響詞典的編纂質(zhì)量。

根據(jù)上述思考,我們選取權(quán)威的《現(xiàn)代漢語詞典》(第6版)作為考察對象,以常用動詞“發(fā)酵”、名詞“神話”、形容詞“厲害”為例,首先基于國家語委現(xiàn)代漢語語料庫相關語料,進行定性與定量分析,歸納其所有可能的義項及其排序,并將調(diào)查結(jié)果與該詞典相關釋義條目進行對比。其次,我們使用北大中文語料庫重新調(diào)查上述三個詞語的義項及其排序,并將該調(diào)查與前一調(diào)查進行對比,嘗試探討上述哪一個語料庫更適合《現(xiàn)代漢語詞典》這類辭書的編撰及相關議題。

一、本研究的理論背景

語料庫是指從有代表性的書面語和口語材料中隨機抽樣,并由可用計算機進行處理的大量文本組成的,專供語言研究、分析和描述的語言資料庫。近年來,計算機技術(shù)的發(fā)展為基于語料庫的詞典編撰研究工作提供了三大有利條件:語料庫規(guī)模日趨龐大、代表性更高、分析更完善。[1]對比之下,傳統(tǒng)詞典編纂方法的不足更加突出,“傳統(tǒng)的釋義方法囿于客觀條件,往往具有主觀性、不周全性、趨同性等經(jīng)驗型釋義的特征,這在一定程度上制約了辭書釋義的客觀真實性、科學準確性方面進一步提升?!保?]國內(nèi)外很多學者都詳細介紹了語料庫編纂詞典所具有的優(yōu)勢,有的學者還將語料庫詞典學作為新興學科列出討論,足以看出“語料庫是現(xiàn)代辭書編纂重要的資源支持和技術(shù)手段,應用語料庫、引入語料庫分析方法是辭書編纂的發(fā)展趨勢?!保?]

不過,語料庫介入詞典編纂帶來優(yōu)勢的同時,也出現(xiàn)很多有待解決的問題,如語料庫的大小、時限、代表性等。根據(jù)我們的調(diào)查,目前學界似乎對這類問題關注不夠。一般而言,調(diào)查詞語的義項,必須使用不斷更新的大型語料庫。一方面,只有語料庫庫容足夠大,常用詞的重要義項才不會被遺漏。另一方面,隨著社會的發(fā)展,語言也不斷變化,新詞、新用法不斷涌現(xiàn),只有不斷更新、擴充的語料庫,才可以反映出這類語言事實。同時,“不斷發(fā)展、擴充的語料庫,能過濾和篩選材料,保留必要的相關材料,并能注意到新的詞形、結(jié)構(gòu)以及舊的詞形的新的用法和搭配。”[3]故在漢語詞典編纂過程中,如何應用語料庫技術(shù)手段,并使用恰當?shù)恼Z料庫,應成為詞典編纂界需要重點研討的議題。

基于上述思考,對照《現(xiàn)代漢語詞典》(第6版),利用國家語委現(xiàn)代漢語語料庫和北大中文語料庫,通過個案調(diào)查,在實證的基礎之上,嘗試佐證上述論斷的合理性。

二、基于國家語委現(xiàn)代漢語語料庫的調(diào)查結(jié)果

基于國家語委現(xiàn)代漢語語料庫,本節(jié)依次給出常用詞“發(fā)酵”的動詞用法、“神話”的名詞用法、“厲害”的形容詞用法的語料調(diào)查結(jié)果。

(一)“發(fā)酵”

“發(fā)酵”在國家語委現(xiàn)代漢語語料庫中共有條目78條,均為動詞詞性。根據(jù)具體語料,可歸納出兩個義項,分別敘述如下。

1.復雜的有機化合物在微生物的作用下分解成比較簡單的物質(zhì),發(fā)面、釀酒等均涉及該過程。共77個條目,占總條目的98.72%,是其最常用的一個義項。如:

(1)經(jīng)過一段時間的發(fā)酵,即可食用。

(2)掛于室內(nèi),任其自然發(fā)酵。

2.感情、心理等滋長。共1個條目,占總條目的1.28%。如:

(3)她也有醋味,但只是添味,不發(fā)酵,尤其難得。

表1:“發(fā)酵”調(diào)查結(jié)果

(二)“神話”

“神話”在國家語委語料庫中共有條目323條,全部為名詞詞性。根據(jù)具體語料,我們概括出3個義項,分別敘述如下。

1.關于神仙或神化的古代英雄的故事,是古代人民對自然現(xiàn)象和社會生活的一種天真的解釋和美麗的向往。共266個條目,占總條目的82.35%,是其最常用的一個義項。如:

(4)我喜歡看神話故事,也喜歡月亮里真有個嫦娥姐姐。

(5)《鏡獅子》是一個古老的神話傳說,是日本舞伎的傳統(tǒng)劇目。

2.虛構(gòu)的、幻想的故事。共39個條目,占總條目的12.07%。如:

(6)這些解答正是他們自己制造的那些神話故事。(7)他此時是真的相信這些荒誕不經(jīng)的神話。

3.奇跡,難以企及的、難以想象會發(fā)生的、不平凡的事。共18個條目,占總條目的5.57%。如:

(8)她居然跳得這樣成功,創(chuàng)造著神話般的故事。

(9)這里像神話似地長著一大片一大片的水稻、油菜、橘子和甘蔗。

表2:“神話”調(diào)查結(jié)果

(三)“厲害”

“厲害”在國家語委語料庫中共有條目409條,其中名詞詞性共28條。如:

(10)嘗到了紅軍的厲害,再也不敢輕舉妄動了。

在此只分析其形容詞詞性,共381條,根據(jù)具體語料歸納出3個義項,分別敘述如下。

1.難以對付或難以忍受;劇烈;兇猛;表示程度很高。共297個條目,占總條目的77.95%,是其最常用的一個義項。如:

(11)原來就是用準備著更普遍更厲害的危機并減少著防止危機的辦法。

(12)他不抽煙,可臉色卻像抽煙很厲害人的臉色。

2.強大的、較為突出的、超群的(技能、性能、智力等)。共75個條目,占總條目的19.69%。如:

(13)在削弱安全感方面,新教倫理比任何其它一切因素都要厲害。

(14)現(xiàn)代電子技術(shù)真夠厲害——最后一位選手剛剛走過,顯示屏上馬上閃出了紅色的數(shù)字。

3.(性情)霸道的、不溫順的、乖張的。共7個條目,占 總條目的1.84%。如:

(15)如能折斷,表示新娘溫順,否則將來一定很厲害。

(16)老主任慈眉 善目的,不像是很厲害。

表3:“厲害”調(diào)查結(jié)果

三、基于北大中文語料庫的調(diào)查結(jié)果

北大中文語料庫的調(diào)查結(jié)果與國家語委的調(diào)查結(jié)果有很大不同。

基于北大中文現(xiàn)代漢語語料庫,本節(jié)依次給出常用詞“發(fā)酵”的動詞用法、“神話”的名詞用法、“厲害”的形容詞用法的語料調(diào)查結(jié)果。

(一)“發(fā)酵”

“發(fā)酵”在北大中文語料庫中共有1202個條目,隨機抽取308條,均為動詞用法,根據(jù)具體語料,我們概括為5個義項,分別敘述如下。

1.復雜的有機化合物在微生物的作用下分解成比較簡單的物質(zhì),發(fā)面、釀酒都是發(fā)酵的作用。共249個條目,占總條目的80.84%,是其最常用的一個義項。如:

(17)發(fā)酵后的蘋果醋含有較高濃度的醋酸。

(18)發(fā)酵工程泛指利用微生物制造工業(yè)原料和產(chǎn)品的工程技術(shù)。

2.事物受外力影響發(fā)生某種發(fā)展變化。共26個條目,占總條目的8.44%。如:

(19)卻被洪秀全和馮云山借用而且不斷發(fā)酵。

(20)我覺得這就如同白先勇老師所說的,是一種文化傳承聯(lián)想的發(fā)酵。

3.感情、心理等醞釀、滋長。共19個條目,占總條目的6.17%。如:

(21)不能讓仇恨一直在心里發(fā)酵,否則最終受害的是自己。

(22)這份痛楚又漸漸在心里發(fā)酵、膨脹。

4.助力,鼓勵;催化。共9個條目,占總條目的2.92%。如:

(23)學生永遠是政治思想的發(fā)酵力氣。

(24)這句話在這個有偏執(zhí)性格的人身上起了巨大的發(fā)酵作用。

5.錘煉,鍛煉。共5個條目,占總條目的1.62%。如:

(25)必須要有豐富的生活經(jīng)驗,同時這些經(jīng)驗又需要沉入到潛意識領域中去發(fā)酵。

(26)荒唐歲月發(fā)酵出來的社會現(xiàn)實,本身飽含著數(shù)不清的失態(tài)和笑料。

表4:“發(fā)酵”調(diào)查結(jié)果

(二)“神話”

“神話”在北大中文語料庫中共有5687條條目,隨機抽取343條進行分析,其中作為動詞使用出現(xiàn)兩次,如:

(27)氣功的歷史被他延伸、神話了。

分析341條“神話”作為名詞詞性使用的語料,我們概括出3個義項。分別敘述如下。

1.關于神仙或神化的古代英雄的故事,是古代人民對自然現(xiàn)象和社會生活的一種天真的解釋和美麗的向往。共159個條目,占總條目的46.63%,是其最常用的一個義項。如:

(28)長篇神話小說《西游記》。

(29)古希臘神話中,有一個叫赫剌克勒斯的英雄。

2.虛構(gòu)的、幻想的故事。共101個條目,占總條目的29.62%。如:

(30)歐洲人打算從道義和經(jīng)濟上拯救世界的神話就土崩瓦解了。

(31)(海峽時評)別想把歷史涂改成“神話”。

3.奇跡,難以想象會發(fā)生的、不平凡的事。共81個條目,占總條目的23.76%。如:

(32)雄偉的媽灣 電廠神話般地在一片汪洋處突現(xiàn)出來。

(33)通貨膨脹和持續(xù)的 經(jīng)濟增長,創(chuàng)造了令無數(shù)人驚嘆不已的“新經(jīng)濟”神話。

表5:“神話”調(diào)查結(jié)果

(三)“厲害”

“厲害”在北大中文語料庫中共有7554條條目,隨機抽取389條,根據(jù)具體語料,其中名詞用法共有97條,在此不作研究。如:

(34)國民黨從來不重視思想人物的厲害。

其余均為形容詞用法,我們概括為5個義項,共292條,分別敘述如下:

1.難以對付或難以忍受;劇烈;兇猛。共192個條目,占總條目的65.75%,是其最常用的一個義項。如:

(35)哭訴朱兵十分厲害,無可處置。

(36)這兩個惡僧有些厲害,不如先傷去一個。

2.強大的、較為突出的、超群的(技能、性能、智力等)。共60個條目,占總條目的20.55%。如:

(37)那七子十二生本領亦頗厲害。

(38)不過他的劍術(shù)厲害,為人義俠,也是凡人。

3.(情況、情形等)讓人恐懼的,讓人敬畏的。共36個條目,占總條目的12.33%。如:

(39)谷里相傳有個火神廟,甚是厲害。

(40)他比殺人放火的強盜還厲害呢。

4.(性情)霸道的、不溫順的、乖張的。共3個條目,占總條目的1.03%。如:

(41)好厲害的小姐,辱罵三輩。

(42)喝,好厲害的家伙。

5.嚴厲。共1個條目,占總條目的0.34%。如:

(43)剛剛收到父親手書,責備我很厲害。

表6:“厲害”調(diào)查結(jié)果

四、對比和解讀

對照動詞“發(fā)酵”、名詞“神話”、形容詞“厲害”,根據(jù)上述兩個語料庫所概括出的義項及其排序,下面我們進行兩項對比并同時加以解讀。首先將國家語委語料庫的調(diào)查結(jié)果與詞典相關釋義條目進行對比和解讀。其次,再將北大中文語料庫的調(diào)查結(jié)果與國家語委語料庫的調(diào)查結(jié)果進行對比和解讀?;谏鲜稣撌?,最后進行進一步的探討。

(一)對比1及解讀

“發(fā)酵”“神話”“厲害”在《現(xiàn)代漢語詞典》(第6版)中的相關條目列表如下:

表7:《現(xiàn)代漢語詞典(第6版)》相關條目

將表7和表1、2、3進行對比,可以發(fā)現(xiàn)下述事實:動詞“發(fā)酵”表“感情、心理等滋長”這一義項未被收錄。名詞“神話”的釋義漏收“奇跡(難以想象會發(fā)生的、不平凡的事)、虛構(gòu)的幻想故事”這兩個常用義項。另外,隨著漢語的發(fā)展,“神話”在現(xiàn)代漢語中更趨向于褒義,而詞典中“荒誕的無稽之談”這一義項顯然沒有反映出這種情感取向。同時,詞典中“厲害”有“嚴厲”這一義項,但語料庫中并未出現(xiàn)。詞典還漏收另外兩個義項:“強大的、較為突出的、超群的(技能、性能、智力等),多含褒義”和“霸道的,不溫順的”。根據(jù)上文,由于語料庫基本上反映了語言的真實面貌,基于其上的義項歸納顯然更加真實可靠。同時,這也凸顯了詞典傳統(tǒng)編纂的以偏概全、義項失真等缺陷。

(二)對比2及解讀

將上述表1、2、3和表4、5、6進行相應的對比,我們可以發(fā)現(xiàn)下述事實。首先,相關的調(diào)查結(jié)果并不一致(不包括語法方面的調(diào)查,例如,“神話”在北大中文語料庫中有動詞用法等)。具體如下:除了兩個共同義項外,“發(fā)酵”其余的三個義項,即“事物受外力影響發(fā)生某種發(fā)展變化”“助力,鼓勵;催化”“錘煉,鍛煉”等,在國家語委語料庫的調(diào)查結(jié)果中均未出現(xiàn)。根據(jù)北大語料庫的調(diào)查結(jié)果,“厲害”新增了一個義項“(情況情形等)讓人恐懼、敬畏”。此外,讓人稍感意外的是,根據(jù)北大中文語料庫的調(diào)查結(jié)果,“厲害”竟然也有“嚴厲”這一義項,盡管其使用頻率極低。其次,通過上述對比及對相關語料的解讀,我們可以發(fā)現(xiàn)下述兩個有意義的現(xiàn)象:其一,上述兩個語料庫的調(diào)查結(jié)果形象地詮釋了語料庫對提升詞典編撰質(zhì)量的意義,因為上文已作說明,此處不加贅述,只補充一點:語料庫可以保障詞典的時效性。例如“神話”一詞中“奇跡,難以企及的,難以想象會發(fā)生的不平凡的事”這一義項。其二,兩個語料庫均為高質(zhì)量的大型語料庫,這體現(xiàn)于其嚴格的建庫標準(可參看其說明)。然而,盡管“語言的收集實際上就是對語言的原則性的選擇,而選擇總是意味著喪失一些重要信息”[4]。但通過對上述調(diào)查結(jié)果的對比,我們可以發(fā)現(xiàn),基于上述兩庫的常用詞義項大同小異(包括義項排序)。這間接證實了雙方建庫標準的有效性。

(三)進一步的解讀

根據(jù)上述對比,我們認為,上述議題還有進一步探討的必要。一般而言,語法框架相對穩(wěn)定,加之語法規(guī)則的普適性,故語法調(diào)查相對可以容忍語料陳舊和庫容較小等問題。但對詞典編撰而言,上述缺陷則無法容忍。一方面,陳舊的語料不能反映出常用詞變動不居的特性,從而導致義項失真;另一方面,較小的庫容難以反映出常用詞義項的豐富性,從而導致詞典工具效用的降低。鑒于《現(xiàn)代漢語詞典》在漢語世界中的權(quán)威性,我們認為,除了極為冷僻的用法之外,常用詞其他義項都應該加以收錄,并且按使用頻率排序。

就此而論,根據(jù)上文的調(diào)查結(jié)果,上述兩個語料庫均不存在語料陳舊的問題。但就常用詞語義項歸納而言,國家語委語料庫顯然不能完全滿足詞典編撰的要求。例如“發(fā)酵”一詞在國家語委語料庫中只有78個條目,可歸納出兩個義項。但在北大中文語料庫中卻有1202個條目,可分析歸納出5個義項。另外,如上文所示,“厲害”一詞在《現(xiàn)代漢語詞典》中有“嚴厲”這一義項,盡管其沒有得到國家語委語料庫調(diào)查結(jié)果的支持,但卻得到北大語料庫調(diào)查結(jié)果的支持。

五、結(jié)語

語料庫技術(shù)是詞典編纂與研究一種新的支撐手段,根據(jù)上文的探討,可以看出,基于語料庫的詞典編纂可以較好地解決一些傳統(tǒng)上難以避免的問題,如義項疏漏、主觀性、趨同性等,從而全面、客觀地反映詞語的真實使用狀況??梢哉J為,引入語料庫這一技術(shù)手段是詞典編撰與修訂的必然趨勢。鑒于《現(xiàn)代漢語詞典》的權(quán)威地位,我們認為,其下一輪的修訂有必要全面基于語料庫來加以推進,盡管工作量可能較為龐大。另外,也如上述探討所示,對于《現(xiàn)代漢語詞典》而言,一般的語料庫可能難以完全滿足其修訂要求,故有必要使用不斷更新的超大型語料庫,如北大中文語料庫等。這樣,就可以有效避免義項歸納不全或區(qū)分不細等問題,從而給學習者提供一部與漢語同步發(fā)展的高品質(zhì)的辭書。通過上面的個案研究,我們希望能夠引起學界的關注。

(本文系江蘇大學2016年省級大學生實踐創(chuàng)新訓練項目[5551350016]“基于語料庫的《現(xiàn)代漢語詞典》常用詞義項考察”的階段性成果。)

注釋:

[1]楊曉軍,李賽紅:《語料庫在詞典編纂中的優(yōu)勢兼評牛津高階英語學習詞典(第6版)》,外語與外語教學,2003年,第04期。

[2]王永耀:《語料庫介入的漢語語文詞典釋義途徑》,辭書研究,2010年,第01期。

[3]劉慶榮:《語料庫與詞典編纂》,上海師范大學學報,2001年,第03期。

[4]王馥芳:《從大數(shù)據(jù)危機到全數(shù)據(jù)革命》,中國社會科學報,2015年,第03期。

[1]王馥芳,馬蘭梅.語料庫詞典的局限性[J].辭書研究,2003,(05).

[2]中國社會科學院語言研究所詞典編輯室.現(xiàn)代漢語詞典(第6版)[M].商務印書館,2015,(1).

[3]國家語委現(xiàn)代漢語語料庫HTTP://WWW.corpuscles.org/

[4]北京大學中國語言學研究中心語料庫HTTP://ccl.pku.edu.cn/

(苗寧,劉欣彤 江蘇鎮(zhèn)江 江蘇大學文學院 212013)

猜你喜歡
國家語委常用詞發(fā)酵
常用詞“怠”“惰”“懶”的歷時演變
學者聚焦
酵母發(fā)酵法去除魔芋飛粉中三甲胺的研究
一株放線菌藍色素的提取及相關研究
發(fā)酵工藝對苦蕎釀茶中黃酮浸出量影響的研究
2011
—2015年國家語委課題立項現(xiàn)狀分析
常用詞“開、辟”在“開闊”義上的演變替換
國家語委咨詢委員會第14次會議在京召開
乳酸菌的分離及酸奶制備
科技視界(2015年25期)2015-09-01 15:50:52
國家語委“十二五”重大招標項目:“新疆少數(shù)民族普通話普及度抽樣研究”順利開題
語言與翻譯(2014年2期)2014-07-12 15:49:20
深州市| 丹寨县| 呈贡县| 金秀| 盐源县| 金乡县| 邹平县| 同仁县| 洛宁县| 房产| 克拉玛依市| 精河县| 安溪县| 射洪县| 固阳县| 无为县| 江西省| 蕲春县| 宜宾市| 郁南县| 余干县| 建德市| 巢湖市| 陵水| 宝兴县| 平阳县| 青龙| 西华县| 定州市| 临颍县| 东乌| 宁国市| 安顺市| 铜鼓县| 祁东县| 陇南市| 灌云县| 台山市| 仪征市| 阿鲁科尔沁旗| 东至县|