国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

贛南客家方言語音語料庫建設(shè)的必要性分析

2016-03-16 20:59:34鄧海龍
文教資料 2016年21期
關(guān)鍵詞:客家方言贛南語料庫

鄧海龍

(贛南師范大學(xué) 外國語學(xué)院,江西 贛州 341000)

贛南客家方言語音語料庫建設(shè)的必要性分析

鄧海龍

(贛南師范大學(xué) 外國語學(xué)院,江西 贛州341000)

方言缺乏文字系統(tǒng),難以采集和數(shù)字化,在社會政治生活中處于邊緣地位,因此,方言語料庫建設(shè)較少受到學(xué)界和社會關(guān)注。本文以贛南客家方言語音語料庫的建設(shè)為切入點(diǎn),從學(xué)術(shù)研究意義、實(shí)際應(yīng)用價(jià)值和文化傳承維護(hù)等方面論證方言語料庫建設(shè)的必要性。方言語料庫建設(shè)費(fèi)時(shí)費(fèi)力,但其意義深遠(yuǎn),價(jià)值不可估量。

客家方言語料庫贛南地區(qū)必要性

一、引言

語料庫主要是指以電子形式儲存并能以一定方式檢索的語言資源庫(Biber,2000;衛(wèi)乃興,2005)。語料庫方法的語言研究發(fā)端于歐美國家,起初主要用于英語、法語等國際通用語言的研究。隨著信息技術(shù)迅速發(fā)展和個(gè)人電腦的廣泛普及,運(yùn)用語料庫逐漸成為語言研究的常規(guī)手段(McEnery &Hardie2012)。當(dāng)今大數(shù)據(jù)時(shí)代,官方語言(如普通話等)電子資源不斷豐富,相關(guān)語料庫的建設(shè)自然更加方便。然而,由于方言缺乏書寫系統(tǒng),通常沒有文字資料留存,網(wǎng)上不會有大量電子數(shù)據(jù)產(chǎn)生,很難進(jìn)行語料庫采集和數(shù)字化。方言在社會政治生活中外于邊緣地位,不容易受到學(xué)界和社會關(guān)注。因此,方言語料庫的建設(shè)總體上還較為薄弱。本文以贛南地區(qū)的客家方言為例,探討方言語音語料庫建設(shè)的多重價(jià)值和必要性,以期引起有關(guān)部門和學(xué)界對方言語音語料庫建設(shè)更多的關(guān)注。

二、國內(nèi)漢語及方言語料庫建設(shè)基本現(xiàn)狀

漢語語料庫的建設(shè)取得了較大成果,其中國家語委的“現(xiàn)代漢語通用平衡語料庫”已達(dá)到了一億字符以上(劉連元,1996);北京大學(xué)的現(xiàn)代漢語語料庫經(jīng)過長年積累不斷發(fā)展壯大,已經(jīng)達(dá)到3億字符以上,可以在線檢索(俞士汶,2002)。

語料庫可以分為語音語料庫和文本語料庫??紤]到采集、存儲和檢索方便,早期語料庫均以文本語料為主,上面所述的兩大漢語語料庫都是文本語料。文本語料庫對于具有書面語的主流語言變體是基本適宜的,但是,因?yàn)榉窖源蠖嘀灰钥谡Z形式傳承,方言語料庫一般需要通過語音形式采集和保存。

上個(gè)世紀(jì)80年代,北京語言文化大學(xué)開始建設(shè)“北京口語語料庫”(北京語言大學(xué)語言研究所,2010),這是我國較早的方言語料庫,將口語以文本轉(zhuǎn)寫的方式呈現(xiàn),屬于“口語”語料庫,卻并非“語音”語料庫。該語料庫已經(jīng)對外開放檢索(http://app.blcu.edu.cn/yys/6_beijing/6_beijing_chaxun.asp)。

另外,美國賓夕法尼亞大學(xué)的語言數(shù)據(jù)聯(lián)盟(Linguistic DataConsortium,http://catalog.ldc.upenn.edu/)已發(fā)布了我國普通話和粵語語音語料庫。我國臺灣的國立政治大學(xué)建成并公開包括國語(普通話)、客家話、閩南話的“漢語口語語料庫”(http://140.119.172.200/)。2008年,國家語委啟動了“中國語言資源有聲數(shù)據(jù)庫建設(shè)”項(xiàng)目,江蘇省率先建成了本省方言語音數(shù)據(jù)庫(http://jsyw.jsjyt.edu.cn/col/col82/index.html),北京市、上海市、廣西壯族自治區(qū)和山東省等省市也開始建設(shè)本地區(qū)方言語音數(shù)據(jù)庫。

1933年,羅香林以《客家研究導(dǎo)論》奠定了客家研究基礎(chǔ),并影響了客家方言在漢語方言體系中的位置(劉綸鑫,2001)。贛南地區(qū)客家方言是客家方言中比較重要的片區(qū)之一。到目前為止,客家方言的研究一般集中在語音、字詞、習(xí)語和社會文化背景等內(nèi)容,研究手段多以邏輯思辨和少量田野調(diào)查為主,尚未發(fā)現(xiàn)有基于較大規(guī)模語料庫的相關(guān)研究(劉綸鑫,2001;溫昌衍,2006)。2002年,南昌大學(xué)文學(xué)院建成的客贛方言數(shù)據(jù)庫在第五屆客家方言暨贛方言首屆學(xué)術(shù)研討會上進(jìn)行了演示。該語言數(shù)據(jù)庫由劉綸鑫教授主持開發(fā),其中涉及的軟件設(shè)計(jì)是上海師范大學(xué)潘悟云教授完成的。這個(gè)方言數(shù)據(jù)庫將方言資料以電子化形式儲存,便于查詢和檢索,主要是音韻內(nèi)容,沒有一般的話語資源(東石,2002)。2004年,由羅美珍等學(xué)者主編的《客家話通用詞典》得到出版,為客家方言資料的保存與完善作出了極其有意義的貢獻(xiàn)。不過略嫌遺憾的是,僅是文本形態(tài),而且由于懂贛南地區(qū)客家方言的學(xué)者不是太多,贛南地區(qū)的客家方言資料收集顯得有點(diǎn)單?。_美珍,2004)。從已有文獻(xiàn)來看,漢語、北京話、粵語及一些少數(shù)民族語言(如蒙古語、維吾爾語等)的語料庫建設(shè)已經(jīng)比較成熟,但客家方言,尤其是語音語料庫的建設(shè)卻相對滯后,中山大學(xué)莊初升教授主持在研2014年度國家重大項(xiàng)目 “海內(nèi)外客家方言的語料庫建設(shè)和綜合比較研究”,側(cè)重于描繪海內(nèi)外客家方言的總體面貌??傮w而言,由于口語語料采集費(fèi)時(shí)費(fèi)力,方言語音語料庫的建設(shè)(包括客家方言)比較欠缺,從而嚴(yán)重制約方言研究的整體發(fā)展水平(范俊軍,2013)。

三、學(xué)術(shù)研究意義

(一)運(yùn)用語料庫展開語言研究是基本趨勢。語言研究大致有理性主義與經(jīng)驗(yàn)主義之分。理性主義代表人物喬姆斯基持一種內(nèi)在主義語言觀,強(qiáng)調(diào)人類語言能力的先天屬性,主張以內(nèi)省的方式研究語言(Chomsky,2000)。與此相對的則是經(jīng)驗(yàn)主義研究方法,注重從大量語言事實(shí)中挖掘語言規(guī)律,而語料庫語言學(xué)方法正是經(jīng)驗(yàn)主義研究的有效手段(馮志偉,2007)。目前,經(jīng)驗(yàn)主義研究方法已經(jīng)逐漸取代理性主義研究方法,成為主流研究手段,用馮志偉先生的話來說,就是 “語言學(xué)研究要實(shí)現(xiàn)戰(zhàn)略大轉(zhuǎn)移”(馮志偉,2011;2013)??梢姡ㄔO(shè)和應(yīng)用語料庫進(jìn)行語言研究是目前語言學(xué)研究的基本發(fā)展方向之一。

(二)客家方言語音語料庫可為客家方言本體研究提供基礎(chǔ)性平臺。限于實(shí)際條件,當(dāng)前客家方言的研究大多根據(jù)自身語感,比較零星地進(jìn)行一些歸納和對比,很難實(shí)現(xiàn)系統(tǒng)性和規(guī)范化,研究結(jié)果不容易做到可靠和準(zhǔn)確。隨著語言研究的日益精深化,語料庫在語言研究中扮演著越來越重要的角色。根據(jù)現(xiàn)代語言學(xué)理論,在語言研究中,口語是第一位的,書寫系統(tǒng)是第二位的。語音語料對于語言研究至關(guān)重要。方言一般缺乏書寫系統(tǒng),語音材料更是唯一必需的研究資料。客家方言語音語料庫的建立可以使客家方言得到更為細(xì)致客觀的描述,為其他相關(guān)研究提供重要的原始素材。這是一項(xiàng)客家方言研究的基礎(chǔ)性工作,將可能催生一系列以語料庫為基礎(chǔ)的客家方言研究。

四、實(shí)際應(yīng)用價(jià)值

(一)在語言教學(xué)應(yīng)用研究中發(fā)揮積極作用。贛南客家方言是贛南地區(qū)數(shù)百萬人的母語,對于贛南客家人的普通話和外語學(xué)習(xí)都會產(chǎn)生重要影響(劉慧,溫書鴻,2013)。母語對于外語學(xué)習(xí)的影響很大,利用語音語料庫把握母語規(guī)律,通過贛南客家方言語料庫和普通話或者英語語料庫之間的比較研究,將有助于發(fā)現(xiàn)第二語言學(xué)習(xí)規(guī)律,強(qiáng)化語言教學(xué)效果。

(二)為語言信息工程研究提供基礎(chǔ)數(shù)據(jù)。計(jì)算機(jī)語言識別需要涉及不同漢語方言的語言特點(diǎn),方言語料庫將有助于人機(jī)對話語言服務(wù)系統(tǒng)的開發(fā),幫助刑偵人員判定罪犯來源于哪一個(gè)方言區(qū),鑒別罪犯成長地所在區(qū)域(楊鴻武,2009)。

五、文化傳承與保護(hù)

(一)語料庫在保護(hù)弱勢和瀕危語言資源中的重要作用。由于交通和通訊技術(shù)的不斷發(fā)展,很多弱勢語言不斷受到主流語言的影響和侵蝕,語料庫是有效的語言保護(hù)手段,得到了我國家高層有關(guān)部門的高度重視。例如,2008年,國家語委啟動了“中國語言資源有聲數(shù)據(jù)庫建設(shè)”項(xiàng)目,這是一項(xiàng)具有深遠(yuǎn)影響的國家重大語言文字工程,要求統(tǒng)一規(guī)范地采集我國境內(nèi)實(shí)際使用中的各類地方語言,將之科學(xué)整理和歸檔,建成有聲數(shù)據(jù)庫(李宇明,2010)。2013年,教育部語言文字信息管理司發(fā)布了《中國語言資源有聲數(shù)據(jù)庫建設(shè)工作規(guī)范(試行)》(教語信司函〔2013〕17號),進(jìn)一步規(guī)范了我國語音語料庫的建設(shè)。

(二)客家方言語音數(shù)據(jù)在客家文化傳承與保護(hù)方面的重要價(jià)值。語言與文化密不可分,贛南地區(qū)客家方言語音語料庫的建設(shè)可以對贛南地區(qū)口耳相傳文化起到傳承和保護(hù)的作用。隨著人口流動的不斷加快和媒介傳播的廣泛發(fā)展,客家方言越來越受到普通話等其他主流語言的影響,許多具有特色的表達(dá)方式和語音習(xí)慣逐漸不為人所知,甚至最終消失。建設(shè)贛南地區(qū)客家方言語音語料庫,保存的不僅僅是語言,還是一個(gè)族群的文化傳承,是我們國家多樣性生態(tài)文化的重要資源。

2012年,《國務(wù)院關(guān)于支持贛南等原中央蘇區(qū)振興發(fā)展的若干意見》(國發(fā)〔2012〕21號)在“加快文化體育事業(yè)發(fā)展”這一項(xiàng)中提出要“加強(qiáng)非物質(zhì)文化遺產(chǎn)保護(hù)”。雖然從嚴(yán)格意義上說,贛南客家方言不能算做一項(xiàng)非物質(zhì)文化遺產(chǎn),但它滲透到當(dāng)?shù)氐纳礁琛蚯?、歌謠等各種形式之中,屬于贛南地區(qū)人民寶貴的精神資源,采取一定措施進(jìn)行留存是非常必要的。

廣而言之,客家方言對團(tuán)結(jié)海內(nèi)外客家后裔,促進(jìn)贛臺兩岸交流,推進(jìn)國內(nèi)外客家群體之間的經(jīng)濟(jì)、文化活動有著不可估量的現(xiàn)實(shí)意義。

六、結(jié)語

目前,漢語方言語音語料庫并不多見,贛南地區(qū)客家方言語音語料庫更是未見先例。雖然方言并非主流交際用語,但其語言研究和文化傳承價(jià)值卻極其重大。若能得到有關(guān)部門和學(xué)界的支持,建成科學(xué)規(guī)范的贛南地區(qū)客家方言語音語料庫,并面向全社會公開,充分發(fā)揮語料庫的社會服務(wù)功能,可以為方言研究、方言語音信息工程、贛南人學(xué)習(xí)普通話或者外語研究等各個(gè)領(lǐng)域提供研究素材;同時(shí)可為傳承贛南客家文化和弘揚(yáng)蘇區(qū)精神產(chǎn)生積極作用。因此,在學(xué)術(shù)上,贛南客家方言語料庫可以為客家方言本體研究提供重要數(shù)據(jù),促進(jìn)語言教學(xué)研究;在社會文化領(lǐng)域,建成語料庫還將為客家文化保護(hù)和傳承發(fā)揮重要的應(yīng)用價(jià)值。

[1]Biber,D.,ConcradS.,ReppenR.CorpusLinguistics[M].北京:外語教學(xué)與研究,2000.

[2]Chomsky,N.NewHorizonsintheStudyofLanguage andMind[M].Cambridge[England].NewYorkCambridgeUniversityPress,2000.

[3]Mcenery,T.,HardieA.CorpusLinguistics:Method,TheoryandPractice[M].CambridgeUniversityPress,2012.

[4]北京語言大學(xué)語言研究所.北京口語語料查詢系統(tǒng)簡介[J].語言教學(xué)與研究,2010(04):95-96.

[5]東石.客贛方言數(shù)據(jù)庫在南昌大學(xué)文學(xué)院建成[J].中國語文,2002(05):477.

[6]范俊軍.漢語方言自然口語語料庫建設(shè)的幾個(gè)基本問題[J].學(xué)術(shù)研究,2013(02):153-158.

[7]馮志偉.基于經(jīng)驗(yàn)主義的語料庫研究[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2007(01):29-36+39.

[8]馮志偉.論語言學(xué)研究中的戰(zhàn)略轉(zhuǎn)移[J].現(xiàn)代外語,2011(01):1-11+108.

[9]馮志偉.語言學(xué)正面臨戰(zhàn)略轉(zhuǎn)移的重要時(shí)刻[J].南開語言學(xué)刊,2013(01):7-19.

[10]李宇明.論中國語言資源有聲數(shù)據(jù)庫的建設(shè)[J].中國語文,2010(04):356-363+384.

[11]劉慧,溫書鴻.贛南客家方言區(qū)基礎(chǔ)教育中的普通話推廣現(xiàn)狀及對策[J].語文建設(shè),2013(11):55-56.

[12]劉連元.現(xiàn)代漢語語料庫研制[J].語言文字應(yīng)用,1996(03):3-9+114.

[13]劉綸鑫.西客家方言概況[M].南昌:江西人民出版社,2001.

[14]羅美珍,林立芳,饒長溶.客家話通用詞典[M].廣州:中山大學(xué)出版社,2004.

[15]羅香林.客家研究導(dǎo)論[M].上海:上海文藝出版社,1992.

[16]衛(wèi)乃興,李文中,濮建忠.語料庫應(yīng)用研究[M].上海:上海外語教育出版社,2005.

[17]溫昌衍.客家方言[M].廣州:華南理工大學(xué)出版社,2006.

[18]楊鴻武,梁青青,郭威彤,etal.一個(gè)面向言語工程的蘭州方言語料庫[J].西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(06):54-59.

[19]俞士汶,段慧明,朱學(xué)鋒,etal.北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范[J].中文信息學(xué)報(bào),2002(05):49-64.

本文系江西省高校人文社會科學(xué)研究青年基金項(xiàng)目《贛南地區(qū)客家方言語音語料庫及檢索平臺建設(shè)》(編號YY1413)階段性成果。

猜你喜歡
客家方言贛南語料庫
粵北鄉(xiāng)鎮(zhèn)中小學(xué)生客家方言傳承研究
——以韶關(guān)市仁化縣為例
文化三館講好贛南審計(jì)故事
贛南采茶戲《一個(gè)人的長征》簡介
影劇新作(2022年2期)2022-07-29 02:28:42
《語料庫翻譯文體學(xué)》評介
近四十年來客家方言研究的歷史經(jīng)驗(yàn)與當(dāng)代反思*
初探客家方言傳承存在的問題及對策
家長·中(2019年9期)2019-09-10 07:22:44
贛南臍橙整形修剪技術(shù)
贛南早臍橙在幾種中間砧木上高接換種的表現(xiàn)
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
长白| 横峰县| 织金县| 忻州市| 交口县| 和田市| 田阳县| 阜新市| 新野县| 财经| 德兴市| 蒙自县| 大同市| 卢氏县| 双柏县| 綦江县| 西贡区| 塔河县| 平乡县| 肥乡县| 绥芬河市| 静安区| 深州市| 阿坝| 远安县| 二连浩特市| 壶关县| 绿春县| 莒南县| 明光市| 当雄县| 闽侯县| 三原县| 昌邑市| 乌什县| 扬中市| 中阳县| 霞浦县| 丰县| 台安县| 定州市|