国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國瀕危方言語料檔案建設(shè)研究

2018-01-23 20:59姜曉娜
山西檔案 2018年3期
關(guān)鍵詞:語料方言模態(tài)

文 / 姜曉娜

我國是一個統(tǒng)一的多民族國家,多樣性亦是我國語言較為突出的特征。十里不同音,各個地域的語言差異相當(dāng)大。據(jù)統(tǒng)計,目前55個少數(shù)民族只有回族、滿族使用漢語,絕大多數(shù)少數(shù)民族還有自己的本族語言。更有甚者,有的少數(shù)民族內(nèi)部也使用多種語言。全國語言數(shù)量在80種以上。語言文字的多樣性主要聚焦在檔案管理方面,即除了國家通用語種漢語和漢字作為語言記錄檔案外,還有為數(shù)眾多的檔案是用我國主要地域方言區(qū)的語言文字來記錄的。地域方言語料檔案既是我國不同地區(qū)人民在生產(chǎn)生活中溝通交流的工具,也是民族文化的載體、情感聯(lián)系的紐帶、國家的非物質(zhì)文化遺產(chǎn)。做好地域方言語言檔案資源的保存與管理工作,對于留存我國不同區(qū)域經(jīng)濟社會發(fā)展的歷史印記、繼承與發(fā)展不同區(qū)域的傳統(tǒng)文化、促進民族之間的團結(jié)與融合,起著不可小覷的作用[1]。鑒此,我們有必要對漢語方言進行合理的保護。但是,從整體上來看,目前我國語言檔案數(shù)據(jù)庫建設(shè)還不完善,正處于探索階段,特別是在“互聯(lián)網(wǎng)+”的大數(shù)據(jù)環(huán)境下,如何有效地進行語言檔案建設(shè)成為檔案學(xué)及社會語言學(xué)領(lǐng)域的一個重要論域。

一、瀕危方言語料檔案信息保護的必要性

20世紀(jì)末,語言學(xué)專家對我國處于瀕危狀態(tài)的地域方言進行了積極的保護與搶救工作。他們利用計算語言調(diào)查軟件對不同地域方言進行了共時與歷時的收集,用錄音、錄像等電子設(shè)備錄制方言語言資源,構(gòu)建有聲語料數(shù)據(jù)庫,原生態(tài)語言的語音、詞匯、語法、篇章等共時語言得以保存。但一直以來,這些珍貴的語言材料并未被相關(guān)機構(gòu)作為收藏對象,僅是分散地保存于少量的研究人員手中,對于瀕危方言的保護非常不利,甚至導(dǎo)致方言搶救工作成為社會記憶斷層現(xiàn)象[2]。

方言作為區(qū)域群體的重要特征,與一個民族的產(chǎn)生、形成、發(fā)展以及變化密切相關(guān)。方言作為見證一個民族發(fā)展的活化石,具有相對的穩(wěn)定性,承載著民族發(fā)展過程中的傳統(tǒng)文化訊息。換言之,它就像一座歷史博物館,館內(nèi)陳列著各個歷史時期留下的文物[2]。所以,從保護某一區(qū)域文化遺產(chǎn)的角度來看,建立有效的瀕危方言語料資源檔案保護機制對于我國顯得格外重要,有利于長期保護其原生性與完整性。

二、瀕危方言語料檔案信息資源保護的現(xiàn)存問題

目前,瀕危方言非遺文化資源的收集、整理、建檔等工作取得了一定的成效,但方言語料資源的檔案保存工作仍需進一步改進。

(一)方言檔案資源管理機構(gòu)建設(shè)不健全

首先,目前我國的方言保護工作尚處在起步階段,管理機制尚不健全、方針政策還不明確、國家扶持力度弱,方言保護工作步履維艱。加之,方言檔案資源在語料的收集、歸類、整理以及鑒定等程序上所需要的相關(guān)人才匱乏,有關(guān)部門及高校未能積極承擔(dān)此重任,方言保護工作更難開展。其次,建立有聲語料檔案資源庫是方言保護的一項重要工作。該項工作需要強大的信息技術(shù)支持來解決信息來源層、數(shù)據(jù)集成層和服務(wù)集成層等方面的問題。但是,現(xiàn)今應(yīng)當(dāng)承擔(dān)此項任務(wù)的地方高校卻很少有實際行動。再次,確立方言檔案資源能組建什么樣的服務(wù),以及怎么實現(xiàn)服務(wù),是擺在專業(yè)機構(gòu)建設(shè)上的難點。并且,方言檔案資源對社會的服務(wù)功能尚不完善。最后,建成的檔案未能及時向公眾開放,造成了方言保護工作與民眾及實際效益脫節(jié)的現(xiàn)象。

(二)方言檔案資源保真度較低

方言語料檔案庫建立伊始,研究者只是考慮將紙質(zhì)文檔囊括其中,卻忽視了有聲語料檔案資源的收集。方言有聲語料檔案不僅有著天然的開放性,而且具有一定的地域特征。然而,我國的方言保護只是停留在紙質(zhì)與寫實記錄方面,而具有證據(jù)屬性、富有表現(xiàn)力的有聲語料卻鮮有人問津。顯然,有聲語料的收集工作急需大批專業(yè)人員,只依賴紙質(zhì)檔案不足以保障瀕危方言的原貌。

檔案收集難在保障瀕危方言的穩(wěn)定性,對原生態(tài)語言的收集貴在保留原有面貌。采集和及時保存是必要工作,因為瀕危方言使用人數(shù)較少,極易受到周邊語言的影響。同時,在采集過程中,翻譯人員用詞主觀性強度、語音音位混淆現(xiàn)象等不確定因素都會不同程度地降低瀕危方言的保真度。

(三)方言檔案資源缺乏跨區(qū)域共享性

我國方言檔案的管理具有綜合性和復(fù)雜性特征,各地區(qū)的信息化建設(shè)參差不齊,且方言檔案資源缺乏跨區(qū)域共享性。方言檔案資源庫的建立并非為了某一個群體,而是為了繼承和弘揚中華優(yōu)秀文化,并為研究者提供更好的查詢服務(wù)。由于人口流動、時代變遷,使用某種方言的人多集中在某一廣大區(qū)域或是鑲嵌分布在某些小區(qū)域。若不實現(xiàn)區(qū)域共享,研究者便很難全方位、多層次地認(rèn)識該種瀕危方言。因此,實現(xiàn)方言檔案資源的跨區(qū)域共享刻不容緩。

三、方言語料檔案信息建設(shè)的總體構(gòu)想

(一)規(guī)范地域方言語料采集

一方面,語料的收集應(yīng)尋找瀕臨方言的記錄志愿者以及傳承人錄制,以保證語料的質(zhì)量。另一方面,語料的收集和保存應(yīng)當(dāng)同時進行,為減少不確定因素的干擾,應(yīng)使用多元化的方法進行收集。

根據(jù)收集方法性質(zhì)的不同,語料的采集分為自然語料和誘發(fā)式語料[3]。在自然語料的采集過程中,常用語料庫需要采集擁有固定程式、數(shù)量有限且結(jié)構(gòu)單一的言語行為;研究人員還可以用自然觀察法獲取自然語料。誘發(fā)式語料是指研究對象在研究人員的誘發(fā)和引導(dǎo)下,調(diào)動記憶,以報告、表演或文字的形式呈現(xiàn)出來[4]。具體的方法主要有語篇完型任務(wù)、情景模擬的角色扮演及研究人員理解的口頭報告。語料收集后,所有可讀文件標(biāo)注國際音標(biāo),以期發(fā)揮語料的跨區(qū)域性價值?,F(xiàn)有的語料標(biāo)注大部分使用漢語拼音,但是研究瀕危方言語料并不一定是使用漢語的人,因而國際音標(biāo)的使用大大提高了收集語料的普適性。

(二)搭建信息化語檔信息網(wǎng)絡(luò)平臺

隨著科技的飛速發(fā)展,網(wǎng)絡(luò)已走進千家萬戶。網(wǎng)絡(luò)的即時性為搭建信息化語檔信息網(wǎng)絡(luò)平臺提供了技術(shù)層面的支持。匯總整合國內(nèi)繁復(fù)檔案資料,建成一體化、多元化的數(shù)字檔案體系,成為未來方言文化保護工作的重點[5]。

搭建信息化語檔信息網(wǎng)絡(luò)平臺需要進行檔案化管理。檔案化管理還可以實現(xiàn)電子資源的高效利用,為社會提供方便、快捷的檔案資源。在瀕危方言的保護工作中,電子檔案可以為研究者提供不受時空限制的最新資源。此外,檔案化的電子資源格式被統(tǒng)一規(guī)定為只讀文件。檔案化的電子資源與紙質(zhì)文件相比,儲存于相對穩(wěn)定的媒介上,不易受自然因素影響,維護相對容易。與此同時,數(shù)字化檔案的長期保存與維護需要相關(guān)技術(shù)人員在數(shù)據(jù)庫產(chǎn)生時處理好編碼方案、專業(yè)符號、術(shù)語錄著、國家通用語言、文字版本收集等信息技術(shù)方面的問題。

信息化語檔有著文字檔案無法比擬的優(yōu)勢,搭建信息化語檔信息網(wǎng)絡(luò)平臺能夠?qū)Ψ窖陨鷳B(tài)實行動態(tài)監(jiān)測。方言有聲檔案的建立指向方言資源與地理信息管理,包括方言的語言說話發(fā)音人、語料的種類以及語音采錄地理位置等重要信息。地理位置、宗教形態(tài)等地域特有的信息與之聯(lián)系,從而發(fā)現(xiàn)方言衰退在二者之間的聯(lián)系。

搭建信息化語檔信息網(wǎng)絡(luò)平臺可以實現(xiàn)瀕危方言檔案資源的共享。雖然國內(nèi)各個地區(qū)的方言語檔不同,但是利用網(wǎng)絡(luò)平臺便可實現(xiàn)跨區(qū)域共享,將資源利用到極致。研究人員可利用網(wǎng)絡(luò)快速地獲取各地的瀕危方言語檔,為研究帶來極大便利。此外,瀕危方言語檔資源應(yīng)當(dāng)供廣大人民群眾使用,進一步提升瀕危方言保護工作的社會價值。

(三)整合語言多模態(tài)保護路徑

多模態(tài)話語是人類感知通道在交際過程中綜合使用的結(jié)果。模態(tài)是指交流的渠道和媒介,包括語言、技術(shù)、圖像、顏色、音樂等符號系統(tǒng);多模態(tài)話語則包含視覺模態(tài)、聽覺模態(tài)、嗅覺模態(tài)、觸覺模態(tài)和味覺模態(tài)[6]。多模態(tài)語言對于提升信息處理的準(zhǔn)確性和速度可提供很大的幫助。此外,多模態(tài)語言還可為信息資源建設(shè)提供服務(wù),在建立資源共享的工作上發(fā)揮巨大作用。

多模態(tài)語言檔案數(shù)據(jù)庫的建立是在語料收集的基礎(chǔ)上進行語言檔案管理、語言檔案分析,然后建立多模態(tài)檔案庫,最后進行語音識別、語音教學(xué)、語音合成等工作[7]。這樣便可將語言與其他相關(guān)資源如圖像、色彩等整合在一起,方便研究人員把握瀕危方言的語義及其不同情境下的感情色彩,大大加快工作進度。若配以高速攝像頭、呼吸帶等最新研究設(shè)備,還可以進行跨學(xué)科研究,為研究瀕危方言提供極大的便利。其中,多模態(tài)語言檔案數(shù)據(jù)庫由三個子數(shù)據(jù)庫組成,分別是語音子數(shù)據(jù)庫,圖像、視頻子數(shù)據(jù)庫以及文本子數(shù)據(jù)庫[7]。這三個數(shù)據(jù)庫是多模態(tài)語言檔案數(shù)據(jù)庫的重點建設(shè)對象,三者在各自獨立的基礎(chǔ)上又緊密聯(lián)系、相輔相成,為用戶提供方便快捷的資源。

自然狀態(tài)下發(fā)生的話語活動往往具有多模態(tài)性。計算涉及模態(tài)和符號系統(tǒng)的數(shù)量是識別多模態(tài)話語的有效途徑。學(xué)術(shù)界普遍把包含兩種或兩種以上的話語模態(tài)稱之為“多模態(tài)”。如果被測話語只有一種模態(tài),卻包含多種符號系統(tǒng),那么我們也稱之為“多模態(tài)”話語[8]。

建設(shè)多模態(tài)話語可以將語言和圖像、色彩及其他符號系統(tǒng)的資源進行有機整合,展現(xiàn)出語言系統(tǒng)在交換過程中發(fā)揮的作用,可以展示其他符號系統(tǒng)的作用與意義,使整個話語過程表現(xiàn)得更加充分、全面,使研究人員更易做出分析判斷。

(四)倡導(dǎo)語言檔案資源的共享性及開放性

方言檔案資源的管理涉及多個機構(gòu),跨越多個領(lǐng)域,這使工作變得復(fù)雜,建成后的檔案資源的共享性及開放性也因此受到忽視。當(dāng)今社會,發(fā)達的信息科技使得各個機構(gòu)跨區(qū)域共享資源、互惠互助成為可能[9]。借鑒保護少數(shù)民族瀕危語言的方法,瀕危方言的保護工作必將跨越多個領(lǐng)域,任何機構(gòu)或組織不可能孤立地完成這項任務(wù)。所以,實現(xiàn)資源共享十分必要,成為瀕危方言保護工作的最基本原則之一。

瀕危方言保護工作離不開人民大眾的支持。大部分檔案應(yīng)該面向公眾開放,瀕危方言來源于民眾也必將再次走近人民大眾,開放性是瀕危方言語料檔案保護的另一原則。只有鼓勵、支持人民大眾重拾瀕危方言,才能最終實現(xiàn)瀕危方言的傳承和發(fā)揚。令人遺憾的是,各個機構(gòu)未設(shè)置對公眾開放接觸檔案的途徑[9]。在未來的工作中,實現(xiàn)檔案對外開放也應(yīng)是工作的重點。

猜你喜歡
語料方言模態(tài)
方嚴(yán)的方言
基于BERT-VGG16的多模態(tài)情感分析模型
多模態(tài)超聲監(jiān)測DBD移植腎的臨床應(yīng)用
基于歸一化點向互信息的低資源平行語料過濾方法*
方言
跨模態(tài)通信理論及關(guān)鍵技術(shù)初探
說說方言
留住方言
瀕危語言與漢語平行語料庫動態(tài)構(gòu)建技術(shù)研究
對外漢語教學(xué)領(lǐng)域可比語料庫的構(gòu)建及應(yīng)用研究
——以“把”字句的句法語義標(biāo)注及應(yīng)用研究為例
庐江县| 达尔| 襄汾县| 鄢陵县| 新兴县| 晋江市| 台前县| 新竹县| 博白县| 巴彦淖尔市| 穆棱市| 天峨县| 什邡市| 咸阳市| 定日县| 固原市| 朝阳市| 虹口区| 绍兴县| 获嘉县| 漯河市| 沅陵县| 宝山区| 锡林浩特市| 汤原县| 保亭| 泾源县| 邹城市| 西盟| 于都县| 白水县| 荔浦县| 精河县| 安福县| 鹤峰县| 丰台区| 新昌县| 资源县| 石泉县| 大关县| 五家渠市|