翟力嬌 曹鈺紅 胡晗 陳逸寒 潘曉芙
摘要:應互聯(lián)網時代信息技術的發(fā)展,方言的傳承也有了新的手段,但仍擺脫不了逐漸落寞的命運。本文以信息技術時代比較普遍的方言保存形式——方言有聲語料庫為抓手,對相關方言保護研究項目進行了解、對現(xiàn)有語料庫進行使用體驗,以激發(fā)青少年對方言文化的興趣、深化群眾對方言的了解從而更好地保護方言文化。同時,對現(xiàn)有方言有聲語料庫的優(yōu)點和不足進行總結并提出建議,以望能對方言的保護和發(fā)展作出貢獻。
關鍵詞:方言保護;有聲語料庫;互聯(lián)網思維;文化自信
一、引言
自十八大提出“文化自信”以來,中國就掀起了一股中華文化熱潮。方言作為語言中舉足輕重的一類,是文化的活化石,具有重要的文化傳承意義。保護并發(fā)展方言,是當代大學生義不容辭的責任與義務。
但不可否認的是,隨著互聯(lián)網時代的到來,地方方言的傳統(tǒng)傳播方式受到了較大的沖擊,舊有的傳播途徑、傳承媒介土崩瓦解;加之信息流轉速度的加快、規(guī)范普通話的普及、多種外語的流行等,方言的魅力被逐漸掩蓋,年輕人幾乎不再關注地方方言的興亡,方言文化也逐漸落寞。
為了更好地促進方言的保護與傳承,社會各界紛紛行動起來,利用互聯(lián)網高效的信息共享能力,建設了一個又一個方言語料庫,將身邊的方言資源匯總、整合,再投放到網絡當中,以便于更多人了解并學習?;谏鲜銮闆r,本文特此對“互聯(lián)網思維下方言有聲語料庫對方言的保護與傳承”問題展開研究。
二、研究基礎
參與各地方言保護、傳承研究的研究人員多自行建立方言語料庫,充分研究方言的發(fā)音特點,將方言語料庫的建設向系統(tǒng)化、專業(yè)化、學術化的方向邁進。如陳琳(2020年)通過自建“《紅樓夢》江淮方言漢英平行語料庫”的方式來研究《紅樓夢》中的江淮方言[1]。他們考慮到了方言難以用書面文字形式記錄的問題,轉而借用語音資源進行保存,語音語料多從本地影視作品中剪裁或邀請當?shù)刂驹刚哌M行錄制。為研究海南方言的語音識別問題,余旭文(2020年)邀請志愿者參與方言語音的錄制,經語音切分后,進行加噪、速度擾動等語音增強手段增廣語料庫數(shù)據[2]。但這些專業(yè)學者構建的方言語料庫傳播范圍極小,多是用于自身研究某一專業(yè)領域,對廣大網民了解、學習方言有聲語料庫起到的作用微乎其微。
也有部分研究互聯(lián)網思維下方言保存與傳承問題的人員參考了各地已建成的方言語料庫,如甘瑩(2017年)在論文中提及的天津方言語音檔案資料庫。她認為已建檔語料庫存在內容形式單一、方言個性特征提取不完善、文本化氣息過重、生活氣息不足等問題,提出了將語料庫建設專業(yè)化、內容深度化,推進方言語料庫的傳播和運用,優(yōu)化語料庫的結構和類別等解決措施[3]。
可見,已有研究大多僅集中在充分運用數(shù)字技術上,對于互聯(lián)網特性的運用考慮不夠全面。鄒曉燕、韓琨(2017年)提出了以高校教師和研究者作為突破口,發(fā)揮高校學生眾多、方言資源種類豐富的優(yōu)勢,解決語料庫存儲方言語料種類少、加工處理工作量大這一問題的方法[4],但沒有意識到網絡上眾多網友所持的海量方言資源,未能找到利用共享信息的方式發(fā)動網友完善方言語料資源的有效途徑。
本文將以現(xiàn)有的方言有聲語料庫為研究出發(fā)點,充分探索現(xiàn)階段語料庫的建設狀況及優(yōu)缺點,以互聯(lián)網特性為基礎,著力找出互聯(lián)網思維下方言有聲語料庫建設的有效途徑,將互聯(lián)網開放性、共享性、多元化、交互性等特點融入語料庫建檔方法中。
三、問題與討論
經過對大量方言語料庫的查找和試驗后,我們收集了38個建設較完善且具有代表性的方言有聲語料庫信息,其中地方類、綜合類、藝術類語料庫分別占比47%、34%、19%。在18個地方類語料庫中,8個涉及粵方言,5個涉及吳方言,這也是總體方言有聲語料庫中語料資源最豐富的兩類方言。
基于調查試驗,我們認為現(xiàn)階段方言有聲語料庫存在以下四個問題:
1.方言錄入形式單一
許多語料庫基本上都是對于方言單字、詞匯的方言發(fā)音的保存,收錄方式上多采用文字、注音、錄音音頻結合的形式,如“潮州音”、“潮州·母語”、“粵語發(fā)音在線學習網”等。
這較之前僅有文本資源的語料庫而言有了較大進步,但形式上仍較為單一,應當增加方言資源錄入形式,豐富方言的保存途徑,使方言資源更加真實化、多樣化。如“粵語學習網”、中國語言資源保護工程采錄展示平臺等語料庫,增加了類型多樣的視頻資源,或是展示方言發(fā)音的嘴型變化,或是介紹方言所屬地的風俗人情,引導網友深入了解方言背后的人文故事。
2.收錄詞匯不完整
對于用戶學習方言和應用方言的需求而言,語料庫收錄的內容是根基,是學習應用的直接來源。在運用語料庫的過程中,我們發(fā)現(xiàn)語料庫錄入的方言詞匯數(shù)量較少,現(xiàn)存的方言語料庫錄入的大多是一些比較典型、有代表性的方言單字、詞匯,收錄內容有限。如“潮州音”只收錄了單字的解釋和發(fā)音,“潮州·母語”則是將搜索的詞組拆成單字提供解釋和發(fā)音,對于想要了解方言文化的使用者并不能起到良好的解釋作用,也破壞了方言詞匯本身所攜帶的文化內涵;“粵語發(fā)音詞典”雖然對于常用語言做出分類,方便使用者按照日常用語和習慣分類進行高效篩選和學習,但是大多分類下的方言詞匯較少,且相關詞匯下的短語釋義不夠完善,存在詞組例句只出現(xiàn)詞組中單個字的釋義的情況,影響用戶學習效果。
除此之外,大多數(shù)方言有聲語料庫缺乏體現(xiàn)當?shù)靥厣幕畹膬热?,只收錄了一些廣泛使用的方言資源,像“方言庫-江蘇省方志館”雖收錄了江蘇省大量地區(qū)的方言資源,但各個地區(qū)僅收錄了少數(shù)詞組的發(fā)音(如太陽、月亮、星星等),而許多當?shù)靥厣脑~匯、短句未被收錄,使用者不能夠通過搜索的形式找到自己感興趣的方言資源,方言收錄碎片化,方言語料庫無法形成系統(tǒng)、有效的整體。
3.網站運行維護困難
多數(shù)方言語料庫缺少專業(yè)人員維護,常出現(xiàn)系統(tǒng)相斥、網頁崩潰、鏈接失效等問題。如“粵語發(fā)音詞典”為用戶提供了MP3、視頻教程以及推薦教材書目,但很多功能需要從美國網站安裝相關軟件,這與國內大多數(shù)網站、軟件相排斥,使得用戶不得不放棄該網站,阻礙學習積極性。
還有不少語料庫缺乏有效的用戶反饋途徑,導致語料庫中漏洞百出,無法向使用者提供良好的使用體驗,極不利于方言語料庫的進步和發(fā)展。如“廣州話口語”,雖收錄了約31萬字語料,提供的方言錄音多是從綜藝節(jié)目、電視劇等中截取,錄音資源真實化、生活化、趣味化,但缺少在線留言的途徑,運行人員無法了解到用戶存在的需求和網站收錄語料的漏洞;有些網站雖有平臺留言、用戶交互交流渠道,但是用戶缺乏反饋與交互意識。如“吳語詞典”中設置了用戶相互交流的路徑和官方反饋郵箱,但大多數(shù)用戶遇到困難還是不知道在何處或者不懂得如何反饋,只是簡單粗暴地選擇更換其他有聲方言語料庫。
另外,語料庫的維護成本昂貴。多數(shù)方言有聲語料庫為非盈利性質,為了正常運行下去,有些語料庫在網頁鋪設了大量廣告,這可能會讓瀏覽語料庫的網友產生抵觸心理,不利于語料庫的長期發(fā)展。類似“四川方言庫”這種個人因興趣而研究建立起的語料庫甚至因種種原因被暫停。
4.語料庫推廣度較低
在試驗現(xiàn)存方言語料庫的過程中,對方言語料庫的有效尋找是最大的難題。大多數(shù)方言語料庫推廣度低,對方言有了解興趣的網友很難直接找到有豐富資源和滿足需要的方言語料庫?,F(xiàn)存的較為官方的一些方言語料庫,如我國教育部、國家語委聯(lián)辦的中國語言資源采錄展示平臺,由于開放權限限制,許多資源不能面向大眾開放。
大多數(shù)語料庫盡管已經建設得較為完備,但因為推廣力度缺乏、瀏覽人數(shù)較少,已經長時間沒有更新內容,這對于方言愛好者和方言的保存與傳承都是阻礙?!包S梅戲在線”是一個大型戲曲類語音分享學習平臺,具有該方言的語料學習、視頻學習、新聞更新和用戶上傳自己作品等功能,但受制于推廣不夠和用戶使用缺乏等問題,該平臺現(xiàn)在處于停滯狀態(tài),新聞沒有及時更新,相關視頻學習資料有空白頁面、權限設置、空有標題而無實質內容等問題。
方言的傳承與保護需要一定流量的推廣者,在一定量使用者的使用分析反饋中語料庫才能進一步發(fā)展,在推廣度的加強中開發(fā)者才能更好及時有效豐富語料庫內容,做到全面控制與發(fā)展。
四、建議與對策
方言保護問題,關系到中國傳統(tǒng)文化的繼承與發(fā)展,而有聲語料庫則是方言保護中比較重要的一筆。針對方言有聲語料庫存在的問題,提出以下改進建議:
1.注意豐富方言收錄內容,可利用互聯(lián)網互動性傳播的特點,鼓勵用戶通過在線平臺優(yōu)化語料庫。
參考吳語語料庫中的“吳語小詞典”。該網站的設計者思考十分全面,相比其他網站它還囊括了“吳語協(xié)會論壇”板塊,該版塊聚集了大量熱愛吳語、獻力保護吳語文化的網友,他們能在論壇中分享資源、交流討論;還專門設有“報錯”板塊,用戶可以在該板塊下發(fā)帖,反應該網站的錯誤或補充建議,這是值得大部分網站學習借鑒的。再比如,“潮州音”、“潮州·母語”網站,用戶可以通過在線留言聯(lián)系到管理員為其在網站操作等基礎問題上答疑解惑,其中“潮州音”還向用戶開放了“我來錄音”功能,讓網友來提供更本土化的方言錄音。
只有高度重視用戶交互的重要性,紛繁復雜的方言語料庫才不會成為一座座零星的“孤島”。
2.注意方言語料資源趣味化,建議以生活對話、地方經典文化片段為主。
調查發(fā)現(xiàn),使用者放棄使用語料庫或者對語料庫興趣不大的原因往往是大多數(shù)的語料庫學術性、專業(yè)性過強。相反,類似“梨園”、“京劇藝術網”這類的藝術趣味性很強的網站則更吸引普通用戶。在調查考證的支撐下,我們建議目的在于推向大眾的語料庫網站不要局限于簡單字詞的查詢,要注意收錄方言語料資源的趣味化,甚至可以以生活對話、地方經典文化片段(如戲曲)為主。這點可以參考“粵語發(fā)音學習網”,該網站在查詢字詞時增添了與之相關的影視中的語句,大大提高了網站的趣味性。
3.注意收錄方式多元化、系統(tǒng)化。
在實操和體驗過程中,我們發(fā)現(xiàn)比較完善的語料庫網站大多是文字、音標注音和音頻范讀三位一體的結構,而類似戲曲藝術類的網站往往是以視頻為主。那普通字詞查詢的工具類網站是否也可以結合相關視頻呢?比如視頻可以對該方言中所查詢字詞的歷史和語境應用進行一個系統(tǒng)的介紹,方便用戶理解。所以我們認為,更為有效的收錄方式是將文字、注音、音頻、視頻一體化,提升語料收錄的質量。
這并不是一個不簡單的工程,但我們可以借助廣大熱心方言研究者和原住地使用居民的力量來共同完成這一工程。
4.注意信息碎片化問題,注重語料庫的開放共享。
方言語音是復雜多變的,不能簡單地一以概之,有時同一方言區(qū)的不同村落間往往都存在較大的語音差異,所以在構建方言有聲語料庫時應當注重信息的共享性和開放性,不拘泥于個別字詞但也能較為客觀全面地展現(xiàn)出該方言的全貌。如“吳語學堂”,其字音搜索功能考慮得非常專業(yè)且周到——考慮到不同吳語地區(qū)讀法有所不同,獨創(chuàng)性地設置了一個地圖讀音搜索的選項,點擊“多地聯(lián)合查詢”,可以同時對比不同地區(qū)的讀音。
除了上例網站內部網狀式搜索結構的優(yōu)化,還可以與其他網站相互建立友情鏈接,采用頻道聚合形式,避免信息繭房影響方言語料的精確學習與傳播,從而更好適應互聯(lián)網多樣性、互動性、海量性、開放性的特點,充分發(fā)揮出互聯(lián)網帶來的新的發(fā)展機遇。如兩個美國留學生司圓直和柯祎藍曾于2013年制作過一個名為“鄉(xiāng)音苑”的中國方言網站。各地的用戶可以用家鄉(xiāng)的方言說故事并上傳至網站,每一段上傳的音頻都會在地圖相應的位置被標出,形成由錄音組成的語言地圖,五顏六色的標簽直觀地展示了這片土地上語言的豐富性。
對方言的有效保護與傳承可以讓文化傳承開出新花。在互聯(lián)網背景下,方言煥發(fā)了新的生機活力,但同時,許多方言的意思在某種程度上被扭曲、破壞,網絡傳播的一知半解使其喪失了本來的意義。方言不應當是網絡土味、無厘頭無營養(yǎng)新詞的滋生土壤。我們研究方言有聲語料庫正是為了從源頭上實現(xiàn)對方言的保護與傳承,尋找方言文化的延續(xù)性,探訪歷史地理留給我們的根脈相傳的文化符碼和精神財富,用方言的魅力建立文化自信!
參考文獻
[1]陳琳.《紅樓夢》江淮方言的異化翻譯——以霍克思譯本為例[J].淮南師范學院學報,2020,22(05):48-53
[2]余旭文.基于深度學習的海南方言語音識別[D].海南大學碩士學位論文,2020
[3]甘瑩.語料庫視域下的天津方言建檔[J].山西檔案,2017(06):87-89
[4]鄒曉燕,韓琨.語言生態(tài)學視野下方言語料庫建設的路徑、實現(xiàn)與應用——以贛方言為例[J].地方文化研究,2018(04):40-45
作者簡介:
翟力嬌(2001-),女,漢族,江蘇常州人,南京審計大學本科在讀,漢語言文學專業(yè)