国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國兒童詩語料庫建設(shè)芻議

2024-03-05 00:00:00趙嘉軒
文教資料 2024年20期
關(guān)鍵詞:兒童詩語料庫意象

摘要:兒童詩是中國現(xiàn)當代兒童文學(xué)的重要組成部分,過往中國兒童詩的研究多集中于名家名作,涉及詞匯、句法、韻律等多個方面。作為詩歌詞匯的核心部分,意象從兒童認知出發(fā),以形象為載體,傳達詩人的思想情感,具有時代特征和詩人個體特征。自“五四”時期至今,中國兒童詩已經(jīng)積累了海量文本,為給兒童詩寫史,彌補“文學(xué)屠宰場”式研究的不足和應(yīng)對“讀不完”的焦慮,本文以“遠距離閱讀”作為新的研究路徑,參考國內(nèi)外語料庫的成功實踐,并基于前人的質(zhì)性研究結(jié)果,設(shè)計了百年中國兒童詩語料庫結(jié)構(gòu)和標注體系,以期為系統(tǒng)考察兒童詩的語言特點和發(fā)展規(guī)律提供幫助。

關(guān)鍵詞:兒童詩語言語料庫

中國兒童文學(xué)有著深厚的歷史資源積淀和民族文脈傳承,其中兒童詩被譽為“兒童文學(xué)王冠上的明珠”。對兒童詩的研究從傳統(tǒng)范式轉(zhuǎn)向數(shù)字人文范式是有必要的。傳統(tǒng)研究方法主要依賴定性分析,枚舉詩中的詞句進行論證說明,已經(jīng)很難出新。數(shù)字人文方法的引入,為兒童詩研究提供了新的視角和工具,使研究者能夠從宏觀和微觀兩個層面進行更系統(tǒng)的深入分析。

一、文獻綜述

(一)中國兒童詩研究

國內(nèi)兒童詩大家的作品是學(xué)界過往研究的重點對象,涵蓋了詞匯、句法、韻律等多個層面,研究者通常枚舉詩中的詞句進行論證說明,這屬于定性研究。湯素蘭認為任溶溶兒童詩具有的語言特點有:口語化,自然靈活的節(jié)奏和和諧的韻律,詩歌形式的“視覺化”,對漢語語詞創(chuàng)造性地運用,句式簡單,語言夸張,善用反諷和悖論。[1]姚洪偉認為傅天琳的創(chuàng)作從母親視角回歸兒童本位,將語言的質(zhì)感和兒童的日常經(jīng)驗有機結(jié)合,充滿了奇妙的想象,并通過打破視聽、物類的界限,將想象的空間進一步拓展,給人陌生化的審美體驗,她的《大雁南飛》《對面走來的爺爺》《椰子樹》《草原》等詩作里的“詩味兒”體現(xiàn)在動詞、擬聲詞和語氣詞的巧妙運用,她將語言的質(zhì)感和兒童的日常經(jīng)驗有機結(jié)合,還借用童謠“子了歌”的押韻形式,增強詩句的節(jié)奏感和韻律感,產(chǎn)生一唱三嘆的語意效果,比如《星期天山就長高了》《幽藍幽藍的童話》。梁前剛評述王宜振的兩本兒童詩集《21世紀校園朗誦詩》和《21世紀校園抒情詩》運用了新韻“十三轍”,且每一轍都用到了;古韻的基本要求“一詩一韻”“雙句押韻”“一韻到底”以及合理換韻,王宜振也繼承得較好;此外他在韻目并用和韻式樣式等方面也有所創(chuàng)新。[2]與之相對,彭斯遠指出兒童詩產(chǎn)生了階段性的反傳統(tǒng)韻律現(xiàn)象,20世紀80年代的兒童詩走向了散文化。[3]總之,兒童詩的共性特征有:從國家、社會、母親的視角轉(zhuǎn)向兒童本位;語言簡潔淺顯、口語化,巧妙運用動詞、擬聲詞、語氣詞及疊詞形式;運用通感等手法使語言“陌生化”,畫面感強;節(jié)奏自然,從傳統(tǒng)韻律走向散文化。個性特征有夸張、反諷、悖論等。

朱自強以兒歌作為參照,說明了兒童詩中形象為意象的原因:兒歌中的形象是直接、具體、客觀的白描,而兒童詩中的形象則往往“意在象外”[4],托物言志,借景抒情,包含了抒情主體的主觀思想和想象,不是純?nèi)豢陀^的。意象是詩歌詞匯的核心部分。兒童詩的意象既根植于中國傳統(tǒng)美學(xué)的深厚土壤,又在現(xiàn)當代語境中煥發(fā)出新的生命力,展現(xiàn)出兒童獨特的認知世界和情感表達。

(二)基于語料庫的詩詞意象研究

語料庫作為一項技術(shù),同時也作為一種研究方法,歷經(jīng)近半個世紀的發(fā)展逐漸成熟,如今已深入國內(nèi)古典詩詞意象研究領(lǐng)域。例如,中國臺灣元智大學(xué)的羅鳳珠等建設(shè)了格律自動檢索系統(tǒng)[5];大連理工大學(xué)的畢旭將特征向量輸入神經(jīng)網(wǎng)絡(luò),系統(tǒng)建立了一個小型唐詩語料庫,標注了意象詞匯在《同義詞詞林》中的編號與主題,并可以查詢出語義相近的詩句[6];葛四嘉進行了關(guān)于《唐詩三百首》意象標注語料庫的構(gòu)建及統(tǒng)計分析,用深度學(xué)習(xí)方法標注分詞和詞性信息,用知網(wǎng)(HowNet)體系標注意象的表層義與深層隱喻義信息,探尋意象與作家風格、題材內(nèi)容之間的關(guān)系,統(tǒng)計得到意象分布數(shù)據(jù)和內(nèi)部詞匯構(gòu)成、深層情感等語義知識。[7]這些研究為兒童詩語料庫的建設(shè)和標注提供了方法、工具和思路上的借鑒。

(三)德國兒童詩語料庫

2023年德國推出的兒童詩語料庫ChildPoeDE是目前世界上第一個較為系統(tǒng)、全面和專門的兒童詩語料庫,收錄了七部詩集,包含了1991年至2001年出版的356位作家(84位女性、271位男性、1位未知)創(chuàng)作于1800年至2018年兩百余年間主要面向小學(xué)生的1 082首兒童詩。詩歌層面和詞匯層面的元數(shù)據(jù)包括選本和作者信息及量化文本特征如押韻、詞匯豐富度、移動平均詞匯豐富度、詞性、實詞詞云、分布和頻率、擬聲詞和聲調(diào)等。大多數(shù)特征是由研究者自己的Python腳本提取的。該研究使用rhymetagger發(fā)現(xiàn),這1082首兒童詩的押韻模式,有的遵循傳統(tǒng)韻律節(jié)拍,有的則較為自由和俏皮。其題材包括日常情景、冒險經(jīng)歷、自然和動物、家庭生活、夢想等。該語料庫既可以用于計算文本分析,也可以作為實驗研究中誘發(fā)語料的來源。有了德國兒童詩語料庫的成功實踐,中國兒童詩語料庫的構(gòu)建和應(yīng)用指日可待。[8]

二、兒童詩語料庫的建設(shè)與標注

經(jīng)過百余年的發(fā)展,中國兒童詩已經(jīng)積累了海量的文學(xué)文本。為了譜寫兒童詩史,并彌補以往只關(guān)注名家名作這樣“文學(xué)屠宰場”式研究的不足和研究過程中讀不完的焦慮,本文認為,可以引入“遠距離閱讀”這一嶄新的研究視角。[9]電子語料庫作為兒童詩存儲和研究的數(shù)字化載體,使“遠距離閱讀”成為可能。

(一)建設(shè)兒童詩語料庫的目的與意義

第一,建設(shè)兒童詩語料庫可以提供大規(guī)模兒童詩數(shù)據(jù)資源。數(shù)字人文技術(shù)的興起正在引發(fā)人文研究的范式變革,大規(guī)模數(shù)據(jù)資源的存儲和應(yīng)用受到了人文學(xué)者前所未有的重視。建設(shè)大規(guī)模數(shù)據(jù)庫是數(shù)字人文研究中的一項基礎(chǔ)工作。語料庫作為數(shù)字化載體,可以為兒童詩研究者提供豐富的素材,也能夠為教育工作者提供豐富的教學(xué)資源,幫助他們設(shè)計教材和課程。

第二,建設(shè)兒童詩語料庫可以挖掘中國兒童詩的語言特征和發(fā)展規(guī)律。不同年代的詩人詩作有不同的語言特點,不僅在高頻詞、詞匯豐富度、詞匯密度等方面存在不同,在字詞、意象的選擇上,不同詩人也有不同的側(cè)重和喜好,用韻情況也各不相同。本文認為通過建立并整理語料庫,可以展現(xiàn)出中國兒童詩百年來語言面貌的發(fā)展規(guī)律,為中國兒童詩編史修志。

第三,建設(shè)兒童詩語料庫可以服務(wù)于兒童詩教。百年來小學(xué)語文教科書中不乏兒童詩篇目,社會上也出版了不少兒童詩集。兒童詩語言淺近、意象優(yōu)美、富于音樂美,尤其適合兒童賞讀。通過語言知識的傳授,培養(yǎng)兒童的閱讀能力、寫作能力,有助于兒童全面提高語文水平。引導(dǎo)兒童感知世界、親近自然、珍惜情感,激發(fā)想象力和思考能力,對于培養(yǎng)兒童的文學(xué)素養(yǎng)和審美情趣有著積極的影響。

第四,建設(shè)兒童詩語料庫可以輔助制定兒童詩分級閱讀清單。近年來,已有專家做過兒童詩閱讀分級工作,如王小妮《給孩子們的詩》按兒童理解力的不同分為一二年級、三四年級、五六年級三個部分[10],但由于篇目有限,分級標準比較主觀,且缺乏20世紀的經(jīng)典詩作。分級閱讀標準的制定以及根據(jù)標準對百年詩作進行歸納,對于語文教育、親子閱讀和兒童自主閱讀都有一定的指導(dǎo)意義。

(二)語料來源和元數(shù)據(jù)字段設(shè)計

本文參考兒童文學(xué)界有代表性的專家學(xué)者推薦或選編的書目,采集了1000余首中國兒童詩,約有30萬字,時間跨度自“五四”時期至21世紀期間百余年,其中既有著名詩人的詩作,也有一線語文教師和兒童的詩作,其中還有部分被收錄進小學(xué)語文課本,盡量保證語料覆蓋度廣、代表性強、流通度高。本文將紙質(zhì)書籍掃描成電子文本,并進行人工清洗,用TXT格式存儲。

年代分期為本文奠定了深入探討詩歌語言與社會、文化、歷史關(guān)系的基礎(chǔ),幫助我們更清晰地識別和分析各個時期兒童詩的特點、流派、主題。那么如何合理地設(shè)置語料庫的年代字段呢?杜傳坤在《中國現(xiàn)代兒童文學(xué)史論》中梳理了現(xiàn)代中國兒童詩的發(fā)展脈絡(luò)。晚清民初的學(xué)堂樂歌可看作兒童詩的前身,主張功利的“精神教育”,被視作“簡化的成人文學(xué)”。“五四”時期的兒童詩創(chuàng)作不再將兒童視為成人的附庸,“兒童本位”意識初顯。20世紀三四十年代,抗戰(zhàn)救國的社會理想輻射到兒童詩陣地。譚旭東在《重繪中國兒童文學(xué)地圖》中論述了當代兒童詩的發(fā)展情況:20世紀50年代—70年代,兒童詩中常見“紅色意象”或“暖色意象”,大都表現(xiàn)出社會公有制背景下的集體主義精神和對時代的歌頌與贊美。到了個體經(jīng)濟發(fā)展的20世紀80年代,兒童詩不再是宣言和頌歌式的創(chuàng)作,審美、題材和意象開始呈現(xiàn)多元、個性、自我傾向,再次回歸到兒童本身,真正從兒童的視角抒發(fā)真情、親近自然、放飛想象。20世紀90年代的兒童詩服務(wù)于市場經(jīng)濟,創(chuàng)作受制于出版商的意圖,處于一個小低谷的過渡時期。[11]21世紀以來兒童詩再次煥發(fā)出生機與活力,老中青三代作家同臺,詩作各具特色[12],作品數(shù)量井噴式增長,不僅有著現(xiàn)代性的豐富意象,還運用通感等手法使語言陌生化,從而帶來獨特的審美感受。綜上,本文認為應(yīng)在年代上設(shè)計“‘五四’時期至20世紀20年代、20世紀三四十年代、20世紀50年代—70年代、20世紀八九十年代、21世紀”5個字段。語料沒有明確年代的詩作,本文認為可利用智能問答系統(tǒng)kimi聯(lián)網(wǎng)搜索和長文總結(jié)功能,參考詩人生平事跡、訪談及原選集的出版時間等來確認其年代歸屬,仍無法確認的可歸為“其他”字段。

詩歌是人工語言,體現(xiàn)詩人的個人創(chuàng)造力,高頻意象可以揭示詩人的寫作風格,反映詩人習(xí)慣或傾向于聚焦一定的抒情客體。朱自強在《朱自強學(xué)術(shù)文集5:中國兒童文學(xué)史論》中選取了幾位風格獨特的兒童詩人詩作進行定性分析,就顯示出一些詩人在某一階段對特定意象的青睞。[13]如金波的《小鹿》等抒情童詩作品里富含“春天”意象,徐魯在《山村母校》《晚秋的溫情》等作品中常用“鄉(xiāng)村”意象。當然,如果某類意象被大量詩人使用,也說明這種抒情客體可以喚起一定程度的集體共鳴。本文認為通過構(gòu)建語料庫,可以大范圍地量化考察詩人用詞尤其是意象的情況,因此根據(jù)研究目標需設(shè)置作者字段和意象字段。

在詞匯層面,為了考察不同年代兒童詩的用詞情況,還應(yīng)設(shè)置高頻詞(停用詞)、詞匯豐富度、詞匯密度、特色語言形式如疊詞的詞類等字段。詞匯豐富度的計算公式是:類符數(shù)/形符數(shù)×100%,反映語料的詞匯量和用詞的變化性;詞匯密度的計算公式是:實詞數(shù)/詞匯總數(shù)×100%,反映語料的信息量,也能側(cè)面體現(xiàn)出語料的形式化程度。為了避免不同年代文本量的區(qū)別導(dǎo)致的結(jié)果誤差,需要進行標準化計算。

(三)語料庫的加工標注

每首詩分為4個層次。最大的層次是“詩”(verse),其次是“標題”(title)和“作者”(author),作者名字(包括筆名)不劃分姓和名,統(tǒng)一標注為“/nr”,再次是“詩節(jié)”(stanza)。加工標注主要以中國國家標準《GB13715—信息處理用現(xiàn)代漢語分詞規(guī)范》和《北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范》標記集為準繩,使用NLPIR進行分詞和詞性標注并主要針對歧義詞、未登錄詞的分詞或標注錯誤進行人工清洗。

兒童詩作為現(xiàn)當代詩歌的一個分支,在一定程度上有機繼承了中國傳統(tǒng)詩詞意象的一些語言形式,如《大歷詩風》中所歸納的數(shù)字精確化、形容詞和動詞的修飾、方位詞的運用,從數(shù)量、性狀、位置三方面促成了意象的具體性。自然景觀的白描是一個重要主題,現(xiàn)當代詩歌不受字數(shù)限制的特點使這些描寫在形式和內(nèi)容上都更加豐富多樣,還常常使用色彩詞、疊詞等。另外,時間意象的空間化、通感、意象的跳躍、虛化(即淡化實體的存在,以聲、色、味來體現(xiàn))也都能在現(xiàn)當代的兒童詩中窺得蹤跡。[14]因此意象單位不宜簡單等同于名詞單位,而應(yīng)看作一種“合成空間”[15],人工在標注時需遵從詞組本位原則,保留如名詞、形容詞、數(shù)量詞、動詞等必要的有意義的修飾詞。

意象作為審美體驗的產(chǎn)物,是一種心理現(xiàn)象。陸儉明假設(shè)意象的形成過程為:先通過感官感知客觀世界的某一個方面,其所感知在人的認知域里形成意象[16],即意象的形成經(jīng)歷了“感知—動情判斷—創(chuàng)構(gòu)”的過程。從“感覺基礎(chǔ)”和“意象的狀態(tài)”角度,意象的類型有視象、聲象、嗅象、味象、觸象,形成意象的感知覺是設(shè)定標注體系的有效抓手。本文建議在前人分類的基礎(chǔ)上增加“動象”標注,原因在于形象思維是兒童詩的顯著特點,動作作為形象刻畫的有機組成部分,能更細膩地傳達人物情感,增強詩歌互動性。本文以分詞和詞性標注語料為基礎(chǔ),“視象、聲象、嗅象、味象、觸象、動象”分別用“[]shi”“[]sheng”“[]xiu”“[]wei”“[]chu”“[]dong”標注在意象詞之后。因為意象具有多層性,有的意象除字面義外還有深層義,有深層義的意象在意象類別標簽后用“{}”符號進行標注,“{}”符號內(nèi)填入對應(yīng)的深層義。編寫Python腳本調(diào)用知網(wǎng)(HowNet)體系可以統(tǒng)計意象的義類組合、意象型、用例、內(nèi)部的語言結(jié)構(gòu)及其在不同年代和不同詩人詩作中的分布、頻率等。

三、結(jié)語

過往的中國兒童詩研究主要聚焦專人專詩的詞匯、句式、韻律等層面,其中在詞匯層面上,意象作為核心組成部分也受到了較多關(guān)注。在傳統(tǒng)研究范式下,研究者們利用文本分析、歷史考證和文化解讀等方法來討論意象。隨著“五四”時期以來海量兒童詩的文本積累和學(xué)界對于兒童詩史投入越來越多的關(guān)注,僅憑目前的研究手段已經(jīng)較難再出新的成果。

參考前人的成功實踐,兒童詩語料庫作為“遠距離閱讀”的數(shù)字載體存儲了1千余首兒童詩,覆蓋了“五四”時期至21世紀期間的百余年的主要詩作。本文基于前人對兒童詩分期的研究結(jié)果,將年代字段設(shè)置為“五四”時期至20世紀20年代、20世紀三四十年代、20世紀50年代—70年代、20世紀八九十年代、21世紀共5個歷史時期,以期反映不同政治社會背景與主流意識形態(tài)下語言面貌的變化。詞匯層面上,本文認為可以設(shè)置高頻詞、詞匯豐富度、詞匯密度、疊詞的詞類等多種字段,以反映一定規(guī)模的用詞情況;與此同時,以感覺、知覺為抓手標注意象字段,分為視象、聲象、嗅象、味象、觸象、動象,標注時需以詞組本位為原則保留語義的完整性,調(diào)用知網(wǎng)體系挖掘語義知識。

總之,該語料庫可用于詞匯計量研究并輔助制定兒童詩分級閱讀清單,統(tǒng)計意象義類組合、意象型、用例、內(nèi)部語言結(jié)構(gòu)等以及其在不同年代和不同詩人詩作中的分布、頻率,服務(wù)于兒童詩教。數(shù)字人文技術(shù)的蓬勃發(fā)展使我們得以借助科技的力量,高效地存儲、挖掘和分析兒童詩寶庫,這不僅為兒童詩研究提供了嶄新的視角,還能夠反哺文學(xué)知識,為兒童文學(xué)未來的發(fā)展注入新的活力。

參考文獻

[1] 湯素蘭.任溶溶兒童詩的語言藝術(shù)[J].中國文學(xué)研究,2016(1):98-102.

[2] 梁前剛.評述王宜振兒童詩的用韻藝術(shù)[J].中國圖書評論,2004(10):38-40.

[3] 彭斯遠.兒童詩的韻律化與散文化[J].重慶師院學(xué)報(哲學(xué)社會科學(xué)版),2003(1):10-13.

[4] 朱自強.兒童文學(xué)概論[M]北京:高等教育出版社,2009:183.

[5] 羅鳳珠,李元萍,曹偉政.中國古代詩詞格律自動檢索與教學(xué)系統(tǒng)[J].中文信息學(xué)報,1999(1):36-43.

[6] 畢旭.基于唐詩語料庫的意象檢索研究[D].大連:大連理工大學(xué),2006.

[7] 葛四嘉.《唐詩三百首》意象標注語料庫的構(gòu)建及統(tǒng)計分析[D].南京:南京師范大學(xué),2019.

[8] Marina Lehmann,Anne Heumann,Moniek M. Kuijpers.The ChildPoeDE Corpus: 1082 German Children’s Poems for Computational and Experimental Studies on Poetry Reception[J].Journal of Open Humanities Data,2023(1):1-6.

[9][美]弗蘭科·莫萊蒂.對世界文學(xué)的猜想[J].詩怡,譯.中國比較文學(xué),2010(2):9-20.

[10] 王小妮.給孩子們的詩[M].廣州:南方日報出版社,2014,前言1.

[11] 譚旭東.重繪中國兒童文學(xué)地圖[M].西安:西北大學(xué)出版社,2006:157-230.

[12] 湛嬌嬌,譚旭東.21世紀兒童詩創(chuàng)作整體觀察與分析[J].昆明學(xué)院學(xué)報,2023(2):124-132.

[13] 朱自強.朱自強學(xué)術(shù)文集5:中國兒童文學(xué)史論[M].南昌:二十一世紀出版社集團,2015:461-469.

[14] 蔣寅.大歷詩風[M].上海:上海古籍出版社.1992:179-206.

[15] 余渭深,董平榮.合成空間與中國古典詩詞意象[J].外語與外語教學(xué),2003(3):4-6.

[16] 陸儉明.構(gòu)式與意象圖式[J].北京大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2009(3):103-107.

猜你喜歡
兒童詩語料庫意象
撫遠意象等
教案《創(chuàng)作兒童詩》
創(chuàng)作兒童詩的有效教學(xué)策略
《語料庫翻譯文體學(xué)》評介
長了翅膀的兒童詩
如何寫兒童詩
把課文的優(yōu)美表達存進語料庫
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
“具體而微”的意象——從《廢都》中的“鞋”說起
“玉人”意象蠡測
平度市| 阳朔县| 斗六市| 厦门市| 临澧县| 沅陵县| 启东市| 乡城县| 奈曼旗| 长宁区| 肃北| 南宁市| 临泉县| 江达县| 乌拉特后旗| 翼城县| 东平县| 巩留县| 克东县| 睢宁县| 鄂托克前旗| 花垣县| 叙永县| 乐平市| 二连浩特市| 靖江市| 嵊州市| 交口县| 会宁县| 民乐县| 横峰县| 新宾| 县级市| 页游| 广水市| 张北县| 沂南县| 德庆县| 壤塘县| 时尚| 凤庆县|