摘 要:機(jī)關(guān)文書語料庫是實(shí)用文寫作教學(xué)進(jìn)行運(yùn)思訓(xùn)練和語體訓(xùn)練的教學(xué)資源庫,也是信息化時(shí)代實(shí)用文寫作者自主學(xué)習(xí)的基礎(chǔ)支撐。目前,語料庫的技術(shù)和理論使機(jī)關(guān)文書語料庫的建設(shè)和應(yīng)用成為可能。
關(guān)鍵詞:機(jī)關(guān)文書語料庫 運(yùn)思 實(shí)用文語體
建設(shè)機(jī)關(guān)文書語料庫,是筆者基于多年實(shí)用文教學(xué)的感悟而提出來的。回顧實(shí)用文寫作教學(xué)的發(fā)展歷程,從“知識(shí)—例文—練習(xí)”這一傳統(tǒng)的教學(xué)思路到情景教學(xué),再到重視運(yùn)思訓(xùn)練和語體訓(xùn)練的一路變革,許多從事實(shí)用文教學(xué)的教師都做了不懈的努力。就教學(xué)對(duì)象——已具備一定語文基礎(chǔ)的高校學(xué)生而言,對(duì)其進(jìn)行實(shí)用文運(yùn)思訓(xùn)練和語體訓(xùn)練是提升其實(shí)用文寫作能力的有效途徑。然而,現(xiàn)實(shí)殘酷,依據(jù)筆者對(duì)部分高校(包括高職)公文寫作教學(xué)的調(diào)研,采用這種方法的寫作教學(xué)仍然無法擺脫教學(xué)過程枯燥和教學(xué)效果式微的尷尬處境。為什么被公認(rèn)的有效的教學(xué)方法,卻無法成為“利器”?是實(shí)用文語體教學(xué)的缺省或偏誤是造成這種現(xiàn)象的主要緣由?,F(xiàn)階段部分教師將實(shí)用文語體教學(xué)作為實(shí)用文寫作基礎(chǔ)知識(shí)的一部分,講解多停留在語體知識(shí)的傳授上;也有教師把它作為文種的“語言要求”泛泛而談,缺乏實(shí)質(zhì)性、針對(duì)性的訓(xùn)練。應(yīng)當(dāng)承認(rèn),這種狀況并非是教學(xué)對(duì)實(shí)用文語體的忽視,而是源于我們對(duì)實(shí)用文語體的模糊認(rèn)知。截至目前,我們還沒有對(duì)實(shí)用文語體進(jìn)行量化式的分析、總結(jié),對(duì)實(shí)用文語體域場的依存性、表達(dá)的選擇性、語階的級(jí)差性和風(fēng)格的伴隨性往往也是以個(gè)案的方式去講解和理解,沒能從宏觀的范疇中解讀。解決這些問題,真正實(shí)現(xiàn)實(shí)用文寫作教學(xué)的有效性,我們認(rèn)為有必要建設(shè)機(jī)關(guān)文書語料庫。
一、機(jī)關(guān)文書語料庫的功能和作用
(一)語料庫及其作用
語料庫(Corpus)是指應(yīng)用計(jì)算機(jī)技術(shù)對(duì)海量自然語言材料進(jìn)行處理、存儲(chǔ)以供自動(dòng)檢索、索引以及統(tǒng)計(jì)分析的大型資料庫。語料庫不僅僅是原始語料的集合,而且是有結(jié)構(gòu)的,是標(biāo)注了語法、語義、語音、語用等語言信息的語料的集合,這是語料庫區(qū)別于一般的文本數(shù)據(jù)庫的重要標(biāo)志。迄今為止,我國已建成并投入使用的語料庫多達(dá)上百個(gè),涵蓋多個(gè)類型和多方應(yīng)用目標(biāo)。如現(xiàn)代漢語通用語料庫、《人民日?qǐng)?bào)》標(biāo)注語料庫等。這些大型語料庫的建立為我國運(yùn)用語料庫開展各種學(xué)術(shù)研究提供了寶貴的數(shù)據(jù)源。
語料庫發(fā)展之初,其用途主要體現(xiàn)在對(duì)語言現(xiàn)象以及語言本質(zhì)的研究上,如語言頻率統(tǒng)計(jì)、詞典編撰、詞匯搭配研究和自然語言處理等方面。隨著語料庫技術(shù)的發(fā)展,其功能和作用也躍出了語言學(xué)范疇,在其他領(lǐng)域如英語寫作教學(xué)等方面的應(yīng)用也越來越廣。薛學(xué)彥(2004)在《語料庫與基礎(chǔ)英語教育》一文中就指出:語料庫不僅可為字典編撰提供可靠的依據(jù)、為教材編寫和大綱制定提供參照,還可為課件開發(fā)提供動(dòng)態(tài)數(shù)據(jù),為英語外語教學(xué)誤用分析提供支撐等。
(二)機(jī)關(guān)文書語料庫的構(gòu)建
構(gòu)建機(jī)關(guān)文書語料庫,就是以機(jī)關(guān)文書為樣本構(gòu)建語料庫,以樣本中的特殊詞語、常用句型、句式、修辭為研究對(duì)象,借助語料庫語言學(xué)的理論方法,對(duì)研究對(duì)象進(jìn)行定量的統(tǒng)計(jì)、分析,系統(tǒng)地研究機(jī)關(guān)文書的語言運(yùn)用特點(diǎn),以期從語言學(xué)角度解讀機(jī)關(guān)文書的寫作技巧。樣本機(jī)關(guān)文書以文件規(guī)定公文(行政機(jī)關(guān)公文、中國共產(chǎn)黨黨的機(jī)關(guān)公文、軍隊(duì)公文)和常用行政事務(wù)文書為范圍。
機(jī)關(guān)文書語料庫又可依據(jù)內(nèi)容建立公文語料庫、事務(wù)文書語料庫兩個(gè)子庫。由于公文涉及到級(jí)別權(quán)限,因而在語料搜集、整理的過程中,應(yīng)以國務(wù)院、省、地區(qū)三級(jí)單位某時(shí)段的公文為語料來源,規(guī)避涉密文件、行業(yè)文件。事務(wù)文書的語料搜集應(yīng)注重體裁、題材的廣泛性和內(nèi)容表達(dá)的成效性。
從學(xué)習(xí)寫作的角度運(yùn)用機(jī)關(guān)文書語料庫主要是通過分析語料,考察機(jī)關(guān)文書中的詞語運(yùn)用情況,句型、句式及修辭的運(yùn)用特點(diǎn)和表達(dá)效果。這樣,逐漸實(shí)證性地彰顯出實(shí)用文語體的特征及其學(xué)習(xí)掌握的要素。
一些學(xué)者近幾年一直致力于這方面的研究探索。張海龍(2008)的碩士學(xué)位論文就是以“行政公文寫作數(shù)據(jù)庫”為研究對(duì)象的。李忠朋、柳新華(2009)在《秘書之友》中也談到公文語料庫建設(shè)的問題。目前,柳新華、邵建國等學(xué)者致力于建設(shè)公文文獻(xiàn)數(shù)據(jù)庫,并通過這個(gè)語料庫開始進(jìn)入到對(duì)公文語言的微觀分析,如分析講話稿中的修辭以及公文中的句子等。
二、機(jī)關(guān)文書語料庫的功能
(一)機(jī)關(guān)文書語料庫使教師微觀把握教學(xué)內(nèi)容成為可能
目前對(duì)實(shí)用文語體特征的闡述多數(shù)全憑直覺。實(shí)際上,我們對(duì)實(shí)用文語言的“準(zhǔn)確、莊重、簡潔、規(guī)范”缺少量化的清晰認(rèn)知。到底哪些要素可使實(shí)用文語言更加準(zhǔn)確?哪些語言要素的運(yùn)用會(huì)使文章更莊重?哪些要素使表達(dá)更簡潔?哪些更規(guī)范?什么樣的語境需要什么樣的語音、詞語、句式、辭式?和語言學(xué)語料庫關(guān)注點(diǎn)不同的是,寫作角度的語料庫分析需要考察語言各要素之間的配合和整體表達(dá)效果,需要考察語境類型的制約。寫作教學(xué)一直是汪洋中的一條船,不知四周的真實(shí)面容。語料庫為其提供了新的視角和思路,借助計(jì)算機(jī)技術(shù),以海量的語言事實(shí)為研究對(duì)象,對(duì)其進(jìn)行言語行為分析,從中可以找出語言運(yùn)用的規(guī)律。而這恰是我們寫作教學(xué)多年來無法解決的詬病。由于語料庫可以統(tǒng)計(jì)詞頻、對(duì)比詞語搭配、追蹤新詞新語等等,這些功能促使教師不再單純地從鑒賞的角度關(guān)注范文。此外,詞語搭配研究將展現(xiàn)言語使用是否規(guī)范。大容量語料庫的問世為詞語搭配研究提供了客觀的量化分析依據(jù),使之更科學(xué)。教師在這個(gè)過程中得以梳理教學(xué)內(nèi)容。
(二)機(jī)關(guān)文書語料庫使寫作教師改變教學(xué)方法成為可能
前文已述,實(shí)用文寫作教師的教學(xué)方法多已由例文賞析式轉(zhuǎn)變?yōu)橐哉Z體、運(yùn)思的訓(xùn)練為主,但是教學(xué)效果依然不理想的現(xiàn)實(shí)促使我們進(jìn)行深層次思考。其中,語體訓(xùn)練的舉例式方法恐怕是教學(xué)中不能達(dá)到舉一反三效果的主要緣由。語料庫將使“實(shí)用文語體”的直觀性、量化性得以實(shí)現(xiàn),使實(shí)用文語體的整體面貌得以呈現(xiàn),從而使語體訓(xùn)練具備了較強(qiáng)的操作性。
(三)機(jī)關(guān)文書語料庫為學(xué)生提供自主式學(xué)習(xí)的可能
語料庫不僅惠及教師,學(xué)生也可以利用語料庫實(shí)現(xiàn)高效的自主式學(xué)習(xí)。
語料庫使學(xué)生真正進(jìn)入實(shí)用文的微觀世界。通過語料庫,學(xué)生可以自主提取人們一般審美認(rèn)知中較能接受的表達(dá);可以賞析到內(nèi)容相同而表現(xiàn)方法不同的寫作技巧;可以借助語料庫構(gòu)建學(xué)生大腦中的“語料”。
三、機(jī)關(guān)文書語料庫的建設(shè)
機(jī)關(guān)文書語料庫構(gòu)建的基本步驟為:規(guī)劃、語料采集、語料輸入計(jì)算機(jī)、校對(duì)、標(biāo)注、賦碼、入庫。
(一)規(guī)劃和采集階段
語料庫的規(guī)劃階段首先要進(jìn)行語料庫建設(shè)的必要性和可行性分析。語料庫中語料的采集并不是語言材料的簡單堆砌,而應(yīng)該充分考慮材料的代表性和平衡性。為了使語料庫具有代表性,語料庫的選材結(jié)構(gòu)就要具有平衡性。所謂平衡,不是指各種類型的語料在語料庫中占有相同的比例,而是指語料庫中各種類型的語料比例恰當(dāng),能代表它們對(duì)現(xiàn)實(shí)語言生活的影響。比如要考慮到公文文種類型、公文發(fā)文機(jī)關(guān)級(jí)別、公文文種使用頻度、事務(wù)文書的典型性等。理想的情況是,這種比例能和每種類型的語言對(duì)實(shí)際語言生活的影響因子相一致。為了追求這個(gè)目標(biāo),在機(jī)關(guān)文書語料庫選材時(shí)要預(yù)先設(shè)計(jì)分類指標(biāo),科學(xué)地確定每種類型的語料在語料庫中的比例。就公文而言,其語體文本的采集首先應(yīng)按照行文方向分類選取。
(二)標(biāo)注階段
語料庫同紙質(zhì)材料最大不同點(diǎn)的一個(gè)重要標(biāo)志是機(jī)器可讀。為了充分發(fā)揮計(jì)算機(jī)運(yùn)算速度快、計(jì)算能力強(qiáng)的特點(diǎn),必須預(yù)先對(duì)語料庫進(jìn)行標(biāo)注。語料庫標(biāo)注的過程是一個(gè)語言知識(shí)形式化的過程。語料庫的標(biāo)注質(zhì)量以及標(biāo)注深度直接影響到可從語料庫中發(fā)掘的信息的豐富性、準(zhǔn)確性,決定了語料庫的可利用性和利用價(jià)值。機(jī)關(guān)文書語料庫的標(biāo)注應(yīng)該包括詞性的標(biāo)注、語義的標(biāo)注、句法結(jié)構(gòu)的標(biāo)注、篇章結(jié)構(gòu)的標(biāo)注等。何婷婷博士(2003)曾經(jīng)結(jié)合Leech的結(jié)論提出了標(biāo)注的6項(xiàng)原則:1.原始語料和標(biāo)記符號(hào)的數(shù)據(jù)獨(dú)立性原則;2.語料標(biāo)注的公開性原則;3.語料標(biāo)注的通用性原則;4.語料標(biāo)注的折衷性原則;5.語料標(biāo)注的一致性原則;6.標(biāo)注符號(hào)的確定性原則。未經(jīng)標(biāo)注、沒有做任何處理的電子文本語料庫被稱為生語料庫,其應(yīng)用價(jià)值非常有限。基于機(jī)關(guān)文書語料庫的寫作指導(dǎo)性,語料庫需要人工標(biāo)注句型、句式、修辭格等信息。
(三)檢索軟件的選擇與開發(fā)
語料庫檢索軟件很多,較成功的共享軟件有Wordsmith Tool v4、Concordance v3、Monoconcord以及WordCrucher等,自由軟件有Microconcord、Tact 2.1(基于DOS平臺(tái))、Wconcord等。在語料庫建設(shè)的初級(jí)階段應(yīng)根據(jù)需要使用現(xiàn)有的語料庫檢索軟件。但是,這些現(xiàn)有的檢索軟件不是萬能的,有可能不完全適用于實(shí)用文語體研究。在研究的過程中開發(fā)出適合于寫作學(xué)習(xí)的檢索軟件是語料庫研究的又一貢獻(xiàn)。
總而言之,機(jī)關(guān)文書語料庫的建設(shè),是一個(gè)集計(jì)算機(jī)技術(shù)、實(shí)用文寫作、社會(huì)語言學(xué)于一體的開發(fā)研究項(xiàng)目,涉及許多專業(yè)技術(shù),同時(shí)還需要各專業(yè)的有效配合。
參考文獻(xiàn):
[1]薛學(xué)彥.語料庫與基礎(chǔ)英語教育[J].山東師范大學(xué)外國語學(xué)院學(xué)
報(bào)(基礎(chǔ)英語教育),2004,(4).
[2]何婷婷.語料庫研究[D].武漢:華中師范大學(xué)博士論文,2003.
[3]李忠朋,柳新華.公文語料庫建設(shè)淺談[J].秘書工作,2009,
(3).
[4]邵建國.基于語料庫的公文句式淺析[J].語文學(xué)刊,2009,
(12).
[5]丁善信.語料庫語言學(xué)的發(fā)展及研究現(xiàn)狀[J].當(dāng)代語言學(xué),
1998,(1).
[6]馮志偉.數(shù)理語言學(xué)[M].北京:知識(shí)出版社,1985.
[7]馮志偉.自然語言的計(jì)算機(jī)處理[M].上海:上海外語教育出版
社,1996.
[8]陳明瑤.語料庫與詞匯學(xué)研究[J].寧波大學(xué)學(xué)報(bào)(人文科學(xué)
版),2000,(1).
(王雪梅 河北廊坊 中國人民武裝警察部隊(duì)學(xué)院基礎(chǔ)部 065000)