○ 竇文娜 陳品
(北京建筑大學(xué) 文法學(xué)院,北京 102616)
語料庫指的是電子文本集,立足于大量的真實語料,對其通過概率統(tǒng)計的方法得出結(jié)論,進(jìn)而推廣到整個語言或是語言變體。隨著科學(xué)技術(shù)水平的高速發(fā)展,語料庫更加廣泛地應(yīng)用到現(xiàn)代外語教學(xué)當(dāng)中,逐步成為外語教師日常教學(xué)中一個強(qiáng)有力的教學(xué)手段。但是隨著學(xué)生學(xué)習(xí)需求和教師教學(xué)需求的多樣化,現(xiàn)有的大型語料庫雖能為外語教學(xué)和研究提供可靠的研究方法,但其針對性、實用性不強(qiáng)。鑒于此,各種針對特殊用途語料庫的建設(shè)研究也孕育而生。近些年,中國建筑英語也逐漸重視對專業(yè)語料庫的建立,從多維度提出了建筑工程英語語料庫的構(gòu)建標(biāo)準(zhǔn)與應(yīng)用[1]113-114[2]428-432[3]253-255。但是以往研究只關(guān)注對本族語者語料進(jìn)行研究,忽略了在中國語境下,絕大多數(shù)學(xué)生將英語作為外語的二語學(xué)術(shù)寫作這一現(xiàn)象。因此,有必要建立該領(lǐng)域?qū)W習(xí)者語料庫。筆者以非英語專業(yè)研究生為落腳點(diǎn),聚焦學(xué)生撰寫的英文專業(yè)學(xué)術(shù)論文,研究建設(shè)建筑與土木工程英語小型學(xué)習(xí)者語料庫,為提升研究生二語學(xué)術(shù)寫作能力、研究生英語教學(xué)、專業(yè)用途英語教材編寫提供幫助,進(jìn)而提高建筑與土木相關(guān)行業(yè)在國際學(xué)術(shù)研究領(lǐng)域中的話語權(quán)。
建筑與土木工程英語小型學(xué)習(xí)者語料庫建設(shè)的主要目的是服務(wù)于教學(xué)。在中國高等院校,大多數(shù)研究生培養(yǎng)目標(biāo)中都將英語作為研一的必修課程。從教師層面,擔(dān)任一線教學(xué)任務(wù)的主體教師是英語教師,與本科時的教學(xué)目標(biāo)的不同。研究生階段的英語教學(xué)要求教師在授課過程中將英語與學(xué)生所學(xué)的專業(yè)相結(jié)合,培養(yǎng)學(xué)生英語應(yīng)用的綜合能力。這樣才能更好地服務(wù)學(xué)生,滿足學(xué)生在研究生學(xué)習(xí)期間撰寫與發(fā)表英文科技論文的訴求。從學(xué)生層面,用英文撰寫學(xué)術(shù)論文的能力不僅是學(xué)生作為順利畢業(yè)的必要條件,更加體現(xiàn)研究生培養(yǎng)過程中的國際化水平。
隨著國家“一帶一路”倡議的推進(jìn)與實施,中國建筑與土木工程在國際相關(guān)行業(yè)有著舉足輕重的地位。從“中國制造”到“中國創(chuàng)造”,國家逐步在工程領(lǐng)域有了飛躍式的發(fā)展。在此過程中,國際化工程人才是企業(yè)發(fā)展的根本,是國家發(fā)展的根基。反觀國際化工程人才的培養(yǎng),最先要在高等教育方面進(jìn)行相應(yīng)的改革,以適應(yīng)時代的需要。在高等教育改革中,英語教學(xué)改革首當(dāng)其沖。有研究顯示:英語教學(xué)如果只是讓學(xué)生埋頭苦練語言基礎(chǔ), 不以服務(wù)學(xué)生的專業(yè)為主要目的,在這種情況下教出來的學(xué)生不會用英語從事自己所學(xué)的專業(yè)當(dāng)中,更不能在自己的所研究的專業(yè)領(lǐng)域內(nèi)展現(xiàn)具有國際交流的能力和較強(qiáng)的國際競爭力[4]56-60。由此可見,英語教師在助力培養(yǎng)國際化人才培養(yǎng)的過程中擔(dān)任重要角色。一線任課教師有必要改變傳統(tǒng)的教學(xué)模式,從“單一語言教學(xué)模式”到“融合專業(yè)語言應(yīng)用教學(xué)模式”進(jìn)行轉(zhuǎn)變。
“結(jié)合專業(yè)語言應(yīng)用教學(xué)”強(qiáng)調(diào)關(guān)注學(xué)生的專業(yè)領(lǐng)域,尤其是在研究生階段。從科技論文寫作的視角,教師不僅應(yīng)具備扎實的語言基本功,還要熟悉學(xué)生專業(yè)領(lǐng)域的國際學(xué)術(shù)論文寫作的基本規(guī)律和要求。 除此之外,最重要的是教師要充分了解學(xué)生在學(xué)術(shù)寫作方面存在的問題。這樣教師才能在研究生日常教學(xué)中有針對性地解決學(xué)生的實際問題,從而培養(yǎng)學(xué)生二語學(xué)術(shù)寫作的能力,實現(xiàn)有效教學(xué)。就專業(yè)領(lǐng)域的國際學(xué)術(shù)論文寫作基本特征而言,教師可以借助語料庫,進(jìn)行深入研究。在中國建筑英語方面,很多研究者提出了不同的建筑工程英語語料庫的構(gòu)建標(biāo)準(zhǔn)與應(yīng)用,吳明海通過收集建筑類出版社出版的圖書以及土木工程相關(guān)專業(yè)的論文、電子書籍等材料建立了建筑工程英語小型語料庫[2]428-432。劉佳通過掃描建筑工程類報紙、期刊等材料對數(shù)據(jù)進(jìn)行收集,進(jìn)而提出建工工程類英語語料庫構(gòu)建的標(biāo)準(zhǔn)[1]113-114。這些研究都為英語教師在教授建筑工程類英語時,了解掌握該行業(yè)的國際論文寫作,提供了有力的教學(xué)素材。
國內(nèi)多數(shù)相關(guān)研究只關(guān)注對本族語者語料進(jìn)行研究,忽略了二語學(xué)習(xí)者在寫作過程中呈現(xiàn)的特點(diǎn)。為了了解和研究學(xué)生在二語學(xué)術(shù)寫作方面所存在的問題,有必要建立建筑與土木工程英語小型學(xué)習(xí)者語料庫。首先,相比大型語料庫而言,小型語料庫更加針對二語學(xué)術(shù)寫作教學(xué)的開展,貼近學(xué)生的個性化需求,同時為學(xué)生課下自主性學(xué)習(xí)提供了有力的平臺。其次,與建筑與土木工程本族語語料庫形成對比,可以讓教師更好地了解在建筑與土木工程領(lǐng)域?qū)W生二語學(xué)術(shù)寫作現(xiàn)狀與問題,通過應(yīng)用語料庫,從而更加有效地指導(dǎo)教學(xué)。
本研究選取的語料來源于北京某市屬高校建筑與土木工程專業(yè)研究生。在系統(tǒng)學(xué)習(xí)學(xué)術(shù)英語寫作課程一個學(xué)期后,以期末論文考核的形式用英文撰寫建筑與土木工程專業(yè)領(lǐng)域的學(xué)術(shù)論文,共計120篇。其中建筑工程類論文59篇,土木工程類論文61篇,所撰寫的英文論文格式符合期刊發(fā)表的標(biāo)準(zhǔn)。
由于學(xué)生上交的英文論文格式主要有兩種Word和PDF,為了統(tǒng)一格式,便于在語料庫中進(jìn)行信息標(biāo)注和檢索,筆者將所收集的文本進(jìn)行轉(zhuǎn)換。Word格式的論文另存為記事本文本格式(.txt),使用ANSI編碼保存文本文件。PDF格式的論文通過Solid PDF Tools v9轉(zhuǎn)換成純文本格式(.txt)。所有的語料保存在一個移動硬盤上,用于后續(xù)語料的承載和更新。
在正式收錄文本之前,通過簡單隨機(jī)抽樣,先抽取少量文本進(jìn)行分析,主要檢查以下問題:文本大小、文本問題、標(biāo)點(diǎn)符號問題等[5]28。圖1是學(xué)生提交的英文論文,仔細(xì)觀察后可以發(fā)現(xiàn),文本中第三行的第四個詞cast-in-past中間有兩個連字符,應(yīng)該刪除,從而形成獨(dú)立的三個單詞。這樣處理后,在后續(xù)的統(tǒng)計計算中,可以成功檢索出cast和in或是past三個單詞,否則在后續(xù)檢索時就會出現(xiàn)問題,甚至整個檢索系統(tǒng)就會崩潰。
圖1 文本先導(dǎo)分析樣例
學(xué)生在用英語撰寫論文的時候,可能會出現(xiàn)的問題,大致可以分為三類[5]28:第一,文字符號類問題,比如在中文編輯的狀態(tài)下,輸入英文字母和數(shù)字,這使得所輸入的英文字母和數(shù)字占有兩個標(biāo)準(zhǔn)的字符,呈現(xiàn)“全角”狀態(tài),這就需要研究者將其進(jìn)行修改,確保所有的英文字母和數(shù)字處在“半角”狀態(tài)下進(jìn)行輸入。第二,格式類問題,指的是在段落的首尾,或是一行的首尾存在半角或是全角空格,跳格(Tab字符)或者是濫用軟回車。第三,標(biāo)點(diǎn)符號類問題,指的是在“全角”狀態(tài)下或是中文模式狀態(tài)下,輸入的標(biāo)點(diǎn)符號。
以上這些問題如果得不到及時的處理,都會導(dǎo)致在后續(xù)的文本標(biāo)注和檢索出現(xiàn)錯誤,統(tǒng)計出來的數(shù)據(jù)不真實。由于人工糾正錯誤費(fèi)時費(fèi)力,可以借助現(xiàn)有的軟件對原始文本進(jìn)行整理和清潔。本研究采用“文本整理器”5.0綠色版軟件對原始收集的數(shù)據(jù)進(jìn)行批量整理,見圖2。
圖2 文本整體前樣例
如圖2所示,文本整理前,在段首有跳格,第一行的T 是“全角”,前三行行尾有多余回車,第二行R后面的標(biāo)點(diǎn)符號是“全角”,第三行后面的標(biāo)點(diǎn)符號是“全角”。通過“文本整理器”,將原文本中的所有字母和符號修改成“半角”格式,同時去除段首的跳格,整理結(jié)果見圖3。
文本加工包括元信息標(biāo)注、分詞和詞性賦碼,這三個步驟是文本處理的核心步驟,為基于該語料庫的后續(xù)研究提供相應(yīng)的數(shù)據(jù)支持。
1.元信息標(biāo)注。元信息就是文本自身的信息,也是本文附加的說明。筆者對120篇英文論文進(jìn)行文獻(xiàn)信息說明,包括作者、時間、標(biāo)題、專業(yè)等。
2.分詞。如圖4所示,第一行“逗號”和“it”之間沒有空格,語料庫分析工具就會將“system,it”視為一個詞。第三行“句號”和“at”也是同樣錯誤,諸如此類的錯誤在圖4中有多次。如果不進(jìn)行分詞處理,在后續(xù)檢索過程中,將無法檢索出相應(yīng)的單詞,甚至造成自動標(biāo)注的失敗。因此,筆者運(yùn)用梁茂成設(shè)計的英語自動分詞程序“Tokenizer”對文本進(jìn)行分詞處理,處理后的結(jié)果如圖5所示。
圖4 未分詞文本
圖5 自動分詞后文本
3.詞性賦碼。詞性賦碼指的是可以利用現(xiàn)有的計算機(jī)技術(shù),對文本中所有的詞進(jìn)行詞性標(biāo)注的過程。詞性賦碼后的文本可以便于研究者對文本中詞匯使用特征或是語法結(jié)構(gòu)進(jìn)行更為深入的研究。筆者利用德國斯圖加特大學(xué)計算機(jī)語言學(xué)研究所Helmut Schmid設(shè)計研發(fā)的TreeTagger,對文本進(jìn)行詞性自動賦碼。根據(jù)程序設(shè)計者所提供的研究報告,使用該賦碼器對英文文獻(xiàn)進(jìn)行賦碼,準(zhǔn)確率高達(dá)97%。
Granger 指出,學(xué)習(xí)者語料庫的建立是為研究學(xué)習(xí)者語言特征和使用提供客觀真實的語言數(shù)據(jù),基于這些數(shù)據(jù), 研究者可以進(jìn)行語言學(xué)相關(guān)理論研究和語言教學(xué)研究。[6]本語料庫的建立的主要目的是服務(wù)教學(xué),為英語教師日常教學(xué)和科研提供有力輔助工具。與此同時,在有效提高學(xué)生二語學(xué)術(shù)寫作能力的同時,讓學(xué)生成為學(xué)習(xí)的主體,培養(yǎng)學(xué)生自主學(xué)習(xí)的能力,從而有效地改善學(xué)習(xí)效果。
教師可通過該語料庫研究二語學(xué)習(xí)者在建筑與土木工程領(lǐng)域的學(xué)術(shù)寫作特征,分析學(xué)生寫作過程中出現(xiàn)的問題。尤其在詞匯、句式和語法層面。建筑與土木工程英語小型學(xué)習(xí)者語料庫可幫助教師更加清晰地梳理學(xué)生在以上方面的使用特征。這些研究直接反作用于教學(xué),教師更加明確語言學(xué)習(xí)者的學(xué)習(xí)需求,有針對地組織教學(xué),明確教學(xué)目的的同時,提高教學(xué)效率。教師不但可以研究局部學(xué)習(xí)組群整體的語言特征,而且能夠觀察分析獨(dú)立的學(xué)習(xí)者個體的語言發(fā)展,從而建立一種更科學(xué)、更客觀的全新教學(xué)信息反饋模式[7]72-77。
運(yùn)用語料庫語言學(xué)研究方法,教師可根據(jù)該語料庫中所呈現(xiàn)的二語學(xué)術(shù)寫作的特征或是問題,深挖素材,分析二語學(xué)術(shù)寫作特征表象背后的成因,尋找能解決學(xué)生在寫作過程出現(xiàn)問題的有效方法。從理論探討到應(yīng)用實踐,教師可以將科研的成果應(yīng)用到教學(xué)中去,或是通過教學(xué)實踐活動,佐證理論的建立。以該語料庫為研究基礎(chǔ),教學(xué)助力科研,科研反哺教學(xué),讓教師在二語學(xué)術(shù)寫作的科研和教學(xué)方面得到雙提升,從而更好地服務(wù)學(xué)生。
Nesselhauf 在研究中指出,基于語料庫的學(xué)習(xí)對于解決學(xué)習(xí)者在學(xué)習(xí)過程中遇到的實際問題和困難非常有用,尤其是有助于學(xué)生在課堂上學(xué)習(xí)過但是還沒有完全掌握的語言知識。鑒于上課時間的有限性,學(xué)生可以在課下自主時間,合理的運(yùn)用建筑與土木工程英語小型學(xué)習(xí)者語料庫。可以讓相關(guān)專業(yè)的學(xué)生通過對比學(xué)習(xí)者語料庫和本族語者語料庫,觀察分析數(shù)據(jù),發(fā)現(xiàn)問題,形成改進(jìn)的策略,從而讓學(xué)生成功真正的學(xué)習(xí)中心。同時,在學(xué)習(xí)者語料庫的幫助下,他們可以通過辨別和解釋自己語言輸出中的語言錯誤,從而達(dá)到掌握正確的語言知識的目的[8]104。從被動接受來自教師的問題反饋,轉(zhuǎn)變成主動發(fā)現(xiàn)問題解決問題,為培養(yǎng)和提高學(xué)生學(xué)習(xí)的自主性提供了有力的平臺。
中國的學(xué)生英語學(xué)習(xí)往往注重詞匯、語法以及閱讀這些最基本的語言能力要求,但忽視了英語學(xué)習(xí)中的中西方文化差異、語言習(xí)慣和思維方式[9]140-142。尤其是在研究生階段,這些能力的培養(yǎng)與鍛煉顯得尤為重要。所以學(xué)生應(yīng)該在日常英語學(xué)習(xí)中,擺正學(xué)習(xí)的態(tài)度,明確學(xué)習(xí)的目標(biāo),在提升語言基本技能的基礎(chǔ)上,更加注重鍛煉高層次語言技能。蔡基剛指出:很少帶著批判性思維去閱讀,久而久之,造成了批判性思維能力差的后果,反映在學(xué)術(shù)寫作中,就是創(chuàng)造性思維少[4]56-60。充分利用建筑與土木工程小型語料庫,學(xué)生以批判的眼光和視角審視自己的學(xué)術(shù)論文,找尋其中的優(yōu)點(diǎn)與缺點(diǎn),培養(yǎng)學(xué)生在二語學(xué)術(shù)寫作上的創(chuàng)造力,進(jìn)而提升學(xué)生的科研能力。
本研究通過自建建筑與土木工程英語小型學(xué)習(xí)者語料庫,詳盡闡述了建庫的目的和語料庫文本的處理過程。以服務(wù)教學(xué)的視角,從教師和學(xué)生兩個方面,分別論述了學(xué)習(xí)者語料庫在外語教學(xué)過程中的應(yīng)用,為建筑與土木相關(guān)專業(yè)學(xué)生的二語學(xué)術(shù)寫作能力的提升提供有力的輔助工具。該語料庫隨著學(xué)生的個性化需求以及教師的教學(xué)改革,還需要繼續(xù)充實和完善。首先,今后的研究可以細(xì)分不同的專業(yè)方向,便于對比發(fā)現(xiàn)不同專業(yè)方向?qū)W習(xí)者二語學(xué)術(shù)寫作特征,結(jié)合定量研究方法,進(jìn)行科學(xué)的系統(tǒng)性研究。其次,教師作為教學(xué)的主要行動者,可以根據(jù)自己的實際教學(xué)情況,在共時和歷時兩個維度建立小型的個性化語料庫,從而發(fā)揮語料庫的長效機(jī)制。最后,發(fā)展建筑與土木工程專業(yè)平行語料庫,豐富現(xiàn)有的數(shù)據(jù)資源,為更加深入的研究提供數(shù)據(jù)支持。