国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)料庫(kù)微型文本在英語(yǔ)語(yǔ)言測(cè)試材料編寫(xiě)中的應(yīng)用

2013-09-07 05:32:36
關(guān)鍵詞:表達(dá)式外語(yǔ)教學(xué)語(yǔ)料

梁 波

(廣東藥學(xué)院 外國(guó)語(yǔ)學(xué)院,廣東廣州 510006)

在外語(yǔ)教學(xué)和研究領(lǐng)域中,新興的語(yǔ)料庫(kù)技術(shù)受到越來(lái)越多的重視。語(yǔ)料庫(kù)(Corpus)作為語(yǔ)言資料庫(kù),收集了大量的語(yǔ)言信息,為研究者提供了一個(gè)分析、研究、描述和應(yīng)用語(yǔ)言的載體。語(yǔ)料庫(kù)是在隨機(jī)采樣的基礎(chǔ)上廣泛收集人們實(shí)際使用、有代表性的真實(shí)語(yǔ)言材料而創(chuàng)建的。通過(guò)借助宏大的計(jì)算機(jī)數(shù)據(jù)庫(kù),語(yǔ)料庫(kù)為編寫(xiě)詞典、語(yǔ)法及各種教材提供了重要的語(yǔ)料資源,并為英語(yǔ)語(yǔ)言研究提供了新的途徑。

語(yǔ)料庫(kù)的突出特點(diǎn)是庫(kù)中所包含的語(yǔ)言真實(shí)、數(shù)據(jù)龐大,在大型通用語(yǔ)料庫(kù)中,各種語(yǔ)言現(xiàn)象應(yīng)有盡有。同時(shí),語(yǔ)料庫(kù)在語(yǔ)言測(cè)試試題的編寫(xiě)方面具有廣闊的應(yīng)用前景。Leech【1】曾指出,由于正確的答案就在語(yǔ)料庫(kù)之中,利用語(yǔ)料庫(kù)自動(dòng)編寫(xiě)語(yǔ)言測(cè)試題應(yīng)該是十分可行的。然而,盡管計(jì)算機(jī)軟硬件飛速發(fā)展,對(duì)大型語(yǔ)料庫(kù)進(jìn)行復(fù)雜的檢索并不需要耗費(fèi)很長(zhǎng)時(shí)間,但教學(xué)的各個(gè)不同階段均有比較明確的目標(biāo),理應(yīng)根據(jù)不同需要量體裁衣,在實(shí)際的外語(yǔ)教學(xué)中使用不同難度、適用于不同場(chǎng)合的語(yǔ)言素材,而大型語(yǔ)料庫(kù)數(shù)據(jù)的龐雜性使得外語(yǔ)教學(xué)工作者很難在短時(shí)間內(nèi)有效地從海量語(yǔ)料庫(kù)中獲取合適的語(yǔ)言素材【2】。

為此,借鑒Sinclair【3】【4】【5】關(guān)于分析索引行的做法以及梁茂成、李文中和許家金在《語(yǔ)料庫(kù)應(yīng)用教程》一書(shū)中提出的關(guān)于微型文本的概念,本文以編制英語(yǔ)語(yǔ)法單項(xiàng)選擇題為例,探討如何通過(guò)語(yǔ)料庫(kù)應(yīng)用軟件PowerGREP,從語(yǔ)料庫(kù)中抽取適當(dāng)數(shù)量的索引行,創(chuàng)建微型文本,建設(shè)英語(yǔ)語(yǔ)言測(cè)試材料編寫(xiě)素材。

1 微型文本的創(chuàng)建

1.1 語(yǔ)料庫(kù)和軟件準(zhǔn)備

考慮到語(yǔ)料庫(kù)的容量,本文的示范語(yǔ)料選取自英國(guó)國(guó)家語(yǔ)料庫(kù)(British National Corpus,BNC)。該語(yǔ)料庫(kù)含有9000萬(wàn)詞次的書(shū)面語(yǔ)和1000萬(wàn)詞次的口頭語(yǔ)語(yǔ)料,語(yǔ)料選取余地較大。完成微型文本中文本處理步驟的軟件工具為PowerGREP,該 軟 件 可 從 網(wǎng) 頁(yè) http://www.powergrep.com上下載。一般對(duì)于自建的專(zhuān)業(yè)用途語(yǔ)料庫(kù)或利用網(wǎng)絡(luò)資源建立的語(yǔ)料庫(kù),在最初的文本清潔過(guò)程中需要進(jìn)行簡(jiǎn)單的分句處理,軟件PowerGREP可實(shí)現(xiàn)該步驟的操作,通過(guò)替換功能實(shí)現(xiàn)簡(jiǎn)單的分句,但由于本文的語(yǔ)料來(lái)源于BNC大型語(yǔ)料庫(kù),入庫(kù)語(yǔ)料均已經(jīng)過(guò)分句處理,所以該步驟可省略。

1.2 微型文本的創(chuàng)建與編輯

點(diǎn)擊運(yùn)行PowerGREP軟件,選取語(yǔ)料庫(kù),創(chuàng)建微型文本。具體步驟如下:

(1)運(yùn)行PowerGREP軟件,在該軟件的程序主界面左上區(qū)域的【Folders and files】一欄中選擇語(yǔ)料庫(kù)所在文件夾,右鍵點(diǎn)擊后選擇【Include Folder and Subfolders】選項(xiàng)(參見(jiàn)圖1)。需要注意的是,在這個(gè)步驟下進(jìn)行的語(yǔ)料庫(kù)選擇,須為教學(xué)工作者根據(jù)自己的需要和學(xué)生水平所篩選和編輯的語(yǔ)料,在具體選取時(shí),要考慮這些語(yǔ)料作為素材是否難易適中。

圖1 在PowerGREP中選擇語(yǔ)料

(2)在PowerGREP主界面上方的功能區(qū)域找到【Action Type】一欄,點(diǎn)選Collect data選項(xiàng)(參見(jiàn)圖2):

圖2 在【Action Type】中設(shè)定選項(xiàng)

在圖2所處的軟件界面中,實(shí)際上還包含了上部表達(dá)式輸入框和下部表達(dá)式輸入框,其中【Search】一欄為上部表達(dá)式,【Collect】一欄為下部表達(dá)式。具體可參見(jiàn)圖3:

在【Search】和【Collect】這兩個(gè)輸入表達(dá)式界面中,需要輸入的是相應(yīng)的表達(dá)式語(yǔ)言。筆者在此處選取英文單詞vocabulary為例,由于上部表達(dá)式需要匹配原語(yǔ)料庫(kù)中所有包含vocabulary一詞的句子,因此將這些句子分為三部分,分別為:句首至vocabulary部分;vocabulary;vocabulary至句末部分。這三部分分別用3個(gè)括號(hào)分組標(biāo)記,vocabulary前后的空格用兩個(gè)\s匹配。具體表述方式為:

圖3 輸入表達(dá)式界面

下部表達(dá)式中用$1,$2,$3分別表示上部表達(dá)式中對(duì)應(yīng)的三部分,即$1= 句首至vocabulary部分;$2=vocabulary部分;$3=vocabulary至句末部分。Vocabulary一詞前后兩個(gè)空格用制表符( t)表示。具體表述方式為:

將上述兩個(gè)表達(dá)式分別輸入表達(dá)式框內(nèi)即顯示為圖4:

圖4 輸入上下部表達(dá)式界面

(3)按照?qǐng)D5的界面所示,在PowerGREP主界面下方的創(chuàng)建文件設(shè)定區(qū),對(duì)文件創(chuàng)建方式【Target file creation】和目標(biāo)文件存放處【Target file location】進(jìn)行設(shè)定。其中,將目標(biāo)文件創(chuàng)建方式設(shè)定為【Save results into a single file】,將目標(biāo)文件存放處設(shè)定為教學(xué)研究者自行制定的保存界面,如C:\User\bob\Desktop\vocabulary.txt,具體可見(jiàn)圖5:

以上步驟完成后,點(diǎn)擊PowerGREP主界面上的【Collect】按鈕,便可遵循目標(biāo)文件存放處地點(diǎn)建立起一個(gè)名為vocabulary.txt的文件。該文件中采集了所選語(yǔ)料庫(kù)中全部還有vocabulary一詞的句子,而不含有該詞的句子則自動(dòng)被排除。

圖5 設(shè)定目標(biāo)文件

2 語(yǔ)言測(cè)試材料的編制

參考以上步驟,教學(xué)工作者可根據(jù)檢索的關(guān)鍵詞和詞組搭配,隨意選取自己認(rèn)為合適的語(yǔ)料,組建微型文本。將這個(gè)步驟運(yùn)用到英語(yǔ)教學(xué)中的語(yǔ)言測(cè)試材料編制工作上,則只需要有一個(gè)合適的語(yǔ)料庫(kù),通過(guò)語(yǔ)料庫(kù)查詢(xún)的方法將題干從語(yǔ)料庫(kù)中抽取,再把題干和選項(xiàng)按照一定的格式編排,便可構(gòu)成一道單項(xiàng)選擇題。以下題為例:

這道選擇題主要由三部分組成,分別為:(1)題號(hào),即“1”,通常還會(huì)在題號(hào)后加一個(gè)點(diǎn)號(hào)和空格,把題號(hào)和題干分開(kāi);(2)題干,即句子本身,該部分可直接從語(yǔ)料庫(kù)中抽取真實(shí)的語(yǔ)言。同時(shí),題干部分出現(xiàn)下劃線(xiàn)“_____I”,是考點(diǎn)所在;(3)選項(xiàng),一般有A\B\C\D四個(gè)標(biāo)記,其中一個(gè)是正確答案,其余為干擾項(xiàng)。

按照單項(xiàng)選擇題題型的特點(diǎn),以上題為例,可以確定答案選項(xiàng)為as a result,in a word,by the way和on the contrary。因此,在創(chuàng)建微型文本時(shí),【Search】和【Collect】?jī)蓚€(gè)表達(dá)式輸入方框內(nèi)的表達(dá)式則應(yīng)為:

輸入PowerGREP界面后如圖6:

完成這一操作后,將從語(yǔ)料庫(kù)中抽取的所有包含四個(gè)選項(xiàng)的句子保存到名為choice.txt的微型文本中。然后運(yùn)行PowerGREP軟件,選中微型文本choice.txt,再進(jìn)行一次Collect。本次操作中,Search不變,Collect的表達(dá)式變更為:

圖6 創(chuàng)建編制練習(xí)題所需微型文本

在本次抽取過(guò)程中,所用的是PowerGREP內(nèi)置的表達(dá)式“%MATCHFILENS%”,后邊加了點(diǎn)號(hào)和空格,之后是“$1”,即微型文本的每個(gè)句子中選項(xiàng)之前的部分。微型文本的原選項(xiàng)被替換成了“______”,之后是微型文本原句中選項(xiàng)之后的部分“$3”和一個(gè)回車(chē)符號(hào)和換行符號(hào)“\r\n”。最后逐步輸入四個(gè)選項(xiàng),點(diǎn)擊【Collect】,變成完成操作。隨后,將所得文本保存為question.txt,打開(kāi)后可看到這個(gè)文本的格式正符合所需要的單項(xiàng)選擇題格式,可直接應(yīng)用于語(yǔ)言測(cè)試的材料編寫(xiě)(圖7)。

圖7 根據(jù)微型文本編制的語(yǔ)言測(cè)試材料

同樣,使用類(lèi)似的步驟,可再次抽取練習(xí)題的答案,只需要把【Collect】表達(dá)式輸入框中的表達(dá)式改為“%MATCHFILENS%.$2”,將輸入文件名改為answer.txt即可(圖8)。

圖8

3 結(jié) 語(yǔ)

語(yǔ)料庫(kù)應(yīng)用涉及大綱制定、教材編寫(xiě)、閱讀材料選擇等多個(gè)外語(yǔ)教學(xué)研究環(huán)節(jié),無(wú)論是課前準(zhǔn)備階段還是課堂課后練習(xí)題編寫(xiě)階段,使用語(yǔ)料庫(kù)時(shí)無(wú)不涉及索引工具。外語(yǔ)教學(xué)工作者利用語(yǔ)料庫(kù)資源,結(jié)合相應(yīng)軟件,抽取適當(dāng)?shù)乃饕?,?chuàng)建微型文本,作為編制英語(yǔ)語(yǔ)言測(cè)試素材,既可省去使用大型語(yǔ)料庫(kù)的種種繁雜操作,也可通過(guò)精心挑選,設(shè)計(jì)出重點(diǎn)突出的微型文本,激發(fā)學(xué)生學(xué)習(xí)興趣。

1 Leech,G.1991.The state of the art in corpus linguistics.In K.Aijmer &B.Altenberg(eds.).English Corpus Linguistics.London:Longman.8-29.

2 梁茂成,李文中,許家金.語(yǔ)料庫(kù)應(yīng)用教程[M].北京:外語(yǔ)教學(xué)與研究出版社.

3 Sinclair,J.1991.Corpus,Concordance,Collocation.Oxford:Oxford University Press.

4 Sinclair,J.2003.Reading Concordances.London:Pearson.

5 Sinclair,J.2007.The search for units of meaning.In W.Teubert & R.Krishnamurthy (eds.).Corpus Linguistics(Vol.3).London:Routledge.3-29.

猜你喜歡
表達(dá)式外語(yǔ)教學(xué)語(yǔ)料
從震旦到復(fù)旦:清末的外語(yǔ)教學(xué)與民族主義
一個(gè)混合核Hilbert型積分不等式及其算子范數(shù)表達(dá)式
表達(dá)式轉(zhuǎn)換及求值探析
淺析C語(yǔ)言運(yùn)算符及表達(dá)式的教學(xué)誤區(qū)
The Book Review of Methods of Critical Discourse Analysis
速讀·中旬(2018年7期)2018-08-17 07:22:00
“Less Is More”在大學(xué)外語(yǔ)教學(xué)中的應(yīng)用
基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
《苗防備覽》中的湘西語(yǔ)料
外語(yǔ)教學(xué)法的進(jìn)展
科技視界(2014年32期)2014-08-15 00:54:11
将乐县| 社旗县| 桦南县| 卓资县| 都匀市| 海兴县| 余干县| 双峰县| 莫力| 周宁县| 孝感市| 岑巩县| 吉木乃县| 绥芬河市| 鄂托克前旗| 西宁市| 高碑店市| 海安县| 三门峡市| 昌乐县| 淮南市| 漳州市| 清水河县| 通州区| 班戈县| 庐江县| 泊头市| 会泽县| 正定县| 饶平县| 龙江县| 当阳市| 奎屯市| 廊坊市| 乳山市| 雅江县| 凤翔县| 察雅县| 孝昌县| 绍兴县| 保定市|