劉先寬
自從以文秋芳老師為代表的一批中國(guó)學(xué)者創(chuàng)建了中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)以來(lái),語(yǔ)料庫(kù)就成為英語(yǔ)學(xué)習(xí)者的重要工具。雖然語(yǔ)料庫(kù)語(yǔ)言學(xué)研究方法興起的時(shí)間較短,但是由于定量研究方法的準(zhǔn)確性和新穎性,以及結(jié)合SPSS圖表,使語(yǔ)言學(xué)研究具有非常強(qiáng)的直觀性,將二語(yǔ)習(xí)得研究,特別是英語(yǔ)習(xí)得研究帶入一個(gè)全新的領(lǐng)域[1]。作為教育部人文社科研究項(xiàng)目的重要研究?jī)?nèi)容之一,本課題組試圖利用我們所創(chuàng)建的遼寧省高校學(xué)生口語(yǔ)、書(shū)面語(yǔ)語(yǔ)料庫(kù)(LCC),通過(guò)實(shí)驗(yàn)和干預(yù)遼寧省高校學(xué)生的英語(yǔ)習(xí)得,探討語(yǔ)料庫(kù)和二語(yǔ)習(xí)得特別是英語(yǔ)習(xí)得之間的關(guān)系,以及研究成果和存在的問(wèn)題。
課題組認(rèn)為,所建立的遼寧省高校學(xué)生口語(yǔ)、書(shū)面語(yǔ)語(yǔ)料庫(kù)(LCC)具有以下特征:
遼寧省高校學(xué)生口語(yǔ)、書(shū)面語(yǔ)語(yǔ)料庫(kù)(LCC)全部利用WORDSMITH等專業(yè)數(shù)據(jù)庫(kù)研究軟件,進(jìn)行語(yǔ)料庫(kù)的創(chuàng)建和處理,運(yùn)用BRILLE軟件進(jìn)行附碼,將原始語(yǔ)料變成可以研究的語(yǔ)料庫(kù)。LCC語(yǔ)料庫(kù)運(yùn)用WORDSMITH等軟件列出語(yǔ)料庫(kù)中的高頻詞和低頻詞進(jìn)行研究,結(jié)合SPSS軟件探討二語(yǔ)習(xí)得者出現(xiàn)高頻詞和低頻詞的原因,提出相對(duì)應(yīng)的教學(xué)和學(xué)習(xí)方法。同時(shí)利用英國(guó)國(guó)家語(yǔ)料庫(kù)(BNC)研究它的高頻詞和低頻詞,對(duì)比研究我們語(yǔ)料庫(kù)的高頻詞和低頻詞,分析原因,指導(dǎo)英語(yǔ)教學(xué),讓學(xué)生學(xué)到更地道的英語(yǔ)。這些研究的應(yīng)用必將會(huì)提高高校教師、學(xué)生和研究者的視野,讓英語(yǔ)語(yǔ)言教學(xué)和研究進(jìn)入一個(gè)全新的階段。另外,遼寧省高校學(xué)生口語(yǔ)、書(shū)面語(yǔ)語(yǔ)料庫(kù)一經(jīng)發(fā)布,就可供所有的教師和研究者共同享有和使用,有助于我省高校英語(yǔ)教學(xué)的改革和發(fā)展。
LCC語(yǔ)料庫(kù)課題組利用兩年多的時(shí)間,首先隨機(jī)抽出遼寧省高校四級(jí)和八級(jí)口語(yǔ)、書(shū)面語(yǔ)的作文題目,然后走遍全省多個(gè)地級(jí)市的11所高等學(xué)校,進(jìn)行現(xiàn)場(chǎng)語(yǔ)料采集,得到LCC的原始語(yǔ)料,然后利用先進(jìn)的軟件生成語(yǔ)料庫(kù)。所以,LCC語(yǔ)料庫(kù)為遼寧省高校英語(yǔ)教師、二語(yǔ)習(xí)得者和研究者提供了真實(shí)、可靠的,可以經(jīng)過(guò)不斷驗(yàn)證的語(yǔ)言數(shù)據(jù)。為他們研究和克服教學(xué)和學(xué)習(xí)中經(jīng)常出現(xiàn)的問(wèn)題和困難,提供了有益的幫助。
二語(yǔ)習(xí)得者是一個(gè)個(gè)鮮活的個(gè)體,容易受社會(huì)環(huán)境和心理因素的影響。我們?cè)趧?chuàng)建語(yǔ)料庫(kù)的初期,對(duì)于話題范圍、話題類型嚴(yán)格設(shè)計(jì),從幾千個(gè)四級(jí)和八級(jí)的口語(yǔ)和書(shū)面語(yǔ)題目中選取人文、社會(huì)、自然、生態(tài)等幾個(gè)方面近100個(gè)題目。對(duì)于參加測(cè)試的學(xué)生也有明確要求,必須是在校的大二和大三的學(xué)生。選取的面盡可能包含我省多個(gè)地級(jí)市有代表性的大學(xué),比如沈陽(yáng)、大連、丹東、錦州、朝陽(yáng)、鞍山、撫順等地區(qū)的11所高校的學(xué)生。我們要求他們按照限時(shí)和不限時(shí)兩種方式隨機(jī)抽取作文題目,并按要求完成??谡Z(yǔ)的語(yǔ)料庫(kù),更是安排有經(jīng)驗(yàn)的老師現(xiàn)場(chǎng)錄音、測(cè)試、轉(zhuǎn)錄,形成語(yǔ)料庫(kù)。所有的這些工作都是為了保證LCC語(yǔ)料庫(kù)具有代表性和典型性。
現(xiàn)代語(yǔ)言學(xué)研究多從事定性的研究。我們創(chuàng)建LCC語(yǔ)料庫(kù)的初衷是以定量研究為主,輔以定性研究。它以現(xiàn)成的語(yǔ)料為基礎(chǔ),以實(shí)驗(yàn)為核心,用SPSS統(tǒng)計(jì)軟件生成圖表。同時(shí),通過(guò)對(duì)比英國(guó)國(guó)家語(yǔ)料庫(kù)(BNC)分析和研究遼寧省高校學(xué)生的英語(yǔ)習(xí)得情況和產(chǎn)生的原因,以及指導(dǎo)英語(yǔ)教學(xué)和研究的實(shí)踐,多維度地揭示遼寧省高校學(xué)生二語(yǔ)習(xí)得的特點(diǎn)、成果和現(xiàn)狀。
依據(jù)語(yǔ)言學(xué)研究的目的,LCC語(yǔ)料庫(kù)的二語(yǔ)習(xí)得研究主要包括語(yǔ)段搭配錯(cuò)誤分析和特征描寫(xiě),高頻詞和低頻詞研究,學(xué)術(shù)成果檢驗(yàn)和分析三個(gè)方面。
課題組的研究者主要運(yùn)用WORDSMITH檢索軟件中的CONCORDANCE檢索功能,以某個(gè)單詞或者詞組作為檢索的關(guān)鍵詞,提取出LCC語(yǔ)料庫(kù)中所有的關(guān)于這個(gè)關(guān)鍵詞的搭配。在提取關(guān)鍵詞的過(guò)程中我們還可以根據(jù)需要來(lái)選取不同的跨距 (SPAN),也就是以關(guān)鍵詞為核心左右所取的詞的個(gè)數(shù)。也可以利用BRILLE軟件的附碼功能,研究以關(guān)鍵詞為核心,所有詞匯間的詞性搭配特征。
語(yǔ)段搭配錯(cuò)誤分析總體上可以分為兩種:一是針對(duì)二語(yǔ)習(xí)得者普遍存在的搭配錯(cuò)誤進(jìn)行分析,查找原因,發(fā)現(xiàn)規(guī)律,指導(dǎo)教育和教學(xué)活動(dòng)。我們創(chuàng)建和分析LCC語(yǔ)料庫(kù),發(fā)現(xiàn)目前遼寧省高校的學(xué)生,在詞匯和語(yǔ)法兩個(gè)方面出現(xiàn)較多錯(cuò)誤,原因主要是受母語(yǔ)負(fù)遷移和學(xué)習(xí)者語(yǔ)言能力的影響。同時(shí)課題組的研究人員運(yùn)用桂詩(shī)春的語(yǔ)段搭配錯(cuò)誤分析認(rèn)知模型,分析和解釋了遼寧省高校學(xué)生的二語(yǔ)習(xí)得錯(cuò)誤的成因及交互影響,提供了我省高校學(xué)生深層認(rèn)知模型和整體理論框架,并把他們用于英語(yǔ)的教學(xué)和實(shí)踐當(dāng)中[2]。二是針對(duì)某個(gè)詞匯或者短語(yǔ)的特種類型的研究。這是一種微觀的研究,主要研究遼寧省高校學(xué)生英語(yǔ)口語(yǔ)和書(shū)面語(yǔ)表達(dá)中的單詞或短語(yǔ)的錯(cuò)誤使用,比如拼寫(xiě)錯(cuò)誤、冠詞錯(cuò)誤搭配、介詞錯(cuò)誤搭配[3]。結(jié)合教學(xué)和課題研究的需要,課題組的全體研究人員對(duì)這些錯(cuò)誤進(jìn)行了逐項(xiàng)的研究,發(fā)現(xiàn)了一定的規(guī)律性,比如使用規(guī)則錯(cuò)誤、語(yǔ)法項(xiàng)掌握不夠、母語(yǔ)負(fù)遷移影響等等。
描寫(xiě)母語(yǔ)或者二語(yǔ)習(xí)得者的語(yǔ)言特征是語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的重點(diǎn),涉及到語(yǔ)言的各個(gè)層面。高頻詞和低頻詞的研究是語(yǔ)言特征研究的中心,文秋芳老師、楊惠忠老師、王立非老師等都不同程度地進(jìn)行過(guò)這方面的研究。LCC語(yǔ)料庫(kù)課題組把高頻詞和低頻詞的研究也作為研究的重點(diǎn),探討LCC語(yǔ)料庫(kù)中高頻詞出現(xiàn)的次數(shù)和所占的比重。對(duì)于低頻詞的研究,主要是一種對(duì)比研究,對(duì)比BNC語(yǔ)料庫(kù)和LCC語(yǔ)料庫(kù)之間低頻詞使用的異同,并分析出現(xiàn)這種情況的原因。
我們對(duì)LCC語(yǔ)料庫(kù)四級(jí)(定時(shí))寫(xiě)作分庫(kù)進(jìn)行了高頻詞研究,采用WORDLIST軟件列出使用頻度前十位的詞。它們出現(xiàn)的次數(shù)和所占的百分比如表1所示:
表1 英語(yǔ)四級(jí)考試高頻詞出現(xiàn)次數(shù)及百分占比
從這個(gè)詞表我們可以看出冠詞占據(jù)LCC語(yǔ)料庫(kù)四級(jí)寫(xiě)作 (定時(shí))分庫(kù)的前兩位,所占的百分比為8.24%。可見(jiàn)英語(yǔ)的初學(xué)者在語(yǔ)言的使用方面有很大的局限性,能夠靈活運(yùn)用的詞匯量較少。另外,介詞、人稱代詞、連詞、系動(dòng)詞也占有很大的比重。通過(guò)和BNC語(yǔ)料庫(kù)的高頻詞比較,我們發(fā)現(xiàn)遼寧省高校學(xué)生尤其是低年級(jí)的學(xué)生常用的詞匯量較少,并且書(shū)面作文有口語(yǔ)化的傾向,需要在高?;A(chǔ)階段的教學(xué)過(guò)程中加強(qiáng)這方面的訓(xùn)練[4]。連詞的使用方面,也較多地使用and,but等口語(yǔ)化明顯的連詞,而像furthermore,however等較地道的和較正式的詞匯用得比較少且蹩腳。但是,課題組成員研究八級(jí)寫(xiě)作分庫(kù)時(shí)發(fā)現(xiàn),高年級(jí)的學(xué)生英語(yǔ)寫(xiě)作的口語(yǔ)化現(xiàn)象不明顯,且受漢語(yǔ)負(fù)遷移的影響也相對(duì)少一些[5]。對(duì)比研究BNC語(yǔ)料庫(kù),我們發(fā)現(xiàn)遼寧省高校學(xué)生的英語(yǔ)寫(xiě)作相對(duì)于本族語(yǔ)者比較僵化,尤其在語(yǔ)言的搭配和使用方面表現(xiàn)明顯,常用的詞匯少且重復(fù)率很高。
LCC語(yǔ)料庫(kù)不僅是我省二語(yǔ)習(xí)得者的口語(yǔ)和書(shū)面語(yǔ)的儲(chǔ)備庫(kù),而且是許多語(yǔ)言現(xiàn)象的有力解釋工具。課題組在創(chuàng)建LCC語(yǔ)料庫(kù)之初就力求把檢驗(yàn)和驗(yàn)證二語(yǔ)習(xí)得的理論和現(xiàn)象作為首要目標(biāo)。比如,以介詞in和on為關(guān)鍵詞,通過(guò)CONCORDANCE軟件和與BNC語(yǔ)料庫(kù)的對(duì)比進(jìn)行了搭配研究和母語(yǔ)遷移假說(shuō)的研究,我們發(fā)現(xiàn)英語(yǔ)的初學(xué)者介詞搭配錯(cuò)誤較多,而且受母語(yǔ)負(fù)遷移的影響較重。例如,經(jīng)常使用on the bed(表示睡在床上)這樣的搭配。
LCC課題組把學(xué)術(shù)成果檢驗(yàn)和分析作為我們研究和探索的突破口。我們運(yùn)用WORDLIST軟件列出LCC四級(jí)寫(xiě)作分庫(kù)的詞匯表,發(fā)現(xiàn)冠詞的使用頻度居于所有使用詞匯的前兩位。而B(niǎo)NC語(yǔ)料庫(kù)中冠詞的使用明顯減少,而以日語(yǔ)為母語(yǔ)的英語(yǔ)學(xué)習(xí)者的語(yǔ)料庫(kù)中,冠詞的使用量更少。分析原因,得出如下結(jié)論:一是受母語(yǔ)遷移的影響,中國(guó)學(xué)生大量使用冠詞;而以日語(yǔ)中沒(méi)有冠詞體系,所以他們英語(yǔ)初學(xué)者的冠詞使用很少。二是受語(yǔ)言使用的靈活度影響,母語(yǔ)習(xí)得者可以用很多其它的詞匯來(lái)代替冠詞,所以使用的頻率不是很多。這些研究體會(huì),都為我們遼寧省英語(yǔ)的教學(xué)和研究提供了可靠的理論和實(shí)踐依據(jù)[6]。
遼寧省高校學(xué)生口語(yǔ)、書(shū)面語(yǔ)語(yǔ)料庫(kù)(LCC)作為遼寧省二語(yǔ)習(xí)得研究和學(xué)習(xí)的一個(gè)重要的資源,是語(yǔ)料庫(kù)語(yǔ)言學(xué)這一新興領(lǐng)域在我省的一項(xiàng)探索,尚有一些不完善的地方。
首先,語(yǔ)料采集的樣本和文體的類型相對(duì)單一。LCC語(yǔ)料庫(kù)主要是研究遼寧省高校學(xué)生的口語(yǔ)和書(shū)面語(yǔ)的語(yǔ)料庫(kù),所采集的樣本都是遼寧省高校學(xué)生四級(jí)和八級(jí)的口語(yǔ)、書(shū)面語(yǔ)的作文。所選擇的題目也都是四級(jí)、八級(jí)考試和練習(xí)的作文題目,其中以議論文和說(shuō)明文為主。今后我們?cè)趧?chuàng)建語(yǔ)料庫(kù)的時(shí)候,會(huì)在采集樣本和文體類型上有一個(gè)突破,增加幾個(gè)分庫(kù)作為對(duì)比研究的重要資源。
其次,口語(yǔ)和書(shū)面語(yǔ)語(yǔ)料規(guī)模和研究不均衡。LCC語(yǔ)料庫(kù)是一個(gè)兼有口語(yǔ)和書(shū)面語(yǔ)的語(yǔ)料庫(kù)。但是,口語(yǔ)語(yǔ)料庫(kù)的規(guī)模要明顯小于書(shū)面語(yǔ)語(yǔ)料庫(kù)。原因是口語(yǔ)語(yǔ)料庫(kù)的創(chuàng)建非常復(fù)雜,需要消耗大量的人力、財(cái)力和時(shí)間。課題組的研究人員需要赴各個(gè)高?,F(xiàn)場(chǎng)采樣、錄音,回來(lái)后還需要把錄音資料轉(zhuǎn)錄成書(shū)面語(yǔ)的形式,再附碼形成語(yǔ)料庫(kù)。受課題組成員能力的限制,二者非常不均衡。另外,受能力和技術(shù)的限制,口語(yǔ)和書(shū)面語(yǔ)的研究也具有不均衡性。我們對(duì)于口語(yǔ)語(yǔ)音的變異和英語(yǔ)發(fā)音受方言遷移影響等研究也沒(méi)有深入開(kāi)展。這是我們課題組以后研究的重點(diǎn)。
最后,語(yǔ)料庫(kù)的縱橫向研究不對(duì)等。LCC語(yǔ)料庫(kù)研究課題組的成立,從通過(guò)國(guó)家教育部的審查到現(xiàn)在不到三年時(shí)間。我們所選取的語(yǔ)料均是來(lái)自于現(xiàn)有高校學(xué)生的口語(yǔ)和書(shū)面語(yǔ)作文。對(duì)于同一學(xué)習(xí)者在不同階段的語(yǔ)言能力研究還沒(méi)有深入開(kāi)展。對(duì)于同一語(yǔ)言現(xiàn)象在不同時(shí)期的應(yīng)用也沒(méi)有開(kāi)展。如果時(shí)間和精力允許,課題組會(huì)在這方面有所突破。
總之,LCC語(yǔ)料庫(kù)還是語(yǔ)料庫(kù)語(yǔ)言學(xué)研究領(lǐng)域的一個(gè)新軍,無(wú)論是語(yǔ)料庫(kù)的設(shè)計(jì)、樣本、創(chuàng)建和研究都有很多需要完善的地方。解決之,一是期盼各位專家和學(xué)者給予幫助和指導(dǎo);二是課題組的全體成員在發(fā)展和完善語(yǔ)料庫(kù)的時(shí)候,也會(huì)觀察和關(guān)注不同的語(yǔ)言現(xiàn)象和語(yǔ)言規(guī)律。
[1]Granger S.Applied Corpus Linguistics:A Multidimensional Perspective[C].Amsterdam&Atlanta,2004.
[2]桂詩(shī)春.以語(yǔ)料庫(kù)為基礎(chǔ)的中國(guó)學(xué)習(xí)者英語(yǔ)失誤分析的認(rèn)知模型[J].現(xiàn)代外語(yǔ),2004(2).
[3]Dagneaux E,Denness S,Granger S.Computer:aided error analysis[J].System,1998(2).
[4]鄧耀臣.中國(guó)大學(xué)生英語(yǔ)議論文中連接副詞使用特征研究[J].中國(guó)英語(yǔ)教學(xué),2006(6).
[5]Ringbom H.Vocabulary frequencies in advanced learner English:A cross-linguistic approach[M].London:Longman,1998.
[6]何安平.學(xué)生英語(yǔ)拼寫(xiě)錯(cuò)誤分析[J].外語(yǔ)教學(xué)與研究,2001(3).
重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2014年2期