王小梅,賈永華
(閩江學(xué)院 外國語學(xué)院,福建 福州 350108)
語言測試是應(yīng)用語言學(xué)研究的一個重要分支,伴隨著語言教學(xué)出現(xiàn),語言測試的應(yīng)用研究也得到發(fā)展。它不但涉及到教學(xué)法、二語習(xí)得理論、語用學(xué)、認(rèn)知語言學(xué)、心理語言學(xué)、教育測量學(xué)等學(xué)科,而且還運用到計算機應(yīng)用技術(shù),現(xiàn)已獨立發(fā)展成一門跨學(xué)科的綜合性學(xué)科。國內(nèi)學(xué)者從整體、效度、反撥效應(yīng)、社會屬性、統(tǒng)計模型、測試真實性、現(xiàn)代技術(shù)、批判等不同角度對語言測試研究做了綜述。國家哲學(xué)社會科學(xué)(以下簡稱“國家社科”)基金項目和教育部人文社會科學(xué)(以下簡稱“教育部社科”)基金項目彰顯了我國人文社會科學(xué)的研究水平,這些研究項目更多的是從宏觀方面反映了學(xué)科研究的熱點、現(xiàn)狀和發(fā)展趨勢。而本研究試圖對兩個基金資助項目中包含“測試”和“測評”的立項項目關(guān)鍵詞進(jìn)行詞頻統(tǒng)計和分析,希望為中國語言測試研究的深度開展提供不同的觀察維度。
本文語料源自兩個基金項目數(shù)據(jù)庫:國家社科規(guī)劃辦公室國家社科基金“項目數(shù)據(jù)庫”和教育部社科研究管理平臺“按項目研究檢索”數(shù)據(jù)庫。筆者分別在“項目名稱”欄輸入“測試”和“測評”檢索,手動剔除與語言測試無關(guān)的項目后顯示:國家社科基金30項,教育部社科基金255項,后在教育部社科研究管理平臺手動增補2015—2017年10項,共計295項。由于檢索未設(shè)定項目類別、學(xué)科類別、立項時間等,這兩個基金1993-2017年間所有包含“測試”“測評”的立項名稱都包括其中。
本文依據(jù)文獻(xiàn)計量學(xué)方法,以295項國家社科和教育部社科立項名稱作為研究對象,利用圖悅詞頻分析工具(圖悅是一款國內(nèi)在線詞頻分析工具)進(jìn)行關(guān)鍵詞詞頻統(tǒng)計,選取高頻詞,采用內(nèi)容分析法和縱橫向比較分析法對立項項目名稱的關(guān)鍵詞進(jìn)行研究分析,理清國內(nèi)語言測試研究的脈絡(luò),展望未來研究趨勢。
通過對兩項基金語言測試的立項項目統(tǒng)計分析后發(fā)現(xiàn):國家社科語言測試研究立項來自于重大項目、一般項目、青年項目、西部項目和后期資助項目五類;教育部社科語言測試研究立項來自于規(guī)劃基金項目、青年基金項目兩類;國家社科基金語言測試研究立項全部來自語言學(xué)領(lǐng)域;教育部社科基金語言測試研究立項絕大部分來自語言學(xué)學(xué)科,極小部分來自外國文學(xué)、中國文學(xué)、管理學(xué)、教育學(xué)、藝術(shù)學(xué)、經(jīng)濟學(xué)、統(tǒng)計學(xué)、社會學(xué)、新聞學(xué)與傳播學(xué)、國際問題和交叉學(xué)科。而在項目立項數(shù)量上,教育部社科項目立項的數(shù)量遠(yuǎn)超過國家社科立項數(shù)量,而國家社科的項目立項數(shù)量近幾年有明顯地增多,而且一般項目和重大項目的比率高。中國語言測試項目研究在二十一世紀(jì)初(2001-2008年)出現(xiàn)高潮,立項數(shù)量多達(dá)229項,占總量的77.63%;而二十世紀(jì)末兩類總量20項,比例最小,占 6.78%;2009年至今也不多,僅 46項,占15.59%。具體立項數(shù)量如圖1:
圖1 1993-2017年國家社科和教育部社科語言測試立項數(shù)量統(tǒng)計Fig.1 Quantitative statistics of language testing projects of National Social Science Fund and Humanities and Social Sciences of Ministry of Education from 1993 to 2017
把三個時段的國家社科基金和教育部社科基金的立項項目名稱分別輸入圖悅詞頻分析工具,獲?。?993-2000關(guān)鍵詞36個、2001-2008關(guān)鍵詞150個、2009-2017關(guān)鍵詞106個。按照高頻關(guān)鍵詞選擇標(biāo)準(zhǔn)(一般為截取的高頻詞累計頻次達(dá)到總頻次的40%左右[1]),獲?。?993-2000高頻詞 13個(詞頻≥2),2001-2008高頻詞37個(詞頻≥5)、2009-2017高頻詞29個(詞頻≥2)。所有高頻詞按(頻次)關(guān)鍵詞這種格式顯示,其結(jié)果見表1:
表1 1993-2017年語言測試項目名稱高頻關(guān)鍵詞Tab.1 High frequency key words of language testing project names from 1993 to 2017
調(diào)查統(tǒng)計一段時間之內(nèi)的關(guān)鍵詞詞頻,能夠觀察并發(fā)現(xiàn)此領(lǐng)域的總體特征,把握此領(lǐng)域的研究熱點,由此預(yù)測未來的研究趨勢。為了更好梳理語言測試研究近25年的研究脈絡(luò),本文以上表數(shù)據(jù)為基準(zhǔn),輻射軟件生成的所有關(guān)鍵詞,對之進(jìn)行縱向和橫向分析,據(jù)此推斷未來的研究方向。
1.1993-2000年語言測試立項名稱關(guān)鍵詞
從表1可見,1993-2000年兩社科基金有關(guān)語言測試研究立項名稱的高頻關(guān)鍵詞有:測試、英語、普通話、標(biāo)準(zhǔn)、外語、教學(xué)、大學(xué)、漢語、中學(xué)、素質(zhì)、教育、任務(wù)、理論。結(jié)合圖悅分析出的36個關(guān)鍵詞,可以歸納出:這期間的語言測試集中在英語語言測試研究有10項,漢語語言測試研究有9項,還有一項涉及韓語測試;這些項目主要從理論、測試標(biāo)準(zhǔn)、具體教學(xué)三個角度進(jìn)行研究,大部分著眼于大學(xué)階段這個層次的語言測試。此階段的語言測試具有如下特點:第一,語言測試研究主要集中在宏觀的理論層面,立項的名稱都是大而廣,如 《英語語言測試研究》《漢語測試?yán)碚撗芯俊罚坏诙?,語言測試研究主要集中在英語和漢語這兩個語種;第三,研究者都將語言測試作為一個獨立的個體研究,很少涉及與測試相關(guān)的其他環(huán)節(jié)的研究,如教學(xué)。20世紀(jì)80年代,國內(nèi)的學(xué)者開始關(guān)注外語測試,介紹國外相關(guān)的理論,進(jìn)而影響漢語的測試研究。因此,此階段的語言測試研究僅僅是個開始。
2.2001-2008年語言測試立項名稱關(guān)鍵詞
從表1可見,2001-2008年兩社科基金的語言測試立項名稱的高頻關(guān)鍵詞有:測試、英語、普通話、大學(xué)、教學(xué)、專業(yè)、實踐、模式等37個。結(jié)合圖悅分析出的150個關(guān)鍵詞,可以歸納出此階段的語言測試具有如下特點:
從語種角度看,語言測試依然主要集中在英語和漢語兩種語種。其中含有關(guān)鍵詞“英語”立項高達(dá)116項,“外語”7項(主要也是研究英語方面的測試),“英漢”1 項。含關(guān)鍵詞“普通話”“漢語”“方言”“語文”立項分別為52項,11項,3項和2項。此外,包含關(guān)鍵詞“雙語”的有4項,“俄語”的有2項,“日語”的有2項。除了小語種,語言測試的研究觸角開始伸向了雙語教學(xué)。
從研究內(nèi)容看,此階段的研究內(nèi)容從理論層面擴展到實踐層面,以理論為基礎(chǔ),重在實踐,重在改革。包含關(guān)鍵詞“理論”立項16項,“實踐”立項19項,“改革”立項 14項,“實驗”立項 2項,“實踐性”和“可行性”各立項1項。語言測試離不開語言教學(xué),兩者相輔相成,教學(xué)自然就成為語言測試研究的第一位,包含關(guān)鍵詞“教學(xué)”立項36項,進(jìn)而研究具體語言能力的測試:包含“口語/寫作/語音/聽力/語法/語用/聲學(xué)/詞匯/口試”等關(guān)鍵詞的立項高達(dá)57項。隨著對語言認(rèn)識的深入,人們的語言觀產(chǎn)生變化,進(jìn)而影響語言測試的研究內(nèi)容,包含“項目/策略/任務(wù)/認(rèn)知/交際/思維”等關(guān)鍵詞的立項23項。另外,語言測試的規(guī)范也是研究的熱點之一,包含關(guān)鍵詞“測試模式”立項19項,“標(biāo)準(zhǔn)”立項12項,“建設(shè)”立項8項,“評分”立項8項,“試題庫”和“試題”立項共 9項?!按缶V/命題”立項各1項。語言測試是在多學(xué)科的基礎(chǔ)上發(fā)展而來,其研究本身就包涵跨學(xué)科,但從此階段的立項項目看,包含關(guān)鍵詞“語料庫”立項3項,“心理學(xué)”立項2項,比例不大,還有很大的發(fā)展空間。
從研究的測試類型看,涵蓋了成績測試、學(xué)能測試、水平測試和診斷測試,包含關(guān)鍵字“課程/成績/考試/四級/四六級/成就/診斷/教材”等立項25項。從研究的測試題型看,只有3項立項是跟題型有關(guān)聯(lián)的,其中1項具體研究完形填空。從測試的工具看,語言測試研究從人工走向智能化。語言測試是多種科學(xué)的結(jié)合體,可以概括為兩類:語言科學(xué)和技術(shù)科學(xué)。前者給測試饋入內(nèi)容,后者給測試饋入手段。計算機技術(shù)的發(fā)展給語言測試研究注入了新鮮的血液。包含關(guān)鍵詞“計算機/語料庫/網(wǎng)絡(luò)/無紙化/校園網(wǎng)/教學(xué)網(wǎng)”立項共18項。
從研究的測試對象看,主要集中在大學(xué),包含關(guān)鍵詞“大學(xué)”(50 項)、“高?!保?4 項)、“四級”(5 項)“大學(xué)生”(4 項)、“本科”(3 項)、“對外經(jīng)貿(mào)大學(xué)”(2 項)、“院?!保? 項)、“民辦高?!保? 項)、“理工科”(1 項)、“學(xué)院”(1 項)、“高職院?!保? 項)、“吉林大學(xué)”(1 項)和“留學(xué)生”(1項)共86項。研究的測重點集中在專業(yè)。包含關(guān)鍵詞“專業(yè)”立項25項,“培訓(xùn)”“非專業(yè)”“職業(yè)”共有6項。此階段的研究對象比較寬泛,涵蓋了大部分的測試群體,體現(xiàn)了國內(nèi)常見的測試形式,只有個別研究以某個學(xué)?;蚰硞€群體為依托。而其他方面的研究對象集中在高考,包含關(guān)鍵詞“高考”立項5項,“中學(xué)”立項2項。國內(nèi)語言測試的研究學(xué)者主要來自各個高校和各大考試機構(gòu),研究身邊觸手可及和熟悉的測試,以及影響重大,社會關(guān)注度高的語言測試。
21世紀(jì)初,國內(nèi)的語言測試研究出現(xiàn)“井噴”狀態(tài),體現(xiàn)在教育部社科8年期間的228項立項數(shù)量上,隨著Lado博士撰寫的《語言測試》——語言測試領(lǐng)域的第一本專著出版,國外學(xué)者在語言測試領(lǐng)域進(jìn)行了長達(dá)近六十年的不懈研究,建立了完整的研究體系,積累了豐碩的成果。籍此國內(nèi)學(xué)者站在巨人的肩膀上,結(jié)合國內(nèi)的實際情況,嘗試進(jìn)行語言測試的細(xì)化研究,拓寬研究廣度,豐富研究內(nèi)涵,但是其研究的深度還不夠,在此期間僅有1個課題獲得國家社科立項(國家社科的立項經(jīng)費比教育部社科的立項經(jīng)費多,從世俗的角度而言,國家社科立項比教育部社科立項分量重)。
3.2009-2017年語言測試立項名稱關(guān)鍵詞
從表1可見,2009-2017年兩社科基金的語言測試立項名稱的高頻關(guān)鍵詞有:測試、英語、測評、標(biāo)準(zhǔn)、漢語、寫作、理論、任務(wù)、高考、效應(yīng)等29個。結(jié)合圖悅分析出的106個關(guān)鍵詞,可以歸納出此階段的語言測試具有如下特點:
第一,語言測試研究語種范圍進(jìn)一步擴大。此階段的研究延續(xù)了前一階段的特點,語言測試依舊以英語和漢語為主(都是立項13項),但開始兼顧日語、維吾爾語、蒙古語、雙語、漢英等語言的測試。甚至語言測試的研究范圍也拓寬到我國少數(shù)民族的語言,這對于我們保護(hù)及發(fā)展少數(shù)民族語言是一大幸事。
第二,語言測試研究側(cè)重標(biāo)準(zhǔn)化的探討。語言測試是一項極其嚴(yán)謹(jǐn)?shù)幕顒?,需要建立一定的行業(yè)標(biāo)準(zhǔn)和準(zhǔn)則,保證考試的科學(xué)性、客觀性和公正性[2],這是其健康發(fā)展的基石。因此有學(xué)者一直致力于等級標(biāo)準(zhǔn)的研究,與之相關(guān)的立項有13項,占據(jù)近三分之一的立項:有從宏觀討論標(biāo)準(zhǔn)的制定,如《標(biāo)準(zhǔn)化語言測試的標(biāo)準(zhǔn)制訂與效度研究》;有具體到學(xué)科測試標(biāo)準(zhǔn)的制定,如《新TEM-8寫作測試量表建構(gòu)研究》;有某一語言能力測定的研究,如《中國大學(xué)生學(xué)術(shù)英語口語能力等級量表及測評標(biāo)準(zhǔn)應(yīng)用研究》《中小學(xué)生英語閱讀能力標(biāo)準(zhǔn)及測評體系研究》。國內(nèi)大規(guī)模語言考試往往是涉及眾多考生切身利益的高風(fēng)險考試,具有廣泛的社會影響力,為這些考試制定科學(xué)的等級量表及測試標(biāo)準(zhǔn)不僅是必要的,而且要與時俱進(jìn)。
第三,語言測試的影響研究成為熱點。語言測試這一行為不是獨立的,是與特定社會環(huán)境緊密相連的。語言測試一旦使用,就會產(chǎn)生一定的影響,這種影響體現(xiàn)在三個方面:水平認(rèn)定,反撥和社會影響[3]。近年來,語言測試的影響研究成了熱點之一,與之相關(guān)的立項有5項:《語言測試反撥效應(yīng)理論視角下的高考英語改革研究》《批判語言測試視闕下CET的反撥效應(yīng)研究》《PISA測試對發(fā)達(dá)國家課程改革影響研究》《閱讀能力發(fā)展機制理論及其與閱讀教學(xué)和測評的關(guān)系研究》《口譯職業(yè)資格認(rèn)證測試的理論體系和運作模式研究》。
第四,語言測試的服務(wù)對象從國內(nèi)開始面向國外。隨著中國國力提升以及文化“走出去”的戰(zhàn)略實施,漢語的影響力日益擴大,外國人學(xué)習(xí)中文的熱情開始高漲,對外漢語的測試研究成了新寵。立項項目如《對外漢語考試的理論框架與測試模型研究》《對外漢語分級測試研究》很好地體現(xiàn)了這一趨勢。
第五,語言測試跨學(xué)科的結(jié)合研究展現(xiàn)新內(nèi)容。語言測試與統(tǒng)計相聯(lián)系,造就《累進(jìn)辯論法與語言測試辯論研究》;與語料庫相結(jié)合,成就《基于語料庫的語言測試研究》;與計算機相結(jié)合,提出《計算機自適應(yīng)語言測試模型設(shè)計》;還開始跟比較語言學(xué)結(jié)合,關(guān)注比較、對比,從而獲得語言測試后續(xù)的方向和動力,不僅有雙語比較,如《中外留學(xué)生語言測試體系比較與研究》;還有三語比較,如《藏漢雙語者藏漢英三語者心理詞匯語義表征的 SOA多點測試法與ERP對比研究》。
此階段的立項數(shù)目雖然不多,但是國家社科的立項(26項)比教育部社科的立項(20項)多,而且其中有3項屬于國家社科的重大項目,在質(zhì)上有進(jìn)一步的提升。因此,此階段的語言測試研究,題目涉及范圍更大,且結(jié)合實際情況,更有原創(chuàng)性、開拓性、針對性和現(xiàn)實性,這也符合國家社科立項的精神。
根據(jù)圖悅詞頻分析工具獲取的1993-2017年語言測試項目名稱關(guān)鍵詞詞頻數(shù),按照頻次及排名可將近25年來中國語言測試研究分為以下幾類:
1.語言測試研究語種主要是英語和漢語。英語【7-116-13】和漢語(普通話、語文)【8-63-13】兩類關(guān)鍵詞都在這三個階段穩(wěn)居前二。每種語言都有其特點,語言測試的研究要依附于某一語言。語言測試的研究發(fā)源于英語語種國家,而且國內(nèi)學(xué)習(xí)外語選擇的語種大多是英語,這里有國家發(fā)展戰(zhàn)略的因素,因而英語水平測試在各級各類外語考試中所占比重大,涉及面廣,因此英語語言測試研究始終是此領(lǐng)域的常青樹。隨著社會的發(fā)展,普通話水平測試的開展,對外文化的宣傳和對外漢語的興起,普通話測試的研究是學(xué)者關(guān)切的話題。
2.語言測試的理論實踐研究。理論【2-16-4】,是語言測試的研究基石,是指導(dǎo)實踐【1-19-0】的依據(jù),是改革【0-14-2】的動力之源;實踐是理論的基礎(chǔ),是檢驗改革成果的試金石;改革完善理論,推動實踐的發(fā)展。語言測試的理論和實踐研究相輔相成,推進(jìn)國內(nèi)相關(guān)測試的改革發(fā)展,或探索【0-6-0】、建設(shè)【0-8-1】、開發(fā)【0-5-0】、設(shè)計【0-4-1】與實際情況相符,能真實反映考生語言能力的測試模式【0-19-2】、模型【0-2-2】,或解決測試中遇到的問題,提供對策【0-5-0】,或評價【0-5-1】、改進(jìn)現(xiàn)狀【0-3-0】。這既是學(xué)者們的出發(fā)點,也是追求的目標(biāo)。
3.具體語言技能方面的測試研究。語言能力是一種綜合性的能力,具體體現(xiàn)在聽說讀寫譯的能力上??谡Z【1-17-2】、寫作【0-12-5】、語音【0-12-1】、聽力【1-5-1】、語法【0-5-0】這些相關(guān)課程【0-7-1】的技能【0-2-0】是語言測試者較為關(guān)注的語言技能測試,尤其像口語、寫作、語音之類主觀性強的語言測試,評分主觀性強,隨意性較大。如何科學(xué)地考查考生的語言能力,如何平衡信度和效度等等問題是研究者十分重視的話題。
4.語言測試的社會屬性研究。Kunnan指出,語言測試不是孤立的,而是發(fā)生在由政治經(jīng)濟,教育環(huán)境,社會文化環(huán)境以及技術(shù)及基礎(chǔ)設(shè)施環(huán)境等一系列相互交叉,相互影響的環(huán)境所編織的社會關(guān)系網(wǎng)絡(luò)之中[4]。在過去的十幾年間,語言測試變得越來越專業(yè)化。語言測試行業(yè)如同法律、醫(yī)療行業(yè)一樣也需要建立一定的行業(yè)標(biāo)準(zhǔn)和準(zhǔn)則。標(biāo)準(zhǔn)【5-12-6】、評分【0-8-0】、等級【1-2-3】、分級【1-2-2】、大綱【1-1-0】、指標(biāo)【0-1-1】、細(xì)則【0-2-0】、制定【0-1-1】、命題【0-1-1】、指南【1-0-0】等是語言測試常見的話題。此外,測試的信度【0-3-0】和效度【0-13-6】(信度和效度是手動檢測所得的結(jié)果)研究是每個測試工作者高度關(guān)切的話題。一開始,學(xué)者們主要關(guān)注測試的信度和效度的研究,隨著效度研究范疇和界限的擴展,倫理道德研究越來越受到關(guān)注,已經(jīng)成為效度研究不可或缺的一個維度[5]。
5.語言測試工具、內(nèi)容方面的研究。各種語言測試?yán)碚摰难芯?,其最終是為各種形式的語言測試服務(wù)。隨著科學(xué)技術(shù)和信息技術(shù)的不斷發(fā)展,各種語言測試的工具和內(nèi)容也進(jìn)行了一些更新。遠(yuǎn)程【1-0-0】、智能【1-0-0】、計算機【0-7-2】、語料庫【0-3-1】、試題庫【0-5-0】、網(wǎng)絡(luò)【0-5-0】、無紙化【0-1-0】等各種測試工具進(jìn)入研究人員的視野。隨著語言教學(xué)理論的發(fā)展,語言測試內(nèi)容經(jīng)歷了任務(wù)型語言測試,交際型語言測試和認(rèn)知診斷。兩基金的立項課題也體現(xiàn)了這一過程,任務(wù)【2-4-4】、項目【0-7-0】、交際【0-2-2】、認(rèn)知【0-2-1】、診斷【0-2-1】、策略【0-6-1】、難度【1-1-2】、語用【0-3-1】等是學(xué)者關(guān)注的語言測試內(nèi)容。
6.語言測試效應(yīng)研究。語言教學(xué)是第一性,語言測試是為其服務(wù)的[6]。語言測試發(fā)展至今,經(jīng)歷了前科學(xué)語言測試階段、結(jié)構(gòu)主義階段、社會語言學(xué)階段和交際語言測試階段。但是不管處在哪個階段,語言測試都是檢驗學(xué)生學(xué)習(xí)效果的重要工具,也是教師獲得教學(xué)反饋的最直接方式,能夠促進(jìn)語言教學(xué)的發(fā)展。教學(xué)【3-36-2】,主要是大學(xué)【3-50-2】、高?!?-14-0】、本科【0-3-2】的專業(yè)【1-25-2】課程【0-7-1】教學(xué),公外學(xué)生【0-16-2】四級【0-6-0】教學(xué)或者教學(xué)效應(yīng)【0-3-3】、反撥【0-6-2】(手動檢測)等是研究者經(jīng)常思考研究的課題。
根據(jù)對1993-2017年近25年的國家社科和教育部社科立項題目關(guān)鍵詞的橫向與縱向解剖分析,我們可以試圖預(yù)測未來語言測試的研究趨勢,主要有:
1.基于理論的實踐研究隨著時代的發(fā)展進(jìn)一步深化。語言測試的設(shè)計開發(fā)和使用仍將受到不斷發(fā)展的語言學(xué)理論的挑戰(zhàn),受到思辨,創(chuàng)新和開拓的教育理念的挑戰(zhàn),受到先進(jìn)的統(tǒng)計測量技術(shù)和信息技術(shù)的挑戰(zhàn)[7]。例如國家“互聯(lián)網(wǎng)+”行動計劃的提出,推動了信息技術(shù)與教育領(lǐng)域的融合發(fā)展。慕課、翻轉(zhuǎn)課堂、無縫學(xué)習(xí)等在語言教學(xué)的創(chuàng)新應(yīng)用,為各教育階段的學(xué)習(xí)、課程、教學(xué)、考試、決策管理、評價體系、人才培養(yǎng)模式等帶來革命性的變化。這些變化對語言測試的影響需要學(xué)者們進(jìn)行開拓性的實證研究。除了英語、普通話這兩種常規(guī)語言測試外,雙語(主要是漢英或者英漢)、少數(shù)民族語、小語種,甚至三語方面的語言測試,特別是具體在語用、篇章、交際、翻譯等能力方面的測試會是未來研究的一個方向。
2.語言測試的社會屬性研究繼續(xù)升溫。上世紀(jì)80年代,語言測試的社會屬性研究逐漸興起。國外學(xué)者不僅從心理測量學(xué)和效度理論研究兩個傳統(tǒng)研究領(lǐng)域中的社會觀,而且從語言測試實踐的社會政治功能、社會學(xué)理論、測試倫理道德與測試者的責(zé)任等方面展開研究。但國內(nèi)學(xué)者較多關(guān)注前面兩項的研究,少有人涉及后面幾項的研究,因此,語言測試的社會屬性研究在我國還有很大的發(fā)展空間。Bachman指出語言現(xiàn)象的豐富性和語言能力的多維性使我們無法簡單地,完全客觀地用一把單維度的尺子去測量,測試的工具性和社會性又為語言測試者增添了艱巨的責(zé)任感和使命感,這些也正是語言測試研究不斷探索的方向[8]。
3.跨學(xué)科的語言測試研究也會不斷加強。一方面,語言測試本身就是融合多個學(xué)科而成的語言學(xué)研究分支。另一方面,社會科學(xué)的研究趨勢是越來越理科化,漸趨于嚴(yán)謹(jǐn)?shù)牧炕芯俊?015年,中央提出了網(wǎng)絡(luò)強國戰(zhàn)略,“互聯(lián)網(wǎng)+”、大數(shù)據(jù)、云計算,在此背景下,人文學(xué)科研究應(yīng)引入多元研究方法,實現(xiàn)研究的更新與轉(zhuǎn)型。測量學(xué)科的迅速發(fā)展,新的統(tǒng)計工具的開發(fā)應(yīng)用,語料庫的深度應(yīng)用都能給語言測試注入新鮮血液,使其研究方法更趨于多樣化和復(fù)雜化。例如項目反應(yīng)理論(IRT)中的多層面Rasch模型能夠分析影響考試成績的多個因素,并估算出各個因素對成績的影響程度,這種模型如果在語言測試中使用,則能有效提高評分的質(zhì)量,確保語言運用考試的公平和有效。
4.外語測評體系標(biāo)準(zhǔn)化將成為重要的研究內(nèi)容。我國英語考試種類繁多,但是其功能不同,導(dǎo)致不同考試成績無法比較,缺乏統(tǒng)一的評價標(biāo)準(zhǔn),并且考試處于不斷改革變化以適應(yīng)社會的發(fā)展需求之中,以致考生需花費很多時間和精力重復(fù)應(yīng)考。我國應(yīng)建立國家外語測評標(biāo)準(zhǔn),在此基礎(chǔ)上,推動考試內(nèi)容和形式的改革,完善開發(fā)系統(tǒng)性的外語考試項目,推動形成性評價與終結(jié)性評價相結(jié)合的研究,以期建成標(biāo)準(zhǔn)統(tǒng)一、功能多元的現(xiàn)代化外語測評體系。外語測評體系的建立是項浩大的工程,極需眾多各級語言測試研究人員參與其中并為之努力。
國內(nèi)語言測試研究歷史雖然不長,但因其融合多學(xué)科知識,已吸引眾多學(xué)者激情參與,取得了各類不同的研究成果。本文讓數(shù)據(jù)說話,從1993-2017年國家社科基金和教育部社科基金的立項課題的關(guān)鍵字出發(fā),由此“窺一斑而知全豹”,分析了近25年來中國語言測試研究的大致內(nèi)容和走向。隨著全球化進(jìn)程的加快,語言作為一個交流工具會愈加受到重視,而語言測試的研究發(fā)展步伐也會加快。我們作為語言教學(xué)人員和測試研究學(xué)者有責(zé)任有義務(wù)在這條道路上繼續(xù)前行,不但要積極申請各級各類研究課題,而且還要及時參與、組織各類語言測試相關(guān)會議,在語言測試研究的國際舞臺上發(fā)出更響亮的聲音,取得更加豐碩的成果。