(浙江工業(yè)大學(xué) 外國(guó)語(yǔ)學(xué)院,浙江 杭州 310023)
長(zhǎng)期以來(lái),語(yǔ)言測(cè)試工作者研究的核心是如何提高測(cè)試的信度與效度,以客觀、精確地測(cè)量考生的語(yǔ)言能力。二十世紀(jì)七十年代中期,國(guó)際語(yǔ)言教學(xué)界興起了一場(chǎng)轟轟烈烈的交際語(yǔ)言教學(xué)運(yùn)動(dòng),學(xué)界提出了“語(yǔ)言交際能力”(communicative competence)和“交際語(yǔ)言能力”(communicative language ability)培養(yǎng)的新理念。受其影響,以做事測(cè)試(performance test)為主的交際語(yǔ)言測(cè)試(communicative language testing)逐漸推行。同時(shí),隨著批判語(yǔ)言測(cè)試(Critical Language Testing)的興起,測(cè)試的社會(huì)維度日益受到關(guān)注,語(yǔ)言水平的構(gòu)念也隨之發(fā)生了變化。研究的范式開始從單一的心理測(cè)量實(shí)證研究擴(kuò)展到更廣泛的定量與定性相結(jié)合的綜合研究,對(duì)于信度和效度的理解也上升到了新的高度。Messick(1989)在統(tǒng)一效度理論模式中引入了測(cè)試的社會(huì)性概念,提出:(1)測(cè)試設(shè)計(jì)者語(yǔ)言能力的構(gòu)念以及在實(shí)施測(cè)量過(guò)程中的某些方面的側(cè)重會(huì)反映其社會(huì)文化價(jià)值;(2)考試在特定的社會(huì)環(huán)境中發(fā)生并對(duì)結(jié)果使用的教育和社會(huì)環(huán)境產(chǎn)生影響[1]。繼Messick后,Bachman(1990)基于Canale and Swain(1980)[注]①Canale ,Swain對(duì)“交際語(yǔ)言能力”的研究資料參見:Canale ,M. and Swain,M. Theoretical bases of communicative approaches to second language teaching and testing[J].Applied Linguistics, 1980,(1):1-47.、Canale(1983)[注]②Canale對(duì)“交際語(yǔ)言能力”的研究資料參見:Canale,M. From communicative competence to communicative panguage pedagogy[A]. J.C.Richards & R.W. Schmidt.Language and communication[C].London: Longman Press,1983.2-27.以及Hymes(1972)[注]③Hymes對(duì)“交際語(yǔ)言能力”的研究資料參見:Hymes,D.H. On Communicative Competence[A]. J.B.Pride & J.Holmes.Sociolingistics. armondsworth[C].UK:Penguin Press, 1972.269-293.對(duì)“交際語(yǔ)言能力”的闡述,構(gòu)建了二語(yǔ)語(yǔ)言交際能力模式,將“社會(huì)語(yǔ)言適切性”(sociolinguistic appropriateness)納入二語(yǔ)交際語(yǔ)言能力的一個(gè)組成部分[2]。2006年,McNamara和Roever全面系統(tǒng)地從語(yǔ)言測(cè)試?yán)碚摵蛯?shí)踐論述述語(yǔ)言測(cè)試的社會(huì)性,具體闡述了測(cè)試公平性、分?jǐn)?shù)的使用以及語(yǔ)言測(cè)試在社會(huì)中的用途等,以口語(yǔ)能力測(cè)試和語(yǔ)用能力測(cè)試為例討論了語(yǔ)言能力的社會(huì)維度及其測(cè)量,強(qiáng)調(diào)語(yǔ)言能力包括語(yǔ)用能力,語(yǔ)言在交際中的使用受情景因素影響, 進(jìn)一步明確定了語(yǔ)言能力社會(huì)維度的定義和范疇[3]。McNamara和Roever的著作問世將語(yǔ)言測(cè)試的社會(huì)維度研究推向了高潮。
從此,做事測(cè)試社會(huì)維度的研究成為了熱點(diǎn)。
口語(yǔ)測(cè)試為做事測(cè)試的一種,形式多樣,主要為半直接(考生根據(jù)要求錄音、考官根據(jù)錄音評(píng)分)、直接(面試)兩種。目前最常見的是面試:一名考官面對(duì)一名考生的一對(duì)一形式、兩名考官面對(duì)兩名考生的配對(duì)形式(paired format)或兩名考官面對(duì)兩名以上考生的小組形式(group format)。配對(duì)(組)口語(yǔ)測(cè)試中兩名考官承擔(dān)不同的任務(wù):一名考官按照考試要求向考生提問、引導(dǎo)考生完成考試任務(wù)并對(duì)照口試評(píng)分量表對(duì)考生的各項(xiàng)口語(yǔ)能力進(jìn)行評(píng)估,另一名考官不參與提問,主要任務(wù)是充當(dāng)評(píng)分員,對(duì)照口試評(píng)分量表評(píng)估考生的各項(xiàng)口語(yǔ)能力。國(guó)際知名的大型英語(yǔ)水平測(cè)試中雅思(IELTS)口語(yǔ)測(cè)試采用一對(duì)一形式,劍橋第一證書(FCE) 采用配對(duì)形式,我國(guó)的大學(xué)英語(yǔ)四、六級(jí)口試(CET-SET)采用的是配對(duì)延伸形式。近年來(lái),受二語(yǔ)習(xí)得理論發(fā)展以及課堂教學(xué)實(shí)踐理論影響,配對(duì)(組)口試作為測(cè)試語(yǔ)言交際能力的最直接形式越來(lái)越被廣泛采用。
社會(huì)學(xué)家Goffman (1964)認(rèn)為面對(duì)面的口頭交際具有鮮明的社會(huì)性,它遵循一定的規(guī)律、有內(nèi)在的社會(huì)文化法則,規(guī)律和法則通過(guò)語(yǔ)言作為載體來(lái)體現(xiàn)[4]。面對(duì)面互動(dòng)中交際雙方通過(guò)共同承擔(dān)責(zé)任、協(xié)同構(gòu)建交際秩序、完成交際任務(wù)。由此,互動(dòng)交際中的話語(yǔ)及其產(chǎn)生的效應(yīng)并非預(yù)先設(shè)定、更不是某一方單獨(dú)的貢獻(xiàn)?;?dòng)中意義的構(gòu)建并非僅僅取決于對(duì)話者的努力,聽者的配合和貢獻(xiàn)同等重要。配對(duì)(組)口語(yǔ)測(cè)試屬互動(dòng)交際范疇,是考官和考生、考生和考生之間面對(duì)面互動(dòng)的一種測(cè)試形式,融入了非考試狀態(tài)下對(duì)話交際的元素,被認(rèn)為是考生展示真實(shí)交際事件中的不同交際能力的考試[5]。毫無(wú)疑問,配對(duì)(組)口語(yǔ)測(cè)試具有雙向互動(dòng)(interaction)的特性。因此,考試過(guò)程中主體的互動(dòng)具有社會(huì)/行為學(xué)的意義即個(gè)體之間的共同行為構(gòu)成共同表現(xiàn)的基礎(chǔ)[6]??脊倥c考生、考生與考生之間的各方面表現(xiàn)相互影響,期間有諸多因素對(duì)考生的行為和表現(xiàn)起作用。換句話說(shuō),這種特定情景下的口試具有較強(qiáng)的社會(huì)性,考生不再是一個(gè)個(gè)孤立的個(gè)體,考試過(guò)程中的交際參與者已構(gòu)成了“一個(gè)社會(huì)的世界”,被試所得的考試分?jǐn)?shù)并非就是其個(gè)人語(yǔ)言能力的反映,而是交際互動(dòng)者共同構(gòu)建的語(yǔ)言能力反映。對(duì)這類考試成績(jī)的解釋顯然就是對(duì)一種社會(huì)行動(dòng)的解釋。已有研究表明,考生的性別、性格、母語(yǔ)背景、考生之間的熟悉程度、對(duì)話者語(yǔ)言水平等均為影響因素。
口語(yǔ)測(cè)試的目的主要是測(cè)試考生運(yùn)用某種語(yǔ)言進(jìn)行口頭交際的能力。鑒于面對(duì)面的口頭交際帶有的鮮明社會(huì)屬性和配對(duì)口試的社會(huì)性,傳統(tǒng)的以語(yǔ)法、詞匯等語(yǔ)言使用準(zhǔn)確性為主的語(yǔ)言水平構(gòu)念已無(wú)法全面反映個(gè)體語(yǔ)言交際的真實(shí)能力。同樣,基于傳統(tǒng)語(yǔ)言水平構(gòu)念的評(píng)分標(biāo)準(zhǔn)難以體現(xiàn)考生成功從事口語(yǔ)交際的水平。配對(duì)(組)口語(yǔ)測(cè)試中考生的語(yǔ)言水平構(gòu)念必須包括語(yǔ)用能力和社會(huì)語(yǔ)言文化能力。為提高考試的信度和效度,保證分?jǐn)?shù)的詮釋性,語(yǔ)言測(cè)試工作者必須重視將考試作為一種社會(huì)行動(dòng)研究,運(yùn)用微觀分析方法,深入分析“互動(dòng)交際”的本質(zhì),從不同的但又互補(bǔ)的視角詮釋考生最后所得分?jǐn)?shù)的意義[6],從而完善考試設(shè)計(jì)的構(gòu)念、為教學(xué)提供正面的反撥。
傳統(tǒng)的語(yǔ)言測(cè)試效度研究側(cè)重考試結(jié)果的分析,主要范式是基于心理測(cè)量的實(shí)證研究。研究者通常運(yùn)用先進(jìn)的統(tǒng)計(jì)學(xué)方法如多層面Rasch模型、概化理論、結(jié)構(gòu)方程模型等來(lái)研究語(yǔ)言測(cè)試的信度和效度。20世紀(jì)后半葉,受二語(yǔ)習(xí)得研究交際能力培養(yǎng)的轉(zhuǎn)向的影響,語(yǔ)言能力的構(gòu)念開始變化,交際語(yǔ)言測(cè)試開始興起。隨后,受批判語(yǔ)言學(xué)和社會(huì)語(yǔ)言學(xué)影響,批判語(yǔ)言測(cè)試研究推行。語(yǔ)言測(cè)試學(xué)領(lǐng)域開始關(guān)注測(cè)試過(guò)程的研究,測(cè)試社會(huì)維度研究得到重視。因受后現(xiàn)代主義批判理論研究范式的影響,語(yǔ)言測(cè)試研究方法開始轉(zhuǎn)變,定性研究方法或定量與定性結(jié)合的混合方法逐漸被采用。
配對(duì)口試過(guò)程研究主要采用社會(huì)學(xué)的定性研究方法——會(huì)話分析。會(huì)話分析源于民族方法學(xué),它既是民族方法學(xué)的繼承又是對(duì)民族方法論在專業(yè)方向的拓展和延伸,是一種精致地、經(jīng)驗(yàn)性地、形式化地描述社會(huì)行為之細(xì)節(jié)的自然的觀察學(xué)科[7]。會(huì)話分析學(xué)反對(duì)通過(guò)假想的例證研究人們言語(yǔ)行為的規(guī)則,反對(duì)社會(huì)學(xué)常用的訪談、問卷調(diào)查、人種志法等研究,批評(píng)心理學(xué)領(lǐng)域理論先導(dǎo)的試驗(yàn)方法。會(huì)話分析學(xué)追求建立自然、可觀察的社會(huì)(科)學(xué),認(rèn)為社會(huì)科學(xué)的對(duì)象應(yīng)該是可觀察的行為。會(huì)話分析的研究目的是明確說(shuō)明交際者創(chuàng)造社會(huì)有序性的方式和方法。Heritage (1984)認(rèn)為Sacks的會(huì)話分析研究基于以下三個(gè)假設(shè)[8]:(1)人們的日常交際會(huì)話是有組織的,并非雜亂無(wú)章、無(wú)章可循。(2)交際行為是以語(yǔ)境為導(dǎo)向的。一方面語(yǔ)境制約人們的交際行為,話語(yǔ)是順應(yīng)語(yǔ)境的產(chǎn)物;另一方面,任何話語(yǔ)都能構(gòu)建、影響和制約語(yǔ)境。(3)以上兩個(gè)特點(diǎn)存在于交際的細(xì)節(jié)中,研究者在分析話語(yǔ)時(shí)不能放棄任何細(xì)節(jié)。話語(yǔ)并不僅適用于日常會(huì)話研究,它對(duì)于交往中的談話(talk-in-interaction)序列組織的關(guān)注也適用于日常會(huì)話之外的其他交際方式或語(yǔ)體[7]。
CET-SET為配對(duì)(組)口語(yǔ)測(cè)試,以面對(duì)面的口語(yǔ)交際形式呈現(xiàn)。盡管因眾多因素如考試的高風(fēng)險(xiǎn)、考試環(huán)境等的交互作用,這種交際形式不能完全等同于自然會(huì)話,但仍然在Goffman(1983)所謂的交際秩序(interaction order)下進(jìn)行。因此這種交際秩序具有分析性,“其可取的分析方法便是微觀分析”[9]。應(yīng)用語(yǔ)言學(xué)界的知名學(xué)者已通過(guò)研究發(fā)現(xiàn)會(huì)話分析對(duì)于檢驗(yàn)測(cè)試效度的必要性和重要性: Shohamy 認(rèn)為會(huì)話分析應(yīng)是研究口語(yǔ)測(cè)試中互動(dòng)本質(zhì)的工具[10],F(xiàn)ulcher通過(guò)實(shí)踐證明口試的構(gòu)念效度可以通過(guò)話語(yǔ)分析來(lái)驗(yàn)證[11]。van Lier 在研究中發(fā)現(xiàn)口語(yǔ)交際過(guò)程錯(cuò)綜復(fù)雜,要考察語(yǔ)言學(xué)習(xí)者的口語(yǔ)交際表現(xiàn)必須從對(duì)話交際研究的過(guò)程著手,用微觀分析的方法探索口語(yǔ)互動(dòng)過(guò)程中產(chǎn)生的話語(yǔ)本質(zhì)[12]。Lazaraton在博士論文中率先運(yùn)用會(huì)話分析開展口試效度研究,獲得了豐富的定量分析無(wú)法檢測(cè)到的效度證據(jù)[13]。近十年來(lái),除信度仍主要采用先進(jìn)的統(tǒng)計(jì)學(xué)方法研究外,配對(duì)(組)口試效度相關(guān)研究轉(zhuǎn)向以定性和定量相結(jié)合或以定性方法開展,話語(yǔ)分析成為收集效度證據(jù)的有效方法。借鑒民族方法學(xué)的社會(huì)學(xué)研究方法,研究者首先將考試過(guò)程完整地錄音錄像,依據(jù)國(guó)際學(xué)術(shù)界公認(rèn)的轉(zhuǎn)寫系統(tǒng)將口試參與者(考官、考生等)的會(huì)話完整地轉(zhuǎn)寫成文字,通過(guò)逐輪的(turn-by-turn)會(huì)話分析,探索會(huì)話互動(dòng)中影響話語(yǔ)產(chǎn)出和口試成績(jī)的因素。十余年的研究表明,會(huì)話分析測(cè)試過(guò)程效果良好、啟發(fā)深刻。通過(guò)會(huì)話分析,我們才有可能辨析交際者(尤指考生)通過(guò)語(yǔ)言運(yùn)用(performance)展示自己的語(yǔ)言能力(competence)、剖析交際者之間受互動(dòng)情景影響共建語(yǔ)言能力的過(guò)程。分析所得到的大量信息和證據(jù)彌補(bǔ)心理測(cè)量的缺陷,是可信的效度檢驗(yàn)方法[14]。
口語(yǔ)測(cè)試反映的是考生和考官共同構(gòu)建的語(yǔ)言能力(joint construction of performance),這一特點(diǎn)對(duì)于口語(yǔ)測(cè)試效度極具挑戰(zhàn)性。而研究測(cè)試環(huán)境下的交互交際社會(huì)特征對(duì)口語(yǔ)測(cè)試效度不失為一個(gè)有力的理論支撐。由多個(gè)直接參與者的口試交互交際看似微觀但蘊(yùn)藏著多個(gè)宏觀社會(huì)學(xué)相關(guān)范疇的問題。最近十幾年中,國(guó)內(nèi)外學(xué)者已開展了針對(duì)配對(duì)口試的效度研究(Davis[注]①Davis,L. The influence of partner proficiency in a paired oral assessment[D]. St Paul: America University of Minnesota,2007.28.,2007;Davis[注]②Davis, L. The influence of interlocutor proficiency in a paired oral assessment[J]. Language Testing,2009,(26):367-396.,2009;Lazaraton[注]③④⑤Lazaraton,A. A qualitative approach to monitoring examiner conduct in CASE[M]. Cmabridge: Cambridge University Press,1996.18-33. Lazaraton, A. Interlocutor support in oral proficiency interviews: The case of CASE[J]. Language Testing, 1996,(13):151-172.Lazaraton,A. A qualitative approach to the validation of oral language tests[M].Cambridge: Cambridge University Press,2002.1-6.,2008)。 主要的效度研究尤其是關(guān)于考試社會(huì)性相關(guān)的效度研究有如下幾個(gè)方面:
1.構(gòu)念效度研究。構(gòu)念效度指的是測(cè)試中的表現(xiàn)與基于能力或構(gòu)念理論所作出的預(yù)測(cè)之間的一致性(Bachman, 1990)。研究構(gòu)念效度主要是驗(yàn)證測(cè)試能夠測(cè)量到理論上的構(gòu)想或特質(zhì)的程度。因口語(yǔ)測(cè)試的特性,國(guó)內(nèi)外大規(guī)模口語(yǔ)測(cè)試包括配對(duì)(組)口語(yǔ)測(cè)試、口語(yǔ)面試等在考試設(shè)計(jì)構(gòu)念中都會(huì)包含語(yǔ)用能力和社會(huì)語(yǔ)言文化能力等要素,但迄今為止僅有少數(shù)相關(guān)的實(shí)證研究構(gòu)念在任務(wù)和考生考試表現(xiàn)中的實(shí)現(xiàn)情況。換言之,任務(wù)(即測(cè)試的題型、每個(gè)題型下的題目、考試設(shè)計(jì)的活動(dòng)等)是否能使考生展示構(gòu)念預(yù)設(shè)的能力、考試過(guò)程中考生的表現(xiàn)是否與考試設(shè)計(jì)者的意圖吻合缺乏研究。就配對(duì)口測(cè)試而言,國(guó)內(nèi)外共有兩個(gè)典型的構(gòu)念效度實(shí)證研究。He & Dai(2006)基于17 萬(wàn)字的大學(xué)英語(yǔ)四、六級(jí)口語(yǔ)測(cè)試語(yǔ)料庫(kù),運(yùn)用定量和定性相(會(huì)話分析)結(jié)合方法分析小組討論活動(dòng)中考生運(yùn)用交互語(yǔ)言功能的情況。通過(guò)對(duì)48個(gè)小組討論的分析,發(fā)現(xiàn)考生之間交互性較低, 考試大綱中列出的諸如支持或挑戰(zhàn)對(duì)方觀點(diǎn)、修改、勸說(shuō)、繼續(xù)交談、意義協(xié)商等交互語(yǔ)言功能運(yùn)用頻率低,有的甚至為0。該研究表明了大學(xué)英語(yǔ)四、六級(jí)口語(yǔ)測(cè)試小組活動(dòng)中交互語(yǔ)言功能構(gòu)念的不充分代表性(construct underrepresentation)[15]。Galaczi(2013)針對(duì)劍橋口語(yǔ)測(cè)試中的考生間互動(dòng)交際任務(wù)部分進(jìn)行了研究[16]。她主要通過(guò)定量和定性(會(huì)話分析)混合方法研究不同英語(yǔ)水平考生在劍橋英語(yǔ)配對(duì)口試中表現(xiàn)的互動(dòng)交際能力(interactional competence),發(fā)現(xiàn)實(shí)際考試中考生表現(xiàn)出的互動(dòng)交際能力超過(guò)評(píng)分標(biāo)準(zhǔn)中描述的范疇,證明已有評(píng)分標(biāo)準(zhǔn)互動(dòng)交際能力描述不夠充分。Galaczi提出:互動(dòng)交際能力是個(gè)廣義的概念,它包括話輪內(nèi)部和話輪之間的主題發(fā)展(topic development),比如發(fā)起主題、回應(yīng)等,也包括話輪轉(zhuǎn)換策略和積極聆聽(active listening) 。 Galaczi的研究結(jié)論是:無(wú)論在課堂教學(xué)中還是在考試設(shè)計(jì)中,我們對(duì)互動(dòng)交際能力的理解不能僅限于一些互動(dòng)交際特征層面,還應(yīng)將會(huì)話?cǎi)雎犝叩闹С植呗?listener support strategies)、話輪轉(zhuǎn)換策略等等納入互動(dòng)交際能力范疇 。
2.對(duì)話者效應(yīng)研究?!皩?duì)話者效應(yīng)”是口語(yǔ)測(cè)試的研究焦點(diǎn)之一。因配對(duì)(組)口試中考官參與互動(dòng)的頻率極低,對(duì)話者效應(yīng)研究主要圍繞考生進(jìn)行。在互動(dòng)交際責(zé)任共同承擔(dān) 、意義共同構(gòu)建的配對(duì)(組)口語(yǔ)測(cè)試中,對(duì)話者(即配對(duì)考生)的語(yǔ)言水平、互動(dòng)交際能力、性別、年齡、性格等都是影響考生表現(xiàn)的因素??忌g的交互具有雙向互動(dòng)特性(McNamara,1997),考試使用者較難從考分中推斷個(gè)體考生的口語(yǔ)水平,考試分?jǐn)?shù)其實(shí)是交互者共同構(gòu)建的結(jié)果。同輩考生交互效應(yīng)隨之成為研究該口試效度的焦點(diǎn)。
不同背景和身份的考生配對(duì)或配組共同完成口語(yǔ)測(cè)試任務(wù)時(shí),其口語(yǔ)水平表現(xiàn)方式、方法和程度會(huì)相互影響[14],已有會(huì)話分析研究發(fā)現(xiàn):不同語(yǔ)言水平考生配對(duì)后,水平高的考生控制整個(gè)交互過(guò)程而水平低的幾乎無(wú)法平等地進(jìn)行交際[17];配對(duì)考生之間的熟悉度影響考生句子結(jié)構(gòu)、詞匯的使用與選擇[18],當(dāng)考生與朋友配對(duì)時(shí),語(yǔ)言精確度、所得的分?jǐn)?shù)明顯高于其與陌生人配對(duì)時(shí)[19]。劍橋第一證書口試錄音(像)資料分析顯示:配對(duì)考生之間互動(dòng)交際采用的話語(yǔ)策略以及交互的總體模式與其口語(yǔ)考試“互動(dòng)交際(IC)”部分的得分密切相關(guān):對(duì)話雙方自始至終非常配合的小組IC中位數(shù)分別為4.5/5和4.25/5;而對(duì)話雙方缺乏交互、以各自陳述為主的小組獲得的IC中位數(shù)較低,分別只有3. 45/5[20]。Berry(2004)研究考生外向程度對(duì)考試成績(jī)的影響,協(xié)方差計(jì)算(ANCOVA)發(fā)現(xiàn):外向(n=78)和內(nèi)向性格的(n=85)受試與平均外向程度高的配組時(shí)口試分?jǐn)?shù)較高,而內(nèi)向型受試與平均外向度低的配組后口試分?jǐn)?shù)比預(yù)期差(Ockey,2009)。 Ockey(2009)運(yùn)用綜合人格調(diào)查問卷和周密的配組方法,考察日本225名英語(yǔ)專業(yè)學(xué)生性格特征與口試分?jǐn)?shù)的關(guān)系,發(fā)現(xiàn):自信考生的口試分?jǐn)?shù)受其組員的自信程度影響,而自卑考生口試分?jǐn)?shù)與其組員自信程度無(wú)關(guān)[21]。樓荷英(2013)對(duì)大規(guī)??谡Z(yǔ)測(cè)試小組討論活動(dòng)中考生的表現(xiàn)進(jìn)行了深入研究,發(fā)現(xiàn)在配組口試的環(huán)境下,考生的性格與其互動(dòng)能力表現(xiàn)無(wú)關(guān)。此外,也有零星的研究表明考生的焦慮程度、學(xué)習(xí)背景等特點(diǎn)對(duì)考試表現(xiàn)有一定影響[22]。
為數(shù)不多的配對(duì)(組)口語(yǔ)測(cè)試對(duì)話者效應(yīng)研究中最值得一提的是Lazaraton and Davis開展的研究[23]。他們認(rèn)為考生通常將多種身份帶入開始中,而這些身份隨環(huán)境的變化而變化。研究中Lazaraton and Davis將社會(huì)學(xué)的身份理論、語(yǔ)言測(cè)試的社會(huì)性理論為主要理論框架,運(yùn)用會(huì)話分析的微觀視角, 研究分析劍橋ESOL’s FCE和PET配對(duì)(組)口語(yǔ)測(cè)試中考生定位其“語(yǔ)言水平身份”的過(guò)程、驗(yàn)證真實(shí)考試中考生的話語(yǔ)特征與最后得分的關(guān)系。Lazaraton and Davis從配對(duì)(組)口語(yǔ)測(cè)試的社會(huì)視角出發(fā),將考生的語(yǔ)言水平確定為一種社會(huì)身份,通過(guò)轉(zhuǎn)寫口試錄像材料、分析每組對(duì)話中考生的交互過(guò)程,考察考生所帶入的身份在互動(dòng)交際過(guò)程中是否變化、如何變化、考生是否“共同構(gòu)建”語(yǔ)言水平等,最后對(duì)照考生已得的口試分?jǐn)?shù)與會(huì)話分析發(fā)現(xiàn)的“擬合度”。該研究最后得出的結(jié)論是:考生的語(yǔ)言水平隨著配對(duì)對(duì)象的語(yǔ)言水平及其在互動(dòng)中的發(fā)揮和激活程度而動(dòng)態(tài)變化。在配對(duì)(組)口語(yǔ)測(cè)試環(huán)境下,考生的語(yǔ)言水平身份通過(guò)配對(duì)互動(dòng)交際展演、認(rèn)同、重新構(gòu)建,身份定位過(guò)程可以通過(guò)會(huì)話分析全面呈現(xiàn),考生的會(huì)話特征(discourse features)與其所得的口試分?jǐn)?shù)緊密相關(guān)。該項(xiàng)研究跨學(xué)科且視角新穎,其研究發(fā)現(xiàn)不僅填補(bǔ)語(yǔ)言測(cè)試社會(huì)維度研究方面的空白從而引起高度關(guān)注,而且會(huì)對(duì)拓寬今后語(yǔ)言測(cè)試界的研究思路產(chǎn)生顯著作用,對(duì)促進(jìn)應(yīng)用語(yǔ)言學(xué)跨學(xué)科研究具有深刻的意義。
總體來(lái)說(shuō),關(guān)于配對(duì)(組)口語(yǔ)測(cè)試社會(huì)性的研究尚在起步階段,已有研究多數(shù)具有樣本小、缺乏代表性等特點(diǎn),對(duì)同一問題的研究結(jié)果各異?;诖笠?guī)??荚嚨臉颖痉治鋈狈?,基于大規(guī)??荚嚇颖厩医沂窘换ミ^(guò)程中對(duì)話者(interlocutor)的行為與分?jǐn)?shù)的關(guān)系的研究?jī)H有兩項(xiàng),并且都是針對(duì)同一項(xiàng)考試——?jiǎng)虻谝蛔C書(FCE)進(jìn)行[20][23]。在中國(guó),類似研究仍為個(gè)位數(shù)。
配對(duì)(組)形式不僅在交際語(yǔ)言教學(xué)課堂中越來(lái)越受歡迎,而且正成為口語(yǔ)測(cè)試的主要形式之一。但該形式在國(guó)外口語(yǔ)測(cè)試中已使用二十多年,其效度研究尤其是實(shí)證性研究?jī)H始于二十一世紀(jì)初,有許多效度相關(guān)的維度尚無(wú)研究報(bào)道。隨著配對(duì)(組)口試形式越來(lái)越多地運(yùn)用在國(guó)內(nèi)外高風(fēng)險(xiǎn)測(cè)試中如雅思(IELTS)、劍橋口語(yǔ)證書考試、大學(xué)英語(yǔ)四、六級(jí)口試、公共英語(yǔ)等級(jí)考試(PETS),考試的效度勢(shì)必會(huì)不斷引起利益相關(guān)者(stakeholder)的高度關(guān)注。而對(duì)于此類考試,要盡量保證測(cè)試結(jié)果的詮釋性、保證考試的效度,口試社會(huì)視角的研究必不可少。
隨著語(yǔ)言測(cè)試研究領(lǐng)域范式的多元化和語(yǔ)言測(cè)試社會(huì)維度研究的進(jìn)一步深入,研究者將完善建構(gòu)主義研究范式——民族志研究( ethnographic studies) , 并將這種方法與基于后實(shí)證主義研究范式的定性研究相結(jié)合。今后,研究者不僅充當(dāng)一個(gè)立場(chǎng)中立的外部觀察者,而是更加貼近研究對(duì)象、以一個(gè)“局內(nèi)人(insider)的身份開展研究。因此,會(huì)話分析將成為分析和揭示口語(yǔ)測(cè)試具體過(guò)程微觀細(xì)節(jié)重要的、必不可少的工具和研究方法。通過(guò)精致的會(huì)話分析,語(yǔ)言測(cè)試研究者挖掘考生互動(dòng)中的話語(yǔ)特征、獲得實(shí)證主義研究難以提供的大量信息,用來(lái)檢驗(yàn)評(píng)分的正確性和合理性、收集考生口語(yǔ)能力表現(xiàn)的特征,從而豐富驗(yàn)證測(cè)試效度的證據(jù)。
然而,如上文所述,配對(duì)(組)口語(yǔ)測(cè)試的社會(huì)視角研究仍然處于初始階段,許多只是嘗試性研究。為充分驗(yàn)證配對(duì)(組)口試的效度,完善其考試設(shè)計(jì),以下幾個(gè)方面將是今后研究的主要方向:(1)基于大樣本、深入研究高風(fēng)險(xiǎn)、大規(guī)??荚囍信鋵?duì)(組)口試的社會(huì)視角研究。研究的考試將不局限于國(guó)際性的英語(yǔ)水平考試,各國(guó)具有規(guī)模效應(yīng)的口語(yǔ)測(cè)試都有可能作為研究對(duì)象,同時(shí),樣本將不再局限于英語(yǔ)作為外語(yǔ)的日本學(xué)生、在歐美留學(xué)的中國(guó)學(xué)生等,將擴(kuò)大到參加各類考試的受試。我國(guó)的大學(xué)英語(yǔ)四、六級(jí)口語(yǔ)測(cè)試、公共英語(yǔ)等級(jí)考試因樣本的規(guī)模、考生的英語(yǔ)學(xué)習(xí)背景、考生英語(yǔ)學(xué)習(xí)的環(huán)境等方面的特點(diǎn)都將是值得研究的對(duì)象。與此同時(shí),研究也將延伸到除英語(yǔ)以外的其他語(yǔ)種口語(yǔ)測(cè)試中。(2)配對(duì)(組)口試相關(guān)的構(gòu)念研究。口語(yǔ)能力的構(gòu)成要素迄今為止眾說(shuō)紛紜。考試開發(fā)和設(shè)計(jì)時(shí)的構(gòu)念差異直接影響評(píng)分量表描述,從而影響評(píng)分的客觀性和公平性。目前,口語(yǔ)能力構(gòu)念主要基于理論研究,研究表明真實(shí)考試過(guò)程中考生表現(xiàn)的口語(yǔ)能力與設(shè)計(jì)構(gòu)念存在明顯差異[15-16]。因此,有必要通過(guò)微觀分析語(yǔ)料歸納考生的互動(dòng)交際特征、影響交際的語(yǔ)境因素,通過(guò)大量真實(shí)考試語(yǔ)料分析收集口語(yǔ)能力構(gòu)念證據(jù)彌補(bǔ)偏重理論研究形成構(gòu)念的缺陷。(3)考生特質(zhì)如性別、年齡、熟悉程度、性格、母語(yǔ)背景等方面對(duì)于考試表現(xiàn)及其最后成績(jī)影響將繼續(xù)成為研究的重點(diǎn)?,F(xiàn)有研究數(shù)量少、規(guī)模小、結(jié)論迥異,不足以證明考生某個(gè)特質(zhì)對(duì)考試過(guò)程中的表現(xiàn)的真實(shí)影響。在已有相關(guān)研究基礎(chǔ)上,擴(kuò)大研究規(guī)模、拓展研究領(lǐng)域,開展與心理學(xué)、社會(huì)學(xué)等學(xué)科的交叉研究將成為必然。
此外,受批判語(yǔ)言測(cè)試的進(jìn)一步影響,口語(yǔ)測(cè)試與其他測(cè)試一樣,將置于更加廣闊的社會(huì)政治語(yǔ)境中,對(duì)測(cè)試后效(consequences)的反思不再局限于反撥效應(yīng)(washback),而是重新審視測(cè)試中滲透的權(quán)力與控制,測(cè)試所具有的社會(huì)價(jià)值、政治功能等[24]。考試的測(cè)試后果、道德和公平性等社會(huì)問題也將成為研究的熱點(diǎn)。
參考文獻(xiàn):
[1] Messick,S.Validity in Educational measurement[M].New York:American Council on Education & Mcmillan,1989 .13-103.
[2] Bachman,L. Fundamental considerations in language testing[M].Oxford:Oxford University Press,1990.81-107.
[3] McNamara,T.& Roever,C. Language testing: The social dimension[J].Language Learning,2006,(2):1-291.
[4] Goffman, E. The neglected situation[J]. American Anthropologist,1964,(66):133-136.
[5] Brown,A. Interviewer variation and the co-construction of speaking proficiency[J]. Language Testing,2003, (1):1-25.
[6] McNamara,T.F. “Interaction” in second language performance assessment: Whose performance?[J].Applied Linguistics,1997,(18):446-465.
[7] 于國(guó)棟.會(huì)話分析[M].上海:上海外語(yǔ)教育出版社,2008.4,30.
[8] Atkinson, J. M.& Heritage.Structures of social action:Studies in conversation analysis[M]. Cambridge: Cambridge University Press,1984.1-15.
[9] Goffman,E. The interaction order[J].American Sociological reviewing ,1983,(8):1-17.
[10] Shohamy,E. Discourse Analysis and Language Testing[J].Annual Review of Applied Linguistics,1991,(11):115-131.
[11] Fulcher, G.Test of oral performance: The need for data-based criteria[J]. EST Journal,1987,(41):287-291.
[12] van Lier, L. Reeling, Writhing, Drawling, Stretching, and Fainting in Coils:Oral Proficiency Interviews as Conversation[J]. TESOL Quarterly,1989,(23):489-508.
[13] Lazaraton, A. A conversation Analysis of Structure and Interaction in the Language Interview[D]. Los Angeles :University of California at Los Angeles,1991.65-90.
[14] McNamara, T. Discourse and assessment[J].Annual Review of Applied Linguistics,2002,(22): 22-43.
[15] He, L. & Dai, Y.A corpus-based investigation into the validity of the CET-SET group discussion[J]. Language Testing,2006,(3):370-401.
[16] Glaczi, E. Interactional competence across proficiency levels: How do learners manage interaction in paired speaking tests?[J]. Applied Linguistics,2013,(30):1-23.
[17] Iwashita,N. The validity of the paired interview format in oral performance assessment[J].Melbourne Papers of Language Testing,1998,(2):51-65.
[18] Norton, J.The paired format in the Cambridge speaking tests[J]. ELT Journal,2005,(59): 287-297.
[19] O’Sullivan,B. Learner acquaintanceship and oral proficiency test pair-task performance[J].Language Testing, 2002,(19):277-295.
[20] Galaczi,E. Peer-peer interaction in a speaking test: The case of the First Certificate in English examination[J]. Language Assessment Quarterly, 2008,(5):89-119.
[21] Ockey, G. The Effect of Group Members’ Personalities on a Test-taker’s L2 Group Oral Discussion Test Scores[J]. Language Testing ,2009, (2): 161-186.
[22] LOU He-ying. The relationship between test-takers’ personality and their interactional competence——A mixed approach[D]. Hangzhou:Thejiang University,2013.56.
[23] Lazaraton.A. & Davis.L. A Microanalytic Perspective on Discourse, Proficiency, and Identity in Paired Oral Assessment[J].Language assessment Quarterly,2008,(4):313-335.
[24] 何蓮珍,呂洲洋.語(yǔ)言測(cè)試研究的新視角:批判語(yǔ)言測(cè)試[J].浙江大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013,(6):164-173.