趙日彰,蔡雅薰,郭伯臣,林振興
(1.新生醫(yī)護管理??茖W校,臺灣,桃園 32544;2.4.臺灣師范大學,臺灣,臺北 10610;3.臺中教育大學,臺灣,臺中 40306)
基于語言知識模式之漢語交際能力評量研究
趙日彰1,蔡雅薰2,郭伯臣3,林振興4
(1.新生醫(yī)護管理??茖W校,臺灣,桃園 32544;2.4.臺灣師范大學,臺灣,臺北 10610;3.臺中教育大學,臺灣,臺中 40306)
交際能力;語言知識模式;語言技能模式;歐洲共同語言參考架構
本研究的目的是建立融入文化和語用知識的漢語交際能力測驗。試題編制主要是參考CEFR語言交際的能力指標,同時涵蓋43道個別和整合任務型的試題。本研究在測驗的建置上,主要貢獻有三:1)考慮華人文化知識和生活習慣等漢語使用時的情境和交際任務;2)考慮漢語交際時個別和整合型的任務;3)同時測量漢語交際能力及其三種領域(語言、社會語言和語用)能力。實證資料分析發(fā)現(xiàn),女性華裔學生的漢語總體交際能力顯著高于男性。其次由于僑居地接觸漢語機會的高低不同,華裔學生在漢語語言能力上有顯著的國別差異,但是在漢語社會語言和語用能力上則均沒有顯著的差異。
全球化的來臨加速了人與人之間的互動關系,造成這些互動的原因不論是來自于貿(mào)易、工作或教育的需求等,都需依賴彼此之間可以相互交際才能達成目的。所以學習語言主要的目的就是為了協(xié)助與人交際或互動時,可以達到目的并解決問題(Brown,2006)。近年來由于亞洲經(jīng)濟的崛起,加上中國自20世紀80年代以來的改革開放,帶動華人經(jīng)濟的活絡,世界人士的眼光一齊匯聚到亞洲華人地區(qū)?!爸袊鵁帷蓖瑫r帶動起全球漢語學習的熱潮。因此,評量第二語言學習者的漢語能力在各國之間已經(jīng)逐漸地受到重視,而評量學習者第二語言漢語交際能力則更有其必要性。
1.1 語言技能模式(language skill approach)
對于第二語言交際能力的描述通常可分為語言技能模式和語言知識模式兩種。語言技能模式是依照交際時學習者使用的聽覺(audio)和視覺(visual)兩種渠道(channel)以及他們對于語言的接受(receptive)和產(chǎn)出(pro ductive)兩種方式(mode),將學習者的第二語言交際能力分成聽、讀、說、寫四種語言技能(Carroll,1968a;Carroll,1972;Lado,1961)。語言技能模式是現(xiàn)今評量第二語言交際能力時主要采用的模式,例如以英文作為第二語言的托??荚嚕═est of English as a Foreign Language,TOEFL)(Jamieson et al.,2000)。在漢語能力的測驗中,不論是中國大陸的新漢語水平考試(Hanyu Shuiping Kaoshi,新HSK)(HSK,2011),還是美國的AP中文考試(AdvancedPlacementChineseLanguageand Culture Exam)(CollegeBoard,2012a;CollegeBoard,2012b),或是臺灣的華語測驗(TOCFL,Test of Chinese as a Foreign Language)(SC-TOP,2011a;SC-TOP,2011b)也都是采用語言技能模式,以聽、讀、說、寫四種技能評量學習者的漢語交際能力。
1.2 語言知識模式(language knowledge approach)
Bachman(1990)認為采語言技能模式所定義的第二語言交際能力有其缺陷之處:首先,以聽、讀、說、寫四種語言技能所定義的第二語言交際能力,在不同的語言使用的活動中,雖然使用相同語言技能,但是這種技能卻無法有效區(qū)別兩種語言活動之間交際能力的差異。例如使用在一般對話過程中的聽力和收聽廣播節(jié)目的聽力,若是采用語言技能模式,兩者之間交際能力之差異是無法區(qū)辨的。其次他認為第二語言交際能力應考慮語言使用時的情境。因為語言的使用并非無中生有,而是和學習者在使用第二語言進行交際時所處的情境有密切的關系。但是語言技能模式在衡量學習者的第二語言交際能力時,完全不考慮學習者在使用語言進行交際時所處的情境問題(Bachman&Palmer,1997)。
采語言知識模式闡述學習者第二語言交際能力主要包括兩種論述:Bachman模式(Bachman's model)和歐洲共同語言參考架構(the Common European Framework of Reference for languages,CEFR)(Purpura,2010)。Bachman模式依照語言知識,將學習者的交際能力分成語言知識(language knowledge or language competence)和策略能力(strategic competence,or a set of metacognitive strategies)(Bachman,1990)。語言知識包含組織知識(organizational knowledge)和語用知識(pragmatic knowledge);策略能力則包含目標設定(Goal setting)、評估(Assessment)和計劃(Planning)三種后設認知的能力(Bachman&Palmer,1997)。歐洲共同語言參考架構在建構第二語言交際能力時,主要是基于語言學習者所需要知道的知識以及他們能力所能夠做到的事,作為衡量各等級交際能力的參考標準。歐洲共同語言參考架構采語言知識模式所建構的第二語言交際能力包含一般語言能力(a set of general competences)和特殊語言能力(a set of language-specific competences)兩種。一般語言能力包含社會文化知識(sociocultural knowledge)和跨文化意識(intercultural awareness)兩種語言知識;特殊語言能力包含語言能力(linguistics)、社會語言能力(sociolinguistics)和語用能力(pragmatics)三種領域能力(Council of Europe,2001)。目前漢語交際能力的評量并沒有采用這種模式。
2.1 文化知識
中華文化已有數(shù)千年的歷史,其語言又有其歷史的延續(xù)性;他的演化隨著年代,不斷地融入各地的文化、生活型態(tài)和方言。研究指出以英文作為第二語言的學習者,在使用英文進行交際時,社會文化能力較低者比較容易誤解對方的語意(Blum-Kulka et al.,1989;Kasper&Dahl,1991)。同樣情況也發(fā)生在以漢語作為第二語言的學習者身上。因為就中國人而言,在進行語言交際時,尚可能因為語言內(nèi)包含較為深層的文化涵義而誤解對方的原意,更何況是以漢語作為第二語言的學習者。因此,以漢語作為第二語言的學習者在使用漢語進行交際時,除了需具備良好的漢語的詞匯和語法等語言知識外,還需熟悉華人文化、歷史以及風俗習慣,才能確實掌握并了解交際的內(nèi)容,因為文化素養(yǎng)和語言表達是密切不可分的。
Campbell&Rosenthal(2000)從文化的觀點觀察發(fā)現(xiàn),傳承語(heritage language)學習者對于目標語(target language)文化知識的了解程度,比外國語(foreign language)學習者深,因為傳承語(heritage language)學習者在其日常的生活中就能習得目標語的文化知識。Valdés(2001)認為傳承語學習者可視為是雙語的學習者。華裔學生學習漢語時,不但各有不同多元文化背景、多元需要和學習動機,更有著他們處于不同華人社群的交際任務和目的。因此,在評量漢語交際能力時,學習者對于漢語文化知識的了解程度,都應納入作為評量學習者交際能力的考慮因素。
2.2 多面向的知識
透過實際測驗數(shù)據(jù)證明,第二語言的交際能力是屬于一種多面向的知識模式(a multicomponential model of knowledge)(Oller,1979;Oller,1983;Oller&Jonz,1994)。也就是說第二語言交際能力常被視為一種多面向的知識結構(multicomponential consturct)(Kunnan,1998),包含數(shù)個不同領域的能力。例如歐洲共同語言參考架構采語言知識模式所定義的交際能力包含語言、社會語言、語用三種領域能力。其中語言能力包括詞匯、音韻、語法等的知識。社會語言能力也就是社會文化能力,具體來說是指運用語言交際時,語言用戶能顧及和掌握語言使用時社會層面所需的知識。語用能力則著重語言用戶對于篇章的精熟程度,對于上下文的連貫性,以及不同文體間的識別能力(Council of Europe,2001;多媒體英語學會譯本,2007;蔡雅薰,2009)。研究發(fā)現(xiàn)采用語言知識模式所進行的測驗數(shù)據(jù)分析,比采用語言技能模式更能闡明交際能力多面向的語言知識特性(Purpura,2010)。
2.3 高階層的知識
再則由實際測驗數(shù)據(jù),在檢驗語言知識的因素結構研究中也發(fā)現(xiàn),語言知識包含著一個高階層的因素(a general higher order factor)和數(shù)個不同的因素(several distinct factors)(Bachman&Palmer,1982;Harley et al.,1990;Purpura,2010;Sasaki,1999;Vollmer&Sang,1980)。也就是說在第二語言交際能力多面向的知識特性中,涵蓋著一個高階層知識因素的結構。因此,第二語言交際能力測驗的能力架構應視為一個高階層的能力架構。例如基于歐洲共同語言參考架構采語言知識模式的測驗,交際能力的能力架構應包含一個高階層能力(交際能力)和三個領域能力(語言、社會語言和語用能力)的能力架構。目前并沒有任何漢語交際能力測驗的能力架構涵蓋并測量高階層能力。
3.1 個別任務型與整合任務型試題
由于第二語言交際能力具有多面向知識的特性,因此語言測驗專家建議采用個別任務型(separate task)試題與整合任務型(integrate task)試題來評量第二語言的交際能力(Harris&Palmer,1970;Lado,1961)。整合任務型試題是指使用任務型的試題同時測量學習者兩個面向以上的語言知識;個別任務型試題則指試題只測量學習者個別或單一的語言知識。Carroll(1968)指出,以任務型試題測量交際能力時,試題的題型應該同時涵蓋個別任務型的試題和整合任務型的試題。Carroll的觀點廣泛地影響后來的語言測驗的命題發(fā)展趨勢;托??荚嚨拿},第一次的測驗就同時包含了個別任務型試題和整合任務型試題(Purpura,2010)。直到現(xiàn)在,托福網(wǎng)絡測驗(TOEFL-iBT)也都是采用同時包含個別任務型和整合任務型的試題來測量受試者英文的交際能力(ETS,2012)。就目前的漢語能力測驗而言,只有美國的AP中文考試是同時采用個別任務型和整合任務型的試題來測量受試者的漢語交際能力,其余如華語測驗或新HSK以都只采用個別任務型的試題來評量受試者的漢語交際能力。
3.2 漢語交際能力指標
歐洲共同語言參考架構是國際上公認的非常重要的能力指標之一。全球目前除了歐盟各國之外,還有很多國家的語言能力標準都是參考歐洲共同語言參考架構而制定的。歐洲共同語言參考架構將學習者的交際能力以明確且層級分明的指標,依照學習者交際能力的等級差異分成三等(基礎、獨立、精熟)六級(入門和基礎、進階和高階、流利和精通)。臺灣的華語測驗即是采用歐洲共同語言參考架構各等級的能力指標作為評量的依據(jù)。華語測驗各級測驗對應歐洲共同語言參考架構各能力等級的對應表請參見表1。學習者若通過華語測驗的基礎級測驗,其漢語交際能力是對應歐洲共同語言參考架構的A2級;進階級對應B1級;高階級對應B2級;流利級主要對應C1級(SC-TOP,2011a)。蔡雅薰(2009)考慮臺灣對外漢語教學與第二語言學習的實際情況,針對歐洲共同語言參考架構各等級的能力指標進行修正,發(fā)展出適合臺灣對外漢語教學教師、學習者以及測驗人員參考使用的能力指標。因此在臺灣的漢語交際能力測驗,尚有王暄博、蔡雅薰、郭伯臣和趙日彰(2012)直接以歐洲共同語言參考架構的語言技能模式為基礎所建構的漢語交際能力測驗(Wang's CPT)(Wang et al.,2012)。
在第二語言交際能力的評量中,許多學者認為采用Bachman模式評量受試者的語言交際能力,在實務的執(zhí)行上是不可行的。主要原因認為Bachman模式所建構的語言交際能力的范圍既廣又深,不但內(nèi)容太過抽象,而且對于語言測驗目的的構成因素,優(yōu)先級不明確(Chalhoub-Deville&Deville,2005;Kunnan,1998;McNamara,2003;O'Sullivan,2011)。其次,在第二語言交際能力多面向的知識結構中,各個面向知識間彼此互動情形仍未厘清(Douglas,2000;Shehan,1988)。因此,McNamara認為Bachman模式所定義的第二語言交際能力缺乏互動或社會面向(interactional/social dimension)(Chalhoub-Deville,1997;Chalhoub-Deville,2003;Chalhoub-Deville&Deville,2005;Kramsch,1986;Kramsch,1998;McNamara,2003;Young,2000)。相對于Bachman模式,歐洲共同語言參考架構采語言知識模式所定義的交際能力,將學習者對于目標語的文化知識納入作為考慮的因素。這種第二語言交際能力的分級模式很快獲得了第二語言教學、測驗等領域?qū)<业囊恢抡J同,并廣泛地使用在歐盟及世界其他各國第二語言學習的課程綱要、課程指引、評量和教材編制等領域之中(O'Sullivan,2011)。
表1:臺灣華語測驗各級測驗和CEFR各級能力對照表
3.3 高階層試題反應理論
試題反應理論(Item Response Theory,IRT)能克服古典測驗理論的缺點。以試題反應理論為基礎的測驗,是近幾年國際語言測驗與評量發(fā)展主要的趨勢。很多大型的測驗都采用試題反應理論作為測量的基礎模式。例如:美國用來評量學生成就的“國家教育發(fā)展評量”(NAEP,NationalAssessmentofEducational Progress)(Lee et al.,2007;張鈿富、吳慧子,2006)或是“國際數(shù)學與科學教育成就趨勢調(diào)查”(TIMSS,Trends in International Mathematics and Science Study)(Mullis et al.2007)或者是針對各國7年級以上的15歲學生所做的“學生能力國際評量計劃”(PISA,The ProgrammeforInternationalStudentAssessment)(OECD,2005)等都是采用試題反應理論模式而發(fā)展的國際大型標準測驗。在第二語言能力測驗方面,在英文測驗如托??荚嚕∕cKinley&Way,1992);在漢語測驗方面,如Wang's CPT(Wang et al.,2012),都是以試題反應理論為基礎而發(fā)展的測驗模式(Wang et al.,2012)。
試題反應理論的基本假設為單向度的能力(unidimensionality)(Weiss&Yoes,1991)。對于非單一向度能力的測驗除了采用多次測驗的方式之外,一般采用多向度(multidimensional)測驗模式,亦可兼顧并考慮各領域間能力的相關性問題(Adams et al.,1997;de la Torre,2008;de la Torre&Patz,2005)。例如PISA以多向度測驗模式測量學習者對于連續(xù)文本和非連續(xù)文本兩個領域的閱讀能力,作為評量學習者閱讀素養(yǎng)之依據(jù)(OECD,2005;國立臺南大學PISA國家研究中心,2009)。但是多向度測驗模式并不適合運用在包含更復雜高階層能力的第二語言交際能力的測驗模式之中。對于涵蓋高階層能力架構的測驗,最新的研究趨勢則是建議采高階層試題反應理論模式,以線性關系的數(shù)學模式,同時測量學習者總體能力及其數(shù)個領域能力(de la Torre et al.,2011;Song,2007)。目前并沒有采高階層試題反應理論模式的漢語交際能力測驗。
4.1 試題編制
本研究在試題的編制上,試題的設計是針對歐洲共同語言參考架構獨立級(B級)以上的受試者而研發(fā),主要的目的是評量他們的漢語交際能力。本研究的試題編制流程如下圖1所示。試題編制的流程雖是以線性的方式呈現(xiàn),實際執(zhí)行時,也會透過循環(huán)修正的方式以確保試題之質(zhì)量。本研究的試題編制流程是參考“學生能力國際評量計劃”的標準化試題編制流程,共涵蓋初始準備、審題會議、認知訪談和預試四個階段(OECD,2005)。
圖1:試題編制流程圖
在初始準備階段先舉行命題研習會,讓所有參與命題的人員都能了解試題命題標準、原則。同時依據(jù)命題卡、命題檢核表以及漢語交際能力測驗之評量架構,作為命題時之參考依據(jù)。在審題會議階段,主要的工作在訂立修題和審題原則,并建立修題和審題的檢核表。修題和審題的檢核表需要包含選擇題的題干、選項與試題內(nèi)容。在認知訪談階段,主要的工作是將編制完成的部分試題提供試測人員試考,以確定受試者之思考歷程,這種認知訪談之歷程特別有助于澄清試題之題意。在所有的試題編制完成后,即可執(zhí)行試題的預測。在預試階段的主要任務為收集受試者對于所有試題的可能反應,做為未來正式施測之準備。
本研究共研發(fā)并設計47道試題,經(jīng)專家篩選和審核后,最后選用43道試題作為正式的施測試題。所有的試題皆由臺灣師范大學應用華語文學系的教授所設計、審查,并在正式施測前皆已確保他們的適當性。試題難易度設計的原則是比照臺灣的華語測驗的試題編制,設定為一難易適中的測驗;也就是答對率在百分之六十以上的試題,須占全部試題的百分之八十(張莉萍,2007)。
4.2 試題對應
本研究對于所有43道試題的編制皆參考并對應歐洲共同語言參考架構語言知識模式的能力指標,并且在試題中同時包含整合任務型與個別任務型的試題,如圖2所示。
圖2:漢語交際能力測驗的試題架構
例如,在漢語交際能力測驗的試題架構中,總共有7道同時對應三種領域能力的整合任務型試題;他們分別為8、9、11、15、22、23和25題(請參見下頁圖3)。總體而言,本研究所編制的試題中,整合任務型試題共有22道試題;個別任務型試題共有21道試題。試舉漢語交際能力測驗的第41道試題說明如下:
試題41
謝欣穎的爸爸到學校參加家長座談會,蕭老師看到謝欣穎的爸爸說:「______,歡迎你來參加。」請問以下哪個答案最適合:
(A)謝經(jīng)理
(B)老謝
(C)謝彥文
(D)謝爸爸
根據(jù)漢語稱謂語的用法,從四個選項來看,在學校的家長座談會上,蕭老師應該是以學生(謝欣穎)的爸爸“謝爸爸”(選項D)來稱呼比較合適。根據(jù)上述對于第41道試題的分析來看,這道試題只涵蓋一種社會語言能力的指標,這道試題屬于個別任務型試題。另外例如第8題,這道試題同時涵蓋語言能力、社會語言能力和語用能力的指標,顯示這道試題同時評量受試者漢語交際能力的三種領域能力,這道試題屬于整合任務型試題。
試題8
“如果你不按照他說的去做,他會讓你吃不完兜著走?!边@句話的意思是?
(A)如果你不聽他的,他會自己想辦法把事情完成
(B)就算你不聽他的,他也會想辦法讓你順從他
(C)就算你不聽他的,他也會有辦法自己把事情搞定
(D)如果你不聽他的,他會想辦法報復你讓你有麻煩
圖3:試題對應CEFR能力指標的分布
本研究于2011年4月在臺灣臺灣師范大學國際與僑教學院僑生先修部施測。漢語交際能力測驗是透過自行所開發(fā)的《華語文能力計算機化測驗系統(tǒng)》,以在線測驗的方式收集數(shù)據(jù)。圖4為《華語文能力計算機化測驗系統(tǒng)》的登入接口,受試者在賬號和密碼的字段中,輸入個人的賬號和密碼后,即可進入系統(tǒng)中開始進行漢語交際能力測驗的試題作答。圖5為《華語文能力計算機化測驗系統(tǒng)》受試者的作答接口,左上角顯示受試者目前作答的題號;左邊中間為試題的題干。右上角顯示受試者目前作答的剩余時間,主要的功能為提醒受試者之用。右下角顯示作答試題的四個選項;選項可顯示文字,也可采圖片或是影音多媒體的方式呈現(xiàn)。受試者只要在選項前點選適合的答案即可。作答完成后受試者需點選“下一題”,系統(tǒng)才會顯示下一道試題。
漢語交際能力測驗施測時間為45分鐘,施測的對象為華裔學生,總共收集有效數(shù)據(jù)樣本共1235份。本研究資料分析,共細分成四個步驟:首先分別計算出每一位華裔學生的總體漢語交際能力;其次根據(jù)所估算各個領域能力和總體能力間的相關系數(shù),分別計算出每一位華裔學生個別的漢語語言、社會語言和語用領域能力;第三依據(jù)華裔學生的背景資料作為自變量,采二因子變異數(shù)分析(Two-way ANOVA)的統(tǒng)計方法,檢定華裔學生漢語總體交際能力是否有顯著的差異性存在;最后再采二因子多變量變異數(shù)分析(Two-way MANOVA)的統(tǒng)計方法,探討哪些領域能力造成華裔學生顯著差異。
圖4:《華語文能力計算機化測驗系統(tǒng)》登入接口
另外由于本研究在試題的研發(fā)和設計上,同時涵蓋了整合任務型與個別任務型試題,而且在測驗的能力架構上,建構了高階層能力。因此,本研究采用一因子題內(nèi)多向度高階層試題反應理論三參數(shù)模式(one-factor within-item HO-IRT 3PM model)(de la Torre&Song,2009)。試題參數(shù)值的估計是運用WinBUGS軟件,以蒙地卡羅-馬可夫鏈法(The Markov Chain Monte Carlo estimator,MCMC)進行。
圖5:《華語文能力計算機化測驗系統(tǒng)》作答接口
本研究所編制的43道試題的整體平均答對率為78.55%;其中答對率在60%以上的試題數(shù)為36題,占全部試題的83%,顯示對于華裔學生而言,這是一份難易適中的測驗。表2顯示個別任務型試題在語言、社會語言和語用領域能力中的平均答對率分別為67.58%、78.44%和72.35%,個別任務型試題的總體平均答對率為72.79%;整合任務型試題在語言-社會語言、語言-語用、社會語言-語用以及語言-社會語言-語用的領域能力中之平均答對率分別為89.07%、75.30%、82.85%以及87.57%,整合任務型試題的總體平均答對率為83.70%。
在三參數(shù)模式的試題反應理論中,試題的參數(shù)包含鑒別度、難度和猜測度。根據(jù)表3所示的平均試題參數(shù):平均試題難度為-1.0178;平均試題猜測度為0.2112;語言、社會語言和語用領域能力的平均試題鑒別度分為0.4081、0.2921和0.4727。
經(jīng)測驗資料分析發(fā)現(xiàn),華裔學生漢語交際能力的語言、社會語言和語用領域能力與總體交際能力的相關系數(shù)分別為0.7614、0.8794以及0.7935(請參考表4),顯示漢語交際能力(總體能力)為一多面向的能力。各領域能力與總體交際能力之間存在高相關。同時也證明本研究所采用的一因子題內(nèi)多向度高階層試題反應理論的模式符合測驗數(shù)據(jù)所需的能力架構。
試題反應理論模式所估算的能力值范圍是介于正負三之間;正三代表能力高,負三代表能力低。根據(jù)表4數(shù)據(jù)分析顯示,華裔學生的漢語交際能力平均值為-0.1141;語言、社會語言和語用三個領域能力的平均能力值分別為-0.1759、-0.1620和-0.1388。
表2:漢語交際能力測驗試題通過率
表3:平均試題參數(shù)
5.1 漢語總體交際能力
華裔學生來自全球各地,但是華裔學生在僑居當?shù)厮幍纳鐣佑|漢語的機會并非相同。有部分華裔學生在僑居當?shù)厮幍纳鐣佑|漢語的機會比較高,例如來自香港和澳門的華裔學生。他們可以說漢語也可以了解廣東話,同時在僑居地隨時隨地都方便接觸漢語文的書面文字,如漢語的招牌和報紙等;但是也有部分華裔學生在其所處的僑居當?shù)厣鐣?,接觸漢語的機會并不高,例如來自韓國和印度尼西亞的華裔學生。來自僑居地接觸漢語機會比較高的華裔學生共有641名;來自僑居地接觸漢語的機會比較低的華裔學生共有594名。因此,本研究首先將華裔學生的性別和僑居地接觸漢語機會兩個因素列入作為自變量,采二因子變異數(shù)分析,檢定華裔學生在漢語總體交際能力上,是否有顯著的差異性存在。
表4:漢語交際能力與各領域能力值及其相關系數(shù)
如表5所示,由于華裔學生的性別與僑居地兩個自變量在漢語總體交際能力的交互作用上未達顯著水平(d.f=1,F(xiàn)=0.030,p=0.863<0.05);而且不同僑居地的華裔學生在漢語總體交際能力上也沒有顯著的差異(d.f=1,F(xiàn)=0.030,p=0.863<0.05)。華裔學生的漢語總體交際能力僅在性別上有顯著的差異(d.f=1,F(xiàn)=34.52,p=0.000<0.05)。
由表6,男性華裔學生共有660人,男性平均的漢語交際能力為-0.1797;女性華裔學生共有575人,女性平均漢語交際能力為-0.0389。本研究根據(jù)華裔學生的性別差異所進行的統(tǒng)計檢定發(fā)現(xiàn),在95%的信心水平下,女性華裔學生的漢語總體交際能力顯著高于男性,請參考表5。
表5:性別與僑居地接觸漢語機會的漢語交際總體能力變異數(shù)分析
表6:華裔學生的漢語總體交際能力在性別上的差異比較
5.2 漢語領域能力
其次,本研究采二因子多變量變異數(shù)分析,檢定華裔學生在漢語三個領域能力上,是否有顯著的差異性存在。如表7所示,由于華裔學生的性別和僑居地兩個自變量在漢語交際能力的三個領域能力(語言、社會語言和語用能力)中的交互作用未達顯著(Pillai's Trace=0.001,Wilks'Lambda變量選擇法=0.999,多變量顯著性檢定=0.001,Roy的最大平方根值均=0.001,d.f=3,F(xiàn)=0.223,p=0.881>0.05)。
因此,本研究根據(jù)華裔學生的性別和僑居地所進行主要效果分析如下:首先,就性別的自變量而言,如表8所示,根據(jù)受試者間效應項的檢定發(fā)現(xiàn),在95%的信心水平下,不同性別的華裔學生在語言(d.f=1,F(xiàn)=23.393,p=0.000<0.05)、社會語言(d.f=1,F(xiàn)=25.937,p=0.000<0.05)和語用能力(d.f=1,F(xiàn)=34.755,p=0.000<0.05)上均存在有顯著的差異性,且在女性的漢語語言、社會語言和語用能力皆較男性高,其中女性的漢語語言能力較男性高0.194;女性的漢語社會語言能力較男性高0.196;女性的漢語語用能力較男性高0.235,請參考表9。
表7:性別與僑居地接觸漢語機會的漢語交際領域能力多變量變異數(shù)分析(1)
表8:性別與僑居地接觸漢語機會的漢語交際領域能力多變量變異數(shù)分析(2)
其次,就華裔學生在僑居地接觸漢語機會來看,如表8所示,根據(jù)受試者間效應項的檢定發(fā)現(xiàn),不同僑居地的受試者只有在漢語語言(d.f=1,F(xiàn)=3.865,p=0.050)存在有顯著的差異性,其余在漢語社會語言(d.f=1,F(xiàn)=1.670,p=0.196>0.05)和漢語語用能力(d.f=1,F(xiàn)=0.083,p=0.773>0.05)上均沒有顯著的差異性。華裔學生在其僑居地接觸漢語機會的高低不同,其漢語語言能力的差異為0.079,請參考表9。
表9:性別與僑居地接觸漢語機會在各領域能力之水平比較
本研究成功地建構了以語言知識模式為基礎,參考歐洲共同語言參考架構的交際能力指標,并且涵蓋高階層能力的漢語交際能力測驗??偣彩占行颖竟?235份,其中男性華裔學生有660名,女性華裔學生為575名。52%的華裔學生來自于接觸漢語機會較高的僑居地區(qū)或國家。由表2的試題平均答對率發(fā)現(xiàn),對應兩種以上能力的整合任務型試題的試題平均答對率為83.70%;對應單一能力的個別任務型試題的試題平均答對率比較低,只有約72.79%。經(jīng)上述測驗數(shù)據(jù)的試題通過率分析發(fā)現(xiàn),整合任務型試題的平均答對率高于個別任務型試題的平均答對率,表示受試者回答整合任務型試題無須同時具備兩種領域能力,只要擁有其中一種領域能力即可能答對該道試題。也就是說受試者在回答試題時,即使這道試題是對應兩種以上領域能力的整合任務型試題,受試者只要具備其中一種知識,即可正確地回答這道試題。這個現(xiàn)象說明了漢語交際能力是屬于一種補償性(compensatory)的能力。另外由試題通過率亦可發(fā)現(xiàn),華裔學生在回答所有有對應社會語言領域能力試題的平均答對率為84.48%;回答沒有對應社會語言領域能力試題的平均答對率卻只有71.74%。歸咎原因,華裔學生雖然來自全球各地,他們可能同時熟悉漢語或者其他中國的方言之外,甚至對于漢語文化知識的了解更綜合了僑居當?shù)氐奈幕蛩睾椭R。但是他們自小皆與父母同住,從小即耳濡目染并習得來自其父母、家庭以及華人社會的文化知識。由于他們自小就沉浸在華人的社會文化之中,就學習漢語作為第二語言而言,他們對于漢語文化知識的了解程度,比外國語學習者深入,他們都是屬于雙語的漢語學習者。
本研究發(fā)現(xiàn),語言、社會語言和語用領域能力與總體交際能力之間具有高相關;其相關系數(shù)分別為0.7614、0.8794以及0.7935,顯示漢語交際能力為一多面向的能力。因此,測驗數(shù)據(jù)是適合采用高階層試題反應理論模式。另外本研究的數(shù)學模式也同時估算出所有華裔學生的各個領域能力與總體交際能力。華裔學生的總體平均交際能力為-0.1141;語言、社會語言和語用的平均領域能力分別為-0.1759、-0.1620和-0.1388。
根據(jù)二因子變異數(shù)分析,不同性別的華裔學生和在僑居地使用漢語機會的高低情況對于漢語交際總體能力并沒有顯著的交互影響。而且雖然華裔學生在僑居地接觸漢語的環(huán)境不同,他們在漢語總體交際能力上并沒有顯著差異。但是,實證數(shù)據(jù)顯示女性華裔學生的漢語總體交際能力顯著高于男性。另外,根據(jù)二因子多變量變異數(shù)分析,不同性別的華裔學生和在僑居地使用漢語機會的高低情況對于漢語語言、社會語言和語用的三個領域能力也沒有顯著的交互影響。但是,女性的漢語語言、社會語言和語用能力皆顯著高于男性;其中女性的漢語語言能力較男性高0.194;社會語言能力較男性高0.196;語用能力較男性高0.235。而且,僑居地接觸漢語機會會顯著影響華裔學生的漢語語言能力??傮w而言,本研究最重要的貢獻是首先納入漢語的文化知識,以同時涵蓋個別任務型和整合任務型的試題,評量學習者使用漢語進行交際時其多面向的語言知識。
蔡雅薰2009華語文教材分級研制原理之建構[M].臺北:正中書局.
多媒體英語學會(譯)2007歐洲共同語文參考架構[Z].高雄:和遠圖書信息出版社.
國立臺南大學PISA國家研究中心2009PISA閱讀素養(yǎng)應試指南[Z].臺灣:國立臺南大學.
王暄博,蔡雅薰,郭伯臣,趙日彰2012以CEFR為基礎之華語文初級能力測驗研發(fā)與應用[J].華文教學與研究(1).
張莉萍2007華語文能力測驗,發(fā)展現(xiàn)況[R].外語能力測驗之動向與展望國際學術研討會(臺北:政治大學,2007,7).
張鈿富,吳慧子2006基本能力評量跨國發(fā)展經(jīng)驗之比較研究[Z].臺灣:國立教育資料館.
Adams,R.J.,M.Wilson&W.C.Wang1997The multidimensional random coefficients multinomial logit model[J].Applied Psychological Measurement21:1-23.
Bachman,L.F.1990Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press.
Bachman,L.F.&A.S.Palmer1982The construct validation of some components of communicative language proficiency[J].TESOL Quarterly16:449-65.
——1997Language Testing in Practice[M].London:Oxford University Press.
Blum-Kulka,S.,J.House&G.Kasper1989Crosscultural Pragmatics:Requests and Apologies[M].Norwood,NJ:Ablex.
Brown,H.D.2006Principles of Language Learning and Teaching Englewood Cliffs[M].NJ:Prentice Hall Regents.
Campbell,R.N.&J.W.Rosenthal(eds.)2000Heritage Language(Handbook of Undergraduate Second Language Education)[M].Mahwah,NJ:Lawrence Erlbaum Associates.
Carroll,J.B.1968The psychology of language testing[A].In A.Davies(ed.).Language Testing Symposium:A Psycholinguistic Approach[C].London:Oxford U-niversity Press:46-49.
——1972Fundamental considerations in testing English proficiency of foreign students[A].In H.B.A.R.N.Campbell(ed.).Teaching English as a Second Language:A Book of Readings[C].New York:Mc-Graw-Hill Book Company.
Chalhoub-Deville,M.1997Theoretical models,assessment frameworks,and test construction[J].Language Testing14:3-33.
——2003Second language interaction:current perspectives and future trends[J].Language Testing20:369-83.
Chalhoub-Deville,M.&C.Deville2005A look back at and forward to what language testers measure[A].In E.Hinkel(ed.).Handbook of Research in Second Language Teaching and Learning[C].Mahwah,NJ:Lawrence Erlbaum Associates:815-32.
Council of Europe(ed.)2001The Common European Framework of Reference for Languages[Z].Strasbourg:Cambridge University Press.
de la Torre,J.2008Multidimensional scoring of abilities:the ordered polytomous response case[J].Applied Psychological Measurement32:355-70. de la Torre,J.&R.J.Patz2005Making the most of what we have:a practical application of MCMC in test scoring[J].Journal of Educational and BehavioralStatistics 30:295-311.
de la Torre,J.&H.Song2009Simultaneous estimation of overall and domain abilities:a higher-order IRT model approach[J].Applied Psychological Measurement33:620-39.
de la Torre,J.,H.Song&Y.Hong2011A comparison of four methods of IRT subscoring[J].Applied Psychological Measurement35:296-316.
Douglas,D.2000Assessing Language for Specific Purposes[M].Cambridge:Cambridge University Press.Harley,B.,P.Allen,J.Cummins&M.Swain1990The Development of Second Language Proficiency[M].New York:Cambridge Applied Linguistics.
Harris,D.P.&L.A.Palmer1970CELT Listening Form L-A,Structure Form S-A,Vocabulary Form VA[M].New York:McGraw-Hill Book Company.
Jamieson,J.,S.Jones,I.Kirsch,P.Mosenthal.&C.Taylor2000TOEFL 2000 framework:A working paper[Z].ETS.
Kasper,G.&M.Dahl1991Research Methods in Interlanguage Pragmatics[M].Honolulu:University of Hawaii Press.
Kramsch,C.1986From language proficiency to interactional competence[J].The Modern Lanuage Journal70:366-72.
——1998Language and Culture[M].Oxford:Oxford University Press.
Kunnan,A.J.1998Approaches to validation in language assessment[A].In A.J.Kunnan(ed.).Validation in Language Assessment[C].Mahwah,N.J.:LEA:1-16.
Lado,R.1961Language Testing[M].New York:Mc-Graw-Hill Book Company.
Lee,J.,W.S.Grigg&G.S.Dion2007The Nation’s Report Card:Mathematics 2007[Z].U.S.Department of Education.
McKinley,R.L.&W.D.Way1992The feasibility of modeling secondary TOEFL ability dimensions using multidimensional IRT models[R].ETS TOEFL Technical Report No.TR-05.
McNamara,T.2003Book Review:Fundamental considerations in language testing.(Oxford:Oxford University Press,Language Testing in Practice:Designing and Developing Useful Language Tests)[J].Language Testing 20:466-73.
O'Sullivan,B.(ed.)2011Language Testing:Theories and Practices(Palgrave Advances in Language andLinguistics)[M].New York:Palgrave Macmillan.
Oller,J.W.1979Language Tests at School[M].London:Longman Group Ltd.
——(ed.)1983.Issues in Language Testing Research[M].Rowley,MA:Newbury House Publishers,Inc.
Oller,J.W.&J.Jonz1994Cloze and Coherence[M].London:Associated University Press.
Purpura,J.E.2010Assessing communicative language ability:models and their components[A].In E.Shohamy&N.H.Hornberger(eds.),Encyclopedia of Language and Education[C].NY:Springer.
Sasaki,M.1999Second Language Proficiency,F(xiàn)oreign Language Aptitude,and Intelligence[M].NY:Peter Lang.
SC-TOP2011aNew version of the Test of Chinese as a Foreign Language launched in 2011.Taipei:Steering Committee for the Test Of Proficienct-Huayu[EB/OL].http://www.sc-top.org.tw/download/News%20release%20of%20the%20new%20version.pdf.
——2011bSteering Committee for the Test of Proficiency-Huayu[EB/OL].http://www.sc-top.org.tw/.
Shehan,P.1988State-of-the-Art article:language testing,Part 1[J].Language Testing21:211-21. Song,H.2007A higher-order item response model:development and application[Z].Unpublished:The State University of New Jersey doctoral dissertation.
Valdés,G.(ed.)2001Heritage Language Students:Profiles and Possibilities(Heritage Language in America,Preserving a National Resource)[M].IL:Delta Publishing Company.
Vollmer,H.J.&F.Sang1980Competing hypotheses about second language ability:a plea for caution[M].Berlin:Osnabrück.
Wang,H.P.,B.C.Kuo,Y.H.Tsai&C.H.Liao2012 A CEFR-based computerized adaptive testing system for Chinese proficiency[J].The Turkish Online Journal of Educational Technology11.
Weiss,D.&M.Yoes1991Item response theory[A].In R.K.Hambleton&J.Zall(eds.),Advances in Educational and Psychological Testing[C].Boston:Kluwer-Nijhoff.
Young,R.F.2000Interactional competence:challenges for validity[R].Paper presented at the The annual meeting of the American Association for Applied Linguistics and the Language Testing Research Colloquium,Vancouver,Canada.
On Chinese Communicative Language Proficiency Assessment:Based on Language Knowledge Model
Rih-Chang Chao1,Ya-Hsun Tsai2,Bor-Chen Kuo3,Zhen-Xing Lin4
(1.Hsin Sheng Junior College of Medical Care and Management,Taoyuan,Taiwan 32544,China;2.4.Department of Applied Chinese Language and Literature,National Taiwan Normal University,Taipei,Taiwan 10610,China;
3.Graduate Institute of Educational Measurement and Statistics Dept.,National Taichung University,Taichung,Taiwan 40306,China)
language communicative competence;language knowledge model;language skill model;CEFR
The purpose of this study is to put Chinese cultural and pragmatic knowledge into the test of Chinese communicative competence.By referring to the indicators of CEFR language communicative competence,43 items were designed in the communicative competence test in this study.This study makes contributions in the following three aspects:(1)develop an original model to consider both Chinese cultural and pragmatic knowledge in a Chinese Communicative Competence Test,(2)involve both separated and integrated task items,and(3)asses the examinees'overall competence and their abilities in three distinctive domains(linguistic,sociolinguistic,and pragmatic competence).By an empirical data analysis,it is found that the overall Chinese communicative competence of female students is significantly higher than that of male.In addition,the Chinese linguistics proficiency of students who use Chinese as their major language is significantly higher than those who do not.In addition,there is significant difference of students'Chinese language proficiency according to their nationality,and the Chinese language proficiency is influenced by their Chinese contact frequency.However,there is no significant difference in their sociolinguistic and pragmatic competence.
H195.6
A
1674-8174(2014)03-0053-12
【責任編輯 蔡麗】
2013-04-09
趙日彰(1963-),男,臺灣人,新生醫(yī)護管理??茖W校講師,主要從事華語測驗與評量研究;蔡雅薰(1964-),女,臺灣人,臺灣師范大學應用華語文學系教授,博士,主要從事華語文教學、評量與教材設計研究;郭伯臣(1970-),男,臺灣人,臺中教育大學教育學院教授,博士,主要從事影像辨認、機械學習、資料探勘、測驗與評量研究;林振興(1968-),男,臺灣人,臺灣師范大學應用華語文學系副教授,博士,主要從事華語文教學與華人文化研究。