彭云帆 隋 雯
計(jì)算機(jī)輔助普通話水平測試(PSC)中,命題說話測試項(xiàng)的錄音出現(xiàn)了與應(yīng)試人面對測試員人工測試不同的一些情況。例如,機(jī)測命題說話中不時出現(xiàn)應(yīng)試人看錯了話題或說錯了話題,以及背稿或離題等情況。這些情況在人工測試時有測試員及時提醒而能盡量避免,現(xiàn)在機(jī)測評分應(yīng)當(dāng)如何處理這些情況?又如,前三項(xiàng)即單音節(jié)、多音節(jié)和朗讀短文由計(jì)算機(jī)評分,命題說話則由兩位測試員背對背獨(dú)立評分,若兩位測試員評分的差異超過規(guī)定范圍的3分,評分則為不合格,需請第三位測試員復(fù)聽。有些測試員對沒有前三項(xiàng)評判印象而給命題說話評分能否準(zhǔn)確心存疑慮。如何在評分細(xì)則上全面準(zhǔn)確地區(qū)分機(jī)測說話項(xiàng)錄音答題出現(xiàn)的有關(guān)情況?如何將測試員之間的評分差異控制在合理的范圍?這要求對計(jì)算機(jī)輔助普通話水平測試及其評分細(xì)則實(shí)施情況深入進(jìn)行調(diào)查及研討,在國家語委《普通話水平測試實(shí)施綱要》(以下簡稱《綱要》)的基礎(chǔ)上,進(jìn)一步明確計(jì)算機(jī)輔助普通話水平測試的目的,對評分細(xì)則進(jìn)行相應(yīng)的科學(xué)的修訂。廣西語委辦多次組織不同層面的測試員,對《廣西普通話水平測試評分細(xì)則》(修改稿)(以下簡稱《細(xì)則》)反復(fù)進(jìn)行實(shí)驗(yàn)、研討及修改,我們參與了實(shí)驗(yàn)、研討和修訂,制定出現(xiàn)行的機(jī)測命題說話評分細(xì)則,力求使其具有科學(xué)性、操作性和公平性。
一、語音標(biāo)準(zhǔn)程度
語音標(biāo)準(zhǔn)程度評分項(xiàng)分為音節(jié)的準(zhǔn)確度和方音的表現(xiàn)程度。廣西評分細(xì)則對“方音”的解釋主要是指與方言有關(guān)的語音錯誤,在說話項(xiàng)中主要指聲韻缺陷和語調(diào)偏誤。對這一評分項(xiàng)中的語調(diào)與自然流暢程度評分項(xiàng)中的語調(diào)如何分別把握?我們認(rèn)為,這里的“方音”評判設(shè)置,主要是在語音標(biāo)準(zhǔn)程度量化的基礎(chǔ)上歸檔操作后進(jìn)行微調(diào)的依據(jù)。如《綱要》中“語音標(biāo)準(zhǔn)程度”中二檔、三檔的設(shè)置,當(dāng)語音錯誤數(shù)量相同時,方音表現(xiàn)程度的不同是分?jǐn)?shù)高低調(diào)整的依據(jù)。
對說話中失誤音節(jié)的定量累計(jì),是取得評判準(zhǔn)確性、縮小評分差異的重要保證。這里的定量包含著定性,是在定性的基礎(chǔ)上形成的量化記錄。說話中出現(xiàn)了什么性質(zhì)的失誤,是錯誤還是缺陷,是什么錯誤,是什么缺陷,測試員都要在瞬間做出判斷,這就是定性;及時把錯誤和缺陷分類累計(jì)下來,這就是定量。同時,在評判過程中,還應(yīng)對應(yīng)試人說話中非音質(zhì)的表現(xiàn)作出判斷。這樣有依據(jù)地作出語音標(biāo)準(zhǔn)程度歸檔和評分,可以由任何一位合格的測試員得出相同結(jié)果。因此,它是科學(xué)的、可控的和準(zhǔn)確的。
對說話中失誤音節(jié)的定量累計(jì),是測試員判分的基本依據(jù)。過去有四項(xiàng)或五項(xiàng)的人工測試評分,有的測試員憑著對前三項(xiàng)的印象,在應(yīng)試人開始說話不足2分鐘時就對整個說話項(xiàng)作出判分。這樣判分不能說都不準(zhǔn)確,確實(shí)有不少測試員當(dāng)應(yīng)試人一開口就能大致判斷其普通話水平等級,但從科學(xué)的角度來講,判定普通話水平高低應(yīng)以確鑿的定量記錄作為事實(shí)依據(jù),不能用“大致”判定代替準(zhǔn)確評分。當(dāng)判分的依據(jù)有較大差異時,測試員之間的評分差異就難以控制。這樣不依據(jù)完整測試過程來判分,就會對應(yīng)試人作出不夠公正的判分,使普通話水平測試工作的信度降低。因此,機(jī)測要求測試員脫離前三項(xiàng)評分而對應(yīng)試人說話進(jìn)行單獨(dú)評分,有些測試員產(chǎn)生“單判說話不好判”的顧慮。國家測試員培訓(xùn)班反復(fù)強(qiáng)調(diào):沒有經(jīng)過測試評判,誰也不能確定應(yīng)試人的等級。因此,測試員對機(jī)測說話項(xiàng)的準(zhǔn)確評判,必須采取語音標(biāo)準(zhǔn)程度的量化工作方式。語音標(biāo)準(zhǔn)程度的準(zhǔn)確定量,是說話項(xiàng)準(zhǔn)確評分和縮小評分差距不可或缺的重要依據(jù)。
二、詞匯、語法規(guī)范程度
詞匯、語法規(guī)范程度評分項(xiàng),應(yīng)檢測不符合普通話規(guī)范的方言詞語和語法,不包括偶爾出現(xiàn)的口誤。從原則上講,應(yīng)當(dāng)主要考查應(yīng)試人對普通話詞匯、語法這些語言成分的應(yīng)用水平;對于言語成分應(yīng)當(dāng)從寬評判。如果3分鐘說話期間反復(fù)出現(xiàn)話不成句的情況,應(yīng)當(dāng)在詞匯、語法規(guī)范程度評分項(xiàng)中考慮適當(dāng)扣分。語言成分指已經(jīng)進(jìn)入普通話靜態(tài)系統(tǒng)中的語言的成分,詞典收錄的是詞匯部分,語法教材講解的是普通話的語法規(guī)范。從人的語感來講,對方言詞語的評判主要指意義很難理解,普通話從來不這么說的詞語。例如,桂林話中的詞語“把爺”,非西南方言區(qū)的人乍一聽是不會理解其詞義的。又如,粵方言的“吃茶”、“吃煙”、“那個人很肥”,普通話就不這么說。關(guān)于詞匯、語法的規(guī)范與方言詞語句式的對比材料,測試培訓(xùn)教材應(yīng)當(dāng)進(jìn)行詳細(xì)的收集和系統(tǒng)的整理。
三、自然流暢程度
自然流暢程度評分項(xiàng)主要分為語調(diào)自然程度和言語流暢程度兩方面。命題說話是一個整體,語流中的各項(xiàng)要素比如語調(diào)在各項(xiàng)評分中會有交叉出現(xiàn)的現(xiàn)象,“細(xì)則”及其實(shí)施應(yīng)讓各項(xiàng)評分分工合作?!白匀涣鲿吵潭取迸c“語音標(biāo)準(zhǔn)程度”在語調(diào)上有交叉,與“缺時”在“言語流暢程度”上有交叉,但是它們各有分工。自然流暢程度評分項(xiàng)對語調(diào)的考查,是對3分鐘說話語流態(tài)勢的整體考查,是在“語音標(biāo)準(zhǔn)程度”之外對語流的流暢和樣態(tài)的評分;“語音標(biāo)準(zhǔn)程度”中的“方音”,只是音節(jié)量化歸檔的輔助性微調(diào)要素,幾乎不單獨(dú)占分值?!白匀涣鲿吵潭取敝械恼Z調(diào),與方音中的語調(diào)評分著眼點(diǎn)不同,所占分值也不同。
對說話自然流暢程度的考查,是對語言能力的考查。這種考查也體現(xiàn)在朗讀以及多音節(jié)、單音節(jié)測試項(xiàng)。語言學(xué)習(xí)的目標(biāo)可以分為語言能力的獲得和語言應(yīng)用能力的獲得。語言能力是語言學(xué)習(xí)過程中的基礎(chǔ)能力,是前一階段的學(xué)習(xí)目標(biāo)。是對語音、詞匯、語法各語言要素掌握的能力,也就是說話時能否正確地發(fā)音、用詞和造句的能力。假如說話中語流不順暢,磕磕絆絆,反復(fù)出現(xiàn)糾正字音、方音和方言句式等現(xiàn)象,說明應(yīng)試人普通話語言能力不過關(guān)。評分時,即使不在“語音標(biāo)準(zhǔn)程度”定量上記為語音錯誤,也應(yīng)在“自然流暢程度”上適當(dāng)扣分。
語言應(yīng)用能力是應(yīng)用普通話生動自如地表達(dá)思想感情的能力,是普通話語言學(xué)習(xí)的高級目標(biāo),也是普通話水平測試的側(cè)重點(diǎn)。《綱要》二檔中有“類似背稿子的表現(xiàn)”,三檔中有“語調(diào)生硬”的描寫。這里“類似背稿子的表現(xiàn)”,是指語調(diào)或腔調(diào)上的表現(xiàn),“語調(diào)生硬”是“類似背稿子的表現(xiàn)”的程度加深。就目前的認(rèn)識來講,語調(diào)主要包括聲調(diào)、句調(diào)、重音、停連以及音節(jié)長短等超音段的節(jié)律特征?!邦愃票掣遄拥谋憩F(xiàn)”語調(diào)用漢語拼音無法記錄,用文字只能做大致的描寫:停連機(jī)械、高低無據(jù)、沒有輕重之分或輕重不當(dāng)、語音形式與語言內(nèi)容不一致。這樣的表現(xiàn)徒有語音形式的“順溜”,而無言語形式與言語內(nèi)容之間諧調(diào),所以語調(diào)生硬。應(yīng)試人說話全過程采用背稿子腔調(diào)或語調(diào)生硬,說明他(她)只掌握普通話語言形式,具備普通話語言發(fā)音能力,尚未達(dá)到普通話應(yīng)用能力的目標(biāo),未能用標(biāo)準(zhǔn)普通話流暢生動地表達(dá)豐富的思想感情。學(xué)生們在課堂上齊讀唱讀的訓(xùn)練
方式對他們學(xué)習(xí)普通話語流起到了誤導(dǎo)作用,這些學(xué)生用普通話說話時就會自覺不自覺地采用那些生硬腔調(diào)、背誦語調(diào)、念書腔調(diào),禁錮語言應(yīng)用能力的發(fā)展。對背誦語調(diào)、生硬語調(diào)等現(xiàn)象,我們在評分工作中不可忽視。
四、缺時
缺時指說話中出現(xiàn)持續(xù)性的空白,是人工測試和機(jī)測共有的現(xiàn)象?!毒V要》規(guī)定缺時1分鐘以內(nèi)有3個分?jǐn)?shù)?!都?xì)則》具體規(guī)定為“錄音開頭空白10秒不扣分,以后出現(xiàn)空白每持續(xù)10秒扣0.5分。說話不滿30秒,本測試項(xiàng)扣40分?!币?0秒為計(jì)量單位來扣分,以縮小測試員之間的評分差異,并跟“自然流暢程度”的評判相區(qū)分。
錄音開頭空白10秒不扣分,是出于對機(jī)測錄音常見情況的考慮。應(yīng)試人朗讀結(jié)束后接著點(diǎn)擊說話題,用10秒時間調(diào)整思路應(yīng)該是合理的。有的應(yīng)試人操作計(jì)算機(jī)時會耽擱一點(diǎn)兒時間,用10秒時間也是合理的。此后缺時從10秒起扣,我區(qū)把網(wǎng)絡(luò)評分頁面可以開始記錄扣分的時間設(shè)置為2分51秒,提示測試員對應(yīng)試人說話的聽判時間不可以隨意減少,以保證對應(yīng)試人評分的真實(shí)可信,減少測試員評分之間差異。
缺時與自然流暢程度的評分區(qū)別在于,缺時評分項(xiàng)是指說話出現(xiàn)持續(xù)性空白,自然流暢程度評分項(xiàng)考查言語是否磕巴、不流利、反復(fù)糾錯、停頓時間較長,而不包括10秒以上的空白?!都?xì)則》把“缺時”扣分界定為空白持續(xù)10秒起扣缺時分,對持續(xù)不到10秒鐘的空白,不必累計(jì)扣分,而在自然流暢程度加以評判。這樣區(qū)分兩項(xiàng)評分,便于操作,減少測試員之間的評分差異。
五、無效話語
無效話語是安徽、上海機(jī)測命題說話測試中提出來的概念。廣西《細(xì)則》中,無效話語包括“與測試話題毫不相關(guān)的話語,多次簡單重復(fù)相同的語句,以背誦他人文本代替說話”等。這幾條都是從內(nèi)容方面考查應(yīng)試人普通話應(yīng)用能力,可以歸為一個評分項(xiàng)。比如,應(yīng)試人在說話時間內(nèi)長長地?cái)?shù)數(shù),或反復(fù)叨嘮同一句話,或反復(fù)地念說話題目,或背誦他人作品等。
命題說話測試中出現(xiàn)無效話語的原因很多。應(yīng)試人準(zhǔn)備的內(nèi)容說完了不知再說些什么,或一時心理緊張?jiān)斐伤季S短路,或擔(dān)心無話說,就用與說話題目無關(guān)的一些話語應(yīng)對測試。這些無效話語未能表現(xiàn)出應(yīng)試人普通話應(yīng)用能力和水平。
廣西《細(xì)則》中無效話語評分項(xiàng)以占時扣分,每10秒加扣0.5分,便于操作。所謂“加扣”,就是在“語音標(biāo)準(zhǔn)程度”扣分之外再扣分,即先對應(yīng)試人普通話語言能力進(jìn)行考量,再對其普通話語言應(yīng)用能力進(jìn)行評判。
六、離題
普通話水平測試中的離題評判與高考作文的離題評判不一樣。高考作文測查考生的寫作水平,包括思維水平和語言表達(dá)水平。語言表達(dá)水平在作文評分中大約只占六分之一。普通話說話水平固然與思維水平密切相關(guān),但它側(cè)重于指應(yīng)試人普通話口頭應(yīng)用能力,能否用普通話流暢地表達(dá)思想感情,而不是側(cè)重于指應(yīng)試人思維水平的高低。
普通話水平測試不是側(cè)重評判應(yīng)試人的思維水平,并且不容易準(zhǔn)確判斷其說話是否離題,所以對離題的扣分應(yīng)當(dāng)從寬?!都?xì)則》修訂為:“說話內(nèi)容與話題多少有些聯(lián)系的一般不扣離題分。離題持續(xù)1分鐘扣2分,以后每30秒加扣1分,全程離題加扣6分。”比如,把話題“我喜歡的節(jié)日”錯說成“我喜歡的節(jié)目”,在語音標(biāo)準(zhǔn)程度、詞匯語法規(guī)范程度、自然流暢程度等評分項(xiàng)上照常扣分,再在離題項(xiàng)扣6分,而不是將命題說話的40分全扣掉,因?yàn)閼?yīng)試人畢竟用普通話表達(dá)自己的思想。應(yīng)試人以事先準(zhǔn)備的內(nèi)容應(yīng)對命題說話的題目,被扣離題的6分就不能提高普通話等級。這樣的分?jǐn)?shù)設(shè)置,有利于準(zhǔn)確反映應(yīng)試人普通話真實(shí)水平,緩解他們臨場的心理壓力,也減輕測試員評分的壓力?!罢f話內(nèi)容與話題多少有些聯(lián)系而不扣分”與離題扣分之間漸降的坡度不要太陡,才符合普通話水平測試側(cè)重于考查應(yīng)試人普通話應(yīng)用水平這一目的。
離題與無效話語都是對命題的偏離,為何分兩項(xiàng)扣分?《細(xì)則》規(guī)定無效話語起扣時間是10秒鐘,離題起扣時間是1分鐘。從錄音材料中,無效話語其語言形式明顯,短時間就可以判定的;離題是內(nèi)容的偏離,短時間內(nèi)不好判斷,其起扣時間比無效話語起扣時間要長。因此,這兩項(xiàng)不能合并,不重復(fù)、不累計(jì)扣分,以便于操作。
命題說話評分項(xiàng)目共有這六條。這六條相互配合,構(gòu)成一個完整的合理的普通話說話評價系統(tǒng),供測試員獨(dú)立評分使用。對《細(xì)則》的實(shí)施,可增加測試員獨(dú)立評分的可信度。命題說話測試項(xiàng)沒有前三項(xiàng)評分的印象,避免兩名或三名測試員評分之間相互參考,每位測試員完全憑借個人聽力獨(dú)立評分,與其他測試員評分差異控制在規(guī)定的3分以內(nèi),其評分就是真實(shí)性的可信的。
《廣西普通話水平測試評分細(xì)則》是技術(shù)性的操作規(guī)則。我們期望測試員依據(jù)修訂后的《細(xì)則》。在相同條件下能得出相同的評分結(jié)果,并在命題說話測試中不斷發(fā)現(xiàn)新問題,以便今后進(jìn)一步完善命題說話測試項(xiàng)評分細(xì)則。
[作者簡介]
彭云帆,女,漢族。廣西師范學(xué)院副教授,國家級測試員,應(yīng)用語言學(xué)方向。
隋雯,女,漢族,廣西幼兒師專副教授,國家級測試員,現(xiàn)代漢語口語方向。
(責(zé)編李景和)