聶丹
論普通話水平測試研究內(nèi)容
聶丹
規(guī)劃普通話水平測試學科的研究內(nèi)容是一個系統(tǒng)工程,需要找準研究主線,劃定研究區(qū)域,理清研究層次,從宏觀到微觀地對普通話水平測試研究內(nèi)容進行分層和分級。本文探討了普通話水平測試研究的6個基本問題,在此基礎上,依次闡述了普通話水平測試研究內(nèi)容的“二分法”、“三分法”、“四分法”等宏觀分類法以及微觀分類法。這一系統(tǒng)工程的建成有助于普通話水平測試研究者明確研究定位,理順研究思路,洞悉研究路向,減少研究的盲目性和重復性,增強研究的方位性和條理性。
普通話水平測試;學科;研究內(nèi)容
普通話水平測試(PSC)是世界范圍內(nèi)少見的專門測試母語者標準語水平的大規(guī)模的口語測試。它從醞釀、產(chǎn)生、發(fā)展到不斷深化,已經(jīng)走過了30年歷程,形成了一支素質(zhì)優(yōu)良的研究隊伍,產(chǎn)生了大量研究著述,初步確立了PSC的學科地位,受到越來越多語言學和測量學研究者的關注。然而,作為一門新興學科,當前的PSC研究還不能完全適應PSC事業(yè)發(fā)展的需求。其中,一個突出問題就是PSC的研究內(nèi)容缺少科學規(guī)劃。僅從研究成果的數(shù)量來看,各研究領域的發(fā)展還不平衡,某些領域出現(xiàn)研究“扎堆”的現(xiàn)象,而另外一些領域卻相對冷清甚至無人問津。從研究成果的質(zhì)量來看,重復性研究比較多,創(chuàng)新性研究和深度研究不足,研究的連續(xù)性、系統(tǒng)性有待提升。而這些問題其實也是任何學科發(fā)展之初常常會出現(xiàn)的問題,只有通過理性、科學的研究規(guī)劃才能解決。為此,我們有必要對PSC的研究內(nèi)容進行全面規(guī)劃,使PSC研究步入規(guī)范、有序的科學軌道。
PSC可以研究和應該研究的內(nèi)容非常廣泛,這是因為PSC活動涉及的因素很多。面對方方面面的研究內(nèi)容,以及它們之間千絲萬縷的聯(lián)系,我們需要分清主次、理順關系,對眾多研究內(nèi)容進行系統(tǒng)的梳理和歸類。姚喜雙等(2011:2)將PSC活動中涉及的眾多因素歸納為四個方面:“測試主體、測試對象、測試依據(jù)和測試手段”。在此基礎上指出:“測試活動的四個要素之間有各種各樣的聯(lián)系,互相作用、互相影響,共同促進測試活動的發(fā)展。普通話水平測試研究不局限于測試活動中測試員的某個測試技巧或者應試人的應試策略,而是研究伴隨普通話水平測試事業(yè)發(fā)生、發(fā)展的一般規(guī)律。普通話水平測試表現(xiàn)形式很多,但無論哪種形式都要區(qū)分測試對象的水平,這是普通話水平測試不變的規(guī)律。普通話水平測試研究的就是如何準確區(qū)分測試對象的普通話水平?!边@也就提出了PSC研究內(nèi)容的主線。
對PSC的研究內(nèi)容,可以從不同角度進行分類。例如,聶丹(2011)根據(jù)PSC30年的研究成果,將其研究內(nèi)容歸納為八大領域:宏觀課題研究、測試依據(jù)研究、測試主體研究、測試客體研究、測試手段研究、測試界域研究、測試作用研究、測試評價研究。除此之外,更宏觀的分類方法還可以有“二分法”、“三分法”、“四分法”等。不管怎么分類,PSC研究都需要回答或解決6個基本問題,這些基本問題也構成了PSC學科理論體系的概念框架。
在探討PSC的研究內(nèi)容之前,需要明確PSC研究的基本問題。參照盛炎(1990:4)對第二語言教學理論基本問題的剖析,我們認為PSC研究應該能夠回答以下6個基本問題:
(1)誰(who)。參加PSC的人是誰?什么性別、年齡、民族?來自哪個地區(qū)?居住在鄉(xiāng)村還是城鎮(zhèn)?他的方言是什么?普通話水平如何?教育背景如何?從事何種職業(yè)?他個人的智力怎樣?有什么樣的個性?普通話學習中有什么樣的風格和策略?應試時他的身心狀態(tài)如何?有什么樣的應試策略?測試普通話的人是誰?什么性別、年齡、民族?來自哪個地區(qū)?有什么方言背景?普通話水平如何?教育背景如何?從事何種職業(yè)?他的測試理念和風格是什么?測試經(jīng)驗是否豐富?有什么樣的個性?測試時他的身心狀態(tài)如何?教普通話的人是誰?什么性別、年齡、民族?來自哪個地區(qū)?有什么方言背景?普通話水平如何?教育背景如何?他的教學理念和風格是什么?教學經(jīng)驗是否豐富?有什么樣的個性?教學時具體采用什么教學方法?等等。
(2)什么(what)。測什么?教什么?學什么?什么是漢語普通話?漢語標準語的發(fā)展歷程是什么?什么是方言?漢語方言的種類和特征是什么?普通話水平是什么?如何對普通話水平進行描述?什么是地方普通話?如何對地方普通話進行分層和分類?習得方言與學習普通話的過程有什么不同?PSC的目標、性質(zhì)、特點、原則、作用、內(nèi)容等各是什么?PSC的理論依據(jù)是什么?等等。
(3)怎么樣(how)。怎么樣測普通話水平?怎么樣保證測到的結果是可靠、有效的?應試者怎么樣保證自己有出色的應試表現(xiàn)?影響應試者普通話測試成績的因素都有哪些?這些因素之間有怎樣的關系?怎么樣學習普通話?怎么樣保證普通話學習的成功?學習普通話的認知過程是怎樣的?學習者應該用什么樣的策略和風格學習普通話?影響學習者普通話學習水平的都有哪些因素?這些因素之間有怎樣的關系?怎么樣教普通話?影響普通話教學效果的都有哪些因素?這些因素之間有怎樣的關系?PSC對社會有怎樣的影響?普通話的測試、學習與教學之間存在怎樣的相互作用關系?普通話的測試、培訓應該怎樣為推廣普通話服務?等等。
(4)何時(when)。方言區(qū)的人何時學習普通話?年齡對普通話學習有何影響?學前兒童怎樣習得普通話?在校兒童習得了方言之后,如何學習普通話?普通話學習有沒有“關鍵期”?學習普通話的最佳年齡是什么時候?普通話教學或培訓的總量及時間以多少為宜?PSC的題量和時間以多少為宜?普通話水平提升一個級別需要多長時間?等等。
(5)在哪里(where)。環(huán)境對普通話學習和使用有何影響?在不同方言區(qū)學習和使用普通話有何差異?在城鎮(zhèn)和鄉(xiāng)村學習和使用普通話有何差別?在不同工作環(huán)境學習和使用普通話有何差別?機測與人測對應試表現(xiàn)和普通話成績有何影響?不同地區(qū)的普通話推廣情況有何不同?不同地區(qū)的PSC內(nèi)容與評分細則是否應該有所區(qū)別?哪些地區(qū)在PSC實施和管理方面取得顯著成效?等等。
(6)為什么(why)。為什么要開發(fā)PSC?為什么PSC在組織形式、測試內(nèi)容、測試方法、等級標準等方面確定了當前的格局?學習者為什么學習普通話?為什么參加PSC?為什么不同方言區(qū)學習者在普通話學習中存在不同的缺陷或偏誤?普通話學習中的“化石化”現(xiàn)象是什么原因造成的?等等。
上述問題都是圍繞普通話的測試、學習、教學與培訓提出的,比較全面地囊括了PSC的內(nèi)部和外部因素,試圖探究各個因素之間錯綜復雜的關系。其中有關“什么”與“怎么樣”的問題尤其重要。對上述6大基本問題的解答,就構成了PSC研究的概念框架,也是PSC學科理論體系的基本架構。PSC的研究內(nèi)容就是從不同角度對上述基本問題的研究和解答。
PSC研究的基本內(nèi)容可以概括為兩大方面:一方面是圍繞著“普通話”的研究,另一方面是圍繞著“測試”的研究。
關于“普通話”的研究即對普通話和普通話水平的研究,旨在回答“測什么”的問題。這是有關漢語本身的研究,以語言學及其相關學科為研究基礎,包括漢語普通話的語音、詞匯、語法等語言要素的研究,語言能力(特別是口語能力)評價標準的研究,漢語普通話與漢語方言的對比研究,地方普通話(中介語)系統(tǒng)的研究等。
關于“測試”的研究即對PSC這一測量工具的研究,旨在回答“怎么測”的問題。這是有關測量工具效度和信度等的研究,以測量學及其相關學科為研究基礎,包括PSC的任務設計研究,評價標準研究,評分方法研究,測試組織和實施辦法研究,測試員隊伍建設研究,現(xiàn)代技術在測試中的運用研究等。
除了上述最核心的兩大塊研究內(nèi)容之外,鑒于PSC實踐活動的特點,PSC研究內(nèi)容還包括普通話“怎么教”、“怎么學”以及PSC的語言政策、社會功能、社會評價等。這些相對于核心研究內(nèi)容來說,可算作PSC外圍的研究內(nèi)容。
張凱(2006:3-10)曾將語言測試的研究內(nèi)容歸納為三大類:理論研究、技術研究、應用研究。其中,理論要解決的是“某物(或觀測對象)是什么”的問題,這是個認識問題;技術要解決的是“對某物進行什么樣的處理并使它變成什么東西”的問題,這是個操作問題;應用要解決的是某物怎么用的問題,這是個社會問題。PSC作為一種現(xiàn)代語言測試,自然也應該包括上述三方面的研究內(nèi)容。
測試中的基本理論問題是效度問題,語言測試的效度問題就是一個測試是否測到了以及在多大程度上測到了語言能力。而要解答這個問題,需要先回答一個更為基本的理論問題,即語言能力是什么?由于語言能力深藏在人腦之中,要想探究它的本質(zhì)及構成實非易事。從喬姆斯基的語言能力(language competence)理論到海姆斯的交際能力(communicative competence)理論,人們對語言能力做了廣泛、深入的探討。但時至今日,這仍然是一個尚未圓滿解決的問題。而當這個問題出現(xiàn)在語言測試里時,它就變成了效度問題。如同語言學界對“語言能力”的理解尚無共識一樣,測量界對效度的回答也同樣困難(張凱,2006:5-8)。這就使效度問題和語言能力問題成為語言測試中最核心、也是最難解決的理論問題。
在PSC研究中,有關普通話水平到底是什么(涉及語言能力問題)以及PSC是否測到了它想測的普通話水平(涉及效度問題),對這樣的測試基本理論問題的研究還遠未開展起來。而對這類問題研究的空缺,會使PSC研究缺少理論根基,使PSC學科體系缺少理論內(nèi)核,成為“無根之木”或者“空心木”。因此,關于PSC的基本原理、理論構架,關于普通話水平到底是什么、其表現(xiàn)是什么,關于PSC的構想及效度等諸多理論問題,都需要深刻的研究和探索。
測試中的技術問題大致可分作兩類:一類用來控制題目和測試的質(zhì)量,另一類用來提高測試的效率(張凱,2006:3-5)。在語言測試開發(fā)和實施的全過程中,需要使用一系列技術手段來控制題目和測試的質(zhì)量。每一個環(huán)節(jié)和步驟都涉及很多技術性問題,其共同目的主要是減小測量誤差,保證測試具有較高的信度。除此之外,大規(guī)模的測試還要考慮實施效率問題。如何在最短時間內(nèi)測試到最多的考生,同時保證測量質(zhì)量不受影響,這是需要不斷探索的課題,往往需要現(xiàn)代信息技術的介入,而這其中存在著大量的技術問題。
在PSC實踐中,有關國家級題庫建設以及計算機輔助測試評分系統(tǒng)開發(fā)是最重要的技術問題之一。其中,普通話水平測試題庫的建立是規(guī)范測試工作、提高測試效率的一個重要技術手段。在建立題庫的過程中,應該始終嚴格以PSC大綱為依據(jù),根據(jù)各方言區(qū)的普通話特點,組織語言學、測量學與計算機等相關領域的專家,編制科學實用的程序,研制符合語言學標準和測量學、統(tǒng)計學要求的規(guī)范的題目、等值的試卷,建立題目和試卷自動生成的系統(tǒng)以及數(shù)據(jù)查詢系統(tǒng),從而最終建立PSC國家級題庫。關于計算機輔助PSC評分系統(tǒng)的研發(fā)工作,目前在測試的前三項上已經(jīng)達到很好的應用,這其中的技術工作包含“建立一個頂級標準數(shù)字化音檔庫,通過不同等級樣本與應試者樣本的語音匹配、分析、比較,運用實驗語音學方法,客觀展現(xiàn)應試者的普通話語音面貌,借助語音識別技術,建立標準音、錯誤音、缺陷音的匹配模板,提供出應試者的參考評分。研究的重點是:PSC中錯誤音與缺陷音總體語圖模式的分析、識別。研究的難點是:普通話語音變化的復雜性和多樣性,使建立相應的匹配模板異常困難,技術路線也需在實驗中探索。”
總之,在技術研究部分,包括測試的信度檢驗、等值手段、命題技術、評分方法等多方面的研究課題,對于同一研究課題又有不斷更新的技術手段,每種技術手段都有不同的適用范圍以及不同的應用效果。比較、檢驗、選擇和改進這些技術方法,是測量學的一個重要研究內(nèi)容。需要指出的是,一種新的技術手段的產(chǎn)生,往往是以新的理論模型為基礎的,因此,技術和理論問題也常常是相伴而生的(張凱,2006:10)。
開發(fā)語言測試的首要目的,通常并不是通過測量去揭示語言能力的本質(zhì),而往往是作為一種評價能力的工具或選拔人才的手段而被應用于社會生活中。應用問題研究主要探討的就是測試應用于社會生活中的種種問題。其中,公平性是首先需要考慮的問題。測試如果對一部分社會群體比較適合,而對另一部分群體不太適合,這個測試就是不公平的,或者說存在DIF(differential item function?ing)。由于普通話推廣是在全社會范圍內(nèi)進行的,不同方言區(qū)、不同行業(yè)對普通話學習和使用的要求和情況不同,而PSC對不同地區(qū)、不同行業(yè)是否存在DIF,也是一個需要研究的社會性課題,這方面的研究乏人問津。
由于測試與社會生活存在千絲萬縷的聯(lián)系,每一個接觸面都可能會產(chǎn)生新的研究課題。除了測試的公平性問題之外,PSC應用問題的研究還包括測試的后效以及測試輔導和培訓等種種社會性問題。特別是PSC作為國家推廣普通話的一個重要手段,其社會責任和社會作用尤其重大,因此它在社會應用方面必然存在廣大的研究空間。
需要說明的是,理論問題、技術問題、應用問題常常是相互交織的。比如,概化理論一般被認為是現(xiàn)代測量三大理論之一,但是張凱(2006:10)將其歸入技術研究部分,理由是“概化理論的核心內(nèi)容就是一套方差分析技術,概化理論的目的是控制和分解誤差,它基本上不回答(或不直接回答)‘所測特質(zhì)/能力是什么’的問題?!痹偃?,DIF問題屬于社會應用問題,但其研究方法涉及很多統(tǒng)計技術,因此也可以視為技術問題。
在規(guī)劃研究內(nèi)容時,要注意防止重技術研究、重應用研究而輕理論研究的傾向。張凱(2006:10)將這種傾向稱為“技術上的巨人,理論上的矮子”。而事實上,PSC30年的研究狀況恰恰存在這種輕理論研究的現(xiàn)象,純理論的研究屈指可數(shù)。同時,在技術研究和應用研究方面,內(nèi)容挖掘的廣度和深度也還遠遠不夠。
PSC的根本目的是“以測促訓”,即通過測試促進普通話培訓,帶動普通話學習,最終提高人們的普通話水平(姚喜雙等,2011:57)。因此,PSC的研究內(nèi)容可以歸納為四大方面:服務于PSC的漢語普通話研究、PSC這一測量工具的研究、服務于PSC的普通話教學培訓研究以及普通話習得過程和規(guī)律研究。
該領域主要研究“測什么”的問題,具體包括測誰、測什么能力、測什么內(nèi)容、測多少等。①測誰。即研究測試對象,關注其所在方言區(qū)、職業(yè)、年齡、專業(yè)背景等。②測什么能力。即研究普通話水平是什么,關注其構成因素和表現(xiàn)形式,在此基礎上對普通話水平進行能力分級描述。PSC等級標準就是這類研究的成果形式。③測什么內(nèi)容。即研究漢語普通話,尤其是普通話語音系統(tǒng),從而確定測試的內(nèi)容范圍和測試點;特別要研究普通話與方言的異同,以確定測試的重點和難點。PSC內(nèi)容大綱就是這類研究的成果形式。④測多少。這是“量”的研究,包括測試內(nèi)容的總量以多少為宜,各測試點的數(shù)量比重如何分配等。
該領域主要研究“怎么測”的問題,關注測量工具的有效性和可靠性,尋求測量普通話水平的最佳途徑。研究內(nèi)容包括對測試各個環(huán)節(jié)的科學性和可行性的檢驗及評估,主要有總體設計、命題制卷、實施測試、閱卷評分、統(tǒng)計分析、考務管理、測試員隊伍建設、現(xiàn)代化測試手段等系列環(huán)節(jié),并從信度、效度、可行性及后效等方面對PSC的整體質(zhì)量進行評價和研究??梢哉f,這是體現(xiàn)測量學研究特征的一個重點內(nèi)容,需要大量測量學理論和方法的介入。但在PSC研究成果中,這類研究無論從內(nèi)容的廣度還是研究的深度上都還存在很大的提升空間。不僅很多測試環(huán)節(jié)沒有得到關注,而且理性思考明顯不足,缺少科學的研究方法和實驗手段,主要還流于感性的描述和經(jīng)驗的總結。
這一領域主要研究“怎么教”的問題,關注普通話教學及培訓過程,尋求有效的教學途徑。研究內(nèi)容包括教學大綱的制定、培訓教材的編寫、培訓課程的設置、教學的方法技巧、應試策略輔導等。該研究內(nèi)容在PSC研究中成果頗豐,但普遍缺乏科學的理論和方法指導,重復性研究較多,研究質(zhì)量不高。
這一領域主要研究“怎么學”的問題,涉及普通話學習過程與學習規(guī)律的研究,需要引入中介語理論、偏誤分析、對比分析等語言學習理論,還需要借鑒心理學、社會學等相關學科的理論與方法,邁出了傳統(tǒng)語言學研究的范疇,具有跨學科的研究特點。具體研究內(nèi)容包括:①對學習者語言本身的研究。即對學習者從方言向標準普通話過渡中的地方普通話的研究,相當于對學習者的中介語進行研究。這方面的研究既包括靜態(tài)、共時的中介語特征或規(guī)律的研究,也包括動態(tài)、歷時的中介語習得過程的研究。②對學習者普遍認知規(guī)律與習得方式的研究。后者包括漢語普通話語言各要素的習得方式研究,特別是普通話語音習得方式的研究。③從學習者的外部因素(如社會因素)、學習者的內(nèi)部因素(如心理因素)以及學習者的個體差異(如生理、情感、動機、認知特點和學習策略)三個側面對學習者進行研究,關注影響普通話水平的各種因素,并探討各因素之間相互作用的關系。
上述四方面的研究內(nèi)容結合起來,就是PSC研究的內(nèi)容框架。
“二分法”、“三分法”和“四分法”都是從宏觀層面對PSC研究內(nèi)容所做的分類。而每一塊宏觀的研究內(nèi)容都是由一個個微觀的研究內(nèi)容構成的,都需要通過一個個微觀問題的研究來落實。所以,在規(guī)劃完宏觀研究內(nèi)容之后,還要繼續(xù)細化分類,規(guī)劃微觀的研究內(nèi)容。而“宏觀”、“微觀”只是相對而言的,如果A課題細化成a、b等課題,而a課題又細化成(a)、(b)等課題,那么A相對于a、b來說,前者就是宏觀研究內(nèi)容,后者就是微觀研究內(nèi)容;同樣,a相對于(a)、(b)來說,前者也是宏觀研究內(nèi)容,后者是微觀研究內(nèi)容。
比如,對于“影響PSC成績的學習者因素研究”這樣一個研究內(nèi)容,可以細化出更微觀的研究內(nèi)容:
(1)民族因素對測試成績的影響研究——遷移(語音、詞匯、語法等);
(2)方言因素對測試成績的影響研究——遷移(語音、詞匯、語法等);
(3)職業(yè)因素對測試成績的影響研究——播音員、教師、學生、公務員、其他行業(yè)等;
(4)專業(yè)因素對測試成績的影響研究——文科專業(yè)、理工科專業(yè)等;
(5)受教育程度對測試成績的影響研究——普通大中專院校、職業(yè)技術培訓類院校等;
(6)生活地域因素對測試成績的影響研究——城市、農(nóng)村等;
(7)生理因素對測試成績的影響研究——年齡、性別等;
(8)認知因素對測試成績的影響研究——智力、學能、學習策略、學習風格等;
(9)情感因素對測試成績的影響研究——性格、態(tài)度、心理等;
(10)應試動機因素對測試成績的影響研究——教育需要、職業(yè)需要、興趣需要等。
上述因素只是羅列了大概,并未窮盡全部影響因素。而且,各條因素的排序是隨意的,并未作重要程度之分。只有對上述各條因素進行了系統(tǒng)研究之后,有關“影響PSC成績的學習者因素研究”才可以說得到了比較充分的研究。
總之,規(guī)劃PSC學科的研究內(nèi)容也是一個系統(tǒng)工程,需要找準研究主線,劃定研究區(qū)域,理清研究層次,從宏觀到微觀地對PSC研究內(nèi)容進行分層和分級。這一系統(tǒng)工程的建成有助于PSC研究者明確研究定位,理順研究思路,洞悉研究路向,既能看到“樹木”,也能看到“森林”,既能“瞻前”,也能“顧后”,從而減少PSC研究的盲目性和重復性,增強PSC研究的方位性和條理性。
[1]國家語言文字工作委員會普通話培訓測試中心.普通話水平測試實施綱要[M].北京:商務印書館.2004.
[2]聶丹.關于普通話水平測試研究走向的思考[J].語言文字應用,2011(2):92-99.
[3]盛炎.語言教學原理[M].重慶:重慶出版社.1990.
[4]姚喜雙,韓玉華,聶丹,黃霆瑋,孟暉.普通話水平測試概論[M].北京:高等教育出版社.2011.
[5]張凱.語言測試理論及漢語測試研究[M].北京:商務印書館.2006.
Thoughts on Research Contents of Putonghua Proficiency Test(PSC)
NIE Dan
It is a system engineering to program the research contents of putonghua proficiency test(PSC),which needs defining the research principal line,dividing the research area,organizing the research level,and following the stratification and grading principles for PSC research contents from macroscopical to microcosmic.This paper discusses 6 essential questions of PSC research.And on that basis,it takes turns to tell about the macro classification(“Dichotomy”,“Trichotomy”and“Quartation”)and the micro classification for PSC research contents.The completion of this system engineering will help the PSC researchers to understand the research orientation,to straighten out the research ideas,to know the research routes clearly,and thus to reduce the blindness and repeatability,and to enhance the sense of orientation and order in PSC research.
PSC;Discipline;Research Contents
G405
A
1005-8427(2012)06-0003-7
本課題為北京語言大學青年自主科研支持計劃資助項目(中央高校基本科研業(yè)務費專項資金資助)(11JBB021),謹致謝忱!
北京語言大學