国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于因子分析的中文學(xué)習(xí)者低分段作文語言特征研究*

2022-03-14 10:16玲孫金華
外語研究 2022年1期
關(guān)鍵詞:低分因子學(xué)習(xí)者

王 玲孫金華

(1.南京大學(xué)文學(xué)院,江蘇 南京 210023;2.國(guó)防科技大學(xué)國(guó)際關(guān)系學(xué)院,江蘇 南京 210023)

0.引言

寫作一直是第二語言習(xí)得領(lǐng)域研究(包括對(duì)外漢語教學(xué))中反映學(xué)生綜合語言能力的重要組成方面。如何有效解決高水平學(xué)習(xí)者口語能力與書面寫作能力不平衡的問題,日益引起關(guān)注。近年來,一些學(xué)者開始嘗試從語言區(qū)別性特征來討論第二語言或外語寫作問題(Ortega 2003;Lu 2011;Verspoor et al.2012)?!罢Z言區(qū)別性特征”(亦簡(jiǎn)稱為“語言特征”,下文統(tǒng)一稱為“語言特征”)指的是對(duì)某一語言文本的語言要素(比如詞匯、句子結(jié)構(gòu)等)進(jìn)行描寫所概括出的客觀性成分及特征(Jiang 2013;Jin&Barley 2013)。不少學(xué)者研究發(fā)現(xiàn),語言特征是影響二語學(xué)習(xí)者作文質(zhì)量的重要因素(Humphry et al.2014;Banerjee et al.2015;吳繼峰2018),也是有效體現(xiàn)二語學(xué)習(xí)者書面語水平的重要特征(Malvern&Brian 2002)。不過,有較多研究關(guān)注的是某個(gè)或某幾個(gè)語言特征對(duì)寫作的影響(Laufer&Paul 1999;Housen&Folkert 2009)。作文是一個(gè)有機(jī)整體,某個(gè)維度(比如詞匯)語言特征的指標(biāo)表現(xiàn)較好,不意味著作文質(zhì)量就高(Ortega 2003)。基于上述背景,本研究選取了不同維度的指標(biāo)來分析語言特征與作文質(zhì)量的關(guān)系。

1.研究設(shè)計(jì)

1.1 研究對(duì)象和確定的語言特征

本研究以中文學(xué)習(xí)者低分段作文為研究對(duì)象。作文樣本來自北京語言大學(xué)HSK動(dòng)態(tài)作文語料(http://yuyanziyuan.blcu.edu.cn/info/1043/1501.htm)。選取的低分段作文(無等級(jí)證書以及6-8級(jí)證書),成績(jī)?cè)?0~60分之間。由于一些研究表明體裁、話題等會(huì)影響二語寫作的質(zhì)量(Kormos 2011;劉瑜2017),因此,為排除不同體裁和話題的干擾,選取的120份作文均為議論文,且限制在3個(gè)話題:“我看流行歌曲”“父母是孩子的第一任老師”和“學(xué)習(xí)漢語的苦與樂”??疾斓恼Z言特征涉及詞匯、句法、語篇、漢字這4個(gè)維度。

1.1.1 詞匯維度

已有學(xué)者用“詞匯豐富性”(lexical richness)作為探究詞匯與寫作質(zhì)量使用關(guān)系的測(cè)量指標(biāo)。Read(2000)將“詞匯豐富性”的指標(biāo)分類為詞匯密度、詞匯復(fù)雜性、詞匯變異性、詞頻分布和詞語錯(cuò)誤(Lexical errors)。王藝璇(2017)在此基礎(chǔ)上將“詞匯豐富性”的內(nèi)涵擴(kuò)展為詞種數(shù)(Type)、詞匯多樣性、詞匯復(fù)雜性、詞匯密度、詞匯準(zhǔn)確性等。本文借鑒王藝璇(同上)提出的詞匯測(cè)量的總括性指標(biāo),但又剔除掉“詞匯復(fù)雜性”這一指標(biāo)。因?yàn)椤霸~匯復(fù)雜性”指罕見詞語(Lexical rareness)在文本中出現(xiàn)的比重(Read 2000),Yuan&Ellis(2002)、鮑貴(2008)等學(xué)者發(fā)現(xiàn)詞匯復(fù)雜性是區(qū)分不同水平學(xué)習(xí)者的最佳指標(biāo)和依據(jù)。而本文是針對(duì)同一水平即高水平留學(xué)生展開的,因此最終確定詞匯方面的測(cè)量指標(biāo)包括:詞種數(shù)、詞匯多樣性、詞匯密度、詞匯準(zhǔn)確性。具體統(tǒng)計(jì)方法如下:

(1)詞種數(shù):指的是作文中詞匯類符數(shù)量,如“我認(rèn)為流行歌曲使人們感到很舒服,因此我喜歡流行歌曲。”詞種數(shù)為11,包括“我、感到、很、人們、認(rèn)為、使、舒服、喜歡、因此、流行、歌曲”這11個(gè)詞,其中“歌曲”和“流行”雖出現(xiàn)兩次,詞種數(shù)僅計(jì)算一次。

(2)詞匯多樣性:是指學(xué)習(xí)者在語言使用中所展現(xiàn)出的詞匯變化程度(Malvern&Brian 2002)。詞種數(shù)和總詞數(shù)的比(Type-token ratio,TTR)是使用最廣泛的計(jì)算公式,但一些學(xué)者研究發(fā)現(xiàn)TTR的信度受到文本長(zhǎng)度的影響。本文由于所用語料庫(kù)容量相近,且所選取的二語寫作文本均為限制字?jǐn)?shù)條件下的寫作任務(wù),文本字?jǐn)?shù)受到控制,故使用計(jì)算較簡(jiǎn)便的詞種數(shù)與總詞數(shù)的比。具體計(jì)算公式為:詞匯多樣度=(詞種數(shù)/總詞數(shù))×100%。

如“父親是我最尊敬的人,也是我的朋友,我愛我的父親?!痹~種數(shù)為10,包括“我、的、父親、愛、朋友、人、是、也、最、尊敬”這10個(gè)詞,其中“我”出現(xiàn)4次;“的”出現(xiàn)3次;“父親”和“是”出現(xiàn)2次,總詞數(shù)是17,則詞匯多樣度為(詞種數(shù)/總詞數(shù))×100%=58.82%。

(3)詞匯密度:指的是某一文本中實(shí)詞(Lexical word)在總詞數(shù)中的比重。本文采用Laufer&Paul(1999)提出的詞匯密度計(jì)算公式:詞匯密度=(實(shí)詞種數(shù)/總詞種數(shù))×100%。例如:“父親是我最尊敬的人,也是我的朋友,我愛我的父親?!边@一句中,總詞數(shù)是17;實(shí)詞種數(shù)8包括“我、父親、愛、朋友、最、是、人、尊敬”這8個(gè)詞,故詞匯密度為(實(shí)詞種數(shù)/總詞種數(shù))×100%=80%。

(4)詞匯準(zhǔn)確性:指的是某一文本中使用正確的詞語在總詞數(shù)中的比重即為詞匯正確率(Read 2000:131)。由于本文考察對(duì)象為參加高等漢語水平考試(HSK高等)總分在280分-500分之間的學(xué)生,其語言水平較高,計(jì)算正確詞匯數(shù)量操作難度較大,本文借鑒吳繼峰(2018)使用的采取通過計(jì)算錯(cuò)誤率的方式進(jìn)行統(tǒng)計(jì)計(jì)算的方法,即用每篇作文的錯(cuò)詞數(shù)除以每篇作文的總詞數(shù),最后,從1中減去錯(cuò)誤率得到正確率。

本文在分析學(xué)生作文詞匯錯(cuò)誤時(shí)發(fā)現(xiàn),此階段學(xué)生詞匯錯(cuò)誤可以劃分為語義錯(cuò)誤與詞匯偏誤兩類。其中,語義錯(cuò)誤包括理性意義基本相同的詞、語素相同的詞、母語多義對(duì)應(yīng)的漢語詞、單音節(jié)和雙音節(jié)同義詞等使用錯(cuò)誤(同上)。本文使用“語義錯(cuò)誤率”統(tǒng)計(jì)每篇作文中語義錯(cuò)誤的分布情況,具體計(jì)算公式是:語義錯(cuò)誤率=(語義錯(cuò)誤數(shù)量/文章總詞數(shù))×100%;如“最苦(痛苦)的事是對(duì)別人不能表示(表達(dá))我的思考(想法)。”總詞數(shù)是13;語義錯(cuò)誤數(shù)為3,語義錯(cuò)誤率為(語義錯(cuò)誤數(shù)量/文章總詞數(shù))=23.08%。

詞匯偏誤包括外來詞、誤用詞、多余詞、混合詞和缺詞等。本文使用“詞匯偏誤率”統(tǒng)計(jì)每篇作文詞匯偏誤的分布情況,具體計(jì)算公式是:詞匯偏誤率=(詞匯偏誤數(shù)量/文章總詞數(shù))×100%。如“根(根據(jù))聲調(diào)來(的)意思都(的)不同。每個(gè)人都有經(jīng)驗(yàn)(經(jīng)歷)過以(因?yàn)?聲調(diào)為出(鬧出)了(的)很多難忘的事情?!笨傇~數(shù)是22;詞匯偏誤數(shù)為6,詞匯偏誤率為(詞匯偏誤數(shù)量/文章總詞數(shù))=27.27%。另外,詞形錯(cuò)誤我們放在漢字層面進(jìn)行統(tǒng)計(jì)(具體見后文)。

1.1.2 句法維度

句法維度,指的是學(xué)界普遍采用“句法復(fù)雜性”這一標(biāo)準(zhǔn)?!熬浞◤?fù)雜性”(syntactical complexity),也被稱為“語法復(fù)雜性”(grammatical complexity),或者“句法成熟度”(syntactic maturity)(Ortega 2003)。本研究的“句法復(fù)雜性”利用T單位長(zhǎng)度、無誤T單位百分比、話題鏈長(zhǎng)度、話題鏈分句數(shù)、零形成分?jǐn)?shù)和特殊句計(jì)數(shù)等幾個(gè)指標(biāo)進(jìn)行考察。具體統(tǒng)計(jì)方法如下:

(1)T單位長(zhǎng)度。指的是一個(gè)T單位中所包含的字?jǐn)?shù)(Jiang 2013)。那么何為“T單位”?本文借鑒安福勇(2015)和吳繼峰(2018)的研究,將T單位定義為:包含一個(gè)獨(dú)立謂語和其他附屬小句或嵌入小句的獨(dú)立主句。具體來說,可包括以下幾條標(biāo)準(zhǔn):簡(jiǎn)單句作為一個(gè)T單位;一個(gè)由兩個(gè)或兩個(gè)以上分句組成的復(fù)句,根據(jù)每個(gè)分句中是否有謂語被劃分為不同的T單位。只有當(dāng)分句中有謂詞時(shí),它才能被視為T單位;復(fù)雜句中的嵌入分句不作為獨(dú)立的T單位;分句中均含有謂語的情況下,漢語偏正復(fù)句,由一個(gè)分句承載主要信息,從句依附于主句,所以算作一個(gè)T單位;漢語聯(lián)合復(fù)句,每一個(gè)并列的分句都算作兩個(gè)T單位。(其中偏正復(fù)句與聯(lián)合復(fù)句的分類標(biāo)準(zhǔn)參照黃伯榮和廖序東(2017:134)。例如:

[1]我的父親是一名辦事員。(一個(gè)T單位)

[2]對(duì)我來說,父親是對(duì)我影響最大的人。(一個(gè)T單位)

[3]父親叫我去他的單位工作。(一個(gè)T單位)

[4]只要聽到母親的歌聲,那聲音的影片便會(huì)放映出來。(一個(gè)T單位)

[5]他一邊收拾行李,一邊認(rèn)真思考父親的話。(兩個(gè)T單位)

其中例[1]是一個(gè)簡(jiǎn)單句,可以看出一個(gè)T單位;例[2]含有兩個(gè)分句,雖然表示某種復(fù)句結(jié)構(gòu),但第1個(gè)分句“對(duì)我來說”是一個(gè)插入語,沒有謂語,可以看作一個(gè)T單位;例[3]是一個(gè)復(fù)雜句,可以看作一個(gè)T單位;例[4]是一個(gè)偏正結(jié)構(gòu)的復(fù)句,因此算作一個(gè)T單位;例[5]是聯(lián)合復(fù)句,每一個(gè)并列的分句都算作一個(gè)T單位,整個(gè)句子為兩個(gè)T單位。

統(tǒng)計(jì)方法為:統(tǒng)計(jì)每篇作文中T單位所包含的平均字?jǐn)?shù)。如:“雖然城市的生活有些繁忙,但我總覺得自己是適合這種生活方式的。”此句為偏正復(fù)句,包括2個(gè)T單位,平均T單位長(zhǎng)度為14(所包含的平均字符數(shù))。

(2)無誤T單位百分比。指的是沒有語言錯(cuò)誤的T單位占T單位總數(shù)中的比例(Jiang 2013)。其中對(duì)語言錯(cuò)誤的認(rèn)定,本文基本采用HSK動(dòng)態(tài)語料庫(kù)的偏誤標(biāo)記,但在本研究中不計(jì)繁體字和標(biāo)點(diǎn)錯(cuò)誤、字層面的偏誤、詞層面的偏誤。只記錄句子層面的偏誤,如:缺少句子成分、存在多余句子成分、特殊句式錯(cuò)誤(如“把”字句錯(cuò)誤、“被”字句錯(cuò)誤等)、重疊錯(cuò)誤、語序錯(cuò)誤、固定格式錯(cuò)誤、不完整句等。

具體計(jì)算公式是:(無誤T單位數(shù)量/T單位總數(shù))×100%。如:“這句話對(duì)每個(gè)孩子應(yīng)是很感動(dòng)?!贝司溆姓Z法錯(cuò)誤,應(yīng)改為“這句話對(duì)每個(gè)孩子來說都很感動(dòng)”,此為有誤T單位,不計(jì)入計(jì)算。

(3)話題鏈長(zhǎng)度。指的是每篇作文中話題鏈所含的平均字?jǐn)?shù)(ibid.),其中話題鏈?zhǔn)菨h語的一種語篇單位。曹逢甫(1995:105)為了解決漢語句子界限模糊的問題,最早在漢語中引入了話題鏈的概念,他指出話題鏈?zhǔn)怯梢粋€(gè)或數(shù)個(gè)小句所組成且以一個(gè)出現(xiàn)在句首的共同話題貫穿其間的一段話。關(guān)于話題鏈的具體劃分,有幾個(gè)問題需要做簡(jiǎn)要說明。首先,單句后不存在具有相同話題的分句,此單句是否可以計(jì)算成為一個(gè)話題鏈?如“昨天我已經(jīng)去過了”此句后再無其他成分。其次,話題鏈鏈?zhǔn)仔【涞奈恢贸霈F(xiàn)顯性話題,其他小句位置是否可以出現(xiàn)顯性的同指代詞以及名詞?如“媽媽的畫已經(jīng)畫完了,這其中包括中國(guó)古典的意象?!逼渲械诙渲邪复~“這”,是否可以與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。本文的話題鏈劃分方法,將通過舉例說明。

[6]昨天我不是很舒服。

[7]那棵樹樹干細(xì),葉子大,很不協(xié)調(diào),所以我沒買。

[8]媽媽的畫已經(jīng)畫完了,這其中包括中國(guó)古典的意象。

例[6]句以“我”為單個(gè)小句,單句后不存在具有相同話題的分句,但本文也將其計(jì)算成為一個(gè)話題鏈;例[7]以“那棵樹”為主題,其后分句均以“那棵樹”為話題,為多個(gè)小句構(gòu)成的話題鏈,這是典型的話題鏈的形式,計(jì)算成為一個(gè)話題鏈;例[8]句中話題鏈,鏈?zhǔn)仔【涞奈恢贸霈F(xiàn)顯性話題,其他小句的話題位置以“同指代詞”或“名詞”代替,如第二句中包含同指代詞“這”,本文將其與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。之所以這樣劃分,是考慮到本文的研究語料不是漢語母語者的作文,而是以漢語為第二語言的留學(xué)生中文作文,這一劃分標(biāo)準(zhǔn)放寬了話題鏈的定義范圍,便于計(jì)算和確保數(shù)據(jù)的有效性,也為后期計(jì)算話題鏈與作文質(zhì)量的關(guān)系提供條件。

具體的統(tǒng)計(jì)方法為:計(jì)算每篇作文中話題鏈所含的平均字?jǐn)?shù)(吳繼峰2016:28)。如“祥子知道自己混到那么干凈利落已經(jīng)是怎樣的不容易,聞著現(xiàn)在身上的臭汗味,他把以前的掙扎與成功看得分外光榮,比原來的光榮放大了十倍?!?老舍《駱駝祥子》)按照話題鏈的定義,此選段為一個(gè)話題鏈,話題鏈長(zhǎng)度為60。

(4)話題鏈的分句數(shù)。指的是指每一個(gè)話題所包含的分句數(shù)量(Jin&Barley 2013)。具體計(jì)算方法:統(tǒng)計(jì)每篇作文中話題鏈所含的分句平均數(shù)(包括含有主題的首句)(吳繼峰2016:29)。又如這句“祥子知道自己混到那么干凈利落已經(jīng)是怎樣的不容易,聞著現(xiàn)在身上的臭汗味,他把以前的掙扎與成功看得分外光榮,比原來的光榮放大了十倍?!?老舍《駱駝祥子》),此選段為一個(gè)話題鏈,分句數(shù)為4。

(5)零形成分?jǐn)?shù)。關(guān)于零形成分的定義,本文借鑒Jin&Barley(2013)的主張,認(rèn)為零形成分為一種由兩個(gè)或兩個(gè)以上分句組成的序列,其特征是幾個(gè)分句共有一個(gè)主題,其主題只出現(xiàn)在第一個(gè)分句中,其余均以“無詞匯”形式出現(xiàn),這種空白的形式,即為零形成分。零形成分?jǐn)?shù)主要指零形主題或主語的數(shù)量。具體計(jì)算方法為:統(tǒng)計(jì)每篇作文話題鏈中零形成分總數(shù)。如:“我認(rèn)識(shí)她,?長(zhǎng)得又高又瘦,?整天在看書”,其中“?”為零形成分,此句零形成分?jǐn)?shù)為2。

(6)特殊句計(jì)數(shù)。主要是指具有漢語特點(diǎn)且留學(xué)生易出現(xiàn)偏誤的句子(韓笑,馮麗萍2017)。選取標(biāo)準(zhǔn)主要借鑒《漢語水平等級(jí)標(biāo)準(zhǔn)與語法等級(jí)大綱》(1996)以及《國(guó)際漢語教學(xué)通用課程大綱》(2014修訂版)所規(guī)定的符合漢語書面語教學(xué)要求且中文學(xué)習(xí)者易出現(xiàn)偏誤的句式。具體計(jì)算方法為統(tǒng)計(jì)特殊句的數(shù)量,其中只計(jì)算正確的特殊句型句。

表1 :特使句型例表

1.1.3漢字和篇章維度

關(guān)于漢字維度測(cè)量標(biāo)準(zhǔn),本文采用學(xué)界普遍使用的漢字正確率進(jìn)行研究(王藝璇2017;吳繼峰2018)。其中漢字錯(cuò)誤的界定,借鑒吳繼峰(2018)的研究方法,將漢字錯(cuò)誤分成兩類:一類是字形錯(cuò)誤,即錯(cuò)別字,包括錯(cuò)字、別字、漏字、多字;第二類是用拼音代替漢字,包括拼音字、無法識(shí)別字。

具體計(jì)算方法如下:首先利用國(guó)家語委的字詞統(tǒng)計(jì)軟件計(jì)算每篇作文的總字?jǐn)?shù)(不包含標(biāo)點(diǎn)在內(nèi)),再根據(jù)HSK動(dòng)態(tài)作為語料庫(kù)中的錯(cuò)字標(biāo)注計(jì)算每篇作文中的錯(cuò)字字?jǐn)?shù),然后計(jì)算每篇作文中漢字錯(cuò)誤率,最后用1減去錯(cuò)誤率即為漢字正確率。具體計(jì)算公式是:1-(兩類漢字錯(cuò)誤的總個(gè)數(shù)/總字?jǐn)?shù))×100%。如“他跟他的朋友說了一兩邊,說他再做一年就不做了?!边@句中“邊”為錯(cuò)別字,應(yīng)該改為“遍”,則此句漢字正確率為95%。

在語篇方面,本文借鑒呂文華(2014)的觀點(diǎn),從語法手段、詞匯手段和連接成分中選取篇章維度測(cè)量標(biāo)準(zhǔn)。由于本文句法維度的測(cè)量包含特殊句、話題句等測(cè)量指標(biāo),因此不單獨(dú)對(duì)語法手段進(jìn)行測(cè)量,且由于本文的測(cè)量對(duì)象為以漢語為第二語言的留學(xué)生,其漢語作文中介詞與助詞的使用頻率較低,不易得到有效數(shù)據(jù)。綜合上述兩點(diǎn),本文選取連接成分中的“連詞”以及詞匯手段中的“代詞”作為篇章維度測(cè)量標(biāo)準(zhǔn),探尋“代詞計(jì)數(shù)”“連詞計(jì)數(shù)”與作文質(zhì)量的關(guān)系。具體統(tǒng)計(jì)方法如下:

(1)代詞計(jì)數(shù):即每篇中正確使用的代詞數(shù)量,本文參照黃伯榮和廖序東(2017:183)對(duì)于代詞的定義標(biāo)準(zhǔn),即代詞指能夠起替代和指示作用的詞,它大致相當(dāng)于所取代和表示的語言單位的語法功能。按照句法功能劃分“代詞”包括代名詞、代謂詞、代數(shù)詞、代副詞,其中代名詞的代詞包括“人稱代詞”“疑問代詞”和“指示代詞”?!按~計(jì)數(shù)”的具體計(jì)算方法為統(tǒng)計(jì)平均每100詞中正確使用的代詞數(shù)量。如“告訴我他是誰?!边@一句中“我”和“他”均為人稱代詞,代詞計(jì)數(shù)為2。

(2)連詞計(jì)數(shù):即每篇中正確使用的連詞數(shù)量,本文參照黃伯榮和廖序東(同上:185)對(duì)于連詞的定義標(biāo)準(zhǔn),即連詞是指起連接作用,連接詞、短語、分句和句子等,表示并列、選擇、遞進(jìn)、轉(zhuǎn)折、條件、因果等關(guān)系的詞。“連詞計(jì)數(shù)”的具體計(jì)算方法為,統(tǒng)計(jì)平均每100詞中正確使用的連詞數(shù)量。如“既能實(shí)現(xiàn)交流,又能被廣為接受的手段就是社會(huì)革命。”其中“既……又”即為連詞,連詞計(jì)數(shù)為2。

1.2 研究問題和研究方法

主要研究問題是漢語學(xué)習(xí)者低分段作文在語言特征方面表現(xiàn)出哪些特征以及反映出的作文的問題與不足。為了解決上述問題,本研究采用因子分析法對(duì)上述14個(gè)測(cè)量指標(biāo)進(jìn)行分析。因子分析法是研究如何保證信息最少丟失的情況下,使因子變量具有較強(qiáng)解釋性的一種多元統(tǒng)計(jì)分析方法(Gusti 1993)。較之于線性回歸分析法,因子分析法的優(yōu)勢(shì)是可以從眾多變量中歸納、篩選出最有影響的變量,然后用這些最有影響的變量來解釋最大量的觀測(cè)事實(shí),從而得以揭示出事物之間最本質(zhì)的聯(lián)系(Tweedie&Baayen 1998)。

首先,用SPSS(24.0)因子分析統(tǒng)計(jì)軟件中的KMO和Bartlett球形檢驗(yàn)對(duì)14個(gè)測(cè)量指標(biāo)數(shù)據(jù)進(jìn)行分析。結(jié)果表明:卡方=327.789.P=.000,而且,KMO值為0.821。其中p=.000<0.001說明數(shù)據(jù)做因子分析具有有效性,可以通過因子分析方法展開研究。其次,確定有統(tǒng)計(jì)意義的測(cè)量指標(biāo)。載荷值為0.35或更大被認(rèn)為有統(tǒng)計(jì)意義,結(jié)果顯示,除“特殊句計(jì)數(shù)”外,其他13項(xiàng)的載荷值大于0.35,為有效指標(biāo)。第三步,確定因子個(gè)數(shù)。利用主成分分析法和極大似然法正交旋轉(zhuǎn),從13種語言區(qū)別性特征的數(shù)據(jù)中心提取主成分,確定因子個(gè)數(shù)。13個(gè)語言特征最終綜合成為4個(gè)因子(因子1-因子4)。這4個(gè)因子代表了低分段留學(xué)生中文作文的主要語言特征,也是影響低分段留學(xué)生作文質(zhì)量的重要因素。第四步,提取亞因子,給因子命名。為確定4個(gè)因子所包含的語言特征,分析低分段留學(xué)生漢語作文特點(diǎn),我們利用極大似然法,在主成分分析的基礎(chǔ)上進(jìn)行空間旋轉(zhuǎn),用以確定上述4個(gè)因子的亞因子。亞因子檢驗(yàn)結(jié)果見下表。

表2 :低分段作文語言區(qū)別性特征亞因子分布及測(cè)量指標(biāo)載荷情況

上表顯示,因子一包括5個(gè)亞因子(語義錯(cuò)誤率、詞匯偏誤率、無誤T單位百分比、漢字正確率以及連詞計(jì)數(shù));因子二包括4個(gè)亞因子(話題鏈長(zhǎng)度、零形成分?jǐn)?shù)、代詞計(jì)數(shù)、話題鏈分句數(shù));因子三包括詞匯多樣性、詞匯密度2個(gè)亞因子;因子四包括詞種數(shù)、T單位長(zhǎng)度2個(gè)亞因子。

根據(jù)同一因子的亞因子之間存在較高的共性,可以確定因子的性質(zhì),進(jìn)而為因子命名(吳紅云 劉潤(rùn)清2004)。根據(jù)這一特點(diǎn),對(duì)因子一-四的命名情況為:因子一命名為“準(zhǔn)確性”因子。因子一包含的5個(gè)亞因子均與語言使用準(zhǔn)確性相關(guān)。吳繼峰(2016)、李春琳(2017)等學(xué)者均使用上述指標(biāo)測(cè)量過漢語學(xué)習(xí)者語言的準(zhǔn)確性,故命名為“準(zhǔn)確性”因子。因子二包含的4個(gè)亞因子均為Jin&Barley(2013)提出的可以有效考察漢語話題鏈的測(cè)量指標(biāo),故命名為“話題鏈”因子。因子三包含的2個(gè)亞因子主要用來探究不同類型的詞語在語篇中所占比重的多少,測(cè)量學(xué)習(xí)者使用詞匯的范圍(Scott&Michael 2013),詞匯使用范圍越廣,語言多樣性越高(秦曉晴2009),故命名為“詞匯多樣性”因子。因子四包含的兩個(gè)亞因子均用來觀察漢語學(xué)習(xí)者輸出詞匯和句法的“量”的指標(biāo),與作文篇幅長(zhǎng)短相關(guān)。曹賢文、鄧素娟(2012)和安福勇(2015)等曾使用以上兩種指標(biāo)測(cè)量學(xué)生輸出詞匯的多少與句子的長(zhǎng)短,故將因子四命名為“篇幅”因子。

2.低分段作文四因子的統(tǒng)計(jì)結(jié)果

2.1 準(zhǔn)確性因子

關(guān)于“準(zhǔn)確性”的定義,學(xué)者們的看法比較一致,指的是沒有錯(cuò)誤,表意清楚明白,確切無誤,不產(chǎn)生歧義(李旭奎等2017;張恒超2018)。但研究者在測(cè)量“準(zhǔn)確性”時(shí),存在分歧較大。比如,選詞錯(cuò)誤、拼寫錯(cuò)誤、斷句錯(cuò)誤等,都在一定程度上反映寫作的準(zhǔn)確性問題,但不同的學(xué)者對(duì)待他們的態(tài)度存在差異,有些忽略不計(jì),有些加以統(tǒng)計(jì)。這些都涉及到如何對(duì)待和選取錯(cuò)誤以及如何確定語言準(zhǔn)確性標(biāo)準(zhǔn)的問題。

如何確定語言準(zhǔn)確性的標(biāo)準(zhǔn),學(xué)界還沒有統(tǒng)一的結(jié)論。本研究較認(rèn)同郝全梅(2008)的說法,她認(rèn)為“二語學(xué)習(xí)者”與“母語者”不同,其目的語并不一定要做到確切無誤,讀者讀其語言,能夠準(zhǔn)確完整地理解他們的意圖即可。因此在檢索時(shí),將“不造成歧義”作為判斷“語言準(zhǔn)確性”的輔助標(biāo)準(zhǔn)。雖然HSK語料庫(kù)已經(jīng)完成了語言錯(cuò)誤的標(biāo)注,但我們不盲目將語料庫(kù)標(biāo)注的語言錯(cuò)誤計(jì)算在內(nèi),而是在理解性的基礎(chǔ)上從整篇文章不同緯度綜合的角度出發(fā)判斷語言錯(cuò)誤。如語料庫(kù)中將繁體字計(jì)為錯(cuò)別字,本著“不造成歧義”即可的原則,本研究不探究繁體字與簡(jiǎn)化字的差異,在計(jì)算漢字正確率時(shí)不將繁體字計(jì)為錯(cuò)別字。

為了更好地描述準(zhǔn)確性語言特征在漢語學(xué)習(xí)者作文中的表現(xiàn),我們通過計(jì)算各個(gè)語言特征的“標(biāo)準(zhǔn)分”來加以檢驗(yàn),通過“標(biāo)準(zhǔn)分”判斷測(cè)量指標(biāo)對(duì)因子的作用(公式如下)(劉照德等2019)。其中“標(biāo)準(zhǔn)分”分布類似于坐標(biāo)軸,正數(shù)代表存在或數(shù)量多,負(fù)數(shù)代表缺失或數(shù)量少。而數(shù)字越大,其作用越明顯;越趨近于0,作用越小。例如,假設(shè)語義錯(cuò)誤率以及詞匯偏誤率的標(biāo)準(zhǔn)分為正,既表現(xiàn)為語義錯(cuò)誤以及詞匯偏誤較多,而無誤T單位百分比為負(fù),則表示為無誤T單位百分比較低,無誤T單位較少,其他亞因子分析原則以此類推。(z為標(biāo)準(zhǔn)分,x為原始載荷,xˉ為平均值,s為標(biāo)準(zhǔn)差)“準(zhǔn)確性”因子的統(tǒng)計(jì)結(jié)果見表3?!皽?zhǔn)確性”因子包含的5個(gè)亞因子,其載荷值均>0.35,有統(tǒng)計(jì)意義,均為有效指標(biāo)。

表3 :因子—亞因子分布及測(cè)量指標(biāo)載荷及方差

其中“語義錯(cuò)誤率”“詞匯偏誤率”“無誤T單位百分比”,3個(gè)測(cè)量指標(biāo)的載荷值依次超過了0.8>0.35(載荷值為0.35或更大的被認(rèn)為有統(tǒng)計(jì)意義),說明語義錯(cuò)誤、詞匯偏誤以及T單位錯(cuò)誤是影響低分段作文準(zhǔn)確性的主要因素。此外,“漢字正確率”以及“連詞計(jì)數(shù)”這兩個(gè)區(qū)別性特征載荷值也大于0.6,說明它們也是影響低分段作文準(zhǔn)確性的重要因素。

2.2 話題鏈因子

學(xué)界關(guān)于話題鏈的定義大體可分為兩類。一類以屈承熹(1998)等學(xué)者為代表。他們認(rèn)為,話題鏈?zhǔn)且粋€(gè)由多個(gè)小句組成的段落,共享一個(gè)主話題。主題顯性出現(xiàn)在一個(gè)子句中,隱性出現(xiàn)在其他子句中。如“那棵樹樹干細(xì),葉子大,很不協(xié)調(diào),所以我沒買,”該句話題“那棵樹”為主題,在句首小句中顯性出現(xiàn),其他小句中未出現(xiàn)。另一類以曹逢甫(1995)、方梅(2008)等學(xué)者為代表。他們認(rèn)為,話題鏈?zhǔn)怯梢粋€(gè)或數(shù)個(gè)小句組成,具有共同話題,且話題貫穿其間的一段話。這一定義與第一類定義最大的區(qū)別在于,不僅第一個(gè)小句的話題位置可以出現(xiàn)話題,其他分句也可以出現(xiàn),占主導(dǎo)地位的同指代詞和名詞。如“我從小就喜歡音樂,不只喜歡聽音樂,我還喜歡寫音樂,更喜歡唱歌。”根據(jù)曹逢甫等學(xué)者的定義,句子中的“我”屬于同指顯性代詞,代指句子中的主語,這種顯性話題不僅可以出現(xiàn)在第一個(gè)小句中,還可以出現(xiàn)在其他小句的話題位置,因此此句可以看作為1個(gè)話題鏈;根據(jù)屈承熹等學(xué)者,他們認(rèn)為顯性的同指代名詞形式不允許在一個(gè)話題鏈中多次出現(xiàn),話題鏈中只允許出現(xiàn)一個(gè)顯性話題,按照這個(gè)觀點(diǎn),此例句包含2個(gè)話題鏈。我們主要依據(jù)曹逢甫等學(xué)者的定義檢索話題鏈。為便于計(jì)算和確保數(shù)據(jù)的有效性,我們將單句也計(jì)算為一個(gè)話題鏈。具體計(jì)算方式如下:

[9]昨天我不是很舒服。

[10]那棵樹樹干細(xì),葉子大,很不協(xié)調(diào),所以我沒買。

[11]媽媽的畫已經(jīng)畫完了,這其中包括中國(guó)古典的意象。

例[9]句為單句,將其計(jì)為一個(gè)話題鏈,例[10]為句首出現(xiàn)話題,其他小句存在隱性話題,屬于典型的話題鏈結(jié)構(gòu)構(gòu)成的一個(gè)話題鏈。例[11]句第二句中包含同指代詞“這”,因其指代句首話題“媽媽的畫”,將其與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。

對(duì)“話題鏈”因子進(jìn)行亞因子分析結(jié)果見表4?!霸掝}鏈”因子的四個(gè)亞因子的載荷值均>0.35,即說明這四種語言特征均為影響低分段作文話題鏈的有效指標(biāo)。其中“話題鏈長(zhǎng)度”和“話題鏈分句數(shù)”載荷值超過0.9,是重要影響因素。另外,零形成分?jǐn)?shù)的載荷值為0.871,代詞計(jì)數(shù)的載荷值為0.446,說明這兩個(gè)特征也是不容忽視的兩個(gè)因素。

表4 :因子二亞因子分布及測(cè)量指標(biāo)載荷及方差

2.3 詞匯多樣性因子

詞匯多樣性,指的是不同類型的詞在語篇中所占比重的多少。即在寫作中使用多種不同的詞,如同義詞、上位詞、實(shí)詞和其他相關(guān)詞,而避免重復(fù)使用某些詞來表示(Polat&Youjin 2015)。

表5 :因子三亞因子分布及測(cè)量指標(biāo)載荷及方差

由上表可知,詞匯多樣性的兩個(gè)亞因子的載荷值大于均0.35,是有效指標(biāo)。結(jié)合標(biāo)準(zhǔn)分可知,詞匯多樣性標(biāo)準(zhǔn)分為-1.021,表明詞匯多樣性較低;詞匯密度標(biāo)準(zhǔn)分為-0.092,趨近于0,對(duì)因子影響較小,表現(xiàn)為詞匯密度適中。

2.4 篇幅因子

本文使用的“篇幅”指標(biāo)引自安福勇(2015)的研究,具體指使用“字?jǐn)?shù)”“詞數(shù)”的多少來衡量文章長(zhǎng)短,包括作文中詞的數(shù)量、詞種的數(shù)量、句子的長(zhǎng)短(以字?jǐn)?shù)表示)等。

表6顯示,亞因子詞種數(shù)和T單位長(zhǎng)度的載荷值分別為0.790和0.676,大于0.35,均為有效指標(biāo)。結(jié)合標(biāo)準(zhǔn)分,詞種數(shù)標(biāo)準(zhǔn)分為正數(shù)1.117,說明詞種數(shù)較多;T單位長(zhǎng)度標(biāo)準(zhǔn)分為正數(shù)1.114,說明T單位長(zhǎng)度較長(zhǎng)。表明此階段漢語學(xué)習(xí)者輸出文本能力較強(qiáng),寫作文本詞種數(shù)較多,T單位長(zhǎng)度較長(zhǎng)。

表6 :因子四亞因子分布及測(cè)量指標(biāo)載荷及方差

3.低分段作文區(qū)別性語言特征分析

因子分析的統(tǒng)計(jì)結(jié)果顯示,詞匯準(zhǔn)確性、詞匯多樣性、話題鏈以及文章篇幅是中文學(xué)習(xí)者低分段作文中呈現(xiàn)出的值得關(guān)注的語言特征。對(duì)作文文本的分析可以發(fā)現(xiàn),中文學(xué)習(xí)者低分段作文在這四個(gè)方面存在較多不足。

語言準(zhǔn)確性方面的不足主要表現(xiàn)為語義錯(cuò)誤、詞匯偏誤以及語法錯(cuò)誤較多,影響作文內(nèi)容的表達(dá),造成閱讀困難。低分段作文顯示,學(xué)生詞匯偏誤與語法錯(cuò)誤較多,表現(xiàn)為有相同語素或同音素的詞,學(xué)生容易混淆,導(dǎo)致詞語搭配錯(cuò)誤,造成語義錯(cuò)誤率高;此外缺詞、多詞以及缺少成分、語序錯(cuò)誤、句式雜糅的現(xiàn)象十分普遍,造成詞匯偏誤率較高,無誤T單位百分比較低。例如:

[12]我當(dāng)兵以后我父親勸告(勸)我學(xué)習(xí)漢語,所以我來到中國(guó)學(xué)習(xí)漢語。一到北京學(xué)習(xí),我就遇見(遇到)了很多困苦(困難)的事情。

[13]根據(jù)聲調(diào)來(的)意思都(的)不同。每個(gè)人都有經(jīng)驗(yàn)(經(jīng)歷)過以(因)聲調(diào)(應(yīng)添加“錯(cuò)誤”)為(而)鬧出(發(fā)生)的很多難忘的事情。

[14]跟我們國(guó)家氣候不一樣,生活方式也不一樣。最苦(痛苦)的事是別人不能對(duì)表示(表達(dá))我的思考(想法)。

例[12]中出現(xiàn)較多語義錯(cuò)誤,如將“勸”錯(cuò)用為“勸告”;“困難”錯(cuò)用為“困苦”;“想法”錯(cuò)用為“思考”。而例[13]中存在較多詞匯偏誤,如“來”和“都”為詞匯錯(cuò)用,應(yīng)改為“的”;“以”和“為”應(yīng)改為“因”和“而”;“聲調(diào)”后應(yīng)添加“錯(cuò)誤”;“鬧出”與“事情”詞匯搭配有誤,應(yīng)該為“發(fā)生”,此外,還存在一例語義錯(cuò)誤,即“經(jīng)驗(yàn)”語義理解有誤,改為“經(jīng)歷”。例[14]中也有較多的語義錯(cuò)誤,如“苦”應(yīng)該為“痛苦”;“表示”應(yīng)為“表達(dá)”,而“思考”應(yīng)為“想法”。此外,例[14]劃線部分存在較多語法錯(cuò)誤現(xiàn)象,如缺乏主語和語序錯(cuò)誤,正確表述應(yīng)該為“北京的氣候跟我們國(guó)家的不一樣”以及“最痛苦的事是不能對(duì)別人表達(dá)我的想法”;這一段話中存在3個(gè)T單位,但無誤T單位僅有1個(gè),無誤T單位百分比較低。

另外,漢字正確率較低以及連詞計(jì)數(shù)較低(正確使用的連詞)。例如:

[15]所以初學(xué)漢語第一個(gè)辛苦是接屬[接觸]到中國(guó)人的困難。但可能同時(shí)是“塞翁失馬”一樣現(xiàn)像[象],因?yàn)閺絒經(jīng)]過最初兩三年學(xué)漢語的“黑葙[箱]作業(yè)”的過程后,我掌握了基本發(fā)音和詞匯[匯]的要點(diǎn)。結(jié)果到中國(guó)重新開放的時(shí)候,我已經(jīng)會(huì)說一些比效[較]流和(流行)但並[并]不標(biāo)準(zhǔn)的中國(guó)話,使我可以自由與新中國(guó)的朋友們溝通。

[16]雖然(因?yàn)椋┎煌膰?guó)家有的漢語跟我國(guó)家漢字的意思相同,所以頭一次看漢語沒有陌生。

[17]我長(zhǎng)大了,而且(但是)我的牙不太好看,我覺得我本來喜歡唐[糖],但(所以)我的牙不好,可是都是我爸造成的。

例[15]存在大量漢字錯(cuò)誤,如形近錯(cuò)別字,“徑與經(jīng)”“效與較”“像與象”“葙與箱”“並與并”,以及音近混淆詞錯(cuò)誤,如“接屬與接觸”,這兩類錯(cuò)誤在留學(xué)生低分段漢語作文中十分常見,母語者在使用這些詞語時(shí),不會(huì)出現(xiàn)此類錯(cuò)誤,但留學(xué)生,特別是母語為表音文字的學(xué)生,易出現(xiàn)此類錯(cuò)誤;例[16]與例[17]中連詞錯(cuò)誤表現(xiàn)明顯,例[16]中“雖然”使用錯(cuò)誤,應(yīng)改為“因?yàn)椤迸c后一小句的“所以”形成因果關(guān)系。例[17]中“而且”和“但”使用錯(cuò)誤,應(yīng)該改為“但是”和“所以”。低分段作文中,連詞使用的數(shù)量并不少,但連詞使用錯(cuò)誤問題較為嚴(yán)重,學(xué)生不能根據(jù)文章的意義選擇合適的連詞。

詞匯多樣性方面,主要的缺陷是作文詞匯密度適中,但詞匯多樣性較低。表現(xiàn)為學(xué)習(xí)者在表達(dá)觀點(diǎn)時(shí),會(huì)重復(fù)使用自己有把握的詞,而不會(huì)變化使用多種詞匯。例如:

[18]學(xué)習(xí)漢語的時(shí)候也有苦的地方,也有樂的地方。學(xué)習(xí)本來是不容易的。學(xué)習(xí)漢語的時(shí)候,我認(rèn)為開始學(xué)習(xí)漢語的時(shí)候呢,苦的地方是發(fā)音。我在首爾工作的時(shí)候開始學(xué)習(xí)漢語,上課的時(shí)候,老師讓我讀課本,那時(shí)候我的舌頭很硬,怎么也硬,老師和同事們總是笑。半年后我到中國(guó)來學(xué)習(xí)了。我一到中國(guó)就開始上課了,那時(shí)我聽不懂老師的講話,所以老師問問題的時(shí)候(缺少“我”)總是東問西答,現(xiàn)在呢,我說話的時(shí)候,讓中國(guó)人感覺“她看樣子大學(xué)生,但說話的時(shí)候孩子一樣”“他說話是不是開玩笑”因?yàn)槲业谋磉_(dá)能力很差,而且一個(gè)同樣的詞是有不同的意思,還有各個(gè)方面說話的方式不一樣,以上這種方面讓我感覺苦。那么樂的方面呢,我覺得樂的方面比苦的方面多。開始學(xué)習(xí)的時(shí)候跟中國(guó)人說話的機(jī)會(huì)只是買東西的時(shí)候,但也高興?,F(xiàn)在呢,(缺少“可以”)跟中國(guó)人討論,而且表達(dá)能力也提高了,有這種感覺的時(shí)候高興。但是最樂的時(shí)候呢,我的發(fā)音不準(zhǔn)所以讓中國(guó)人產(chǎn)生了笑的時(shí)候等很多?,F(xiàn)在想苦的地方也可以說樂的地方。

[19]我的父親是個(gè)技術(shù)工人。性格上說很溫柔,不知道對(duì)男的這樣的說法是不是合適,但他的卻[確]是很柔和的人。對(duì)(從)生活上來說非常老實(shí),認(rèn)真,勤勞。他的這一切都給我?guī)砹撕芎玫挠绊?。我可以這么說,上大學(xué)以后讀較多的書,我慢慢完成了人生觀、價(jià)值觀。我對(duì)世界了解得(了)不少,認(rèn)識(shí)了很多偉大的八[人]物,高尚的學(xué)者等等,我都尊敬他們??墒俏覍?duì)他們的尊敬心(尊敬)不對(duì)(如)我父親。這個(gè)世界上我最喜歡的人是父親,(詞匯贅余“向”)向?qū)W習(xí)的人(對(duì)象)也是父親,以后我的事業(yè)完成的(詞匯缺失“那”)一天替我最高興的人,我相信也是我的父親。我擔(dān)心他年齡不少(?。?,等到那時(shí)候我的父親身體好,我祝(祝愿)他的(詞匯贅余“的”)健康!

從詞匯密度角度來看,例[18]有238個(gè)詞,實(shí)詞數(shù)為139,詞匯密度為58.40%。例[19]有151個(gè)詞,實(shí)詞數(shù)為122,詞種數(shù)67個(gè),詞匯密度為80.79%,整體來看,學(xué)生作文詞匯密度均超過50%,表現(xiàn)為低分段留學(xué)生漢語寫作詞匯密度適中。從詞匯多樣性角度來看,例[18]有238個(gè)詞,詞匯多樣度為33.15%,例[19]有151個(gè)詞,詞匯多樣度為44.37%,可以看出任務(wù)時(shí)間內(nèi)有效產(chǎn)出詞匯數(shù)量較多,但用詞較為單一,學(xué)生重復(fù)使用自己有把握的詞,而不會(huì)變化使用多種詞匯,導(dǎo)致文本質(zhì)量較低。

在話題鏈以及文章篇幅方面,總體來看,低分段作文中話題鏈?zhǔn)褂梅矫娴牟蛔闶?,話題鏈長(zhǎng)度較短,存在話題鏈跳躍的問題。即,學(xué)生往往就一個(gè)話題鏈進(jìn)行簡(jiǎn)單描述后,則立即轉(zhuǎn)向?qū)α硪粋€(gè)話題鏈,文章中心內(nèi)容不固定,缺乏連貫性、整體性,使文章中心不明確。

[20]在我們世界有成千上萬的歌手。//人們都有自己所喜歡的歌手或歌曲//,其中我也喜歡流行歌曲的那一類//。每個(gè)人都喜歡不同的歌曲,有的愛聽流行歌曲,有的愛聽舊的歌曲。//我認(rèn)為歌曲對(duì)人有利的//。

[21]他對(duì)我們非常嚴(yán)格。表情、動(dòng)作都使人覺得非常害怕。//因此我們的表哥,表姐妹們從來(一直)怕他。//過年,親戚都在一起的時(shí)候小孩子們特別怕考(靠)近在(“在”多余)我父親。//

例[20]中,主題分別為“人們”“我”“每個(gè)人”“我”;例[21]中,主題分別為“他”“表哥、表姐妹們”“小孩子們”。每個(gè)句子僅僅形成“主題+評(píng)述”的形式,沒有形成“主題+評(píng)述,+評(píng)述+……”的話題鏈,使得主題描述不全面,文章割裂開來,結(jié)構(gòu)不清晰,內(nèi)容不連貫。其次就話題鏈分句數(shù)來看,例[20][21]話題鏈的分句數(shù)較少。為更加準(zhǔn)確說明這一結(jié)論,我們對(duì)120份漢語學(xué)習(xí)者作文進(jìn)行數(shù)據(jù)整理,發(fā)現(xiàn)留學(xué)生作文中話題鏈分句數(shù)均較少,平均值僅為1.7423。多數(shù)話題鏈,除首句外,僅含有一個(gè)分句,單個(gè)話題鏈的內(nèi)容并未說完,就開啟一個(gè)新的話題鏈,造成文章割裂,言未達(dá)意。由上述兩點(diǎn)可見,低分段留學(xué)生作文話題鏈?zhǔn)褂们闆r較差。結(jié)合標(biāo)準(zhǔn)分,零形成分為負(fù),代詞計(jì)數(shù)為正,其表現(xiàn)為零形成分?jǐn)?shù)較少、代詞計(jì)數(shù)較多。結(jié)合文本發(fā)現(xiàn),學(xué)生作文中應(yīng)使用零形成分的部分大多出現(xiàn)“這”“我”“她、他”等代詞,漢語學(xué)習(xí)者習(xí)慣使用名詞或代詞等形式指稱主題,而不習(xí)慣使用零形成分,這導(dǎo)致代詞數(shù)量較多,零形成分?jǐn)?shù)較少。

關(guān)于篇幅方面,需要思考的問題是,是否作文輸出的篇幅越長(zhǎng),其作文語言質(zhì)量就越好。王藝璇(2017)、吳繼峰等(2019)等曾采用詞種數(shù)作為指標(biāo),測(cè)量學(xué)生詞匯掌握程度,發(fā)現(xiàn)作文中詞種數(shù)越多,表明學(xué)生詞匯掌握程度越好,則作文的寫作質(zhì)量越高。但我們對(duì)作文文本的分析發(fā)現(xiàn)篇幅長(zhǎng)短與作文質(zhì)量并非成正比。為了進(jìn)一步說明這一問題,我們引入漢語母語者同題作文進(jìn)行比較。

[22]父母對(duì)孩子的生存有巨大的影響。/從孩子一落地,他就開始讓識(shí)[認(rèn)識(shí)]世界。/他讓識(shí)[認(rèn)識(shí)]的對(duì)一個(gè)人就是父母親。/孩子跟父母一起生活就會(huì)學(xué)到父母的行為。/小孩子第一個(gè)學(xué)習(xí)就是摩仿父母親。/從吃,喝,睡,玩,日常等等的方面都只有父母的習(xí)貫[習(xí)慣]讓孩子知道應(yīng)該怎么做。/換一句話說,父母就是孩子的第一個(gè)老師。/這樣說孩子不一定全學(xué)的都是好的,/父母的壞習(xí)貫[習(xí)慣]也都會(huì)吸收到。/這時(shí),孩子長(zhǎng)大后也會(huì)受到不斷的環(huán)竟[環(huán)境]變化,/他也會(huì)受到別人的批評(píng),/因?yàn)樗磺凶龅亩际歉改杆痰摹?假如父母教的好,/孩子自己會(huì)扮斷(判斷)什么是好的什么是壞的。/這就是做父母最難的一件事,/教出一個(gè)好孩子。/父母的心全都給了孩子。/孩子大部分都知道有了問題一定可以請(qǐng)求父母的幫助。/可是這也是要父母的陪養(yǎng)[培養(yǎng)]才能讓孩子知道有這一條路。/如果父母把孩子教對(duì)了,/孩子才不會(huì)走錯(cuò)條路。/(留學(xué)生漢語作文——《父母是孩子的第一任老師》)(詞種數(shù)115,22個(gè)T單位)

[23]父母是孩子的第一任老師,/這句話體現(xiàn)了家庭教育對(duì)個(gè)人教育的重要性。/主要表現(xiàn)在以下幾點(diǎn),/首先父母決定著孩子可以接觸什么,/為孩子創(chuàng)造最基本的生活環(huán)境。/其次,父母對(duì)孩子的教育是潛移默化、無法抵抗的,/他融入在生活之中,/在一言一行之中,/對(duì)孩子的影響是無形卻真實(shí)。/最后,父母對(duì)孩子的影響是長(zhǎng)久的,/不論是童年時(shí)期還是成年之后,/這些影響也許會(huì)伴隨孩子的一生。/(母語者輸出文本——《父母是孩子的第一任老師》)(詞種數(shù)61,11個(gè)T單位)

上述例子中一個(gè)T單位用“/”表示。例[22]是漢語學(xué)習(xí)者的作文,其中詞種數(shù)為115,存在22個(gè)T單位,T單位的平均長(zhǎng)度為16;例[23]為漢語母語者作文,詞種數(shù)為61,存在11個(gè)T單位,T單位的平均長(zhǎng)度為13.1。比較發(fā)現(xiàn),漢語學(xué)習(xí)者低分段作文篇幅較長(zhǎng),T單位長(zhǎng)度與漢語母語者作文相當(dāng),而且詞種數(shù)還高于漢語母語者作文。但從具體文本內(nèi)容質(zhì)量來看,漢語學(xué)習(xí)者作文中詞匯的難度以及內(nèi)容論證的深度要遠(yuǎn)低于漢語母語者。如漢語母語者作文中,使用了“潛移默化”“無法抵抗”“無形”“一言一行”等難度較大的詞匯;另外,漢語母語者從父母對(duì)孩子影響的內(nèi)容、方式、持久度等三個(gè)方面進(jìn)行論述,而漢語學(xué)習(xí)者僅論述了父母對(duì)孩子生活的影響,深度低于漢語母語者。還有,漢語學(xué)習(xí)者作文T單位長(zhǎng)度雖長(zhǎng),但語言不夠精煉,存在較多重復(fù)詞匯。上述兩例顯示,作文篇幅長(zhǎng)短與作文質(zhì)量并非正比。雖然語言輸出的量在一定程度上可以反應(yīng)其語言能力,但作文的質(zhì)量總體上會(huì)受準(zhǔn)確性、豐富性以及內(nèi)容連貫性等多種因素的影響。因此,單獨(dú)用篇幅長(zhǎng)短無法說明漢語學(xué)習(xí)者低分段中文寫作的總體特征。留學(xué)生低分段作文篇幅較長(zhǎng),表明此階段學(xué)生語言表達(dá)能力有所提高,學(xué)生基本能夠完成作文的字?jǐn)?shù)要求。但從具體文本內(nèi)容質(zhì)量來看,其與母語者相比,詞匯的難度以及內(nèi)容論證的深度都還有待提高。

4.結(jié)語

本文采用因子分析法對(duì)中文學(xué)習(xí)者低分段中文作文語言區(qū)別性特征進(jìn)行分析,結(jié)果顯示,除特殊句計(jì)數(shù)為無效指標(biāo)外,語義錯(cuò)誤率、詞匯偏誤率、無誤T單位百分比、漢字正確率、連詞計(jì)數(shù)、話題鏈長(zhǎng)度、零形成分?jǐn)?shù)、代詞計(jì)數(shù)、話題鏈分句數(shù)、詞匯多樣性、詞匯密度、詞種數(shù)、T單位長(zhǎng)度等均為測(cè)量低分段留學(xué)生中文寫作質(zhì)量的有效指標(biāo)。另外,因子分析將上述語言區(qū)別性特征聚合為4個(gè)固定因子,分別為“準(zhǔn)確性因子”“話題鏈因子”“詞匯多樣性因子”以及“篇幅因子”。統(tǒng)計(jì)結(jié)果表明,準(zhǔn)確性、詞匯多樣性、話題鏈以及文章篇幅是低分段作文中呈現(xiàn)出的值得關(guān)注的語言特征,具體存在的不足包括:

(1)語言準(zhǔn)確性有待提高。學(xué)習(xí)者作文中語義錯(cuò)誤較多,特別是有相同語素或相同音素的詞,留學(xué)生比較容易混淆,造成作文行文歧義點(diǎn)多;詞匯錯(cuò)用,缺詞、多詞,以及缺少成分、語序錯(cuò)誤、句式雜糅的現(xiàn)象十分普遍。(2)話題鏈的使用情況較差。話題鏈長(zhǎng)度較短和話題鏈分句數(shù)較少是中文學(xué)習(xí)者作文中話題鏈?zhǔn)褂们闆r較差的重要原因,表現(xiàn)為一篇作文多個(gè)話題,文章的主題來回跳動(dòng)的現(xiàn)象,學(xué)生往往就一個(gè)話題鏈進(jìn)行簡(jiǎn)單描述后,則立即轉(zhuǎn)向?qū)α硪粋€(gè)話題鏈的描述,文章中心內(nèi)容不固定,缺乏連貫性、整體性。(3)詞匯多樣性有待提高。留學(xué)生低分段作文詞匯密度適中,但詞匯多樣性較低。表現(xiàn)為學(xué)習(xí)者在表達(dá)觀點(diǎn)時(shí),會(huì)重復(fù)使用自己有把握的詞,而不會(huì)變化使用多種詞匯。(4)篇幅與質(zhì)量不成正比。低分段作文篇幅較長(zhǎng),表明此階段學(xué)生語言表達(dá)能力較高,但從具體文本內(nèi)容質(zhì)量來看,詞匯的難度以及內(nèi)容論證的深度都還有待提高。

以上研究結(jié)果對(duì)第二語言寫作教學(xué)有一定的啟示:第一,在寫作教學(xué)中,要特別注意學(xué)習(xí)者的語言錯(cuò)誤,采取各種有效的方法加以糾正,以提高學(xué)生的語言正確性。近年來,關(guān)于“二語寫作教學(xué)中的書面糾錯(cuò)反饋的有效性”存在爭(zhēng)議,主要有以下兩點(diǎn):第一,糾錯(cuò)是否有效?第二,如果是,哪種糾錯(cuò)方法最有效?本文認(rèn)為,無論糾錯(cuò)效果如何,語言的正確性都是影響作文評(píng)分的最重要因素。強(qiáng)調(diào)語言的正確性,加強(qiáng)對(duì)學(xué)習(xí)者基本語言技能的訓(xùn)練是提高學(xué)生語言水平的基礎(chǔ),是一切能力發(fā)展的基石,因此在對(duì)外漢語教學(xué)中,特別是針對(duì)高水平學(xué)習(xí)者,準(zhǔn)確性不容忽略。第二,注重培養(yǎng)中文學(xué)習(xí)者漢語話題鏈意識(shí)。中文篇章有其獨(dú)特的特點(diǎn),并非“主語-謂語”形式,而是由“主題-說明”組成。教師應(yīng)注重培養(yǎng)學(xué)生的話題意識(shí),尤其是寫作時(shí)話題鏈的建構(gòu),雖然這對(duì)學(xué)生來說可能較為困難。正如周強(qiáng)和周驍聰(2014)所指出的,“漢語這種簡(jiǎn)單而靈活的意合型篇章組合結(jié)構(gòu)在人們的日常理解和交流中沒有困難,但它對(duì)漢語寫作的連貫性提出了巨大挑戰(zhàn)。”因此,理解漢語篇章構(gòu)成,注重漢語寫作話題鏈的使用以及語言篇章的連貫性,是寫作教學(xué)中教師與學(xué)生需要關(guān)注的重點(diǎn)。

猜你喜歡
低分因子學(xué)習(xí)者
在線學(xué)習(xí)環(huán)境下學(xué)習(xí)者畫像構(gòu)建研究
低分劇成了大眾的“情緒容器”
十二星座是什么類型的學(xué)習(xí)者
情感過濾假說在對(duì)外漢語教學(xué)中的應(yīng)用
非正式學(xué)習(xí)環(huán)境下基于移動(dòng)終端的學(xué)習(xí)者模型研究
一類常微分方程的解法研究
《老人與?!分械膫惱碓轿慌c斯芬克斯因子再思考
直徑不超過2的無爪圖的2—因子
巧解難題二則
讓“低分”學(xué)生道歉不是挫折教育
杭锦后旗| 镇雄县| 娄烦县| 慈利县| 建昌县| 滦南县| 那坡县| 呼玛县| 丰县| 洪洞县| 安阳市| 牙克石市| 万盛区| 尼木县| 新乐市| 东至县| 神农架林区| 共和县| 苏州市| 确山县| 卢氏县| 扬州市| 高雄市| 开远市| 攀枝花市| 洛南县| 荆门市| 曲阳县| 金川县| 梨树县| 浠水县| 哈密市| 增城市| 武威市| 资源县| 上虞市| 博罗县| 汶川县| 蒙山县| 泰安市| 汉沽区|