基于因子分析的中文學(xué)習(xí)者低分段作文語言特征研究*

2022-03-14 10:16玲孫金華

外語研究 2022年1期

王玲孫金華

（1.南京大學(xué)文學(xué)院，江蘇南京 210023；2.國(guó)防科技大學(xué)國(guó)際關(guān)系學(xué)院，江蘇南京 210023）

0.引言

寫作一直是第二語言習(xí)得領(lǐng)域研究(包括對(duì)外漢語教學(xué))中反映學(xué)生綜合語言能力的重要組成方面。如何有效解決高水平學(xué)習(xí)者口語能力與書面寫作能力不平衡的問題，日益引起關(guān)注。近年來，一些學(xué)者開始嘗試從語言區(qū)別性特征來討論第二語言或外語寫作問題(Ortega 2003;Lu 2011;Verspoor et al.2012)?！罢Z言區(qū)別性特征”(亦簡(jiǎn)稱為“語言特征”，下文統(tǒng)一稱為“語言特征”)指的是對(duì)某一語言文本的語言要素(比如詞匯、句子結(jié)構(gòu)等)進(jìn)行描寫所概括出的客觀性成分及特征(Jiang 2013;Jin&Barley 2013)。不少學(xué)者研究發(fā)現(xiàn)，語言特征是影響二語學(xué)習(xí)者作文質(zhì)量的重要因素(Humphry et al.2014;Banerjee et al.2015；吳繼峰2018)，也是有效體現(xiàn)二語學(xué)習(xí)者書面語水平的重要特征(Malvern&Brian 2002)。不過，有較多研究關(guān)注的是某個(gè)或某幾個(gè)語言特征對(duì)寫作的影響(Laufer&Paul 1999;Housen&Folkert 2009)。作文是一個(gè)有機(jī)整體，某個(gè)維度(比如詞匯)語言特征的指標(biāo)表現(xiàn)較好，不意味著作文質(zhì)量就高(Ortega 2003)。基于上述背景，本研究選取了不同維度的指標(biāo)來分析語言特征與作文質(zhì)量的關(guān)系。

1.研究設(shè)計(jì)

1.1 研究對(duì)象和確定的語言特征

本研究以中文學(xué)習(xí)者低分段作文為研究對(duì)象。作文樣本來自北京語言大學(xué)HSK動(dòng)態(tài)作文語料(http://yuyanziyuan.blcu.edu.cn/info/1043/1501.htm)。選取的低分段作文(無等級(jí)證書以及6-8級(jí)證書)，成績(jī)?cè)?0～60分之間。由于一些研究表明體裁、話題等會(huì)影響二語寫作的質(zhì)量(Kormos 2011；劉瑜2017)，因此，為排除不同體裁和話題的干擾，選取的120份作文均為議論文，且限制在3個(gè)話題:“我看流行歌曲”“父母是孩子的第一任老師”和“學(xué)習(xí)漢語的苦與樂”?？疾斓恼Z言特征涉及詞匯、句法、語篇、漢字這4個(gè)維度。

1.1.1 詞匯維度

已有學(xué)者用“詞匯豐富性”(lexical richness)作為探究詞匯與寫作質(zhì)量使用關(guān)系的測(cè)量指標(biāo)。Read(2000)將“詞匯豐富性”的指標(biāo)分類為詞匯密度、詞匯復(fù)雜性、詞匯變異性、詞頻分布和詞語錯(cuò)誤(Lexical errors)。王藝璇(2017)在此基礎(chǔ)上將“詞匯豐富性”的內(nèi)涵擴(kuò)展為詞種數(shù)(Type)、詞匯多樣性、詞匯復(fù)雜性、詞匯密度、詞匯準(zhǔn)確性等。本文借鑒王藝璇(同上)提出的詞匯測(cè)量的總括性指標(biāo)，但又剔除掉“詞匯復(fù)雜性”這一指標(biāo)。因?yàn)椤霸~匯復(fù)雜性”指罕見詞語(Lexical rareness)在文本中出現(xiàn)的比重(Read 2000),Yuan&Ellis(2002)、鮑貴(2008)等學(xué)者發(fā)現(xiàn)詞匯復(fù)雜性是區(qū)分不同水平學(xué)習(xí)者的最佳指標(biāo)和依據(jù)。而本文是針對(duì)同一水平即高水平留學(xué)生展開的，因此最終確定詞匯方面的測(cè)量指標(biāo)包括:詞種數(shù)、詞匯多樣性、詞匯密度、詞匯準(zhǔn)確性。具體統(tǒng)計(jì)方法如下:

(1)詞種數(shù):指的是作文中詞匯類符數(shù)量，如“我認(rèn)為流行歌曲使人們感到很舒服，因此我喜歡流行歌曲。”詞種數(shù)為11，包括“我、感到、很、人們、認(rèn)為、使、舒服、喜歡、因此、流行、歌曲”這11個(gè)詞，其中“歌曲”和“流行”雖出現(xiàn)兩次，詞種數(shù)僅計(jì)算一次。

(2)詞匯多樣性:是指學(xué)習(xí)者在語言使用中所展現(xiàn)出的詞匯變化程度(Malvern&Brian 2002)。詞種數(shù)和總詞數(shù)的比(Type-token ratio，TTR)是使用最廣泛的計(jì)算公式，但一些學(xué)者研究發(fā)現(xiàn)TTR的信度受到文本長(zhǎng)度的影響。本文由于所用語料庫(kù)容量相近，且所選取的二語寫作文本均為限制字?jǐn)?shù)條件下的寫作任務(wù)，文本字?jǐn)?shù)受到控制，故使用計(jì)算較簡(jiǎn)便的詞種數(shù)與總詞數(shù)的比。具體計(jì)算公式為:詞匯多樣度=(詞種數(shù)/總詞數(shù))×100%。

如“父親是我最尊敬的人，也是我的朋友，我愛我的父親?！痹~種數(shù)為10，包括“我、的、父親、愛、朋友、人、是、也、最、尊敬”這10個(gè)詞，其中“我”出現(xiàn)4次；“的”出現(xiàn)3次；“父親”和“是”出現(xiàn)2次，總詞數(shù)是17，則詞匯多樣度為(詞種數(shù)/總詞數(shù))×100%=58.82%。

(3)詞匯密度:指的是某一文本中實(shí)詞(Lexical word)在總詞數(shù)中的比重。本文采用Laufer&Paul(1999)提出的詞匯密度計(jì)算公式:詞匯密度=(實(shí)詞種數(shù)／總詞種數(shù))×100%。例如:“父親是我最尊敬的人，也是我的朋友，我愛我的父親?！边@一句中，總詞數(shù)是17；實(shí)詞種數(shù)8包括“我、父親、愛、朋友、最、是、人、尊敬”這8個(gè)詞，故詞匯密度為(實(shí)詞種數(shù)/總詞種數(shù))×100%=80%。

(4)詞匯準(zhǔn)確性:指的是某一文本中使用正確的詞語在總詞數(shù)中的比重即為詞匯正確率(Read 2000:131)。由于本文考察對(duì)象為參加高等漢語水平考試(HSK高等)總分在280分-500分之間的學(xué)生，其語言水平較高，計(jì)算正確詞匯數(shù)量操作難度較大，本文借鑒吳繼峰(2018)使用的采取通過計(jì)算錯(cuò)誤率的方式進(jìn)行統(tǒng)計(jì)計(jì)算的方法，即用每篇作文的錯(cuò)詞數(shù)除以每篇作文的總詞數(shù)，最后，從1中減去錯(cuò)誤率得到正確率。

本文在分析學(xué)生作文詞匯錯(cuò)誤時(shí)發(fā)現(xiàn)，此階段學(xué)生詞匯錯(cuò)誤可以劃分為語義錯(cuò)誤與詞匯偏誤兩類。其中，語義錯(cuò)誤包括理性意義基本相同的詞、語素相同的詞、母語多義對(duì)應(yīng)的漢語詞、單音節(jié)和雙音節(jié)同義詞等使用錯(cuò)誤(同上)。本文使用“語義錯(cuò)誤率”統(tǒng)計(jì)每篇作文中語義錯(cuò)誤的分布情況，具體計(jì)算公式是:語義錯(cuò)誤率=(語義錯(cuò)誤數(shù)量/文章總詞數(shù))×100%；如“最苦(痛苦)的事是對(duì)別人不能表示(表達(dá))我的思考(想法)。”總詞數(shù)是13；語義錯(cuò)誤數(shù)為3，語義錯(cuò)誤率為(語義錯(cuò)誤數(shù)量/文章總詞數(shù))=23.08%。

詞匯偏誤包括外來詞、誤用詞、多余詞、混合詞和缺詞等。本文使用“詞匯偏誤率”統(tǒng)計(jì)每篇作文詞匯偏誤的分布情況，具體計(jì)算公式是:詞匯偏誤率=(詞匯偏誤數(shù)量/文章總詞數(shù))×100%。如“根(根據(jù))聲調(diào)來(的)意思都(的)不同。每個(gè)人都有經(jīng)驗(yàn)(經(jīng)歷)過以(因?yàn)?聲調(diào)為出(鬧出)了(的)很多難忘的事情?！笨傇~數(shù)是22；詞匯偏誤數(shù)為6，詞匯偏誤率為(詞匯偏誤數(shù)量/文章總詞數(shù))=27.27%。另外，詞形錯(cuò)誤我們放在漢字層面進(jìn)行統(tǒng)計(jì)(具體見后文)。

1.1.2 句法維度

句法維度，指的是學(xué)界普遍采用“句法復(fù)雜性”這一標(biāo)準(zhǔn)?！熬浞◤?fù)雜性”(syntactical complexity)，也被稱為“語法復(fù)雜性”(grammatical complexity)，或者“句法成熟度”(syntactic maturity)(Ortega 2003)。本研究的“句法復(fù)雜性”利用T單位長(zhǎng)度、無誤T單位百分比、話題鏈長(zhǎng)度、話題鏈分句數(shù)、零形成分?jǐn)?shù)和特殊句計(jì)數(shù)等幾個(gè)指標(biāo)進(jìn)行考察。具體統(tǒng)計(jì)方法如下:

(1)T單位長(zhǎng)度。指的是一個(gè)T單位中所包含的字?jǐn)?shù)(Jiang 2013)。那么何為“T單位”?本文借鑒安福勇(2015)和吳繼峰(2018)的研究，將T單位定義為:包含一個(gè)獨(dú)立謂語和其他附屬小句或嵌入小句的獨(dú)立主句。具體來說，可包括以下幾條標(biāo)準(zhǔn):簡(jiǎn)單句作為一個(gè)T單位；一個(gè)由兩個(gè)或兩個(gè)以上分句組成的復(fù)句，根據(jù)每個(gè)分句中是否有謂語被劃分為不同的T單位。只有當(dāng)分句中有謂詞時(shí)，它才能被視為T單位；復(fù)雜句中的嵌入分句不作為獨(dú)立的T單位；分句中均含有謂語的情況下，漢語偏正復(fù)句，由一個(gè)分句承載主要信息，從句依附于主句，所以算作一個(gè)T單位；漢語聯(lián)合復(fù)句，每一個(gè)并列的分句都算作兩個(gè)T單位。(其中偏正復(fù)句與聯(lián)合復(fù)句的分類標(biāo)準(zhǔn)參照黃伯榮和廖序東(2017:134)。例如:

[1]我的父親是一名辦事員。（一個(gè)T單位）

[2]對(duì)我來說，父親是對(duì)我影響最大的人。（一個(gè)T單位）

[3]父親叫我去他的單位工作。（一個(gè)T單位）

[4]只要聽到母親的歌聲，那聲音的影片便會(huì)放映出來。（一個(gè)T單位）

[5]他一邊收拾行李，一邊認(rèn)真思考父親的話。（兩個(gè)T單位）

其中例[1]是一個(gè)簡(jiǎn)單句，可以看出一個(gè)T單位；例[2]含有兩個(gè)分句，雖然表示某種復(fù)句結(jié)構(gòu)，但第1個(gè)分句“對(duì)我來說”是一個(gè)插入語，沒有謂語，可以看作一個(gè)T單位；例[3]是一個(gè)復(fù)雜句，可以看作一個(gè)T單位；例[4]是一個(gè)偏正結(jié)構(gòu)的復(fù)句，因此算作一個(gè)T單位；例[5]是聯(lián)合復(fù)句，每一個(gè)并列的分句都算作一個(gè)T單位，整個(gè)句子為兩個(gè)T單位。

統(tǒng)計(jì)方法為:統(tǒng)計(jì)每篇作文中T單位所包含的平均字?jǐn)?shù)。如:“雖然城市的生活有些繁忙，但我總覺得自己是適合這種生活方式的。”此句為偏正復(fù)句，包括2個(gè)T單位，平均T單位長(zhǎng)度為14(所包含的平均字符數(shù))。

(2)無誤T單位百分比。指的是沒有語言錯(cuò)誤的T單位占T單位總數(shù)中的比例(Jiang 2013)。其中對(duì)語言錯(cuò)誤的認(rèn)定，本文基本采用HSK動(dòng)態(tài)語料庫(kù)的偏誤標(biāo)記，但在本研究中不計(jì)繁體字和標(biāo)點(diǎn)錯(cuò)誤、字層面的偏誤、詞層面的偏誤。只記錄句子層面的偏誤，如:缺少句子成分、存在多余句子成分、特殊句式錯(cuò)誤(如“把”字句錯(cuò)誤、“被”字句錯(cuò)誤等)、重疊錯(cuò)誤、語序錯(cuò)誤、固定格式錯(cuò)誤、不完整句等。

具體計(jì)算公式是:(無誤T單位數(shù)量／T單位總數(shù))×100%。如:“這句話對(duì)每個(gè)孩子應(yīng)是很感動(dòng)?！贝司溆姓Z法錯(cuò)誤，應(yīng)改為“這句話對(duì)每個(gè)孩子來說都很感動(dòng)”，此為有誤T單位，不計(jì)入計(jì)算。

(3)話題鏈長(zhǎng)度。指的是每篇作文中話題鏈所含的平均字?jǐn)?shù)(ibid.)，其中話題鏈?zhǔn)菨h語的一種語篇單位。曹逢甫(1995:105)為了解決漢語句子界限模糊的問題，最早在漢語中引入了話題鏈的概念，他指出話題鏈?zhǔn)怯梢粋€(gè)或數(shù)個(gè)小句所組成且以一個(gè)出現(xiàn)在句首的共同話題貫穿其間的一段話。關(guān)于話題鏈的具體劃分，有幾個(gè)問題需要做簡(jiǎn)要說明。首先，單句后不存在具有相同話題的分句，此單句是否可以計(jì)算成為一個(gè)話題鏈?如“昨天我已經(jīng)去過了”此句后再無其他成分。其次，話題鏈鏈?zhǔn)仔【涞奈恢贸霈F(xiàn)顯性話題，其他小句位置是否可以出現(xiàn)顯性的同指代詞以及名詞?如“媽媽的畫已經(jīng)畫完了，這其中包括中國(guó)古典的意象?！逼渲械诙渲邪复~“這”，是否可以與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。本文的話題鏈劃分方法，將通過舉例說明。

[6]昨天我不是很舒服。

[7]那棵樹樹干細(xì)，葉子大，很不協(xié)調(diào)，所以我沒買。

[8]媽媽的畫已經(jīng)畫完了，這其中包括中國(guó)古典的意象。

例[6]句以“我”為單個(gè)小句，單句后不存在具有相同話題的分句，但本文也將其計(jì)算成為一個(gè)話題鏈；例[7]以“那棵樹”為主題，其后分句均以“那棵樹”為話題，為多個(gè)小句構(gòu)成的話題鏈，這是典型的話題鏈的形式，計(jì)算成為一個(gè)話題鏈；例[8]句中話題鏈，鏈?zhǔn)仔【涞奈恢贸霈F(xiàn)顯性話題，其他小句的話題位置以“同指代詞”或“名詞”代替，如第二句中包含同指代詞“這”，本文將其與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。之所以這樣劃分，是考慮到本文的研究語料不是漢語母語者的作文，而是以漢語為第二語言的留學(xué)生中文作文，這一劃分標(biāo)準(zhǔn)放寬了話題鏈的定義范圍，便于計(jì)算和確保數(shù)據(jù)的有效性，也為后期計(jì)算話題鏈與作文質(zhì)量的關(guān)系提供條件。

具體的統(tǒng)計(jì)方法為:計(jì)算每篇作文中話題鏈所含的平均字?jǐn)?shù)(吳繼峰2016:28)。如“祥子知道自己混到那么干凈利落已經(jīng)是怎樣的不容易，聞著現(xiàn)在身上的臭汗味，他把以前的掙扎與成功看得分外光榮，比原來的光榮放大了十倍?！?老舍《駱駝祥子》)按照話題鏈的定義，此選段為一個(gè)話題鏈，話題鏈長(zhǎng)度為60。

(4)話題鏈的分句數(shù)。指的是指每一個(gè)話題所包含的分句數(shù)量(Jin&Barley 2013)。具體計(jì)算方法:統(tǒng)計(jì)每篇作文中話題鏈所含的分句平均數(shù)(包括含有主題的首句)(吳繼峰2016:29)。又如這句“祥子知道自己混到那么干凈利落已經(jīng)是怎樣的不容易，聞著現(xiàn)在身上的臭汗味，他把以前的掙扎與成功看得分外光榮，比原來的光榮放大了十倍?！?老舍《駱駝祥子》)，此選段為一個(gè)話題鏈，分句數(shù)為4。

(5)零形成分?jǐn)?shù)。關(guān)于零形成分的定義，本文借鑒Jin&Barley(2013)的主張，認(rèn)為零形成分為一種由兩個(gè)或兩個(gè)以上分句組成的序列，其特征是幾個(gè)分句共有一個(gè)主題，其主題只出現(xiàn)在第一個(gè)分句中，其余均以“無詞匯”形式出現(xiàn)，這種空白的形式，即為零形成分。零形成分?jǐn)?shù)主要指零形主題或主語的數(shù)量。具體計(jì)算方法為:統(tǒng)計(jì)每篇作文話題鏈中零形成分總數(shù)。如:“我認(rèn)識(shí)她，?長(zhǎng)得又高又瘦，?整天在看書”，其中“?”為零形成分，此句零形成分?jǐn)?shù)為2。

(6)特殊句計(jì)數(shù)。主要是指具有漢語特點(diǎn)且留學(xué)生易出現(xiàn)偏誤的句子(韓笑，馮麗萍2017)。選取標(biāo)準(zhǔn)主要借鑒《漢語水平等級(jí)標(biāo)準(zhǔn)與語法等級(jí)大綱》(1996)以及《國(guó)際漢語教學(xué)通用課程大綱》(2014修訂版)所規(guī)定的符合漢語書面語教學(xué)要求且中文學(xué)習(xí)者易出現(xiàn)偏誤的句式。具體計(jì)算方法為統(tǒng)計(jì)特殊句的數(shù)量，其中只計(jì)算正確的特殊句型句。

表1 ：特使句型例表

1.1.3漢字和篇章維度

關(guān)于漢字維度測(cè)量標(biāo)準(zhǔn)，本文采用學(xué)界普遍使用的漢字正確率進(jìn)行研究(王藝璇2017；吳繼峰2018)。其中漢字錯(cuò)誤的界定，借鑒吳繼峰(2018)的研究方法，將漢字錯(cuò)誤分成兩類:一類是字形錯(cuò)誤，即錯(cuò)別字，包括錯(cuò)字、別字、漏字、多字；第二類是用拼音代替漢字，包括拼音字、無法識(shí)別字。

具體計(jì)算方法如下:首先利用國(guó)家語委的字詞統(tǒng)計(jì)軟件計(jì)算每篇作文的總字?jǐn)?shù)(不包含標(biāo)點(diǎn)在內(nèi))，再根據(jù)HSK動(dòng)態(tài)作為語料庫(kù)中的錯(cuò)字標(biāo)注計(jì)算每篇作文中的錯(cuò)字字?jǐn)?shù)，然后計(jì)算每篇作文中漢字錯(cuò)誤率，最后用1減去錯(cuò)誤率即為漢字正確率。具體計(jì)算公式是:1-(兩類漢字錯(cuò)誤的總個(gè)數(shù)／總字?jǐn)?shù))×100%。如“他跟他的朋友說了一兩邊，說他再做一年就不做了?！边@句中“邊”為錯(cuò)別字，應(yīng)該改為“遍”，則此句漢字正確率為95%。

在語篇方面，本文借鑒呂文華(2014)的觀點(diǎn)，從語法手段、詞匯手段和連接成分中選取篇章維度測(cè)量標(biāo)準(zhǔn)。由于本文句法維度的測(cè)量包含特殊句、話題句等測(cè)量指標(biāo)，因此不單獨(dú)對(duì)語法手段進(jìn)行測(cè)量，且由于本文的測(cè)量對(duì)象為以漢語為第二語言的留學(xué)生，其漢語作文中介詞與助詞的使用頻率較低，不易得到有效數(shù)據(jù)。綜合上述兩點(diǎn)，本文選取連接成分中的“連詞”以及詞匯手段中的“代詞”作為篇章維度測(cè)量標(biāo)準(zhǔn)，探尋“代詞計(jì)數(shù)”“連詞計(jì)數(shù)”與作文質(zhì)量的關(guān)系。具體統(tǒng)計(jì)方法如下:

(1)代詞計(jì)數(shù):即每篇中正確使用的代詞數(shù)量，本文參照黃伯榮和廖序東(2017:183)對(duì)于代詞的定義標(biāo)準(zhǔn)，即代詞指能夠起替代和指示作用的詞，它大致相當(dāng)于所取代和表示的語言單位的語法功能。按照句法功能劃分“代詞”包括代名詞、代謂詞、代數(shù)詞、代副詞，其中代名詞的代詞包括“人稱代詞”“疑問代詞”和“指示代詞”?！按~計(jì)數(shù)”的具體計(jì)算方法為統(tǒng)計(jì)平均每100詞中正確使用的代詞數(shù)量。如“告訴我他是誰?！边@一句中“我”和“他”均為人稱代詞，代詞計(jì)數(shù)為2。

(2)連詞計(jì)數(shù):即每篇中正確使用的連詞數(shù)量，本文參照黃伯榮和廖序東(同上:185)對(duì)于連詞的定義標(biāo)準(zhǔn)，即連詞是指起連接作用，連接詞、短語、分句和句子等，表示并列、選擇、遞進(jìn)、轉(zhuǎn)折、條件、因果等關(guān)系的詞。“連詞計(jì)數(shù)”的具體計(jì)算方法為，統(tǒng)計(jì)平均每100詞中正確使用的連詞數(shù)量。如“既能實(shí)現(xiàn)交流，又能被廣為接受的手段就是社會(huì)革命。”其中“既……又”即為連詞，連詞計(jì)數(shù)為2。

1.2 研究問題和研究方法

主要研究問題是漢語學(xué)習(xí)者低分段作文在語言特征方面表現(xiàn)出哪些特征以及反映出的作文的問題與不足。為了解決上述問題，本研究采用因子分析法對(duì)上述14個(gè)測(cè)量指標(biāo)進(jìn)行分析。因子分析法是研究如何保證信息最少丟失的情況下，使因子變量具有較強(qiáng)解釋性的一種多元統(tǒng)計(jì)分析方法(Gusti 1993)。較之于線性回歸分析法，因子分析法的優(yōu)勢(shì)是可以從眾多變量中歸納、篩選出最有影響的變量，然后用這些最有影響的變量來解釋最大量的觀測(cè)事實(shí)，從而得以揭示出事物之間最本質(zhì)的聯(lián)系(Tweedie&Baayen 1998)。

首先，用SPSS(24.0)因子分析統(tǒng)計(jì)軟件中的KMO和Bartlett球形檢驗(yàn)對(duì)14個(gè)測(cè)量指標(biāo)數(shù)據(jù)進(jìn)行分析。結(jié)果表明:卡方=327.789.P=.000，而且，KMO值為0.821。其中p=.000＜0.001說明數(shù)據(jù)做因子分析具有有效性，可以通過因子分析方法展開研究。其次，確定有統(tǒng)計(jì)意義的測(cè)量指標(biāo)。載荷值為0.35或更大被認(rèn)為有統(tǒng)計(jì)意義，結(jié)果顯示，除“特殊句計(jì)數(shù)”外，其他13項(xiàng)的載荷值大于0.35，為有效指標(biāo)。第三步，確定因子個(gè)數(shù)。利用主成分分析法和極大似然法正交旋轉(zhuǎn)，從13種語言區(qū)別性特征的數(shù)據(jù)中心提取主成分，確定因子個(gè)數(shù)。13個(gè)語言特征最終綜合成為4個(gè)因子(因子1-因子4)。這4個(gè)因子代表了低分段留學(xué)生中文作文的主要語言特征，也是影響低分段留學(xué)生作文質(zhì)量的重要因素。第四步，提取亞因子，給因子命名。為確定4個(gè)因子所包含的語言特征，分析低分段留學(xué)生漢語作文特點(diǎn)，我們利用極大似然法，在主成分分析的基礎(chǔ)上進(jìn)行空間旋轉(zhuǎn)，用以確定上述4個(gè)因子的亞因子。亞因子檢驗(yàn)結(jié)果見下表。

表2 ：低分段作文語言區(qū)別性特征亞因子分布及測(cè)量指標(biāo)載荷情況

上表顯示，因子一包括5個(gè)亞因子(語義錯(cuò)誤率、詞匯偏誤率、無誤T單位百分比、漢字正確率以及連詞計(jì)數(shù))；因子二包括4個(gè)亞因子(話題鏈長(zhǎng)度、零形成分?jǐn)?shù)、代詞計(jì)數(shù)、話題鏈分句數(shù))；因子三包括詞匯多樣性、詞匯密度2個(gè)亞因子；因子四包括詞種數(shù)、T單位長(zhǎng)度2個(gè)亞因子。

根據(jù)同一因子的亞因子之間存在較高的共性，可以確定因子的性質(zhì)，進(jìn)而為因子命名(吳紅云劉潤(rùn)清2004)。根據(jù)這一特點(diǎn)，對(duì)因子一-四的命名情況為:因子一命名為“準(zhǔn)確性”因子。因子一包含的5個(gè)亞因子均與語言使用準(zhǔn)確性相關(guān)。吳繼峰(2016)、李春琳(2017)等學(xué)者均使用上述指標(biāo)測(cè)量過漢語學(xué)習(xí)者語言的準(zhǔn)確性，故命名為“準(zhǔn)確性”因子。因子二包含的4個(gè)亞因子均為Jin&Barley(2013)提出的可以有效考察漢語話題鏈的測(cè)量指標(biāo)，故命名為“話題鏈”因子。因子三包含的2個(gè)亞因子主要用來探究不同類型的詞語在語篇中所占比重的多少，測(cè)量學(xué)習(xí)者使用詞匯的范圍(Scott&Michael 2013)，詞匯使用范圍越廣，語言多樣性越高(秦曉晴2009)，故命名為“詞匯多樣性”因子。因子四包含的兩個(gè)亞因子均用來觀察漢語學(xué)習(xí)者輸出詞匯和句法的“量”的指標(biāo)，與作文篇幅長(zhǎng)短相關(guān)。曹賢文、鄧素娟(2012)和安福勇(2015)等曾使用以上兩種指標(biāo)測(cè)量學(xué)生輸出詞匯的多少與句子的長(zhǎng)短，故將因子四命名為“篇幅”因子。

2.低分段作文四因子的統(tǒng)計(jì)結(jié)果

2.1 準(zhǔn)確性因子

關(guān)于“準(zhǔn)確性”的定義，學(xué)者們的看法比較一致，指的是沒有錯(cuò)誤，表意清楚明白，確切無誤，不產(chǎn)生歧義(李旭奎等2017；張恒超2018)。但研究者在測(cè)量“準(zhǔn)確性”時(shí)，存在分歧較大。比如，選詞錯(cuò)誤、拼寫錯(cuò)誤、斷句錯(cuò)誤等，都在一定程度上反映寫作的準(zhǔn)確性問題，但不同的學(xué)者對(duì)待他們的態(tài)度存在差異，有些忽略不計(jì)，有些加以統(tǒng)計(jì)。這些都涉及到如何對(duì)待和選取錯(cuò)誤以及如何確定語言準(zhǔn)確性標(biāo)準(zhǔn)的問題。

如何確定語言準(zhǔn)確性的標(biāo)準(zhǔn)，學(xué)界還沒有統(tǒng)一的結(jié)論。本研究較認(rèn)同郝全梅(2008)的說法，她認(rèn)為“二語學(xué)習(xí)者”與“母語者”不同，其目的語并不一定要做到確切無誤，讀者讀其語言，能夠準(zhǔn)確完整地理解他們的意圖即可。因此在檢索時(shí)，將“不造成歧義”作為判斷“語言準(zhǔn)確性”的輔助標(biāo)準(zhǔn)。雖然HSK語料庫(kù)已經(jīng)完成了語言錯(cuò)誤的標(biāo)注，但我們不盲目將語料庫(kù)標(biāo)注的語言錯(cuò)誤計(jì)算在內(nèi)，而是在理解性的基礎(chǔ)上從整篇文章不同緯度綜合的角度出發(fā)判斷語言錯(cuò)誤。如語料庫(kù)中將繁體字計(jì)為錯(cuò)別字，本著“不造成歧義”即可的原則，本研究不探究繁體字與簡(jiǎn)化字的差異，在計(jì)算漢字正確率時(shí)不將繁體字計(jì)為錯(cuò)別字。

為了更好地描述準(zhǔn)確性語言特征在漢語學(xué)習(xí)者作文中的表現(xiàn)，我們通過計(jì)算各個(gè)語言特征的“標(biāo)準(zhǔn)分”來加以檢驗(yàn)，通過“標(biāo)準(zhǔn)分”判斷測(cè)量指標(biāo)對(duì)因子的作用(公式如下)(劉照德等2019)。其中“標(biāo)準(zhǔn)分”分布類似于坐標(biāo)軸，正數(shù)代表存在或數(shù)量多，負(fù)數(shù)代表缺失或數(shù)量少。而數(shù)字越大，其作用越明顯；越趨近于0，作用越小。例如，假設(shè)語義錯(cuò)誤率以及詞匯偏誤率的標(biāo)準(zhǔn)分為正，既表現(xiàn)為語義錯(cuò)誤以及詞匯偏誤較多，而無誤T單位百分比為負(fù)，則表示為無誤T單位百分比較低，無誤T單位較少，其他亞因子分析原則以此類推。(z為標(biāo)準(zhǔn)分，x為原始載荷，xˉ為平均值，s為標(biāo)準(zhǔn)差)“準(zhǔn)確性”因子的統(tǒng)計(jì)結(jié)果見表3?！皽?zhǔn)確性”因子包含的5個(gè)亞因子，其載荷值均＞0.35，有統(tǒng)計(jì)意義，均為有效指標(biāo)。

表3 ：因子—亞因子分布及測(cè)量指標(biāo)載荷及方差

其中“語義錯(cuò)誤率”“詞匯偏誤率”“無誤T單位百分比”，3個(gè)測(cè)量指標(biāo)的載荷值依次超過了0.8＞0.35(載荷值為0.35或更大的被認(rèn)為有統(tǒng)計(jì)意義)，說明語義錯(cuò)誤、詞匯偏誤以及T單位錯(cuò)誤是影響低分段作文準(zhǔn)確性的主要因素。此外，“漢字正確率”以及“連詞計(jì)數(shù)”這兩個(gè)區(qū)別性特征載荷值也大于0.6，說明它們也是影響低分段作文準(zhǔn)確性的重要因素。

2.2 話題鏈因子

學(xué)界關(guān)于話題鏈的定義大體可分為兩類。一類以屈承熹(1998)等學(xué)者為代表。他們認(rèn)為，話題鏈?zhǔn)且粋€(gè)由多個(gè)小句組成的段落，共享一個(gè)主話題。主題顯性出現(xiàn)在一個(gè)子句中，隱性出現(xiàn)在其他子句中。如“那棵樹樹干細(xì)，葉子大，很不協(xié)調(diào)，所以我沒買，”該句話題“那棵樹”為主題，在句首小句中顯性出現(xiàn)，其他小句中未出現(xiàn)。另一類以曹逢甫(1995)、方梅(2008)等學(xué)者為代表。他們認(rèn)為，話題鏈?zhǔn)怯梢粋€(gè)或數(shù)個(gè)小句組成，具有共同話題，且話題貫穿其間的一段話。這一定義與第一類定義最大的區(qū)別在于，不僅第一個(gè)小句的話題位置可以出現(xiàn)話題，其他分句也可以出現(xiàn)，占主導(dǎo)地位的同指代詞和名詞。如“我從小就喜歡音樂，不只喜歡聽音樂，我還喜歡寫音樂，更喜歡唱歌。”根據(jù)曹逢甫等學(xué)者的定義，句子中的“我”屬于同指顯性代詞，代指句子中的主語，這種顯性話題不僅可以出現(xiàn)在第一個(gè)小句中，還可以出現(xiàn)在其他小句的話題位置，因此此句可以看作為1個(gè)話題鏈；根據(jù)屈承熹等學(xué)者，他們認(rèn)為顯性的同指代名詞形式不允許在一個(gè)話題鏈中多次出現(xiàn)，話題鏈中只允許出現(xiàn)一個(gè)顯性話題，按照這個(gè)觀點(diǎn)，此例句包含2個(gè)話題鏈。我們主要依據(jù)曹逢甫等學(xué)者的定義檢索話題鏈。為便于計(jì)算和確保數(shù)據(jù)的有效性，我們將單句也計(jì)算為一個(gè)話題鏈。具體計(jì)算方式如下:

[9]昨天我不是很舒服。

[10]那棵樹樹干細(xì)，葉子大，很不協(xié)調(diào)，所以我沒買。

[11]媽媽的畫已經(jīng)畫完了，這其中包括中國(guó)古典的意象。

例[9]句為單句，將其計(jì)為一個(gè)話題鏈，例[10]為句首出現(xiàn)話題，其他小句存在隱性話題，屬于典型的話題鏈結(jié)構(gòu)構(gòu)成的一個(gè)話題鏈。例[11]句第二句中包含同指代詞“這”，因其指代句首話題“媽媽的畫”，將其與鏈?zhǔn)仔【溆?jì)算成為一個(gè)話題鏈。

對(duì)“話題鏈”因子進(jìn)行亞因子分析結(jié)果見表4?！霸掝}鏈”因子的四個(gè)亞因子的載荷值均＞0.35，即說明這四種語言特征均為影響低分段作文話題鏈的有效指標(biāo)。其中“話題鏈長(zhǎng)度”和“話題鏈分句數(shù)”載荷值超過0.9，是重要影響因素。另外，零形成分?jǐn)?shù)的載荷值為0.871，代詞計(jì)數(shù)的載荷值為0.446，說明這兩個(gè)特征也是不容忽視的兩個(gè)因素。

表4 ：因子二亞因子分布及測(cè)量指標(biāo)載荷及方差

2.3 詞匯多樣性因子

詞匯多樣性，指的是不同類型的詞在語篇中所占比重的多少。即在寫作中使用多種不同的詞，如同義詞、上位詞、實(shí)詞和其他相關(guān)詞，而避免重復(fù)使用某些詞來表示(Polat&Youjin 2015)。

表5 ：因子三亞因子分布及測(cè)量指標(biāo)載荷及方差

由上表可知，詞匯多樣性的兩個(gè)亞因子的載荷值大于均0.35，是有效指標(biāo)。結(jié)合標(biāo)準(zhǔn)分可知，詞匯多樣性標(biāo)準(zhǔn)分為-1.021，表明詞匯多樣性較低；詞匯密度標(biāo)準(zhǔn)分為-0.092，趨近于0，對(duì)因子影響較小，表現(xiàn)為詞匯密度適中。

2.4 篇幅因子

本文使用的“篇幅”指標(biāo)引自安福勇(2015)的研究，具體指使用“字?jǐn)?shù)”“詞數(shù)”的多少來衡量文章長(zhǎng)短，包括作文中詞的數(shù)量、詞種的數(shù)量、句子的長(zhǎng)短(以字?jǐn)?shù)表示)等。

表6顯示，亞因子詞種數(shù)和T單位長(zhǎng)度的載荷值分別為0.790和0.676，大于0.35，均為有效指標(biāo)。結(jié)合標(biāo)準(zhǔn)分，詞種數(shù)標(biāo)準(zhǔn)分為正數(shù)1.117，說明詞種數(shù)較多；T單位長(zhǎng)度標(biāo)準(zhǔn)分為正數(shù)1.114，說明T單位長(zhǎng)度較長(zhǎng)。表明此階段漢語學(xué)習(xí)者輸出文本能力較強(qiáng)，寫作文本詞種數(shù)較多，T單位長(zhǎng)度較長(zhǎng)。

表6 ：因子四亞因子分布及測(cè)量指標(biāo)載荷及方差

3.低分段作文區(qū)別性語言特征分析

因子分析的統(tǒng)計(jì)結(jié)果顯示，詞匯準(zhǔn)確性、詞匯多樣性、話題鏈以及文章篇幅是中文學(xué)習(xí)者低分段作文中呈現(xiàn)出的值得關(guān)注的語言特征。對(duì)作文文本的分析可以發(fā)現(xiàn)，中文學(xué)習(xí)者低分段作文在這四個(gè)方面存在較多不足。

語言準(zhǔn)確性方面的不足主要表現(xiàn)為語義錯(cuò)誤、詞匯偏誤以及語法錯(cuò)誤較多，影響作文內(nèi)容的表達(dá)，造成閱讀困難。低分段作文顯示，學(xué)生詞匯偏誤與語法錯(cuò)誤較多，表現(xiàn)為有相同語素或同音素的詞，學(xué)生容易混淆，導(dǎo)致詞語搭配錯(cuò)誤，造成語義錯(cuò)誤率高；此外缺詞、多詞以及缺少成分、語序錯(cuò)誤、句式雜糅的現(xiàn)象十分普遍，造成詞匯偏誤率較高，無誤T單位百分比較低。例如:

[12]我當(dāng)兵以后我父親勸告（勸）我學(xué)習(xí)漢語，所以我來到中國(guó)學(xué)習(xí)漢語。一到北京學(xué)習(xí)，我就遇見（遇到）了很多困苦（困難）的事情。

[13]根據(jù)聲調(diào)來（的）意思都（的）不同。每個(gè)人都有經(jīng)驗(yàn)（經(jīng)歷）過以（因）聲調(diào)（應(yīng)添加“錯(cuò)誤”）為（而）鬧出（發(fā)生）的很多難忘的事情。

[14]跟我們國(guó)家氣候不一樣，生活方式也不一樣。最苦（痛苦）的事是別人不能對(duì)表示（表達(dá)）我的思考（想法）。

例[12]中出現(xiàn)較多語義錯(cuò)誤，如將“勸”錯(cuò)用為“勸告”；“困難”錯(cuò)用為“困苦”；“想法”錯(cuò)用為“思考”。而例[13]中存在較多詞匯偏誤，如“來”和“都”為詞匯錯(cuò)用，應(yīng)改為“的”；“以”和“為”應(yīng)改為“因”和“而”；“聲調(diào)”后應(yīng)添加“錯(cuò)誤”；“鬧出”與“事情”詞匯搭配有誤，應(yīng)該為“發(fā)生”，此外，還存在一例語義錯(cuò)誤，即“經(jīng)驗(yàn)”語義理解有誤，改為“經(jīng)歷”。例[14]中也有較多的語義錯(cuò)誤，如“苦”應(yīng)該為“痛苦”；“表示”應(yīng)為“表達(dá)”，而“思考”應(yīng)為“想法”。此外，例[14]劃線部分存在較多語法錯(cuò)誤現(xiàn)象，如缺乏主語和語序錯(cuò)誤，正確表述應(yīng)該為“北京的氣候跟我們國(guó)家的不一樣”以及“最痛苦的事是不能對(duì)別人表達(dá)我的想法”；這一段話中存在3個(gè)T單位，但無誤T單位僅有1個(gè)，無誤T單位百分比較低。

另外，漢字正確率較低以及連詞計(jì)數(shù)較低(正確使用的連詞)。例如:

[15]所以初學(xué)漢語第一個(gè)辛苦是接屬[接觸]到中國(guó)人的困難。但可能同時(shí)是“塞翁失馬”一樣現(xiàn)像[象]，因?yàn)閺絒經(jīng)]過最初兩三年學(xué)漢語的“黑葙[箱]作業(yè)”的過程后，我掌握了基本發(fā)音和詞匯[匯]的要點(diǎn)。結(jié)果到中國(guó)重新開放的時(shí)候，我已經(jīng)會(huì)說一些比效[較]流和（流行）但並[并]不標(biāo)準(zhǔn)的中國(guó)話，使我可以自由與新中國(guó)的朋友們溝通。

[16]雖然（因?yàn)椋┎煌膰?guó)家有的漢語跟我國(guó)家漢字的意思相同，所以頭一次看漢語沒有陌生。

[17]我長(zhǎng)大了，而且（但是）我的牙不太好看，我覺得我本來喜歡唐[糖]，但（所以）我的牙不好，可是都是我爸造成的。

例[15]存在大量漢字錯(cuò)誤，如形近錯(cuò)別字，“徑與經(jīng)”“效與較”“像與象”“葙與箱”“並與并”，以及音近混淆詞錯(cuò)誤，如“接屬與接觸”，這兩類錯(cuò)誤在留學(xué)生低分段漢語作文中十分常見，母語者在使用這些詞語時(shí)，不會(huì)出現(xiàn)此類錯(cuò)誤，但留學(xué)生，特別是母語為表音文字的學(xué)生，易出現(xiàn)此類錯(cuò)誤；例[16]與例[17]中連詞錯(cuò)誤表現(xiàn)明顯，例[16]中“雖然”使用錯(cuò)誤，應(yīng)改為“因?yàn)椤迸c后一小句的“所以”形成因果關(guān)系。例[17]中“而且”和“但”使用錯(cuò)誤，應(yīng)該改為“但是”和“所以”。低分段作文中，連詞使用的數(shù)量并不少，但連詞使用錯(cuò)誤問題較為嚴(yán)重，學(xué)生不能根據(jù)文章的意義選擇合適的連詞。

詞匯多樣性方面，主要的缺陷是作文詞匯密度適中，但詞匯多樣性較低。表現(xiàn)為學(xué)習(xí)者在表達(dá)觀點(diǎn)時(shí)，會(huì)重復(fù)使用自己有把握的詞，而不會(huì)變化使用多種詞匯。例如:

[18]學(xué)習(xí)漢語的時(shí)候也有苦的地方，也有樂的地方。學(xué)習(xí)本來是不容易的。學(xué)習(xí)漢語的時(shí)候，我認(rèn)為開始學(xué)習(xí)漢語的時(shí)候呢，苦的地方是發(fā)音。我在首爾工作的時(shí)候開始學(xué)習(xí)漢語，上課的時(shí)候，老師讓我讀課本，那時(shí)候我的舌頭很硬，怎么也硬，老師和同事們總是笑。半年后我到中國(guó)來學(xué)習(xí)了。我一到中國(guó)就開始上課了，那時(shí)我聽不懂老師的講話，所以老師問問題的時(shí)候（缺少“我”）總是東問西答，現(xiàn)在呢，我說話的時(shí)候，讓中國(guó)人感覺“她看樣子大學(xué)生，但說話的時(shí)候孩子一樣”“他說話是不是開玩笑”因?yàn)槲业谋磉_(dá)能力很差，而且一個(gè)同樣的詞是有不同的意思，還有各個(gè)方面說話的方式不一樣，以上這種方面讓我感覺苦。那么樂的方面呢，我覺得樂的方面比苦的方面多。開始學(xué)習(xí)的時(shí)候跟中國(guó)人說話的機(jī)會(huì)只是買東西的時(shí)候，但也高興?，F(xiàn)在呢，（缺少“可以”）跟中國(guó)人討論，而且表達(dá)能力也提高了，有這種感覺的時(shí)候高興。但是最樂的時(shí)候呢，我的發(fā)音不準(zhǔn)所以讓中國(guó)人產(chǎn)生了笑的時(shí)候等很多?，F(xiàn)在想苦的地方也可以說樂的地方。

[19]我的父親是個(gè)技術(shù)工人。性格上說很溫柔，不知道對(duì)男的這樣的說法是不是合適，但他的卻[確]是很柔和的人。對(duì)（從）生活上來說非常老實(shí)，認(rèn)真，勤勞。他的這一切都給我?guī)砹撕芎玫挠绊?。我可以這么說，上大學(xué)以后讀較多的書，我慢慢完成了人生觀、價(jià)值觀。我對(duì)世界了解得（了）不少，認(rèn)識(shí)了很多偉大的八[人]物，高尚的學(xué)者等等，我都尊敬他們?？墒俏覍?duì)他們的尊敬心（尊敬）不對(duì)（如）我父親。這個(gè)世界上我最喜歡的人是父親，（詞匯贅余“向”）向?qū)W習(xí)的人（對(duì)象）也是父親，以后我的事業(yè)完成的（詞匯缺失“那”）一天替我最高興的人，我相信也是我的父親。我擔(dān)心他年齡不少（?。?，等到那時(shí)候我的父親身體好，我祝（祝愿）他的（詞匯贅余“的”）健康！

從詞匯密度角度來看，例[18]有238個(gè)詞，實(shí)詞數(shù)為139，詞匯密度為58.40%。例[19]有151個(gè)詞，實(shí)詞數(shù)為122，詞種數(shù)67個(gè)，詞匯密度為80.79%,整體來看，學(xué)生作文詞匯密度均超過50%，表現(xiàn)為低分段留學(xué)生漢語寫作詞匯密度適中。從詞匯多樣性角度來看，例[18]有238個(gè)詞，詞匯多樣度為33.15%，例[19]有151個(gè)詞，詞匯多樣度為44.37%，可以看出任務(wù)時(shí)間內(nèi)有效產(chǎn)出詞匯數(shù)量較多，但用詞較為單一，學(xué)生重復(fù)使用自己有把握的詞，而不會(huì)變化使用多種詞匯，導(dǎo)致文本質(zhì)量較低。

在話題鏈以及文章篇幅方面，總體來看，低分段作文中話題鏈?zhǔn)褂梅矫娴牟蛔闶?，話題鏈長(zhǎng)度較短，存在話題鏈跳躍的問題。即，學(xué)生往往就一個(gè)話題鏈進(jìn)行簡(jiǎn)單描述后，則立即轉(zhuǎn)向?qū)α硪粋€(gè)話題鏈，文章中心內(nèi)容不固定，缺乏連貫性、整體性，使文章中心不明確。

[20]在我們世界有成千上萬的歌手。//人們都有自己所喜歡的歌手或歌曲//，其中我也喜歡流行歌曲的那一類//。每個(gè)人都喜歡不同的歌曲，有的愛聽流行歌曲，有的愛聽舊的歌曲。//我認(rèn)為歌曲對(duì)人有利的//。

[21]他對(duì)我們非常嚴(yán)格。表情、動(dòng)作都使人覺得非常害怕。//因此我們的表哥，表姐妹們從來（一直）怕他。//過年，親戚都在一起的時(shí)候小孩子們特別怕考（靠）近在（“在”多余）我父親。//

例[20]中，主題分別為“人們”“我”“每個(gè)人”“我”；例[21]中，主題分別為“他”“表哥、表姐妹們”“小孩子們”。每個(gè)句子僅僅形成“主題+評(píng)述”的形式，沒有形成“主題+評(píng)述，+評(píng)述+……”的話題鏈，使得主題描述不全面，文章割裂開來，結(jié)構(gòu)不清晰，內(nèi)容不連貫。其次就話題鏈分句數(shù)來看，例[20][21]話題鏈的分句數(shù)較少。為更加準(zhǔn)確說明這一結(jié)論，我們對(duì)120份漢語學(xué)習(xí)者作文進(jìn)行數(shù)據(jù)整理，發(fā)現(xiàn)留學(xué)生作文中話題鏈分句數(shù)均較少，平均值僅為1.7423。多數(shù)話題鏈，除首句外，僅含有一個(gè)分句，單個(gè)話題鏈的內(nèi)容并未說完，就開啟一個(gè)新的話題鏈，造成文章割裂，言未達(dá)意。由上述兩點(diǎn)可見，低分段留學(xué)生作文話題鏈?zhǔn)褂们闆r較差。結(jié)合標(biāo)準(zhǔn)分，零形成分為負(fù)，代詞計(jì)數(shù)為正，其表現(xiàn)為零形成分?jǐn)?shù)較少、代詞計(jì)數(shù)較多。結(jié)合文本發(fā)現(xiàn)，學(xué)生作文中應(yīng)使用零形成分的部分大多出現(xiàn)“這”“我”“她、他”等代詞，漢語學(xué)習(xí)者習(xí)慣使用名詞或代詞等形式指稱主題，而不習(xí)慣使用零形成分，這導(dǎo)致代詞數(shù)量較多，零形成分?jǐn)?shù)較少。

關(guān)于篇幅方面，需要思考的問題是，是否作文輸出的篇幅越長(zhǎng)，其作文語言質(zhì)量就越好。王藝璇(2017)、吳繼峰等(2019)等曾采用詞種數(shù)作為指標(biāo)，測(cè)量學(xué)生詞匯掌握程度，發(fā)現(xiàn)作文中詞種數(shù)越多，表明學(xué)生詞匯掌握程度越好，則作文的寫作質(zhì)量越高。但我們對(duì)作文文本的分析發(fā)現(xiàn)篇幅長(zhǎng)短與作文質(zhì)量并非成正比。為了進(jìn)一步說明這一問題，我們引入漢語母語者同題作文進(jìn)行比較。

[22]父母對(duì)孩子的生存有巨大的影響。/從孩子一落地，他就開始讓識(shí)[認(rèn)識(shí)]世界。/他讓識(shí)[認(rèn)識(shí)]的對(duì)一個(gè)人就是父母親。/孩子跟父母一起生活就會(huì)學(xué)到父母的行為。/小孩子第一個(gè)學(xué)習(xí)就是摩仿父母親。/從吃，喝，睡，玩，日常等等的方面都只有父母的習(xí)貫[習(xí)慣]讓孩子知道應(yīng)該怎么做。/換一句話說，父母就是孩子的第一個(gè)老師。/這樣說孩子不一定全學(xué)的都是好的，/父母的壞習(xí)貫[習(xí)慣]也都會(huì)吸收到。/這時(shí)，孩子長(zhǎng)大后也會(huì)受到不斷的環(huán)竟[環(huán)境]變化，/他也會(huì)受到別人的批評(píng)，/因?yàn)樗磺凶龅亩际歉改杆痰摹?假如父母教的好，/孩子自己會(huì)扮斷（判斷）什么是好的什么是壞的。/這就是做父母最難的一件事，/教出一個(gè)好孩子。/父母的心全都給了孩子。/孩子大部分都知道有了問題一定可以請(qǐng)求父母的幫助。/可是這也是要父母的陪養(yǎng)[培養(yǎng)]才能讓孩子知道有這一條路。/如果父母把孩子教對(duì)了，/孩子才不會(huì)走錯(cuò)條路。/（留學(xué)生漢語作文——《父母是孩子的第一任老師》）（詞種數(shù)115，22個(gè)T單位）

[23]父母是孩子的第一任老師，/這句話體現(xiàn)了家庭教育對(duì)個(gè)人教育的重要性。/主要表現(xiàn)在以下幾點(diǎn)，/首先父母決定著孩子可以接觸什么，/為孩子創(chuàng)造最基本的生活環(huán)境。/其次，父母對(duì)孩子的教育是潛移默化、無法抵抗的，/他融入在生活之中，/在一言一行之中，/對(duì)孩子的影響是無形卻真實(shí)。/最后，父母對(duì)孩子的影響是長(zhǎng)久的，/不論是童年時(shí)期還是成年之后，/這些影響也許會(huì)伴隨孩子的一生。/（母語者輸出文本——《父母是孩子的第一任老師》）（詞種數(shù)61，11個(gè)T單位）

上述例子中一個(gè)T單位用“/”表示。例[22]是漢語學(xué)習(xí)者的作文，其中詞種數(shù)為115，存在22個(gè)T單位，T單位的平均長(zhǎng)度為16；例[23]為漢語母語者作文，詞種數(shù)為61，存在11個(gè)T單位，T單位的平均長(zhǎng)度為13.1。比較發(fā)現(xiàn)，漢語學(xué)習(xí)者低分段作文篇幅較長(zhǎng)，T單位長(zhǎng)度與漢語母語者作文相當(dāng)，而且詞種數(shù)還高于漢語母語者作文。但從具體文本內(nèi)容質(zhì)量來看，漢語學(xué)習(xí)者作文中詞匯的難度以及內(nèi)容論證的深度要遠(yuǎn)低于漢語母語者。如漢語母語者作文中，使用了“潛移默化”“無法抵抗”“無形”“一言一行”等難度較大的詞匯；另外，漢語母語者從父母對(duì)孩子影響的內(nèi)容、方式、持久度等三個(gè)方面進(jìn)行論述，而漢語學(xué)習(xí)者僅論述了父母對(duì)孩子生活的影響，深度低于漢語母語者。還有，漢語學(xué)習(xí)者作文T單位長(zhǎng)度雖長(zhǎng)，但語言不夠精煉，存在較多重復(fù)詞匯。上述兩例顯示，作文篇幅長(zhǎng)短與作文質(zhì)量并非正比。雖然語言輸出的量在一定程度上可以反應(yīng)其語言能力，但作文的質(zhì)量總體上會(huì)受準(zhǔn)確性、豐富性以及內(nèi)容連貫性等多種因素的影響。因此，單獨(dú)用篇幅長(zhǎng)短無法說明漢語學(xué)習(xí)者低分段中文寫作的總體特征。留學(xué)生低分段作文篇幅較長(zhǎng)，表明此階段學(xué)生語言表達(dá)能力有所提高，學(xué)生基本能夠完成作文的字?jǐn)?shù)要求。但從具體文本內(nèi)容質(zhì)量來看，其與母語者相比，詞匯的難度以及內(nèi)容論證的深度都還有待提高。

4.結(jié)語

本文采用因子分析法對(duì)中文學(xué)習(xí)者低分段中文作文語言區(qū)別性特征進(jìn)行分析，結(jié)果顯示，除特殊句計(jì)數(shù)為無效指標(biāo)外，語義錯(cuò)誤率、詞匯偏誤率、無誤T單位百分比、漢字正確率、連詞計(jì)數(shù)、話題鏈長(zhǎng)度、零形成分?jǐn)?shù)、代詞計(jì)數(shù)、話題鏈分句數(shù)、詞匯多樣性、詞匯密度、詞種數(shù)、T單位長(zhǎng)度等均為測(cè)量低分段留學(xué)生中文寫作質(zhì)量的有效指標(biāo)。另外，因子分析將上述語言區(qū)別性特征聚合為4個(gè)固定因子，分別為“準(zhǔn)確性因子”“話題鏈因子”“詞匯多樣性因子”以及“篇幅因子”。統(tǒng)計(jì)結(jié)果表明，準(zhǔn)確性、詞匯多樣性、話題鏈以及文章篇幅是低分段作文中呈現(xiàn)出的值得關(guān)注的語言特征，具體存在的不足包括:

(1)語言準(zhǔn)確性有待提高。學(xué)習(xí)者作文中語義錯(cuò)誤較多，特別是有相同語素或相同音素的詞，留學(xué)生比較容易混淆，造成作文行文歧義點(diǎn)多；詞匯錯(cuò)用，缺詞、多詞，以及缺少成分、語序錯(cuò)誤、句式雜糅的現(xiàn)象十分普遍。(2)話題鏈的使用情況較差。話題鏈長(zhǎng)度較短和話題鏈分句數(shù)較少是中文學(xué)習(xí)者作文中話題鏈?zhǔn)褂们闆r較差的重要原因，表現(xiàn)為一篇作文多個(gè)話題，文章的主題來回跳動(dòng)的現(xiàn)象，學(xué)生往往就一個(gè)話題鏈進(jìn)行簡(jiǎn)單描述后，則立即轉(zhuǎn)向?qū)α硪粋€(gè)話題鏈的描述，文章中心內(nèi)容不固定，缺乏連貫性、整體性。(3)詞匯多樣性有待提高。留學(xué)生低分段作文詞匯密度適中，但詞匯多樣性較低。表現(xiàn)為學(xué)習(xí)者在表達(dá)觀點(diǎn)時(shí)，會(huì)重復(fù)使用自己有把握的詞，而不會(huì)變化使用多種詞匯。(4)篇幅與質(zhì)量不成正比。低分段作文篇幅較長(zhǎng)，表明此階段學(xué)生語言表達(dá)能力較高，但從具體文本內(nèi)容質(zhì)量來看，詞匯的難度以及內(nèi)容論證的深度都還有待提高。

以上研究結(jié)果對(duì)第二語言寫作教學(xué)有一定的啟示:第一，在寫作教學(xué)中，要特別注意學(xué)習(xí)者的語言錯(cuò)誤，采取各種有效的方法加以糾正，以提高學(xué)生的語言正確性。近年來，關(guān)于“二語寫作教學(xué)中的書面糾錯(cuò)反饋的有效性”存在爭(zhēng)議，主要有以下兩點(diǎn):第一，糾錯(cuò)是否有效?第二，如果是，哪種糾錯(cuò)方法最有效?本文認(rèn)為，無論糾錯(cuò)效果如何，語言的正確性都是影響作文評(píng)分的最重要因素。強(qiáng)調(diào)語言的正確性，加強(qiáng)對(duì)學(xué)習(xí)者基本語言技能的訓(xùn)練是提高學(xué)生語言水平的基礎(chǔ)，是一切能力發(fā)展的基石，因此在對(duì)外漢語教學(xué)中，特別是針對(duì)高水平學(xué)習(xí)者，準(zhǔn)確性不容忽略。第二，注重培養(yǎng)中文學(xué)習(xí)者漢語話題鏈意識(shí)。中文篇章有其獨(dú)特的特點(diǎn)，并非“主語-謂語”形式，而是由“主題-說明”組成。教師應(yīng)注重培養(yǎng)學(xué)生的話題意識(shí)，尤其是寫作時(shí)話題鏈的建構(gòu)，雖然這對(duì)學(xué)生來說可能較為困難。正如周強(qiáng)和周驍聰(2014)所指出的，“漢語這種簡(jiǎn)單而靈活的意合型篇章組合結(jié)構(gòu)在人們的日常理解和交流中沒有困難，但它對(duì)漢語寫作的連貫性提出了巨大挑戰(zhàn)。”因此，理解漢語篇章構(gòu)成，注重漢語寫作話題鏈的使用以及語言篇章的連貫性，是寫作教學(xué)中教師與學(xué)生需要關(guān)注的重點(diǎn)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡