国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

需求導(dǎo)向的漢語繼承語學(xué)習(xí)者語料庫建設(shè)研究*

2022-02-04 03:19:23趙煥改西北師范大學(xué)國際文化交流學(xué)院
國際中文教育(中英文) 2022年2期
關(guān)鍵詞:同質(zhì)性語料母語

趙煥改 西北師范大學(xué)國際文化交流學(xué)院

提 要 建立學(xué)習(xí)者語料庫并基于語料庫進(jìn)行多維研究,是近年來國內(nèi)外第二語言教學(xué)和外語教學(xué)研究的熱點(diǎn)內(nèi)容。國內(nèi)外已建立的學(xué)習(xí)者語料庫不少,但都無法滿足漢語繼承語的教學(xué)及研究需求。本研究著眼于語料庫的使用需求,從漢語繼承語學(xué)習(xí)者語料庫建設(shè)的必要性,語料的追蹤性、同質(zhì)性、真實(shí)性、共享性、可比性以及平衡性等方面探討漢語繼承語學(xué)習(xí)者語料庫的建設(shè),以期能為漢語繼承語學(xué)習(xí)者語料庫的建設(shè)提供參考,為中介語對(duì)比分析提供新的角度和數(shù)據(jù)。

一、引言

近年來,學(xué)習(xí)者語料庫的作用日益受到重視,建立學(xué)習(xí)者語料庫并基于語料庫進(jìn)行多維研究,已成為國內(nèi)外第二語言教學(xué)和外語教學(xué)研究的熱點(diǎn)和難點(diǎn)?;诖笠?guī)模真實(shí)文本的、定量分析與定性分析相結(jié)合的研究方法逐漸成為漢語習(xí)得與教學(xué)研究的主流方法。語料庫語言學(xué)的研究路徑包括“語料庫指引”“基于語料庫”“語料庫驅(qū)動(dòng)”等三種(梁茂成等,2010)。這些研究可以視作從語料庫資源平臺(tái)的“供給側(cè)”視角所做的分析(曹賢文,2020),從研究者需求視角做分析的則不多,只有曹賢文(2020)等。同時(shí),第二語言教學(xué)與研究的不斷發(fā)展也對(duì)中介語語料庫的建設(shè)提出了新的需求。目前,已建成的中介語語料庫中尚未見到專門的漢語繼承語學(xué)習(xí)者語料庫,可真正實(shí)現(xiàn)縱向追蹤的語料少,語料同質(zhì)性、真實(shí)性、共享性、可比性、平衡性等均有提升的空間。

為了使建成的語料庫可以更好地滿足研究者的需求,在研究中發(fā)揮更大的作用,本文結(jié)合建庫實(shí)踐,從使用者需求的角度探討漢語繼承語學(xué)習(xí)者語料庫建設(shè)的必要性以及語料的追蹤性、同質(zhì)性、真實(shí)性、共享性、可比性和平衡性等問題。

二、基于語料庫研究的研究需求

漢語作為第二語言教學(xué)與研究的不斷發(fā)展對(duì)漢語中介語語料庫的建設(shè)提出了新的需求,總體而言,可以概括為以下幾個(gè)方面。

(一)需要建立漢語繼承語學(xué)習(xí)者語料庫

繼承語(heritage language),又稱“社區(qū)語言”(community language)、“家庭語言”(home language)、 “祖語”(ancestral language)、“傳承語”等,是“由于個(gè)體轉(zhuǎn)向另一門主導(dǎo)語言而沒有完全習(xí)得的第一門語言”(Valdés,2001)。繼承語理論的相關(guān)研究認(rèn)為,繼承語習(xí)得具有一語習(xí)得和二語習(xí)得的雙重特征,但又不同于常規(guī)的一語習(xí)得和二語習(xí)得。因此,自1977年“繼承語”一詞出現(xiàn)以來,該理論就受到了國外學(xué)界的廣泛關(guān)注,近年來國內(nèi)也開始關(guān)注該理論,已有的研究包括國外相關(guān)研究綜述(曹賢文,2017;邵明明,2018)、繼承語譯法的探討(郭熙,2017)及繼承語習(xí)得研究的初步嘗試(呂嬋,2017;邵明明,2018)等。對(duì)漢語繼承語習(xí)得的深入研究同樣離不開基于語料庫的研究方法。而已建成的語料庫,語料產(chǎn)出者數(shù)量不均衡,少見漢語繼承語學(xué)習(xí)者的語料。因此,當(dāng)前漢語繼承語教學(xué)與習(xí)得研究的主要方法依然是小樣本、小規(guī)模的定性研究,所得結(jié)論的普遍性、穩(wěn)定性不強(qiáng)。而繼承語研究中的核心問題,如繼承語習(xí)得與二語習(xí)得的關(guān)系、繼承語習(xí)得的研究等需語料支撐的研究目前較少。因此,建立具有一定規(guī)模的漢語繼承語學(xué)習(xí)者語料庫就顯得十分必要和迫切。

(二)需要能實(shí)現(xiàn)真正意義上縱向追蹤的語料庫

所謂“能實(shí)現(xiàn)真正意義上縱向追蹤的語料庫”,是指收集到的語料是相同學(xué)習(xí)者在初、中、高不同學(xué)習(xí)階段的語料。由于縱向追蹤研究能觀察較完整的二語發(fā)展過程和發(fā)展過程中的一些關(guān)鍵轉(zhuǎn)變點(diǎn),因此特別適合習(xí)得過程研究(文秋芳、胡健,2010)。曹賢文(2013)認(rèn)為,只有通過縱向追蹤調(diào)查才能全面了解學(xué)習(xí)者由預(yù)制的套語到可分析的語言結(jié)構(gòu)、由重復(fù)模仿他人話語到自主生成第二語言的習(xí)得過程。二語發(fā)展的動(dòng)態(tài)系統(tǒng)理論成為熱點(diǎn)之后 (Van Geert,2008),采集縱向發(fā)展語料、開展動(dòng)態(tài)發(fā)展研究更是受到學(xué)界關(guān)注。目前,漢語中介語語料庫基本都是共時(shí)截面語料庫,歷時(shí)縱向語料庫十分缺乏。一些學(xué)者提出,可利用不同語言水平等級(jí)語料構(gòu)建類歷時(shí)語料庫(quasilongitudinal corpus),以解決縱向語料缺乏的問題 (Granger,2002; 顏明、肖奚強(qiáng),2017)。不過,Gass和Selinker(2008)把這類數(shù)據(jù)稱為“偽縱向數(shù)據(jù)”(pseudo-longitudinal data),認(rèn)為用分層截面數(shù)據(jù)來取代縱向數(shù)據(jù),其有效性充滿爭議。但是,由于建設(shè)縱向語料庫收集語料時(shí)間跨度較長、費(fèi)時(shí)費(fèi)力,且長期學(xué)歷班學(xué)生較少,縱向語料收集困難。因此,目前尚未見到規(guī)模較大的能實(shí)現(xiàn)真正意義上縱向追蹤的漢語中介語語料庫。已建成且對(duì)外開放的漢語中介語語料庫多為“跨層共時(shí)語料”,即分屬于初、中、高不同水平等級(jí)的不同學(xué)習(xí)者的共時(shí)語料。如北京語言大學(xué)的“HSK動(dòng)態(tài)作文語料庫”“全球漢語中介語語料庫”等都屬于此類。因此,語料的限制導(dǎo)致與兒童母語習(xí)得研究相比,采用縱向追蹤語料進(jìn)行的二語習(xí)得過程研究比較少??陀^地講,在縱向語料缺乏并且收集難度較大的情況下,采用跨層共時(shí)語料研究二語發(fā)展過程不失為一種簡便易行的辦法(曹賢文,2013),對(duì)促進(jìn)二語習(xí)得過程研究確實(shí)起到了積極的作用,不過正如 Doughty和Long(2003)所指出的:“(由于)縱向研究極少,大量的二語習(xí)得研究是橫截面式的,使得在一些重要問題上所得出的結(jié)論存在嚴(yán)重的限制。因此,能實(shí)現(xiàn)真正意義上縱向追蹤的語料庫的建立對(duì)漢語習(xí)得研究尤為重要。”

(三)需要語料同質(zhì)性較高的語料庫

學(xué)習(xí)者的年齡、性別、學(xué)習(xí)時(shí)長、學(xué)習(xí)環(huán)境、教師、教材、教學(xué)方法的差異,都會(huì)使學(xué)習(xí)者產(chǎn)出的語料出現(xiàn)不同程度的差異,而這些差異又會(huì)影響語料的同質(zhì)性,從而一定程度上影響研究結(jié)論的客觀性。在語料收集中如能充分考慮這些因素,并且在語料庫使用者檢索時(shí)能依據(jù)不同研究目的檢索出來的話,則能使研究結(jié)果更加可靠,更加有針對(duì)性。然而,跟母語語料庫常常受制于建庫者的取舍不同,中介語語料庫在這些方面實(shí)現(xiàn)得不夠充分,基本上都是受到客觀條件的限制(施春宏、張瑞朋,2013)。當(dāng)前漢語中介語語料收集受限于語料產(chǎn)出者數(shù)量不及母語語料產(chǎn)出者多,因而在保證量的情況下,無法對(duì)其他方面的差異做到全部考慮,導(dǎo)致當(dāng)前學(xué)習(xí)者語料庫中語料普遍同質(zhì)性不高。具體而言,學(xué)習(xí)者語料庫中的語料在學(xué)習(xí)者年齡、學(xué)習(xí)環(huán)境、所用教材、教學(xué)方法、語言環(huán)境等方面的同質(zhì)性均待提高。

(四)除音頻口語語料外,還需要真實(shí)的能尊重口語語料原貌的轉(zhuǎn)寫語料庫

Myles(2008)認(rèn)為,高質(zhì)量的語料庫其中一個(gè)特點(diǎn)是“口語的”,因?yàn)榭谡Z語料能更好地代表學(xué)習(xí)者語言產(chǎn)出體現(xiàn)的語言系統(tǒng),由于受到在線言語產(chǎn)出的壓力,與書面表達(dá)受到較多監(jiān)控處理特征相比,口頭表達(dá)相對(duì)來說更能反映學(xué)習(xí)者的語言能力。當(dāng)前的漢語中介語語料庫語料獲取手段單一,多為書面語語料,口語語料較少。并且由于漢語中介語口語語料轉(zhuǎn)寫困難,因此,容易出現(xiàn)費(fèi)時(shí)費(fèi)力轉(zhuǎn)寫出的語料卻無法真實(shí)還原口語語料的原貌而實(shí)用性差的問題。近年來,隨著語音識(shí)別技術(shù)的進(jìn)步,機(jī)器自動(dòng)轉(zhuǎn)寫母語者語料取得了很好的效果,但是在學(xué)習(xí)者語料的自動(dòng)轉(zhuǎn)寫,尤其是發(fā)音偏誤較多的語料轉(zhuǎn)寫方面,效果卻不太理想。如何能最大程度地尊重口語語料的原貌,也是語料庫建設(shè)者和研究者需要考慮的問題之一。

(五)需要更多開放訪問和資源共享的網(wǎng)絡(luò)版本的語料庫

當(dāng)前已建成的漢語中介語語料庫,只有少數(shù)是面向公眾免費(fèi)開放的,如北京語言大學(xué)的“HSK動(dòng)態(tài)作文語料庫”“全球漢語中介語語料庫”、中山大學(xué)的“漢字偏誤中介語語料庫”、臺(tái)灣師范大學(xué)的“漢語學(xué)習(xí)者漢字偏誤數(shù)據(jù)資料庫”等,并且由于各種原因,已開放的語料庫也時(shí)常會(huì)出現(xiàn)打不開的問題。多數(shù)語料庫只供建庫者小范圍內(nèi)使用,造成了資源的浪費(fèi)。因此,可以開放訪問的網(wǎng)絡(luò)版本的語料庫也是學(xué)界所需要的。

(六)需要可實(shí)現(xiàn)對(duì)比的語料庫

對(duì)比研究作為重要的研究方法,其研究的開展離不開充足的可對(duì)比語料的支持。當(dāng)前,大多數(shù)漢語中介語語料庫由于語料同質(zhì)性差,在進(jìn)行一些對(duì)比研究,如不同階段習(xí)得情況對(duì)比、不同母語背景學(xué)習(xí)者漢語習(xí)得情況的對(duì)比研究時(shí),研究結(jié)論會(huì)受到不同程度的影響。同時(shí),由于沒有統(tǒng)一的建庫規(guī)范,建庫實(shí)踐中存在隨意性(張寶林、崔希亮,2015),造成已建成的各庫之間的語料無法進(jìn)行并集1研究,這也導(dǎo)致了語料庫重復(fù)建設(shè)與資源浪費(fèi)。因此,同質(zhì)性較高的可實(shí)現(xiàn)對(duì)比的語料庫也是當(dāng)前研究所需。

三、基于需求的漢語繼承語學(xué)習(xí)者語料庫的建庫思考及實(shí)現(xiàn)路徑

漢語中介語語料庫建設(shè)的目的是為對(duì)外漢語教學(xué)與研究服務(wù)(張寶林,2019)。因此,以下內(nèi)容將以“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”建設(shè)為例,探討面向以上研究需求的漢語繼承語學(xué)習(xí)者語料庫的建設(shè)。筆者結(jié)合多年的建庫經(jīng)驗(yàn)及建庫實(shí)際,對(duì)“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”中語料的追蹤性、同質(zhì)性、真實(shí)性、共享性、可比性和平衡性等進(jìn)行關(guān)聯(lián),對(duì)已建或待建的漢語中介語語料庫具有普遍意義的問題進(jìn)行探討。

(一)語料的追蹤性

Mitchell和 Myles(2004)認(rèn)為:“二語習(xí)得研究除了清晰的理論框架以外,最寶貴的資源是可使用的高質(zhì)量數(shù)據(jù)?!?Ortega和Iberri-Shea(2005)明確指出,跟蹤研究能夠解決二語習(xí)得研究中的許多基本問題,如二語石化、母語遷移、二語學(xué)習(xí)關(guān)鍵期等。曹賢文(2013)認(rèn)為:“要真正研究學(xué)習(xí)者的語言發(fā)展變化,縱向語料比跨層語料更加適合……對(duì)于研究漢語二語習(xí)得過程,既需要截面數(shù)據(jù),也需要縱向數(shù)據(jù),縱向追蹤語料庫起著共時(shí)語料庫難以替代的作用?!币虼耍枰ù罅獠杉薪檎Z發(fā)展過程中的縱向數(shù)據(jù),通過加強(qiáng)漢語中介語動(dòng)態(tài)發(fā)展語料庫建設(shè),來支撐相關(guān)二語習(xí)得研究,尤其是深入考察中介語在時(shí)間軸上的變異和變化表現(xiàn),對(duì)學(xué)習(xí)者中介語系統(tǒng)的動(dòng)態(tài)發(fā)展軌跡做出比較完整的描述和解釋。

理想的可追蹤性語料是相同學(xué)習(xí)者在不同階段的語料,這樣才能實(shí)現(xiàn)真正意義上的追蹤,否則只能算是偽縱向語料庫。基于偽縱向語料庫進(jìn)行的研究會(huì)掩蓋某些個(gè)性,從而對(duì)結(jié)論產(chǎn)生影響。西北師范大學(xué)自2013年開始招收中華文化語言本科學(xué)生,至今已8年多,共招收四年制本科生300多名,這些學(xué)生母語多為東干語,他們?cè)谖鞅睅煼洞髮W(xué)進(jìn)行為期四年的漢語專業(yè)學(xué)習(xí),其教學(xué)計(jì)劃、課程設(shè)置、教學(xué)環(huán)境、生活環(huán)境等完全一致。這一特殊群體可以保證收集到的語料是包含同一批學(xué)生在不同學(xué)習(xí)階段的語料,也包括不同學(xué)生在相同學(xué)習(xí)階段的語料,即包含可以實(shí)現(xiàn)真正意義上縱向追蹤的語料,這是以往的語料庫所未能實(shí)現(xiàn)的,也是該語料庫的獨(dú)特性之一。為了便于進(jìn)行追蹤性研究,語料庫建設(shè)者在語料編碼上采用了學(xué)生的“學(xué)號(hào)+學(xué)年+學(xué)期+科目+語料來源(+補(bǔ)考)(+課目+題號(hào))(+頁碼)”的編碼方式,通過漢語拼音和英文大寫字母+阿拉伯?dāng)?shù)字+短橫(+波浪號(hào))的方式來實(shí)現(xiàn),比如“20185703001-2018-2019-1-ZHQZ/QM-BK/A/B/1-7~2”,其中,“20185703001”是學(xué)生學(xué)號(hào),“2018-2019”是學(xué)年,“1”指第1學(xué)期,“ZH”代指綜合課,“QZ/QM”指期中/期末。這樣在語料庫中進(jìn)行檢索時(shí),可以依據(jù)學(xué)生的學(xué)號(hào)檢索出其不同階段的所有語料,也可以進(jìn)一步根據(jù)“科目”代碼等實(shí)現(xiàn)對(duì)不同課程語料的檢索。如此便可以實(shí)現(xiàn)對(duì)個(gè)案或群案的不同學(xué)習(xí)階段、不同課程習(xí)得的動(dòng)態(tài)追蹤研究。

(二)語料的同質(zhì)性

學(xué)生的學(xué)習(xí)環(huán)境不同,會(huì)對(duì)語料的同質(zhì)性產(chǎn)生一定影響。為了確保語料的同質(zhì)性,“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”建庫過程中收集的語料是不同學(xué)習(xí)者在相同學(xué)習(xí)環(huán)境下的語料。由于語料產(chǎn)出者同屬中華語言文化本科學(xué)歷班,因此有著相同的培養(yǎng)方案及課程設(shè)置,且學(xué)習(xí)者年齡跨度為18—25歲,平均年齡為19.6歲,學(xué)習(xí)者在年齡、學(xué)習(xí)環(huán)境、所用教材、教學(xué)方法、語言環(huán)境方面的同質(zhì)性均得到了很好的保證,而這正是語料同質(zhì)性的保證,這是在一般的中介語語料庫建設(shè)中很難做到的,也是“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”的獨(dú)特之處。

(三)口語語料轉(zhuǎn)寫的真實(shí)性

與書面語語料照實(shí)錄入不同的是,口語語料需要在反復(fù)聽辨音頻文件的情況下,將音頻文件轉(zhuǎn)寫成文字。音頻文件中存在停頓、重復(fù)、聲韻調(diào)問題、聲音模糊、鼻音、外文,以及非言語因素(如音頻文件的雜音干擾、笑聲、咳嗽等)和學(xué)生的姓名該如何轉(zhuǎn)寫等問題,如何在盡可能保持音頻文件原貌的前提下,保質(zhì)保量地完成轉(zhuǎn)寫任務(wù),也是我們研究的內(nèi)容。為了解決這一難題,我們?cè)谵D(zhuǎn)寫口語語料的時(shí)候,對(duì)其中的停頓、重復(fù)、聲母錯(cuò)誤、韻母錯(cuò)誤、聲調(diào)錯(cuò)誤以及聽不清、鼻音、非言語行為、外文、朗讀、學(xué)生姓名、聽后重復(fù)等與書面語語料錄入不同的部分均采用了相應(yīng)的符號(hào)進(jìn)行標(biāo)記2。在轉(zhuǎn)寫完成之后,我們還會(huì)對(duì)轉(zhuǎn)寫后的語料進(jìn)行多次交叉校對(duì),以確保最大限度地還原口語語料的真實(shí)面貌。

(四)語料的共享性

依靠個(gè)人或某個(gè)機(jī)構(gòu)的力量很難把中介語語料庫迅速擴(kuò)大,最好的方法是實(shí)現(xiàn)各校合作與資源共享。這就需要有統(tǒng)一可行的建庫規(guī)范,如統(tǒng)一的采集、編排和標(biāo)注的原則,同時(shí)要有一致的文本外標(biāo)記(屬性標(biāo)記),可供使用者根據(jù)不同需要“提取各類不同文本的集合或交集、并集來進(jìn)行研究”(張普,2003)。因此,為了實(shí)現(xiàn)語料的共享,也為了滿足研究者的需求,使費(fèi)時(shí)費(fèi)力收集來的語料為更多的研究者所用,“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”的建設(shè)主要采用了當(dāng)前剛建成的、規(guī)模最大的“全球漢語中介語語料庫”的標(biāo)注規(guī)范。并且,“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”在建庫之初即就語料庫的檢索需求與技術(shù)人員充分溝通,在語料庫建庫專家的指導(dǎo)下,確定本庫檢索平臺(tái)的開發(fā)要求,開發(fā)出簡單、實(shí)用、具備用戶友好性的檢索平臺(tái),以滿足研究者的多種檢索需求,方便其使用。擬建設(shè)開放的語料庫建設(shè)與使用平臺(tái),除滿足一般的檢索需求外,還結(jié)合本語料庫語料追蹤性的獨(dú)特之處,特設(shè)按照語料代碼檢索,以便于研究者進(jìn)行縱向追蹤性的研究。并且,由于該庫與“全球漢語中介語語料庫”的標(biāo)注體系相同,因此,研究者還可以根據(jù)需求,提取“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”語料和“全球漢語中介語語料庫”中的非漢語繼承語者語料,并集進(jìn)行研究。

(五)語料的可比性

中華文化語言本科學(xué)歷班中的學(xué)生包含母語為東干語的學(xué)生,也包含母語為學(xué)生所在國官方語言(如哈薩克語、吉爾吉斯語、烏茲別克語等)的學(xué)生,但由于這些學(xué)生所在國家的官方語言之一是俄語,因此幾乎所有學(xué)生都會(huì)俄語。他們產(chǎn)出的語料既包括口語語料,也包括書面語語料;既包括漢語繼承語學(xué)習(xí)者的語料,也包括非漢語繼承語學(xué)習(xí)者的語料。也就是說,這些語料既包含東干語母語背景的留學(xué)生的語料,也包含俄語背景的留學(xué)生的語料。語料產(chǎn)出者的學(xué)習(xí)環(huán)境完全相同,因此具有很好的對(duì)比性,可以為漢語繼承語者與非漢語繼承語者的對(duì)比研究、相同學(xué)習(xí)者不同縱向發(fā)展階段的中介語比較、學(xué)習(xí)者口語與書面語語料比較以及雙語及多語者的漢語習(xí)得研究提供堅(jiān)實(shí)的語料基礎(chǔ)。以上種種對(duì)比研究屬于近些年為了克服偏誤分析的局限而興起的“中介語對(duì)比分析理論”的研究范疇。“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”使得研究者在較易獲得的漢語母語者語料庫及東干語語料庫3的基礎(chǔ)上,還可以實(shí)現(xiàn)中介語、目標(biāo)語和學(xué)習(xí)者母語的比較等,為對(duì)中亞漢語繼承語者的漢語習(xí)得全貌進(jìn)行綜合考察提供了便利。

(六)語料的平衡性

在進(jìn)行對(duì)比研究時(shí),需要考慮各階段語料的平衡、各類型(書面語、口語)語料的平衡、各文體語料的平衡、各性別語料的平衡等。在建庫過程中,我們考慮到了產(chǎn)出者水平、母語背景、性別、口語語料與書面語語料等方面的平衡。但是由于語料收集的現(xiàn)實(shí)原因,不同水平語料及口語語料與書面語語料的平衡可以盡力保證,而產(chǎn)出者母語背景及男女比例方面的平衡未盡如人意,主要原因在于中華語言文化本科班招收的主要是東干留學(xué)生,但是也有少量非東干學(xué)生,因此,基于中華文化語言本科學(xué)歷班收集的語料無法做到產(chǎn)出者母語背景的完全平衡。同時(shí),由于中亞東干人普遍結(jié)婚較早,尤其是女性(平均結(jié)婚年齡在18—19歲)(李建軍等,2015),因此班里的女生較少,無法做到產(chǎn)出者性別方面的平衡。理論上說,語料越平衡越好,但在具體建庫實(shí)踐中,很難做到各方面的全方位平衡。所以,“因地制宜地進(jìn)行局部的有代表性的語料收集和建設(shè)也許有其不可替代的價(jià)值,也是必要而可行的”(顏明、肖奚強(qiáng),2017)。該語料庫在水平階段的平衡控制較好:即初級(jí)、中級(jí)、高級(jí)階段(每個(gè)階段內(nèi)部還有進(jìn)一步的水平劃分)產(chǎn)出者的數(shù)量基本平衡,使語料保持了很好的連續(xù)性,這就為不同階段的語言習(xí)得發(fā)展趨勢研究提供了語料,也方便開展對(duì)個(gè)案語言習(xí)得的追蹤研究。

四、基于需求的漢語繼承語學(xué)習(xí)者語料庫建設(shè)中遇到的問題

(一)疫情造成語料收集困難

2020年爆發(fā)的新冠疫情導(dǎo)致不少留學(xué)生教學(xué)項(xiàng)目受到極大影響,中華語言文化本科學(xué)歷班也不例外。雖然學(xué)校及學(xué)院采取了各種措施鼓勵(lì)學(xué)生線上繼續(xù)學(xué)習(xí),但是由于學(xué)生的生活壓力4、網(wǎng)絡(luò)質(zhì)量差5以及網(wǎng)絡(luò)教學(xué)效果不佳等現(xiàn)實(shí)問題,生源流失嚴(yán)重,語料收集遇到極大困難。巧婦難為無米之炊,這也是我們?cè)诮◣爝^程中遇到的最大困難。不過,疫情終將過去,留學(xué)生也終會(huì)入校學(xué)習(xí),相信假以時(shí)日,這一問題可以得到解決。

(二)語料平衡性考慮中遇到的問題

在收集語料的過程中,初級(jí)階段的學(xué)生成段表達(dá)有困難,只能產(chǎn)出一些造句語料,且語料數(shù)量較少。因此,雖然初級(jí)、中級(jí)、高級(jí)階段的語料產(chǎn)出者數(shù)量基本相當(dāng),但是由于初級(jí)語料較少,導(dǎo)致初級(jí)、中級(jí)、高級(jí)階段語料的數(shù)量并不平衡。針對(duì)這一問題,我們計(jì)劃在新生入學(xué)后,加強(qiáng)對(duì)初級(jí)階段學(xué)生的語料收集頻率,以縮小初級(jí)階段語料與中級(jí)、高級(jí)階段語料的數(shù)量差距。不過,這樣會(huì)造成部分初級(jí)階段語料的產(chǎn)出者沒有相應(yīng)的中高級(jí)階段語料,因而無法對(duì)這部分語料的產(chǎn)出者進(jìn)行追蹤性研究。

(三)語料追蹤性考慮中遇到的問題

追蹤性書面語語料的收集相較于追蹤性口語語料較為簡便。主要原因在于,教學(xué)計(jì)劃中開設(shè)“漢字讀寫”“中級(jí)漢語寫作”“高級(jí)漢語寫作”等課程,學(xué)生每周都會(huì)有作品產(chǎn)出,追蹤性書面語語料的收集比較方便。而口語語料的產(chǎn)出則沒有這么規(guī)律,只有在期中、期末考試時(shí)才方便專門收集,雖然語料會(huì)從一年級(jí)一直延續(xù)到四年級(jí),但由于產(chǎn)出數(shù)量少,追蹤性口語語料收集效果不太理想。為了解決這一問題,我們計(jì)劃發(fā)揮本專業(yè)本科生及研究生的力量,在雙方自愿的情況下,為中外學(xué)生牽線搭橋,提供“一對(duì)一”的語伴服務(wù),要求雙方每周至少進(jìn)行一次與學(xué)生生活密切相關(guān)的、各語伴小組間的話題具有很強(qiáng)相似性的語言交流,并要求中國學(xué)生在交流的同時(shí)錄音且定期上交錄音材料,從而解決追蹤性口語語料不易收集的問題。

(四)語料比較性考慮中遇到的問題

文秋芳(2009)認(rèn)為:“影響跟蹤研究效度的最大問題就是多次收集數(shù)據(jù)的可比性。影響可比性的困難有兩個(gè):一是每兩次收集數(shù)據(jù)的間隔期可能不等,二是兩次收集數(shù)據(jù)所采用的方法與任務(wù)不盡相同。”為了確?;诒菊Z料庫追蹤性研究的效度,保證多次收集數(shù)據(jù)的可比性,在語料的同質(zhì)性方面,我們所收集語料的產(chǎn)出者在培養(yǎng)方案、課程設(shè)置、年齡、學(xué)習(xí)環(huán)境、所用教材、教學(xué)方法、語言環(huán)境方面均有很高的同質(zhì)性,且兩次語料收集的間隔基本一致,采用的也均是與學(xué)生生活密切相關(guān)的話題。但即便如此,我們?nèi)耘f不敢肯定學(xué)生漢語的變化是否會(huì)受到不同話題的影響。

五、結(jié)語

由于繼承語理論的興起,國內(nèi)外亟須建設(shè)漢語繼承語學(xué)習(xí)者語料庫。為滿足這一需求,我們從“中亞地區(qū)漢語繼承語學(xué)習(xí)者語料庫”建設(shè)的必要性,語料的追蹤性、同質(zhì)性、真實(shí)性、共享性、可比性以及平衡性等方面進(jìn)行了探討,并就建庫實(shí)踐過程中遇到的問題及解決辦法進(jìn)行了分析。但是,由于受到疫情的影響,中華文化語言本科學(xué)歷班學(xué)生無法來到中國學(xué)習(xí)、線上教學(xué)效果不佳及學(xué)生生活的現(xiàn)實(shí)需要等原因?qū)е律戳魇?yán)重,語料收集困難,這也成為我們建庫過程中的最大困難。

附注

1 數(shù)學(xué)概念,給定兩個(gè)集合A、B,把他們所有的元素合并在一起組成的集合,叫作集合A與集合B的并集。這里指將不同的語料庫中的語料合并起來。

2 這部分的標(biāo)記代碼采用了與“全球漢語中介語語料庫”相同的代碼,以方便對(duì)兩個(gè)庫語料進(jìn)行并集研究。

3 該庫由西北師范大學(xué)武和平教授團(tuán)隊(duì)研發(fā),作者本人也參與其中,目前已投入使用,網(wǎng)址為:http://114.251.154.212/cqp/dungan/。

4 中華語言文化本科學(xué)歷班學(xué)生大多居住在農(nóng)村,在東干人的觀念中,19歲左右的男孩子已經(jīng)被視為家里的勞動(dòng)力,需要出去賺錢養(yǎng)家。

5 中華語言文化本科學(xué)歷班學(xué)生大多居住在農(nóng)村,網(wǎng)費(fèi)較貴且網(wǎng)絡(luò)質(zhì)量較差,有的學(xué)生為了完成畢業(yè)論文答辯,甚至專門開車尋找信號(hào)較好的區(qū)域。

猜你喜歡
同質(zhì)性語料母語
母語
草原歌聲(2020年3期)2021-01-18 06:52:02
母語
草原歌聲(2017年3期)2017-04-23 05:13:47
基于同質(zhì)性審視的高職應(yīng)用型本科工程教育研究
職教論壇(2017年4期)2017-03-13 16:43:19
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
理性程度的異質(zhì)性:基于理論與實(shí)踐的考察
我有祖國,我有母語
《苗防備覽》中的湘西語料
高等工程教育與高等職業(yè)教育的同質(zhì)性
國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
那曲县| 霞浦县| 桂东县| 宾川县| 永定县| 和田县| 林甸县| 将乐县| 丽江市| 桃园市| 沙田区| 赤城县| 东平县| 永城市| 临沂市| 石狮市| 微山县| 张家港市| 宁乡县| 垦利县| 怀化市| 龙井市| 庆城县| 丰都县| 松阳县| 永靖县| 通化县| 澄城县| 樟树市| 双流县| 鄂温| 罗田县| 阜康市| 虹口区| 无为县| 衢州市| 盐津县| 曲靖市| 崇阳县| 香河县| 荃湾区|