国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢語口語中介語語料庫建設中的兩個關鍵問題

2020-01-19 20:37:23劉運同
華文教學與研究 2020年1期
關鍵詞:書面語語料語料庫

劉運同

(同濟大學國際文化交流學院,上海200092)

0.引言

在漢語中介語語料庫建設方面,口語語料庫的建設相對滯后,這是一個不爭的事實。本文首先對口語中介語語料庫建設滯后的原因進行探討,然后對口語語料庫建設中的語料選取及語料轉寫兩個關鍵問題進行剖析,以期促進漢語口語中介語語料庫建設的理論探索和爭鳴。

1.漢語口語中介語語料庫建設滯后的原因

無論從世界范圍還是從中國范圍來看,口語語料的建設都相對落后于書面語語料庫的建設。根據(jù)2015年的一份資料,全球范圍內大約有140多個中介語語料庫,但其中只有38個是口語中介語語料庫(Ballier & Martin,2015:107)。在漢語中介語語料庫建設方面,劉運同(2013:99)指出,漢語中介語語料庫建設中“比較突出的問題是書面語語料庫與口語語料庫的發(fā)展不平衡,口語語料庫建設嚴重滯后”。目前還沒有大型的口語中介語語料庫供研究者使用,只有個別學校建設的小型口語中介語語料庫被研究者報告或提及,如香港中文大學和蘇州大學建設的專門的口語語料庫(周文華、肖奚強,2011:1),暨南大學華文學院的留學生口語語料庫①根據(jù)介紹,華裔學習者口語主要采集學習華語的華裔留學生的日常對話、課堂口語和錄音室錄音,約50萬字。華裔學生以暨南大學華文學院的學生為主,兼及其他高校的華裔學生,以及海外華文學習者(http://www.languagetech.cn/corpus/huayu/spoken.aspx)。,臺灣師范大學華語中介語口語語料庫等②對此語料庫的說明,詳見方淑華、網(wǎng)瓊淑、陳浩然(2013)。。

關于口語語料庫建設滯后的原因,研究者也做了實事求是的說明。楊翼等(2006)指出,口語語料庫建設的難點在于:(1)口語語料難以收集;(2)口語語料難以轉寫:(3)口語語料難以標注;(4)口語語料難以保存和分析。但是我們認為,除此之外還有一個重要的原因未被提及,那就是在一些研究者心目中仍然存在著重視書面語輕視口語的傾向。換句話說,在語言研究領域,人們對口語的重要性的認識仍舊不足。

口語的第一性雖然早由結構主義語言學確立,研究者包括教育工作者對書面語的重視與對口語的輕視并沒有隨之改變。Linell(2005)把這種重文輕語的傾向稱為“書面語偏見(the written language bias)”,并指出它不僅存在于語言研究領域,也擴展到社會文化的各個領域。書面語偏見在中國也不同程度地存在。在語言研究領域,一些研究者對口語和書面語的區(qū)別不重視,用書面語的標準來要求口語。劉運同(2015)研究了口語中“就是說”的用法,發(fā)現(xiàn)“就是說”除了具有解釋說明的功能之外,還具有兩個口語特有的功能,那就是用來標示會話補救的開端以及充當填充詞語。該研究還提到,對于“就是說”的這種功能及其評價,研究者的態(tài)度卻存在差異。徐志紅(2003)研究了電視訪談節(jié)目中“就是”和“就是說”的使用,認為一些“就是”或者“就是說”是一種“贅言”,并認為,“贅言不是語言成分,不屬于修辭手法,不能增加語言的美感和表現(xiàn)力,相反會造成交流中的困難甚至誤解?!弊屑氂^察徐文的例子(有關“就是說”的),可以發(fā)現(xiàn)它們大都是口語表達。在這些話語中,“就是說”的功能是充當填充詞語,但是我們不能說填充詞語就是“贅語”。我們知道,口語中出現(xiàn)填充詞語是一種正常的現(xiàn)象。我們在分析口語時,不能按照書面語的標準來要求口語。如果按照書面語的標準,(1a)應該改成“我2000年最快樂的事是出了新專輯,我非常感激這些年來關心支持我的廣大觀眾”。這樣改固然是正確了,但是也就不是口語了。按照我們的分析,出現(xiàn)在這個例子中的“就是說”“就是”都是填充詞語,都是為了爭取更多的時間計劃安排下面的話語而出現(xiàn)的,因此它們出現(xiàn)的位置也不是偶然的,即出現(xiàn)在主謂之間或者動賓之間。我們認為,研究者切不可用書面語的標準來要求口語的使用,口語中的一些現(xiàn)象應該放在口語的框架中給予客觀的研究和評價。

(1)a.在2001年最快樂的事就是說我出了新專輯。我非常地感激就是這些年來對我關心支持的廣大觀眾。(2)

b.在這個行當里,我覺得就是說大家都變得比較浮躁。(4)

c.我感覺就是說今天歌手的水平相當高。(5)

d.《東方紅》我們演了一年多,受到了就是說觀眾的熱烈歡迎,演員也感到常演常新。(6)

e.我們好長時間也就是說見不到就是說文藝演出,這一次《燕山情》演出……(7)

f.剛才好多同志就是說談到了反盜版的建議。(10)

g.今天就是說上海體育館里坐滿了觀眾。(11)

h.不知道你注意到?jīng)]有,就是說每一項科學技術都會和生活有許多聯(lián)系。(13)

i.我有一個問題,就是說問王濤,你和瓦爾德內爾交手這么多年……(15)(徐志紅,2003)

在漢語作為外語教學領域也存在用書面語標準要求口語的問題。劉運同(2018)對口語評價中的重要概念流利度進行評論時指出,流利度的概念雖然對衡量學習者的口語水平很重要,但其背后的理論假設需要審慎評估。在漢語作為外語或第二語言教學領域,對口語的評價要客觀可行,要區(qū)別正常的言語管理與不正常的非流利現(xiàn)象。僅僅采用定量的標準可能扭曲被評者或學習者的口語能力。金霞(2011)在一項關于二語口語廣度測試及其對口語流利度的預測能力的研究中提到,“停頓是分析口語流利性的關鍵”。在他們的研究中,利用7項時間性指標來衡量口語的流利度,停頓被界定為發(fā)生于句內或句間的0.3秒及以上的間歇,包括0.3秒及以上的有填充和無填充停頓。會話分析對停頓現(xiàn)象的研究表明,出現(xiàn)在話語中不同位置的停頓往往是出于不同的目的,而不同目的跟一個停頓的絕對長度并沒有關聯(lián)。根據(jù)Sacks等(1974)對話輪轉換系統(tǒng)的經(jīng)典研究,會話中的停頓可以進一步分為:(1)話輪沉默或可歸屬沉默(turn silence or attributable silence),指應用了話輪轉換規(guī)則中的第一條規(guī)則后出現(xiàn)的沉默,例如被提問,卻不予回答;(2)空隔(gap),指當前發(fā)話人結束話輪但未選定下一個發(fā)話人時,其他人自選或無人自選當前發(fā)話人繼續(xù)自己的話輪之前的停頓;(3)間斷(lapse),指沒有應用話輪轉換規(guī)則中的任一規(guī)則產(chǎn)生的停頓。此外還有發(fā)生在發(fā)話人話輪內的停頓。會話分析學者所關注的并不是停頓的絕對長短,而是它們對交際的價值(劉運同,2007)。此外,如對口語交流中大量存在的重復、修正現(xiàn)象如何科學地進行界定,而不是單純地看作是消極的、需要排除的因素。如果研究者無法對口語交流中的這些重要因素做出客觀的界定,流利度的概念就是一個建立在不可靠的理論假設上的概念,對客觀衡量交際者的語言能力無法提供切實的幫助。

無論是有意無意地按照書面語地標準來進行口語研究,還是對口語中一些重要因素不加研究就進行排除,種種情形都說明,研究者仍然不同程度地受到書面語偏見的影響。我們認為,這種研究偏見也在有意無意之間影響了對口語語料庫建設的研究及建設本身。

2.漢語口語中介語語料庫建設的語料選擇

一個完整的中介語語料庫應該同時包含口語語料和書面語語料,這一點很多研究者都明確提出過。周文華、肖奚強(2011:6)在對首屆漢語中介語語料庫建設與應用國際學術討論會進行綜述時指出,“中介語語料庫分為口頭表達和作文語料。目前各校所建的中介語語料庫多為作文語料庫,進一步的工作應該是建立外國留學生分級別的口語語料庫,在此基礎上進行的口語中介語研究將與現(xiàn)有的基于作文語料的研究成果相互驗證、相互補充,從不同的角度說明漢語中介語的習得狀況?!焙渭眩?018)也通過對比中日不同語料庫,對語料庫的語料采集提出了有益的建議,如同一學習者的口語和書面語語料同時采集等等。無論是把口語語料作為一個完整的漢語中介語語料庫的一個部分,還是建立獨立的漢語口語中介語語料庫,口語語料庫的采集都是十分重要的一項工作。

劉運同(2013)對當前口語中介語語料庫的語料收集方式進行了系統(tǒng)的總結和評論,并對口語中介語語料收集及口語中介語語料庫建設提出了建議。根據(jù)文獻提供的信息可以發(fā)現(xiàn),當前的口語語料庫語料來源主要有四個:(1)標準化考試語料;(2)口語評測語料;(3)課堂錄音錄像;(4)學習者的語言使用語料。

語料庫建設者必須明了,其實每種語料都帶有自身的優(yōu)勢和缺陷。由于學習者的中介語語料很難收集,一些語料庫就利用標準化外語考試中的語料來建設學習者中介語語料庫。例如“中國學習者英語口語語料庫”(COLSEC)的語料來源主要是全國大學英語四、六級口語考試的實景錄像資料。口語考試包括三種類型:教師——學生型晤談;學生——學生型自由討論;教師——學生型討論(楊慧中、衛(wèi)乃興,2005)。又如新HSK口試(高級)分三部分,共6題。第一部分,共3題。每題播放一段話,考生聽后復述。第二部分,共1題。試卷上提供一段文字,考生朗讀。第三部分,共2題。試卷上提供兩個問題,考生讀后回答問題①見http://www.chinesetesting.cn/gosign.do?id=1 & lid=0#。。以標準化考試語料為基礎來建設口語中介語語料庫可以看作是建設口語語料庫的一條捷徑,它省卻了前期語料收集的煩難手續(xù),并且語料規(guī)模大,后續(xù)語料有保證;同時語料包含了豐富的考生信息,便于進行對比研究。但是這類語料也存在明顯的缺陷。首先,考試語境中的話語是一種受控話語,不是自由話語。僅僅以此為依據(jù)來衡量學習者的語言使用能力可能會出現(xiàn)以偏概全的問題。其次,考試語境中的話語類型也過于單一,無法全面衡量學習者真實的語言能力。如“中國學習者英語口語語料庫”的考題類型以教師和學生的問答和討論為主,受試者的表現(xiàn)很容易受到教師或者其他受試者的影響。我們認為,以朗讀和回答問題為主要題型的口語考試忽視了口語交流的交互特征,缺乏對話輪轉換、會話策略等內容的考查,難以對學習者的口語能力進行全面而準確的鑒定和評價②有些口語語料庫以考察學習者的語音面貌為目標,主要采用朗讀或者讀句子或詞表的形式來收集語料。也許對這類語料庫而言,朗讀作為一種主要的語料來源是可以接受的。但如果以考察學習者的語言能力為目標,以朗讀材料作為語料來源存在較大爭議。。另外,由于考試語料的性質,該類語料更適合橫向比較研究,而弱于縱向比較研究,因此對于考查學習者中介語的發(fā)展過程也顯得力不從心。

以平時的口語測試材料為語料也同樣面臨一些問題。由于口語課教授方式及教學理念的不同,在不同的學校口語成績的評測也存在百花齊放的局面。如果以口語課成績評測語料為基礎來建立口語語料庫,我們馬上面臨選擇的問題。是否應該把各種題型的口語語料都收錄到語料庫中?還是選擇一部分?選擇的標準是什么?另外,如何評定學生的口語水平?依據(jù)什么標準?不同教師、不同班級、不同學校的口語成績如何進行比較?

周寶芯(2011)曾介紹南京師范大學正在建設國內首個多模態(tài)中介語語料庫,它以課堂教學的錄音錄像為主要語料,真實地還原中介語產(chǎn)生的場景。雖然課堂教學活動的研究對描述學習者中介語的發(fā)展過程是十分重要的,但是由于教學活動的復雜性,既有教師的講授,也有機械練習階段,還有交際練習階段,不同的課型還存在不同的教法,因此把課堂教學過程作為語料來建設學習者中介語語料庫,也必然存在一個語料分類和選擇的問題。此外,多模態(tài)的語料庫還存在兼容或者擴容的問題。

對于收集真實的口語交流語料,目前尚沒有看到有關報道。但是根據(jù)中介語語料庫的性質,最基礎的語料當然應該取自學習者本身使用語言的錄音或錄像資料??筛鶕?jù)普通口語語料庫的建設模式,分門別類地收集學習者學習和使用漢語的各種語料。包括學習者跟漢語母語者的交往語料,也要包括學習者跟其他學習者使用漢語交往的語料。雖然按照這種方式收集口語語料的成本巨大,但是為了建設真正的漢語學習者口語語料庫,為了使建成的漢語中介語口語語料庫能真正反映學習者的目的語使用能力,下大力氣收集學習者自然環(huán)境中使用漢語的各種語料是必不可少的。即使不能完全以此類語料來建設學習者漢語中介語語料庫,至少應該在語料庫中包含一部分學習者正常使用漢語交流的語料。按照學習者的需求,真實的口頭交流語料應該包括三個小類:(1)與日常生活有關的口語交流;(2)與學習有關的口語交流;(3)與工作場合相關的口語交流。

語料庫的優(yōu)勢在于能夠提供大量可靠的數(shù)據(jù)幫助研究者進行相關的研究,避免由于證據(jù)不足或者代表性不理想而影響結論的可靠性。因此,在語料庫建設過程中,語料的選擇是十分關鍵的一步。語料選擇包括兩個方面,一個是數(shù)量,一個是質量。相對而言,我們認為,語料的質量更為重要。中介語語料庫是一種特殊的語料庫,它的語料來自學習者在掌握目的語的過程中產(chǎn)生的中介語。這種中介語的一個重要特點就是它不是固定不變的,而是處于發(fā)展變化過程。因此中介語語料與普通的口語語料既有相同點又有不同點,一個重要的不同就是中介語語料必須包含學習者不同階段的語料,以便于研究中介語的發(fā)展過程。為了獲得真實可靠的中介語語料,對不同類型的學習者在不同階段產(chǎn)生的中介語都應該按照一定的比例收錄在語料庫中。為了全面了解學習者口語的發(fā)展,應對不同階段學習者的口語表達進行系統(tǒng)地收集,同時盡量做到語料形式的統(tǒng)一,以利于比較研究。在語料收集過程中,除了可以利用口語課評測以及標準化考試收集的語料以外,學習者在課堂上的學習和練習材料也可以收集起來作為補充。但歸根結底應該系統(tǒng)收集學習者在課堂之外實際使用漢語進行交際的語料,作為考查學習者口語發(fā)展的重要語料。

3.漢語口語中介語語料庫建設中的語料轉寫

口語中介語語料庫建設的難點之一是口語語料轉寫難。在對口語進行研究時,必須進行一項無奈的工作,就是把口語轉寫成書面形式。研究者已經(jīng)設計出不同的轉寫系統(tǒng)來幫助人們進行口語轉寫和研究。在對口語話語進行轉寫時,有四種轉寫系統(tǒng)比較常用,它們是Bois的 Discourse Transcription(TD),Konrad Ehlich的H IAT,會話分析(CA)傳統(tǒng)的轉寫系統(tǒng),以及Brian MacWhinney的CHAT(Codes for the Human Analysis of Transcripts)(劉運同,2016)。不同的口語轉寫系統(tǒng)在分類和符號的選擇上存在很大的差異。并且雖然已經(jīng)有一些成熟的轉寫系統(tǒng)存在,但是不斷有新的轉寫系統(tǒng)被設計出來。因此可以說,并不存在放之四海而皆“宜”的轉寫系統(tǒng)。不同的研究目的需要不同的轉寫系統(tǒng)。

在對中介語口語進行轉寫時,第一步是確立一個轉寫口語語料的最低分類清單。這個清單來自兩個方面的內容,第一類包括普通口語本身的特征;第二類是學習者的中介語特征,如影響發(fā)話人語言表達的語音特征,不同于母語者的停頓,語碼轉換等等。

第一類特征的選取可以借鑒現(xiàn)有的口語轉寫系統(tǒng),例如會話分析(CA)所采用的轉寫系統(tǒng)。它是會話分析學派的共同語言,也成為其他研究口語交流現(xiàn)象的研究者借鑒的對象。這一系統(tǒng)也是逐步完善的,研究者可以根據(jù)自己的研究目的增加新的因素。例如,Charles Goodwin及其學生研究的對象是人們交往中目光注視等非語言因素,他們轉寫的語料除了人們的話語之外,增加了人們交談時目光、手勢的使用。會話分析的轉寫系統(tǒng)關注的是會話活動中的一些重要因素,如話輪之間的順序等等。Hutchby & Woffitt(1999)認為會話分析學者所關注的內容可以歸納為兩類:一是有關話輪轉換的因素,如話輪的開端、結束,話輪交疊,停頓等等;二是話語發(fā)出時的特點,如重音、語調、清晰或含糊等等。

對第二類內容的選擇和確定必須建立在中介語學習理論和相應的研究基礎之上,才能捕捉到學習者中介語的一些特殊表現(xiàn),并在語料轉寫中給予充分的重視和系統(tǒng)的標注。例如初級的漢語學習者由于漢語知識的缺乏,會掌握不好漢語句子的節(jié)奏,使用一種幾乎平均分割的方式來讀或者說漢語句子,把“她-愛上-漢語-了”說成“她-愛-上-漢-語-了”。

由于口語語料轉寫費事費力,在具體操作時可以借鑒一些語料庫轉寫系統(tǒng)的層級性設計,對轉寫語料進行不同“精細度”的轉寫,如“HIAT”系統(tǒng)和“DT”轉寫系統(tǒng)都分為基礎與擴展,或寬式和嚴式轉寫。

在設計中介語口語語料庫時,另外一個重要的問題是系統(tǒng)的開放性和計算機技術的應用。因為口語語料轉寫是十分繁雜的工作,因此不可能在很短時間內或者靠某一個研究單位完成。因為在設計系統(tǒng)時要重視系統(tǒng)的開放性,以便研究者不斷補充語料,對系統(tǒng)進行擴展和完善,所以口語語料庫的轉寫系統(tǒng)一定要考慮通用性和兼容性,可以與其他的語料庫歸并。同時還有考慮易學易用,讓普通的研究者也可以參與。在口語語料庫建設中,僅僅靠人工勞動是難以完成的。在語料庫建設及轉寫系統(tǒng)設計時,還有充分利用計算機在口語轉寫和存儲、加工等方面的優(yōu)勢,采用人-機結合的方式來提高語料的轉寫的速度和準確度,以便建設高質高效的口語語料庫。

研究者早已經(jīng)指出,語料轉寫的一些原則之間有時候是互相矛盾的,不可能同時兼顧的,如系統(tǒng)性和可讀性、簡易性等。因此一個語料轉寫系統(tǒng)的設計總是理論性和實踐性之間尋求合理的折中,在可行性的基礎上,最大可能提供更多的信息,以利于使用者的研究。

4.結語

口語語料庫建設是一項費時費力的浩大工程,需要精心的設計和實施,但是其背后也需要堅實的理論作為支撐。本文的主要的觀點就是口語中介語語料庫建設滯后,固然有缺乏資金支持等現(xiàn)實原因,但學界對口語及口語語料庫建設的理論問題缺乏深入的探索,也在一定程度上制約了口語語料庫建設的發(fā)展??谡Z具有的獨特特征是什么?口語中介語的特點又是什么?對于漢語口語中介語語料庫而言,什么才是最能體現(xiàn)學習者語言能力的語料?如何把口語的一些鮮明特征用書面形式在計算機上儲存標識出來?研究者需要花大力氣對這些關鍵問題進行研究,才能為口語中介語語料庫建設提供堅實可靠的理論支持。

猜你喜歡
書面語語料語料庫
語文課重點教的是書面語
新校園(2023年10期)2023-12-02 07:53:41
《語料庫翻譯文體學》評介
“口語和書面語轉換”備考指導
關于初中學生書面語感的思考與提升策略
漢語書面語與口語的特征
把課文的優(yōu)美表達存進語料庫
基于語料調查的“連……都(也)……”出現(xiàn)的語義背景分析
華語電影作為真實語料在翻譯教學中的應用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
《苗防備覽》中的湘西語料
大同县| 碌曲县| 茶陵县| 南部县| 郴州市| 承德县| 安多县| 黄骅市| 迭部县| 灌南县| 越西县| 同江市| 新丰县| 丁青县| 安国市| 通辽市| 建湖县| 望城县| 霍邱县| 桑植县| 宁德市| 合肥市| 讷河市| 阿克| 乐至县| 商城县| 洪洞县| 崇文区| 西乌珠穆沁旗| 台州市| 堆龙德庆县| 雷波县| 珲春市| 呼图壁县| 桃源县| 会东县| 环江| 庆安县| 庐江县| 肥东县| 马鞍山市|