劉運(yùn)同 同濟(jì)大學(xué)國(guó)際文化交流學(xué)院
提 要 在漢語(yǔ)口語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)建設(shè)中,口語(yǔ)語(yǔ)料的收集和加工(特別是轉(zhuǎn)寫(xiě))是一項(xiàng)重要的挑戰(zhàn)。本文對(duì)口語(yǔ)轉(zhuǎn)寫(xiě)的幾個(gè)關(guān)鍵問(wèn)題進(jìn)行了討論,并提供了可行的建議。這些問(wèn)題包括:①轉(zhuǎn)寫(xiě)的基本單位,②轉(zhuǎn)寫(xiě)的主要內(nèi)容,③標(biāo)點(diǎn)符號(hào)的使用,④基本的轉(zhuǎn)寫(xiě)策略。
無(wú)論從世界范圍還是從中國(guó)范圍來(lái)看,口語(yǔ)語(yǔ)料的建設(shè)都落后于書(shū)面語(yǔ)語(yǔ)料庫(kù)的建設(shè)。這是因?yàn)橄鄬?duì)于書(shū)面語(yǔ)語(yǔ)料來(lái)說(shuō),口語(yǔ)語(yǔ)料在收集和加工方面都存在更大的挑戰(zhàn)。口語(yǔ)使用語(yǔ)音媒介作為交流手段,因此要對(duì)口語(yǔ)語(yǔ)料進(jìn)行收集和加工,跟書(shū)面語(yǔ)相比就多了一道程序,即首先采用一種合適的方法來(lái)記錄和保存口頭交流內(nèi)容。用書(shū)面形式來(lái)記錄和保存口語(yǔ)語(yǔ)料是一種無(wú)奈的選擇,對(duì)語(yǔ)言研究來(lái)說(shuō)也是一種新的挑戰(zhàn)(傳統(tǒng)的語(yǔ)言研究由于傾向于使用書(shū)面語(yǔ)作為研究材料,總體來(lái)說(shuō)此問(wèn)題未顯現(xiàn))。
語(yǔ)料庫(kù)是按照特定目標(biāo)收集的語(yǔ)言數(shù)據(jù)。目前,語(yǔ)料庫(kù)的規(guī)模越來(lái)越大,對(duì)語(yǔ)料庫(kù)數(shù)據(jù)準(zhǔn)確性的要求也越來(lái)越高。這個(gè)要求對(duì)中介語(yǔ)語(yǔ)料庫(kù)建設(shè)提出了新的挑戰(zhàn),對(duì)口語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)建設(shè)尤其如此。因?yàn)榭谡Z(yǔ)中介語(yǔ)語(yǔ)料庫(kù)多了轉(zhuǎn)寫(xiě)的程序,轉(zhuǎn)寫(xiě)的質(zhì)量在很大程度上決定了中介語(yǔ)語(yǔ)料的質(zhì)量,決定了語(yǔ)料庫(kù)的質(zhì)量。Weisser(2018)通過(guò)重新轉(zhuǎn)寫(xiě),發(fā)現(xiàn)BNC(British National Corpus)的語(yǔ)料轉(zhuǎn)寫(xiě)存在一些錯(cuò)誤。如一些轉(zhuǎn)寫(xiě)者由于粗心,把 “you’re off the hook”轉(zhuǎn)寫(xiě)成了“your off the hook”。如果依個(gè)例為代表進(jìn)行推算,Weisser估計(jì)BNC的錯(cuò)誤率將高達(dá)8.5%。并且這個(gè)轉(zhuǎn)寫(xiě)錯(cuò)誤還將導(dǎo)致其他的問(wèn)題,如詞頻統(tǒng)計(jì)問(wèn)題,語(yǔ)法分析問(wèn)題(“your off the hook”成了一種錯(cuò)誤的表達(dá),或可能被標(biāo)注為與上下文無(wú)關(guān)的碎片,即fragment)。
本文將主要討論漢語(yǔ)口語(yǔ)中介語(yǔ)語(yǔ)料轉(zhuǎn)寫(xiě)中的一些重要問(wèn)題,包括:①轉(zhuǎn)寫(xiě)的基本單位,②轉(zhuǎn)寫(xiě)的主要內(nèi)容,③標(biāo)點(diǎn)符號(hào)的使用,④基本的轉(zhuǎn)寫(xiě)策略。
語(yǔ)料的整理加工涉及語(yǔ)言分析的基本單位問(wèn)題。對(duì)于書(shū)面語(yǔ)來(lái)說(shuō),語(yǔ)言描寫(xiě)和分析的基本單位就是句子。對(duì)于語(yǔ)料庫(kù)語(yǔ)言學(xué)來(lái)說(shuō),甚至可以采用更具操作性的方法來(lái)解決句子的問(wèn)題,那就是根據(jù)句號(hào)(或問(wèn)號(hào)、感嘆號(hào))作為判斷句子的標(biāo)準(zhǔn)(宋柔等,2017)。但是對(duì)于口語(yǔ)語(yǔ)料來(lái)說(shuō),情形有很大的不同。口語(yǔ)就其固有媒介來(lái)說(shuō),并不存在標(biāo)點(diǎn)符號(hào)之類(lèi)的輔助成分。不過(guò)研究者發(fā)現(xiàn),口語(yǔ)表達(dá)也是可以分隔成較小的片段的。在處理口語(yǔ)語(yǔ)料時(shí)研究者面臨的一個(gè)重要問(wèn)題就是:對(duì)于口語(yǔ)來(lái)說(shuō),如何進(jìn)行描寫(xiě)和分析?它的基本單位是什么?是跟書(shū)面語(yǔ)一樣的句子還是其他的單位?
Foster等(2000)回顧了87項(xiàng)涉及口語(yǔ)的研究,發(fā)現(xiàn)過(guò)往的研究者對(duì)口語(yǔ)的基本切分單位提出了眾多的方案,包括:命題(Proposition)、交流單位(C-unit)、表達(dá)單位(Idea Unit);音調(diào)單位(Tone Unit)、語(yǔ)調(diào)單位(Intonation Unit)、小句(Utterance);句子(Sentence)、可終結(jié)單位(T-unit);等等。之所以出現(xiàn)這么多的定義,是因?yàn)檠芯空邔?duì)口語(yǔ)中基本單位的認(rèn)知不同,采用的標(biāo)準(zhǔn)不同,如語(yǔ)義的、語(yǔ)法的、韻律的。有時(shí)甚至同時(shí)混用不同的標(biāo)準(zhǔn),如語(yǔ)義標(biāo)準(zhǔn)無(wú)法解決問(wèn)題時(shí)轉(zhuǎn)向語(yǔ)法標(biāo)準(zhǔn)。雖然研究者提出的各種定義有其本身的合理性,但眾多的定義顯然造成了一個(gè)無(wú)法克服的后果,就是人們無(wú)法對(duì)采用不同定義的研究結(jié)果進(jìn)行比較。
目前,越來(lái)越多的研究者認(rèn)為,在對(duì)口語(yǔ)進(jìn)行切分時(shí),最好先單獨(dú)利用韻律標(biāo)準(zhǔn),找出口語(yǔ)表達(dá)的基本單位,然后再對(duì)韻律單位與語(yǔ)法、語(yǔ)義、功能的關(guān)系進(jìn)行研究。研究者把利用韻律因素劃分出來(lái)的口語(yǔ)基本單位稱(chēng)為語(yǔ)調(diào)單位(Intonation Unit),語(yǔ)調(diào)單位從本質(zhì)上講是一個(gè)聽(tīng)覺(jué)單位。根據(jù)美國(guó)功能語(yǔ)言學(xué)派的觀點(diǎn),原型性的語(yǔ)調(diào)單位具有一個(gè)連貫的語(yǔ)調(diào)拱形,并具有一些明顯的分界特征,如開(kāi)頭部分的加速,結(jié)尾音節(jié)的延長(zhǎng),以及停頓等(Barth-Weingarten,2016)。
有些研究者懷疑語(yǔ)調(diào)單位具有范疇性特點(diǎn),在處理真實(shí)的口語(yǔ)語(yǔ)料面臨模糊的臨界現(xiàn)象時(shí)便無(wú)能為力(Barth-Weingarten,2016)。但多數(shù)研究者認(rèn)為,語(yǔ)調(diào)單位已成為一個(gè)公認(rèn)的口語(yǔ)語(yǔ)篇分析單位,對(duì)口語(yǔ)研究非常重要,并具有很多優(yōu)勢(shì),比如可進(jìn)行跨語(yǔ)言比較等(Tao,1996)。對(duì)語(yǔ)調(diào)單位的探索也影響到語(yǔ)料庫(kù)(特別是包括口語(yǔ)語(yǔ)料的語(yǔ)料庫(kù))的建設(shè)和標(biāo)注,例如20世紀(jì)80年代前完成的London-Lund Corpus對(duì)其中的口語(yǔ)語(yǔ)料進(jìn)行了韻律標(biāo)注,在每一個(gè)音調(diào)單位(Tone Unit,英國(guó)學(xué)派的術(shù)語(yǔ),與Intonation Unit同義)后面插入一個(gè)黑色實(shí)心方塊來(lái)進(jìn)行標(biāo)注,見(jiàn)例(1)。雖然口語(yǔ)的基本分析單位與書(shū)面語(yǔ)不同,但是一些研究發(fā)現(xiàn),由小句來(lái)實(shí)現(xiàn)的語(yǔ)調(diào)單位在整個(gè)口語(yǔ)表達(dá)中還是占有相當(dāng)高的比例。Tao(1996)的數(shù)據(jù)顯示,漢語(yǔ)口語(yǔ)語(yǔ)篇中,小句形式的語(yǔ)調(diào)單位占比達(dá)47.9%(完整小句占19%)。Matsumoto(2003)的數(shù)據(jù)顯示,日語(yǔ)口語(yǔ)語(yǔ)篇中,小句形式的語(yǔ)調(diào)單位占比68%(完整小句占19%)。從書(shū)面語(yǔ)和口語(yǔ)對(duì)比的角度看,如果語(yǔ)料庫(kù)中的語(yǔ)料標(biāo)注了語(yǔ)調(diào)單位,研究者便可以利用大規(guī)模的數(shù)據(jù)來(lái)對(duì)比書(shū)面語(yǔ)的句子和口語(yǔ)的語(yǔ)調(diào)單位的共同點(diǎn)和不同點(diǎn),來(lái)深入挖掘口語(yǔ)表達(dá)的特點(diǎn)。如果語(yǔ)料庫(kù)未區(qū)分書(shū)面語(yǔ)和口語(yǔ)分析單位的不同,二者的對(duì)比研究便無(wú)法深入進(jìn)行下去。因此我們認(rèn)為,在對(duì)口語(yǔ)語(yǔ)料進(jìn)行標(biāo)注時(shí)優(yōu)先確定口語(yǔ)轉(zhuǎn)寫(xiě)的基本單位是十分重要的。雖然對(duì)語(yǔ)調(diào)單位的性質(zhì)和判定方法還存在少許爭(zhēng)議,但在目前情況下把它作為口語(yǔ)轉(zhuǎn)寫(xiě)和分析的基本單位是一種值得嘗試的選擇。目前,大多數(shù)語(yǔ)料庫(kù)在處理口語(yǔ)語(yǔ)料時(shí)采用了與書(shū)面語(yǔ)相同的方法,這固然帶來(lái)一定的便利,但卻也忽視了口語(yǔ)語(yǔ)料的特點(diǎn),不利于對(duì)口語(yǔ)特征的描寫(xiě),也不利于對(duì)口語(yǔ)與書(shū)面語(yǔ)的差異進(jìn)行研究。
在對(duì)口語(yǔ)中介語(yǔ)語(yǔ)料進(jìn)行轉(zhuǎn)寫(xiě)時(shí),需要盡可能地保留口語(yǔ)交際的特征。根據(jù)前人的研究,我們認(rèn)為,有三類(lèi)口語(yǔ)特征在轉(zhuǎn)寫(xiě)時(shí)需要特別關(guān)注。
第一類(lèi)是關(guān)于口語(yǔ)本身的一些特征,如停頓、語(yǔ)調(diào)、重音等。第一類(lèi)特征的選取可以借鑒現(xiàn)有的口語(yǔ)轉(zhuǎn)寫(xiě)系統(tǒng),如會(huì)話分析(Conversation Analysis)所采用的轉(zhuǎn)寫(xiě)系統(tǒng)。這一轉(zhuǎn)寫(xiě)系統(tǒng)是會(huì)話分析學(xué)派的共同語(yǔ)言,還深深影響到其他研究口語(yǔ)交流現(xiàn)象的研究者及其設(shè)計(jì)的轉(zhuǎn)寫(xiě)系統(tǒng)。會(huì)話分析的轉(zhuǎn)寫(xiě)系統(tǒng)關(guān)注的是會(huì)話活動(dòng)中的一些重要因素,如話輪之間的順序等。Hutchby和Wooffitt(1998)認(rèn)為會(huì)話分析學(xué)者所關(guān)注的內(nèi)容可以歸納為兩類(lèi):一是有關(guān)話輪轉(zhuǎn)換的因素,如話輪的開(kāi)端、結(jié)束,話輪交替;二是話語(yǔ)產(chǎn)出時(shí)的特點(diǎn),如重音、語(yǔ)調(diào)、清晰或含糊等。
第二類(lèi)口語(yǔ)特征是正常的非流利特征,指口語(yǔ)表達(dá)中的各種修改和補(bǔ)救努力。例(2)是一位官員在回答記者提問(wèn)時(shí)的話語(yǔ),每次產(chǎn)出的話語(yǔ)都很短(臨時(shí)用#來(lái)代表產(chǎn)出單位的界限,即語(yǔ)調(diào)單位之間的分界),充滿了“呃、啊”等填充詞和停頓。但這其實(shí)正是口語(yǔ)表達(dá)的常態(tài),而不應(yīng)該把它看作是書(shū)面語(yǔ)的退化形式。研究口語(yǔ)的學(xué)者把人們進(jìn)行口語(yǔ)補(bǔ)救的努力當(dāng)作是進(jìn)行交流的重要資源,而不是需要排除的消極因素。對(duì)于一種語(yǔ)言來(lái)說(shuō),口語(yǔ)修補(bǔ)還擴(kuò)展了語(yǔ)法的可能性。謝格羅夫(Schegloff,1979)認(rèn)為,會(huì)話補(bǔ)救在一定程度上具有超語(yǔ)法的能力(like a super-syntax)。例(3)選自曹禺著名的話劇《雷雨》(姑且當(dāng)作是口語(yǔ)的模仿),魯侍萍發(fā)現(xiàn)周家的大兒子周萍(其實(shí)也是她與周樸園的兒子)動(dòng)手打了自己和魯貴的兒子魯大海,十分生氣,想上前制止。當(dāng)她走到周萍跟前,說(shuō)出“你是萍”之后,卻突然停了下來(lái),因?yàn)樗庾R(shí)到在當(dāng)前的語(yǔ)境下,讓周萍認(rèn)她這個(gè)媽媽是十分困難的事。但她并沒(méi)有放棄已經(jīng)發(fā)出的話語(yǔ),而是改為“憑、憑什么打我的兒子”,利用同音詞的關(guān)聯(lián),十分巧妙地轉(zhuǎn)移了話題。同樣地,當(dāng)周萍詢(xún)問(wèn)魯侍萍是誰(shuí)時(shí),她本能的反應(yīng)是說(shuō)“我是你的媽媽”,但當(dāng)話語(yǔ)進(jìn)行到“你的”之后(如果說(shuō)出“媽媽”一詞,整個(gè)句子也就結(jié)束,因而無(wú)法更改),也是突然停止,改成了“你打的這個(gè)人的媽”。從這個(gè)例子可以看出,人們?cè)诳谡Z(yǔ)中充分利用了各種手段(包括打斷原來(lái)的話語(yǔ),改變?cè)瓉?lái)的話語(yǔ)),來(lái)達(dá)成交際的目的。對(duì)口語(yǔ)的研究應(yīng)該對(duì)交際者的這種語(yǔ)言能力進(jìn)行描述和說(shuō)明,而不僅僅貶斥為錯(cuò)誤啟動(dòng)或不成熟的嘗試(false start)。
在對(duì)口語(yǔ)中介語(yǔ)語(yǔ)料進(jìn)行轉(zhuǎn)寫(xiě)時(shí),對(duì)各種會(huì)話修補(bǔ)現(xiàn)象首先要進(jìn)行準(zhǔn)確的轉(zhuǎn)寫(xiě)記錄,然后可以根據(jù)大類(lèi)的不同進(jìn)行細(xì)分。在嘗試建立一個(gè)小型漢語(yǔ)學(xué)術(shù)口語(yǔ)語(yǔ)料庫(kù)時(shí),我們對(duì)口語(yǔ)中的正常非流利現(xiàn)象進(jìn)行了大類(lèi)及小類(lèi)標(biāo)注。例(4)中,“df”表示一種標(biāo)注的大類(lèi):口語(yǔ)中的不流暢,“type=‘repeat’”中的‘repeat’表示“口語(yǔ)中的不流暢”這一上層類(lèi)別中的子類(lèi)別“重復(fù)”。正如例句所示,標(biāo)注時(shí)將需要標(biāo)注的文本放置于兩個(gè)中括號(hào)中間,“”就表示該標(biāo)注的完成,“/”是結(jié)束的主要標(biāo)記,在分析時(shí)用于提取和定位標(biāo)注內(nèi)容(韓毅、劉運(yùn)同,2020)。
(2)#那么今年#教育部啊就是國(guó)家#這個(gè)用這個(gè)每年兩個(gè)億的資金#建立了免費(fèi)提供教科書(shū)的#這樣一個(gè)制度的試點(diǎn)#
(3)魯侍萍:(大哭起來(lái))哦,這真是一群強(qiáng)盜!
(走至周萍面前,抽咽)你是萍……憑——憑什么打我的兒子?
周萍:你是誰(shuí)?
魯侍萍:我是你的——你打的這個(gè)人的媽。
(曹禺《雷雨》)
(4)連不起來(lái)有點(diǎn)雜糅 [P]
第三類(lèi)口語(yǔ)特征是學(xué)習(xí)者的中介語(yǔ)特征,如影響說(shuō)話人語(yǔ)言表達(dá)的語(yǔ)音特征,不同于母語(yǔ)者的停頓,外語(yǔ)學(xué)習(xí)者特有的語(yǔ)碼轉(zhuǎn)換等。對(duì)第三類(lèi)內(nèi)容的選擇和確定必須建立在中介語(yǔ)學(xué)習(xí)理論和相應(yīng)的研究基礎(chǔ)之上,才能捕捉到學(xué)習(xí)者中介語(yǔ)的一些特殊表現(xiàn),并在語(yǔ)料轉(zhuǎn)寫(xiě)中給予充分的重視和系統(tǒng)的標(biāo)注。例如,初級(jí)階段漢語(yǔ)二語(yǔ)學(xué)習(xí)者由于漢語(yǔ)知識(shí)的缺乏,掌握不好漢語(yǔ)句子的節(jié)奏,使用一種幾乎平均分割的方式來(lái)讀或者說(shuō)漢語(yǔ)句子,把“她-愛(ài)上-漢語(yǔ)-了”說(shuō)成“她-愛(ài)-上-漢-語(yǔ)-了”。
為了忠實(shí)記錄各種口語(yǔ)特征,轉(zhuǎn)寫(xiě)時(shí)免不了利用一些符號(hào)。在設(shè)計(jì)各種符號(hào)時(shí),除了表意的明確性,其實(shí)還有其他一些實(shí)際的因素需要考慮,如在計(jì)算機(jī)上實(shí)現(xiàn)的便利等。有時(shí),一些轉(zhuǎn)寫(xiě)系統(tǒng)由于某種原因利用了書(shū)面語(yǔ)常用的一些標(biāo)點(diǎn)符號(hào)。書(shū)面語(yǔ)的標(biāo)點(diǎn)符號(hào)是為了輔助閱讀而設(shè)計(jì)的,而一些轉(zhuǎn)寫(xiě)系統(tǒng)在借用這些標(biāo)點(diǎn)符號(hào)時(shí)表達(dá)的意義是不同的。轉(zhuǎn)寫(xiě)者在進(jìn)行口語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)轉(zhuǎn)寫(xiě)時(shí)或使用其他研究者的語(yǔ)料時(shí),對(duì)標(biāo)點(diǎn)符號(hào)表示的意義一定要特別注意。
以書(shū)面語(yǔ)常用的逗號(hào)和句號(hào)為例,它們?cè)诓煌霓D(zhuǎn)寫(xiě)系統(tǒng)中表達(dá)的意義是截然不同的。對(duì)會(huì)話分析的轉(zhuǎn)寫(xiě)系統(tǒng)來(lái)說(shuō),來(lái)自書(shū)面語(yǔ)的幾種標(biāo)點(diǎn)符號(hào)是用來(lái)表示話輪或者話輪構(gòu)成單位的音高形狀的。Hepburn和Bolden(2017)特別說(shuō)明:“為了表示發(fā)話人結(jié)束話輪的不同方式,我們通常使用標(biāo)點(diǎn)符號(hào),如逗號(hào)、句號(hào)、問(wèn)號(hào)。這些標(biāo)點(diǎn)符號(hào)并不是像在書(shū)面語(yǔ)里那樣用來(lái)標(biāo)示語(yǔ)法特性的,而是用來(lái)標(biāo)示話輪的結(jié)尾部分的音高輪廓的。這些標(biāo)點(diǎn)符號(hào)當(dāng)然也可以出現(xiàn)在一個(gè)復(fù)雜話輪中間,用來(lái)標(biāo)示話輪構(gòu)成單位之間的界限?!本唧w而言,逗號(hào)標(biāo)示略微上升的語(yǔ)調(diào),句號(hào)表示下降語(yǔ)調(diào)。(順便說(shuō)一下,在會(huì)話分析的轉(zhuǎn)寫(xiě)系統(tǒng)中,問(wèn)號(hào)標(biāo)示的是一種比較強(qiáng)烈的上升語(yǔ)調(diào),不一定同疑問(wèn)的語(yǔ)法形式對(duì)應(yīng)。)
同樣,在應(yīng)用廣泛的美國(guó)功能語(yǔ)言學(xué)派的轉(zhuǎn)寫(xiě)系統(tǒng)(指Du Bois等設(shè)計(jì)的轉(zhuǎn)寫(xiě)系統(tǒng))中,也采用了書(shū)面語(yǔ)常用的標(biāo)點(diǎn)符號(hào)。設(shè)計(jì)者(Du Bois等,1993)非常明確地指出:“在我們的話語(yǔ)轉(zhuǎn)寫(xiě)系統(tǒng)中,標(biāo)點(diǎn)符號(hào)如逗號(hào)、句號(hào)、問(wèn)號(hào)一直是用來(lái)標(biāo)示語(yǔ)調(diào)的類(lèi)型的,從來(lái)不是用來(lái)標(biāo)示語(yǔ)法或語(yǔ)義結(jié)構(gòu)本身的。”同時(shí),功能語(yǔ)言學(xué)的研究者又從語(yǔ)篇功能的角度來(lái)對(duì)語(yǔ)調(diào)類(lèi)型進(jìn)行分類(lèi),把語(yǔ)調(diào)大致分為終結(jié)(final)、延續(xù)(continuing)、吁求(appeal)語(yǔ)調(diào),分別由句號(hào)、逗號(hào)、問(wèn)號(hào)來(lái)表示。設(shè)計(jì)者特別提醒使用者:“盡管使用書(shū)面語(yǔ)中的標(biāo)點(diǎn)符號(hào)可以方便記憶,但同時(shí)也帶來(lái)一定的風(fēng)險(xiǎn),轉(zhuǎn)寫(xiě)者一定要避免用書(shū)面語(yǔ)的使用習(xí)慣來(lái)理解這些符號(hào)?!?/p>
基于上述討論,我們認(rèn)為,轉(zhuǎn)寫(xiě)符號(hào)需要表意明確。為了避免書(shū)面語(yǔ)的影響,在進(jìn)行口語(yǔ)轉(zhuǎn)寫(xiě)和標(biāo)注時(shí)最好不要使用書(shū)面語(yǔ)中常用的符號(hào)。如果為了便利而采用了書(shū)面語(yǔ)中的一些符號(hào),就要在語(yǔ)料庫(kù)的描述和相關(guān)文件(包括使用該語(yǔ)料庫(kù)語(yǔ)料進(jìn)行研究的文獻(xiàn))中明確說(shuō)明這些符號(hào)的定義,從而避免造成不必要的誤解。
由于口語(yǔ)語(yǔ)料轉(zhuǎn)寫(xiě)費(fèi)時(shí)費(fèi)力,在具體操作時(shí)可以借鑒一些語(yǔ)料庫(kù)轉(zhuǎn)寫(xiě)系統(tǒng)的層級(jí)性設(shè)計(jì),對(duì)轉(zhuǎn)寫(xiě)語(yǔ)料進(jìn)行不同“精細(xì)度”的轉(zhuǎn)寫(xiě)。如德語(yǔ)學(xué)者設(shè) 計(jì) 的“HIAT”(Heuristic Interpretative Auditory Transcription)轉(zhuǎn)寫(xiě)系統(tǒng)分為兩種,一種是基本版本,另一種是擴(kuò)展版本。擴(kuò)展版本中補(bǔ)充了音調(diào)和非語(yǔ)言符號(hào),以及更細(xì)致的音調(diào)變化符號(hào)。Du Bois等(1993)的轉(zhuǎn)寫(xiě)系統(tǒng)區(qū)分寬式、中級(jí)、嚴(yán)式三種轉(zhuǎn)寫(xiě)等級(jí)。寬式轉(zhuǎn)寫(xiě)包括基本的內(nèi)容,中級(jí)轉(zhuǎn)寫(xiě)更進(jìn)一步,嚴(yán)式轉(zhuǎn)寫(xiě)包括的內(nèi)容最多。寬式轉(zhuǎn)寫(xiě)包含的信息主要是:交談?wù)?、話輪和語(yǔ)調(diào)單位、話語(yǔ)重疊、停頓、笑聲。中級(jí)轉(zhuǎn)寫(xiě)增加了模糊音、轉(zhuǎn)寫(xiě)人的評(píng)論、重音詞和音節(jié)的長(zhǎng)短、停頓的時(shí)長(zhǎng)、語(yǔ)調(diào)方向。嚴(yán)式轉(zhuǎn)寫(xiě)在二者的基礎(chǔ)上再增加話語(yǔ)的緊密連接、特殊音如吸氣和長(zhǎng)出氣、特殊的音質(zhì)如快慢高低等(劉運(yùn)同,2016)。Barth-Weingarten(2016)在提出自己對(duì)語(yǔ)調(diào)單位的研究思路時(shí)也提議,可以對(duì)口語(yǔ)進(jìn)行三種顆粒度不同的轉(zhuǎn)寫(xiě):最少轉(zhuǎn)寫(xiě)、基本轉(zhuǎn)寫(xiě)、精細(xì)轉(zhuǎn)寫(xiě)。在最少轉(zhuǎn)寫(xiě)層面,轉(zhuǎn)寫(xiě)者只需要區(qū)分出三種不同的休止(cesura)即可。在討論口語(yǔ)轉(zhuǎn)寫(xiě)的著作中,Jenks(2011)把口語(yǔ)交流的轉(zhuǎn)寫(xiě)信息分為5種類(lèi)型,見(jiàn)表1。
表1 口語(yǔ)交流轉(zhuǎn)寫(xiě)信息的5種類(lèi)型
(續(xù)表)
對(duì)口語(yǔ)研究和中介語(yǔ)語(yǔ)料庫(kù)建設(shè)而言,只轉(zhuǎn)寫(xiě)第一類(lèi)型和第二類(lèi)型的特征顯然是不夠的。但一個(gè)轉(zhuǎn)寫(xiě)系統(tǒng)到底需要包括哪些信息,其實(shí)是要根據(jù)研究目的或語(yǔ)料庫(kù)建設(shè)的目的來(lái)考慮的。中國(guó)的語(yǔ)料庫(kù)建設(shè)與研究者在這方面也進(jìn)行了寶貴的探索,提出了一些行之有效的建設(shè)策略。張寶林和崔希亮(2013,2022)提出全球語(yǔ)料庫(kù)“搭積木式”的動(dòng)態(tài)建設(shè)策略,提議采用多次標(biāo)注/多版標(biāo)注,每次只對(duì)一個(gè)層面的內(nèi)容進(jìn)行標(biāo)注。上述兩篇論文中提到的標(biāo)注策略主要是針對(duì)后期的標(biāo)注信息提出的,我們提出的轉(zhuǎn)寫(xiě)策略是針對(duì)把口語(yǔ)語(yǔ)料變成文本這一階段,二者的對(duì)象不完全相同。我們建議,在對(duì)口語(yǔ)語(yǔ)料進(jìn)行轉(zhuǎn)寫(xiě)時(shí)可以先確立不同類(lèi)型的轉(zhuǎn)寫(xiě)信息,每個(gè)版本只標(biāo)注相應(yīng)的信息。然后根據(jù)需要,從簡(jiǎn)單到復(fù)雜,逐漸完善口語(yǔ)語(yǔ)料或多模態(tài)語(yǔ)料的各種信息。在處理口語(yǔ)語(yǔ)料時(shí),分層或分級(jí)轉(zhuǎn)寫(xiě)可以使口語(yǔ)中介語(yǔ)語(yǔ)料轉(zhuǎn)寫(xiě)更具操作性。這一轉(zhuǎn)寫(xiě)策略可以納入張寶林和崔希亮(2013,2022)提出的“搭積木式”語(yǔ)料庫(kù)建設(shè)策略。
建設(shè)高質(zhì)量、具有通用性的漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù),其中的一個(gè)重要的問(wèn)題就是要做到書(shū)面語(yǔ)語(yǔ)料和口語(yǔ)語(yǔ)料的平衡??谡Z(yǔ)語(yǔ)料的收集和標(biāo)注與書(shū)面語(yǔ)語(yǔ)料相比有顯著的區(qū)別,其中,口語(yǔ)語(yǔ)料轉(zhuǎn)寫(xiě)是十分關(guān)鍵的步驟。學(xué)術(shù)界對(duì)口語(yǔ)以及口語(yǔ)中介語(yǔ)的研究相對(duì)還處于探索階段,無(wú)法為口語(yǔ)中介語(yǔ)的轉(zhuǎn)寫(xiě)及口語(yǔ)語(yǔ)料庫(kù)建設(shè)提供堅(jiān)實(shí)的基礎(chǔ),這在一定程度上制約了口語(yǔ)語(yǔ)料庫(kù)建設(shè)的發(fā)展以及口語(yǔ)中介語(yǔ)研究的深入。本文針對(duì)中介語(yǔ)口語(yǔ)轉(zhuǎn)寫(xiě)的幾個(gè)重要問(wèn)題,根據(jù)已有的研究和實(shí)踐,提出了一些建議,例如如何確立口語(yǔ)轉(zhuǎn)寫(xiě)的基本單位,應(yīng)優(yōu)先轉(zhuǎn)寫(xiě)哪些韻律要素,轉(zhuǎn)寫(xiě)符號(hào)的選擇等,希望對(duì)中介語(yǔ)語(yǔ)料庫(kù)建設(shè)中口語(yǔ)語(yǔ)料轉(zhuǎn)寫(xiě)及轉(zhuǎn)寫(xiě)標(biāo)準(zhǔn)研究有所助益。