国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語(yǔ)料庫(kù)的同一后綴不同構(gòu)詞過(guò)程的形態(tài)生成能力研究
——以派生后綴“-ly”為例

2022-04-24 07:41李華劍鄧耀臣
東北亞外語(yǔ)論壇 2022年2期
關(guān)鍵詞:詞綴后綴副詞

李華劍 鄧耀臣

大連外國(guó)語(yǔ)大學(xué)英語(yǔ)學(xué)院 大 連 116044 中 國(guó)

一、引言

詞綴生成能力一直是語(yǔ)言形態(tài)研究中的熱門話題。不同的詞綴基于構(gòu)詞規(guī)則能夠不斷的創(chuàng)造新的復(fù)雜單詞,但是基于構(gòu)詞規(guī)則所產(chǎn)生的新詞的數(shù)量變化很大。例如在英語(yǔ)中以“-th”結(jié)尾的單詞(warmth)很少,而以“-ness”結(jié)尾的單詞(goodness)卻有成千上萬(wàn),研究不同詞綴的生成能力既可以了解不同詞綴的構(gòu)詞能力的差異,也可以讓我們從詞匯層面觀察語(yǔ)言的發(fā)展和變化趨勢(shì)。

二、文獻(xiàn)綜述

詞綴生成能力是語(yǔ)言形態(tài)研究中最熱門和最具爭(zhēng)議的話題之一。Plag (2003)將生成能力描述為詞綴的固有屬性即“用來(lái)創(chuàng)造新的復(fù)雜詞匯”,關(guān)于詞綴生成能力及其測(cè)量方法,在許多文獻(xiàn)中提出了不同的觀點(diǎn)和方法(Aronoff, 1976; Chitashvili & Baayen, 1993; Baayen & Renouf, 1996; Plag, 1999, 2004; Baayen, 1992, 1993,1994, 2001, 2009; Bauer, 2001; Gaeta & Ricca, 2003; Pustylnikov & Schneider-Wiejowski, 2009;among many others)。例如,Gaeta & Ricca(2003)選擇了58個(gè)意大利語(yǔ)的派生后綴,將基于語(yǔ)料庫(kù)和基于詞典分別所得出的詞綴生成能力數(shù)據(jù)進(jìn)行了一個(gè)對(duì)比分析。這是因?yàn)樵趯?duì)意大利語(yǔ)的詞綴相關(guān)研究中,頻數(shù)盡管一直以來(lái)都被認(rèn)為是評(píng)價(jià)詞綴在構(gòu)詞過(guò)程中的生成能力可用的一個(gè)相關(guān)參數(shù),但是很少有研究將其作為主要研究對(duì)象,此前的研究主要還是以詞典為導(dǎo)向來(lái)評(píng)估詞綴的生成能力。為此該研究基于自建的報(bào)紙語(yǔ)料庫(kù),對(duì)這58個(gè)派生后綴從頻數(shù)和罕見(jiàn)詞(Hapax/詞頻為1)這兩個(gè)角度進(jìn)行生成能力的評(píng)估,并將數(shù)據(jù)和之前的以詞典為導(dǎo)向的數(shù)據(jù)進(jìn)行全方面的對(duì)比,最終的研究發(fā)現(xiàn)表明,在詞綴生成能力研究領(lǐng)域,基于語(yǔ)料庫(kù)的數(shù)據(jù)整體更加可靠,因?yàn)樗鼈儽苊饬嗽~典編撰過(guò)程中的一些缺點(diǎn)(例如詞典有時(shí)出于全面性的考慮會(huì)保留一系列已經(jīng)很少使用的古老的復(fù)雜形式,這會(huì)對(duì)以詞典為導(dǎo)向的研究產(chǎn)生干擾),使用基于真實(shí)語(yǔ)料的大規(guī)模語(yǔ)料庫(kù)往往能更全面準(zhǔn)確的反映不同詞綴的生成能力,這個(gè)研究結(jié)論同樣也證實(shí)了Baayen的觀點(diǎn)的合理性與可實(shí)踐性。

Baayen 生成能力計(jì)量方式

在生成能力計(jì)量研究這方面,Baayen(2009)的生成能力計(jì)算方式是一個(gè)著名而復(fù)雜的衡量指標(biāo)。他的基于語(yǔ)料庫(kù)的定量估算形態(tài)生成能力的方法已經(jīng)成為構(gòu)詞過(guò)程生成能力共時(shí)和歷時(shí)研究的主要范式(Gaeta & Ricca, 2003; Plag, 1999,2006)。Baayen的目標(biāo)是計(jì)算在語(yǔ)料庫(kù)中由特定的形態(tài)過(guò)程生成新詞的概率,他提出了估算形態(tài)生成能力的定量方法。Baayen(2009)基于語(yǔ)料庫(kù)中的罕見(jiàn)詞(hapax legomena),也即詞頻為1的詞,提出了三個(gè)生成能力維度,即已實(shí)現(xiàn)生成能力(realized productivity)、潛在生成能力(potential productivity)和擴(kuò)大生成能力(expanding productivity),每一個(gè)維度都探索了生成能力的一個(gè)方面:

已實(shí)現(xiàn)生成能力(realized productivity),下文簡(jiǎn)稱為“RP”,計(jì)算在構(gòu)詞過(guò)程中不同的后綴已經(jīng)產(chǎn)生的不同單詞的數(shù)量,Baayen認(rèn)為這種衡量方法“顯示了過(guò)去的生成能力和該后綴的使用程度”。

已實(shí)現(xiàn)生成能力的計(jì)算公式為:

RP=某一后綴已經(jīng)產(chǎn)生的不同單詞的數(shù)量

潛在生成能力(potential productivity),下文簡(jiǎn)稱為“PP”,所表明的是某一個(gè)類別(或詞綴)的潛在生成能力,通過(guò)統(tǒng)計(jì)“語(yǔ)料庫(kù)中只出現(xiàn)一次的形態(tài)類別的所有單詞的數(shù)量,再用該數(shù)據(jù)除以這一類別(或詞綴)所構(gòu)建的單詞的總數(shù)量(包含所有詞頻的單詞而不僅僅是頻率為1的罕見(jiàn)詞)。Baayen認(rèn)為hapax的數(shù)量可以顯示一個(gè)詞綴的生成能力,這一測(cè)量方法同時(shí)也是“在某一語(yǔ)料庫(kù)或文本中遇到尚未觀察到的單詞類型的概率”。

潛在生成能力的計(jì)算公式為:

擴(kuò)大生成能力(expanding productivity),下文簡(jiǎn)稱為“EP”,它是用給定語(yǔ)料庫(kù)中該形態(tài)類別的hapax數(shù)量除以語(yǔ)料庫(kù)中hapax詞的總數(shù)量,Baayen認(rèn)為這一指標(biāo)可以有效地“評(píng)估形態(tài)類別擴(kuò)張和吸引新成員的速度”。同時(shí)也指出“這個(gè)比率是對(duì)所有詞綴對(duì)詞匯增長(zhǎng)率的相對(duì)貢獻(xiàn)的估計(jì)”。

擴(kuò)大生成能力的計(jì)算公式為:

綜上所述,這三個(gè)維度都探索了生成能力的一個(gè)方面,具有不同的功能,基于這三個(gè)維度可以對(duì)派生后綴的生成能力進(jìn)行綜合評(píng)估。使用這三個(gè)維度衡量生成能力的方式在國(guó)內(nèi)外的不同語(yǔ)言的研究中都得到了充分的驗(yàn)證,例如Seyyedeh Zohreh Aftabia& Abbas Ali Ahangara& Hassan Mishmast Nehib(2021)中基于Baayen的生成能力計(jì)算模型對(duì)波斯語(yǔ)的派生后綴的生成能力進(jìn)行了定量的研究,研究基于Baayen(2009)提出的生成能力計(jì)算模型和Lotfi Zadeh的模糊集合理論,對(duì)Bijankhan語(yǔ)料庫(kù)中波斯語(yǔ)派生詞綴的生成能力進(jìn)行了研究,一共對(duì)51個(gè)派生后綴進(jìn)行考察,該研究的結(jié)果證明Baayen的生成能力衡量方式在評(píng)估波斯語(yǔ)詞綴的生成能力方面同樣有效。

在生成能力研究層面,就筆者目前所閱讀的文獻(xiàn),目前已有的研究多集中于對(duì)一兩個(gè)詞綴進(jìn)行深入的定量或定性的分析研究,例如Baayen & Neitt(1997)曾基于自建的新聞報(bào)紙的語(yǔ)料庫(kù)對(duì)荷蘭語(yǔ)的派生后綴“-heid”進(jìn)行了定量分析,目前的研究鮮有綜合不同的語(yǔ)料庫(kù)進(jìn)行生成能力的對(duì)比分析研究。因此本研究基于Brown語(yǔ)料庫(kù)和LOB語(yǔ)料庫(kù)這兩個(gè)平衡語(yǔ)料庫(kù),選擇派生后綴“-ly”為研究對(duì)象,由于基于“-ly”這一個(gè)派生后綴所產(chǎn)生的單詞有兩種詞性,分別是形容詞和副詞,本研究將回答以下兩個(gè)問(wèn)題:

1.基于Baayen的生成能力三個(gè)衡量維度,以“-ly”為后綴派生的形容詞和副詞的生成能力是否有差異?如果有差異造成這種差異的原因是什么?

2.美式英語(yǔ)和英式英語(yǔ)的統(tǒng)計(jì)結(jié)果是否有差異?

三、研究設(shè)計(jì)

研究語(yǔ)料

本研究以Brown語(yǔ)料庫(kù)和LOB(全稱Lancaster-Oslo-Bergen)語(yǔ)料庫(kù)為研究語(yǔ)料,Brown語(yǔ)料庫(kù)由美國(guó)Brown大學(xué)在20世紀(jì)60年代初創(chuàng)建,該語(yǔ)料庫(kù)收集了500個(gè)連貫的美國(guó)英語(yǔ)書(shū)面語(yǔ),用于研究當(dāng)代美國(guó)英語(yǔ)。它是世界上第一個(gè)平衡語(yǔ)料庫(kù),也一直是英語(yǔ)平衡語(yǔ)料庫(kù)的標(biāo)準(zhǔn),LOB語(yǔ)料庫(kù)便是基于此標(biāo)準(zhǔn)模仿Brown語(yǔ)料庫(kù)的比例建立起來(lái)的英國(guó)英語(yǔ)語(yǔ)料庫(kù),其語(yǔ)料搜集自1961年英國(guó)英語(yǔ)出版物上的文本,共500篇,這兩個(gè)語(yǔ)料庫(kù)對(duì)當(dāng)代美國(guó)英語(yǔ)和英國(guó)英語(yǔ)有著足夠的代表性可以支撐本次研究。

表1 Brown語(yǔ)料庫(kù)和LOB語(yǔ)料庫(kù)概況

表2 Brown語(yǔ)料庫(kù)和LOB語(yǔ)料庫(kù)的具體容量

研究工具

本研究主要使用LancsBox和Excel這兩個(gè)工具輔助研究。LancsBox是由蘭卡斯特大學(xué)開(kāi)發(fā)的一款多功能語(yǔ)料分析工具,使用LancsBox可以很快捷方便制作基于詞頻的Wordlist,便于后續(xù)研究。LancsBox也可以對(duì)文本進(jìn)行詞性標(biāo)記,由于本研究主要考察副詞和形容詞的生成能力,因此可以借助LancsBox快速準(zhǔn)確的排除其余詞性的單詞。得到最終要研究的數(shù)據(jù)后使用Excel協(xié)助進(jìn)行進(jìn)一步的數(shù)據(jù)篩選處理以保證結(jié)果的準(zhǔn)確性,同時(shí)可以制作不同的表格使數(shù)據(jù)更加直觀。

研究步驟

1.使用LancsBox將派生后綴“-ly”分別基于Brown和LOB語(yǔ)料庫(kù)制作wordlists,將wordlists導(dǎo)入Excel后進(jìn)行兩步篩選,保證數(shù)據(jù)的準(zhǔn)確性:

①基于LancsBox所制作的wordlists已經(jīng)標(biāo)好了全部單詞的詞性,將數(shù)據(jù)導(dǎo)入Excel后篩選出以“-ly”為后綴的形容詞和副詞:

②再進(jìn)行完以詞性為標(biāo)準(zhǔn)的篩選后,進(jìn)行人工核驗(yàn),將最后的結(jié)果核驗(yàn)無(wú)誤后進(jìn)行下一步的研究。

通過(guò)以上兩個(gè)篩選步驟來(lái)保障研究數(shù)據(jù)的精確性和完整性。

2.將整理完的研究數(shù)據(jù)通過(guò)Excel依照Baayen所提出的生成能力計(jì)算方式進(jìn)行計(jì)算,將研究結(jié)果以表格形式呈現(xiàn)并繼續(xù)進(jìn)行分析。

數(shù)據(jù)統(tǒng)計(jì)

基于Brown和LOB語(yǔ)料庫(kù),將以“-ly”為后綴生成的單詞經(jīng)過(guò)篩選過(guò)后,分為形容詞和副詞兩個(gè)類別以表3的形式呈現(xiàn)

表3 以”-ly”為后綴的單詞數(shù)量

四、結(jié)果與討論

1.基于Baayen的生成能力三個(gè)衡量維度,以“-ly”為后綴派生的形容詞和副詞的生成能力是否有差異?如果有差異造成這種差異的原因是什么?

基于Baayen的生成能力三個(gè)衡量維度對(duì)兩個(gè)語(yǔ)料庫(kù)的數(shù)據(jù)整合進(jìn)行計(jì)算并且以表4記錄

表4 基于語(yǔ)料庫(kù)的形容詞和副詞的生成能力

從表4可以看出,以“-ly”為后綴派生的形容詞和副詞的生成能力存在明顯差異。具體來(lái)說(shuō)在所使用的語(yǔ)料庫(kù)中形容詞的單詞數(shù)量遠(yuǎn)遠(yuǎn)小于副詞的單詞數(shù)量,因此形容詞的RP和EP遠(yuǎn)小于副詞的RP。同時(shí)形容詞的PP略大于副詞的PP,但兩者的差距并不是很大,沒(méi)有像RP和PP那么明顯的差異性。

“-ly”既是副詞后綴也是形容詞后綴。“-ly”作為本族語(yǔ)的副詞后綴,幾乎可以加在一切的形容詞后面,表示狀態(tài)(如cheerfully)、程度(greatly)以及時(shí)間(recently)等等,因此以“-ly”為后綴的副詞數(shù)量特別龐大。與之相比,“-ly”也可以加在名詞后面充當(dāng)形容詞后綴,在這種情況下,“-ly”并不是活性詞綴,它的構(gòu)詞數(shù)量是很有限的,其主要意思為like a (像……的)、characteristic of(有……性質(zhì)的)以及suited to(適于……的)等等,例如,ghostly(像鬼一樣的)、brotherly(有兄弟特點(diǎn)的)、manly(適合男子的)等等,因此以“-ly”為后綴的形容詞數(shù)量不是很多。

RP這一衡量維度顯示了過(guò)去的生成能力和該后綴使用的程度,EP這一衡量維度是對(duì)所有詞綴對(duì)詞匯增長(zhǎng)率的相對(duì)貢獻(xiàn)的估計(jì),從上文可以得出以“-ly”為后綴的副詞數(shù)量特別多,而以“-ly”為后綴的形容詞數(shù)量不是很多,因此在語(yǔ)料庫(kù)中“-ly”的副詞的RP和EP均遠(yuǎn)大于形容詞。

PP這一衡量維度是表示在某一語(yǔ)料庫(kù)或文本中遇到尚未觀察到的單詞類型的概率,由于“-ly”為后綴的形容詞數(shù)量不是很多,所以很多以此形成的形容詞相對(duì)而言比較陌生,而對(duì)以“-ly”為后綴的副詞已經(jīng)非常熟悉,因此在某一語(yǔ)料庫(kù)中遇到尚未觀察的單詞類型概率兩者相差不大。前者是因?yàn)閿?shù)量少很多不是很熟悉,后者是構(gòu)詞數(shù)量很多因此也會(huì)遇到尚未觀察到的單詞類型,但總體而言兩者相差不是很多。PP多與EP相結(jié)合來(lái)考察詞綴的生成能力。

2.美式英語(yǔ)和英式英語(yǔ)的統(tǒng)計(jì)結(jié)果是否有差異?

基于Baayen的生成能力三個(gè)衡量維度分別對(duì)Brown和LOB語(yǔ)料庫(kù)進(jìn)行計(jì)算并且以表5記錄

表5 基于語(yǔ)料庫(kù)的形容詞和副詞的生成能力

從表5可以看出,在Brown和LOB語(yǔ)料庫(kù)兩個(gè)語(yǔ)料庫(kù)中,前者代表的是美式英語(yǔ),后者代表的是英式英語(yǔ)。從結(jié)果來(lái)看兩者之間存在差異,在兩個(gè)語(yǔ)料庫(kù)中形容詞的RP和PP的相對(duì)差異較為明顯,其余各項(xiàng)數(shù)據(jù)的差異很小。總體而言,兩個(gè)語(yǔ)料庫(kù)之間存在差異但是差異不大。

這可能是因?yàn)橛⑹接⒄Z(yǔ)和美式英語(yǔ)其實(shí)最大的差別就是發(fā)音,除了發(fā)音,詞匯方面也存在差異。雖然美國(guó)和英國(guó)官方語(yǔ)言都是英語(yǔ),而且有很深的淵源,但在日后的發(fā)展過(guò)程當(dāng)中,因?yàn)槲幕煌?,所以還是會(huì)產(chǎn)生差異,例如football,美式英語(yǔ)稱之為橄欖球,英式英語(yǔ)稱之為足球,因此存在差異但差異并不是很大。

五、結(jié)語(yǔ)

本研究基于Baayen的詞綴生成能力的三個(gè)衡量維度,以Brown語(yǔ)料庫(kù)和LOB語(yǔ)料庫(kù)為研究語(yǔ)料,對(duì)派生后綴“-ly”進(jìn)行了深層次考察,分為形容詞和副詞兩個(gè)類別進(jìn)行比較分析,結(jié)果表明形容詞在已實(shí)現(xiàn)生成能力和擴(kuò)大生成能力這兩個(gè)維度均遠(yuǎn)小于副詞,造成這種差異的原因大部分是因?yàn)橐虼艘浴?ly”為后綴的副詞數(shù)量特別龐大,而以“-ly”為后綴的形容詞數(shù)量不是很多。而在潛在生產(chǎn)力這一衡量維度形容詞和副詞的差別不大。造成這種差異的原因大部分是因?yàn)樵谀骋徽Z(yǔ)料庫(kù)中遇到尚未觀察的單詞類型概率兩者相差不大,前者是因?yàn)閿?shù)量少很多不是很熟悉,后者是構(gòu)詞數(shù)量很多因此也會(huì)遇到尚未觀察到的單詞類型。同時(shí)也比較了代表美式英語(yǔ)的Brown語(yǔ)料庫(kù)和代表英式英語(yǔ)的LOB語(yǔ)料庫(kù)這兩個(gè)語(yǔ)料庫(kù)的數(shù)據(jù)統(tǒng)計(jì)結(jié)果的差別,結(jié)果表明有差異但差異不大。

本研究也存在明顯的不足。一是選擇研究的對(duì)象不多,僅僅選擇了“-ly”這一個(gè)派生后綴作為研究對(duì)象,二是選擇的語(yǔ)料庫(kù)不是很新,容量也不是很大,有待于后續(xù)的研究進(jìn)行進(jìn)一步的豐富和補(bǔ)充。

猜你喜歡
詞綴后綴副詞
從網(wǎng)絡(luò)語(yǔ)“X精”看“精”的類詞綴化
副詞“好容易”及其詞匯化成因
韓國(guó)語(yǔ)副詞“?”與漢語(yǔ)副詞“更”“再”的對(duì)應(yīng)
詞尾與詞綴的區(qū)別研究
淺談現(xiàn)代漢語(yǔ)類詞綴
釋西夏語(yǔ)詞綴wji2
倍增法之后綴數(shù)組解決重復(fù)子串的問(wèn)題
兩種方法實(shí)現(xiàn)非常規(guī)文本替換
說(shuō)“迪烈子”——關(guān)于遼金元時(shí)期族名后綴問(wèn)題
副詞和副詞詞組
凌云县| 沙河市| 左权县| 读书| 聂荣县| 宾阳县| 西乌珠穆沁旗| 浮梁县| 邯郸市| 吉首市| 江华| 忻州市| 尤溪县| 六盘水市| 赤峰市| 沈阳市| 无为县| 交城县| 青浦区| 大丰市| 五大连池市| 禹城市| 望江县| 涿州市| 洛扎县| 孝感市| 微博| 韶山市| 方正县| 呼图壁县| 道孚县| 东海县| 珠海市| 台中县| 锡林浩特市| 瓮安县| 沿河| 新和县| 营山县| 察隅县| 游戏|