国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于規(guī)則的雙重否定識別
——以“不V1不V2”為例

2022-06-17 09:09:40袁毓林
中文信息學(xué)報 2022年4期
關(guān)鍵詞:助動詞真值雙重

王 昱,袁毓林,2,3,4

(1.北京大學(xué) 中文系,北京 100871; 2. 澳門大學(xué) 人文學(xué)院中國語言文學(xué)系,澳門;3. 北京大學(xué) 中國語言學(xué)研究中心,北京 100871; 4. 北京大學(xué) 教育部計算語言學(xué)重點實驗室,北京 100871)

0 引言

0.1 研究背景

在語義識別領(lǐng)域,否定對語義有著重要的影響,否定的有無影響整個句子的真值與情感。例如,“我喜歡這件衣服”,這句話的真值為真,情感為積極。但是如果在動詞前加上否定詞“不”(即“不喜歡”),真值便為假,情感便為消極。因此,句子中的否定成分是自然語言語義識別處理時必須考慮的內(nèi)容。而在否定用法中,有一種特殊的用法——雙重否定。丁聲樹先生在《現(xiàn)代漢語語法講話》中將其概括為: “一句話先后用兩個否定詞,如‘不能不去’‘沒有人不去’‘非去不可’之類,都是雙重否定的句法。雙重否定意思上是肯定的,不過跟單純肯定不全一樣”。[1]例如,“我不得不去學(xué)?!敝浮拔业萌W(xué)?!?,“我不一定不同意這個觀點”指“我也許同意這個觀點”。雖然用的是否定的格式,表達的卻是肯定的語義,且其語氣還與單純肯定有一定的區(qū)別。這種連用否定表達肯定的特殊結(jié)構(gòu)即為雙重否定。對于自然語言語義識別來說,雙重否定是處理語料時必須考慮的內(nèi)容。如果計算機無法識別雙重否定,則可能會導(dǎo)致整個句子的語義真值和情感極性的判斷錯誤。因此,我們有必要對雙重否定進行更全面深入的研究與探索。雙重否定的自動識別將有助于句子語義與情感識別的進一步發(fā)展。

0.2 文獻綜述

目前國內(nèi)對于雙重否定的研究主要集中在雙重否定的定義、范圍、語義和語用等理論問題方面。

雙重否定的定義與范圍方面,學(xué)界一直存在爭議,如呂叔湘先生[2]、王力先生[3]等認(rèn)為含有否定詞的反詰句是雙重否定,而符達維先生[4]則認(rèn)為反詰句不是雙重否定。

雙重否定格式方面,已有研究都是從分類與舉例的角度進行討論,尚未有一篇論文從形式的角度對雙重否定格式進行具體詳細(xì)的遍歷分析。目前對雙重否定格式概括最為全面的是蕪崧[5]所劃分的八大類型,25個格式,但是其主要涵蓋的是“構(gòu)式”類的雙重否定,對于非構(gòu)式類的雙重否定尚未進行全面的考察。

語義語用方面,葉文曦[6]、方緒軍[7]、何愛晶[8]等引入了Ladusaw[9]的形式語義學(xué),Horn[10]的元語否定等理論,對一些典型的結(jié)構(gòu)進行了分析,得出了具有解釋力的成果。然而,由于雙重否定的范圍、格式還未確定,目前學(xué)者只集中分析了幾個典型的結(jié)構(gòu),覆蓋面十分有限,無法直接應(yīng)用于實踐。

自然語言理解領(lǐng)域,關(guān)于雙重否定識別的研究非常少。目前只有王勇等[11]在其極性詞典的構(gòu)建中,簡單地搜集了一些典型的雙重否定結(jié)構(gòu),構(gòu)建了一個雙重否定詞典,具體如圖1所示。

圖1 王勇雙重否定詞典示意圖

然而該詞典所歸納的結(jié)構(gòu)數(shù)量有限,大量雙重否定結(jié)構(gòu)未被收入,如“不應(yīng)不”“不準(zhǔn)不”“不該不”“非……不可”“無一不”“沒有……不……”,等等。

0.3 本文的選題及意義

綜上所述,目前國內(nèi)多從分類與舉例的角度對雙重否定進行討論,尚未有從形式的角度對雙重否定格式進行遍歷分析的成果。關(guān)于雙重否定,我們只知道一些具體的實例,并沒有歸納其完整的形式格式。另一方面,雙重否定對于語義的真值與情感極值有著重大的影響,如“我不可能不去”與“我不去”真值完全相反,然而目前國內(nèi)并未有學(xué)者對雙重否定的識別予以關(guān)注?;诖?,本研究選取了“不V1不V2”為研究對象,嘗試對含“不”的雙重否定結(jié)構(gòu)實現(xiàn)自動識別功能。本文將對“不V1不V2”做全面的考察,判斷屬于雙重否定結(jié)構(gòu)的“不V1不V2”的具體特征,并根據(jù)歸納出的特征建立自動識別程序。最后,建立的自動識別程序能對含有多個“不”的語料進行識別,區(qū)分屬于雙重否定與不屬于雙重否定的句子,并返回其內(nèi)部的雙重否定結(jié)構(gòu)。本研究可以作為預(yù)實驗,為后續(xù)的全面的雙重否定自動識別程序做基礎(chǔ)。

1 “不V1不V2”雙重否定的類型及識別規(guī)則

目前關(guān)于雙重否定的定義和標(biāo)準(zhǔn),學(xué)界尚未有定論。鑒于語義真值識別和情感極值判斷是計算機對否定結(jié)構(gòu)進行語義識別時所面臨的主要問題,本文借鑒形式語義學(xué),對雙重否定擬定了一個工作定義: 只要兩次否定與肯定在語義真值上相同,“﹁ ﹁ P==P”,便屬于雙重否定。符合雙重否定條件的結(jié)構(gòu)即為雙重否定結(jié)構(gòu)。

為了得到完整的雙重否定結(jié)構(gòu)格式,本文結(jié)合前賢研究,采用遍歷的方法,梳理了所有的“不V1不V2”的語法形式并對其進行考察,試圖找出所有可能的雙重否定結(jié)構(gòu)。具體的遍歷方法如下:

(1) 在CCL語料庫中搜尋含有“不$Num不”的語料(Num取值為“1~20”);其中Num表示“不”與“不”之間相隔的字?jǐn)?shù)。如“不得不”的Num為1,而“不覺得不”的Num為2;

(2) 根據(jù)所得語料,結(jié)合詞性限制,在“不$Num不”中提取所有可能的“不V1不V2”,并進行數(shù)據(jù)統(tǒng)計;

(3) 根據(jù)統(tǒng)計結(jié)果與具體語料,對結(jié)果進行概括,抽象出具體的所有可能的“不V1不V2”結(jié)構(gòu)。

具體結(jié)果如表1所示。

表1 “不V1不V2”格式表

1.1 不+助動詞+不+V2

“不+助動詞+不+V2”是目前公認(rèn)的雙重否定的結(jié)構(gòu),其具體格式為“不+表示可能或必要的助動詞+不+V2”,如“不得不去”“不會不來”“不可不說”等等。例句如下:

[例1]a. 一些農(nóng)村學(xué)校的校長為了保證學(xué)習(xí)的正常運轉(zhuǎn),不得不四處籌錢。

b. 一些農(nóng)村學(xué)校的校長為了保證學(xué)習(xí)的正常運轉(zhuǎn),(必須)得四處籌錢。

[例2]a. 這樣重大的事件新聞界不會不給予特別重視。

b. 這樣重大的事件新聞界會給予特別重視。

例1、例2的a、b例句,雖然它們的語氣強度存在區(qū)別,如例1a中的“不得不”比例1b中的“得”的肯定語氣更強,然而這種語氣變化并不影響語義的真值 。例1a、例2a仍與例1b、例2b的語義真值一致,符合“﹁ ﹁ P==P”雙重否定的標(biāo)準(zhǔn),屬于雙重否定結(jié)構(gòu)。

對于“不+助動詞+不+V”這種在長期使用中已經(jīng)逐漸變?yōu)榻咏跇?gòu)式的固化結(jié)構(gòu),本文采取簡單的字符串匹配的方法,便可實現(xiàn)對其的識別。

1.2 不+是+不+V2/不+是+……+不+V21.2.1 不+是+不+V2

“不+是+不+V2”與“不+助動詞+不+V2”結(jié)構(gòu)類似,也是最為常見的雙重否定結(jié)構(gòu)之一,但是“不+是+不+V2”的情況更為復(fù)雜。因為“不+是+不+V2”中的“不是”除了可以表示描述性真值否定(descriptive truth-functional negation)外,還可以表示元語否定(non-truth-functional negation)?!八^元語否定,就是用元語言對對象語言所描述的非真值語義的否定,……是一種非真值意義否定;與之相對應(yīng)的是真值否定,否定的是句子的真值條件(truth condition)”。[8]這種元語否定常常是引述性否定,是對之前對話中已出現(xiàn)的內(nèi)容的否定。例句如下:

[例3]a. “可現(xiàn)在殺他不容易啊?!庇腥苏f。不是不容易,是根本不可能。

b. #“可現(xiàn)在殺他不容易啊?!庇腥苏f。是容易,是根本不可能。

[例4]a. “可我不想跟她結(jié)婚?!眲|北進一步道,“不是不想跟她結(jié)婚,是不想結(jié)婚?!?/p>

b. #“可我不想跟她結(jié)婚。”劉東北進一步道,“是想跟她結(jié)婚,是不想結(jié)婚?!?/p>

[例5]a. 毛澤東同志反對的是教育脫離實際、脫離群眾、脫離勞動,不是不要讀書,而是要讀得更好。

b. 毛澤東同志反對的是教育脫離實際、脫離群眾、脫離勞動,是要讀書,(而)是要讀得更好。

上述例句,例3、例4中的“不是”為元語否定,它是對之前內(nèi)容的語用否定,而不是對本句內(nèi)容的語義否定,因此例3a、例4a無法轉(zhuǎn)化成例3b、例4b。從語義來說,例3a、例4a中的“不是不”只包含一重語義否定,其邏輯式為“﹁ P”,并不符合“﹁ ﹁ P==P”雙重否定的標(biāo)準(zhǔn),因此,不屬于雙重否定結(jié)構(gòu)。而例5a例句中的“不是”是對語義的否定,“不是不”符合“﹁ ﹁ P==P”雙重否定的標(biāo)準(zhǔn),因此,屬于雙重否定結(jié)構(gòu)。

綜上所述,對于“不+是+不+V2”,需要使計算機先區(qū)分其中的“不是”是元語否定還是真值否定,然后才能判斷其是否為雙重否定結(jié)構(gòu)。在單純的文本里,絕大多數(shù)表示元語否定的“不是”都只出現(xiàn)在“不+是+不+x,(而)是+y”的結(jié)構(gòu)中。因此,下面我們將以“不+是+不+x,(而)是+y”為對象作進一步的討論。

由于真值否定,其修訂的是命題真值,因此,其修正內(nèi)容(y)的真值應(yīng)與錯誤內(nèi)容(不x)的真值相反。而元語否定不對語義真值進行否定,因此其修正內(nèi)容(y)的真值應(yīng)與錯誤內(nèi)容(不x)的真值一致。

根據(jù)這一觀察,我們提出判斷“不+是+不+x,(而)是+y”是否為雙重否定結(jié)構(gòu)的具體方法如下:

提取“不+是+不+x”中的x,并匹配y與“不+x”的真值(1)判斷真值的方法為,計算其謂語真值。一次否定為-1,兩次否定為1,以此類推。判斷真值時,也包括內(nèi)含否定的謂詞,如“討厭”、“丑”等。。若“不+是+不+x,(而)是+y”中“y”的真值與“不+x”不一致,則句中的“不是不”屬于雙重否定結(jié)構(gòu);若一致,則不屬于雙重否定結(jié)構(gòu)。

結(jié)合這一方法,本文對例3、例5句子分析如下:

[例3]a. “可現(xiàn)在殺他不容易啊?!庇腥苏f。不是不容易,是根本不可能。

(y真值: -1,不x真值: -1,不屬于雙重否定)

[例5]a.毛澤東同志反對的是教育脫離實際、脫離群眾、脫離勞動,不是不要讀書,而是要讀得更好。

(y真值: 1,不x真值: -1,屬于雙重否定)

根據(jù)上述方法,本文可以判斷出上述兩個例句中的“不是不”,是否是雙重否定結(jié)構(gòu)。因此,本文采用字符串匹配與計算真值的方法,實現(xiàn)計算機對“不是不”雙重否定結(jié)構(gòu)的識別。

1.2.2 不+是+……+不+V2

不+是+……+不+V2除了需要滿足“‘不是’表示語義否定”的條件外,還需要滿足“不是”的否定焦點落在“不V2”上的條件。如“不是我故意不來”并不等于“是我故意來”。因為在該例中,“不是”的否定焦點在“故意”上而不在“不來”上。具體否定焦點的限制條件本文將會在1.4.2節(jié)中進行討論。

1.3 “不+V1+不+V2”/“不+V1+……+不+V2”(非述賓結(jié)構(gòu))

“不+V1+不+V2”指“V1”不是助動詞、不是“是”的結(jié)構(gòu),它的結(jié)構(gòu)類型有主謂、并列、緊縮、述賓等?!安?V1+……+不+V2”則指“不V1”與“不V2”之間不緊鄰的“不+V1+其他內(nèi)容+不+V2”結(jié)構(gòu)。下面本文將對以上各個結(jié)構(gòu)類型一一進行討論。

主謂結(jié)構(gòu)的“不V1(……)不VP”,指“不隱藏不代表泄露”“不買票不是我的決定”這一類表達,語料數(shù)量很少。在該類結(jié)構(gòu)中,“不V1”只是一個命題陳述,是交流中的舊信息,“不V1”的“不”與“不VP”的“不”,沒有語義上的關(guān)聯(lián),并不構(gòu)成,“雙重”否定的關(guān)系。主謂結(jié)構(gòu)的“不V1不VP”只是“不V1VP”結(jié)構(gòu)的否定,不屬于雙重否定結(jié)構(gòu)。如“不隱藏不代表泄露”不等于“隱藏代表泄露”“不買票不是我的決定”不等于“買票是我的決定”。緊縮結(jié)構(gòu)的“不+V1+(……)+不+V2”包括“不x不行”“不x不成”等固定形式的短語結(jié)構(gòu),也包括“不買票就不讓進”“不給錢不辦事”這一類表達。其語義為“如果不V1,那么不V2”。關(guān)于緊縮條件類的結(jié)構(gòu)是否為雙重否定未有定論。在這里本文從形式語義學(xué)的角度對其進行討論。

以“不x不行”為例?!皒行”語義為“如果x,那么行”。P命題可以分解為q1“x”,q2“y”,邏輯式為蘊含式q1→q2,它的等值式為﹁ q2→﹁ q1。而“不x不行”語義為“如果不x,那么不行”,邏輯式應(yīng)為蘊含式﹁ q1→﹁ q2。從下列真值表可以看出,q1→q2與﹁ q1→﹁ q2的語義真值不一致,不符合 “﹁ ﹁ P==P”的標(biāo)準(zhǔn),因此從形式語義學(xué)來看,緊縮語義結(jié)構(gòu)不是雙重否定結(jié)構(gòu)(2)雖然緊縮語義結(jié)構(gòu)不是雙重否定結(jié)構(gòu),但是比起普通的并列結(jié)構(gòu),緊縮語義結(jié)構(gòu)仍然具有其獨特的表達功能,應(yīng)該與其他結(jié)構(gòu)區(qū)分開,未來我們希望能對其展開進一步的研究。。

表2 緊縮結(jié)構(gòu)語義真值表

并列結(jié)構(gòu)的“不V1(……)不V2”,指“不哭不鬧”“不高不低” 這一類表達。袁毓林[12]提出并列結(jié)構(gòu)“通常不能通過直接在這種謂詞性并列結(jié)構(gòu)的前面加上‘不、沒有’等否定詞來構(gòu)成否定式,而是要在這種并列結(jié)構(gòu)的各個直接成分之前分別加上‘不、沒有’等否定詞?!币虼?,“不V1不V2”只是“V1V2”并列結(jié)構(gòu)的一重否定結(jié)構(gòu),不屬于雙重否定結(jié)構(gòu)。如“不哭不鬧”不等于“哭鬧”。

1.4 “不+V1+不+V2”/“不+V1+……+不+V2”(述賓結(jié)構(gòu))

述賓結(jié)構(gòu)的“不+V1+(……)+不+V1”指“不覺得不好”、“不知道你不來”等V1為述語,“不V2”為賓語的結(jié)構(gòu)。該結(jié)構(gòu)中存在一部分結(jié)構(gòu),其“不V1”對“不V2”有語義指向,屬于雙重否定結(jié)構(gòu),如例7所示;同時還存在一部分結(jié)構(gòu)“不V1”與“不V2”之間沒有語義指向,不是雙重否定結(jié)構(gòu),如例6所示。

[例6]a. 我不知道你不來。(述賓)

b. #我知道你來。(述賓)

[例7]a. 平時也是人來人往,我不相信你不難受。(述賓)

b. 平時也是人來人往,我相信你難受。(述賓)

因此,對于述賓結(jié)構(gòu)的“不+V1+(……)+不+V2”,本文的主要任務(wù)是找出其中“不V1”對“不V2”存在語義指向、屬于雙重否定的結(jié)構(gòu),并提取其特征,制定識別規(guī)則。下面將以“不+V1+……+不+V2”為對象進行討論。

1.4.1 第一個條件: V1為非敘實動詞

首先我們需要確定在什么情況下“不V1”對“不 V2”具有語義指向與管轄功能。

[例8]a. 我不知道他不來。

b. #我知道他來。

[例9]a. 我不幻想他不來。

b. #我幻想他來。

[例10]a. 我不認(rèn)為他不來。

b. 我認(rèn)為他來。

通過例句,可以發(fā)現(xiàn),當(dāng)V1為“認(rèn)為”時,“不+V1+……+不+V2”可以轉(zhuǎn)換成“V1+……+V2”,而當(dāng)V1為“知道”“幻想”時卻不能轉(zhuǎn)換。同樣是動詞,“知道”“幻想”“認(rèn)為”卻存在著區(qū)別。本文認(rèn)為,“不V1”對“不 V2”是否有語義指向或管轄的作用與V1的語義有關(guān),具體來說與V1的敘實性有關(guān)。

李新良等[13]將敘實性定義為“敘實性是動詞的一種語義功能,即動詞預(yù)設(shè)其賓語小句真值的能力。具體來說,肯定式和否定式都預(yù)設(shè)其賓語小句為真的動詞是敘實動詞……肯定式和否定式都不預(yù)設(shè)其賓語小句為真,也不預(yù)設(shè)其賓語小句為假的動詞是非敘實動詞……肯定式和否定式都預(yù)設(shè)其賓語小句為假的動詞是反敘實動詞”。因此,對于敘實動詞和反敘實動詞來說,由于其預(yù)設(shè)固定,無論主句有無否定,賓語小句的真值都不變,因此主句無法影響賓語小句的真值,不構(gòu)成“﹁ ﹁ P==P”。然而,對于非敘實動詞(如: 認(rèn)為)來說,由于非敘實動詞對賓語小句并沒有預(yù)設(shè),在述賓結(jié)構(gòu)中,主句中的V1可以對賓語的真值造成影響,具有“﹁ ﹁ P==P”的可能。因此,本文提出述賓結(jié)構(gòu)“不+V1+……+不+V2”構(gòu)成雙重否定的第一個條件: V1為非敘實動詞。

1.4.2 第二個條件: “不V1”的否定焦點包含V2

該條件只對分開的“不+V1+……+不+V2”有約束,對于緊連的“不+V1+不+V2”并無影響。當(dāng)主句V1確定為非敘實動詞時,該句子并不一定為雙重否定句。示例如下:

[例11]a. 我不認(rèn)為他不來。

b. 我認(rèn)為他來。

[例12]a. 我不認(rèn)為他故意不來。

b. #我認(rèn)為他故意來。

[例13]a. 我不相信他不喜歡我。

b. 我相信他喜歡我。

[例14]a. 我不相信他不喜歡我到了看見我就惡心的地步。

b. #我相信他喜歡我到了看見我就惡心的地步。

在例句中,例11a、例13a可以轉(zhuǎn)換為例11b、例13b,而例12a、例14a卻不能轉(zhuǎn)換為例12b、例14b。為何?本文認(rèn)為這主要與否定的焦點有關(guān)。袁毓林[14]指出“有的成分表達的是句子的預(yù)設(shè)意義,屬于舊信息,事實上它們的意義在否定的情況下仍然得以保持;有的成分表達的是句子的焦點意義,屬于新信息,它們是真正被否定的?!碑?dāng)V2不是否定焦點時,“不V1”并不會對V2進行否定,不構(gòu)成“﹁ ﹁ P”,不滿足“﹁ ﹁ P==P”的條件,不屬于雙重否定結(jié)構(gòu)。例如“我不認(rèn)為他故意不來”中的“不V1”否定的是“故意”而不是“不來”,其中的“不來”是預(yù)設(shè)成分,屬于舊信息,其真值不受“不V1”的影響。如:

[例15]a. 我不認(rèn)為他故意不來。預(yù)設(shè): 他不來。

b. 我認(rèn)為他故意不來。預(yù)設(shè): 他不來。

結(jié)合袁毓林[14]關(guān)于否定詞焦點與轄域的觀點,本文將“不V1……不V2”中“不V1”的否定焦點的情況歸結(jié)如下:

(1) 若V2存在謂語狀語或者謂語補語,則謂語狀語或者謂語補語是否定焦點;反之,則V2是否定焦點;

(2) 若V2的狀語、補語、賓語中含有全稱量詞或者“一+量”時,量詞為否定焦點。

[例16]a. 我不認(rèn)為他每一天都不來。

b. #我認(rèn)為他每一天都來。

[例17]a. 我不認(rèn)為他不喜歡所有人。

b. #我認(rèn)為他喜歡所有人。

由此本文提出述賓結(jié)構(gòu)的“不V1……不V2”構(gòu)成雙重否定的第二個條件: 不V1的否定焦點包含V2。這一條件同樣適用于“不+是+……+不+V2”。具體參照1.2.2。

2 雙重否定自動識別程序的建立

2.1 詞庫的建立

為了使計算機能夠識別助動詞、非敘實動詞,本文對助動詞與非敘實動詞進行了梳理,在常用的基礎(chǔ)詞表中補充了助動詞詞表與非敘實動詞詞表。

助動詞方面,本文以鄭貴友[15]整理的助動詞范圍為基本,結(jié)合魯曉琨[16]等前人的研究以及現(xiàn)代漢語的使用情況,選取了26個助動詞,構(gòu)成常用助動詞詞表。具體如下:

能、能夠、可能、會、可以、應(yīng)該、應(yīng)、應(yīng)當(dāng)、要、得、愿意、愿、甘愿、肯、可、情愿、想、要、敢、該、配、當(dāng)、準(zhǔn)、許、得、容;

非敘實動詞方面,結(jié)合袁毓林、李新良等人對非敘實動詞的研究,本文認(rèn)為非敘實動詞多為心理動詞。因此本文對心理動詞進行了考察。若一個心理動詞的賓語真值未被預(yù)設(shè),則該心理動詞為非敘實動詞。以此為標(biāo)準(zhǔn),本文在心理動詞中篩選出了24個非敘實動詞(3)非敘實動詞的界限并不是完全清晰的。非敘實動詞與敘實動詞、反敘實動詞之間還存在漂移現(xiàn)象。由于其情況較為復(fù)雜,且對本文研究的影響較小,故暫不討論。 ② “不是不”結(jié)構(gòu)199句中包含了“豈不是”等“不+反問句式”的句子,排除后,為192句。整理如下:

認(rèn)為、覺得、想(料想、猜想)、感到、情愿、相信、樂意、愿意、盼望、希望、猜、猜測、揣測、揣摩、推測、估計、估摸、猜想、考慮、打算、說(認(rèn)為)、同意、贊同、允許;

2.2 雙重否定自動識別程序的流程

以第1節(jié)所討論的語法規(guī)則為核心,本文設(shè)計了雙重否定自動識別程序。程序的輸入為含有兩個副詞詞性“不”的語料txt文件,輸出為一個結(jié)果txt文件。輸出的結(jié)果分為兩個部分,一是所有識別出的含有雙重否定結(jié)構(gòu)的句子及其雙重否定結(jié)構(gòu)類型;二是語料總句數(shù)、雙重否定句子句數(shù)、各雙重否定結(jié)構(gòu)的句子句數(shù)等統(tǒng)計信息。示例如圖2所示。

圖2 實驗結(jié)果示例圖②

具體程序的識別步驟如下:

(1) 通過Python程序使用哈工大LTP對語料進行分句、分詞、詞性標(biāo)注;對每一個句子進行以下(2)~(6)操作。

(2) 檢測其是否含有“不+助動詞+不+V”結(jié)構(gòu),若含有,則為雙重否定句,其雙重否定結(jié)構(gòu)為“不+助動詞+不+V”,將句子寫入文件并歸入數(shù)據(jù)統(tǒng)計,跳過后續(xù)步驟。若不含有,則進行下一步。

(3) 檢測其是否含有“不+助動詞+非敘實動詞+不+V”結(jié)構(gòu),若含有,則為雙重否定句,其雙重否定結(jié)構(gòu)為“不+助動詞+非敘實動詞+不+V”,將句子寫入文件并歸入數(shù)據(jù)統(tǒng)計,跳過后續(xù)步驟。若不含有,則進行下一步。

(4) 對句子進行句法分析。

(5) 檢測其是否含有述賓關(guān)系的“不+非敘實動詞(+……)+不+V”結(jié)構(gòu),若含有,則為雙重否定句,其雙重否定結(jié)構(gòu)為“不+非敘實動詞(+……)+不+V”,將句子寫入文件并歸入數(shù)據(jù)統(tǒng)計,跳過后續(xù)步驟。若不含有,則進行下一步。

(6) 檢測其是否含有述賓關(guān)系且“不是”為語義真值否定(通過否定值判斷)的“不+是(+……)+不+V”結(jié)構(gòu),若含有,則為雙重否定句,其雙重否定結(jié)構(gòu)為“不+是(+……)+不+V”,將句子寫入文件并歸入數(shù)據(jù)統(tǒng)計,跳過后續(xù)步驟。若不含有,則該句不含有雙重否定結(jié)構(gòu),進行數(shù)據(jù)統(tǒng)計。

3 雙重否定自動識別實驗

3.1 實驗語料來源

本文在CCL語料庫中,提取了100 000條含有“不”的語料,并通過程序從中抽取含有兩個副詞詞性“不”的句子,共計28 033句,以此為“不”的基礎(chǔ)語料,測試雙重否定識別程序的正確率。同時,本文從28 033句語料中選取了1 000條語料作為人工檢測語料,以測試雙重否定識別程序的召回率。

3.2 實驗結(jié)果

本文使用雙重否定識別程序?qū)?8 033句語料進行識別,獲得了894句含有雙重否定結(jié)構(gòu)的句子。經(jīng)人工的檢校,發(fā)現(xiàn)以上894個句子中,含有雙重否定結(jié)構(gòu)的句子數(shù)為878,該程序識別正確率為98.21%。具體如表3所示(4)由于文章討論的范圍限制,刪去了“豈不是”這類“不+反問詞”的句子。。

表3 實驗結(jié)果統(tǒng)計表

為了測試該程序的召回率,本文人工對1 000句語料進行檢校,篩選出了29句含有雙重否定結(jié)構(gòu)的句子。本文將這1 000句語料輸入到雙重否定識別程序中,程序識別出了27句含有雙重否定結(jié)構(gòu)的句子。因此,該程序的召回率約為93.10%。根據(jù)F1值公式與上述數(shù)據(jù),該程序的F1值為95.58%。

3.3 實驗分析

無論是正確率還是召回率,實驗的準(zhǔn)確率都是在百分之九十多,未達到百分之百。我們對以上三個未達到百分百正確率的雙重否定結(jié)構(gòu)的語料進行分析。結(jié)果顯示,程序識別與召回錯誤主要與句子的句法分析錯誤有關(guān)。由于分詞與句法分析等基礎(chǔ)自然語言處理工具的問題,程序?qū)σ恍┚渥拥木浞ㄅ袛噱e誤,導(dǎo)致一些原本應(yīng)被判為并列結(jié)構(gòu)、因果關(guān)系的成分,被誤判為述賓結(jié)構(gòu),從而使整個雙重否定結(jié)構(gòu)的識別錯誤。例句如下:

[例18]如果用適用各種土質(zhì)的幾十臺鉆機同時作業(yè),電力條件不允許,地下管網(wǎng)不安全。

[例19]……每到拔棉柴時,農(nóng)民心里直犯愁,用手拔吧,費工費時不說,拔不了多少,便滿手血泡。有的急于求成把將來要辦的事情,拿到今天來辦,由于條件不允許遲遲開展不了。

以上例句中,V1與V2都不構(gòu)成述賓結(jié)構(gòu),不符合程序中雙重否定結(jié)構(gòu)的規(guī)則,然而程序并未檢索出這一點,導(dǎo)致識別錯誤。這個問題主要與句法分析的處理工具有關(guān),本文暫時無法對其進行進一步的改進。

除此之外,還有一些句子的識別錯誤,是由于結(jié)構(gòu)格式總結(jié)疏漏所造成的。例句如下:

[例20]因為他們不是不懂足球,便是偏愛市井蜚聞的幫閑之輩。

上述例句,其結(jié)構(gòu)為“不是……便是……”,整體為選擇并列的關(guān)系。其中“不是不懂足球”中的“不是”并不表示否定,而是選擇??梢岳斫鉃椤耙词遣欢闱颉?,因此不屬于雙重否定結(jié)構(gòu)。然而由于我們歸納結(jié)構(gòu)格式時,沒有考慮到類似的特殊結(jié)構(gòu),將其簡單地歸入了“不是不”,從而導(dǎo)致了錯誤。這一問題,可以通過更多次的實驗與總結(jié)來改進。

4 結(jié)語

本文通過遍歷考察對現(xiàn)有的雙重否定結(jié)構(gòu)形式進行了補充,從“非敘實動詞”與“否定焦點”的角度對述賓式“不+V1+……+不+V2”雙重否定結(jié)構(gòu)成立的條件進行了討論。實踐方面,基于文中所提識別策略,設(shè)計了“不”的雙重否定自動識別程序,對28033句語料進行了識別,識別正確率為98.21%,召回率約為93.10%,F(xiàn)1值約為95.58%,并在此過程中補充了助動詞詞表與非敘實動詞詞表。以上結(jié)果表明基于規(guī)則的雙重否定自動識別具有一定的實踐性。然而,本文的討論范圍還限于“不V1不V2”這一個格式。未來,將引入更多的雙重否定結(jié)構(gòu),全面地對雙重否定進行考察,以期能夠真正地實現(xiàn)計算機對雙重否定的自動識別,將其應(yīng)用于文本分析、問答系統(tǒng)等自然語言處理應(yīng)用當(dāng)中。

猜你喜歡
助動詞真值雙重
自然與成長的雙重變奏
從推量助動詞看日語表達的曖昧性
助動詞的用法
化解“雙重目標(biāo)”之困
中國外匯(2019年7期)2019-07-13 05:44:56
維吾爾語助動詞及其用法
語法學(xué)堂 助動詞怎么"助"?
10kV組合互感器誤差偏真值原因分析
電子制作(2017年1期)2017-05-17 03:54:35
真值限定的語言真值直覺模糊推理
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價算法
“雙重打擊”致恐龍滅絕
沂南县| 佛冈县| 平泉县| 广德县| 房山区| 屏山县| 麻栗坡县| 行唐县| 芮城县| 历史| 华安县| 江华| 象山县| 讷河市| 日喀则市| 定安县| 南安市| 囊谦县| 衢州市| 台东县| 寿阳县| 滕州市| 布拖县| 瓮安县| 平舆县| 马山县| 耒阳市| 许昌县| 荆门市| 婺源县| 佳木斯市| 普安县| 合山市| 辽阳市| 泾川县| 铅山县| 罗平县| 柏乡县| 武义县| 鄢陵县| 明溪县|