黃培紅
(中國(guó)農(nóng)業(yè)銀行莆田分行,莆田351100)
?
自然語(yǔ)言加工中What-Why理解效應(yīng)
黃培紅
(中國(guó)農(nóng)業(yè)銀行莆田分行,莆田351100)
摘要:通過(guò)使用一種迫選范式發(fā)現(xiàn)語(yǔ)言加工中what-why因素引起的理解效應(yīng)。進(jìn)一步研究發(fā)現(xiàn),what因素在語(yǔ)言理解效應(yīng)中首先被激活,然而,why因素對(duì)what理解效應(yīng)產(chǎn)生交互作用,對(duì)理解效應(yīng)也是必不可少的。what因素與why因素共同引發(fā)自然語(yǔ)言加工過(guò)程中的理解效應(yīng)。同時(shí),通過(guò)理解效應(yīng)實(shí)驗(yàn),其輸出的結(jié)果進(jìn)一步驗(yàn)證what-why理解效應(yīng)規(guī)律的正確性。
關(guān)鍵詞:自然語(yǔ)言加工;what-why因素;理解效應(yīng)
無(wú)論融會(huì)貫通還是抽象思維,無(wú)不建立在理解之上,理解構(gòu)成了人類(lèi)思維活動(dòng)的基礎(chǔ),因而有必要把理解作為科學(xué)問(wèn)題加以研究。對(duì)事物的理解,常常有這樣的經(jīng)驗(yàn):第一是要知道該事物是什么(稱(chēng)為what因素);第二是凡事要問(wèn)個(gè)為什么(稱(chēng)為why因素),之后,該事物得以理解。what與why因素可能影響對(duì)事物的理解,需要實(shí)驗(yàn)驗(yàn)證。本研究將主要研究這個(gè)問(wèn)題。
目前國(guó)內(nèi)外有些人在研究自然語(yǔ)言的理解問(wèn)題,一種認(rèn)為理解就是對(duì)語(yǔ)法、語(yǔ)義與語(yǔ)用的理解,例如系統(tǒng)語(yǔ)法、格語(yǔ)法[1-2]等。這種觀點(diǎn)與心理學(xué)觀點(diǎn)相一致。格語(yǔ)法認(rèn)為句子由中心動(dòng)詞與深層格組成,而深層格包括施事格、對(duì)象格等,當(dāng)一個(gè)句子分析出深層格時(shí),即理解了該句子。還有一種觀點(diǎn)認(rèn)為理解即對(duì)概念的理解。美國(guó)Yale大學(xué)的R.Schank[3]及同事提出CD理論(概念依存關(guān)系理論),認(rèn)為人腦中存在某種概念基礎(chǔ),語(yǔ)言理解就是對(duì)概念的映射過(guò)程。這是種具有影響力的思想。許多典型的語(yǔ)言理解理論都是基于概念理解基礎(chǔ)之上的。例如WordNet[4-8]、本體理論[9-11]等。這些理論對(duì)語(yǔ)義知識(shí)進(jìn)行了表達(dá),其中的知識(shí)由概念、屬性與關(guān)系組成,理論之間的不同之處在于對(duì)知識(shí)的表達(dá)形式不同,數(shù)據(jù)結(jié)構(gòu)不同引起有關(guān)的維護(hù)及操作使用的軟件流程也不盡相同。Winograd[12]完成的SHDRLU系統(tǒng)在狹小的積木世界中,在有限的詞匯上運(yùn)用系統(tǒng)語(yǔ)法進(jìn)行人機(jī)對(duì)話(huà)取得成功。
然而,這些建立在語(yǔ)法、語(yǔ)義、語(yǔ)用或概念理解之上的理論又不得不面對(duì)一個(gè)巨大的障礙,這就是語(yǔ)法、語(yǔ)義、語(yǔ)用、概念、信息等等刺激物的理解問(wèn)題。對(duì)概念的再理解,才能在更深的層次上啟動(dòng)演繹推理或歸納推理。而對(duì)概念的再問(wèn)究,需要弄清楚某一個(gè)具體的概念是什么及涉及的為什么(即相關(guān)道理),從而認(rèn)知系統(tǒng)對(duì)概念產(chǎn)生更加精細(xì)的便于理解的結(jié)構(gòu),這時(shí)它對(duì)現(xiàn)實(shí)世界的規(guī)律的認(rèn)識(shí)與刻畫(huà)便更精細(xì)。概念的再理解是有意義的,然而也是相對(duì)復(fù)雜的。同樣,信息包羅萬(wàn)象,包括事實(shí)、經(jīng)驗(yàn)與知識(shí)等,對(duì)信息的理解并不比對(duì)概念的理解簡(jiǎn)單。SHDRLU人機(jī)對(duì)話(huà)系統(tǒng)擴(kuò)大到真實(shí)的現(xiàn)實(shí)世界時(shí),由于現(xiàn)實(shí)世界充滿(mǎn)不確定性與模糊性,對(duì)文本的進(jìn)一步處理無(wú)能無(wú)力,它很快就陷入困境。而相對(duì)于SHDRLU系統(tǒng),現(xiàn)實(shí)世界之所以會(huì)充滿(mǎn)了不確定性與模糊性,其根本原因是系統(tǒng)對(duì)現(xiàn)實(shí)世界的理解力不足,即并不知道文本及構(gòu)成文本的詞語(yǔ)的真實(shí)意思(語(yǔ)義),亦不具備在文本的深層語(yǔ)義上邏輯推理的能力。心理學(xué)認(rèn)為理解是對(duì)意思的建構(gòu)過(guò)程,并使用信息加工的觀點(diǎn)對(duì)語(yǔ)言理解過(guò)程進(jìn)行了一定的解釋?zhuān)珜?duì)什么是意思(或語(yǔ)義)以及意思的理解還不清楚,對(duì)語(yǔ)言理解這個(gè)復(fù)雜問(wèn)題還未達(dá)到闡述清楚的程度??傊?傳統(tǒng)的自然語(yǔ)言理解理論,對(duì)什么是理解的認(rèn)識(shí)仍處于知其然而不知其所以然的狀態(tài)。理解到底是什么?有哪些規(guī)律?有關(guān)理解的因素及效應(yīng)關(guān)系需要進(jìn)一步研究與驗(yàn)證。
值得一提的是,物理學(xué)定律是從大量事實(shí)基礎(chǔ)上總結(jié)并經(jīng)實(shí)驗(yàn)驗(yàn)證而獲得的。歷史上,胡克定律先總結(jié)出受力與形變成正比,然后實(shí)驗(yàn)驗(yàn)證。牛頓三定律也采用同樣方法總結(jié)與驗(yàn)證。本研究比照物理學(xué)定律的提出與驗(yàn)證方法進(jìn)行理解效應(yīng)的相關(guān)因素的研究驗(yàn)證。本研究進(jìn)一步驗(yàn)證what與why因素是否與理解效應(yīng)構(gòu)成因果關(guān)系,采用理解效應(yīng)的一種迫選范式來(lái)研究語(yǔ)言材料的理解問(wèn)題,實(shí)驗(yàn)中包含what條件和why條件。為探討在語(yǔ)言材料理解中是否存在what-why理解效應(yīng)現(xiàn)象,在實(shí)驗(yàn)中包括了一種非what-why條件對(duì)照。在這個(gè)對(duì)照組條件下,只呈現(xiàn)無(wú)關(guān)的背景音樂(lè)。當(dāng)前的研究中還控制了what、why等因素,并且考察這些因素如何協(xié)同影響理解效應(yīng)。理解效應(yīng)是人類(lèi)智能的基礎(chǔ)要素。無(wú)論是談話(huà)、作文還是閱讀思考,抑或是做事、決斷以及日常生活,人類(lèi)天天在使用理解機(jī)制。理解問(wèn)題的重要性可見(jiàn)一斑,理解效應(yīng)的規(guī)律研究無(wú)疑具有意義,它是類(lèi)腦計(jì)算的重要內(nèi)容。
what因素與why因素對(duì)理解效應(yīng)的影響研究以前還沒(méi)有文獻(xiàn)報(bào)告過(guò)。本文報(bào)告詞、句、篇的理解效應(yīng)實(shí)驗(yàn),對(duì)理解的特性及其形成過(guò)程進(jìn)行試驗(yàn),進(jìn)而對(duì)what-why理解效應(yīng)的正確性進(jìn)行實(shí)驗(yàn)驗(yàn)證。這些試驗(yàn)采用被試不理解的實(shí)驗(yàn)材料,本研究觀察被試使用這些實(shí)驗(yàn)材料進(jìn)行試驗(yàn)中,從不解狀態(tài)到理解狀態(tài)轉(zhuǎn)變過(guò)程中所涉及的數(shù)據(jù)點(diǎn),進(jìn)而觀察what-why條件與理解效應(yīng)的關(guān)系,關(guān)鍵是要考察what因素與why因素對(duì)理解效應(yīng)的產(chǎn)生是否充分,以及這兩個(gè)因素是不是必要條件?本研究假設(shè)what-why變量可引發(fā)理解效應(yīng),那么當(dāng)被試對(duì)刺激物進(jìn)入不理解狀態(tài)時(shí)加入變量值,預(yù)期會(huì)引發(fā)被試對(duì)刺激物的理解效應(yīng);若未加入變量值,則預(yù)期被試無(wú)法產(chǎn)生理解效應(yīng)。
1.1被試
21人正常狀況下的學(xué)生自愿參加實(shí)驗(yàn),從17歲到24歲,平均年齡18.4歲。右利手,視力或矯正視力正常。實(shí)驗(yàn)前不知道此次實(shí)驗(yàn)的目的,實(shí)驗(yàn)時(shí)給出被試相應(yīng)的實(shí)驗(yàn)要求。
1.2實(shí)驗(yàn)儀器
本實(shí)驗(yàn)機(jī)器用IBM2780,CPU2.4GHz,操作系統(tǒng)Linux,軟件為understanding-soft軟件。機(jī)器與軟件均為正常狀態(tài)。
1.3實(shí)驗(yàn)設(shè)計(jì)
本實(shí)驗(yàn)采用迫選范式,實(shí)驗(yàn)為被試內(nèi)設(shè)計(jì),共有2個(gè)自變量,即what因素(刺激物的含義)、why因素(真值推理過(guò)程),其刺激類(lèi)型為詞、句、篇語(yǔ)言材料。通過(guò)比較被試對(duì)語(yǔ)言刺激物詞、句、篇在輸入與非輸入what值條件,以及輸入與非輸入why值條件后,在迫選任務(wù)中是否理解目標(biāo)語(yǔ)言材料的正確率,來(lái)考察what和why條件是如何影響認(rèn)知系統(tǒng)對(duì)刺激物的理解。
對(duì)詞語(yǔ)等語(yǔ)言材料的理解過(guò)程通常都是從不理解到理解的過(guò)程,本設(shè)計(jì)就是考察不理解到理解的輸入量。對(duì)這些語(yǔ)言材料,本實(shí)驗(yàn)先通過(guò)讓被試事先挑選,設(shè)法讓他們進(jìn)入不理解狀態(tài)。如果認(rèn)知系統(tǒng)從不理解狀態(tài)加上自變量賦值后,其狀態(tài)變?yōu)槔斫鉅顟B(tài),那么,該自變量的賦值就是理解效應(yīng)的原因。本文把該自變量設(shè)為語(yǔ)言材料的what與why因素,自變量賦值即給語(yǔ)言材料是什么及為什么賦予值。
定義1 what-why效應(yīng)是指當(dāng)認(rèn)知系統(tǒng)知道刺激物是什么及為什么時(shí)產(chǎn)生的心里反應(yīng)。
本文考察what-why的理解效應(yīng),即當(dāng)給處于不理解狀態(tài)的被試輸入刺激物的what變量值及why變量值時(shí)是否產(chǎn)生理解效應(yīng),也就是當(dāng)被試知道刺激物是什么及為什么時(shí)是否具有理解的感受或反應(yīng)。本文中what理解效應(yīng),即what條件下的理解效應(yīng);what(或why)值即賦予what(或why)變量的內(nèi)容,或稱(chēng)what(或why)變量的值;what值即意思,why值即道理;what(或why)條件即給出what(或why)值條件,簡(jiǎn)稱(chēng)what(或why)條件。
1.4實(shí)驗(yàn)材料
本文理解效應(yīng)實(shí)驗(yàn),其研究的是自然語(yǔ)言,它的實(shí)驗(yàn)材料對(duì)應(yīng)為自然語(yǔ)言材料,包括詞語(yǔ)、句子以及篇章片段等。實(shí)驗(yàn)共有3個(gè)條件,每個(gè)條件包括100個(gè)語(yǔ)言刺激材料。
詞語(yǔ)條件下的語(yǔ)言材料取自現(xiàn)代漢語(yǔ)詞典中全部的53000多個(gè)詞語(yǔ)。實(shí)驗(yàn)過(guò)程中共取出難于理解的詞語(yǔ)4301個(gè),這些詞匯相對(duì)于被試為罕見(jiàn)詞。詞語(yǔ)材料還包括真假詞,這些詞語(yǔ)用于詞的真假對(duì)理解效應(yīng)是否有影響的實(shí)驗(yàn),所以這些真假詞語(yǔ)包括一半的真詞與一半的假詞,以驗(yàn)證真假詞對(duì)理解效應(yīng)是否產(chǎn)生影響。
句子條件的理解效應(yīng)實(shí)驗(yàn),其語(yǔ)言材料包括無(wú)法理解語(yǔ)句3503個(gè),含歧義句子、不明事理命題、內(nèi)容抽象句子等。這些句子包括命題與非命題。篇章條件下的實(shí)驗(yàn),其研究對(duì)象包括2901個(gè)文章片段或數(shù)學(xué)證明題。相對(duì)于句子理解,篇章理解還涉及了句子間關(guān)系的理解。篇章理解實(shí)驗(yàn)中,本研究略過(guò)各個(gè)句子的理解,單單考察被試對(duì)句子之間關(guān)系的理解。本節(jié)設(shè)計(jì)的涉及篇章的實(shí)驗(yàn)對(duì)象,包括因果關(guān)系、并列關(guān)系、遞進(jìn)關(guān)系、概括關(guān)系等。其關(guān)系的what-why值即關(guān)系的語(yǔ)義。例如,構(gòu)成因果關(guān)系的語(yǔ)句,其語(yǔ)義上構(gòu)成的因果關(guān)系,即因果關(guān)系的what-why值。
1.5實(shí)驗(yàn)過(guò)程
本迫選范式是,實(shí)驗(yàn)儀器給處于目標(biāo)刺激物不解狀態(tài)的被試輸入有關(guān)條件之后,迫使被試根據(jù)是否理解目標(biāo)語(yǔ)言材料,單選“理解”或“不解”答案。本實(shí)驗(yàn)旨在通過(guò)此范式來(lái)考察中文中what與why值的輸入是如何影響認(rèn)知系統(tǒng)對(duì)刺激物的理解的。
每人做11組測(cè)試,每組100個(gè)語(yǔ)言材料。做完1組測(cè)試后休息片刻。首先,被試隨機(jī)選擇出難理解的詞語(yǔ)、句子與篇章,標(biāo)記不理解部分,并形成測(cè)試任務(wù)。被試坐在靜音室中并避免干擾。詞語(yǔ)呈現(xiàn)在計(jì)算機(jī)屏幕的正中央,眼睛距離屏幕70cm,視角24°×30°。左右手食指放在F、J鍵上。雙眼注視屏幕中央,刺激呈現(xiàn)與做反應(yīng)時(shí)盡量減少頭部運(yùn)動(dòng),避免眨眼。每次實(shí)驗(yàn)之前,在屏幕中心會(huì)呈現(xiàn)一個(gè)注視點(diǎn)(大小為4×4個(gè)像素),呈現(xiàn)大約1s后消失.然后在注視點(diǎn)會(huì)立即呈現(xiàn)1個(gè)語(yǔ)言材料,首先被試確認(rèn)進(jìn)入不理解狀態(tài),否則實(shí)驗(yàn)材料無(wú)效,呈現(xiàn)下一語(yǔ)言材料。若是被試已進(jìn)入不理解狀態(tài),則呈現(xiàn)該刺激物的含義與涉及邏輯,導(dǎo)引他/她注視屏幕中央的正確意思。刺激物的含義與涉及邏輯即給出語(yǔ)言材料涉及的what-why值,給出它的確切含義并呈現(xiàn),要求他/她根據(jù)這些語(yǔ)義數(shù)據(jù)提示來(lái)理解該詞語(yǔ)等語(yǔ)言材料。刺激項(xiàng)目的呈現(xiàn)時(shí)長(zhǎng)由之后描述的方法確定。刺激項(xiàng)目呈現(xiàn)消失后,在原先呈現(xiàn)項(xiàng)目的位置會(huì)有理解與不理解的選項(xiàng),被試通過(guò)按鍵從2個(gè)備選答案中做出選擇.電腦記錄相關(guān)實(shí)驗(yàn)數(shù)據(jù)。例如,呈現(xiàn)項(xiàng)目是“嬛嬛”,被試若進(jìn)入不理解狀態(tài),則屏幕會(huì)給出該詞語(yǔ)的含義,即呈現(xiàn)what值(“指女子舞蹈,動(dòng)作柔美貌”)與含義的邏輯值后,呈現(xiàn)2個(gè)備選答案分別為“理解”和“不解”(圖1),軟件自動(dòng)記錄理解反應(yīng)時(shí)。對(duì)句子的理解的例子,例如‘天有不測(cè)風(fēng)云,人有旦夕禍?!睦斫猓跏紬l件若是被試無(wú)法理解該語(yǔ)句,則實(shí)驗(yàn)程序呈現(xiàn)給出相應(yīng)的事實(shí)依據(jù)后,看被試的理解效應(yīng)情況,記錄相應(yīng)的理解實(shí)驗(yàn)結(jié)果。當(dāng)被試完成全部語(yǔ)言材料理解測(cè)試,則完成實(shí)驗(yàn)。對(duì)抽象難解的命題,則給予充分的理由與解釋?zhuān)幢辉囀欠癞a(chǎn)生理解效應(yīng)。又如對(duì)“停止杯葛亞投行”的理解,初始狀態(tài)因?qū)Α氨稹辈焕斫舛鴮?dǎo)致被試的整個(gè)語(yǔ)句不理解狀態(tài),當(dāng)給出杯葛的確切含義為“抵制”時(shí),被試確切獲得了整個(gè)語(yǔ)句的含義,從而理解該語(yǔ)言材料,電腦記錄相關(guān)數(shù)據(jù)。對(duì)命題“碳酸飲料對(duì)牙齒的腐蝕作用”的理解,首先給出實(shí)驗(yàn)過(guò)程及結(jié)果材料說(shuō)明以確定它的真值性,用事實(shí)證明碳酸飲料確實(shí)會(huì)對(duì)牙齒產(chǎn)生腐蝕作用,并對(duì)反例給出原因說(shuō)明,最后要求被試作出反應(yīng),系統(tǒng)記錄被試?yán)斫庠撁}的實(shí)驗(yàn)結(jié)果。本實(shí)驗(yàn)中,對(duì)語(yǔ)言材料的理解,若被試仍處于疑惑、不能確定、似是而非的狀態(tài),其實(shí)驗(yàn)結(jié)果選擇為“不解”。
圖1 實(shí)驗(yàn)過(guò)程流程圖
為讓被試熟悉實(shí)驗(yàn)程序,實(shí)驗(yàn)正式開(kāi)始前有15個(gè)練習(xí)機(jī)會(huì)。本實(shí)驗(yàn)通過(guò)90個(gè)調(diào)整試次來(lái)決定刺激的呈現(xiàn)時(shí)間。如果被試在不到10次實(shí)驗(yàn)之內(nèi)做出2次錯(cuò)誤反應(yīng),則刺激呈現(xiàn)時(shí)間就會(huì)增加一個(gè)幀大約120s.刺激材料呈現(xiàn)時(shí)間確定后,將呈現(xiàn)20個(gè)練習(xí)試次,練習(xí)試次中會(huì)包括所有實(shí)驗(yàn)條件。
表1 真假詞條件下的理解率(%)a)
首先考察真假詞對(duì)語(yǔ)言材料理解效率的影響.把語(yǔ)言材料的what理解率作為因變量,將詞語(yǔ)真假、why變量作為被試內(nèi)因素進(jìn)行了方差分析。結(jié)果顯示,給出語(yǔ)言材料刺激物what值條件下的正確率(70.64%)要顯著高于非what值情況(0.45%, F(1,20)=3781,P<0.001)。當(dāng)給出why值時(shí),反應(yīng)的正確率有越來(lái)越高的趨勢(shì)(F(1,20)=53700,P<0.001)。詞真假的主效應(yīng)不顯著(F<1),見(jiàn)表1。由于真詞與假詞條件下的正確率無(wú)差異,因而詞真假因素不作為一個(gè)參數(shù)參與以下的數(shù)據(jù)分析。從不理解到理解狀態(tài)與詞語(yǔ)是否真假無(wú)關(guān),可能詞語(yǔ)本身只是一種形式上的標(biāo)識(shí),其標(biāo)識(shí)下的語(yǔ)義即what-why值才最重要,詞語(yǔ)本身僅僅為語(yǔ)義的標(biāo)識(shí)而已。
2.1詞語(yǔ)和語(yǔ)句
將詞、句在輸入與非輸入what-why條件下理解率做方差分析。將what(輸入或非輸入值)和why(輸入或非輸入值)作為被試內(nèi)變量,對(duì)理解率進(jìn)行了方差分析。假如存在what-why理解效應(yīng),期待存在自變量的主效應(yīng)或出現(xiàn)與理解效應(yīng)相關(guān)的交互作用.假如某個(gè)變量(what或why)對(duì)理解效應(yīng)的大小產(chǎn)生影響,期待變量之間產(chǎn)生交互作用。結(jié)果表明,what-why的主效應(yīng)邊緣顯著(F(1,20)=74907,P<0.001)。在what-why條件下(99.00%)正確理解率比在非輸入what-why條件(0.73%)下的正確率更高。本測(cè)試的有效率達(dá)到99%,其中不理解的情況是因?yàn)閷?duì)含義中的有些詞不理解,當(dāng)給出這些詞的含義后獲理解。這也是詞語(yǔ)理解僅當(dāng)其語(yǔ)義被真正理解之后的印證。無(wú)論是詞語(yǔ)、語(yǔ)句,還是歧義句子、抽象句子,由于它們的初狀態(tài)都是不理解,只要賦給值,即知道了句子的具體的what-why值后,這些語(yǔ)言刺激物都從不解狀態(tài)順變?yōu)榭衫斫鉅顟B(tài)。表2還顯示非what條件或非why條件下,理解率都很低(<1%)。
表2 詞/句的what-why條件下的理解率(%)a)
更重要的是,在what條件和why條件之間發(fā)現(xiàn)了交互作用(F(1,20)= 40523,P<0.01)。當(dāng)what條件時(shí),why條件下的正確率比非why條件下高97.18%,但是當(dāng)非what條件時(shí),正確率下降了98%。事后檢驗(yàn)表明, why條件下的這種差異是顯著的(F(1,20)=66027,P<0.01)。這一結(jié)果表明,在why條件時(shí)出現(xiàn)了what理解效應(yīng)。由表3可以看出, why-what序列條件下的理解效應(yīng)(1.00%)比what-why序列條件時(shí)要?。?7.64%)。事后檢驗(yàn)表明,這個(gè)差異邊緣顯著(F(1,20)=56542,P <0.001)。結(jié)果顯示,理解效應(yīng)的大小還和what-why先后次序相關(guān),what-why序列時(shí)理解效應(yīng)更大。
2.2篇章
為了比較篇章條件下語(yǔ)言材料閱讀理解中whatwhy條件下的理解效應(yīng)是否比非what-why呈現(xiàn)時(shí)的理解率高,將what-why條件和非what-why條件下語(yǔ)言材料的理解率做方差分析。與上節(jié)的分析方法類(lèi)似,將刺激類(lèi)型(語(yǔ)句關(guān)系)的what因素(輸入或非輸入值)和why因素(輸入或非輸入值)作為被試內(nèi)變量。
句篇理解包括語(yǔ)句的理解及句子間關(guān)系的理解,關(guān)系的理解基于語(yǔ)句的理解之上,本節(jié)單獨(dú)考察句子間關(guān)系的理解效應(yīng)。假如存在what-why理解效應(yīng),本研究期待句子間的關(guān)系理解也存在自變量的主效應(yīng)或出現(xiàn)與理解效應(yīng)相關(guān)的交互作用。關(guān)系代詞僅僅是一種提示,既需要知道具體的關(guān)系是什么,還需要從這種提示中對(duì)實(shí)質(zhì)性的內(nèi)容進(jìn)行驗(yàn)證,即驗(yàn)證其why值,以確認(rèn)這些關(guān)系是否為真,若為真,則得到真正的理解。比較語(yǔ)句間關(guān)系的理解與不理解的情況,結(jié)果表明,語(yǔ)句間關(guān)系的what-why因素的主效應(yīng)顯著(F(1,20)= 76311,P<0.001), what與why條件同時(shí)呈現(xiàn)(98.73%)比非what-why(0.82%)時(shí)的正確率更高。表3顯示,與非what-why條件呈現(xiàn)時(shí)相比,當(dāng)輸入what-why值時(shí),出現(xiàn)了理解效應(yīng),而當(dāng)what或why值不呈現(xiàn)時(shí)都沒(méi)有發(fā)現(xiàn)理解效應(yīng)。語(yǔ)句及其語(yǔ)句之間的關(guān)系,當(dāng)且僅當(dāng)what-why條件得到滿(mǎn)足時(shí),被試對(duì)這些句群出現(xiàn)理解效應(yīng)(理解效應(yīng)量大于97.27)。少數(shù)不理解的原因是對(duì)賦值中的部分詞語(yǔ)不理解造成的,這些詞語(yǔ)理解后被試對(duì)句群集進(jìn)入理解狀態(tài)。
表3 不同條件下的理解率與理解效應(yīng)大?。ǎィ゛)
另外, what與why條件的交互作用也顯著(F (1,20)= 46922, P<0.001)。在what條件時(shí), why條件下的正確率比非why條件高出97.27%;雖然二者都知道連詞的意思,但前者還知道句子之間的連詞關(guān)系的why值,后者(非why條件)則不理解句子之間的連詞關(guān)系。結(jié)果表明,在懂得語(yǔ)句意思的條件下,當(dāng)懂得關(guān)系的what-why值,被試則真正理解語(yǔ)句之間的關(guān)系,從而理解該句群。但是當(dāng)what值不呈現(xiàn)時(shí),理解率為0.45%。事后檢驗(yàn)表明why條件下這些差異顯著(F (1,20)=82293,P<0.001)。表3顯示,語(yǔ)句間關(guān)系的what-why序列因素的主效應(yīng)邊緣顯著(F(1,20)= 55765, P<0.001)。若當(dāng)不理解狀態(tài)加上知道what-why 值,并且加上what-why序列因素則處于理解狀態(tài);而當(dāng)不理解狀態(tài)下,若被試不知道該句子關(guān)系的what-why值或what-why先后失序則還是處于不理解狀態(tài),這就證明what-why先后序列也參與導(dǎo)致句子關(guān)系的理解效應(yīng)。
通過(guò)比較what-why條件和非what-why條件下的語(yǔ)言材料理解效應(yīng)的正確率,發(fā)現(xiàn)了what-why理解效應(yīng)。與非what-why條件相比,在what-why條件下該刺激物被理解率更高,前者理解率接近100%后者理解率接近于0。從表3可以看出,當(dāng)沒(méi)有輸入what值或why值時(shí),理解率均很低,沒(méi)有出現(xiàn)理解效應(yīng),但輸入what值與why值后,被試出現(xiàn)理解效應(yīng),說(shuō)明兩個(gè)因素都出現(xiàn)時(shí)產(chǎn)生理解效應(yīng),而少了任何一個(gè)條件,都不能出現(xiàn)理解效應(yīng)。這些結(jié)果表明對(duì)于理解效應(yīng)來(lái)說(shuō),what因素與why因素對(duì)理解加工都有影響,都是必不可少的,而且是充分的,即兩個(gè)因素決定了理解效應(yīng)。通俗地講,當(dāng)認(rèn)知系統(tǒng)知道了詞、句、篇是什么意思及為什么(即體會(huì)到語(yǔ)言材料及其含義的正確性)的時(shí)候,對(duì)這些語(yǔ)言材料的理解即可由不理解狀態(tài)進(jìn)入理解狀態(tài),被試也就理解了該刺激物。語(yǔ)言材料獲得理解的充要條件是對(duì)應(yīng)的語(yǔ)義及其邏輯均獲得理解。這一點(diǎn)與平常的經(jīng)驗(yàn)認(rèn)識(shí)是一致的。理解是一種情感標(biāo)識(shí),當(dāng)明白被測(cè)對(duì)象是什么并確認(rèn)它的真值即知道為什么時(shí)疑惑消除,認(rèn)知系統(tǒng)也就懂得了該對(duì)象,從而產(chǎn)生理解效應(yīng)。隨后,認(rèn)知系統(tǒng)標(biāo)識(shí)該刺激物及其what-why值,并記入認(rèn)知系統(tǒng)之內(nèi)以備用。總之,what條件與why條件結(jié)合起來(lái)協(xié)同產(chǎn)生對(duì)刺激物的理解效應(yīng)。
本研究還發(fā)現(xiàn)what條件與why條件對(duì)理解效應(yīng)的作用具有不同之處。在被試知道What值條件下,比較why與非why條件,發(fā)現(xiàn)只在why條件時(shí)產(chǎn)生了理解效應(yīng),而在非why條件或非what條件下均沒(méi)有發(fā)現(xiàn)類(lèi)似的現(xiàn)象。這個(gè)結(jié)果表明,一是語(yǔ)言材料的理解加工除了受到what條件的加工的影響外,同樣具有why條件依賴(lài)性,并不是被what條件獨(dú)立理解的,以至于當(dāng)非why條件時(shí),語(yǔ)言材料的理解加工無(wú)法進(jìn)行下去。說(shuō)明除了知道what值外,還要道理理解,否則無(wú)法產(chǎn)生理解效應(yīng)。二是表明Why值對(duì)what理解效應(yīng)產(chǎn)生交互作用。認(rèn)知系統(tǒng)知道了刺激物是什么后,why值還對(duì)該知道的內(nèi)容進(jìn)行求證交互,只有該內(nèi)容全部是真值后,才能沒(méi)有疑惑,才能理解該理解對(duì)象。因此,如果沒(méi)有why值驗(yàn)證或不符合道理的話(huà),認(rèn)知系統(tǒng)還是無(wú)法產(chǎn)生理解效應(yīng)。有了why值,才能確認(rèn)內(nèi)容為真值,若非真值,則須通過(guò)why值調(diào)整,直到內(nèi)容確認(rèn)為真值,從而產(chǎn)生理解效應(yīng)。
根據(jù)實(shí)驗(yàn)結(jié)果,還發(fā)現(xiàn)如果非what條件下,why值是否提供,都無(wú)法對(duì)理解效應(yīng)產(chǎn)生作用。通過(guò)比較what-why條件與非what-why條件下的理解效應(yīng)正確率發(fā)現(xiàn)了理解效應(yīng),但這一效應(yīng)只有當(dāng)what值首先提供時(shí)才出現(xiàn),同時(shí)why條件才表現(xiàn)出對(duì)理解效應(yīng)的影響。這個(gè)現(xiàn)象表明,一是認(rèn)知系統(tǒng)對(duì)語(yǔ)言材料并不是同時(shí)地進(jìn)行what與why水平加工的, what加工總是先,然后才能進(jìn)行why加工,what條件是加工的起點(diǎn),why值是以what值為基礎(chǔ)的。因?yàn)槿绻辉嚥恢纖hat值,根本無(wú)法對(duì)語(yǔ)言對(duì)象進(jìn)行why判斷,why判斷根本無(wú)從談起。所以,即使給了why值被試也無(wú)法發(fā)生理解效應(yīng),這個(gè)結(jié)論與以往的語(yǔ)言材料閱讀理解的日常經(jīng)驗(yàn)相一致,即被試如若對(duì)被測(cè)對(duì)象是什么都不知道,就更談不上道理的理解了。根據(jù)這些情況,可以認(rèn)為,認(rèn)知系統(tǒng)對(duì)刺激物的理解首先要知道該刺激物是什么,然后才能去理解道理,看它是不是符合道理,然后產(chǎn)生理解效應(yīng)。二是這種現(xiàn)象表明,認(rèn)知系統(tǒng)是根據(jù)意思對(duì)語(yǔ)言材料進(jìn)行加工的。因?yàn)橹挥性趙hat條件下觀察到了理解效應(yīng),而What值就是語(yǔ)言材料的意思。另一個(gè)可能原因是,詞匯通過(guò)what值即意思達(dá)成與現(xiàn)實(shí)世界的映射關(guān)系,只有在what值基礎(chǔ)上,現(xiàn)實(shí)世界規(guī)律知識(shí)才能通過(guò)why條件組織反饋,并根據(jù)真值性標(biāo)準(zhǔn)及時(shí)影響詞匯的what內(nèi)容的理解,最后認(rèn)知系統(tǒng)才能有效使用現(xiàn)實(shí)世界的規(guī)律知識(shí)。
可以用交互理解模型來(lái)進(jìn)一步解釋這個(gè)各層次交互理解效應(yīng)現(xiàn)象。對(duì)語(yǔ)言材料的理解而言,其在what水平首先被激活,同時(shí),why條件也起著重要的作用。對(duì)語(yǔ)言材料而言,其相應(yīng)的理解模型可能不僅僅只包括what層次的加工,還存在一個(gè)why水平的加工確認(rèn),使得語(yǔ)言材料的加工會(huì)同時(shí)受到what水平的因素(如語(yǔ)義)和高水平why條件的影響。why水平的激活反饋會(huì)通過(guò)自上而下的通路影響what水平的加工。當(dāng)前研究只在why條件下發(fā)現(xiàn)了理解效應(yīng),造成這個(gè)現(xiàn)象可能是由于加工的復(fù)雜性和中文閱讀中的歧義導(dǎo)致的,也可能是語(yǔ)言材料中, what內(nèi)容可能存在自相矛盾的狀況。與非why相比, why因素在內(nèi)容水平上和整體水平上的真值確認(rèn),反饋到達(dá)what水平之時(shí), what水平加工將被調(diào)整,使得內(nèi)容更一致。what水平與why水平下相互作用從而產(chǎn)生理解效應(yīng)現(xiàn)象。這些現(xiàn)象進(jìn)一步表明,語(yǔ)言材料的理解是一個(gè)多水平之間交互加工的過(guò)程,是并行地以一個(gè)整體進(jìn)行加工調(diào)整的。這個(gè)理解模型可以推廣到對(duì)圖像的理解之中。因?yàn)閳D像理解是語(yǔ)言理解的一部分,所以關(guān)于圖像的理解亦然,即若認(rèn)知系統(tǒng)內(nèi)存在對(duì)應(yīng)的what-why值,作為刺激物的圖像與內(nèi)部的知覺(jué)模式集匹配時(shí),也就獲取并知道該刺激物圖像的what值與置信度,從而理解該圖像。如若不知道該圖像的what值是什么,也沒(méi)有why水平上的認(rèn)識(shí),也就無(wú)法正確理解該圖像。
what-why理解效應(yīng)結(jié)論與以往的理論[1-17]與研究結(jié)果是沒(méi)有矛盾的,是相一致的,因?yàn)榭梢杂脀hat-why理解效應(yīng)來(lái)進(jìn)一步理解概念、信息,并對(duì)語(yǔ)法、語(yǔ)義以及語(yǔ)用進(jìn)行理解再加工。what-why理解效應(yīng)理論認(rèn)為,當(dāng)知道概念是什么及為什么時(shí),也就理解了概念。同樣,當(dāng)知道語(yǔ)用涵義是什么及為什么時(shí),也就理解了它的語(yǔ)用,語(yǔ)義的理解也是一樣。對(duì)語(yǔ)法的理解,是通過(guò)語(yǔ)法與語(yǔ)義并行的整體加工來(lái)交互劃分語(yǔ)法的。因此用what-why理解效應(yīng)可以很好地解釋對(duì)語(yǔ)法、語(yǔ)義及語(yǔ)用的進(jìn)一步理解現(xiàn)象。ALICE[18]對(duì)話(huà)聊天軟件是基于統(tǒng)計(jì)與關(guān)鍵字的,統(tǒng)計(jì)加規(guī)則方法的理解觀認(rèn)為把語(yǔ)法切分出來(lái)就是一種理解,其統(tǒng)計(jì)方法只是一種手段,可以歸到語(yǔ)法、語(yǔ)義、語(yǔ)用理解觀上。陸汝占[19-20]提出概念、語(yǔ)義計(jì)算及內(nèi)涵邏輯表示方法,這是對(duì)蒙太古語(yǔ)義學(xué)的發(fā)展。該理論主張深入語(yǔ)義層面,將漢語(yǔ)表達(dá)式抽象成數(shù)學(xué)表達(dá)式恰當(dāng)?shù)乇硎緝?nèi)涵與外延,然后把這些語(yǔ)義表示在計(jì)算機(jī)內(nèi)進(jìn)行處理,這種理解方法以概念為基礎(chǔ),最終表達(dá)成無(wú)歧義的結(jié)果為目的,該方法可以歸結(jié)為概念理解學(xué)派。同樣,心理學(xué)理論[21]認(rèn)為,理解是一種意思建構(gòu)的過(guò)程,what-why理解效應(yīng)可以完成對(duì)該理解觀的進(jìn)一步解釋。
what-why理解效應(yīng)表明了當(dāng)認(rèn)知系統(tǒng)知道被試對(duì)象是什么及為什么時(shí),該系統(tǒng)也理解了該刺激物,這正是文獻(xiàn)[22,23]中的理解定義的基礎(chǔ)。該理論提出,理解是刺激物與認(rèn)知系統(tǒng)內(nèi)的知覺(jué)模式集匹配時(shí)析出的確信性感受。刺激物與認(rèn)知系統(tǒng)內(nèi)的知覺(jué)模式集匹配時(shí),也就獲取并知道了該刺激物是什么,析出確信性感受表明該內(nèi)容為真值,此時(shí),認(rèn)知系統(tǒng)即知道它是什么及為什么(即what-why值),可見(jiàn),這個(gè)時(shí)候,該刺激物被理解,認(rèn)知系統(tǒng)獲得了what-why理解效應(yīng)。what-why理解效應(yīng)規(guī)律是對(duì)文獻(xiàn)[22]結(jié)論的進(jìn)一步驗(yàn)證。Watson[24-25]在美國(guó)智力競(jìng)猜節(jié)目《危險(xiǎn)邊緣》中戰(zhàn)勝有史以來(lái)最出色的兩名人類(lèi)選手,獲得冠軍。它們的理解觀側(cè)重點(diǎn)在于不通過(guò)模擬人類(lèi)的理解機(jī)制,是對(duì)文本語(yǔ)義的淺層分析理解。本研究與該方法沒(méi)有矛盾,還可以通過(guò)理解效應(yīng)進(jìn)行分析,對(duì)淺層分析再理解,以進(jìn)行精細(xì)語(yǔ)義上的推理,從而增加問(wèn)題解決的途徑,提高問(wèn)題解決的可靠性與準(zhǔn)確度。圖2表明,語(yǔ)言材料經(jīng)過(guò)what-why效應(yīng),認(rèn)知系統(tǒng)產(chǎn)生對(duì)文本材料的語(yǔ)義的實(shí)質(zhì)理解,之后就可以在目標(biāo)驅(qū)動(dòng)之下,產(chǎn)生對(duì)應(yīng)的目的產(chǎn)品,這些產(chǎn)品既可以是方案,亦可以是答案。
圖2 理解在信息處理中的位置
總的來(lái)說(shuō),通過(guò)一種迫選范式,發(fā)現(xiàn)了語(yǔ)言加工中的what-why理解效應(yīng).同時(shí),當(dāng)比較what條件與非what條件時(shí),只在what條件下,why條件才對(duì)理解效應(yīng)發(fā)揮作用,而且what條件下僅僅在why條件時(shí),理解效應(yīng)才出現(xiàn),why條件對(duì)what理解效應(yīng)產(chǎn)生交互作用。這表明,自然語(yǔ)言的理解加工不僅受到what條件的影響,而且受到why條件的制約,二者共同促成理解效應(yīng)的產(chǎn)生。詞語(yǔ)與句篇理解實(shí)驗(yàn)過(guò)程表明一個(gè)道理,即當(dāng)認(rèn)知系統(tǒng)知道作為被測(cè)對(duì)象的刺激物是什么(what值)及為什么(經(jīng)why水平檢測(cè)且why值為真)時(shí),該刺激獲得理解。而把理解定義為當(dāng)刺激物與知覺(jué)模式集匹配時(shí)的確信性感受,其基礎(chǔ)論據(jù)即為上述結(jié)論。從而該理解的定義的正確性獲得了實(shí)驗(yàn)的驗(yàn)證。理解是認(rèn)知系統(tǒng)進(jìn)行信息處理的基礎(chǔ),信息處理過(guò)程中,認(rèn)知系統(tǒng)需要知道文本是什么(what因素),并需要懂得從抽象微觀層面(what水平)進(jìn)行推斷與邏輯演繹(why水平)??梢?jiàn),理解觀更擅長(zhǎng)于處理需要微觀分析給出結(jié)果的問(wèn)題。該理解觀直接研究人類(lèi)的理解能力,覆蓋人類(lèi)理解能力的全部,與人類(lèi)的理解交流方式相一致。下一步,本研究將對(duì)理解效應(yīng)對(duì)信息處理的作用機(jī)制給出進(jìn)一步的闡釋?zhuān)斫庑?yīng)的生物物理學(xué)基礎(chǔ)也是一個(gè)值得研究的課題。
參考文獻(xiàn):
[1]Fillmore, C.J.(1971)‘Some Problems for Case Grammar.’In R. J. O’Brien, Editor,22nd Annual Round Table. Linguistics: Developments of the Sixties-Viewpoints of the Seventies. Volume 24 of Monograph Series on Language and Linguistics. Georgetown University Press, Washington, D.C., pp. 35-56.
[2]鄒崇理,崔佳悅.基于格語(yǔ)法思想的范疇類(lèi)型邏輯研究[J].安徽大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版, 2014, 38(4):15-22. DOI:10.13796/j. cnki.1001-5019.2014.04.003.
[3]Schank,R.C.Conceptual Information Processing[M]. Amsterdam: North-Holland Publishng Company,1975.
[4]Miller G. A,Beckwith R,Fellbaum C,et al.Introduction to WordNet:An on_Line Lexical Database[R]. CSL Report, NJ: Princeton UniverSity,1993.
[5]Pan Y N, Teng H M. Word Sense Disambiguation of Tags in XML Documents Based on WordNet[J]. Information Science, 2014.
[6]Wei T, Zhou Q, Chang H, et al. A Semantic Approach for Rext Clustering Using WordNet and Lexical Chains[J]. Expert Systems with Applications, 2015, 42:2264–2275.
[7]Aditi Sharan A1 and Manju L. Joshi. An Algorithm for Finding Document Concepts Using Semantic Similarities from WordNet Ontology [A]. International Journal of Computational Vision and Robotics[C],2010(2):147-157.
[8]Ricardo Sotolongo, Fangyan Dong, Kaoru Hirota .Algorithm for Code Clone Refinement Based on Semantic Analysis of Multiple Detection Reports Using WordNet[A].Proceedings of the 4th International Symposium on Computational Intelligence and Industrial Applications(2010)[C].Publishing House of Electronics Industry, 2010:191-198.
[9]Janzen, S.,Maass, W.Ontology-Based Natural Language Processing for In-store Shopping Situations[A]. IEEE International Conference on ICSC '09[C].2009:361- 366.
[10]Minu R I, Thyagharajan K K. Semantic Rule Based Image Visual Feature Onto66logy Creation[J]. International Journal of Automation & Computing, 2014, 11(5):489-499.
[11]陸汝鈐.世紀(jì)之交的知識(shí)工程與科學(xué)[C].北京:清華出版社,2001.9.
[12]Winograd, T. Language as a Cognitive Process[M]. MA:Addison Wesley,1983.
[13]鐘義信.自然語(yǔ)言理解的全信息方法論[J].北京郵電大學(xué)學(xué)報(bào),2004(04):1-12.
[14]劉松.基于全信息的問(wèn)答系統(tǒng)研究[D].北京郵電大學(xué), 2014.
[15]黃曾陽(yáng).HNC理論[M].清華大學(xué)出版社,1998.
[16]劉智穎.服務(wù)于漢英機(jī)器翻譯的HNC詞語(yǔ)知識(shí)庫(kù)建設(shè)[J].語(yǔ)言文字應(yīng)用, 2015,(1):117-126.
[17]賈玉祥,俞士汶,朱學(xué)鋒.隱喻自動(dòng)處理研究進(jìn)展.中文信息學(xué)報(bào),2009(6):
[18]Wallace R S. The Anatomy of A.L.I.C.E. [M] //Parsing the Turing Test. Springer Netherlands, 2009:181-210.
[19]陸汝占. 2003.概念、語(yǔ)義計(jì)算及內(nèi)涵邏輯.見(jiàn):中文信息處理若干重要問(wèn)題.北京:科學(xué)出版社.第90-9
[20]李釗劍,陸汝占.用戶(hù)需求概念圖的生成方法研究[J].計(jì)算機(jī)應(yīng)用與軟件, 2012, 29(1):23-26. DOI:10.3969/j.issn.1000-386X. 2012.01.006.
[21]彭聃齡.普通心理學(xué)第二版[M].北京:北京師范大學(xué)出版社,2005.
[22]黃培紅.自然語(yǔ)言理解的機(jī)器認(rèn)知形式系統(tǒng)[J].湖南:計(jì)算機(jī)工程與科學(xué),2007,29(6):113-116.
[23]黃培紅.自然語(yǔ)言理解——一個(gè)關(guān)于機(jī)器感悟人類(lèi)語(yǔ)言實(shí)質(zhì)的邏輯理論[J].四川兵工學(xué)報(bào),2009,(1):138-142.
[24]David Ferrucci, Eric Brown, Jennifer Chu-Carroll,James Fan, David Gondek, Aditya A. Kalyanpur,Adam Lally, J. William Murdock, Eric Nyberg, John Prager,Nico Schlaefer, and Chris Welty.Building Watson:An Overview of the DeepQA Project[M].http://www.stanford.edu/class/cs124/AIMagzine-DeepQA.pdf,2011:59-79.
[25]Chandrasekar R. Elementary? Question answering, IBM's Watson, and the Jeopardy! Challenge[J]. Resonance, 2014, 19(3):222-241.
What-Why Effect on Natural Language Understanding
HUANG Pei-hong
(Agricultural Bank of China Putian Branch,F(xiàn)ujian 351100)
Abstract:Through the use of a forced-choice paradigm, finds the understanding effect caused by what-why factors in language processing. Further investigation reveals that, in language understanding what-factor effect is activated first, but why-factor interacts to what-understand-effect, is also essential to understanding effects. What and why factors together lead to understanding effects in natural language processing. Meanwhile, the output results of what-why understanding effect experiment confirm that earlier definition of understanding is correct.
Keywords:Natural Language Processing; What-Why Factor; Understanding Effect
收稿日期:2015-12-22修稿日期:2016-02-22
作者簡(jiǎn)介:黃培紅(1968-),男,福建莆田人,高級(jí)工程師,研究方向?yàn)槿斯ぶ悄芘c軟件工程
文章編號(hào):1007-1423(2016)10-0009-08
DOI:10.3969/j.issn.1007-1423.2016.10.003