国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向智能語言處理的漢語句法語義知識庫構(gòu)建

2021-06-15 04:17史金生李靜文

史金生 李靜文

[摘?要]文章通過比較各種語義知識庫的特點,重點討論了基于生成詞庫和論元結(jié)構(gòu)理論的句法語義知識體系研究及資源庫構(gòu)建的內(nèi)容、特色,并從句法-語義接口的透明性和自然性、名詞中心論建模方法的實用性、解決復(fù)雜語法問題的便捷性、情感評價色彩描述的突破性等四個方面分析了其價值,并提出了關(guān)于未來句法語義知識體系研究的幾點思考。

[關(guān)鍵詞]生成詞庫;論元結(jié)構(gòu);物性結(jié)構(gòu);句法語義知識庫;情感評價

[中圖分類號]H08?[文獻(xiàn)標(biāo)志碼]A?[文章編號]2095-0292(2021)02-0001-09

[作者簡介] 史金生,首都師范大學(xué)文學(xué)院教授,博士研究生導(dǎo)師,國家語委科研基地中國語言智能研究中心副主任,中國語文現(xiàn)代化學(xué)會語義功能語法專委會理事長,研究方向:句法語義、漢語國際教育、語言知能;李靜文,首都師范大學(xué)文學(xué)院博士研究生,研究方向:句法語義。

一、引言

自然語言處理就是研究計算機處理自然語言的過程和方法,包括形式化、算法化、程序化、實用化等步驟,其中建立語言的形式化模型,使之能以一定的數(shù)學(xué)形式表示出來,是自然語言處理的核心。自然語言處理經(jīng)歷了從知識驅(qū)動到數(shù)據(jù)驅(qū)動的不同發(fā)展階段:語言知識的獲取最早是基于語言學(xué)家的規(guī)則描寫,即根據(jù)語言學(xué)規(guī)則來編寫程序,然后發(fā)展到基于統(tǒng)計,即從大規(guī)模真實語料庫中獲取語言知識,近些年發(fā)展到基于神經(jīng)網(wǎng)絡(luò),通過深度學(xué)習(xí),讓計算機自動獲取自然語言的特征。人工智能現(xiàn)在已經(jīng)發(fā)展到第三代,已經(jīng)來到了一個重要的拐點,其路徑是融合第一代知識驅(qū)動和第二代數(shù)據(jù)驅(qū)動,自然語言語義的精準(zhǔn)理解因而成為人工智能皇冠上的明珠。

計算機要能實現(xiàn)準(zhǔn)確的分析,就要具備相應(yīng)的語義以及語法等知識,以及相應(yīng)的常識知識和推理能力。建立句法、語義知識庫之類的語言知識資源,并且映射到知識圖譜之類通用的形式化的語義表示框架,可以幫助計算機理解自然語言的意義,并且在一定程度上進(jìn)行常識性知識推理;相反,如果同相關(guān)的知識沒有牽扯,僅僅是統(tǒng)計方法、機器學(xué)習(xí),計算機就不能達(dá)到對相關(guān)語言、概念的深刻理解。面向自然語言處理的知識庫可服務(wù)于自動分詞、詞性標(biāo)注、句法分析、語義分析、機器翻譯、信息提取、情感分析、文本摘要和問答系統(tǒng)等多個領(lǐng)域。構(gòu)建相應(yīng)的句法語義知識庫成為當(dāng)前自然語言處理的重要任務(wù),而缺乏形態(tài)標(biāo)記的漢語,建立相關(guān)的知識庫顯得更加迫切。

本文主要分析漢語句法語義知識庫構(gòu)建的理論基礎(chǔ)、具體內(nèi)容、特色優(yōu)勢,并提出未來句法語義知識體系研究方面的幾點思考。

二、國內(nèi)外基于不同理論框架的知識庫構(gòu)建

現(xiàn)階段,語言知識庫主要包括現(xiàn)代漢語語法信息詞典、大規(guī)?,F(xiàn)代漢語基本標(biāo)注語料庫、平行語料庫、英漢和日漢對照雙語語料庫、多語言概念詞典、現(xiàn)代漢語短語結(jié)構(gòu)規(guī)則庫等,此外,還有為上述語言知識庫服務(wù)的不同種類的工具軟件,這些最終構(gòu)成了綜合型的語言知識庫。

如果要展示詞匯概念,并且描述概念和概念之間,以及概念和屬性間關(guān)系,就需要文本語義了,也就是需要重新構(gòu)建語義知識庫。近年來,國內(nèi)外比較流行的語義知識庫在設(shè)計方面各具特點,但都是依據(jù)一定的語言學(xué)理論構(gòu)建起來的。例如,美國普林斯頓大學(xué)WordNet知識庫,將語義上緊密聯(lián)系的相關(guān)詞匯聚合成同義詞集;美國科洛大學(xué)的VerbNet知識庫,以Levin的動詞分類作為理論基礎(chǔ),描述不同類別動詞的論元結(jié)構(gòu);賓西法尼亞大學(xué)的Chinese PropBank知識庫,借鑒了PropBank的理論和描述框架;紐約大學(xué)的NomBank知識庫,借鑒了PropBank,Nomlex項目及支撐動詞有關(guān)研究;Chinese NomBank知識庫就是將英語命題庫以及英語NomBank常規(guī)架構(gòu),用到了中文名詞化謂詞標(biāo)注當(dāng)中;我國臺灣地區(qū)詞庫小組的Sinica TreeBank知識庫,運用了中心語主導(dǎo)原則和依存語法理論;上海師范大學(xué)與山西大學(xué)聯(lián)合構(gòu)建的Chinese FrameNet,運用了框架語義學(xué)的理論;北京大學(xué)中文網(wǎng)庫是在配價語法基礎(chǔ)上提出了論元結(jié)構(gòu)理論,并將這一理論運用于知識庫構(gòu)建;清華大學(xué)、北京大學(xué)、魯東大學(xué)的事件描述塊句法語義標(biāo)注庫,運用了格語法和配價語法理論。

以上語義知識詞庫為計算機實現(xiàn)自然語言的語義理解提供了可能性,但是也存在一些缺陷。比如,WordNet往往會將詞語之間的組合關(guān)系以及語句段落里面共現(xiàn)的關(guān)系忽視掉,VerbNet知識庫將動詞當(dāng)作核心,這樣就不能夠妥善地處理和解決情景式事物指稱的問題,F(xiàn)rameNet無法準(zhǔn)確地掌握相關(guān)詞匯概念在具體語句段落里面的最常見的共現(xiàn)關(guān)系;ConceptNet雖然被計算機賦予常識經(jīng)驗,但缺少句子和語篇間的組合推斷。那么,如何解決像“網(wǎng)球問題”等事物間情景聯(lián)想的有關(guān)問題?計算機如何模仿人類進(jìn)行常識推理和句法組合?一些語言學(xué)家作出了積極深入的探索。

三、基于生成詞庫和論元結(jié)構(gòu)理論的漢語句法語義知識庫

最近,北京大學(xué)袁毓林教授團(tuán)隊基于生成詞庫論和論元結(jié)構(gòu)理論,對漢語實詞進(jìn)行了句法語義知識挖掘構(gòu)建,編寫了《現(xiàn)代漢語實詞語法語義功能信息詞典》(以下簡稱《實詞信息詞典》)。

1.主要內(nèi)容

《實詞信息詞典》不僅充分地描寫了動詞和形容詞的論元角色及其句法配置,還描寫了名詞的物性角色及其句法配置,把漢語有關(guān)的句法、語義及相關(guān)的常識知識納入詞項的句法、語義描述中,從而在體詞和謂詞之間形成了具有鏈接性的語義網(wǎng)絡(luò)和句型體系。

《實詞信息詞典》是一個綜合型的語義知識庫,可以服務(wù)于自然語言處理。詞典的主要內(nèi)容有現(xiàn)代漢語常用實詞的語義角色、主要句型、經(jīng)典例句等。同時,還有一個配套信息檢索系統(tǒng),可以快速、準(zhǔn)確地檢索到所需要的信息內(nèi)容。該詞典由“漢語動詞句法語義功能信息詞典暨檢索系統(tǒng)”“漢語形容詞句法語義功能信息詞典暨檢索系統(tǒng)”“漢語名詞句法語義功能信息詞典暨檢索系統(tǒng)”這三個子系統(tǒng)構(gòu)成。該詞典為實詞設(shè)計了一套前后一致、互相照應(yīng)的語義表示框架,揭示它們之間語義角色關(guān)系;加入情感評價色彩的描寫,由此形成了相對完善的漢語語義知識體系。這一體系具有很大的優(yōu)勢,基于該體系,可以形成相應(yīng)的語義知識庫,其中具備了面向?qū)ο?、可擴展的特點。特別重視語義角色,即詞語之間的搭配關(guān)系和選擇限制,并配有相關(guān)句型和習(xí)慣搭配。將語言知識納入到知識圖譜當(dāng)中的方式,可以讓人們更加容易也更加深刻地理解AI的含義。

知識庫里面的每個實詞的構(gòu)成都是有兩個部分,一個部分是語義角色,也被稱作物性角色,另一個部分則是句法格式。詞庫生成需要有四種不同的物性結(jié)構(gòu),語義知識庫則是在這四種不同的物性結(jié)構(gòu)上進(jìn)行了擴增,變成了10種不同的物性結(jié)構(gòu),分別是形式、構(gòu)成、單位、評價、施成、材料、功用、行為、處置以及定位。這10種不同的物性結(jié)構(gòu)一起組建成名詞物性結(jié)構(gòu)框架。這項研究針對動詞、形容詞等,建立了論元結(jié)構(gòu)描寫框架。在這個框架里面的內(nèi)容主要有施事、經(jīng)事、主事、與事、對象、工具、方法、原因、目標(biāo)、時段、場合、起點、終點、途徑等,共計22種動詞語義角色。此外,還包括感事、與事、系事等合計9種形容詞語義角色。利用句法格式就能夠?qū)崿F(xiàn)描寫名詞的物性結(jié)構(gòu)與動詞、形容詞的論元結(jié)構(gòu)的連接;并且還可以形成完整的句法語義接口知識,實現(xiàn)了在動態(tài)語境下意義浮現(xiàn)的解釋和說明。這一知識庫比其他語義知識庫更加注重組合性、語義劃分的精細(xì)化及語義結(jié)構(gòu),有利于計算機進(jìn)行自動文本的常識性推理。

2.多層聯(lián)動推導(dǎo)特征

《實詞信息詞典》是在調(diào)查大規(guī)模真實文本語料的基礎(chǔ)上,通過對名詞、動詞和形容詞等實詞的物性結(jié)構(gòu)和論元結(jié)構(gòu)的精心設(shè)計和合理描述,把事物和跟事物相關(guān)的事件的有關(guān)世界知識及其語言表達(dá)形式表示出來,再輔之以指針鏈接和知識圖譜(knowledge graph)等數(shù)據(jù)表示技術(shù)和拉近—推遠(yuǎn)(zoom-in and zoom-out)等便捷的呈現(xiàn)手段,有效地把相關(guān)的名詞、動詞和形容詞的語義關(guān)聯(lián)起來,形成了以名詞(實體)為檢索核心的、面向?qū)ο螅╫bject orientation)的語義知識庫。

比如“豬—喝—湯”的語義角色關(guān)系及句法配置的構(gòu)建:

名詞“豬”的行為角色是動詞“喝”,這是從名詞出發(fā)看名詞和動詞的語義關(guān)聯(lián);反過來,從動詞出發(fā)看動詞和名詞的語義關(guān)聯(lián),動詞“喝”的施事角色是名詞“豬”,同時受事角色是名詞“湯”。而“湯”作為“豬”施成的條件與句子保持了句法結(jié)構(gòu)的關(guān)聯(lián)。“湯”功用語義角色促發(fā)了與動詞“喝”進(jìn)行關(guān)聯(lián)。因此我們看到“豬—喝—湯”構(gòu)成了一個知識網(wǎng)絡(luò),在知識網(wǎng)絡(luò)中每一個節(jié)點都因語義角色的關(guān)系而相互關(guān)聯(lián),最終形成句法結(jié)構(gòu)。通過對動詞的論元結(jié)構(gòu)和名詞的物性結(jié)構(gòu)的刻畫,為計算機理解名詞—動詞之間的語義關(guān)系,提供了一種有效的知識表示。

我們再看一下名詞與其他詞的關(guān)聯(lián)問題,《實詞信息詞典》解決了“饅頭問題”,圍繞名詞進(jìn)行物性角色的構(gòu)建也符合沈家煊(2019)“大名詞”觀的思路,如:

圍繞名詞“饅頭”可以組構(gòu)成多種事件,如構(gòu)成中可以與其他名詞形成偏正和聯(lián)合結(jié)構(gòu)“雜糧饅頭”“主食饅頭”,處置語義角色在句法中表現(xiàn)為動詞的賓語,如“吃—饅頭”“買—饅頭”,作賓語也可以是施成角色,如“蒸饅頭”,“饅頭”的動作行為角色也可以賦予“饅頭”話題的身份,如“饅頭霉變”?!梆z頭”的評價角色,使得饅頭可以作為被修飾的成分,如“熱氣騰騰的饅頭”“硬邦邦的饅頭”“松軟可口的饅頭”等??梢?,圍繞“名詞”可以關(guān)聯(lián)動詞“吃”“蒸”等,也可以關(guān)聯(lián)名詞“主食”“雜糧”等,甚至還可以關(guān)聯(lián)形容詞“松軟可口”“硬邦邦”等。以名詞為中心輻射構(gòu)成了知識圖譜。

另外,計算機在處理情感評價系統(tǒng)的時候存在輸出的困難,如何識別句子的隱藏特征成為需要解決的問題。我們在考察《實詞信息詞典》的形容詞部分找到了相關(guān)的證據(jù)。

比如:

我們可以看到“好”是對主事和范圍的評價,比如“這把傘的質(zhì)量好”,也可以用于比較結(jié)構(gòu)“這把傘的質(zhì)量比那把傘的質(zhì)量好”,但是我們發(fā)現(xiàn),事件結(jié)構(gòu)也可以用“好”進(jìn)行主觀評價,比如“豬喝湯好”,“好”評價了前面的“豬喝湯”這一事件結(jié)構(gòu)。如果借用化學(xué)上原子化合和配價的說法,那么形容詞就是語句組合的核心,像主體、方面等伴隨成分就是配價成分。不同的形容詞有不同的配價功能,支配不同數(shù)量和不同性質(zhì)的配價成分,構(gòu)成不同形式的短語和句子。袁毓林、曹宏(2019)“形容詞信息詞典”就是從這樣一種“情境語義學(xué)”( situation semantics) 和“配價語法”( valence grammar) 的角度,通過對大規(guī)模真實文本語料的調(diào)查和分析,全面、準(zhǔn)確、簡明地描寫形容詞在情境意義和搭配用法上的關(guān)鍵性特點,使讀者“觀其伴,會其意; 明其價,知其用”,即讓讀者在查閱到一個形容詞條目以后,可以了解該形容詞通常與哪些伴隨成分一起出現(xiàn),從而從搭配關(guān)系上理解該形容詞的意義、明白其配價組合方面的特點,并掌握其基本的常用句式,進(jìn)而根據(jù)這些句式,模仿相關(guān)實例,理解相關(guān)的其他句子。

形容詞在修辭上生動優(yōu)美、意蘊豐富,但是它的意義又顯得空靈朦朧,使用起來不太好把握火候。那么,怎樣才能比較切實地了解形容詞的意義、掌握形容詞復(fù)雜多變的用法呢?其實,了解一個詞和了解一個人有相似之處。通常,我們看一個人跟什么人來往,就可以知道他大概是一個什么樣的人。同樣,要了解一個詞的意義和用法,最好的辦法莫過于觀察它跟什么樣的詞語搭配。

另外,如“很+NP”類評價構(gòu)式中的NP的語義角色關(guān)聯(lián)還需要繼續(xù)考慮,這就與詞典中“藝術(shù)”不能受到“很”“不”等副詞修飾相沖突,那么計算機如何識別“整體大于部分之和”的構(gòu)式性問題還需要進(jìn)一步思考。如:

四、句法語義知識庫構(gòu)建的意義和價值

Halvorsen(1988)特別提出計算語言學(xué)其實是模擬了人類社會的語言接受和處理的能力。這種能力其實就是典型的人工智能方法,其最大優(yōu)勢是實現(xiàn)了計算機同人類之間的轉(zhuǎn)化。即將人類思維成功轉(zhuǎn)化為相應(yīng)的模型,使得人類的整個認(rèn)知過程通過所建立的計算機模型進(jìn)行實現(xiàn)。他曾經(jīng)試圖使用計算范式去模擬人類學(xué)習(xí)、獲取、儲存、使用知識的全部流程。

通過運用語言知識資源,讓機器更加準(zhǔn)確地理解語義,并進(jìn)行一些常規(guī)的推理和推斷,這正是眾多計算機專家、語言學(xué)家們普遍關(guān)注和想要探究明白的問題。如何解決自然語言處理中的語義表示和理解技術(shù),逐漸提上日程??傮w而言,基于認(rèn)知的《實詞信息詞典》,創(chuàng)建了具有鏈接性的語義網(wǎng)絡(luò),把語義知識加入知識圖譜,利用計算機信息技術(shù)和語言知識資源建構(gòu)了基于情感計算和常識計算的語義知識庫,解決了像“網(wǎng)球問題”“他是老狐貍”等需要人類常識經(jīng)驗參與的語義知識問題,具有語言知識與常識推理互動溝通的創(chuàng)新性和信息技術(shù)開發(fā)的前沿性。

1.實現(xiàn)了句法-語義的自然對接

為計算機研究語言,主要以自然語言為對象,并對其具體的結(jié)構(gòu)、意義規(guī)律進(jìn)行不斷的深入挖掘,從中得到相應(yīng)的規(guī)則,包括語法以及句法等。同時這些規(guī)則具有一定的特點,即相對容易實現(xiàn)形式化、算法化?;谏鲜隼砟罱⒌南鄳?yīng)的理論模型,主要作用就是更好地組織各種規(guī)則?!秾嵲~信息詞典》里面實詞語義結(jié)構(gòu)的構(gòu)成有兩大部分,一個部分是語義角色,也叫作物性角色,另外一個構(gòu)成部分就是句法格式。語義角色可以表述事物語義特點;后面句法格式則是表示實詞和語義角色句法結(jié)合的特征。語義結(jié)構(gòu)網(wǎng)絡(luò)在與常識性知識建立聚合聯(lián)系的同時,也關(guān)注句法結(jié)構(gòu)、語境浮現(xiàn)和篇章鏈接的組合性關(guān)系和配置模式。這個知識庫構(gòu)建了一個新的動作指針鏈接,最終就成為一個“謂詞—論元”式的語義關(guān)系圖式?;谏稍~庫理論,整合了VerbNet、FrameNet、ConceptNet等知識庫的優(yōu)點,形成了動詞、形容詞論元結(jié)構(gòu)知識庫和名詞物性結(jié)構(gòu)知識庫互動的模式。

2.突出了名詞中心論建模方法的實用性

基于生成詞庫和論元結(jié)構(gòu)形成的句法語義知識庫具備一定的優(yōu)點,具體來講就是對相關(guān)詞語所反映的知識進(jìn)行突出表現(xiàn),不但包括常識知識,而且有百科知識,特別是名詞的描寫,是在“物性角色”基礎(chǔ)上,實現(xiàn)對相關(guān)的百科知識、語義結(jié)構(gòu)進(jìn)行詳細(xì)的描述,從而解決了對“圍棋是什么?”等相關(guān)問題的解釋。更重要的是,該語義資源還可以和計算機視覺技術(shù)相結(jié)合,讓計算機進(jìn)行常識推理。例如,可以實現(xiàn)“如何選用某種工具(鏟子)來完成鏟土之類工作?”等等相關(guān)的判斷和推理。

從另一方面來說,該知識庫通過描寫事物間的關(guān)系,構(gòu)建了名詞的框架結(jié)構(gòu);又基于論元結(jié)構(gòu)建立了動詞和形容詞框架結(jié)構(gòu),并從句法角度刻畫了名詞與動詞和形容詞論元結(jié)構(gòu)的選擇限制和搭配關(guān)系,演化為語義關(guān)聯(lián)、互動推導(dǎo),而且都是以名詞作為核心,包括動詞、形容詞以及名詞,構(gòu)建了屬性、動作和事物間的語義網(wǎng)絡(luò)。比如,名詞“網(wǎng)球”的施成角色是動詞“制作”等,這是從名詞的角度來對名詞、動詞之間的語義關(guān)聯(lián)進(jìn)行分析;同理,從動詞的角度,網(wǎng)球這一名詞實際上就是動詞“打”等的受事角色。因此,這種以名詞為中心的語言建模和概念建模具有較強的實用性。

3.解釋了一些復(fù)雜的語法現(xiàn)象

構(gòu)建有足夠精細(xì)度的句法語義知識庫,有利于為計算機處理復(fù)雜的語法現(xiàn)象提供資源和解釋。例如,漢語里有“名詞+的+名詞”歧義的問題,像“魯迅的書”就可以理解為“魯迅擁有的書”以及“魯迅寫的書”兩種意思。針對自然語言處理,可以給計算機一個指令規(guī)則,即當(dāng)NP1表示人或機構(gòu)、NP2表示物品時,其中NP1和NP2之間隱含獲得義,但是“魯迅的書”卻沒辦法用規(guī)則來說明,而利用語義知識圖譜恰好能夠消解這種隱含動詞的歧義現(xiàn)象。在《實詞信息詞典》中檢索“魯迅”的百科知識,查到其身份是作家,再調(diào)用“作家”的物性角色,查到其功能角色是“寫”,從而消解了歧義。其次,可以通過物性角色去給有價名詞構(gòu)建模型。比如“小明對小紅的意見”中“意見”作為二價名詞,可以在“物性角色”中的“構(gòu)成”中,展現(xiàn)其降級“施事”和降級“受事”,解決有價名詞的句法語義問題。再如,有些結(jié)構(gòu)是動詞中心論無法解決的問題,如“自行車騎起來很輕松?!比绻覀冝D(zhuǎn)換視角,用名詞中心論就更容易解釋,如把“騎”看成是名詞“自行車”的功用角色,后面的形容詞是名詞的直接評價角色,或者把“形容詞”看成名詞直接是從功用角色承繼下來的評價角色( [騎自行車]輕松)。另外,針對無根話題,如“大象,鼻子長”,通過在《實用信息詞典》中檢索“大象”,其構(gòu)成角色為“鼻子”,這樣就找到了與前面的無根話題的聯(lián)系。最后,像“他打籃球打得好”轉(zhuǎn)變?yōu)椤八幕@球打得好”的限制條件可以用語義知識圖譜解釋為,形容詞“好”是修飾“他打籃球”整個事件的,事件內(nèi)“打”是后面賓語“籃球”的施成角色??梢姡衙~的物性角色與動詞、形容詞的論元角色整合起來,能夠為解決復(fù)雜的語法現(xiàn)象提供方便。

4.突破了情感評價色彩描述的難題

人類日常語言中的感情色彩表達(dá)常常是通過褒貶詞實現(xiàn)的,反過來說詞語的情感色彩表達(dá)了人類對相關(guān)事物的情感評價?!秾嵲~信息詞典》對于漢語的實詞采用五級標(biāo)度的方式表示其感情色彩。具體就是褒義(+2)、積極(+1)、中性(0)、消極(-1)、貶義(-2)。五級標(biāo)度的方式避免了對情感色彩區(qū)分顆粒度過大或者過小的毛病,且有一定的階梯性。除此之外,還加入了副詞的考慮,如“很”“非?!钡仍~在與情感色彩詞搭配時,感情色彩將增強和減弱的情況。

另外,語義知識庫還結(jié)合通俗的“七情”分類和心理實驗,將情緒詞分為快樂、喜好、悲哀、驚恐、憤怒、厭惡等六類,讓計算機處理自然語言時具有了情感分析能力。所以,這種帶有情感評價色彩的描述,在自然語言處理當(dāng)中是有很大的突破意義的。

五、結(jié)語

當(dāng)前,語義計算已經(jīng)從詞匯經(jīng)句法轉(zhuǎn)向篇章,出現(xiàn)繁榮發(fā)展的趨勢。要準(zhǔn)確地進(jìn)行語義關(guān)系標(biāo)注,不僅要描述論元結(jié)構(gòu),還要更加完整地把握命題結(jié)構(gòu)甚至命題之外的時體、情態(tài)、篇章特征。如何標(biāo)注清楚事件論元關(guān)系?如何在“謂詞—論元”結(jié)構(gòu)中整合“時體—情態(tài)”結(jié)構(gòu)?特別是“事件”已成知識圖譜新制高點的當(dāng)下,怎樣讓靜態(tài)性語義知識庫和動態(tài)性事件框架更好地融合起來?這些問題都是需要更深入地探討的內(nèi)容。

從語言本體而言,加強語言理論研究,逐步完善語義描述體系和詞典構(gòu)架,使語義資源建設(shè)能夠更好地為知識圖譜和語義計算服務(wù)。要深入地聯(lián)合人格心理研究實驗,探索人格評價詞語所具有的情感傾向,并將這種傾向展開進(jìn)一步細(xì)化。要重視語義角色的精細(xì)化等級,從數(shù)量和分類方面,尋找適合的語義角色顆粒度??傊?,要想把語義資源與計算機技術(shù)推向深入,使得多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)技術(shù)突出重圍,幫助計算機真正“智能”起來,“弄懂”人類語言,還需要更進(jìn)一步的探索。

[參?考?文?獻(xiàn)]

[1]Chomsky & G. A. Miller.Introduction to the formal analysis of natural languages[M].Wiley, New York,1963.

[2]Chomsky.?Formal properties of grammar[M].Wiley, New York,1963.

[3]Daniel Jurafsky & James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition [M].Upper Saddle River, New Jersey, Prentice Hall, 2000. 中文譯本:馮志偉, 孫樂翻譯.自然語言處理綜論[M].北京:電子工業(yè)出版社,2005.

[4]Grishman, Ralph .Computational Linguistics:An Introduction[M]. Cambridge University Press,1986.

[5]Halvorsen, Per-Kristian .Computer applications oflinguistic theory, in F. J. Newmeyer (ed.) Linguistics: The Cambridge Survey, Vol. II, Linguistic Theory: Extentions and Implications[M]. Cambridge University Press,1988.

[6]Manaris.?Natural language processing in the view of man-machine interchange[J].Advances in Computer, Volume,1999(47).

[7]白碩.語言學(xué)知識的計算機輔助發(fā)現(xiàn)[M].北京:科學(xué)出版社,1995.

[8]馮志偉.計算語言學(xué)對理論語言學(xué)的挑戰(zhàn)[J].語言文字應(yīng)用,1992(1).

[9]馮志偉.自然語言的計算機處理[M].上海:上海外語教育出版社,1996.

[10]沈家煊.超越主謂結(jié)構(gòu)[M].北京:商務(wù)印書館,2019.

[11]袁毓林.信息抽取的語義知識資源建設(shè)[J].中文信息學(xué)報,2002(5):8-14.

[12]袁毓林.語義資源建設(shè)的最新趨勢和長遠(yuǎn)目標(biāo)——通過影射對比、走向統(tǒng)一聯(lián)合、實現(xiàn)自動推理[J].中文信息學(xué)報,2008(3):3-15.

[13]袁毓林.面向信息檢索系統(tǒng)的語義資源規(guī)劃[J].語言科學(xué),2008(1):1-11.

[14]袁毓林.漢語配價語法研究[M].北京:商務(wù)印書館,2010.

[15]袁毓林.基于生成詞庫論和論元結(jié)構(gòu)理論的語義知識體系研究[J].中文信息學(xué)報,2013(6):23-30.

[16]袁毓林.漢語名詞物性結(jié)構(gòu)的描寫體系和運用案例[J].當(dāng)代語言學(xué),2014(1):31-48.

[17]袁毓林,李強.怎樣用物性結(jié)構(gòu)知識解決“網(wǎng)球問題”[J].中文信息學(xué)報,2014(5).

[18]袁毓林.怎樣利用語言知識資源進(jìn)行語義理解和常識推理[J].中文信息學(xué)報,2018(12).

[19]袁毓林,曹宏.“漢語形容詞句法語義功能信息詞典暨檢索系統(tǒng)”知識內(nèi)容說明書[J].辭書研究,2019(2).

[責(zé)任編輯?薄?剛]