項(xiàng) 威
(華中科技大學(xué)電子信息與通信學(xué)院,湖北 武漢 430074)
知識(shí)圖譜源于語義網(wǎng)概念[1],2012年5月由Google公司提出并用于知識(shí)搜索引擎。知識(shí)圖譜由節(jié)點(diǎn)和邊組成,將現(xiàn)實(shí)世界映射到數(shù)據(jù)世界,描述客觀世界的概念、實(shí)體、事件及其關(guān)系。其中,節(jié)點(diǎn)代表客觀世界中的概念、實(shí)體和事件,邊則代表它們之間的關(guān)系和屬性。知識(shí)圖譜以復(fù)雜的圖結(jié)構(gòu)展現(xiàn),提供了高效的計(jì)算和推理能力,在智能問答、決策支持等諸多應(yīng)用方面表現(xiàn)出優(yōu)異的性能。
事件是發(fā)生在某個(gè)特定時(shí)間點(diǎn)或時(shí)間段、某個(gè)特定地域范圍內(nèi),由一個(gè)或者多個(gè)角色參與的一個(gè)或者多個(gè)動(dòng)作組成的事情或者狀態(tài)的改變[2]?,F(xiàn)實(shí)世界中發(fā)生的事情都可以被看成事件,人們通過事件和事件之間的關(guān)系來認(rèn)知和了解世界?,F(xiàn)有知識(shí)圖譜以靜態(tài)的實(shí)體為核心,而很多學(xué)者認(rèn)為以動(dòng)態(tài)的事件為核心的知識(shí)圖譜或事理圖譜更符合世界的認(rèn)知規(guī)律?;谑录⑵饋淼闹R(shí)圖譜,包含了事件的邏輯關(guān)系,如共指關(guān)系、因果關(guān)系、時(shí)序關(guān)系等,描述了事件間的規(guī)律和模式,對傳統(tǒng)知識(shí)圖譜進(jìn)行補(bǔ)充,應(yīng)用領(lǐng)域更為廣泛。
現(xiàn)實(shí)領(lǐng)域?qū)κ录?shù)據(jù)強(qiáng)烈依賴,而互聯(lián)網(wǎng)發(fā)展帶來數(shù)據(jù)爆炸式增長,尤其是非結(jié)構(gòu)化數(shù)據(jù),依靠人工分析、處理和理解海量事件數(shù)據(jù)已經(jīng)不現(xiàn)實(shí)。事件知識(shí)圖譜為人們分析、處理和理解海量數(shù)據(jù)提供了可能,輔助人們認(rèn)知掌握領(lǐng)域規(guī)律,為智能問答、決策分析等應(yīng)用提供可靠的依據(jù)。本文全面介紹事件知識(shí)圖譜的研究現(xiàn)狀,重點(diǎn)闡述事件知識(shí)圖譜的構(gòu)建技術(shù),并討論事件知識(shí)圖譜的應(yīng)用。
知識(shí)圖譜以三元組的形式表示和儲(chǔ)存實(shí)例數(shù)據(jù),建立數(shù)據(jù)之間的語義鏈接[3]。三元組由頭實(shí)體、尾實(shí)體和描述它們之間的關(guān)系組成。如<姚明,國籍,中國>,頭實(shí)體“姚明”、尾實(shí)體“中國”和它們之間的關(guān)系“國籍”構(gòu)成一個(gè)知識(shí)圖譜的實(shí)例三元組。同時(shí)知識(shí)圖譜用本體(Ontology)對知識(shí)框架進(jìn)行描述和約束。本體概念源于哲學(xué),強(qiáng)調(diào)抽象的框架描述,在知識(shí)圖譜中對實(shí)例數(shù)據(jù)進(jìn)行框架描述和約束,如一個(gè)人的國籍是國家、父親是男性等。知識(shí)本體框架和三元組實(shí)例組成的完整知識(shí)系統(tǒng)就是知識(shí)圖譜,通常用語義網(wǎng)的資源描述框架(Resource Description Framework, RDF)規(guī)范對它們進(jìn)行統(tǒng)一表示[4]。
現(xiàn)有大規(guī)模開源知識(shí)圖譜主要是基于百科知識(shí)數(shù)據(jù)構(gòu)建的,也有基于語言學(xué)和領(lǐng)域知識(shí)構(gòu)建的知識(shí)圖譜,如Freebase、Wikidata、DBpedia、YAGO、NELL、Zhishi.me等。基于維基百科的知識(shí)圖譜Freebase,采用了RDF三元組的語義數(shù)據(jù)模型,由MetaWeb開發(fā),被Google收購后導(dǎo)入了眾包的結(jié)構(gòu)化知識(shí)數(shù)據(jù)Wikidata[5]。DBpedia是早期的語義網(wǎng)項(xiàng)目,從Wikipedia抽取鏈接數(shù)據(jù)集。DBpedia采用了嚴(yán)格的本體形式組織知識(shí)條目,包含人、地點(diǎn)、音樂、電影、組織機(jī)構(gòu)、物種、疾病等類定義,同時(shí)與Freebase等多個(gè)數(shù)據(jù)集建立數(shù)據(jù)鏈接,包含30億余個(gè)RDF三元組[6-7]。YAGO是由德國馬普研究所開發(fā)的,集成了Wikipedia、WordNet和GeoNames這3個(gè)來源的數(shù)據(jù),包含1.2億條三元組的知識(shí)圖譜。YAGO將WordNet的詞匯定義和Wikipedia的本體分類結(jié)構(gòu)進(jìn)行了融合集成,具有更加豐富的實(shí)體分類體系,并且考慮了時(shí)間和空間屬性,為知識(shí)條目(RDF三元組)增加了時(shí)間和空間維度的屬性描述[8-9]。NELL是卡內(nèi)基梅隆開發(fā)的知識(shí)圖譜項(xiàng)目,包含400多萬條高置信度三元組知識(shí),采用互聯(lián)網(wǎng)挖掘的方法從Web自動(dòng)獲取三元組知識(shí)。NELL給定了初始本體和少量樣本,通過機(jī)器學(xué)習(xí)的方式從Web中學(xué)習(xí)和抽取新的知識(shí)[10]。上海交通大學(xué)和東南大學(xué)以英文維基百科為橋梁,通過跨語言鏈接技術(shù),融合建立了中文百科知識(shí)圖譜Zhishi.me[11]。
事件知識(shí)圖譜多采用“自頂向下”的構(gòu)建方法,先定義數(shù)據(jù)模式,再添加實(shí)例內(nèi)容向下細(xì)化,構(gòu)建技術(shù)包括事件知識(shí)表示、事件知識(shí)抽取、事件關(guān)系抽取等。事件知識(shí)圖譜從自然語言文本中抽取事件和實(shí)體、屬性、關(guān)系等并進(jìn)行知識(shí)融合,然后通過本體構(gòu)建體系框架,以結(jié)構(gòu)化的三元組形式存儲(chǔ)。事件知識(shí)圖譜的計(jì)算和推理能力,為多個(gè)領(lǐng)域場景的應(yīng)用提供了技術(shù)支撐。例如金融領(lǐng)域,行業(yè)的發(fā)展以事件為核心,對事件數(shù)據(jù)高度依賴。事件知識(shí)圖譜示例如圖1所示。
圖1 事件知識(shí)圖譜示例
Rospocher等[12]2016年提出了一種以事件為中心的知識(shí)圖譜(Event-Centric Knowledge Graph, ECKGs),從新聞報(bào)道中抽取事件,包括事件的時(shí)間、地點(diǎn)、參與者等,并建立事件間的因果關(guān)系和共指關(guān)系,重構(gòu)事件的歷史發(fā)展和時(shí)間演變。Gottschalk等[13]2018年提出了一種以事件為中心的多語言時(shí)序知識(shí)圖譜(Event-Centric Temporal Knowledge Graph, EventKG),從DBpedia、YAGO、Wikidata等現(xiàn)有大型知識(shí)圖譜中抽取了69萬個(gè)當(dāng)代和歷史事件、230多萬個(gè)時(shí)序關(guān)系,并對抽取的事件、實(shí)體和關(guān)系進(jìn)行了融合。Hernes等[14]2018年提出了一種金融事件知識(shí)的語義表示方法,自動(dòng)處理和分析金融事件的意義用于輔助決策。
Li等[15]2018年提出了事理圖譜(Event Evolutionary Graph, EEG)概念,描述事件之間的順承關(guān)系和因果關(guān)系,用于發(fā)現(xiàn)事件的演化規(guī)律和后續(xù)事件的預(yù)測。事理圖譜與知識(shí)圖譜的主要區(qū)別在于:1)知識(shí)圖譜的研究對象主要是名詞性實(shí)體及其屬性和關(guān)系,而事理圖譜的研究對象主要是謂詞性事件及其邏輯關(guān)系;2)知識(shí)圖譜中實(shí)體間是確定的關(guān)系,而事理圖譜中事件演化的邏輯關(guān)系是不確定的概率。Li等還構(gòu)建了金融領(lǐng)域的事理圖譜(參見http://eeg.8wss.com),從人民日報(bào)等新聞文本中自動(dòng)抽取了134萬個(gè)金融事件和140萬個(gè)事件關(guān)系,并評(píng)估了事件關(guān)系抽取的準(zhǔn)確率。
事件知識(shí)圖譜構(gòu)建與實(shí)體知識(shí)圖譜類似,通常采用基于本體的構(gòu)建方法進(jìn)行知識(shí)建模,先構(gòu)建事件知識(shí)圖譜頂層表示模式,再向下細(xì)化補(bǔ)充實(shí)例,構(gòu)建框架見圖2。目前事件知識(shí)圖譜的相關(guān)研究主要集中在事件知識(shí)的自動(dòng)獲取方面,包括事件抽取和事件關(guān)系抽取,也是事件知識(shí)圖譜構(gòu)建的關(guān)鍵技術(shù)。
圖2 事件知識(shí)圖譜構(gòu)建框架
事件知識(shí)表示直接關(guān)系到知識(shí)推理、知識(shí)計(jì)算的應(yīng)用,是事件知識(shí)圖譜的核心部分。事件知識(shí)圖譜的本體表示包括實(shí)體、屬性、事件和關(guān)系等方面,主要有:1)實(shí)體或?qū)ο?,例如“中國平安保險(xiǎn)(集團(tuán))股份有限公司”“馬云”;2)事件,例如“收購”“凍結(jié)”“融資”等;3)實(shí)體和事件的相關(guān)屬性,例如“職務(wù)”“時(shí)間”“金額”等;4)事件之間的邏輯演化關(guān)系,主要有時(shí)序關(guān)系、因果關(guān)系等。事件知識(shí)圖譜通常利用本體表示工具,人工構(gòu)建包含復(fù)雜類別和對屬性進(jìn)行約束的本體。
傳統(tǒng)的事件表示模型主要基于5W(Who, When, Where, What, Why)構(gòu)建[16-18],沒有建立事件之間的關(guān)系連接。Silver等[19]2011年提出了一種離散事件表示本體模型,提供了事件之間的關(guān)系表示方法。Van Hage等[20]2011年構(gòu)建了簡單事件模型(Simple Event Model, SEM),對不同領(lǐng)域中的事件進(jìn)行建模,建立了事件與時(shí)間、地點(diǎn)和實(shí)體之間的鏈接,但無法表示事件之間的關(guān)系。Rospocher等[12]2016年和Gottschalk等[13]2018年在簡單事件模型(SEM)基礎(chǔ)上建立了事件之間的關(guān)聯(lián),構(gòu)建事件知識(shí)圖譜。
Li等[15]2018年提出了一種事理圖譜表示模型,描述事件之間的順承、因果關(guān)系的事理演化或邏輯。事理圖譜將事件及其關(guān)系用邏輯有向圖來表示,以抽象和泛化的事件為節(jié)點(diǎn),順承關(guān)系和因果關(guān)系為有向邊,有向邊上的轉(zhuǎn)移概率表示事件演化的邏輯可能性。Do等[21]2012年提出了一種基于時(shí)間線的事件表示結(jié)構(gòu),將事件信息映射到時(shí)間維度中,用于事件時(shí)序關(guān)系、共指關(guān)系推理和高效計(jì)算語義關(guān)聯(lián)等。事件知識(shí)圖譜本體框架示例如圖3所示。
圖3 事件知識(shí)圖譜本體框架示例
事件知識(shí)抽取是從描述事件信息的文本中抽取所關(guān)注的事件信息并結(jié)構(gòu)化表示,如什么人、什么時(shí)間、在什么地方、做了什么事情[22]。事件知識(shí)抽取任務(wù)在相關(guān)公開測評(píng)和語料的推動(dòng)下展開,按照任務(wù)定義的不同,可以分為框架表示事件抽取和實(shí)例表示事件抽取這2類。框架表示事件抽取是指預(yù)先定義好事件框架,包括事件類型、事件元素、元素角色等,進(jìn)行的事件抽取任務(wù)。實(shí)例表示事件抽取是在沒有預(yù)先定義好的事件框架下先抽取實(shí)例事件,再歸納事件框架內(nèi)容,如事件類型、事件元素等。從技術(shù)方法層面來看,事件知識(shí)抽取可以分為基于模式匹配的方法和基于機(jī)器學(xué)習(xí)的方法2大類。
2.2.1 模式匹配方法
基于模式匹配的事件知識(shí)抽取是在一些模式的指導(dǎo)下進(jìn)行的某類事件的識(shí)別和抽取,包括有監(jiān)督的和弱監(jiān)督的模式匹配。Riloff[23]1993年通過建立觸發(fā)詞詞典和13種事件匹配模式進(jìn)行事件識(shí)別與抽取,事件匹配模式主要利用事件元素初始描述和事件元素上下文語義進(jìn)行構(gòu)建,并開發(fā)了AutoSlog模式匹配事件抽取系統(tǒng),在MUC語料上取得優(yōu)異的性能。Kim等[24]1995年引入WordNet(參見https://wordnet.princeton.edu)語義詞典,利用語義框架和短語結(jié)構(gòu)進(jìn)行事件抽取,并開發(fā)了PALKA模式匹配事件抽取系統(tǒng)。Riloff等[25]1995年在AutoSlog基礎(chǔ)上開發(fā)出AutoSlog-ST系統(tǒng),不需要對語料中的所有事件元素進(jìn)行標(biāo)注,只需標(biāo)注事件類型,然后利用預(yù)分類語料自動(dòng)學(xué)習(xí)事件模式。姜吉發(fā)[26]2005年提出了一種領(lǐng)域通用事件模式匹配方法IEPAM,將事件抽取模式分為語義模式、觸發(fā)模式、抽取模式,在MUC-7語料的飛行事故事件抽取中獲得優(yōu)異結(jié)果。
2.2.2 機(jī)器學(xué)習(xí)方法
機(jī)器學(xué)習(xí)方法將事件知識(shí)抽取任務(wù)建模成多分類問題,是目前的主流方法。Ahn[22]2006年率先將事件抽取分為4個(gè)階段的多分類子任務(wù),包括:1)事件觸發(fā)詞分類,判斷詞語是否為事件觸發(fā)詞和事件類型;2)事件元素分類,利用判斷實(shí)體詞語是否是事件元素;3)事件屬性分類,判斷事件屬性;4)事件共指消解,判斷2個(gè)事件實(shí)例是否屬于同一事件。Ahn用Timbl和MegaM模型進(jìn)行分類,利用詞匯特征、字典特征、句法特征、實(shí)體特征完成觸發(fā)詞分類子任務(wù),利用事件類型、觸發(fā)詞特征、實(shí)體特征、句法特征完成事件元素分類子任務(wù)。常用的機(jī)器學(xué)習(xí)分類模型還有最大熵模型(Maximum Entropy Model, MaxEnt)[27]、概率軟邏輯推理方法[28]、依存結(jié)構(gòu)分析方法[29]、結(jié)構(gòu)感知機(jī)模型[30]等。機(jī)器學(xué)習(xí)事件知識(shí)抽取方法的各階段子任務(wù)相互獨(dú)立,導(dǎo)致誤差從前向后傳播,性能逐級(jí)衰減,無法處理全局的依賴關(guān)系。文獻(xiàn)[30]2013年和文獻(xiàn)[31]2014年提出了基于結(jié)構(gòu)預(yù)測的事件抽取聯(lián)合模型,從全局特征和整體結(jié)構(gòu)中同時(shí)抽取所有的事件信息。
2.2.3 神經(jīng)網(wǎng)絡(luò)方法
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)逐步應(yīng)用到事件抽取任務(wù)中。神經(jīng)網(wǎng)絡(luò)的方法將事件抽取建模成端到端的系統(tǒng),使用包含豐富語言特征的詞向量[32]作為輸入,通過神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征并分類進(jìn)行事件抽取,不需要或者極少地依賴外部的NLP工具。Chen等[33]2015年提出基于動(dòng)態(tài)多池化卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的事件抽取方法,利用動(dòng)態(tài)多池化方法學(xué)習(xí)出一個(gè)句子中包含的多個(gè)事件。Feng等[34]2016年提出用雙向長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)進(jìn)行事件檢測,但沒有探索事件元素的抽取方法。Nguyen等[35]2016年利用雙向LSTM抽取句子中的語義特征,然后聯(lián)合句子結(jié)構(gòu)特征同時(shí)抽取事件觸發(fā)詞和事件元素。
事件關(guān)系抽取以事件為基本的語義單元,自動(dòng)抽取事件之間的邏輯關(guān)系,包括事件的共指關(guān)系、因果關(guān)系、時(shí)序關(guān)系等。事件關(guān)系的抽取和構(gòu)建可以揭示事件發(fā)展規(guī)律,厘清事件關(guān)聯(lián)并全面了解事件,進(jìn)而構(gòu)建事件知識(shí)圖譜。
2.3.1 事件共指關(guān)系抽取
共指關(guān)系是指代表同一目標(biāo)事件,例如“阿里巴巴以95億美元的高價(jià)全資收購餓了么”和“阿里巴巴集團(tuán)與餓了么簽訂收購協(xié)議”代表同一事件。事件關(guān)系抽取不僅可以發(fā)現(xiàn)多源數(shù)據(jù)中的相同事件,在事件知識(shí)融合和更新補(bǔ)全方面也發(fā)揮著關(guān)鍵作用。Choubey和Huang[36]2017年利用事件之間的依存關(guān)系,采用由簡到難(Easy-First)的迭代方式進(jìn)行事件共指消解。Peng等[37]2016年提出了用語言角色標(biāo)注(Semantic Role Labeling, SRL)方法結(jié)構(gòu)化表示事件,并將結(jié)構(gòu)化事件轉(zhuǎn)化為事件向量,通過計(jì)算事件間的余弦相似度進(jìn)行事件共指消解。Lu和Ng[38]2017年提出了聯(lián)合推理學(xué)習(xí)的事件共指消解方法,旨在避免事件共指消解中各子任務(wù)組件間的誤差傳遞,提高事件共指消解性能。楊雪蓉等[39]2014年提出了利用事件觸發(fā)詞和事件元素推斷事件關(guān)系,取得了很好的事件共指關(guān)系抽取效果。
2.3.2 事件從屬關(guān)系抽取
事件從屬關(guān)系是指同一事件話題下包含的多個(gè)子事件,例如“中美貿(mào)易戰(zhàn)”事件話題下包含的“美國加征關(guān)稅子事件”“美國制裁華為子事件”和“中美貿(mào)易談判子事件”等。動(dòng)態(tài)地從網(wǎng)頁新聞文本中抽取子事件能極大地幫助用戶理解事件話題的內(nèi)容、歷史演變和最新進(jìn)展。清華大學(xué)李涓子教授團(tuán)隊(duì)在事件從屬關(guān)系抽取方面的系列工作極具代表性。Hu等[40]2015年提出了將后續(xù)相似子事件知識(shí)作為先驗(yàn)知識(shí),增強(qiáng)當(dāng)前事件的子事件抽取模型。Hu等[41]2015年提出了基于概率的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法,利用子事件在Wikipedia中的關(guān)系網(wǎng)絡(luò)學(xué)習(xí)同類事件的子事件知識(shí),建模子事件的結(jié)構(gòu)關(guān)系。在抽取事件從屬關(guān)系的基礎(chǔ)上,Hu等[42]2017年提出了一個(gè)端到端的上下文LSTM模型,自動(dòng)生成可能發(fā)生的子事件描述文本進(jìn)行事件預(yù)測。
2.3.3 事件時(shí)序關(guān)系抽取
時(shí)序關(guān)系指事件在時(shí)間上的先后順序,有助于事件的發(fā)現(xiàn)和推理,是事件知識(shí)圖譜構(gòu)建的關(guān)鍵要素。時(shí)序標(biāo)注體系TimeML(參見http://www.timeml.org/)和語料TimeBank將事件時(shí)序關(guān)系分為之前(Before)、之后(After)、同時(shí)(Simultinous)、包含(Includes)等13種,而TimpEval語料僅包含之前(Before)、之后(After)和重疊(Overlap)這3種事件時(shí)序關(guān)系。Do和Ng等[21,43]2012年利用多種事件特征將一篇文章中的事件按照時(shí)序關(guān)系構(gòu)造成事件鏈。構(gòu)建同時(shí)包含靜態(tài)實(shí)體、動(dòng)態(tài)事件和事件邏輯關(guān)系的事件知識(shí)圖譜,豐富了知識(shí)圖譜的動(dòng)態(tài)知識(shí),能支撐更多的領(lǐng)域應(yīng)用。Ge等[44]2015年提出了基于時(shí)間感知的多層貝葉斯模型進(jìn)行事件抽取方法,并用排序?qū)W習(xí)方法發(fā)現(xiàn)關(guān)鍵事件,建立記事年表。Gottschalk等[13]2018年利用YAGO和Wikidata中存在的時(shí)間信息抽取事件時(shí)序關(guān)系并建立事件知識(shí)圖譜。
2.3.4 事件因果關(guān)系抽取
因果關(guān)系指事件之間的作用關(guān)系,即某個(gè)事件是另一事件的結(jié)果,例如“美國制裁中興通訊股份有限公司”和“中興通訊股份有限公司繳納罰款”,在事件知識(shí)圖譜的推理應(yīng)用中具有重大意義。楊竣輝等[45]2016年提出了通過構(gòu)建事件和事件元素的語義關(guān)聯(lián),進(jìn)行事件因果關(guān)系的識(shí)別方法。付劍峰等[46]2011年提出了一種基于層疊條件隨機(jī)場的事件因果關(guān)系抽取模型,將事件因果關(guān)系建模為序列標(biāo)注問題。Sorgent等[47]2013年通過制定規(guī)則進(jìn)行事件因果關(guān)系抽取,并利用貝葉斯推理優(yōu)化結(jié)果。
知識(shí)圖譜正逐步應(yīng)用于各行各業(yè),成為人工智能的基石。單純的靜態(tài)的實(shí)體知識(shí)圖譜顯然已經(jīng)不能滿足實(shí)際應(yīng)用的需要,而事件知識(shí)圖譜刻畫了動(dòng)態(tài)的事件,具有更強(qiáng)大的應(yīng)用價(jià)值。事件知識(shí)圖譜通過事件之間的因果、順承等事件關(guān)系在推演和預(yù)測未來的同時(shí),與實(shí)體知識(shí)圖譜進(jìn)行關(guān)聯(lián)和互動(dòng),實(shí)時(shí)對實(shí)體知識(shí)圖譜進(jìn)行補(bǔ)充和校準(zhǔn)。本章主要介紹事件知識(shí)圖譜在智能問答、決策支持和精準(zhǔn)營銷方面的潛在應(yīng)用場景。
智能問答作為知識(shí)圖譜的典型應(yīng)用,能夠接受自然語言形式描述的問題,通過檢索知識(shí)圖譜進(jìn)行語義分析理解用戶意圖,再通過知識(shí)推理和計(jì)算得到答案。然而,傳統(tǒng)的靜態(tài)實(shí)體知識(shí)圖譜僅能回答常識(shí)性問題,如時(shí)間、地點(diǎn)、人物等。在智能客服系統(tǒng)中,過程類和流程類事項(xiàng)在知識(shí)圖譜中表示為事件,需要根據(jù)事件狀態(tài)的變化捕捉客戶的需求,提高服務(wù)的精準(zhǔn)度和個(gè)性化水平。事件知識(shí)圖譜在動(dòng)態(tài)事件及其邏輯的支撐下,可以進(jìn)一步回答邏輯性問題。
知識(shí)圖譜可以自動(dòng)將海量非結(jié)構(gòu)化的文本數(shù)據(jù)和信息利用起來,輔助人工分析研究理解大數(shù)據(jù),為決策提供準(zhǔn)確、可靠、高效的事實(shí)依據(jù)。事件知識(shí)圖譜通過事件驅(qū)動(dòng)傳導(dǎo)路徑的方式進(jìn)行知識(shí)發(fā)現(xiàn),能夠?qū)壿嬛R(shí)進(jìn)行探索,對輔助決策能發(fā)揮極大的作用。例如金融領(lǐng)域需要依靠外部事件的因果關(guān)系進(jìn)行推演,預(yù)測未來事件和形勢的發(fā)展進(jìn)行決策。面對網(wǎng)絡(luò)輿情除了依靠實(shí)體知識(shí)圖譜技術(shù)分析,還需梳理事件的來龍去脈,對事件演化和發(fā)展進(jìn)行預(yù)判,準(zhǔn)確把握網(wǎng)絡(luò)輿情事件的走向來應(yīng)對和控制。
事件知識(shí)圖譜中事件的順承和時(shí)序關(guān)系描繪了事件的整個(gè)階段,事件的階段性特征能夠用于消費(fèi)推薦任務(wù)進(jìn)而促進(jìn)精準(zhǔn)營銷。事理圖譜對事件鏈?zhǔn)揭蕾嚭捅碚魇录l(fā)展方向可能性的研究就能很好地發(fā)現(xiàn)用戶的消費(fèi)意圖并觸發(fā)后續(xù)消費(fèi)事件,通過識(shí)別用戶的隱式消費(fèi)意圖進(jìn)而做出個(gè)性化的商品推薦。例如,在識(shí)別到出行事件時(shí),通過事件知識(shí)圖譜的順承關(guān)系可以推測出機(jī)票預(yù)訂、酒店預(yù)訂等多種潛在消費(fèi)行為。
現(xiàn)有知識(shí)圖譜構(gòu)建與應(yīng)用重點(diǎn)關(guān)注靜態(tài)數(shù)據(jù)如概念、實(shí)體、屬性等,隨著知識(shí)圖譜研究的發(fā)展和領(lǐng)域應(yīng)用的需求,必然會(huì)逐步擴(kuò)充到事件知識(shí)和事件的時(shí)序關(guān)系、因果關(guān)系、從屬關(guān)系等動(dòng)態(tài)知識(shí)中。動(dòng)態(tài)的事件知識(shí)更清晰地描述了發(fā)展規(guī)律,更有效地提升人們的認(rèn)知能力。隨著計(jì)算能力的不斷提高和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)已被應(yīng)用到知識(shí)圖譜的構(gòu)建技術(shù)中,并取得了許多的研究進(jìn)展。對于事件知識(shí)圖譜構(gòu)建任務(wù)而言,面向非結(jié)構(gòu)化文本的事件抽取是目前的研究難點(diǎn)和重點(diǎn),事件抽取的性能普遍較差,遠(yuǎn)沒有達(dá)到知識(shí)圖譜構(gòu)建的需求,亟待進(jìn)一步的研究。