国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

知識(shí)圖譜技術(shù)在新聞?lì)I(lǐng)域中的應(yīng)用思考

2016-02-14 06:15宋卿戚成琳張鵬洲
中國(guó)傳媒科技 2016年5期
關(guān)鍵詞:結(jié)點(diǎn)圖譜領(lǐng)域

■文/宋卿 戚成琳 張鵬洲

?

知識(shí)圖譜技術(shù)在新聞?lì)I(lǐng)域中的應(yīng)用思考

■文/宋卿 戚成琳 張鵬洲

摘 要:知識(shí)圖譜描述了真實(shí)世界中存在的各種概念和實(shí)體,并通過(guò)彼此間的關(guān)聯(lián)關(guān)系組成一個(gè)語(yǔ)義知識(shí)網(wǎng)絡(luò)。本文首先對(duì)知識(shí)圖譜的基本概念和典型應(yīng)用進(jìn)行了梳理,然后闡述了知識(shí)圖譜在新聞?lì)I(lǐng)域中的應(yīng)用背景并對(duì)當(dāng)前新聞知識(shí)化需求進(jìn)行了分析與研究,并針對(duì)新聞?lì)I(lǐng)域?qū)χR(shí)圖譜的需求、知識(shí)圖譜在國(guó)內(nèi)外新聞?lì)I(lǐng)域中的應(yīng)用現(xiàn)狀以及知識(shí)圖譜在新聞?lì)I(lǐng)域中可能存在的應(yīng)用場(chǎng)景進(jìn)行了重點(diǎn)闡述。

關(guān)鍵詞:知識(shí)圖譜;新聞;應(yīng)用

隨著互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代的到來(lái),各種各樣的信息呈爆炸式增長(zhǎng),從信息缺失到信息過(guò)剩的轉(zhuǎn)變使知識(shí)成為了一種稀缺品。面對(duì)海量的信息和數(shù)據(jù),我們的大腦不堪重負(fù),無(wú)法對(duì)其及時(shí)處理。探索一種從信息中有效選擇出知識(shí)的方法勢(shì)在必行。知識(shí)圖譜就是一種將信息有效結(jié)構(gòu)化的方法。對(duì)新聞行業(yè)來(lái)說(shuō),傳統(tǒng)的新聞內(nèi)容存儲(chǔ)管理方式也亟須改革,新聞內(nèi)容的重復(fù)生產(chǎn)造成了人力的浪費(fèi),新聞生產(chǎn)者無(wú)法提供一種新聞產(chǎn)品使用戶能夠輕松高效地汲取高質(zhì)量的信息。知識(shí)圖譜的引入無(wú)疑為新聞?lì)I(lǐng)域現(xiàn)階段面臨的困境帶來(lái)了轉(zhuǎn)機(jī)。目前,知識(shí)圖譜在新聞中的應(yīng)用還處于起步階段,因此,研究知識(shí)圖譜在新聞?lì)I(lǐng)域中的應(yīng)用現(xiàn)狀,探索知識(shí)圖譜可能存在的應(yīng)用場(chǎng)景具有重大意義。

1.知識(shí)圖譜的基本介紹

知識(shí)圖譜最初是指科學(xué)知識(shí)圖譜,是一種顯示科學(xué)知識(shí)的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的圖像??茖W(xué)知識(shí)圖譜最早用于科研中,屬于科學(xué)計(jì)量學(xué)的范疇。[1]直到2012年,谷歌在其搜索引擎中引入了“知識(shí)圖譜”技術(shù),使得“知識(shí)圖譜”這一概念的熱度迅速上升。但谷歌知識(shí)圖譜并不同于早期的科學(xué)知識(shí)圖譜?,F(xiàn)在的知識(shí)圖譜從本質(zhì)上來(lái)說(shuō)是一種描述知識(shí)域的語(yǔ)義網(wǎng)絡(luò),結(jié)點(diǎn)表示實(shí)體或者概念,結(jié)點(diǎn)與結(jié)點(diǎn)之間的邊表示實(shí)體或者概念之間的關(guān)系。也可以說(shuō),知識(shí)圖譜是一種具有語(yǔ)義性的知識(shí)庫(kù)。知識(shí)圖譜具有一些基本功能,包括知識(shí)的組織、可視化展示和搜索。知識(shí)圖譜涉及到諸多技術(shù),包括自然語(yǔ)言處理,知識(shí)抽取,知識(shí)推理和知識(shí)表示等。對(duì)于知識(shí)圖譜來(lái)說(shuō),其發(fā)展前景很大但同時(shí)又面臨著諸多難點(diǎn),比如知識(shí)圖譜隨著時(shí)間推移的動(dòng)態(tài)更新、多數(shù)據(jù)源的知識(shí)融合、實(shí)體之間關(guān)系的遠(yuǎn)近程度確定等。

知識(shí)圖譜有幾個(gè)典型的應(yīng)用,包括搜索查詢和自動(dòng)問(wèn)答等。谷歌是最早將知識(shí)圖譜引入到搜索引擎中的公司,目的是使用戶能進(jìn)行更智能更快的搜索,使搜索結(jié)果從雜亂無(wú)章的網(wǎng)頁(yè)變成有結(jié)構(gòu)的知識(shí)展示,并且根據(jù)科學(xué)完整的知識(shí)體系為用戶提供一些有價(jià)值的新知識(shí)。谷歌知識(shí)圖譜一發(fā)布,就引得多方效仿。百度推出了百度知心,搜狗推出了搜狗知立方。和谷歌知識(shí)圖譜一樣,用戶輸入要查詢的內(nèi)容,搜索引擎會(huì)以知識(shí)卡片的方式展示搜索結(jié)果,并且在右側(cè)給出更豐富的內(nèi)容推薦。百度知識(shí)圖譜可以直接給出搜索答案,可以進(jìn)行場(chǎng)景化搜索、多維度的信息展示以及更加豐富的相關(guān)信息推薦。搜狗也在不斷創(chuàng)新,已經(jīng)將知識(shí)圖譜應(yīng)用到自動(dòng)問(wèn)答中,如搜狗語(yǔ)音助手就應(yīng)用了搜狗知立方來(lái)進(jìn)行自動(dòng)問(wèn)答。

2.新聞?lì)I(lǐng)域中知識(shí)圖譜的應(yīng)用背景

互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,信息過(guò)量讓人的精力過(guò)度耗費(fèi)卻難以獲取真正有價(jià)值的知識(shí)。而大眾傳媒中的信息再生機(jī)制使得原信息在人的加工之后又產(chǎn)生了新的信息,對(duì)用戶來(lái)說(shuō),這些信息使他們感到窒息,不能對(duì)這些信息及時(shí)接收和處理導(dǎo)致用戶無(wú)法及時(shí)準(zhǔn)確地做出決策,可能因此產(chǎn)生信息焦慮等心理問(wèn)題。而對(duì)新聞生產(chǎn)者來(lái)說(shuō),大量重復(fù)生產(chǎn)出來(lái)的內(nèi)容在存儲(chǔ)管理上面臨著巨大挑戰(zhàn),新聞生產(chǎn)者無(wú)法對(duì)這些新聞內(nèi)容進(jìn)行去重化的積累,很難重復(fù)使用已經(jīng)存在的內(nèi)容,也無(wú)法尋找到一種契合用戶信息汲取需求的新聞產(chǎn)品和新聞形式。

最初新聞內(nèi)容是通過(guò)編目進(jìn)行存放的,檢索只能依靠目錄進(jìn)行。后來(lái)從新聞文本中提取出比較切合新聞內(nèi)容的詞語(yǔ)作為關(guān)鍵詞并利用關(guān)鍵詞來(lái)索引一篇新聞。然而,這樣的搜索依然是低效率的,也沒(méi)有在存儲(chǔ)上有任何改進(jìn),同時(shí),關(guān)鍵詞并不能更好地從多角度來(lái)描述一篇新聞。隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),網(wǎng)民們養(yǎng)成了淺閱讀的習(xí)慣,使標(biāo)簽得到了廣泛應(yīng)用。標(biāo)簽的出現(xiàn)以及對(duì)標(biāo)簽維度進(jìn)行擴(kuò)充形成的富標(biāo)簽的應(yīng)用,使大量非結(jié)構(gòu)化的新聞信息得到有效組織,形成了結(jié)構(gòu)化的數(shù)據(jù),不僅改變了新聞的存儲(chǔ)管理方式,而且為新聞內(nèi)容進(jìn)一步進(jìn)行分類和挖掘創(chuàng)造了可能。同時(shí),用戶能輕松快速地搜索到自己感興趣的內(nèi)容,也使新聞內(nèi)容得以迅速傳播。但是富標(biāo)簽的應(yīng)用也存在著諸多不容忽視的問(wèn)題,首先對(duì)標(biāo)簽的濫用和誤用可能會(huì)扭曲新聞事實(shí),其次雜亂繁多的標(biāo)簽使得用戶眼花繚亂,反而又產(chǎn)生了新的信息壓力,最重要的是,富標(biāo)簽中不同維度的標(biāo)簽之間并沒(méi)有任何連接關(guān)系,無(wú)法形成一個(gè)完整客觀的知識(shí)體系,這樣便限制了對(duì)有效信息的挖掘。這個(gè)時(shí)候,知識(shí)圖譜恰逢其時(shí)地出現(xiàn),應(yīng)用到新聞中,不僅克服了富標(biāo)簽應(yīng)用的缺點(diǎn),并且還強(qiáng)化了在新聞中應(yīng)用富標(biāo)簽的優(yōu)勢(shì)。知識(shí)圖譜化不僅將海量的非結(jié)構(gòu)化新聞信息轉(zhuǎn)化成結(jié)構(gòu)化信息,而且使長(zhǎng)久以來(lái)生產(chǎn)的新聞內(nèi)容得到有效組織和積累,不僅便于內(nèi)容生產(chǎn)者進(jìn)行內(nèi)容存儲(chǔ)管理和新知識(shí)的挖掘,而且還為用戶對(duì)信息的選擇和認(rèn)知帶來(lái)了巨大的方便??梢哉f(shuō),知識(shí)圖譜應(yīng)用到新聞?lì)I(lǐng)域里正好符合當(dāng)下新聞行業(yè)所面臨的需求和挑戰(zhàn),并且會(huì)為新聞?lì)I(lǐng)域帶來(lái)新的機(jī)遇和革新。

3.知識(shí)圖譜在新聞?lì)I(lǐng)域中的應(yīng)用思考

3.1新聞?lì)I(lǐng)域中的知識(shí)圖譜

知識(shí)圖譜在新聞?lì)I(lǐng)域的應(yīng)用,不能只依賴于知識(shí)圖譜的現(xiàn)有特性,應(yīng)該加入新聞?lì)I(lǐng)域所需的獨(dú)有特性。首先,知識(shí)圖譜在新聞?lì)I(lǐng)域中應(yīng)該更強(qiáng)調(diào)它的知識(shí)可視化展示功能。其次,根據(jù)新聞?lì)I(lǐng)域的實(shí)際需要,應(yīng)該在現(xiàn)有知識(shí)圖譜構(gòu)成元素中加入時(shí)間線的特性,并且,要想擁有更多創(chuàng)新性的應(yīng)用,知識(shí)圖譜的構(gòu)建不能只局限于新聞內(nèi)容的圖譜化,還應(yīng)當(dāng)擴(kuò)充進(jìn)其他層面的知識(shí)。比如用戶實(shí)體、用戶和新聞內(nèi)容的關(guān)系的加入可以用來(lái)進(jìn)行個(gè)性化推薦等。最后,知識(shí)圖譜要想在新聞?lì)I(lǐng)域中有更加深入的應(yīng)用必須重視它的知識(shí)推理技術(shù)。對(duì)知識(shí)圖譜進(jìn)行深度知識(shí)推理,有利于新知識(shí)的發(fā)現(xiàn),為新聞生產(chǎn)者提供新穎的、有深度的、帶有預(yù)測(cè)性和趣味性的新聞內(nèi)容,對(duì)讀者來(lái)說(shuō)將獲取到更有價(jià)值的、能輔助決策的信息。這對(duì)兩者來(lái)說(shuō)達(dá)到了雙贏的效果。

3.2知識(shí)圖譜化在新聞?lì)I(lǐng)域中的應(yīng)用現(xiàn)狀

3.2.1知識(shí)圖譜化在國(guó)外新聞?lì)I(lǐng)域中的應(yīng)用

《華盛頓郵報(bào)》的知識(shí)地圖是其在產(chǎn)品形式和用戶服務(wù)上進(jìn)行的新探索。知識(shí)地圖不僅可以防止對(duì)信息的重復(fù)生產(chǎn),實(shí)現(xiàn)重用,而且以知識(shí)地圖的方式來(lái)組織、存儲(chǔ)和管理知識(shí)便于用戶進(jìn)行檢索和學(xué)習(xí),節(jié)約時(shí)間成本和精力成本?!度A盛頓郵報(bào)》深諳此道,他們將知識(shí)地圖應(yīng)用到網(wǎng)頁(yè)新聞中,在新聞?wù)闹袑?duì)一些知識(shí)點(diǎn)進(jìn)行標(biāo)注,點(diǎn)擊可在正文右側(cè)以知識(shí)卡片的形式展示相關(guān)的新聞背景或相關(guān)信息,這些補(bǔ)充顯示的知識(shí)主要是一些簡(jiǎn)短的文字和圖片。這種做法既不影響原來(lái)的閱讀體驗(yàn),還能在右側(cè)及時(shí)地為讀者補(bǔ)充相關(guān)的新聞背景、新聞發(fā)展情況,或是一些讀者不懂的相關(guān)知識(shí),便于讀者更準(zhǔn)確地理解新聞內(nèi)容和新聞的發(fā)展過(guò)程。而且,讀者在閱讀的過(guò)程中不必自己去發(fā)現(xiàn)知識(shí),然后花費(fèi)時(shí)間精力來(lái)搜索,這樣可以大大提高用戶體驗(yàn)。可以說(shuō),知識(shí)地圖在新聞中的這種應(yīng)用不僅創(chuàng)造了一種新的新聞形式,而且體現(xiàn)了以讀者為本的意識(shí),為讀者提供了一種良好的服務(wù)。

《紐約時(shí)報(bào)》的新聞編碼也是一種知識(shí)圖譜化的應(yīng)用?!都~約時(shí)報(bào)》實(shí)驗(yàn)室發(fā)布一篇名為《新聞的未來(lái)不是文章》(The Future Of News Is Not An Article)的報(bào)道,文章指出了一種名為“Paticles”的新的新聞形式——對(duì)新聞中提取出的新聞?lì)w粒即信息點(diǎn)進(jìn)行編碼。這種新聞編碼可以讓新聞信息具有被搜索和被提取的能力,并且把這些顆粒嵌入一個(gè)動(dòng)態(tài)內(nèi)鏈框架可以使新聞的表示具有直觀性,同時(shí)把新聞報(bào)道拆分為元件,建立清晰的時(shí)間軸,可以實(shí)現(xiàn)新聞信息的及時(shí)增量積累和信息重用。事實(shí)上,對(duì)新聞編碼就是對(duì)新聞進(jìn)行信息點(diǎn)提取然后形成一個(gè)信息網(wǎng)絡(luò)。這樣的信息網(wǎng)絡(luò)對(duì)于新聞生產(chǎn)者來(lái)說(shuō)解放了他們的勞動(dòng)力,不必再花太多時(shí)間和精力去搜集和整理信息,因?yàn)檫@個(gè)信息網(wǎng)絡(luò)已經(jīng)自動(dòng)規(guī)整好了。而對(duì)于讀者來(lái)說(shuō),經(jīng)過(guò)編碼的新聞?wù)麄€(gè)框架脈絡(luò)清晰,加入了時(shí)間軸及時(shí)更新的特性,使得讀者的閱讀節(jié)奏得到了契合,并且可以根據(jù)自己的興趣進(jìn)行有選擇地閱讀和汲取信息,使讀者有一個(gè)更好的接收和處理信息的體驗(yàn)。對(duì)新聞進(jìn)行編碼還有一個(gè)很大的用處,就是可以提取信息網(wǎng)絡(luò)中的元數(shù)據(jù)信息點(diǎn),對(duì)新聞敘事進(jìn)行重構(gòu),對(duì)同樣的新聞內(nèi)容自動(dòng)生成風(fēng)格迥異的文章。事實(shí)上這已經(jīng)體現(xiàn)出一個(gè)趨勢(shì),就是知識(shí)圖譜是可以作為機(jī)器寫作的底層信息支撐的。

3.2.2知識(shí)圖譜化在國(guó)內(nèi)新聞?lì)I(lǐng)域中的應(yīng)用

目前,國(guó)內(nèi)的媒體機(jī)構(gòu)已經(jīng)開始對(duì)知識(shí)圖譜在新聞生產(chǎn)中的應(yīng)用進(jìn)行探索。新華通訊社作為國(guó)家級(jí)通訊社,在新聞生產(chǎn)報(bào)道方面的技術(shù)創(chuàng)新一直走在行業(yè)前列。目前,新華通訊社沒(méi)有建立真正意義上的知識(shí)圖譜,還停留在人物庫(kù)、機(jī)構(gòu)庫(kù)這樣的傳統(tǒng)知識(shí)庫(kù)層面,但已經(jīng)開始將百科知識(shí)和它自有的人物庫(kù)、機(jī)構(gòu)庫(kù)進(jìn)行合并,也算是知識(shí)圖譜在新聞?lì)I(lǐng)域中應(yīng)用的初步嘗試。目前筆者正在參與的“業(yè)務(wù)建模與知識(shí)圖譜系統(tǒng)”項(xiàng)目,就是通過(guò)將新聞文本中包含的重要內(nèi)容碎片化、知識(shí)化,從而達(dá)到新聞的知識(shí)化積累,為新聞知識(shí)能夠高效率的查詢和重用建立基礎(chǔ)。通過(guò)建立一個(gè)知識(shí)抽取模型,對(duì)新聞文本資源進(jìn)行實(shí)體和關(guān)系抽取,構(gòu)建出知識(shí)圖譜,將這些新聞文本資源結(jié)構(gòu)化。在不耗費(fèi)大量人力物力的前提下及時(shí)準(zhǔn)確地完成知識(shí)的積累,并且不再使用網(wǎng)頁(yè)上的新聞文本作為挖掘潛在信息的來(lái)源,而是把知識(shí)圖譜作為知識(shí)源,進(jìn)行進(jìn)一步的知識(shí)挖掘。新華社2015年年底推出的“快筆小新機(jī)器自動(dòng)寫作”未來(lái)也將基于知識(shí)圖譜進(jìn)行新聞內(nèi)容自動(dòng)選擇和敘述決策,從而自動(dòng)生成更高質(zhì)量的新聞內(nèi)容。

國(guó)內(nèi)其他媒體也逐漸開始對(duì)知識(shí)圖譜的應(yīng)用進(jìn)行探索??梢?,新聞?lì)I(lǐng)域中知識(shí)圖譜化的應(yīng)用在國(guó)內(nèi)也將成為一個(gè)新的趨勢(shì)。

3.3知識(shí)圖譜在新聞?lì)I(lǐng)域中的應(yīng)用場(chǎng)景思考

第3.2節(jié)中的應(yīng)用實(shí)例顯示出了知識(shí)圖譜在國(guó)內(nèi)外新聞?lì)I(lǐng)域中的應(yīng)用現(xiàn)狀。事實(shí)上,對(duì)于知識(shí)圖譜在新聞?lì)I(lǐng)域中的各種應(yīng)用場(chǎng)景還亟待我們進(jìn)行思考和挖掘。

3.3.1新聞的可視化展示

對(duì)于知識(shí)圖譜來(lái)說(shuō),最直接和簡(jiǎn)單的應(yīng)用就是它的可視化功能了,可視化展示可以說(shuō)是知識(shí)圖譜在新聞中的顯式應(yīng)用。為新聞構(gòu)建新聞圖譜,可以客觀完整地表現(xiàn)出一個(gè)信息體系。這個(gè)信息體系可能是新聞內(nèi)容本身、該新聞的背景以及很多新聞信息點(diǎn)的相關(guān)信息構(gòu)成的網(wǎng)絡(luò)。也可能是新聞事件在時(shí)間線上發(fā)展的縱向網(wǎng)絡(luò)?;蛘呤悄骋粋€(gè)主題和它下屬的不同話題的網(wǎng)絡(luò)。這些新聞圖譜不僅可以將非結(jié)構(gòu)化的信息結(jié)構(gòu)化,而且可以實(shí)現(xiàn)積累,對(duì)用戶來(lái)說(shuō),可以更完整直觀地把握新聞的內(nèi)容和動(dòng)態(tài)發(fā)展。并且,利用這種可視化的展示方式,可以使用戶減少處理信息和檢索相關(guān)信息的行為,還可以利用這種可視化展示所衍生出來(lái)的導(dǎo)航功能使用戶選擇感興趣的內(nèi)容進(jìn)行閱讀,大大提高了用戶的閱讀體驗(yàn)。

3.3.2新聞的延伸補(bǔ)充

新聞的延伸閱讀和補(bǔ)充其實(shí)早就存在,只是基于知識(shí)圖譜所進(jìn)行的新聞延伸補(bǔ)充更具科學(xué)性、相關(guān)性和多樣性。在一個(gè)新聞頁(yè)面中,新聞?wù)闹兴鶚?biāo)注出來(lái)的信息點(diǎn)作為知識(shí)圖譜某些局部的中心結(jié)點(diǎn),而延伸閱讀的內(nèi)容可以是和該中心結(jié)點(diǎn)關(guān)聯(lián)度極高的結(jié)點(diǎn)或和該中心結(jié)點(diǎn)有時(shí)間關(guān)聯(lián)的結(jié)點(diǎn)所代表的新聞,位于正文的下方。而補(bǔ)充則是在新聞?wù)牡挠覀?cè),以簡(jiǎn)短的文字、圖片,甚至是視頻的知識(shí)卡片形式來(lái)對(duì)新聞的背景、一些由于篇幅原因無(wú)法在正文中寫出的相關(guān)信息、相關(guān)歷史信息或用戶不了解的知識(shí)進(jìn)行補(bǔ)充,這樣省去了用戶自己去檢索的麻煩。同時(shí)這樣的頁(yè)面布局無(wú)須使用超鏈接跳轉(zhuǎn)離開本頁(yè)面,也不會(huì)影響正文的閱讀體驗(yàn)。

3.3.3新聞個(gè)性化推薦

基于知識(shí)圖譜的淺層新聞推薦類似于新聞延伸補(bǔ)充內(nèi)容的推薦。然而這樣對(duì)知識(shí)圖譜簡(jiǎn)單淺顯的應(yīng)用相對(duì)知識(shí)圖譜的搭建所花費(fèi)的成本來(lái)說(shuō)是一種浪費(fèi)。在《2015中國(guó) APP排行榜》中僅次于“騰訊新聞”和“今日頭條”的資訊新聞?lì)惪蛻舳恕耙稽c(diǎn)資訊”正是依靠基于興趣圖譜的個(gè)性化推薦服務(wù)成為一匹黑馬而躍居行業(yè)第三的?!耙稽c(diǎn)資訊”新聞客戶端基于興趣圖譜的個(gè)性化推薦是知識(shí)圖譜在新聞中的創(chuàng)新式應(yīng)用。興趣圖譜在新聞內(nèi)容圖譜化的基礎(chǔ)上加入了用戶層面的知識(shí),由此也帶入了更豐富的關(guān)系類型。興趣圖譜包含用戶、用戶身份、用戶新聞興趣點(diǎn)等類型的結(jié)點(diǎn),還包含興趣結(jié)點(diǎn)與興趣結(jié)點(diǎn)之間、用戶結(jié)點(diǎn)和興趣結(jié)點(diǎn)之間的各種關(guān)系,如用戶訂閱、搜索、收藏、評(píng)論、分享、不喜歡等,并賦予這些關(guān)系遠(yuǎn)近強(qiáng)弱之分。接著,利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)的算法在搭建好的興趣圖譜上進(jìn)行挖掘和計(jì)算,可以做到對(duì)用戶來(lái)說(shuō)最優(yōu)的個(gè)性化推薦。

3.3.4機(jī)器新聞寫作

機(jī)器新聞寫作是一場(chǎng)正在發(fā)生的革命,機(jī)器新聞自動(dòng)寫作的實(shí)現(xiàn)將大大解放人力,使得記者將精力和時(shí)間花在更有價(jià)值和更有創(chuàng)造性的工作上。機(jī)器新聞寫作涉及自然語(yǔ)言生成技術(shù),而自然語(yǔ)言生成所需的信息就來(lái)自于知識(shí)庫(kù)。知識(shí)圖譜是一種具有語(yǔ)義性的知識(shí)庫(kù),因此知識(shí)圖譜可以應(yīng)用到機(jī)器新聞寫作中,以提供自動(dòng)生成自然語(yǔ)言所需的知識(shí)和信息。斯坦福大學(xué)的機(jī)器人學(xué)家 Ashutosh Saxena在宣布他們的 Robo Brain在線服務(wù)的時(shí)候說(shuō)過(guò):“它(Robo Brain)的目標(biāo)是構(gòu)建一個(gè)非常好的知識(shí)圖譜,或者知識(shí)庫(kù),供機(jī)器人使用?!庇纱丝芍R(shí)圖譜在機(jī)器新聞寫作中起到了一個(gè)自然語(yǔ)言生成的信息支撐作用。

3.3.5預(yù)測(cè)性新聞

知識(shí)圖譜還有一個(gè)重要技術(shù)是知識(shí)推理,目前,通過(guò)采用關(guān)聯(lián)規(guī)則、謂詞邏輯和馬爾科夫邏輯網(wǎng)絡(luò)等方法和工具進(jìn)行知識(shí)推理,能夠從已有知識(shí)中發(fā)現(xiàn)隱含的新知識(shí)。建立好新聞知識(shí)圖譜之后,如果能實(shí)現(xiàn)對(duì)新知識(shí)的深度發(fā)現(xiàn),不僅可以為新聞生產(chǎn)者提供更多獨(dú)到的角度來(lái)吸引讀者,而且可以為用戶提供更有價(jià)值的信息以輔助決策,并且,在為讀者提供具有預(yù)測(cè)性的新聞內(nèi)容這一方向也可能有其施展的地方,如財(cái)經(jīng)方面的一些趨勢(shì)和體育賽事結(jié)果的預(yù)測(cè)或許在未來(lái)都會(huì)通過(guò)對(duì)知識(shí)圖譜的大規(guī)模計(jì)算、推理得以實(shí)現(xiàn)。

4.總結(jié)

到目前為止,知識(shí)圖譜在新聞中的應(yīng)用還處于剛起步的階段。就目前的應(yīng)用來(lái)看,都是基于知識(shí)圖譜可以將非結(jié)構(gòu)化信息轉(zhuǎn)化成結(jié)構(gòu)化信息這一根本特性。新聞的可視化展示屬于知識(shí)圖譜的顯式應(yīng)用,而新聞的延伸補(bǔ)充、新聞個(gè)性化推薦、機(jī)器新聞寫作、新聞?lì)A(yù)測(cè)和發(fā)現(xiàn)新知識(shí)屬于知識(shí)圖譜的隱式應(yīng)用。這些應(yīng)用從新聞行業(yè)的角度來(lái)說(shuō),不僅實(shí)現(xiàn)了知識(shí)的增量積累和重用,而且大大解放了新聞工作者的人力,同時(shí)創(chuàng)造了多種新的新聞產(chǎn)品形式和新聞生產(chǎn)形式,對(duì)新聞行業(yè)來(lái)說(shuō)是一個(gè)很大的機(jī)遇和變革。而從用戶和讀者的角度來(lái)說(shuō),他們既可以擁有更好的新聞閱讀體驗(yàn),不必花費(fèi)太多時(shí)間精力去處理、篩選和檢索信息就能更好地把握新聞的內(nèi)容和發(fā)展,同時(shí)還能享受知識(shí)圖譜應(yīng)用所帶來(lái)的諸多服務(wù),如新聞的個(gè)性化推薦??梢哉f(shuō)知識(shí)圖譜在新聞中的應(yīng)用為整個(gè)新聞行業(yè)和廣大用戶都帶來(lái)了極大的好處。知識(shí)圖譜雖然在新聞中的應(yīng)用目前還處于探索初期,相信未來(lái)隨著技術(shù)難點(diǎn)的克服,還會(huì)發(fā)掘出更多更有價(jià)值的應(yīng)用場(chǎng)景,我們拭目以待。

參考文獻(xiàn)

[1]陳悅,陳超美,劉則淵,胡志剛,王賢文.CiteSpace知識(shí)圖譜的方法論功能[J].科學(xué)學(xué)研究,2015(02):242-253.

[2]雷會(huì)珠,姚立會(huì).知識(shí)地圖與科學(xué)知識(shí)圖譜辨析[J].中國(guó)科技信息,2012(10):59,68.

[3]楊思洛,韓瑞珍.國(guó)外知識(shí)圖譜的應(yīng)用研究現(xiàn)狀分析[J].情報(bào)資料工作,2013(06):15-20.

[4]胡澤文,孫建軍,武夷山.國(guó)內(nèi)知識(shí)圖譜應(yīng)用研究綜述[J].圖書情報(bào)工作,2013(03):131-137,84.

[5]郭云峰,韓龍,皮立華,宋科.知識(shí)圖譜在大數(shù)據(jù)中的應(yīng)用[J].電信技術(shù),2015(06):25-29.

[6]曹倩,趙一鳴.知識(shí)圖譜的技術(shù)實(shí)現(xiàn)流程及相關(guān)應(yīng)用[J].情報(bào)理論與實(shí)踐,2015(12):127-132.

(作者單位:中國(guó)傳媒大學(xué))

中圖分類號(hào):G210.7

文獻(xiàn)標(biāo)識(shí)碼:A

基金項(xiàng)目:本文系為北京市科學(xué)技術(shù)委員會(huì)2016年專項(xiàng)項(xiàng)目《基于類腦知識(shí)圖譜的中文新聞自動(dòng)寫作系統(tǒng)研發(fā)與示范應(yīng)用》成果,課題編號(hào): Z16110000021614 ;國(guó)家新聞出版廣電總局科研項(xiàng)目《廣播電視監(jiān)測(cè)監(jiān)管數(shù)據(jù)挖掘與多維度檢索研究》,項(xiàng)目號(hào):2014-41。

猜你喜歡
結(jié)點(diǎn)圖譜領(lǐng)域
LEACH 算法應(yīng)用于礦井無(wú)線通信的路由算法研究
基于八數(shù)碼問(wèn)題的搜索算法的研究
繪一張成長(zhǎng)圖譜
2020 IT領(lǐng)域大事記
領(lǐng)域·對(duì)峙
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
主動(dòng)對(duì)接你思維的知識(shí)圖譜
新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
雜草圖譜
扎鲁特旗| 金川县| 交口县| 陇西县| 赤峰市| 桂东县| 阳泉市| 大冶市| 高陵县| 云霄县| 尼木县| 工布江达县| 锡林浩特市| 日土县| 黑龙江省| 修水县| 孟州市| 岑溪市| 乐业县| 谷城县| 博兴县| 四平市| 酒泉市| 广安市| 平阴县| 长阳| 连州市| 武义县| 静乐县| 黄龙县| 石台县| 白水县| 淮阳县| 通渭县| 蚌埠市| 南充市| 新源县| 汨罗市| 中卫市| 台湾省| 白沙|