国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識(shí)元抽取的中文智庫成果描述規(guī)則研究

2017-04-19 18:02趙蓉英張心源
圖書與情報(bào) 2017年1期
關(guān)鍵詞:智庫

趙蓉英 張心源

摘 要:從資源角度來看,智庫是一個(gè)擁有大量知識(shí)資源的知識(shí)庫。知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)層面成為繼載體層面后的知識(shí)資源管理與計(jì)量的新視角,知識(shí)元概念的提出為實(shí)現(xiàn)知識(shí)資源直接管理和計(jì)量提供了可能。中文文本的分類、挖掘、標(biāo)引等研究基礎(chǔ)為我國智庫成果的知識(shí)元抽取提供了技術(shù)保障,將抽取出的知識(shí)元?dú)w類、進(jìn)一步歸納出對(duì)應(yīng)的描述規(guī)則有利于實(shí)現(xiàn)知識(shí)層面的中文智庫成果管理與評(píng)價(jià)。文章基于構(gòu)建主題詞表進(jìn)行文本抽取的方法,選擇中國國際問題研究中心2015年全部可獲得的智庫研究成果為樣本,進(jìn)行成果知識(shí)元的抽取,經(jīng)過人工選擇、精煉抽取結(jié)果后歸納總結(jié)出中文智庫成果的知識(shí)元類型及對(duì)應(yīng)描述規(guī)則。共歸納出事實(shí)知識(shí)元、定義知識(shí)元、結(jié)論知識(shí)元、方法知識(shí)元和關(guān)系知識(shí)元等5種知識(shí)元類型和16種具體的描述規(guī)則。

關(guān)鍵詞:智庫;知識(shí)元;中文智庫成果;描述規(guī)則

中圖分類號(hào): G250.7;G252 文獻(xiàn)標(biāo)識(shí)碼: A DOI:10.11968/tsyqb.1003-6938.2017018

Abstract From the perspective of resources, the think tanks are large knowledge base with rich knowledge resources. In the era of knowledge-driven economy, the knowledge resources management and measurement focus more on knowledge level than the carrier level. Knowledge elements are the key role when dealing with knowledge itself. Research on the classification, mining and index of Chinese text provides the technological support for knowledge element extraction of Chinese think-tank products. The descriptive rules, induced from the classification of extracted knowledge elements, would benefit the management and assessment of Chinese think-tank products from level of knowledge. According to the method of building thesaurus for text extraction, the paper chooses the accessible think-tank research products from China Institute of International Studies in 2015 as samples. The types and descriptive rules of Chinese think-tank products are summarized after man-made selection and purification of extraction results. Five kinds of knowledge elements such as fact knowledge element, definition knowledge element, conclusion knowledge element, method knowledge element and relation knowledge element as well as 16 types of descriptive rules of Chinese think-tank products are summed up.

Key words think tank; knowledge element; Chinese think-tank products; descriptive rules

當(dāng)今世界,我國內(nèi)外部環(huán)境正發(fā)生深刻變化,國際政治經(jīng)濟(jì)格局深刻調(diào)整、大國博弈日益復(fù)雜。以布魯金斯學(xué)會(huì)、蘭德公司等為代表的智庫在西方發(fā)達(dá)國家決策中發(fā)揮了重要作用。我國近年來也高度重視我國智庫建設(shè),指導(dǎo)我國智庫建設(shè)的文件相繼出臺(tái),我國迎來了智庫時(shí)代[1]。

國內(nèi)學(xué)界對(duì)智庫建設(shè)、運(yùn)作模式、評(píng)價(jià)體系等方面也開展了豐富的研究,其中構(gòu)建適用于中國特色新型智庫的評(píng)價(jià)體系成為一項(xiàng)重要研究分支,以積極引導(dǎo)我國智庫實(shí)現(xiàn)從“量”到“質(zhì)”的轉(zhuǎn)變,提升智庫影響力。與此同時(shí),知識(shí)管理活動(dòng)正經(jīng)歷著由信息單元向知識(shí)單元邁進(jìn)的探索,由于智庫本身就是一個(gè)知識(shí)庫,將知識(shí)元的概念引入智庫知識(shí)管理中,可以實(shí)現(xiàn)從產(chǎn)品數(shù)量到產(chǎn)品質(zhì)量的檢測評(píng)價(jià),并為后續(xù)智庫成果知識(shí)單元挖掘研究以及從知識(shí)層面進(jìn)行管理與評(píng)價(jià)我國智庫資源提供可能。故必然會(huì)引起智庫評(píng)價(jià)與管理的新變化。本文從中文文本的知識(shí)元抽取機(jī)制出發(fā),選取中文智庫成果作為研究對(duì)象,通過合適的樣本考察了中文智庫成果存在的知識(shí)元類型及其對(duì)應(yīng)的描述規(guī)則。其中,描述規(guī)則是對(duì)中文智庫成果的精準(zhǔn)化標(biāo)引,確定了智庫成果中知識(shí)單元數(shù)量。

1 相關(guān)概述

1.1 我國智庫的研究現(xiàn)狀與智庫評(píng)價(jià)體系

通過文獻(xiàn)調(diào)研和內(nèi)容分析發(fā)現(xiàn),國內(nèi)現(xiàn)有對(duì)我國智庫建設(shè)的討論主要有:中外智庫對(duì)比[3-5]、智庫界定[6]、學(xué)術(shù)機(jī)構(gòu)與智庫間的轉(zhuǎn)型[7-8]、中國智庫發(fā)展理念與制度創(chuàng)新[9]以及中國智庫評(píng)價(jià)體系[10]等。智庫本身是一個(gè)綜合性強(qiáng)的知識(shí)加工機(jī)構(gòu),多個(gè)學(xué)科均有滲透,其中圖書情報(bào)學(xué)科尤為關(guān)注智庫評(píng)價(jià)體系的構(gòu)建。

科學(xué)的評(píng)價(jià)體系不僅用于衡量智庫的優(yōu)劣,更是我國智庫發(fā)展方向的引導(dǎo)標(biāo)桿。上海高校智庫研究和管理中心執(zhí)行副主任沈國麟曾指出:智庫排行榜的最大價(jià)值在于催生了中國新型智庫的行業(yè)自覺,并通過設(shè)定指標(biāo)的形式引導(dǎo)智庫發(fā)展方向[11]。本文進(jìn)行的智庫成果知識(shí)單元描述規(guī)則的抽取,為進(jìn)行智庫成果知識(shí)單元挖掘提供了識(shí)別規(guī)則,提供了從知識(shí)計(jì)量學(xué)角度出發(fā)的基本計(jì)量單位。

1.2 中文智庫成果與知識(shí)評(píng)價(jià)計(jì)量

對(duì)比國內(nèi)現(xiàn)行的智庫指標(biāo)體系,結(jié)合相關(guān)文獻(xiàn)研究發(fā)現(xiàn),我國智庫評(píng)價(jià)采用了定性與定量相結(jié)合的指標(biāo)體系,指標(biāo)涉及了智庫資源、效用以及影響力等多個(gè)角度。尤其是對(duì)中文智庫成果的評(píng)價(jià),包括了智庫智力成果的載體數(shù)量、智力成果受到政治團(tuán)體的采用狀況等內(nèi)容。但現(xiàn)有評(píng)價(jià)指標(biāo)主要是對(duì)載體數(shù)量和后續(xù)使用情況的評(píng)判,沒有深入到智庫單位創(chuàng)造知識(shí)價(jià)值的多少。而以知識(shí)單元為單位進(jìn)行知識(shí)層面的智庫成果評(píng)價(jià)的優(yōu)點(diǎn)在于知識(shí)計(jì)量指標(biāo)較傳統(tǒng)智庫計(jì)量指標(biāo)更為精準(zhǔn)、及時(shí)。

首先,進(jìn)行智庫成果數(shù)量上的統(tǒng)計(jì),載體層面的評(píng)價(jià)會(huì)造成智力產(chǎn)品的重復(fù)統(tǒng)計(jì),因?yàn)橹菐旄黝愋统霭嫖锞侵橇Ξa(chǎn)品的載體,而非知識(shí)本身,成果數(shù)量與智庫智力產(chǎn)品的價(jià)值并不等同;其次,以政策建議被決策者和社會(huì)組織采納情況來衡量智庫成果影響力不夠全面,因?yàn)橹菐斐晒问蕉鄻樱玫經(jīng)Q策者批注的往往是決策咨詢報(bào)告、調(diào)研報(bào)告等正式形式的文檔,而智庫專家的一些著作、短評(píng)、論文等也蘊(yùn)含了寶貴的智慧,這些形式的成果通過網(wǎng)絡(luò)、媒體等形式發(fā)揮著智庫的影響力;最后,智庫成果對(duì)政策的影響具有時(shí)效性,有些成果的影響力需要在多年以后才能彰顯出來,或者某項(xiàng)決策受到多個(gè)智庫成果的共同影響,這種情況單從被批注的智庫成果數(shù)量上不能得以全面體現(xiàn)。

1.3 中文智庫的成果類型與內(nèi)容特點(diǎn)

對(duì)中文智庫成果類型與內(nèi)容特點(diǎn)歸納是進(jìn)行智庫成果知識(shí)單元抽取的基礎(chǔ)。按照主流理論觀點(diǎn),中國智庫的類型主要包括:官方智庫、半官方智庫、民間智庫以及大學(xué)附屬型智庫[12]。縱觀四種類型智庫的研究成果,基本涵蓋了以下形式:一是較為正式的決策咨詢報(bào)告,如調(diào)研報(bào)告、課題結(jié)項(xiàng)報(bào)告、藍(lán)皮書等,該類成果特點(diǎn)是研究項(xiàng)目多為政府或社會(huì)組織直接委托項(xiàng)目,格式規(guī)范,是智庫影響決策的主要工具;二是智庫學(xué)者公開發(fā)表的文獻(xiàn),如學(xué)術(shù)論文、專著等,該類成果能夠方便地從期刊數(shù)據(jù)庫以及圖書出版機(jī)構(gòu)獲取,是科學(xué)觀點(diǎn)傳播的常用形式;三是通過網(wǎng)絡(luò)傳播的非正式成果,如專家短評(píng)、媒體訪談?dòng)涗浀?,該類成果更新快、影響范圍廣,是智庫與社會(huì)公眾交流的主要途徑,也代表了智庫的最新觀點(diǎn)。

基于中文和中國國情特點(diǎn),中文智庫成果呈現(xiàn)出以下特點(diǎn):從成果內(nèi)容涉及主題上看,主要有軍事、外交、經(jīng)濟(jì)、社會(huì)、民生、教育、醫(yī)療等,根據(jù)智庫性質(zhì)的不同在各個(gè)主題的研究表現(xiàn)出不同的傾向;從成果形式上看,專家觀點(diǎn)、媒體訪談等非正式形式的成果在內(nèi)容結(jié)構(gòu)上不拘一格,而調(diào)研報(bào)告、學(xué)術(shù)論文、專著等具有相對(duì)工整的格式,包含摘要、引言、關(guān)鍵詞、參考文獻(xiàn)等信息;從成果研究主題上看,具有明顯的時(shí)間特征,因?yàn)橹菐斓难芯磕繕?biāo)是影響決策,其研究方向集中在每年度的焦點(diǎn)問題上;從成果行文思路上看,中文智庫成果形式簡練,研究思路多為“事實(shí)陳述——分析——結(jié)論”的發(fā)展順序;從研究方法上看,區(qū)別于一般學(xué)術(shù)研究成果,研究方法集中在綜述研究、社會(huì)調(diào)查、統(tǒng)計(jì)分析等社會(huì)科學(xué)研究通用的基礎(chǔ)方法,引文分析等學(xué)科專有方法的使用頻率較低。

2 知識(shí)元相關(guān)基礎(chǔ)研究

2.1 知識(shí)元的提出與影響

知識(shí)元(knowledge element)又稱為知識(shí)因子、知識(shí)基因、知識(shí)元素等。20世紀(jì)70年代后期,美國情報(bào)學(xué)家弗拉基米爾·斯拉麥卡教授來華講學(xué)時(shí),提出知識(shí)的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立的“知識(shí)元”,即“數(shù)據(jù)元”[13]。國內(nèi)關(guān)于知識(shí)元的最早定義是朱曉蕓等人在1993年提出的“原子知識(shí)元”的概念[14]。直至目前,關(guān)于知識(shí)元的明確定義尚未形成統(tǒng)一意見,特別是對(duì)知識(shí)元與知識(shí)單元之間關(guān)系的界定。部分學(xué)者認(rèn)為知識(shí)單元等同知識(shí)元,是知識(shí)不可再分的基本單元,是構(gòu)成系統(tǒng)知識(shí)的最小規(guī)則,即狹義的知識(shí)單元概念,這種觀點(diǎn)較為普遍。如Reich.Y[15]、King A W[16]、邱均平[17]、宋艷輝[18]、文庭孝[19]等從信息計(jì)量學(xué)角度,認(rèn)為知識(shí)單元是繼文獻(xiàn)單元、信息單元后計(jì)量單元從載體層次向認(rèn)知層次的發(fā)展;王子舟[20]、馬費(fèi)成[21]等從知識(shí)管理視角分析,認(rèn)為知識(shí)單元是對(duì)知識(shí)對(duì)象進(jìn)行知識(shí)組織和知識(shí)檢索的基礎(chǔ);趙紅州[22]從科學(xué)計(jì)量學(xué)角度認(rèn)為知識(shí)單元又稱為知識(shí)本體,是能夠用數(shù)學(xué)公式表示的科學(xué)概念,并提出了知識(shí)單元的智荷的概念;馬費(fèi)成[23]介紹了B.C.Brooks的認(rèn)知地圖理論,認(rèn)為認(rèn)知地圖是用知識(shí)單元直接聯(lián)接的概念網(wǎng);溫有奎等[24]認(rèn)為知識(shí)元是知識(shí)的最小管理單位,提出了知識(shí)元鏈接理論和模型。上述研究對(duì)知識(shí)單元與知識(shí)元的界定一致,是區(qū)別于文獻(xiàn)單元,從知識(shí)自身角度劃分的知識(shí)管控單位。而廣義上的知識(shí)單元是知識(shí)元的邏輯組合,是相對(duì)獨(dú)立的內(nèi)容或文本片段,容量具有無限度,而知識(shí)元是構(gòu)成最小要素。本文延續(xù)狹義知識(shí)單元與知識(shí)元等同的概念界定,認(rèn)為知識(shí)元是知識(shí)的最小控制單位,既定量化的概念。中文智庫成果知識(shí)元是知識(shí)經(jīng)濟(jì)時(shí)代下開展智庫知識(shí)直接管理與評(píng)價(jià)的管控對(duì)象。

結(jié)合現(xiàn)有知識(shí)元的理論研究,知識(shí)元具有獨(dú)立性、完整性、穩(wěn)定性、唯一性、不可再分性等特點(diǎn),是知識(shí)管理和計(jì)量研究從載體層面向認(rèn)知層面發(fā)展的本質(zhì)改變,是知識(shí)經(jīng)濟(jì)時(shí)代下進(jìn)行知識(shí)管理活動(dòng)控制單位對(duì)知識(shí)元的標(biāo)引、抽取等研究已成為實(shí)現(xiàn)認(rèn)知層面知識(shí)管理的重要保障。

2.2 知識(shí)元抽取的實(shí)現(xiàn)

知識(shí)元抽取又稱為知識(shí)抽取、知識(shí)元標(biāo)引等,是實(shí)現(xiàn)知識(shí)層面的知識(shí)計(jì)量與知識(shí)管理的前提保障,知識(shí)元的抽取過程就是將文獻(xiàn)中涉及的知識(shí)元按照所屬知識(shí)元的類別逐一識(shí)別、理解、篩選、歸納的過程,并存儲(chǔ)成結(jié)構(gòu)化的知識(shí)元庫,用于進(jìn)一步分析使用。國內(nèi)外知識(shí)元抽取的方法主要有三種類型:基于字符的自動(dòng)標(biāo)引方法,包括詞典標(biāo)引法、切分標(biāo)記標(biāo)引法、單漢字標(biāo)引法等,其中前兩者都屬于先組式標(biāo)引法,處理速度快,但構(gòu)建和維護(hù)分詞詞典較為復(fù)雜繁瑣,不適用于大規(guī)模文獻(xiàn)的知識(shí)元抽取,單漢字標(biāo)引雖然避開了分詞障礙,不存在詞典構(gòu)造問題,但容易忽略文本中隱含的主題概念,容易產(chǎn)生虛假配組的現(xiàn)象;基于統(tǒng)計(jì)模型的抽取方法,如以齊普夫定律為基礎(chǔ)的詞頻統(tǒng)計(jì)標(biāo)引法和加權(quán)統(tǒng)計(jì)標(biāo)引法等,由于語言是有意義的符合序列,基于統(tǒng)計(jì)模型的抽取方法往往需要與語義語法分析相結(jié)合才能取得更高的標(biāo)引質(zhì)量;還有基于語義分析的標(biāo)引方法,如句法分析標(biāo)引法、語義分析標(biāo)引法、人工智能標(biāo)引法等,是漢語自動(dòng)標(biāo)引技術(shù)發(fā)展的趨勢。知識(shí)元抽取過程的常用技術(shù)有自然語言處理技術(shù)、語義網(wǎng)、統(tǒng)計(jì)分析等。

國內(nèi)外對(duì)知識(shí)元抽取的研究涉及語言學(xué)、情報(bào)學(xué)、人工智能、管理學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科領(lǐng)域。在學(xué)術(shù)文獻(xiàn)的知識(shí)元抽取實(shí)踐中,化柏林[25]曾通過內(nèi)容分析對(duì)學(xué)術(shù)論文中方法知識(shí)元的類型與描述規(guī)則進(jìn)行總結(jié),為方法知識(shí)元提供支撐;溫有奎等[26]將知識(shí)元分為兩大類:描述型和過程型,前者包括信息報(bào)道、名詞解釋、數(shù)值、問題描述、文獻(xiàn)引證等類型文獻(xiàn)知識(shí),后者包括步驟、方法、定義、原理、經(jīng)驗(yàn)等文獻(xiàn)知識(shí),并指出文本創(chuàng)新點(diǎn)的知識(shí)元抽取方法;周寧等[27]利用XML描述規(guī)則探討知識(shí)元的表示與抽取模式;宋培彥等[28]設(shè)計(jì)了一種從術(shù)語定義句中自動(dòng)抽取知識(shí)元的方法,并進(jìn)行了實(shí)驗(yàn)驗(yàn)證。

3 研究方法

3.1 樣本選取

根據(jù)賓大版《全球智庫報(bào)告》、中國社會(huì)科學(xué)院的《全球智庫評(píng)價(jià)報(bào)告》以及上海社會(huì)科學(xué)院智庫研究中心發(fā)布的《中國智庫報(bào)告》等在國內(nèi)外影響力較高的智庫評(píng)價(jià)報(bào)告,本文選取出中國影響力較高的7所智庫,分別是中國社會(huì)科學(xué)院、中國國際問題研究院、國務(wù)院發(fā)展研究中心、中國現(xiàn)代國際關(guān)系研究院、上海國際問題研究院、北京大學(xué)國際戰(zhàn)略研究院和中國人民大學(xué)重陽金融研究院為研究樣本。由于北京大學(xué)國際戰(zhàn)略研究院網(wǎng)頁不可訪問,故只對(duì)其余6所智庫代表的成果類型和成果可獲得性進(jìn)行了詳細(xì)調(diào)查結(jié)果(見表1)。

從調(diào)查結(jié)果可以看出,中國社會(huì)科學(xué)院作為我國規(guī)模和影響力最大的智庫涵蓋了全面的智庫成果類型,并且在實(shí)際調(diào)研中發(fā)現(xiàn)中國社會(huì)科學(xué)院作為綜合性智庫,研究內(nèi)容涉及了全球經(jīng)濟(jì)、能源、文化、政治、衛(wèi)生、食品、社會(huì)保障、道德倫理、生態(tài)環(huán)境等國家發(fā)展的方方面面,但其決策報(bào)告的全文可獲得度一般,從中國社會(huì)科學(xué)院網(wǎng)站中只有關(guān)于智庫報(bào)告的解讀、概要等信息,國務(wù)院發(fā)展研究中心也存在以上特點(diǎn),所以中國社會(huì)科學(xué)院以及國務(wù)院發(fā)展研究中心都不是最佳樣本對(duì)象。其余4所智庫從主題單一性、成果可獲取度以及實(shí)際調(diào)查中智庫成果獲取的規(guī)范性角度對(duì)比等方面綜合考慮,本文選取了中國國際問題研究院作為本次研究的樣本源,以其2015年發(fā)布的成果作為描述規(guī)則研究的樣本。智庫研究具有年代背景突出、動(dòng)態(tài)性強(qiáng)的特點(diǎn),鎖定樣本來源為2015年成果有助于控制知識(shí)元抽取詞典的設(shè)立。

中國國際問題研究院2015年共發(fā)布了6份研究報(bào)告,231篇時(shí)事評(píng)論,8部專著(含譯著),專家觀點(diǎn)、短評(píng)共計(jì)43篇,在中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫中檢索到2015年共發(fā)表95篇論文(排除發(fā)表在《國際問題研究》上的22篇),《國際問題研究》2015年共收錄了88篇文獻(xiàn),但另有29篇已結(jié)項(xiàng)課題由于不公開原因不納入樣本范圍。

3.2 方法模型

首先確定模型的初始術(shù)語表,由于研究報(bào)告以及學(xué)術(shù)論文是格式規(guī)范的智庫成果,具有摘要、關(guān)鍵詞信息,并且研究報(bào)告和學(xué)術(shù)論文是智庫研究的主流成果形式,成果主題能夠代表智庫研究方向,筆者通過逐篇閱讀這些成果的摘要信息對(duì)關(guān)鍵詞集合進(jìn)行篩選,匯總出代表2015年中國國際問題研究院研究主題關(guān)鍵詞集合作為初始術(shù)語表。中國國際問題研究院2015年的6冊(cè)研究報(bào)告和183篇學(xué)術(shù)論文共產(chǎn)生1212個(gè)關(guān)鍵詞,刪去重復(fù)和無意義關(guān)鍵詞后得到837個(gè)關(guān)鍵詞。在處理中國社會(huì)科學(xué)院這類綜合性智庫時(shí),由于成果涉及主題多、數(shù)量多,需要先對(duì)成果庫成果進(jìn)行主題識(shí)別、分類,然后選定對(duì)應(yīng)的主題術(shù)語表進(jìn)行對(duì)含有知識(shí)元的術(shù)語句子進(jìn)行抽取,由于本研究樣本主題單一,無需主題識(shí)別步驟,直接根據(jù)初始術(shù)語表進(jìn)行句子抽取。抽取結(jié)果形成術(shù)語句式,未抽取句子則由人工識(shí)別出新的指示知識(shí)元的術(shù)語對(duì)術(shù)語表進(jìn)行擴(kuò)充。對(duì)最終得到的所有術(shù)語句子進(jìn)行人工識(shí)別、篩選,按照知識(shí)元類型進(jìn)行分類,生成對(duì)應(yīng)的知識(shí)元描述規(guī)則(基于知識(shí)元抽取的智庫成果描述規(guī)則的過程模型見圖1)。

4 中文智庫成果的知識(shí)元描述規(guī)則

智庫研究工作的特點(diǎn)是時(shí)代背景突出,智庫研究關(guān)注的是當(dāng)前外交、民生、社會(huì)等方面最前沿的問題;政策性語言豐富,智庫的目標(biāo)是影響決策,智庫成果存在大量政策解讀以及政策提議性內(nèi)容;觀點(diǎn)結(jié)論是成果重點(diǎn),智庫成果區(qū)別于一般學(xué)術(shù)論文的是更突出研究結(jié)論和專家觀點(diǎn)的闡述,對(duì)研究方法的說明是成果呈現(xiàn)的輔助內(nèi)容。

通過上述抽取模型對(duì)智庫成果的處理,筆者將智庫成果知識(shí)元分為陳述型和程序型,前者包括事實(shí)知識(shí)元、定義知識(shí)元、結(jié)論知識(shí)元等陳述型文字內(nèi)容,后者包含方法知識(shí)元和關(guān)系知識(shí)元等具有內(nèi)在結(jié)構(gòu)的文字內(nèi)容(見表2)。

4.1 陳述型知識(shí)元描述規(guī)則

4.1.1 事實(shí)知識(shí)元

事實(shí)知識(shí)是對(duì)研究的背景環(huán)境、現(xiàn)存問題以及專家或者國際觀點(diǎn)、認(rèn)識(shí)等信息的描述。筆者通過上述模型和樣本,共提煉出5種類型的事實(shí)知識(shí)元的描述規(guī)則,即觀點(diǎn)型、序列型、直述型、分析預(yù)測型、事件型(具體規(guī)則見表3)。

觀點(diǎn)型描述規(guī)則是對(duì)中文智庫成果中觀點(diǎn)事實(shí)的結(jié)構(gòu)描述,用于指示智庫研究中的觀點(diǎn)信息,結(jié)構(gòu)特點(diǎn)是句式簡單,規(guī)則架構(gòu)聯(lián)接的內(nèi)容是觀點(diǎn)發(fā)出者、觀點(diǎn)內(nèi)容以及觀點(diǎn)釋義,廣泛存在于綜述研究的前期研究成果陳述、國際問題研究中各國立場聲明等內(nèi)容中。序列型是種形式化的描述規(guī)則,由序列性連接詞構(gòu)成,既可以是一、二、三等數(shù)字連接詞也可以是首先、其次等表達(dá)序列關(guān)系的連接詞,該類規(guī)則對(duì)應(yīng)內(nèi)容是中文智庫成果的常見形式,具有條例清楚、結(jié)構(gòu)分明的特點(diǎn)。直述型即直接敘述型語句,不具備典型的規(guī)則標(biāo)引語句,由主題術(shù)語表內(nèi)容作為句式主語,銜接論述內(nèi)容,事實(shí)知識(shí)元的直述型語句是對(duì)事實(shí)的陳述性表述,不存在句式上的修辭。分析預(yù)測型描述規(guī)則除了連接事實(shí)與推論外,事實(shí)既可以直接出現(xiàn),又常以“從……看”等規(guī)則與推論銜接。事件型規(guī)則的典型特點(diǎn)是具備時(shí)間點(diǎn),對(duì)出現(xiàn)在時(shí)政事件的陳述。

智庫成果的事實(shí)知識(shí)元集合構(gòu)成了智庫的背景知識(shí)資源庫,通過上述規(guī)則識(shí)別、存儲(chǔ)的關(guān)乎成果的事實(shí)資料得以合理、高效的抽取、組織起來,不僅可用于衡量智庫儲(chǔ)備的時(shí)政、理論資源含量,而且構(gòu)成了智庫專屬的事實(shí)知識(shí)庫,為后續(xù)課題研究提供客觀資料。同時(shí),描述規(guī)則的歸納提供了半結(jié)構(gòu)化的知識(shí)資源結(jié)構(gòu),為智庫內(nèi)部檢索提供了方法。

4.1.2 定義知識(shí)元

定義知識(shí)元是對(duì)中文智庫成果中的政策概念、名詞術(shù)語等概念和原理的解釋。分為內(nèi)涵解釋型的定義知識(shí)元描述規(guī)則和外延解釋型的知識(shí)元描述規(guī)則,內(nèi)涵解釋型規(guī)則是概念說明,外延則是概念包含的范疇(具體規(guī)則見表4)。

內(nèi)涵解釋型和外延解釋型分別對(duì)應(yīng)概念的內(nèi)涵與外延的概念,內(nèi)涵解釋型規(guī)則是對(duì)解釋定義本身的內(nèi)容的描述,該規(guī)則標(biāo)引出的內(nèi)容是對(duì)應(yīng)政策概念、原理的解讀。外延解釋型則描述了定義所含有的實(shí)例,同一定義的內(nèi)涵解釋規(guī)則標(biāo)引結(jié)果與外延解釋規(guī)則標(biāo)引結(jié)果共同構(gòu)成了該定義的概念描述。

定義知識(shí)元對(duì)應(yīng)的知識(shí)資源是已有研究或者社會(huì)共識(shí)已認(rèn)可的概念知識(shí)。定義知識(shí)元的抽取可以用于構(gòu)建智庫的概念知識(shí)集合,對(duì)于智庫開展理論學(xué)習(xí)、定義檢索有直接輔助作用。

4.1.3 結(jié)論知識(shí)元

結(jié)論知識(shí)元與事實(shí)知識(shí)元在劃分上很重要一點(diǎn)在于時(shí)間點(diǎn)不同,事實(shí)是對(duì)過去事件、觀點(diǎn)等已有事實(shí)的描述,具有明顯的過去式時(shí)間特征,結(jié)論是對(duì)客觀功能、作用、推斷、建議等的陳述,具有現(xiàn)在時(shí)或者將來時(shí)的時(shí)間特征。結(jié)論知識(shí)元的描述規(guī)則同樣具有直述型和序列型兩種,區(qū)別在于結(jié)論知識(shí)元描述內(nèi)容的時(shí)間點(diǎn)位于選用主題術(shù)語表的時(shí)間段之后。另有歸納推斷型和建議方案型共四種規(guī)則類型(見表5)。

歸納推斷型規(guī)則是對(duì)中文智庫成果中歸納性結(jié)論語句的描述,有兩種類型,一類是“通過……,……”等形式的規(guī)則將被歸納的對(duì)象與歸納出的結(jié)論進(jìn)行銜接;一類是“總體看來……”等形式的規(guī)則直接在上文討論內(nèi)容后連接結(jié)論內(nèi)容。建議方案型規(guī)則是對(duì)中文智庫成果研究者對(duì)研究問題提出的建議或解決方案的描述,連接詞為“需要、建議”等表明建議關(guān)系的中文詞匯,連接了研究的問題和研究提供的解決方案。

結(jié)論是智庫研究活動(dòng)的輸出結(jié)果,用于指導(dǎo)決策,是智庫最重要的成果內(nèi)容。結(jié)論知識(shí)元是智庫成果中創(chuàng)新程度最高、知識(shí)價(jià)值最突出的知識(shí)資源,是衡量智庫智慧產(chǎn)出的最重要依據(jù)。特別是歸納推斷型以及建議方案型結(jié)論知識(shí)元是對(duì)前期智庫研究活動(dòng)的深層總結(jié),價(jià)值密度高。已有研究的結(jié)論知識(shí)元既是從知識(shí)層面衡量知識(shí)成果價(jià)值的重要依據(jù),也是智庫后續(xù)研究的理論知識(shí)庫。

4.2 程序型知識(shí)元描述規(guī)則

程序型知識(shí)元說明中文智庫成果內(nèi)容存在一定的內(nèi)在聯(lián)系,既可以是文本內(nèi)容對(duì)研究方法的說明,又可以是說明文本與文本間的關(guān)系,分別為方法知識(shí)元和關(guān)系知識(shí)元。

4.2.1 方法知識(shí)元

方法知識(shí)元的描述規(guī)包括方法類型說明和研究思想型規(guī)則(見表6)。

方法類型規(guī)則一般不在文本中直接表述,但是摘要、引言等對(duì)研究介紹性文本中存在概括性語句。如“本文對(duì)……進(jìn)行統(tǒng)計(jì)分析……”揭示了對(duì)應(yīng)研究的研究方法為統(tǒng)計(jì)分析方法。研究思路型規(guī)則是對(duì)中文智庫成果中揭示研究思路的文本的描述,描述了對(duì)應(yīng)研究的行文思路。

方法知識(shí)元一般不是智庫的原創(chuàng)性成果,因此方法知識(shí)元對(duì)于從知識(shí)層面評(píng)價(jià)智庫成果的作用在于衡量智庫研究思路的合理性。智庫被采用的成果表征對(duì)應(yīng)的研究過程與結(jié)論的科學(xué)、合理性,據(jù)此可推論出從事某方向研究高效的方法范式。

4.2.2 關(guān)系知識(shí)元

智庫成果的關(guān)系知識(shí)元是對(duì)中文智庫成果文本與文本之間內(nèi)在關(guān)系描述、表示意義、重要程度、所屬關(guān)系等含義。

關(guān)系知識(shí)元是從成果內(nèi)容的內(nèi)在關(guān)系進(jìn)行考察,陳述知識(shí)元是對(duì)成果內(nèi)容類型進(jìn)行劃分。如包含關(guān)系案例,從內(nèi)容類型上屬于結(jié)論知識(shí)元,但在內(nèi)容上存在包含關(guān)系(見圖2)。

關(guān)系知識(shí)元可以揭示研究成果文本內(nèi)部的關(guān)系,其描述規(guī)則是一種半結(jié)構(gòu)化的知識(shí)表示方法。關(guān)系知識(shí)元的意義在于形成研究成果知識(shí)元之間的關(guān)

系架構(gòu),智庫擁有的全部關(guān)系知識(shí)元通過層次、包含、因果等關(guān)系類型將獨(dú)立的知識(shí)元串聯(lián)起來。

5 結(jié)論與展望

本文基于中文文本知識(shí)元抽取機(jī)制,以中文智庫成果為對(duì)象進(jìn)行知識(shí)元抽取,總結(jié)了中文智庫成果的知識(shí)元類型及對(duì)應(yīng)的描述規(guī)則,而現(xiàn)有國內(nèi)關(guān)于中文文本知識(shí)元描述規(guī)則研究的對(duì)象選取基本上集中在學(xué)術(shù)論文中,本文在文本對(duì)象的選擇和研究方法的遷移運(yùn)用上具有創(chuàng)新性。中文智庫成果與傳統(tǒng)學(xué)術(shù)論文在研究主題、研究方法等方面存在明顯差異,決定了規(guī)則類型的區(qū)別,首先,學(xué)術(shù)論文具有明顯的學(xué)科特性,表現(xiàn)在學(xué)科術(shù)語和研究方法等方面具有明顯的學(xué)科傾向特點(diǎn),以學(xué)術(shù)論文為對(duì)象的知識(shí)元類型與描述規(guī)則的相關(guān)研究也主要集中在特定學(xué)科術(shù)語和方法規(guī)則兩方面。智庫研究是對(duì)當(dāng)前國內(nèi)外環(huán)境最關(guān)注的問題進(jìn)行聚焦,學(xué)科特點(diǎn)不突出,方法知識(shí)元的類型也相對(duì)學(xué)術(shù)論文的方法知識(shí)元單一,智庫成果的知識(shí)元類型與描述規(guī)則研究目標(biāo)在于對(duì)智庫知識(shí)資源的精準(zhǔn)化標(biāo)引;其次,學(xué)術(shù)論文是面向?qū)I(yè)人士的具有學(xué)術(shù)深度的文本,學(xué)術(shù)論文的知識(shí)元描述規(guī)則抽取也體現(xiàn)了學(xué)術(shù)研究的深刻性特點(diǎn),注重對(duì)規(guī)則類型的細(xì)分,如化柏林在對(duì)學(xué)術(shù)論文的方法知識(shí)元進(jìn)行抽取時(shí)將方法知識(shí)元從定義、功能、特點(diǎn)、流程、關(guān)系五個(gè)角度進(jìn)行細(xì)分。而智庫成果是服務(wù)產(chǎn)品,尤其是智庫調(diào)研報(bào)告、專家觀點(diǎn)、媒體訪談等智庫專有形式的成果是對(duì)智庫開展研究后所提出解決方案的精煉表達(dá),服務(wù)對(duì)象是不具備特定領(lǐng)域?qū)I(yè)知識(shí)的政府機(jī)構(gòu)。因此筆者對(duì)智庫成果知識(shí)元類型的劃分上實(shí)現(xiàn)全面總結(jié),詳細(xì)地歸納出中文智庫成果涉及的知識(shí)元類型。最后,學(xué)術(shù)論文與中文智庫成果相比在行文方式上更具有靈活性,句式表達(dá)多變,一類學(xué)術(shù)論文的知識(shí)元具有多種描述規(guī)則。而中文智庫成果在語言上具有簡潔、客觀性強(qiáng)的特點(diǎn),句式多以陳述形式出現(xiàn),一類知識(shí)元對(duì)應(yīng)的描述規(guī)則有限。

對(duì)中文智庫成果知識(shí)元類型和描述規(guī)則的研究有利于實(shí)現(xiàn)知識(shí)層面的中文智庫成果的知識(shí)資源計(jì)量與管理。一方面,智庫坐擁知識(shí)資源量評(píng)價(jià)智庫相比從載體數(shù)量對(duì)智庫產(chǎn)能進(jìn)行考察更具精準(zhǔn)性和客觀性,因?yàn)橹R(shí)層面的考察摒除了載體計(jì)量造成資源內(nèi)容的重復(fù)計(jì)算;另一方面,中文智庫成果的描述規(guī)則為中文智庫知識(shí)標(biāo)引提供有效方法,便于實(shí)現(xiàn)對(duì)知識(shí)本身的管理,促進(jìn)智庫知識(shí)的共享、存儲(chǔ)和增值?;谥R(shí)元抽取的中文智庫描述規(guī)則提取的關(guān)鍵技術(shù)在于中文文本抽取,目前國內(nèi)對(duì)中文文本抽取、挖掘和標(biāo)引等方面的研究已取得一定的理論和實(shí)踐基礎(chǔ),經(jīng)歷了詞典抽取、統(tǒng)計(jì)抽取和語義抽取三個(gè)發(fā)展階段,抽取結(jié)果的精確性和全面性在逐步提升,因此本研究在實(shí)際應(yīng)用中具備較強(qiáng)的可行性。

本文首次將知識(shí)元描述規(guī)則的概念引入到智庫成果中,是進(jìn)行知識(shí)層面智庫成果評(píng)價(jià)的基礎(chǔ)工作,彌補(bǔ)了智庫評(píng)價(jià)領(lǐng)域知識(shí)層面評(píng)價(jià)研究的空白?;谖谋究偨Y(jié)歸納出的智庫成果知識(shí)元類型及其規(guī)則,以及研究思路能夠輔助后續(xù)智庫知識(shí)元描述規(guī)則擴(kuò)充研究;其次,知識(shí)元描述規(guī)則的歸納提供了半結(jié)構(gòu)化的知識(shí)表達(dá)方式,有利于構(gòu)建智庫知識(shí)庫,是進(jìn)行智庫知識(shí)檢索和存儲(chǔ)的結(jié)構(gòu)基礎(chǔ);最后,擴(kuò)展知識(shí)元應(yīng)用范圍,由一般學(xué)術(shù)論文擴(kuò)展至決策咨詢報(bào)告。

參考文獻(xiàn):

[1] 曾培炎.探索建設(shè)中國特色新型智庫[EB/OL].[2016-09-03].http:www.qstheory.cn/tjyd/2014-12/25/c_1113768068.htm.

[2] 劉月,李鑒修.人民日?qǐng)?bào)人民要論:打造中國特色新型智庫[EB/OL].[2016-09-03].http://opinion.people.com.cn/n/2015/0728/c1003-27369340.html.

[3] 許共城.歐美智庫比較及對(duì)中國智庫發(fā)展的啟示[J].經(jīng)濟(jì)社會(huì)體制比較,2010(2):77-83.

[4] 王莉麗.美國智庫的“旋轉(zhuǎn)門”機(jī)制[J].國際問題研究,2010(2):13-18.

[5] 楊尊偉,劉寶存.美國智庫的類型、運(yùn)行機(jī)制和基本特征[J].中國高??萍?,2014(7):56-59.

[6] 周仲高.智庫的科學(xué)分類與準(zhǔn)確定位[J].重慶社會(huì)科學(xué),2013(3):116-120.

[7] 姜朝暉.中國特色新型高校智庫:內(nèi)涵、特征及定位[J].高校教育管理,2016,10(2):55-60.

[8] 張?zhí)K敏.黨報(bào)建設(shè)智庫型媒體:定位、模式與發(fā)展策略[J].新聞世界,2015(8):25-27.

[9] 李占峰,金家厚,鮑宗豪.中國智庫發(fā)展亟需理念和制度創(chuàng)新[J].開放導(dǎo)報(bào),2011(6):100-104.

[10] 帕瑞克·克勒納,韓萬渠.智庫概念界定和評(píng)價(jià)排名:亟待探求的命題[J].中國行政管理,2014(5):25-28.

[11] 王斯敏.智庫評(píng)價(jià):要不要做,如何做好?[EB/OL].[2016-09-06].http://epaper.gmw.cn/gmrb/html/2016-02/03/nw.D110000g

mrb_20160203_2-16.htm.

[12] 鄧巖.中國智庫的類型研究[J].天水行政學(xué)院學(xué)報(bào),2011,12(5):62-65.

[13] 溫有奎,焦玉英.知識(shí)元語義鏈接模型研究[J].圖書情報(bào)工作,2010,54(12):27-31.

[14] 朱曉蕓,陳奇,楊棖,等.決策支持系統(tǒng)中的廣義知識(shí)元及模型庫[C].中國控制與決策學(xué)術(shù)年會(huì)論文集,1993:33-36.

[15] Reic h Y.Measuring the value of knowledge[J].International Journal of Human-Computer Studies,2010,42(1):3-30.

[16] King A W,Zeithaml C P.Measuring organizational knowledge:a conceptual and methodological framework[J].Strategic Management Journal,2003,24(8):763-772.

[17] 邱均平,文庭孝,宋艷輝.知識(shí)計(jì)量學(xué)[M].北京:科學(xué)出版社,2014:66-68.

[18] 宋艷輝,王小平.從文獻(xiàn)單元、信息單元向知識(shí)元的嬗變[J].科研管理,2015,36(1):459-464.

[19] 文庭孝,羅賢春,劉曉英,等.知識(shí)元研究述評(píng)[J].中國圖書館學(xué)報(bào),2011,37(5):75-86.

[20] 王子舟,王碧瀅.知識(shí)的基本組分——文獻(xiàn)單元和知識(shí)元[J].中國圖書館學(xué)報(bào),2003,29(1):5-11.

[21] 馬費(fèi)成,陳銳,袁紅.科學(xué)信息離散分布規(guī)律研究——從文獻(xiàn)單元到內(nèi)容單元的實(shí)證分析(Ⅱ):文獻(xiàn)離散分布的布氏區(qū)域分析[J].情報(bào)學(xué)報(bào),1999,18(6):270-277.

[22] 趙紅州,唐敬年.知識(shí)元的靜智荷及其在荷空間的表示問題(續(xù)一)[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,1990,14(2):39-43.

[23] 馬費(fèi)成.科學(xué)情報(bào)的基本屬性與情報(bào)學(xué)原理[J].圖書館論壇,2002,22(5):15-18.

[24] 溫有奎,溫浩,徐端頤,等.基于知識(shí)元的文本知識(shí)標(biāo)引[J].情報(bào)學(xué)報(bào),2006,25(3):282-288.

[25] 化柏林.學(xué)術(shù)論文中方法知識(shí)元的類型與描述規(guī)則研究[J].中國圖書館學(xué)報(bào),2016,42(1):30-40.

[26] 溫有奎,溫浩,徐端頤,等.基于創(chuàng)新點(diǎn)的知識(shí)元挖掘[J].情報(bào)學(xué)報(bào),2005,24(6):663-668.

[27] 周寧,余肖生,劉瑋,等.基于XML平臺(tái)的知識(shí)元表示與抽取研究[J].中國圖書館學(xué)報(bào),2006,32(3):41-45.

[28] 宋培彥,路青,劉寧靜.一種從術(shù)語定義句中自動(dòng)抽取知識(shí)元的方法[J].情報(bào)雜志,2014,(4):139-143.

作者簡介:趙蓉英,女,武漢大學(xué)信息管理學(xué)院、武漢大學(xué)中國科學(xué)評(píng)價(jià)研究中心教授,博士生導(dǎo)師;張心源,武漢大學(xué)信息管理學(xué)院、武漢大學(xué)中國科學(xué)評(píng)價(jià)研究中心博士研究生。

猜你喜歡
智庫
《智庫理論與實(shí)踐》2022年選題指南
好老師智庫·特約編委
好老師智庫·特約編委
書訊:《新型智庫質(zhì)量提升與國家治理現(xiàn)代化》
智庫人不能忘卻的使命
中國智庫數(shù)量居世界第二7家智庫上榜世界百強(qiáng)榜單
中國7家智庫上榜全球智庫百強(qiáng)
廣西科學(xué)院成為智庫聯(lián)盟重點(diǎn)智庫
新型智庫不能有“庫”無“智”
報(bào)告稱中國智庫數(shù)量排世界第二