●郭少友,常楨,竇暢(鄭州大學(xué)信息管理學(xué)院,鄭州450001)
國(guó)內(nèi)知識(shí)元研究綜述
●郭少友,常楨,竇暢(鄭州大學(xué)信息管理學(xué)院,鄭州450001)
知識(shí)元;知識(shí)元抽?。恢R(shí)元表示;知識(shí)元集成;知識(shí)元鏈接
分析國(guó)內(nèi)知識(shí)元研究的現(xiàn)狀,包括知識(shí)元的基本概念、類型、抽取、表示、鏈接與集成、應(yīng)用等多個(gè)方面。針對(duì)知識(shí)元研究中的一些關(guān)鍵問題,提出自己的看法。
對(duì)蘊(yùn)含在數(shù)字資源中的知識(shí)進(jìn)行揭示、描述與組織,是實(shí)現(xiàn)知識(shí)檢索和知識(shí)管理的前提。將揭示和描述知識(shí)的粒度細(xì)化為知識(shí)元,有助于提高知識(shí)獲取的效率和精確度。自20世紀(jì)70年代末美國(guó)情報(bào)學(xué)家弗拉基米爾·斯拉麥卡提出,知識(shí)的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立的“知識(shí)元”開始,國(guó)內(nèi)學(xué)者對(duì)這一概念及其相關(guān)問題進(jìn)行了較為深入和持久的研究。本文通過知網(wǎng)檢索發(fā)現(xiàn),題目包含“知識(shí)元”的期刊論文72篇、碩博士論文25篇、會(huì)議論文6篇,關(guān)鍵詞包含“知識(shí)元”的期刊論文323篇、碩博士論文71篇、會(huì)議論文19篇。研究成果的作者主要來自教育學(xué)領(lǐng)域、計(jì)算機(jī)科學(xué)領(lǐng)域、圖書情報(bào)領(lǐng)域,所討論的對(duì)象主要是中小學(xué)教育資源、醫(yī)學(xué)數(shù)字資源、一般數(shù)字資源,所討論的內(nèi)容涉及知識(shí)元的基本概念、類型、抽取、表示、鏈接與集成、應(yīng)用等多個(gè)方面。
1.1 知識(shí)元的概念
在國(guó)內(nèi),知識(shí)元這一概念出現(xiàn)較早,學(xué)者們對(duì)其進(jìn)行了不同的界定和解讀。
劉新等[1]認(rèn)為,一個(gè)相對(duì)獨(dú)立且能夠準(zhǔn)確地表達(dá)知識(shí)的內(nèi)涵和外延,并能對(duì)一個(gè)知識(shí)進(jìn)行完整描述的知識(shí)單元就是知識(shí)元。張亮等[2]認(rèn)為,知識(shí)元是指不可再分割的具有完備知識(shí)表達(dá)的知識(shí)單位。姜永常等[3]認(rèn)為,知識(shí)元是構(gòu)成知識(shí)結(jié)構(gòu)的最小獨(dú)立單元,用來表示一個(gè)個(gè)針對(duì)特定問題的解決方案。文庭孝等[4]認(rèn)為知識(shí)元是在知識(shí)管理中可以對(duì)知識(shí)進(jìn)行獨(dú)立、自由、有效地識(shí)別、處理與組合的基本知識(shí)單位。溫有奎等[5]認(rèn)為知識(shí)元是構(gòu)造知識(shí)結(jié)構(gòu)的基元,將知識(shí)分解為知識(shí)元以后,比較容易選擇與之相適應(yīng)的查詢及存儲(chǔ)方式,以便用戶直接查找、組裝以及完善知識(shí)結(jié)構(gòu),加快知識(shí)的創(chuàng)新速度。畢經(jīng)元[6]認(rèn)為知識(shí)元是進(jìn)行知識(shí)的存儲(chǔ)、共享和引用的最小存儲(chǔ)單位。
盡管國(guó)內(nèi)學(xué)者都強(qiáng)調(diào)了知識(shí)元應(yīng)具有獨(dú)立性、穩(wěn)定性和完整性,但對(duì)它的理解卻有一定差別,主要反映在知識(shí)元的粒度上,大部分學(xué)者認(rèn)為知識(shí)元是最小獨(dú)立單元,不能再分割;少部分學(xué)者則認(rèn)為知識(shí)元是基本知識(shí)單位,可以再細(xì)分。
1.2 知識(shí)元的類型
王延章[7]把知識(shí)元分為對(duì)象知識(shí)元、屬性知識(shí)元和屬性映射關(guān)系知識(shí)元。其中,對(duì)象知識(shí)元表示的是客觀事物實(shí)體,屬性知識(shí)元對(duì)客觀事物實(shí)體的特征進(jìn)行描述,屬性映射關(guān)系知識(shí)元是對(duì)對(duì)象知識(shí)元內(nèi)部屬性狀態(tài)相互作用關(guān)系的展開描述。溫有奎等[8]將知識(shí)元分成描述型和過程型兩類,前者可細(xì)分為信息報(bào)道型、名詞解釋型、數(shù)值型、問題描述型、文獻(xiàn)引證型等;后者可細(xì)分為步驟型、方法型、定義型、原理型、經(jīng)驗(yàn)型等。張靜等[9]將知識(shí)元分為七個(gè)類型,即概念型、原理型、方法型、事實(shí)型、陳述型、數(shù)值型、模型型。原小玲[10]認(rèn)為,知識(shí)元可以分為理論與方法型知識(shí)元、事實(shí)型知識(shí)元和數(shù)值型知識(shí)元。其中,理論與方法型知識(shí)元包括思想、方法論、公理、原理、定律以及正在探索中的觀念、觀點(diǎn)、方法與技巧,事實(shí)型知識(shí)元包括自然、社會(huì)存在和演變的事實(shí)信息,數(shù)值型知識(shí)元包括各種數(shù)據(jù)類知識(shí)和科學(xué)數(shù)據(jù),具有數(shù)值分析和知識(shí)推理功能。
雖然上述各種觀點(diǎn)的文字描述有所不同,所給出的類型也不一,但每種觀點(diǎn)基本上大同小異,都從概念、事實(shí)、方法策略等幾個(gè)維度來分類知識(shí)元。此外,有些文獻(xiàn)給出的類型并不來源于同一個(gè)分類標(biāo)準(zhǔn),且類型之間有重疊,如文獻(xiàn)[9]中的事實(shí)型和陳述型。
2.1 知識(shí)元的抽取方法
從數(shù)字資源中抽取知識(shí)元是知識(shí)元應(yīng)用的基礎(chǔ),通過對(duì)現(xiàn)有相關(guān)文獻(xiàn)的分析發(fā)現(xiàn),國(guó)內(nèi)學(xué)者所提出的方法大致可分為基于文本結(jié)構(gòu)的抽取方法與基于規(guī)則的抽取方法兩種類型。
(1)基于文本結(jié)構(gòu)的抽取方法。典型代表有兩個(gè)。①姜永常等[11]提出基于文本物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的抽取方法。其中,物理結(jié)構(gòu)={標(biāo)題,作者,機(jī)構(gòu),章,節(jié),段,句,詞,引文},表達(dá)了文本的主觀認(rèn)知結(jié)構(gòu);邏輯結(jié)構(gòu)={主題,層次,段落,句子,主題詞,標(biāo)識(shí)詞,分類號(hào)},表達(dá)了文本的客觀知識(shí)結(jié)構(gòu)。通過對(duì)文本物理結(jié)構(gòu)的分析,建立文本的邏輯結(jié)構(gòu),從中抽取標(biāo)題、小標(biāo)題、段首、段尾、結(jié)論、引文等作為引導(dǎo)知識(shí)元的向?qū)畔?。通過向?qū)畔⒓纯山⑽谋拘畔⑴c知識(shí)元之間的關(guān)系,為文本知識(shí)元的發(fā)現(xiàn)指明方向。②周寧等[12]提出的抽取方法包含三個(gè)步驟:結(jié)構(gòu)解析、長(zhǎng)度解析、內(nèi)容解析。針對(duì)給定的文本,該方法首先根據(jù)事先給定的結(jié)構(gòu)約束來抽取文本片段,并用長(zhǎng)度解析器來檢查文本片段的最大和最小長(zhǎng)度,用內(nèi)容解析器將文本片段解析成僅包含單詞的單詞線性表并在此基礎(chǔ)上生成知識(shí)元。
(2)基于規(guī)則的抽取方法。典型代表是蔣玲[13]提出的基于規(guī)則的知識(shí)元抽取方法。該方法首先對(duì)文本進(jìn)行分句,然后提取向?qū)畔⑺诘南嚓P(guān)主題句,構(gòu)成候選主題句集合;在分析文本各屬性的句法結(jié)構(gòu)特征的基礎(chǔ)上建立各屬性知識(shí)元的句法模型,即提取規(guī)則;將主題詞與提取規(guī)則組合,根據(jù)屬性值知識(shí)元句法模型對(duì)所有主題句做句法匹配,從而提取具有該句法的知識(shí)元描述候選句,并通過人工干預(yù)確定知識(shí)元描述句;然后將主題詞+屬性詞的組合作為知識(shí)元名稱,將提取的主題句作為知識(shí)元描述,并根據(jù)句法模型來確定各知識(shí)元描述句的屬性,將輸入文本作為知識(shí)元來源等。最后將提取出的知識(shí)元入庫。
2.2 知識(shí)元的表示方法
知識(shí)元的表示是指通過使用框架、模型、符號(hào)等來描述知識(shí)元,使知識(shí)元符號(hào)化、形式化或模型化,以使知識(shí)元成為便于機(jī)器處理的形式。現(xiàn)有研究主要采用基于框架表示法的方法和基于本體的方法來表示知識(shí)元。
(1)基于框架表示法的知識(shí)元表示方法??蚣鼙硎痉ㄊ且钥蚣芾碚摓榛A(chǔ)發(fā)展起來的一種結(jié)構(gòu)化表示方法,它將知識(shí)表示成高度模塊化的結(jié)構(gòu)??蚣苡煽蚣苊c若干個(gè)槽組成,每個(gè)槽擁有若干個(gè)側(cè)面,每個(gè)側(cè)面還可擁有若干值,而具體情況則可根據(jù)實(shí)際需求來取舍。通過從不同角度分別建立框架,可以得到一個(gè)框架系統(tǒng)。該系統(tǒng)可以從不同角度來描述一個(gè)事物,而通過框架間的轉(zhuǎn)換也可以表示事物狀態(tài)的變化以及其他活動(dòng)。周寧等[12]在框架表示法的基礎(chǔ)上,提出了XML平臺(tái)上的知識(shí)元表示方法,并給出了知識(shí)元框架的巴科斯范式格式。
(2)基于本體的知識(shí)元表示方法。本體是對(duì)某一領(lǐng)域中的術(shù)語及術(shù)語間關(guān)系的規(guī)范說明,提供對(duì)領(lǐng)域知識(shí)的共同理解和描述,用于共享、交流和復(fù)用,由經(jīng)過精確定義的概念及概念間的關(guān)系組成。袁名依等[14]提出一種基于知識(shí)元本體的知識(shí)統(tǒng)一表示方法,其中知識(shí)元本體包含Creator、KnowledgeElement、KnowldegeElementAbstract、KnowledgeElementDescription和History等五個(gè)類,KnowledgeElement用于描述不同的知識(shí)單元,KnowledgeElementDescription用于表示知識(shí)元描述體,History用于記錄知識(shí)元的演進(jìn)發(fā)展過程。
如前所述,知識(shí)元是一種相對(duì)獨(dú)立的知識(shí)單元,其本身也是知識(shí),常用的知識(shí)表示方法也適用于知識(shí)元的表示?,F(xiàn)有的研究較多地關(guān)注知識(shí)元的框架表示法、基于本體的表示法,較少涉及知識(shí)元的謂詞邏輯表示法、產(chǎn)生式規(guī)則表示法、語義網(wǎng)絡(luò)表示法、面向?qū)ο蟊硎痉ā?/p>
雖然知識(shí)元本身具有一定的結(jié)構(gòu)且能夠在邏輯上完備地表達(dá)某一完整的事實(shí)、方法等,但是將知識(shí)元作為獨(dú)立的個(gè)體進(jìn)行分析所能獲得的效益是有限的。為了更有效地利用知識(shí)元,對(duì)其進(jìn)行集成是必要的。而知識(shí)元的應(yīng)用也建立在知識(shí)元的集成之上。
3.1 知識(shí)元的集成
知識(shí)元集成是指通過某種技術(shù)、方法或策略,在所提取并已標(biāo)引和表示的知識(shí)元或知識(shí)元集之間建立一定的聯(lián)系,以便于理解顯性知識(shí)、揭示隱性知識(shí)、發(fā)現(xiàn)新知識(shí)的行為。
畢經(jīng)元[6]提出了一種基于Web2.0的知識(shí)元鏈接體系。首先將文獻(xiàn)單元按知識(shí)結(jié)構(gòu)分類,并過濾掉無用信息;然后根據(jù)知識(shí)內(nèi)容對(duì)知識(shí)元的特征信息層的屬性(名稱、內(nèi)容、作用等)進(jìn)行填充,設(shè)置知識(shí)元的導(dǎo)航信息層屬性內(nèi)容(鏈接、來源)。成鵬[15]提出了一種基于語義Web的知識(shí)元集成模型——SBKⅠ模型。該模型分為三個(gè)模塊:知識(shí)元挖掘模塊、本體構(gòu)建模塊以及語義集成模塊。其中,語義集成模塊通過在本體中的領(lǐng)域間添加語義邏輯關(guān)系將本體中領(lǐng)域間的非相關(guān)的概念集成起來,使其中非相關(guān)的概念間隱性的關(guān)系能夠顯性化,從而得到具有語義邏輯的知識(shí)元鏈。溫有奎等[16]提出了一個(gè)知識(shí)元語義鏈接模型,其公式為:K(S)+N(K(E)+K(S))=K(S+)S),其中K(S)表示知識(shí)結(jié)構(gòu),K(E)表示知識(shí)元,N表示信息導(dǎo)航鏈接。強(qiáng)調(diào)知識(shí)結(jié)構(gòu)是一個(gè)比較完整的認(rèn)知結(jié)構(gòu),知識(shí)結(jié)構(gòu)的構(gòu)成主要是由信息對(duì)獨(dú)立的知識(shí)元的導(dǎo)航而形成。
綜合起來看,現(xiàn)有研究主要是通過在知識(shí)元之間建立導(dǎo)航鏈接來實(shí)現(xiàn)集成,并考慮了語義因素,但對(duì)集成過程中知識(shí)元的規(guī)范化、同義知識(shí)元的有效關(guān)聯(lián)等問題缺乏深入的探討。
3.2 知識(shí)元的應(yīng)用
(1)在突發(fā)事件處理中的應(yīng)用。仲秋雁等[17]通過抽取情景共性要素及要素關(guān)系來形成情景元模型,在此基礎(chǔ)上提出具體領(lǐng)域的基于知識(shí)元的情景概念模型,并認(rèn)為該研究有利于應(yīng)用計(jì)算機(jī)進(jìn)行情景模擬的研究實(shí)現(xiàn),有助于決策人員的決策行為,并為進(jìn)一步針對(duì)情景進(jìn)行非常規(guī)突發(fā)事件的應(yīng)對(duì)提供基礎(chǔ)。楊德寬等[18]認(rèn)為,隨著突發(fā)事件復(fù)雜性的增加,科學(xué)與高效應(yīng)急的關(guān)鍵是如何實(shí)現(xiàn)模型的組合調(diào)用,根據(jù)突發(fā)事件應(yīng)急決策的特點(diǎn),提出了基于知識(shí)元網(wǎng)絡(luò)的組合調(diào)用方法,可通過構(gòu)造動(dòng)態(tài)模型組合網(wǎng)絡(luò)來解決模型組合調(diào)用問題。
(2)在古籍研究中的應(yīng)用。肖懷志等[19]認(rèn)為,可以利用那些基于歷史年代本體建立的語義關(guān)聯(lián)來聚集相關(guān)歷史年代知識(shí)元,以此達(dá)到聚集同一或相關(guān)史實(shí)的目的。其中,歷史年代知識(shí)元由歷史年代標(biāo)引和歷史事件或史實(shí)構(gòu)成,是史書中可以控制的最小知識(shí)單元,具有完整的邏輯性。丁侃[20]討論了中醫(yī)古籍元數(shù)據(jù)規(guī)范體系,構(gòu)建了以知識(shí)元結(jié)構(gòu)為標(biāo)準(zhǔn)的中醫(yī)古籍元數(shù)據(jù)分類體系。游章才等[21]在知識(shí)元語義分析的基礎(chǔ)上,探討了中藥“性-效-證-癥-病”知識(shí)元之間的內(nèi)在關(guān)聯(lián)規(guī)律。陳冠林等[22]在藥性-功效知識(shí)元語義分析的基礎(chǔ)上論述了中藥復(fù)方的整體功效。此外,還有學(xué)者通過抽取、構(gòu)建中醫(yī)藥知識(shí)元,分析知識(shí)元語義及知識(shí)元之間的關(guān)聯(lián)規(guī)律,來嘗試探析中醫(yī)古籍中概念不明確的知識(shí)元的含義。
(3)在信息檢索方面的應(yīng)用。信息檢索一直面臨著查準(zhǔn)率、查全率不高的問題。傳統(tǒng)信息檢索系統(tǒng)不能滿足人們的知識(shí)需求的根本原因在于知識(shí)組織的深度僅僅停留在文獻(xiàn)層次上,解決方法之一是將文獻(xiàn)知識(shí)的控制單位深入到知識(shí)的最小單位——知識(shí)元層次上。[23]溫有奎[24]提出了知識(shí)組織與檢索中知識(shí)元與向?qū)畔⒌膶?dǎo)航變換的理論與方法,并對(duì)知識(shí)元的理論基礎(chǔ)——認(rèn)知元進(jìn)行了研究。
綜合起來看,知識(shí)元理論和方法在古籍整理和突發(fā)事件處理領(lǐng)域的應(yīng)用研究較多,而在信息檢索領(lǐng)域的應(yīng)用研究較少。從理論上講,利用知識(shí)元來實(shí)現(xiàn)信息資源的組織和檢索,有助于從根本上解決信息檢索的傳統(tǒng)痼疾,但目前這方面的研究尚有待加強(qiáng)。
關(guān)于知識(shí)元的含義?,F(xiàn)有研究在討論知識(shí)元這一概念的含義時(shí),或者強(qiáng)調(diào)知識(shí)元是不可再分割的最小知識(shí)單元,或者認(rèn)為知識(shí)元是基本知識(shí)單位,大多都是從理論層面進(jìn)行描述,很少有簡(jiǎn)單、清晰的知識(shí)元示例,讀者理解起來比較困難。筆者認(rèn)為,知識(shí)元的含義可以理解為用三元組表示的、包含主謂賓結(jié)構(gòu)的最小知識(shí)單元,例如“嗎丁啉是多潘立酮”、“嗎丁啉是Domperidone”、“中國(guó)中央電視臺(tái)央視”是三個(gè)不同的知識(shí)元。其中,斜體字是謂詞,其前后詞語分別是主語和賓語。對(duì)于“中共十八大于2012年11月8日在北京召開”這一陳述,按現(xiàn)有文獻(xiàn)的主流觀點(diǎn)來看只包含一個(gè)知識(shí)元,但從最小知識(shí)單元的角度看,可從中解析出“中共十八大召開時(shí)間是2012年11月8日”、“中共十八大召開地點(diǎn)是北京”兩個(gè)知識(shí)元。
關(guān)于知識(shí)元的類型。如果上述知識(shí)元定義成立的話,判斷知識(shí)元的類型則是比較困難的事情。對(duì)于一個(gè)只包含主謂賓的三元組來說,其所包含的信息不足以用來準(zhǔn)確地判斷其類型,如知識(shí)元“DNAⅤaccines treat Mice”,其含義是DNA疫苗治療鼠類,如果按本文1.2節(jié)所述的類型進(jìn)行分類的話,可算作方法型、經(jīng)驗(yàn)型、事實(shí)型或陳述型知識(shí)元。同一個(gè)知識(shí)元在不同的上下文環(huán)境中具有不同的身份,從現(xiàn)有分類方法來看,可能屬于不同的類型。這種分類上的多變性導(dǎo)致關(guān)于知識(shí)元類型的討論意義不大。
關(guān)于知識(shí)元的表示。從知識(shí)元集成、應(yīng)用以及知識(shí)推理的角度看,采用合適的模型來表示知識(shí)元是至關(guān)重要的。本文2.2節(jié)簡(jiǎn)單討論了可用于知識(shí)元表示的各種方法。筆者認(rèn)為,其中,基于本體的表示方法可將知識(shí)元表示成規(guī)范的、公共可理解的形式,易于滿足知識(shí)元集成與應(yīng)用以及知識(shí)推理的需求。文獻(xiàn)[15]對(duì)此進(jìn)行了探討,但只考慮了知識(shí)元本體的使用,忽略了與各種領(lǐng)域知識(shí)相關(guān)的領(lǐng)域本體,而這些本體可以有效地規(guī)范蘊(yùn)含在知識(shí)元中的概念及關(guān)系。例如,知識(shí)元“DNAⅤaccines treat Mice”描述的是醫(yī)學(xué)領(lǐng)域的知識(shí),其主語和賓語可用醫(yī)學(xué)領(lǐng)域本體UMLS中的概念加以規(guī)范,謂詞可用UMLS中的語義關(guān)系加以規(guī)范,結(jié)果是:“DNAⅤaccines”規(guī)范為“Ⅴaccines,DNA”、“treat”規(guī)范為“treats”、“Mice”規(guī)范為“Mus”,規(guī)范后的知識(shí)元可表示為“Ⅴaccines,DNA treats Mus”。筆者建議,可進(jìn)一步按RDF格式的要求來表示知識(shí)元,結(jié)果形如“umls:Ⅴaccines,DNA umls:treats umls:Mus”。其中,前綴umls指向UMLS本體。任何能兼容UMLS的系統(tǒng)都可以準(zhǔn)確無誤地理解并應(yīng)用該知識(shí)元。
關(guān)于知識(shí)元的集成。當(dāng)采用RDF格式來表示知識(shí)元時(shí),知識(shí)元集成的難度則大為降低,集成過程中需要解決的主要問題是不同本體之間的映射問題以及映射之后同義知識(shí)元之間的關(guān)聯(lián)問題。如果所有知識(shí)元均屬于同一個(gè)領(lǐng)域,且其主謂賓都采用同一本體的詞語進(jìn)行規(guī)范,則在將這些知識(shí)元按RDF格式保存起來的同時(shí),實(shí)質(zhì)上已經(jīng)自動(dòng)進(jìn)行了集成,形成了知識(shí)元鏈接網(wǎng)絡(luò)。如果知識(shí)元采用多個(gè)領(lǐng)域本體進(jìn)行規(guī)范,集成時(shí),需要事先在不同領(lǐng)域本體之間建立映射關(guān)系,然后根據(jù)映射關(guān)系來判斷兩個(gè)知識(shí)元是否同義。筆者認(rèn)為,分別經(jīng)過兩個(gè)不同本體規(guī)范處理的同義知識(shí)元,可通過owl:sameAs建立關(guān)聯(lián)。例如,假設(shè)兩個(gè)知識(shí)元“umls:Ⅴaccines,DNA umls:treats umls:Mus”、“medonto:DNA疫苗medonto:治療medon to:鼠類”是同義關(guān)系,可新增一個(gè)知識(shí)元“umls:Ⅴaccines,DNA owl:sameAs medonto:DNA疫苗”來描述概念“umls:Ⅴaccines,DNA”與“medonto:DNA疫苗”之間的同義關(guān)系,從而間接達(dá)到在兩個(gè)同義知識(shí)元之間建立聯(lián)系的目的。
關(guān)于知識(shí)元的應(yīng)用。從現(xiàn)有研究成果來看,知識(shí)元在教學(xué)、管理、科學(xué)研究等眾多領(lǐng)域都能發(fā)揮作用。依筆者看,知識(shí)元理論與方法無論應(yīng)用在哪個(gè)領(lǐng)域,本質(zhì)上都是對(duì)領(lǐng)域知識(shí)的細(xì)粒度組織以及基于此的知識(shí)檢索與知識(shí)服務(wù)。具體應(yīng)用時(shí),需要重點(diǎn)解決兩個(gè)問題:(1)應(yīng)用領(lǐng)域的本體選擇或構(gòu)建問題。知識(shí)元最終要利用本體進(jìn)行規(guī)范,形成公共可理解的RDF數(shù)據(jù)。如果所選的應(yīng)用領(lǐng)域有成熟的本體可用,則可直接采納;否則,需要組織領(lǐng)域?qū)<覙?gòu)建可用的本體。(2)基于知識(shí)元的知識(shí)檢索。在知識(shí)元的基礎(chǔ)上實(shí)現(xiàn)的知識(shí)組織,與關(guān)聯(lián)數(shù)據(jù)技術(shù)相結(jié)合,可以實(shí)現(xiàn)數(shù)字資源的深度整合——聚合。聚合結(jié)果可以通過可視化形式呈現(xiàn)給用戶,由用戶直接從中找到所需知識(shí),也可以讓用戶通過SPARQL端點(diǎn)進(jìn)行查詢。前者需要為用戶提供清晰、直觀的可視化界面,后者需要提供簡(jiǎn)單易行的SPARQL查詢構(gòu)建器,兩項(xiàng)工作實(shí)現(xiàn)起來都有一定難度。
[1]劉新,王泰森.學(xué)習(xí)型知識(shí)元數(shù)據(jù)庫鏈接理論研究[J].圖書館學(xué)研究,2009(11):25-28.
[2]張亮,楊溢.論基于三維包絡(luò)灰預(yù)測(cè)與知識(shí)元理論的圖書館文獻(xiàn)采購(gòu)優(yōu)化[J].圖書館學(xué)研究, 2013(8):45-48.
[3]姜永常,等.基于知識(shí)元的知識(shí)組織及其系統(tǒng)服務(wù)功能研究[J].情報(bào)理論與實(shí)踐,2007(1):37-40.
[4]文庭孝,等.中文文本知識(shí)元的構(gòu)建及其現(xiàn)實(shí)意義[J].中國(guó)圖書館學(xué)報(bào),2007(6):91-95.
[5]溫有奎,徐國(guó)華.知識(shí)元鏈接理論[J].情報(bào)學(xué)報(bào),2003,22(6):665-670.
[6]畢經(jīng)元.基于web2.0的知識(shí)元鏈接網(wǎng)絡(luò)系統(tǒng)[D].杭州:浙江大學(xué),2010:24-25.
[7]王延章.模型管理的知識(shí)及其表示方法[J].系統(tǒng)工程學(xué)報(bào),2011,26(6):850-856.
[8]溫有奎,等.基于知識(shí)元的文本知識(shí)標(biāo)引[J].情報(bào)學(xué)報(bào),2003,25(3):282-288.
[9]張靜,等.論中小學(xué)多媒體知識(shí)元庫的建設(shè)[J].現(xiàn)代教育技術(shù),2005(5):68-71.
[10]原小玲.基于知識(shí)元的知識(shí)標(biāo)引[J].圖書館學(xué)研究,2007(6):45-47.
[11]姜永常,等.基于知識(shí)元的知識(shí)組織及其系統(tǒng)服務(wù)功能研究[J].情報(bào)理論與實(shí)踐,2007(1):37-40.
[12]周寧,等.基于XML平臺(tái)的知識(shí)元表示與抽取研究[J].中國(guó)圖書館學(xué)報(bào),2006(3):41-45.
[13]蔣玲.面向?qū)W科的知識(shí)元標(biāo)引關(guān)鍵技術(shù)研究[D].武漢:華中師范大學(xué),2011:36-37.
[14]袁名依,謝深泉.基于知識(shí)元本體的知識(shí)統(tǒng)一表示[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2008(5):46-48,57.
[15]成鵬.基于語義Web的知識(shí)元集成模型研究[D].西安:西安電子科技大學(xué),2007:88-90.
[16]溫有奎,焦玉英.知識(shí)元語義鏈接模型研究[J].圖書情報(bào)工作,2010,54(12):27-31.
[17]仲秋雁,等.基于知識(shí)元的非常規(guī)突發(fā)事件情景模型研究[J].情報(bào)科學(xué),2012,30(1):115-120.
[18]楊德寬,等.基于知識(shí)元網(wǎng)絡(luò)的突發(fā)事件模型組合調(diào)用[J].系統(tǒng)工程,2012(9):87-93.
[19]肖懷志,李明.基于本體的歷史年代知識(shí)元在古籍?dāng)?shù)字化中的應(yīng)用[J].圖書情報(bào)知識(shí),2005(3):28-33.
[20]丁侃.基于知識(shí)元信息技術(shù)的中醫(yī)古籍元數(shù)據(jù)研究[D].北京:中國(guó)中醫(yī)科學(xué)院,2009:76-78.
[21]游章才,等.基于中藥“性-效-證-癥-病”知識(shí)元關(guān)聯(lián)探討“澀味”的內(nèi)涵[J].四川中醫(yī),2010,28(8):54-57.
[22]陳冠林,等.基于“藥性-功效知識(shí)元語義分析”探析中藥復(fù)方的整體功效[J].遼寧中醫(yī)雜志,2011,38(78):1260-1264.
[23]溫有奎,等.基于XML平臺(tái)的知識(shí)元本體推理[J].情報(bào)學(xué)報(bào),2004,23(6):643-648.
[24]溫有奎.基于“知識(shí)元”的知識(shí)組織與檢索[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(1):55-57,91.
G250
A
1005-8214(2014)11-0038-04
郭少友(1965-),男,鄭州大學(xué)信息管理學(xué)院教授;常楨(1992-),男,鄭州大學(xué)信息管理學(xué)院碩士研究生;竇暢(1991-),女,鄭州大學(xué)信息管理學(xué)院碩士研究生。
2014-01-26[責(zé)任編輯]閆東芳
本文系2013年度教育部人文社會(huì)科學(xué)研究規(guī)劃基金項(xiàng)目“圖書館數(shù)字資源的細(xì)粒度語義化描述與復(fù)用研究”(項(xiàng)目編號(hào):13YJA870008)研究成果之一。