穆向陽(yáng)(1.南京郵電大學(xué)信息產(chǎn)業(yè)發(fā)展戰(zhàn)略研究院;2.中國(guó)科學(xué)技術(shù)信息研究所)
圖書館、檔案館、博物館(Library、Archives、Museum,簡(jiǎn)稱LAM)作為一個(gè)國(guó)家或社會(huì)的重要文化機(jī)構(gòu),三者擁有的數(shù)字資源呈現(xiàn)出很多內(nèi)容特征上的相似性,如資源的檔案性、文化性以及權(quán)威性等。資源特征上的相似性以及知識(shí)本身所擁有的內(nèi)在統(tǒng)一性是LAM合作的前提基礎(chǔ),同時(shí)也為L(zhǎng)AM知識(shí)重用提供了最根本的內(nèi)部動(dòng)力。知識(shí)重用(Knowledge Reuse)是知識(shí)管理的重要環(huán)節(jié)之一,也是節(jié)省社會(huì)智力資本促進(jìn)知識(shí)高效創(chuàng)新的重要手段。目前,知識(shí)重用已經(jīng)成為眾多知識(shí)創(chuàng)新領(lǐng)域關(guān)注的熱點(diǎn),如產(chǎn)品設(shè)計(jì)領(lǐng)域等。[1]LAM數(shù)字資源作為一種“知識(shí)之源”,其蘊(yùn)含的豐富知識(shí)具有極大價(jià)值,對(duì)其進(jìn)行系統(tǒng)地知識(shí)管理,加強(qiáng)知識(shí)重用研究,能夠提高LAM知識(shí)利用的效率,促進(jìn)知識(shí)創(chuàng)新創(chuàng)造過(guò)程,因而具有非常重要的現(xiàn)實(shí)意義。智慧時(shí)代即將來(lái)臨,如何從更深層次、更多維度對(duì)LAM數(shù)字資源進(jìn)行知識(shí)挖掘,并對(duì)相關(guān)知識(shí)進(jìn)行合理描述和組織,設(shè)計(jì)知識(shí)重用的策略與方法,已經(jīng)成為未來(lái)LAM知識(shí)服務(wù)的重要前提和基礎(chǔ)。
由于圖書館、檔案館、博物館作為文化機(jī)構(gòu)的特殊性,LAM數(shù)字資源相對(duì)于其他數(shù)字資源來(lái)說(shuō)具有一些突出的特征,而LAM數(shù)字資源的特征也在客觀上決定了LAM合作領(lǐng)域知識(shí)重用的必要性。LAM數(shù)字資源內(nèi)涵以及外延上具有如下一些特點(diǎn)。
(1)LAM數(shù)字資源的權(quán)威性。LAM數(shù)字資源是人類歷史在歲月的長(zhǎng)河中遺留下最直接痕跡的數(shù)字化體現(xiàn),作為人類歷史信息的直接證據(jù),LAM數(shù)字資源具有極高的權(quán)威性,是很多學(xué)術(shù)、文化以及社會(huì)活動(dòng)的源頭資源和根本依據(jù)。
(2)LAM數(shù)字資源具有很高的知識(shí)含量。LAM數(shù)字資源是知識(shí)分布最為密集的資源形態(tài)之一,另外使用這些知識(shí)的過(guò)程中也會(huì)產(chǎn)生許多新的知識(shí),很多專家頭腦中的隱性知識(shí)就是在使用LAM數(shù)字資源的過(guò)程中產(chǎn)生的。
(3)LAM數(shù)字資源屬于高品質(zhì)的結(jié)構(gòu)化資源。LAM數(shù)字資源是經(jīng)過(guò)專業(yè)人員進(jìn)行嚴(yán)格采集、表示、分類以及存儲(chǔ)等管理過(guò)程所形成的數(shù)字化資源形態(tài),從而保障了LAM數(shù)字資源極高的資源品質(zhì)。另外,資源本身所固有的文化及檔案性特征也體現(xiàn)了LAM數(shù)字資源極高的學(xué)術(shù)及文化價(jià)值。
從以上LAM數(shù)字資源所具有的獨(dú)特性質(zhì)來(lái)看,加強(qiáng)LAM合作領(lǐng)域的知識(shí)重用具有很大的必要性。從LAM數(shù)字資源的權(quán)威性來(lái)看,首先,LAM所包含的豐富知識(shí)是眾多文化及學(xué)術(shù)領(lǐng)域都需要借鑒和使用的“源知識(shí)”,也是面向用戶的知識(shí)服務(wù)過(guò)程中反復(fù)使用的資源基礎(chǔ);其次,在相關(guān)領(lǐng)域知識(shí)創(chuàng)造過(guò)程中,LAM合作領(lǐng)域的相關(guān)知識(shí)是專家學(xué)者等需要反復(fù)大量使用的資源,加強(qiáng)LAM合作領(lǐng)域的知識(shí)重用能夠極大節(jié)省知識(shí)創(chuàng)造的智力成本,極大提升知識(shí)創(chuàng)新效率;最后,高品質(zhì)的LAM數(shù)字資源為L(zhǎng)AM合作領(lǐng)域的知識(shí)重用提供了可靠保障,同時(shí)資源的品質(zhì)會(huì)產(chǎn)生一種品牌效應(yīng),從而進(jìn)一步促進(jìn)LAM領(lǐng)域知識(shí)重用。
資源與知識(shí)共享是LAM合作的根本目的之一,知識(shí)重用是知識(shí)共享的重要方式,也是LAM的知識(shí)管理活動(dòng)中極為重要的環(huán)節(jié),加強(qiáng)LAM合作領(lǐng)域知識(shí)重用的研究具有如下意義。① 能夠極大提高LAM領(lǐng)域知識(shí)的利用效率,減少智力資源的浪費(fèi)。② 有利于LAM領(lǐng)域知識(shí)的深度挖掘與創(chuàng)新,知識(shí)重用為新知識(shí)的創(chuàng)造提供了良好的機(jī)制和框架。知識(shí)重用將為隱性知識(shí)顯性化、知識(shí)間深度關(guān)聯(lián)以及創(chuàng)新等提供強(qiáng)勁動(dòng)力。③ 能夠進(jìn)一步豐富LAM知識(shí)服務(wù)的種類和內(nèi)涵,提高知識(shí)服務(wù)的專業(yè)化、多樣化以及個(gè)性化水平。④ 因?yàn)長(zhǎng)AM數(shù)字資源的特點(diǎn),需要構(gòu)建與之相適應(yīng)的知識(shí)重用策略與方法,對(duì)于知識(shí)重用相關(guān)理論與方法的研究來(lái)說(shuō)也是一種豐富和完善。
LAM知識(shí)重用是其合作領(lǐng)域知識(shí)管理的環(huán)節(jié)之一,與LAM知識(shí)管理其他過(guò)程緊密相關(guān)。LAM知識(shí)獲取、表示、分類、存儲(chǔ)等環(huán)節(jié)在很大程度上影響著LAM知識(shí)重用的策略與方法,因而需要了解LAM知識(shí)管理的過(guò)程與框架,才能夠合理構(gòu)建LAM知識(shí)重用的策略。
LAM領(lǐng)域的知識(shí)管理遵循知識(shí)管理的一般過(guò)程包括:知識(shí)獲取、知識(shí)表示、分類、組織、存儲(chǔ)、整合以及應(yīng)用創(chuàng)新等環(huán)節(jié)。但由于LAM資源的特殊屬性又使得其具體知識(shí)管理過(guò)程跟一般的知識(shí)管理存在很多差異,這些差異主要體現(xiàn)在不同環(huán)節(jié)所采用的方法與機(jī)制上的差異,因而為了提升LAM知識(shí)共享與重用的水平,構(gòu)建合理的知識(shí)重用策略,需要首先梳理三館合作領(lǐng)域的整體知識(shí)管理框架,本文構(gòu)建的LAM知識(shí)管理框架如圖1所示。
圖1 LAM知識(shí)管理過(guò)程框架
圖1展示了LAM知識(shí)管理的基本過(guò)程,但是每一個(gè)環(huán)節(jié)或階段所包含的豐富細(xì)節(jié)及不同于一般知識(shí)管理過(guò)程的差異還需要進(jìn)一步分析。
(1)知識(shí)采集。LAM數(shù)字資源屬于高質(zhì)量的結(jié)構(gòu)化信息資源,其知識(shí)采集過(guò)程主要可以從兩個(gè)角度入手:元數(shù)據(jù)、具體的知識(shí)內(nèi)容。首先,基于元數(shù)據(jù)的LAM知識(shí)采集是指以元數(shù)據(jù)作為主要手段的知識(shí)采集過(guò)程,如,利用元數(shù)據(jù)描述中所包含的字段信息以及元數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系進(jìn)行的知識(shí)采集。這類方法的主要特征是操作較為簡(jiǎn)單,特別是因LAM數(shù)字信息資源經(jīng)過(guò)了系統(tǒng)嚴(yán)格的著錄過(guò)程,而元數(shù)據(jù)能夠提供較為直接準(zhǔn)確的信息,便于知識(shí)的發(fā)現(xiàn)和獲取。但是這種方法也存在很大的缺陷,元數(shù)據(jù)所包含的信息很難反映出其所描述資源包含的豐富知識(shí),如,文獻(xiàn)類信息資源以及視頻類、圖形圖像類信息資源等。所以除了從元數(shù)據(jù)外,還可以直接從具體的知識(shí)內(nèi)容入手,也就是利用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等手段直接深入到資源內(nèi)部,直接從內(nèi)容入手獲取所需知識(shí)。另外,還可以開發(fā)協(xié)同性工作機(jī)制,以人工的方式對(duì)資源內(nèi)部的知識(shí)進(jìn)行抽取,將專家頭腦中的隱性知識(shí)顯性化并將新獲取的知識(shí)與已有知識(shí)整合到一起,完善已有知識(shí)網(wǎng)絡(luò),作為對(duì)外服務(wù)的資源基礎(chǔ)。
(2)知識(shí)的描述、分類。對(duì)采集到的LAM知識(shí)要進(jìn)行描述和分類,主要的知識(shí)描述手段包括元數(shù)據(jù)、本體等。但是元數(shù)據(jù)和本體存在的共同問(wèn)題是,它們僅能圍繞信息資源的總體特征進(jìn)行揭示,而無(wú)法深入到資源內(nèi)部所包含的豐富內(nèi)容,對(duì)于博物館的單個(gè)藏品這種描述比較適宜,但是對(duì)于圖書、檔案類視頻錄音等這類所含內(nèi)容極為復(fù)雜的資源形態(tài)來(lái)說(shuō),存在很大的局限。元數(shù)據(jù)、本體以及RDF(資源描述框架)無(wú)法深入揭示復(fù)雜形態(tài)資源內(nèi)部所蘊(yùn)含的巨量知識(shí),因此,在探索LAM知識(shí)重用的過(guò)程中必須要尋找一些新的辦法,以彌補(bǔ)元數(shù)據(jù)級(jí)描述的缺陷,從而實(shí)現(xiàn)知識(shí)元級(jí)的知識(shí)共享與重用。對(duì)LAM資源進(jìn)行知識(shí)元級(jí)的描述,是更進(jìn)一層的知識(shí)管理活動(dòng),這也意味著需要從新的層面重新對(duì)知識(shí)進(jìn)行組織與分類,如對(duì)知識(shí)元進(jìn)行標(biāo)簽添加,進(jìn)行主題、時(shí)空等多維度的分類等。LAM知識(shí)共享還需要關(guān)注的是知識(shí)與資源不同層面的協(xié)同組織問(wèn)題,需要構(gòu)建不同層面相互融合的知識(shí)共享網(wǎng)絡(luò),并能夠?yàn)橛脩籼峁┛梢暬涌谝员阌谄溥M(jìn)行與資源間的交互操作。
(3)知識(shí)的組織與存儲(chǔ)。對(duì)于LAM數(shù)字資源來(lái)說(shuō),知識(shí)的組織與存儲(chǔ)涉及到如下幾方面。① 對(duì)原始資源本身的組織與存儲(chǔ)。這部分內(nèi)容主要包括對(duì)原始LAM資源進(jìn)行的描述、加工、存儲(chǔ)等過(guò)程。由于LAM三館資源所具有的差異,三者有著自身獨(dú)立的資源描述元數(shù)據(jù)標(biāo)準(zhǔn),因此在進(jìn)行LAM三館資源統(tǒng)一描述時(shí),需要構(gòu)建通用的元數(shù)據(jù)結(jié)構(gòu),一些比較成功的LAM合作項(xiàng)目都有自己獨(dú)立開發(fā)的元數(shù)據(jù)、本體等,如,以圖像類檔案資源共享為主的Zeri&LODE項(xiàng)目。[2]② 對(duì)挖掘出的知識(shí)元進(jìn)行的組織與存儲(chǔ)。這一部分內(nèi)容更為復(fù)雜,因?yàn)橹R(shí)元廣泛而隱性地分布于具體的資源之中,對(duì)知識(shí)元的識(shí)別、分類、描述、存儲(chǔ)等都存在很多問(wèn)題需要解決,需要探索新的模式將機(jī)器學(xué)習(xí)、語(yǔ)義標(biāo)簽、知識(shí)地圖等技術(shù)應(yīng)用到LAM知識(shí)的共享與重用工作之中。另外,如何存儲(chǔ)知識(shí)元、知識(shí)元之間的關(guān)系以及已經(jīng)顯性化了的專家頭腦中的隱性知識(shí)也是LAM知識(shí)重用需要探討的重要內(nèi)容。③ 動(dòng)態(tài)的組織與存儲(chǔ)過(guò)程。LAM知識(shí)重用也是知識(shí)創(chuàng)造過(guò)程,資源以及知識(shí)間的關(guān)聯(lián)關(guān)系會(huì)在重用的過(guò)程中變得更為密切復(fù)雜,新的知識(shí)將不斷產(chǎn)生,這些新產(chǎn)生的知識(shí)也需要不斷進(jìn)行再組織和存儲(chǔ)。
(4)知識(shí)服務(wù)。服務(wù)是連接資源和用戶的中間環(huán)節(jié),它一方面肩負(fù)著發(fā)揮資源價(jià)值責(zé)任,另一方面決定了用戶的最終體驗(yàn)。同時(shí),服務(wù)模式與接口還在很大程度上擔(dān)負(fù)著資源組織的任務(wù),因?yàn)橛脩粼谑褂觅Y源的過(guò)程中需要與資源進(jìn)行交互,需要將用戶頭腦中的隱性知識(shí)顯性化,并加入到原有的知識(shí)體系之中,從而進(jìn)一步豐富資源本身。LAM知識(shí)重用是建立在一定內(nèi)在特征的資源基礎(chǔ)上的,三館共享的資源集合所擁有的稟賦在很大程度上決定了服務(wù)模式的設(shè)計(jì),因而需要構(gòu)建與資源特征相適應(yīng)的服務(wù)模式才能真正滿足用戶需求并充分發(fā)揮資源的價(jià)值。
LAM可以用來(lái)重用的知識(shí)主要來(lái)源于以下幾個(gè)方面。① LAM三者免費(fèi)提供用于合作共享的數(shù)字信息資源,這部分資源屬于初始性資源,是LAM知識(shí)重用的基礎(chǔ)。② 可以從LAM數(shù)字資源中抽取出知識(shí)元,資源內(nèi)部所蘊(yùn)含的豐富知識(shí)是LAM知識(shí)重用的核心。對(duì)于這部分知識(shí)可以通過(guò)人工的方式獲取,也可以通過(guò)機(jī)器學(xué)習(xí)等技術(shù)獲取。③ 專家頭腦中的隱性知識(shí)。需要提供合理的方式使這部分知識(shí)顯性化,并作為非常重要的資源加入到已有知識(shí)體系之中。④網(wǎng)絡(luò)上一些公開的LAM數(shù)字信息資源?,F(xiàn)有的LAM合作項(xiàng)目,如Wikipedia等,這部分資源可以作為L(zhǎng)AM重用知識(shí)的有益補(bǔ)充。
針對(duì)上述四部分知識(shí)來(lái)源,需要分別探討知識(shí)獲取方法。
(1)LAM免費(fèi)提供的用于共享的數(shù)字信息資源屬于已有資源,無(wú)需獲取。但是這部分資源來(lái)自于不同的文化機(jī)構(gòu),既具有特征上的相似性又存在很大差異。因而必須對(duì)其進(jìn)行統(tǒng)一組織才能夠作為L(zhǎng)AM知識(shí)重用的基礎(chǔ)。LAM數(shù)字資源具有不同的元數(shù)據(jù)描述標(biāo)準(zhǔn),這也意味著需要先從統(tǒng)一元數(shù)據(jù)或本體等開始對(duì)資源進(jìn)行整體描述。[3]現(xiàn)實(shí)中很多LAM合作項(xiàng)目都會(huì)按照項(xiàng)目的具體目標(biāo)進(jìn)行統(tǒng)一的元數(shù)據(jù)處理,如英國(guó)的聚寶盆項(xiàng)目(Cornucopia)、歐洲的光明項(xiàng)目等。將LAM進(jìn)行統(tǒng)一的元數(shù)據(jù)或本體描述后,需要進(jìn)一步構(gòu)建資源關(guān)聯(lián)網(wǎng)絡(luò),包括兩個(gè)方面的內(nèi)容:①已有資源之間的關(guān)聯(lián)關(guān)系;② LAM資源與其他外部信息資源的關(guān)系。可以通過(guò)如下渠道尋找關(guān)聯(lián)關(guān)系:元數(shù)據(jù)描述、本體、關(guān)聯(lián)數(shù)據(jù)、引文關(guān)系等。通過(guò)這些渠道不僅可以將已有資源緊密連接起來(lái),還可以將資源集擴(kuò)展到網(wǎng)絡(luò)上的相關(guān)信息資源,從而成為一個(gè)具有開放性的資源集合。
(2)對(duì)知識(shí)元的抽取、描述、存儲(chǔ)。LAM知識(shí)重用的主要內(nèi)容就是分布在LAM數(shù)字資源中的海量知識(shí)元,因而如何從LAM資源中抽取出有價(jià)值的知識(shí)元是LAM知識(shí)重用的核心內(nèi)容。從LAM數(shù)字資源中抽取知識(shí)元的方式主要分為兩種,即自動(dòng)抽取和人工抽取。自動(dòng)抽取方面可以對(duì)LAM數(shù)字資源進(jìn)行知識(shí)挖掘,并結(jié)合神經(jīng)網(wǎng)絡(luò)、決策樹、機(jī)器學(xué)習(xí)等人工智能技術(shù)對(duì)知識(shí)元進(jìn)行分類組織,并自動(dòng)添加語(yǔ)義標(biāo)簽,從而構(gòu)建可以供重復(fù)使用的知識(shí)元集合。自動(dòng)抽取的知識(shí)集合雖然效率很高,但是準(zhǔn)確性相對(duì)較差,因而需要結(jié)合人工抽取方式才能夠進(jìn)一步保障知識(shí)元的質(zhì)量。人工抽取方式是指由領(lǐng)域內(nèi)專門工作人員、專家學(xué)者等以手工方式對(duì)資源進(jìn)行知識(shí)抽取,并為抽取出的知識(shí)元添加語(yǔ)義標(biāo)簽,以供用戶重復(fù)使用。人工知識(shí)抽取的方法有很多,協(xié)同編輯關(guān)聯(lián)表方法是LAM其中之一,它利用專家協(xié)同編輯的方式抽取LAM資源中的知識(shí)元,并旨在將專家頭腦中的知識(shí)元關(guān)聯(lián)關(guān)系顯性化,從而形成知識(shí)元網(wǎng)絡(luò)。[4]協(xié)同編輯關(guān)聯(lián)表法是一種在資源使用的過(guò)程中,不斷豐富知識(shí)元及知識(shí)元之間關(guān)聯(lián)關(guān)系的方法,也就意味著知識(shí)重用的過(guò)程本身也是一種知識(shí)再創(chuàng)造過(guò)程。LAM知識(shí)元的人工抽取效率較低,但是準(zhǔn)確率和質(zhì)量較高,是自動(dòng)抽取的有效補(bǔ)充。
為進(jìn)一步豐富可重用的LAM知識(shí)集合,需要構(gòu)建知識(shí)元網(wǎng)絡(luò),知識(shí)元網(wǎng)絡(luò)是LAM知識(shí)重用的核心。介于知識(shí)之間的廣泛關(guān)聯(lián)性,添加了語(yǔ)義標(biāo)簽的LAM知識(shí)元需要進(jìn)一步形成知識(shí)元網(wǎng)絡(luò),知識(shí)網(wǎng)絡(luò)是整個(gè)LAM知識(shí)重用的主要內(nèi)容。知識(shí)元之間關(guān)聯(lián)關(guān)系的獲取可以通過(guò)機(jī)器學(xué)習(xí)等方式自動(dòng)建立,也可以通過(guò)人工方式添加,如協(xié)同編輯關(guān)聯(lián)表的方式,通過(guò)這種方式知識(shí)元之間的關(guān)聯(lián)關(guān)系可以添加關(guān)聯(lián)進(jìn)行說(shuō)明,也就是關(guān)聯(lián)關(guān)系本身所反映的語(yǔ)義,以便于用戶獲取相關(guān)知識(shí)內(nèi)容。
(3)專家頭腦中的隱性知識(shí)獲取與存儲(chǔ)。專家頭腦中隱性知識(shí)是LAM知識(shí)元網(wǎng)絡(luò)非常重要的補(bǔ)充,對(duì)于LAM知識(shí)元網(wǎng)路的擴(kuò)展來(lái)說(shuō)具有非常重要的作用。實(shí)現(xiàn)隱性知識(shí)的重復(fù)使用,必須先將隱性知識(shí)顯性化,將深藏于個(gè)人頭腦中的隱性知識(shí)用明確的語(yǔ)言、文字等方式表達(dá)出來(lái)??梢栽谔峁┓?wù)的過(guò)程中,通過(guò)不同的具體方式激發(fā)隱性知識(shí)顯性化的過(guò)程,如COLLATE項(xiàng)目旨在設(shè)計(jì)一套以網(wǎng)絡(luò)為基礎(chǔ)的合作系統(tǒng),領(lǐng)域?qū)<乙约捌胀ㄓ脩舳伎梢詤⑴c相應(yīng)文化資源的編輯過(guò)程。[5]知識(shí)顯性化以后,需要對(duì)其進(jìn)行存儲(chǔ),存儲(chǔ)主要包括知識(shí)本身和知識(shí)關(guān)聯(lián)關(guān)系兩方面內(nèi)容。隱性知識(shí)的顯性化是已有LAM知識(shí)網(wǎng)絡(luò)的有效補(bǔ)充,供用戶重復(fù)使用。
(4)知識(shí)元網(wǎng)絡(luò)以及LAM資源網(wǎng)絡(luò)都可以建立與外圍資源之間的關(guān)聯(lián),從而可以對(duì)LAM知識(shí)進(jìn)一步擴(kuò)展。網(wǎng)絡(luò)上擁有一些可供免費(fèi)使用的極為有價(jià)值的LAM數(shù)字資源,LAM數(shù)字資源通過(guò)本體、關(guān)聯(lián)數(shù)據(jù)等渠道,可以和很多網(wǎng)絡(luò)上的資源建立關(guān)聯(lián)關(guān)系,[6]并使LAM可重用知識(shí)集合具有一定的開放性,從而進(jìn)一步擴(kuò)展LAM可重用知識(shí)的外延。
圖2 LAM可重用知識(shí)的獲取
綜上所述,LAM可重用知識(shí)的獲取包括上述幾個(gè)主要部分,但上述四個(gè)部分并不是割裂開的,而是相互交織在一起共同構(gòu)成LAM可以重用的知識(shí)集合(見圖 2)。① 核心知識(shí)層是指那些能夠直接被重用的具體知識(shí)元所構(gòu)成的集合,其來(lái)源包括人工或自動(dòng)從LAM數(shù)字資源中抽取的知識(shí)元、專家用戶頭腦中的隱性知識(shí)以及一些其他外圍知識(shí)。這些具體知識(shí)可以通過(guò)語(yǔ)義標(biāo)簽等方式進(jìn)行檢索和重用,它們本身也構(gòu)成一個(gè)復(fù)雜龐大的知識(shí)元網(wǎng)絡(luò),從而能夠讓用戶進(jìn)行深度瀏覽和遍歷。② 基礎(chǔ)資源層是LAM免費(fèi)提供用于共享的資源層,是知識(shí)元網(wǎng)絡(luò)的來(lái)源。同樣基礎(chǔ)資源也能夠直接提供可重用的知識(shí),但是基礎(chǔ)資源層的宏觀維度,特別是圖書、視頻、錄音等資源包含的知識(shí)量過(guò)于龐大,以至于無(wú)法直接重用,所以需要對(duì)基礎(chǔ)資源進(jìn)行知識(shí)抽取,以獲得可以重用的具體知識(shí)。基礎(chǔ)資源層也是一個(gè)復(fù)雜而龐大的網(wǎng)絡(luò),資源之間的關(guān)聯(lián)關(guān)
來(lái)源于四個(gè)途徑的LAM可重用知識(shí)并不是一個(gè)松散的集合,而是由內(nèi)在的知識(shí)關(guān)聯(lián)、外在的結(jié)構(gòu)特征以及用戶的使用等連接起來(lái)的一個(gè)具有體系層次的有機(jī)知識(shí)體系,所以需要按照相應(yīng)的體系進(jìn)行資源組織。
LAM可重用的知識(shí)集合總體上可以分為三層:核心知識(shí)層、基礎(chǔ)資源層和外圍資源擴(kuò)展層(見圖3)。系將來(lái)自于LAM三館的資源緊密連接在一起,形成最初的LAM共享資源集合?;A(chǔ)資源層的網(wǎng)絡(luò)并非孤立,它與知識(shí)元網(wǎng)絡(luò)也緊密聯(lián)系在一起,形成極為龐大復(fù)雜的整體網(wǎng)絡(luò)。③ 外圍資源層是網(wǎng)絡(luò)上供免費(fèi)試用的LAM公開數(shù)字資源,這部分資源是上述兩層資源的非常有益的補(bǔ)充,如Wikipedia、已經(jīng)公開的LAM項(xiàng)目資源如world digital library等,通過(guò)本體、關(guān)聯(lián)數(shù)據(jù)等方式可以建立與這些資源之間的關(guān)聯(lián),從而體現(xiàn)LAM可重用知識(shí)體系的開放性和靈活性。
圖3 LAM可重用知識(shí)的組織結(jié)構(gòu)
三個(gè)層次資源的具體特征決定了需要采用不同方式分別對(duì)其進(jìn)行組織。
基礎(chǔ)資源層雖然不是供用戶重復(fù)使用的直接資源,但是它提供了重用知識(shí)的來(lái)源和基礎(chǔ),對(duì)其的管理遵循一般信息資源的管理規(guī)律,首先建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)以及本體結(jié)構(gòu),將來(lái)自于LAM不同形式的資源轉(zhuǎn)換成統(tǒng)一描述的資源,并統(tǒng)一存儲(chǔ),構(gòu)建基本的資源集合,可以直接向用戶提供檢索、瀏覽等服務(wù)。需要注意的是,資源之間存在豐富的關(guān)聯(lián)關(guān)系需要挖掘,利用這些關(guān)系可以突破資源的松散集合形態(tài)從而構(gòu)建資源網(wǎng)絡(luò),便于用戶進(jìn)行深度瀏覽。元數(shù)據(jù)、本體、引文關(guān)系、關(guān)聯(lián)數(shù)據(jù)等都能夠提供資源之間的關(guān)聯(lián)關(guān)系。
對(duì)于核心的知識(shí)元層來(lái)說(shuō),需要不同的資源組織方式,其管理過(guò)程符合知識(shí)管理的一般規(guī)律。LAM重用知識(shí)元的存儲(chǔ)主要包括物理存儲(chǔ)和邏輯存儲(chǔ)兩種方式。物理存儲(chǔ)是指將抽取出的知識(shí)元存儲(chǔ)到具體的知識(shí)庫(kù)中,并通過(guò)語(yǔ)義標(biāo)簽等方式提供檢索等服務(wù)。邏輯存儲(chǔ)是指只存儲(chǔ)知識(shí)元與具體資源之間的關(guān)系,如知識(shí)元分布于哪個(gè)資源之中、它與其他知識(shí)元之間的關(guān)系等。對(duì)于LAM知識(shí)重用的具體目的來(lái)說(shuō),合理的知識(shí)存儲(chǔ)方式將兩者有機(jī)結(jié)合起來(lái),共同構(gòu)建核心的知識(shí)元網(wǎng)絡(luò)。另外,還應(yīng)充分利用關(guān)聯(lián)關(guān)系將知識(shí)元網(wǎng)絡(luò)和基礎(chǔ)資源網(wǎng)絡(luò)結(jié)合起來(lái),形成統(tǒng)一的有機(jī)資源體系。
對(duì)于外圍的可擴(kuò)展性資源來(lái)說(shuō),主要提供相應(yīng)的資源鏈接即可,如通過(guò)關(guān)聯(lián)數(shù)據(jù)、用戶提供的關(guān)聯(lián)關(guān)系等將外圍的資源引入進(jìn)來(lái),作為L(zhǎng)AM知識(shí)重用體系的有益參考。
LAM知識(shí)重用所基于的不同層次可以提供不同層次的資源服務(wù),服務(wù)模式的設(shè)計(jì)需要考慮三者的協(xié)同問(wèn)題,以為用戶提供更為豐富的知識(shí)重用渠道,提供更為全面的具有個(gè)性化的服務(wù)方式。
不同類型知識(shí)體系的共享方式也存在很大差異,如,有學(xué)者在并行計(jì)算方面構(gòu)建了OpenKFramework方案,[7]施星國(guó)等探討了基于情境的知識(shí)重用模式。[8]雖然部分上述成果可以應(yīng)用于LAM知識(shí)重用過(guò)程,但由于LAM知識(shí)的特征,其重用機(jī)制又有很大不同,需要單獨(dú)分析。LAM重用機(jī)制為其重用過(guò)程提供了整體邏輯框架,LAM知識(shí)重用機(jī)制包括檢索、使用、創(chuàng)新、添加、再使用等基本環(huán)節(jié),這些環(huán)節(jié)構(gòu)成一個(gè)循環(huán)過(guò)程,這一循環(huán)過(guò)程同時(shí)也是LAM可共享知識(shí)集合不斷發(fā)展的動(dòng)態(tài)演化過(guò)程(見圖4)。
圖4 LAM知識(shí)重用機(jī)制
本文主要以協(xié)同編輯關(guān)聯(lián)表法為例來(lái)探討LAM的知識(shí)重用機(jī)制。① 在LAM資源體系基礎(chǔ)上形成兩層資源網(wǎng)絡(luò):知識(shí)元網(wǎng)絡(luò)和基礎(chǔ)資源網(wǎng)絡(luò)。用戶首先對(duì)整個(gè)資源體系進(jìn)行檢索,檢索字段被同時(shí)送往兩個(gè)資源層并產(chǎn)生兩種檢索結(jié)果,如圖4所示。兩種檢索結(jié)果屬于兩種形態(tài),一種以資源元數(shù)據(jù)描述為單位,另一種以知識(shí)元為單位。用戶可以根據(jù)兩層網(wǎng)絡(luò)進(jìn)行相關(guān)資源的擴(kuò)展瀏覽。② 用戶需要對(duì)檢索結(jié)果進(jìn)行綜合處理,尋找其真正所需要的知識(shí)以供使用。在使用的過(guò)程中,用戶頭腦中的隱性知識(shí)可以通過(guò)協(xié)同編輯關(guān)聯(lián)表顯性化。協(xié)同編輯關(guān)聯(lián)表是一種供多用戶協(xié)同編輯的表格,該表格能夠記錄資源之間的關(guān)聯(lián)關(guān)系,為用戶頭腦中隱性知識(shí)的顯性化提供了一種渠道。用戶1在使用某知識(shí)的時(shí)候,很可能想到了另外一個(gè)相關(guān)知識(shí),如在圖書中閱讀一段關(guān)于“遼沈戰(zhàn)役”的文字,便聯(lián)想到相關(guān)檔案資源,于是他可以利用協(xié)同編輯關(guān)聯(lián)表建立這段文字和相關(guān)檔案文物或某段視頻影像之間的關(guān)聯(lián)。這些在使用中建立的關(guān)聯(lián)關(guān)系被保存下來(lái),可以被下一個(gè)用戶參照使用。另外,協(xié)同編輯關(guān)聯(lián)表還為用戶提供了新產(chǎn)生知識(shí)的接口,用戶可以把頭腦中的知識(shí)記錄下來(lái),并作為相關(guān)資源的有效補(bǔ)充。③ 除用戶協(xié)同編輯關(guān)聯(lián)表的方法之外,還有很多隱性知識(shí)顯性化的方法和途徑,如Walden’s path 機(jī)制[9]、Annotation thread 機(jī)制。[10]通過(guò)上述方法用戶在使用知識(shí)的過(guò)程中實(shí)際上也是進(jìn)行知識(shí)的創(chuàng)新活動(dòng),這些新產(chǎn)生的知識(shí)將被加入到原有資源體系之中,豐富和完善LAM可重用知識(shí),這樣構(gòu)成了LAM知識(shí)重用過(guò)程的第一次循環(huán)。④ 用戶2繼續(xù)用戶1的循環(huán),但是其使用過(guò)程中所面對(duì)的知識(shí)資源體系是不同的,因?yàn)檫@時(shí)的資源集已經(jīng)加入了用戶1貢獻(xiàn)的內(nèi)容,用戶1所產(chǎn)生的知識(shí)能夠直接被用戶2檢索重用。同樣用戶2在使用知識(shí)的時(shí)候,仍然可以通過(guò)協(xié)同編輯關(guān)聯(lián)表繼續(xù)貢獻(xiàn)頭腦中的隱性知識(shí),進(jìn)一步完成知識(shí)創(chuàng)造,用戶2使用重用知識(shí)的同時(shí)新的知識(shí)又被添加到已有資源體系之中。同樣用戶3、用戶4等其他用戶會(huì)繼續(xù)這樣的循環(huán),使已有資源體系不斷豐富,呈現(xiàn)開放性和動(dòng)態(tài)性。另外,利用協(xié)同編輯關(guān)聯(lián)表,不同用戶之間可以取得聯(lián)系,從而進(jìn)一步形成基于知識(shí)的社會(huì)網(wǎng)絡(luò),促進(jìn)知識(shí)創(chuàng)新。
服務(wù)將資源和用戶連接在一起,服務(wù)模式的設(shè)計(jì)在很大程度上決定著資源價(jià)值的發(fā)揮水平,以及用戶的最終滿意程度。另外,服務(wù)模式本身還承擔(dān)著資源組織的作用,它同時(shí)為用戶提供資源組織與處理的窗口。服務(wù)模式的設(shè)計(jì)與具體項(xiàng)目及其擁有的資源集緊密相關(guān),但LAM知識(shí)重用系統(tǒng)的服務(wù)模式設(shè)計(jì)具有一些共通之處。① 知識(shí)資源體系包括兩個(gè)核心層次,因此對(duì)檢索結(jié)果也應(yīng)該從兩個(gè)層次同時(shí)展示。② 不同層次的資源構(gòu)成各自的網(wǎng)絡(luò),因而服務(wù)模式應(yīng)該從兩層次提供資源網(wǎng)絡(luò)的遍歷。③ 服務(wù)模式需要提供資源系統(tǒng)編輯的窗口和路徑。LAM知識(shí)的重用,意味著用戶在使用資源的過(guò)程中,同時(shí)在和資源進(jìn)行交互,服務(wù)模式設(shè)計(jì)要提供這種交互渠道,并保證資源內(nèi)容本身的質(zhì)量和品質(zhì)。④ 資源的多維度展示。檢索結(jié)果分布在不同的層次,包含在不同的媒體格式之中,因而LAM知識(shí)重用過(guò)程中需要能夠?qū)⒉煌襟w格式的資源靈活地展示出來(lái)。⑤ 服務(wù)模式也是一種價(jià)值再創(chuàng)造過(guò)程。在原有知識(shí)集合的基礎(chǔ)上,可以通過(guò)個(gè)性化服務(wù)方式進(jìn)一步進(jìn)行價(jià)值創(chuàng)造,豐富用戶體驗(yàn),提升整個(gè)LAM知識(shí)重用系統(tǒng)的新穎性和友好性。
LAM知識(shí)重用的根本價(jià)值和動(dòng)力來(lái)源于三者資源的內(nèi)在稟賦,并通過(guò)重用機(jī)制將LAM知識(shí)的價(jià)值源源不斷地發(fā)揮出來(lái),但是其價(jià)值的最終發(fā)揮還需要以具體的服務(wù)模式作為媒介。另外,服務(wù)模式的設(shè)計(jì)同樣也是一種創(chuàng)造價(jià)值的過(guò)程,能夠進(jìn)一步提升LAM知識(shí)重用體系的內(nèi)涵與價(jià)值。
本文以LAM資源的特征為基礎(chǔ),按照“資源分析-組織模式-重用機(jī)制-服務(wù)模式”的邏輯主線,系統(tǒng)詳細(xì)地探討了LAM知識(shí)的重用問(wèn)題。LAM資源的內(nèi)在特征決定了其層次化的知識(shí)組織結(jié)構(gòu),通過(guò)三個(gè)層次的組織架構(gòu)能夠更好地將LAM資源所深藏的知識(shí)組織起來(lái),構(gòu)建有助于知識(shí)重用的包含不同粒度網(wǎng)絡(luò)的資源體系。文中對(duì)不同層次可重用知識(shí)分別進(jìn)行了模式和方法上的探討,通過(guò)具體的模式和方法的設(shè)計(jì)旨在實(shí)現(xiàn)整個(gè)LAM知識(shí)體系的可重用性、資源的自組織性以及開放性,并且充分關(guān)注對(duì)專家頭腦中隱性知識(shí)的挖掘和存儲(chǔ),使整個(gè)知識(shí)體系在使用的具體過(guò)程中不斷豐富和完善。最后,LAM知識(shí)重用體系的價(jià)值必須通過(guò)服務(wù)模式才能發(fā)揮出來(lái),服務(wù)模式需要兼顧資源和用戶,同樣服務(wù)過(guò)程也是一種價(jià)值再創(chuàng)造過(guò)程,是LAM知識(shí)重用體系的有機(jī)組成部分。因此,在LAM知識(shí)組織結(jié)構(gòu)的基礎(chǔ)上,構(gòu)建了顧及資源特征,并為用戶提供與資源深度交互,能夠?qū)㈦[性知識(shí)顯性化的服務(wù)模式,充分發(fā)揮了LAM知識(shí)的可重用價(jià)值,提高用戶滿意度。