摘 要:在互聯(lián)網(wǎng)發(fā)達(dá)和信息膨脹的時(shí)代,文獻(xiàn)信息數(shù)量激增、多維屬性特征和信息之間的隱含關(guān)系等問(wèn)題增加了科研用戶文獻(xiàn)信息理解的難度,文獻(xiàn)信息管理成為學(xué)術(shù)界關(guān)注的問(wèn)題。本文著眼于文獻(xiàn)信息管理的視覺(jué),從文獻(xiàn)信息的網(wǎng)絡(luò)收集和提取入手,利用網(wǎng)絡(luò)可視化工具,研究文獻(xiàn)信息管理的網(wǎng)絡(luò)可視化作用機(jī)理,構(gòu)建了文獻(xiàn)信息傳遞對(duì)網(wǎng)絡(luò)可視化影響框架,進(jìn)一步探討了網(wǎng)絡(luò)可視化促進(jìn)文獻(xiàn)信息管理的積極作用,從而說(shuō)明網(wǎng)絡(luò)可視化在文獻(xiàn)信息管理中的重要性。本文的研究結(jié)果豐富了現(xiàn)有的文獻(xiàn)信息管理體系。
關(guān)鍵詞:網(wǎng)絡(luò)可視化;信息管理;網(wǎng)絡(luò)信息
0 引言
文獻(xiàn)信息管理是圖書(shū)情報(bào)領(lǐng)域研究的重要部分,在信息管理和情報(bào)研究等方面發(fā)揮了積極作用[1-3]。在互聯(lián)網(wǎng)環(huán)境下,管理者通過(guò)系統(tǒng)的信息收集、提取、加工和分析,利用網(wǎng)絡(luò)資源,整合文獻(xiàn)信息資源,形成文獻(xiàn)信息管理系統(tǒng),應(yīng)用多種方式從多個(gè)維度動(dòng)態(tài)的追蹤文獻(xiàn)信息,發(fā)揮文獻(xiàn)信息管理作用,從而滿足科研用戶需求并為科研管理和咨詢服務(wù)。文獻(xiàn)信息管理工作的最終目標(biāo)是任何人在任何時(shí)候、任何地點(diǎn),均可從任一文獻(xiàn)信息源獲得任何文獻(xiàn)信息資源。經(jīng)過(guò)近一個(gè)世紀(jì)的發(fā)展,文獻(xiàn)信息管理被廣泛應(yīng)用于多個(gè)研究領(lǐng)域,并形成了特有的研究體系。
文獻(xiàn)數(shù)據(jù)具有多樣化特征,主要來(lái)源于圖書(shū)、學(xué)術(shù)期刊、學(xué)位論文、專利等,是文獻(xiàn)信息管理研究的基礎(chǔ)[4]。隨著科學(xué)技術(shù)和創(chuàng)新知識(shí)體系的發(fā)展,文獻(xiàn)數(shù)量呈現(xiàn)幾何倍數(shù)的增長(zhǎng)。由于互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,文獻(xiàn)呈多樣化形式,越來(lái)越多的文獻(xiàn)以電子文件、文本文件等形式出現(xiàn)在網(wǎng)絡(luò)上。面對(duì)如此龐大的文獻(xiàn)數(shù)據(jù),人工收集文獻(xiàn)信息已經(jīng)變得如此繁瑣和困難。與此同時(shí),互聯(lián)網(wǎng)技術(shù)為文獻(xiàn)信息收集提供了便利。對(duì)文獻(xiàn)信息歸納、總結(jié)、分類等,利用計(jì)量方法將其轉(zhuǎn)化為文獻(xiàn)數(shù)據(jù)。但是,由于有效信息提取難度大,人們無(wú)法直接獲知龐大數(shù)據(jù)中隱含的信息和未被認(rèn)知的知識(shí)。如何從海量的、復(fù)雜的文獻(xiàn)數(shù)據(jù)中提取有效信息成為文獻(xiàn)計(jì)量學(xué)待解決的問(wèn)題。數(shù)據(jù)處理技術(shù)在不斷的發(fā)展以適應(yīng)時(shí)代的需求,且在處理海量數(shù)據(jù)方面獲得突破性進(jìn)展[5]。科研人員通過(guò)數(shù)據(jù)處理技術(shù)獲取文獻(xiàn)數(shù)據(jù)包含的信息規(guī)律和知識(shí)結(jié)構(gòu)。
網(wǎng)絡(luò)可視化技術(shù)作為信息可視化的一種,利用人類視覺(jué)感知,直觀地展示文獻(xiàn)信息多元要素的內(nèi)在聯(lián)系,從而解釋網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)隱含的語(yǔ)義信息,揭示隱藏在數(shù)據(jù)背后的知識(shí)結(jié)構(gòu)[6,7]。隨著信息技術(shù)在文獻(xiàn)信息管理領(lǐng)域的應(yīng)用,文獻(xiàn)互引網(wǎng)絡(luò)、科研人員合著等數(shù)據(jù)越來(lái)越多,傳統(tǒng)的表達(dá)方式無(wú)法充分展現(xiàn)信息關(guān)聯(lián)的網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)可視化借助文獻(xiàn)計(jì)量學(xué)方法將龐大的文獻(xiàn)信息要素及要素間關(guān)系進(jìn)行圖形展示,從而揭示特定主題、研究熱點(diǎn)、發(fā)展趨勢(shì)等問(wèn)題,有助于理清文獻(xiàn)信息的知識(shí)脈絡(luò)、分析知識(shí)結(jié)構(gòu)的演化過(guò)程,輔助科研人員對(duì)文獻(xiàn)信息進(jìn)行管理和評(píng)估,有助于預(yù)測(cè)未來(lái)發(fā)展[8,9]。
本文圍繞文獻(xiàn)信息管理的網(wǎng)絡(luò)可視化技術(shù),著重分析網(wǎng)絡(luò)可視化方法的作用機(jī)理。文獻(xiàn)信息的網(wǎng)絡(luò)可視化一直是可視化研究中的熱門(mén)問(wèn)題,受到了國(guó)內(nèi)外學(xué)者廣泛關(guān)注。本文以文獻(xiàn)信息管理和認(rèn)知科學(xué)為基礎(chǔ),針對(duì)科技文獻(xiàn)的自有特征和本質(zhì)屬性,利用文獻(xiàn)計(jì)量學(xué)方法,探索網(wǎng)絡(luò)可視化在文獻(xiàn)信息管理領(lǐng)域的系統(tǒng)研究,為網(wǎng)絡(luò)可視化在文獻(xiàn)信息管理領(lǐng)域的科學(xué)實(shí)踐提供理論指導(dǎo),促進(jìn)文獻(xiàn)信息管理水平的全方位提升。
1 文獻(xiàn)信息提取研究
隨著互聯(lián)網(wǎng)的普及,文獻(xiàn)信息存儲(chǔ)方式由傳統(tǒng)的儲(chǔ)存轉(zhuǎn)變到網(wǎng)絡(luò)存儲(chǔ)。專業(yè)學(xué)術(shù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)通過(guò)科學(xué)數(shù)據(jù)存儲(chǔ)與文獻(xiàn)資料庫(kù)的資源整合實(shí)現(xiàn)了電子文獻(xiàn)和傳統(tǒng)文獻(xiàn)的關(guān)聯(lián)[8]。網(wǎng)絡(luò)數(shù)據(jù)庫(kù)為文獻(xiàn)信息存儲(chǔ)提供了平臺(tái)。當(dāng)前,學(xué)術(shù)機(jī)構(gòu)購(gòu)買了學(xué)術(shù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù),科研用戶通過(guò)指定查詢渠道能夠獲取文獻(xiàn)信息。學(xué)術(shù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中文獻(xiàn)信息以不同形式在網(wǎng)頁(yè)上顯示出來(lái)。此外,科技文獻(xiàn)官方網(wǎng)站、第三方信息檢索平臺(tái)、研究機(jī)構(gòu)的信息管理系統(tǒng)等為文獻(xiàn)數(shù)據(jù)網(wǎng)絡(luò)化提供了數(shù)據(jù)來(lái)源。但是,不同的文獻(xiàn)信息系統(tǒng)沒(méi)有統(tǒng)一標(biāo)準(zhǔn),并且不同國(guó)家和區(qū)域?qū)萍嘉墨I(xiàn)出版物管理要求不一致。因此。到目前為止沒(méi)有統(tǒng)一的文獻(xiàn)信息管理系統(tǒng)??蒲杏脩敉ㄟ^(guò)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、網(wǎng)站等收集科學(xué)研究所需的文獻(xiàn)信息,并分析文獻(xiàn)信息獲取知識(shí)信息、研究科技動(dòng)態(tài)以滿足科研需求,為文獻(xiàn)信息管理提供決策支持建議。在信息化時(shí)代,文獻(xiàn)信息是對(duì)文獻(xiàn)數(shù)量、屬性、特征和相互關(guān)系的概括,作為一種社會(huì)資源受到廣泛的關(guān)注[10]。如何通過(guò)網(wǎng)絡(luò)提取有效的文獻(xiàn)信息是科學(xué)研究的重要組成部分。
經(jīng)過(guò)半個(gè)世紀(jì)的發(fā)展,文獻(xiàn)信息提取技術(shù)經(jīng)歷了從自然語(yǔ)言中獲取結(jié)構(gòu)化的信息到從互聯(lián)網(wǎng)的網(wǎng)頁(yè)中獲取結(jié)構(gòu)化或者非結(jié)構(gòu)化信息的過(guò)程,由此出現(xiàn)了多種文獻(xiàn)提取方法。基于自然語(yǔ)言的信息提取方法[11,12]、基于本體的信息提取方法[13]、基于隱形馬爾科夫的信息提取方法[14]和基于DOM樹(shù)結(jié)構(gòu)的方法[15,16]是常用的網(wǎng)絡(luò)信息提取方法。雖然這些方法大大提高了文獻(xiàn)信息提取效率,并擴(kuò)大文獻(xiàn)信息提取范圍,但是這五種方法在提取網(wǎng)絡(luò)文獻(xiàn)信息過(guò)程中存在不同方面的缺陷,分別表現(xiàn)在,大量不完整信息被采集、不適用于新生領(lǐng)域的文獻(xiàn)信息提取、模型參數(shù)設(shè)置需要花費(fèi)較高的人力和無(wú)關(guān)噪聲信息被提取。文獻(xiàn)信息提取的基本步驟如下,首先,對(duì)學(xué)術(shù)信息的結(jié)果進(jìn)行收集和歸納;其次,提取符合需求的信息[12,15]。因此,有序的信息提取操作步驟保障了文獻(xiàn)數(shù)據(jù)的精準(zhǔn)性。
隨著研究的深入,自動(dòng)化、智能化文獻(xiàn)信息提取方式不斷出現(xiàn)。計(jì)算機(jī)技術(shù)的發(fā)展為從互聯(lián)網(wǎng)中提取文獻(xiàn)信息提供了便利。借助計(jì)算機(jī)技術(shù),國(guó)外研發(fā)機(jī)構(gòu)開(kāi)發(fā)了網(wǎng)絡(luò)信息提取系統(tǒng),例如,SRI機(jī)構(gòu)開(kāi)發(fā)的FASTUS 系統(tǒng),BBN公司的SIFT系統(tǒng)和美國(guó)紐約大學(xué)的Proteus系統(tǒng)被應(yīng)用于網(wǎng)絡(luò)信息提取。這些系統(tǒng)在信息提取方面具有通用性,但是這些系統(tǒng)依賴于網(wǎng)頁(yè)結(jié)構(gòu)化。對(duì)于非結(jié)構(gòu)化網(wǎng)頁(yè),這些系統(tǒng)提取信息的效率較低。
上述研究是關(guān)于網(wǎng)絡(luò)信息提取方法在文獻(xiàn)信息管理領(lǐng)域的應(yīng)用,文獻(xiàn)信息提取為研究網(wǎng)絡(luò)可視化提供了一個(gè)數(shù)據(jù)集。提取到的文獻(xiàn)信息用計(jì)量學(xué)方法進(jìn)行處理后得到這個(gè)數(shù)據(jù)集,即文獻(xiàn)信息被轉(zhuǎn)換成一個(gè)數(shù)據(jù)集。這個(gè)數(shù)據(jù)集包含了大量信息,覆蓋了文獻(xiàn)信息的多個(gè)方面。網(wǎng)絡(luò)數(shù)據(jù)提取文獻(xiàn)信息的方法被廣泛用于科技評(píng)價(jià)和科研管理中,實(shí)現(xiàn)了文獻(xiàn)信息的有效采集,有助于信息共享,為科研數(shù)據(jù)采集提供了便利條件。
2 網(wǎng)絡(luò)可視化作用機(jī)理分析
網(wǎng)絡(luò)可視化本質(zhì)是將抽象的、難以理解的、復(fù)雜結(jié)構(gòu)的文獻(xiàn)數(shù)據(jù)以圖形或圖像展示出來(lái),作為協(xié)助科研用戶了解知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)并發(fā)現(xiàn)隱含文獻(xiàn)信息的一種方式。網(wǎng)絡(luò)可視化利用人類視覺(jué)系統(tǒng)對(duì)圖形或圖像識(shí)別能力,達(dá)到快速理解和認(rèn)知文獻(xiàn)數(shù)據(jù)的目的。信息可視化理論是網(wǎng)絡(luò)可視化理論基礎(chǔ)[17,18]。在信息技術(shù)不斷發(fā)展的背景下,文獻(xiàn)信息管理與文獻(xiàn)管理需求之間的矛盾不斷升級(jí)。網(wǎng)絡(luò)可視化能夠提升信息認(rèn)知效率,因此,網(wǎng)絡(luò)可視化為文獻(xiàn)信息管理的重要內(nèi)容和新發(fā)展趨勢(shì),并且具有綜合化、網(wǎng)絡(luò)化和復(fù)雜化趨勢(shì)[19]。網(wǎng)絡(luò)可視化以計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù)為基礎(chǔ),把提取的文獻(xiàn)信息轉(zhuǎn)化為數(shù)據(jù)集通過(guò)信息處理和編碼技術(shù)以多維圖形形式展示出來(lái),從而將所需的知識(shí)結(jié)構(gòu)從海量的數(shù)據(jù)里識(shí)別出來(lái)。這是一個(gè)文獻(xiàn)信息傳遞的過(guò)程。
如圖1所示,從文獻(xiàn)信息傳遞過(guò)程來(lái)說(shuō),可以從網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)媒介、文獻(xiàn)信息收集和網(wǎng)絡(luò)可視化這條路徑入手。圖1的上半部分是網(wǎng)絡(luò)可視化的基本步驟,下半部分是文獻(xiàn)信息數(shù)據(jù)挖掘過(guò)程,作為文獻(xiàn)信息傳遞的非逆向路徑,可以發(fā)現(xiàn)文獻(xiàn)信息數(shù)據(jù)處理流程,結(jié)合美學(xué)布局要求將節(jié)點(diǎn)和邊放置在合適位置,從而使網(wǎng)絡(luò)結(jié)構(gòu)以科學(xué)的、合理的方式展示出來(lái),進(jìn)而解讀文獻(xiàn)信息的知識(shí)結(jié)構(gòu),引導(dǎo)文獻(xiàn)信息有效傳遞。文獻(xiàn)信息在正向傳遞中流動(dòng),實(shí)現(xiàn)從文獻(xiàn)信息到知識(shí)結(jié)構(gòu)解讀之間的協(xié)調(diào)運(yùn)轉(zhuǎn)。
結(jié)合圖1中信息傳遞過(guò)程,接下來(lái)闡述網(wǎng)絡(luò)可視化影響路徑。網(wǎng)絡(luò)可視化的信息傳遞過(guò)程涉及到文獻(xiàn)數(shù)據(jù)、網(wǎng)絡(luò)可視化方式、信息接收對(duì)象的認(rèn)知水平和認(rèn)知能力三方面內(nèi)容。也就是,研究人員選定具體的研究對(duì)象,將研究所需文獻(xiàn)信息進(jìn)行收集,通過(guò)網(wǎng)絡(luò)可視化方式向科研用戶展示知識(shí)信息和知識(shí)結(jié)構(gòu)。該流程是文獻(xiàn)信息管理過(guò)程中信息流向的步驟。網(wǎng)絡(luò)可視化方式對(duì)文獻(xiàn)信息管理的影響作用路徑如圖2所示。
在文獻(xiàn)信息傳遞過(guò)程中,網(wǎng)絡(luò)可視化方式展示文獻(xiàn)知識(shí)信息,對(duì)信息資源的傳遞有直接影響。文獻(xiàn)信息表達(dá)方式發(fā)生變化會(huì)影響信息質(zhì)量傳遞,從而干涉科研人員的判斷,直接影響文獻(xiàn)信息管理水平。多種可視化表達(dá)形式和輔助手段將文獻(xiàn)信息生動(dòng)、形象的展示出來(lái),提高科研用戶對(duì)文獻(xiàn)信息的認(rèn)知能力,從而促進(jìn)文獻(xiàn)信息管理的進(jìn)一步提升。文獻(xiàn)信息的網(wǎng)絡(luò)可視化方式有利于海量數(shù)據(jù)、復(fù)雜性研究等問(wèn)題的轉(zhuǎn)化。因此,網(wǎng)絡(luò)可視化是提升文獻(xiàn)信息管理的一種有效途徑。
文獻(xiàn)信息管理的網(wǎng)絡(luò)可視化方式是借助互聯(lián)網(wǎng)媒介或其他載體,通過(guò)科研人員收集-提取-傳遞-利用的過(guò)程,最終實(shí)現(xiàn)信息傳遞與信息管理系統(tǒng)關(guān)聯(lián)。文獻(xiàn)信息屬性和特征分別體現(xiàn)在文獻(xiàn)信息傳遞對(duì)象和傳遞內(nèi)容中,文獻(xiàn)信息質(zhì)量保障信息傳遞的真實(shí)性和準(zhǔn)確性,因此,科研人員需要對(duì)文獻(xiàn)信息進(jìn)行深入分析,使網(wǎng)絡(luò)可視化方式科學(xué)、合理的應(yīng)用于科研人員分析文獻(xiàn)信息,文獻(xiàn)信息對(duì)網(wǎng)絡(luò)可視化影響效果如圖3所示。
在網(wǎng)絡(luò)可視化過(guò)程中,一方面,由于缺乏統(tǒng)一的文獻(xiàn)信息管理管理平臺(tái),文獻(xiàn)信息數(shù)據(jù)來(lái)源于多個(gè)數(shù)據(jù)庫(kù)或網(wǎng)頁(yè)導(dǎo)致大量多源異構(gòu)文獻(xiàn)信息數(shù)據(jù)的存在,因此文獻(xiàn)信息數(shù)據(jù)多樣性和標(biāo)準(zhǔn)不一致的問(wèn)題暴露出來(lái)。另一方面,提取文獻(xiàn)信息在空間和時(shí)間有一定的局限性,文獻(xiàn)信息管理面臨著信息資源開(kāi)發(fā)利用的限制,導(dǎo)致了文獻(xiàn)信息共享能力差和信息挖掘不足。這些因素都影響了網(wǎng)絡(luò)可視化的展示(如圖3所示)。
3 可視化網(wǎng)絡(luò)展示和分析
圖形是表達(dá)信息的一種視覺(jué)語(yǔ)言,在多元信息轉(zhuǎn)換中,圖形能夠憑借直觀、清晰、易懂的優(yōu)勢(shì)成為網(wǎng)絡(luò)可視化的表達(dá)形式。本文研究了網(wǎng)絡(luò)可視化在文獻(xiàn)信息管理中應(yīng)用的機(jī)理,探索網(wǎng)絡(luò)可視化展示。科研人員對(duì)文獻(xiàn)信息進(jìn)行處理,構(gòu)建數(shù)據(jù)集,選取符合需求的數(shù)據(jù)進(jìn)行圖形化展示,即網(wǎng)絡(luò)可視化將繁雜信息用圖形化語(yǔ)言呈現(xiàn)。網(wǎng)絡(luò)可視化是在傳統(tǒng)信息表達(dá)方式上發(fā)展起來(lái)的,同時(shí)保障信息表達(dá)的準(zhǔn)確,成為信息表達(dá)的重要方式[6,17]。
本文借助網(wǎng)絡(luò)可視化工具,通過(guò)網(wǎng)絡(luò)屬性和網(wǎng)絡(luò)特征,構(gòu)建可視化網(wǎng)絡(luò)。從文獻(xiàn)信息資源視覺(jué)而言,網(wǎng)絡(luò)可視化是對(duì)文獻(xiàn)數(shù)據(jù)可視化處理后,從文獻(xiàn)數(shù)據(jù)中獲取文獻(xiàn)信息點(diǎn)及其相互間聯(lián)系的文獻(xiàn)信息結(jié)構(gòu)。具體的過(guò)程是,首先,以網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和網(wǎng)頁(yè)為數(shù)據(jù)源,定義節(jié)點(diǎn)屬性,確立節(jié)點(diǎn)間關(guān)系;然后,利用網(wǎng)絡(luò)表達(dá)方式,直觀的展示信息網(wǎng)絡(luò)結(jié)構(gòu)。其中,節(jié)點(diǎn)間關(guān)系是網(wǎng)絡(luò)屬性的固有特征,因此,網(wǎng)絡(luò)節(jié)點(diǎn)間關(guān)系是不隨網(wǎng)絡(luò)可視化技術(shù)和網(wǎng)絡(luò)可視化方式的變化而改變。網(wǎng)絡(luò)可視化工具是可視化網(wǎng)絡(luò)展示的載體,常用的網(wǎng)絡(luò)可視化工具主要有計(jì)算機(jī)語(yǔ)言(JAVA、Visual Basic、C、Visual C++、VS、FORTRAN等)、編程軟件(R語(yǔ)言、MATLAB等)和專業(yè)的網(wǎng)絡(luò)構(gòu)建工具(iCharts、Fusion Charts Suit XTZ、RAW等)。
可視化網(wǎng)絡(luò)是將文獻(xiàn)信息的關(guān)聯(lián)關(guān)系反映在一個(gè)相互聯(lián)系的網(wǎng)絡(luò)圖中,即一個(gè)圖形中的節(jié)點(diǎn)相互聯(lián)系,構(gòu)成一個(gè)相互作用的網(wǎng)絡(luò)。網(wǎng)絡(luò)屬性的差異直接影響網(wǎng)絡(luò)可視化結(jié)果和網(wǎng)絡(luò)拓?fù)鋵W(xué)屬性。可視化網(wǎng)絡(luò)圖由節(jié)點(diǎn)和節(jié)點(diǎn)間連線兩大要素構(gòu)成。從節(jié)點(diǎn)類別來(lái)說(shuō),可視化網(wǎng)絡(luò)圖包括單元素網(wǎng)絡(luò)圖和多元素網(wǎng)絡(luò)圖;從節(jié)點(diǎn)間連線指向來(lái)說(shuō),可視化網(wǎng)絡(luò)圖分為有向網(wǎng)絡(luò)圖和無(wú)向網(wǎng)絡(luò)圖(如圖4所示)。
可視化網(wǎng)絡(luò)在圖書(shū)情報(bào)領(lǐng)域的應(yīng)用推動(dòng)了文獻(xiàn)信息管理的深化。根據(jù)可視化網(wǎng)絡(luò)圖形,分析某一類別或某一范圍內(nèi)的文獻(xiàn),研究文獻(xiàn)的科學(xué)事實(shí)、概念、原理、定律、公式等理論和方法有機(jī)組合或者主體、客體、媒介等在多維度空間中的趨勢(shì)或動(dòng)態(tài)、相互關(guān)聯(lián)關(guān)系。文獻(xiàn)數(shù)據(jù)的可視化網(wǎng)絡(luò)為文獻(xiàn)信息管理服務(wù)。由于文獻(xiàn)信息管理是一個(gè)復(fù)雜系統(tǒng),有自身特有的屬性和過(guò)程,受到學(xué)科分類、科技水平、社會(huì)需求等多種因素的影響[20]。文獻(xiàn)數(shù)據(jù)的網(wǎng)絡(luò)可視化加深了人們對(duì)復(fù)雜文獻(xiàn)數(shù)據(jù)的認(rèn)知和理解。因此,解讀文獻(xiàn)數(shù)據(jù)的可視化網(wǎng)絡(luò)圖應(yīng)結(jié)合文獻(xiàn)信息的特性,這樣才能為文獻(xiàn)信息管理提供可靠的理論基礎(chǔ)和現(xiàn)實(shí)指導(dǎo)。
4 結(jié)論
在信息時(shí)代,海量文獻(xiàn)數(shù)據(jù)的分析和處理是科研人員面對(duì)的重要問(wèn)題。從這些復(fù)雜、不規(guī)則的文獻(xiàn)文本或者文件中找出有價(jià)值的信息和知識(shí),從而為文獻(xiàn)信息管理服務(wù),是一個(gè)有意義的研究課題。網(wǎng)絡(luò)可視化為文獻(xiàn)數(shù)據(jù)展示提供了技術(shù)支持,被廣泛應(yīng)用于多個(gè)研究領(lǐng)域,并在科學(xué)研究過(guò)程發(fā)揮重要作用[6,19]。為了推廣網(wǎng)絡(luò)可視化應(yīng)用和簡(jiǎn)化網(wǎng)絡(luò)可視化過(guò)程,網(wǎng)絡(luò)可視化軟件提供了信息交互平臺(tái),使科研用戶在不同層面和多個(gè)維度觀察文獻(xiàn)信息的知識(shí)結(jié)構(gòu)。為了進(jìn)一步滿足科研用戶對(duì)文獻(xiàn)信息追蹤的需求,部分網(wǎng)絡(luò)可視化軟件還能提供動(dòng)態(tài)監(jiān)測(cè)功能,使科研用戶隨時(shí)觀察到可視化網(wǎng)絡(luò)圖的結(jié)構(gòu)變化,從而進(jìn)一步提升文獻(xiàn)信息網(wǎng)絡(luò)可視化展示的質(zhì)量。
本文針對(duì)海量文獻(xiàn)數(shù)據(jù)的現(xiàn)狀,給出了網(wǎng)絡(luò)可視化技術(shù)在文獻(xiàn)信息管理中的機(jī)理分析,并闡述了網(wǎng)絡(luò)可視化展示方式。通過(guò)文獻(xiàn)信息的可視化網(wǎng)絡(luò)圖,科研人員發(fā)現(xiàn)文獻(xiàn)信息要素的關(guān)聯(lián)關(guān)系和文獻(xiàn)信息中包含的知識(shí)結(jié)構(gòu)。本文主要著眼于網(wǎng)絡(luò)可視化技術(shù)解決文獻(xiàn)信息管理中的信息展示問(wèn)題,此方法借用計(jì)算機(jī)科學(xué)技術(shù)研究數(shù)據(jù)挖掘的方法,通過(guò)文獻(xiàn)信息提取,對(duì)數(shù)據(jù)進(jìn)行加工和處理。本文利用節(jié)點(diǎn)和連線構(gòu)建網(wǎng)絡(luò)圖,遵循視覺(jué)感知和網(wǎng)絡(luò)構(gòu)建規(guī)則優(yōu)化可視化結(jié)果,形象展示了節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系,從而為文獻(xiàn)信息管理服務(wù),豐富文獻(xiàn)信息管理體系。
基金項(xiàng)目:本研究得到2016年度中國(guó)博士后科學(xué)基金項(xiàng)目的資助(項(xiàng)目編號(hào):2016M591265)。
參考文獻(xiàn)
[1] Weingart P. Impact of bibliometrics upon the science system: Inadvertent consequences? [J].Scientometrics, 2005,62(1):117-131.
[2] Adams J. Bibliometrics: The citation game [J]. Nature, 2014,510(7506):470-471.
[3] Xiao Y, Lu L, Liu J, Zhou Z. Knowledge diffusion path analysis of data quality literature: A main path analysis [J]. Journal of Informetrics, 2014,8(3):594-605.
[4] Pooladian A, Borrego ?. A longitudinal study of the bookmarking of library and informationscience literature in mendeley [J]. Journal of Informetrics, 2016,10(4):1135-1142.
[5] Chen H, Chiang RHL, Storey VC. Business intelligence and analytics: From big data to big impact [J].Mis Quarterly, 2012,36(4):1165-1188.
[6] Xia M, Wang J, He Y. Brainnet viewer: A network visualization tool for human brain connectomics[J]. PloS one, 2013,8(7):1932-6203.
[7] 毛進(jìn), 李綱. 一種基于OKM的研究領(lǐng)域?qū)<覉D譜構(gòu)建方法 [J]. 圖書(shū)情報(bào)工作, 2014,58(14):34-40.
[8] 陳葉葉, 周通. 國(guó)內(nèi)網(wǎng)絡(luò)輿情治理研究的可視化分析——基于科學(xué)知識(shí)圖譜的方法(CNKI) [J]. 情報(bào)科學(xué), 2016,34(11):101-106.
[9] Salavert F, Garcíaalonso L, Sánchez R, et al. Web-based network analysis and visualization usingcellmaps [J]. Bioinformatics, 2016,32(19):3041-3043.
[10] 丁敬達(dá), 朱夢(mèng)月. 信息管理學(xué)科計(jì)量學(xué)研究的新突破——評(píng)邱均平教授等著的《知識(shí)計(jì)量學(xué)》[J]. 圖書(shū)情報(bào)工作, 2014,58(22):146-148.
[11] 盧延鑫. 基于自然語(yǔ)言處理技術(shù)的循證醫(yī)學(xué)信息提取研究[D]. 復(fù)旦大學(xué), 2011.
[12] Nath C, Albaghdadi MS, Jonnalagadda SR. A natural language processing tool for large-scale dataextraction from echocardiography reports [J]. PloS one, 2016,11(4):1932-6203.
[13] 司成, 張紅旗, 汪永偉, 楊英杰. 基于本體的網(wǎng)絡(luò)安全態(tài)勢(shì)要素知識(shí)庫(kù)模型研究 [J]. 計(jì)算機(jī)科學(xué),2015,42(5):173-177.
[14] Ghamisi P, Benediktsson JA, Ulfarsson MO. Spectral–spatial classification of hyperspectral imagesbased on hidden markov random fields [J]. IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2565-2574.
[15] 朱學(xué)芳, 馮曦曦. 基于文本內(nèi)容的農(nóng)業(yè)網(wǎng)頁(yè)信息抽取和分類研究 [J]. 情報(bào)科學(xué), 2012,30(7):1012-1015.
[16] 馬金娜. 基于DOM樹(shù)節(jié)點(diǎn)重要度的Web主題信息提取研究[D]. 西南大學(xué), 2016.
[17] 楊良斌, 周新麗, 劉益佳, 胡林莉, 曾錦霖. 近10年來(lái)國(guó)際網(wǎng)絡(luò)安全領(lǐng)域研究現(xiàn)狀與趨勢(shì)的可視化分析 [J]. 情報(bào)雜志, 2017,36(1):92-100.
[18] 尹麗春, 殷福亮, 姜春林, 王友強(qiáng). 基于CSCD和SCI的跨省區(qū)科學(xué)合作網(wǎng)絡(luò)可視化分析 [J]. 圖書(shū)情報(bào)工作, 2007,51(8):62-64.
[19] 梁艷琪, 彭博, 高勁松. 基于JASIS的科研合著網(wǎng)絡(luò)可視化研究 [J]. 情報(bào)雜志, 2015,34(8):87-91.
[20] Galliers RD, Leidner DE. Strategic information management: Challenges and strategies inmanaging information systems [M]. Routledge, 2014.
作者簡(jiǎn)介
宋鴻芳,1983年生,女,博士,博士后,研究方向:文獻(xiàn)計(jì)量,科技評(píng)價(jià)。