李雁鳴
摘 要:文獻計量作為量化情報信息的重要手段,在科研評價、館藏核心測定、前沿發(fā)展方面發(fā)揮著重要作用。本文從文獻計量的特性出發(fā),研究了數(shù)據(jù)可視化技術、語義處理技術、文獻計量與信息檢索整合三個方面的研究技術展望,探討了文獻計量在我國現(xiàn)階段圖書情報領域中核心期刊測定、熱點研究、科學評價、館藏建設四個方面的應用,為我國提高圖書情報工作質量提供了很多幫助。
關鍵詞:量化;文獻計量;應用
一、文獻計量研究背景與研究意義
文獻計量由文獻學發(fā)展而來,從最初比較出版物、統(tǒng)計書目到采用統(tǒng)計學計算方法、整合文獻事實研究及計量表征,發(fā)展到涵蓋情報信息分布層次、數(shù)量變化、規(guī)律測試的指導、探討科研熱點、結構、特征的學科。我國文獻計量起步于上世紀六十年代,發(fā)展于八十年代后期,經(jīng)過數(shù)十年發(fā)展,基本形成了符合我國科研環(huán)境的文獻計量理論、方法、實踐經(jīng)驗的知識體系,為我國情報信息處理提供了有力支撐,成為圖書情報與科學評價領域中一個重要的分支學科。
文獻計量通過探索與完善表征詞頻分布或文獻分散規(guī)律的實踐方法,實現(xiàn)數(shù)學、統(tǒng)計、文獻學的有機結合,將文獻評價、出版物確定、文獻利用率等機能日益完善,為實現(xiàn)圖書情報的科學管理提供了有利條件。文獻計量對實現(xiàn)情報網(wǎng)絡建設、情報處理效率、文獻服務利弊等方面的提升產(chǎn)生深遠影響。但隨著近年來圖書情報領域不斷發(fā)展,尤其當前 “大數(shù)據(jù)”、云計算、人工智能成為研究熱點,呈現(xiàn)的文獻數(shù)量以指數(shù)型增長,文獻系統(tǒng)固有的不確定因素日益凸顯,造成我國現(xiàn)階段圖書情報工作仍存在宏觀定律依賴數(shù)學統(tǒng)計,微觀依賴同行評價的舊弊,影響到學科評價的客觀性。在此種情形下,如何正確地評價分析文獻計量在圖書情報領域的應用,充分發(fā)揮文獻計量的優(yōu)勢,以量化指標全面評價某領域科研效率、研究能力、挖掘深度,實現(xiàn)數(shù)學理論與方法運用相結合,以定性過渡到定量,以科學方法探尋情報信息本質,從而提升我國圖書情報信息分析質量。
二、文獻計量在圖書情報特性研究
當前,我國文獻計量學研究范圍已涉及社會網(wǎng)絡映射、數(shù)據(jù)采集分析、標準制定與研究以及智庫機構量化信息、引文量化分析等,研究方法中可視化、數(shù)據(jù)挖掘技術運用廣泛,文獻計量凸顯技術與定量的實現(xiàn)趨勢,其在圖書情報領域體現(xiàn)以下特點。
1.指示目標的明確性
文獻計量的指示目標必須遵循互斥、排他原則,即構建指示目標的明確性,作為文獻計量指示的基礎,明確性必須根植于情報信息內(nèi)容與分析趨勢,此要求包含以下方面:(1)科學指示,即指標在主題、內(nèi)涵、容量、時間、計算單位、方法有明確的定義與要求,排除可能引發(fā)歧義的概念,以期減少收集數(shù)據(jù)的偏差、誤差;(2)可測量操作,文獻計量認為是一種量化方法,具備工具化、模型化的數(shù)學特點,因此其指標的設定前提必須是直接度量的、滿足一定條件的、排除可能引發(fā)計算方法偏離的值域或閥值;(3)評價導向性,指示目標的學科評價必須具備正確的、同方向、持續(xù)性的引導與鼓勵,計量不是為“文獻打分”,而是歸納文獻的學科發(fā)展,明確學科的導向功能,體現(xiàn)絕對的文獻價值。
2.評價的結構層次性
學科評價是文獻計量的重要功能,智庫機構往往通過學科評價確定該信息的價值導向,而學科評價具備明確指向性的特點。組織作為要素基礎,合理組織并建立評價體系模型至關重要,其關鍵在于模型結構的設計,對結構繼續(xù)分解定義,賦予分層層數(shù)、各層定義和組合因素、層遞關系明確的意義與內(nèi)容。優(yōu)秀的指標評價結構體系必須具備以下特點:(1)層次鮮明,即評價分層分析,因層分析,按層分析,既可以保證評價的嚴謹又能夠保證評價目標及時更新;(2)主題一致性,即整體評價的指標與目標統(tǒng)一,層次目標與指標一致;(3)層次數(shù)量適度,即滿足指標體系的及時創(chuàng)新及完善,層次銜接緊湊,分析內(nèi)容緊密契合,易量化操作;(4)目標完備,即體系結構協(xié)調、齊整,評價目標完整、全面。
3.計量閥值的選擇性
文獻計量過程所設計、選擇的單一指標可能會出現(xiàn)不符合指標原則的情況,出現(xiàn)評價指標的互相矛盾、相互掣肘、交叉、因果等不恰當關系,這種不確定關系給圖書情報工作者造成干擾,嚴重的可能會出現(xiàn)重大決策失誤。因此明確文獻計量的指示目標必須設定一定的閥值、參數(shù)來進行計量選擇。
計量閾值是指量化指標中數(shù)量關系、時間參數(shù)的設定值,即可理解為互斥條件。而科學選擇閾值應綜合考慮學科評價機理、內(nèi)涵因素、特點屬性等方面,學科代表性是當前計量閥值設定的基本思想。閥值設定思路包括:(1)以概念為設定閥值,即概念自身定義所隱藏、表征的數(shù)量、時間參數(shù),如“年份” “關鍵詞”;(2)以參考定理原理為設定閥值。即“影響因子”“期刊比重”所代表的學科核心定義選擇,如“ISTP”“ESI”;(3)以隨機區(qū)間、范圍為設定閥值,即評價的“置信區(qū)間”可以涵蓋足夠的文獻,如“某年份、某國”、前“n%”等區(qū)間參數(shù)。
三、文獻計量主要研究技術與發(fā)展趨勢
1.數(shù)據(jù)可視化技術
數(shù)據(jù)可視化技術是文獻計量過程重要的實現(xiàn)工具,通過文獻計量的引文方法、內(nèi)容分析法、元分析法相融合的途徑,實現(xiàn)了計量數(shù)據(jù)的深度挖掘。根植于數(shù)據(jù)挖掘、文本分解的分析軟件在開發(fā)之初就將計量可視化思想進一步表述,如基于語義計算的Autonomy 軟件,將概念與語義關聯(lián)實現(xiàn)對信息的自動理解,自動篩選聚類信息及超鏈接,其核心IDOL(智能信息操作層),能夠挖掘非結構數(shù)據(jù),實現(xiàn)數(shù)據(jù)積累??梢暬治隹此浦攸c在于利于交互的界面建立,其實核心在于其中的分析手段、數(shù)據(jù)梳理方法,及其相應的計量理論??梢暬夹g幫助用戶從龐大的非結構數(shù)據(jù)中抽脫出來,分離復雜的數(shù)據(jù)關系,理解推理結果及明確策略走向。應當強調的是可視化技術與信息可視化有所區(qū)別,信息可視化僅僅是實現(xiàn)計算機在網(wǎng)絡環(huán)境下自動生成信息交互表現(xiàn)形式的開發(fā)、運用,缺少了可視化分析知識發(fā)現(xiàn)、梳理、甄別的過程,而可視化技術更側重自動分析方法及算法研究。只有可視化技術選擇與恰當信息自動化相結合、相輔助,情報信息的推送才能更好地完成用戶決策。
2.語義處理技術
語義處理技術主要整合信息評價提取、自然語言(NLP)處理建模、AI應用、數(shù)據(jù)庫(DT)等智能處理方法,其主要表現(xiàn)為數(shù)據(jù)表征與涵義提取為機器語言,利用計算機對語言結構進行分析,使得機器能夠識別、理解語言并能夠精確搜索、準確定義。語言處理技術向機器理解數(shù)據(jù)語義、完善語義技術應用范疇、完成結構化的語義數(shù)據(jù)采集分析的方向發(fā)展,語義處理技術成為當前語言處理技術難點,針對現(xiàn)有情報研究對象(核心期刊、專利、專著等文獻)計量,雖已現(xiàn)存較為成熟的分析軟件與工具,可以類聚關聯(lián)鏈接,卻仍舊缺少深層次語義支撐,仍需要耗費較多人力資源對設定進行評價,基于語義處理技術研究支持工具與技術還有提升的空間。
3.基于大數(shù)據(jù)背景下的發(fā)展態(tài)勢
大數(shù)據(jù)技術的蓬勃發(fā)展,打破了情報學信息檢索與文獻計量兩大分支的鴻溝,實現(xiàn)了兩者的并行發(fā)展,信息檢索中的信息查詢技術智能化程度,“關鍵詞”自動化提取能力有著顯著提高,是進一步彌補文獻計量中檢索時間過長缺陷的重要補充手段。信息檢索能夠實現(xiàn)文獻計量全過程的學術信息交互、使用,涵蓋用戶行為中的瀏覽記錄、下載鏈接、期刊收錄、科研評價、學術引用等方面,實現(xiàn)全時期、全空間的計量。大數(shù)據(jù)背景下,信息檢索根植于文獻計量,通過信息檢索能夠保存文獻計量的樣本,自動為文獻計量提取樣本,形成文獻圖譜,促使文獻計量向網(wǎng)絡計算發(fā)展,從而形成指標閥值基于個性化檢索、精確推薦的文獻計量指標體系。
四、現(xiàn)階段文獻計量在我國圖書情報領域的應用
1.在學科核心期刊測定方面的應用
核心期刊代表著某學科科技前沿、研究前站,是該學科專業(yè)情報信息量最豐富、質量最高的主要刊物,是文獻情報最重要的來源。文獻計量在學科核心期刊“量化”“測定”方面應用出現(xiàn)較早,影響較為廣泛,理論較為成熟,期刊測定是文獻計量工具化直接的應用。實踐方面,圖書情報單位建立本機構館藏核心、研究人員科學獲得高質量密度情報源、論文撰寫參閱專業(yè)期刊文獻等文獻引用操作,都離不開核心期刊科學、合理、恰當?shù)販y定與評價。文獻計量為核心期刊測定形成一種普遍、廣泛的評價體系,從早期簡單考慮單因素的百分比法、累計法,到結合論文引用率、利用率的文摘法、引文法,再到具體問題數(shù)據(jù)處理的精確計算法,如權重目標法、“無量綱灰色關聯(lián)法”。例如,“無量綱灰色關聯(lián)法”將“引文量”“摘要詞頻”“流通數(shù)量”進行無量綱化,通過灰色關聯(lián)系數(shù)ξ(Xi)構建灰色關聯(lián)模型,比較研究對象與各影響因素的因子值貼近度,由此貼近度獲得影響因子與待識別對象的關聯(lián)度大小,從而將關聯(lián)度絕對值作為核心期刊的測定值,我們通過絕對值大小來測定該期刊的質量是否滿足評價要求。
2.在熱點研究與科技前沿方面的應用
文獻計量的基礎來源于文獻事實研究,文獻研究古老而生命力頑強,往往帶來新思想、新技術的萌芽,這種萌芽不僅能夠促進學科的正循環(huán)發(fā)展,更能夠進一步演示學科領域的發(fā)展方向。尤其近年來,數(shù)據(jù)庫技術的應用,文獻數(shù)量得到極大豐富,文獻目錄、引文歸集的統(tǒng)計分析方法向計量學方向完善,計量分析在某學科熱點確認、學科研究發(fā)展、學科預測等方面得到有效運用。目前,文獻計量對學科動態(tài)理論、文獻產(chǎn)出率與現(xiàn)階段成果、發(fā)展變化與聯(lián)系、詞頻變化與科技發(fā)展變化關系等進行切實可行、靈活多樣的事實研究,其中包括了對該學科范圍內(nèi)論文、專著數(shù)量、作者分布概型、期刊組成、關鍵詞頻率、時空參數(shù)等全方位、多角度分析,對學科研究現(xiàn)狀及發(fā)展趨勢進行客觀評價。如我國數(shù)字圖書館核心館藏數(shù)據(jù)庫建立研究的論著中,研究者主要利用“SCI”“JCR”等工具,運用“引文”間接分析法,通過引文量化頻次、數(shù)量、刊物來源,由“引文量分布”“引文篇數(shù)分布”獲得引文的集中離散規(guī)律,研究該主題文獻量化規(guī)律及客戶需求規(guī)律,從而為數(shù)字化圖書館核心館藏庫建立提供一定的參考價值。
3.在科研評價的應用
我國定性評價方式長期存在于學科研究過程中,其中同行評議的方式固然有著專業(yè)、權威、隱匿的優(yōu)勢,但主觀性、保守性同樣存在,不利于科研能力的客觀評估。而文獻是學科研發(fā)的事實依據(jù)、固有成果、過程體現(xiàn),基于文獻計量相關理論的“定量”分析,是將文獻產(chǎn)出“數(shù)量”“引文頻次”數(shù)量作為科研評價的量化標準,將作者文獻作為科研產(chǎn)能,文獻引用頻次作為科研質量,在一定范圍內(nèi)提供科研評價參考。隨著影響因子與混合量化指標理念的提出與完善,文獻計量由單一指標,向復合計算演進,通過指數(shù)的量來預測、輔助同行評價,由作者核心論文作品集進行科研能力評估,從而建立起完整的科研評價體系。在科研評價過程中,把文獻作為結構性資源,將其基于一般統(tǒng)計、回歸計算等數(shù)學方法,納入計量系統(tǒng)工程系統(tǒng),糾正單一指標所帶來的評價偏差,把科研團隊、學術期刊績效形成適用性報告,客觀的把期刊影響因子、引文、h指數(shù)有機結合起來,從而形成科學地科研評價結果。
4.在圖書館藏建設中的應用
文獻計量在我國圖書情報的實踐還體現(xiàn)在圖書情報科學分析管理方面,并涉及到圖書科學管理系統(tǒng)的建立,如圖書流量、圖書選訂、館藏定量、流通分析、用戶評價等多個方面,而且館購圖書文獻質量也影響本機構圖書情報資源建設與發(fā)展。圖書館在采購文獻時,可以使用文獻計量中的“引文”法對文獻收集、期刊訂閱、館藏核心進行確認,即通過學科期刊中所內(nèi)含的文獻“引用量”“衰退周期率”進行分析,確定圖書館文獻資源管理內(nèi)容。國內(nèi)眾多高校選擇本校師生論文為研究樣本,統(tǒng)計近年來本校師生發(fā)表的論文中引用的參考文獻,并結合本?,F(xiàn)階段館藏建設,采用“一次引文法”,以期獲得基于本校用戶行為的圖書情報信息,促進館藏更好的建設。館藏建設在核心期刊計量方面,明確文獻知識累積性、發(fā)展性、衰老性,推送給用戶的信息必須是正確的、完整的、匹配的,從而構建基于“數(shù)據(jù)庫資源”匹配的個性化推送模型,進而構建基于文獻計量的“被引分析”“詞頻類聚”“h指數(shù)”的架構模型。同時在情報信息整合方面,圖書館要繼續(xù)關注強化詞頻與自動化標注技術研究,完善定量評價與檢索體系,同時借助大數(shù)據(jù)、云服務、數(shù)字圖書館聯(lián)盟中海量的數(shù)據(jù)進行文獻新整合,全面開展學科方向趨勢與科研決策信息服務,深挖用戶行為信息數(shù)據(jù),推廣科學的文獻服務管理,謀求當前圖書館創(chuàng)新轉型。
五、總結
我國文獻計量學已經(jīng)積累了相當多的理論與實踐經(jīng)驗,文學計量相關應用在圖書情報科學管理方面取得很大的進展,對情報服務實際工作、各圖書情報機構信息處理發(fā)揮了舉足輕重的作用。但是我們應該看到現(xiàn)階段文獻計量中重要的理論指導、重要計量可視化軟件大多為西方國家創(chuàng)建,這就要求我們從國內(nèi)實際出發(fā),腳踏實地研究文獻計量學原理,進一步提升我國現(xiàn)階段文獻計量水平,從而做好新時期圖書情報學應用與管理
工作。
參考文獻:
[1]朱 亮,孟憲學.文獻計量法與內(nèi)容分析法比較研究[J].圖書館工作與研究,2013
[2]董 琳.使用文獻計量法開展學科研究[J].情報雜志,2013
[3]陳廉芳.高校圖書館文獻計量類型梳理與融合策略研究[J]. 圖書館工作與研究,2019
[4]王節(jié)祥,蔡 寧.平臺研究的流派、趨勢與理論框架———基于文獻計量和內(nèi)容分析方法的詮釋[J].商業(yè)經(jīng)濟與管理,2018
(作者單位:棗莊學院)