蘇新寧 朱云霞,2
(1.南京大學(xué)信息管理學(xué)院 江蘇南京 210093)(2.南京郵電大學(xué)計算機學(xué)院 江蘇南京 210042)
學(xué)術(shù)引用體現(xiàn)了學(xué)術(shù)的繼承性,反映了學(xué)術(shù)成果之間的關(guān)聯(lián)性,引用中的細節(jié)信息對我們研究學(xué)科發(fā)展的態(tài)勢,分析學(xué)科研究特點,了解學(xué)術(shù)共同體的研究習(xí)慣,把握不同領(lǐng)域?qū)W術(shù)資源分布和各學(xué)科重要學(xué)術(shù)資源都有著極大的幫助作用。因此,在構(gòu)建引文數(shù)據(jù)的數(shù)據(jù)組織之前,首先應(yīng)當深入分析學(xué)術(shù)引用過程中的各類信息,總結(jié)文獻數(shù)據(jù)所反映出來的特征,探求這些特征所能呈現(xiàn)的規(guī)律,以幫助我們更科學(xué)地組織引文索引,使引文索引在知識服務(wù)中發(fā)揮更大的作用。
伴隨著信息化社會的到來,大量信息產(chǎn)生的同時,人們卻發(fā)現(xiàn)很難從信息中獲得需要的知識。在我國,知識服務(wù)的概念從上世紀90年代初被提出,至今一直都是科技管理領(lǐng)域的研究熱點。張曉林先生在《走進知識服務(wù):尋找新世紀圖書情報工作的生長點》一文中明確提出知識服務(wù)的十項特征,并對知識服務(wù)的運營模式進行了詳細的闡述,為圖書情報領(lǐng)域樹立了新的研究方向。
引文索引是對學(xué)術(shù)引用最有力的表達工具。引文索引的起源可以追溯到1873年美國出版的供律師查閱法律判例的檢索工具《謝潑德引文》。1927年格魯斯等人即采用了引文分析法分析了化學(xué)中某些科技期刊論文的參考文獻。20世紀60年代開始,美國在加菲爾德的帶領(lǐng)下先后研制了 SCI、SSCI、A&HCI等一批優(yōu)秀的引文索引。我國從80年代末期開始陸續(xù)開發(fā)了CSCD、ISTP、CSSCI等引文索引。
在當前知識服務(wù)的大背景下,傳統(tǒng)的引文索引逐漸暴露出功能單一、分析預(yù)測能力缺乏、缺少個性化服務(wù)等不足,對文獻知識服務(wù)工作的開展造成阻礙。因此我們在創(chuàng)建引文索引之前,需要深入分析引用過程中的各項數(shù)據(jù)以及這些數(shù)據(jù)之間的關(guān)聯(lián),挖掘其深層次的含義,充分發(fā)揮各項數(shù)據(jù)的效用。目前國內(nèi)對引用過程中具體信息分析的文章并不多見,且主要是針對文后參考文獻的作用,對其他數(shù)據(jù)的分析則基本沒有涉及。因此筆者希望本文的分析研究能對今后引文索引的開發(fā)與設(shè)計工作提供有益的啟示和幫助。
科學(xué)文獻間的引用與被引用構(gòu)成了一種引證關(guān)系,這種引證關(guān)系不僅體現(xiàn)在文獻之間存在關(guān)聯(lián),其中還蘊含著大量的知識和規(guī)律。本文將從引用關(guān)系中的被引對象、引用形式、引用關(guān)聯(lián)和引用角色四個方面進行闡述。
3.1.1 被引文獻類型分析
圖書情報領(lǐng)域?qū)⑽墨I類型劃分為:圖書、期刊論文、會議論文、學(xué)位論文、報告、報紙、專利、標準、參考工具、網(wǎng)絡(luò)資源等。從學(xué)術(shù)角度來看,每一種類型的文獻都有其鮮明的學(xué)術(shù)特征,例如,網(wǎng)絡(luò)資源(如學(xué)術(shù)博客、學(xué)術(shù)論壇)時效性最快,但其資源的可靠性和真實性又受到一定的質(zhì)疑;論文反映了學(xué)術(shù)熱點和學(xué)術(shù)界關(guān)注的問題,相對圖書而言,出版及時,能更快地反映學(xué)術(shù)研究前沿領(lǐng)域,尤其是會議論文(特別是各領(lǐng)域?qū)W界頂級會議論文)更是各學(xué)術(shù)領(lǐng)域?qū)W術(shù)前沿和重要研究成果的代表;圖書的學(xué)術(shù)性表現(xiàn)在其成果更加成熟;最具權(quán)威性的文獻無疑是標準和政府報告;最具科技創(chuàng)新性的文獻應(yīng)屬專利等等。
另一方面,從被引文獻類型分析也可以發(fā)現(xiàn)不同學(xué)科學(xué)者的閱讀習(xí)慣和他們研究所倚仗的主要學(xué)術(shù)資源,深入分析還可以發(fā)現(xiàn)不同學(xué)科學(xué)者對研究資料獲取手段的差異。正如上段所述,圖書的學(xué)術(shù)觀點相對論文而言更加成熟一些,而論文較圖書體現(xiàn)的是更新的研究成果。因此,可以通過一個學(xué)科或一個領(lǐng)域研究成果引用圖書或論文的比例,考察學(xué)科的成長性、成熟度和活躍度。例如,較人文社會科學(xué)而言,自然科學(xué)整體上發(fā)展迅速,其引用的論文占整個引用文獻的70%以上,而人文社會科學(xué)的引用文獻中55%以上是圖書。如果細致考察各種類型的被引文獻比例,可以驗證許多猜想和發(fā)現(xiàn)學(xué)科更多特征。
通過被引文獻的類型分析,我們可以從被引文獻類型的信息中探究學(xué)科和有關(guān)研究領(lǐng)域的成熟度、發(fā)展趨勢和研究特征,了解學(xué)者對學(xué)術(shù)資源的趨向和獲取手段等,同時還能夠從這類信息中挖掘出尚未被人們意識到的有關(guān)規(guī)律。同樣也可以發(fā)現(xiàn)學(xué)術(shù)研究中的重要文獻(如,對學(xué)術(shù)研究有重要影響的學(xué)術(shù)著作或經(jīng)典著作、高被引論文等)。所以,在引用信息的數(shù)據(jù)組織上我們應(yīng)當關(guān)注被引文獻類型信息的標注和編碼,促進引文索引在知識服務(wù)中發(fā)揮更大作用。
3.1.2 被引文獻語種分析
被引文獻語種是指學(xué)者在研究中引用了哪些語種的文獻,通過被引文獻的語種可以發(fā)現(xiàn)各學(xué)科的學(xué)者對國際研究成果的關(guān)注程度,對國際文獻的獲取能力以及對外語文獻的閱讀能力等等。從學(xué)科角度來看,可以分析學(xué)科或領(lǐng)域研究是否與國外研究接軌,國際上科學(xué)的學(xué)術(shù)理念和研究方法是否被引入到其研究領(lǐng)域。一般說來,國外文獻引用較多的學(xué)科,該學(xué)科研究的發(fā)展較為迅速,與國外研究接軌的能力也越強,學(xué)科地域開放度越大。因此,如果將被引文獻語種在引文索引系統(tǒng)中反映出來,勢必將增加引文索引的效能,使之幫助我們分析各學(xué)科研究的國際化程度。
外文文獻語種眾多,我們不僅要重視主流外語語種(如英、法、德、日、俄等語種),也要關(guān)注其他如斯拉夫語系、阿拉伯語等非主流但在某些研究領(lǐng)域有著重要作用的語種,因為這些語言文獻對學(xué)界研究歷史、民族、宗教等有很大幫助。一般而言,被引文獻語言標注的越全面,其引用分析就能更全面的把握國外各類語種文獻對我國各研究領(lǐng)域的影響。
另外,如果我們從橫向比較學(xué)科,我們了解到各學(xué)科學(xué)者對國外文獻的獲取能力、閱讀能力、關(guān)注度的差異,以提請落后學(xué)科的重視。從縱向角度分析,可以看到各學(xué)科多年來對國外文獻利用的變化軌跡,從這一軌跡中我們也許可以發(fā)現(xiàn)某些學(xué)術(shù)領(lǐng)域非常有價值的信息??傊?,在引用信息的組織上標注語種,并非只是簡單地對被引文獻的語種統(tǒng)計,更重要的是可以從中挖掘隱藏于被引文獻中、具有很大學(xué)術(shù)指導(dǎo)作用的信息。因此,在引文索引的組織中,細致標注語種信息將能從某一角度提升引文索引的知識服務(wù)能力。
在科學(xué)論文的撰寫中,針對引用的文獻有多種形式:①文中注,指作者文章中直接標出引用文章的出處、內(nèi)容和觀點的引用;②腳注,指在文章每頁的底部對文中某些內(nèi)容所做的注釋,一般是解釋說明;③尾注,指在文后給出的引用,和腳注相似,但主要是以參考文獻形式給出。一般來說,三種引用形式各有偏重,文中注主要引用的是一句話或一段文字,引用較為直接,并且與所述內(nèi)容聯(lián)系更加緊密;腳注更側(cè)重于數(shù)據(jù)來源和資料引用;尾注更多的表現(xiàn)為參考文獻。因此,對引用形式的分析,可以探索人們的引用習(xí)慣,發(fā)現(xiàn)學(xué)科之間的引用差異,對規(guī)范學(xué)術(shù)引用有一定的幫助。
從目前的學(xué)者引用來看,許多人易混淆了這三種引用形式。例如,文章的腳注中既有資料來源又有參考文獻,有的甚至在尾注中除了參考文獻外,還有文字解釋性注釋,這些都應(yīng)屬于行文規(guī)范性的缺失。雖然,目前少數(shù)文獻的引用存在一定的不規(guī)范,但我們還是可以從絕大多數(shù)引用中分析出許多端倪。如學(xué)科之間的引用形式差異,歷史學(xué)、古文獻領(lǐng)域較多使用文中注,自然科學(xué)領(lǐng)域主要表現(xiàn)為參考文獻形式(尾注),而社會科學(xué)許多領(lǐng)域則是腳注、尾注均具。
因此,研究引文索引的引用形式的編碼和組織,并通過分析其引用形式,可以探索學(xué)科之間的引用習(xí)慣和差異,發(fā)現(xiàn)學(xué)術(shù)引用中尚不規(guī)范的引用行為,從而促進學(xué)科之間的引用行為趨于規(guī)范和統(tǒng)一。當然,也可以根據(jù)引用形式的數(shù)據(jù)分析,了解各學(xué)科學(xué)者的研究習(xí)慣和引用行為,找到各學(xué)科學(xué)者的引用行為規(guī)律。更重要的是,引用形式的統(tǒng)計分析結(jié)果為學(xué)界提供了又一條知識服務(wù)的新路徑。
文獻的引用行為雖然都是個體行為,但無數(shù)的個體引用行為在無形中卻形成一張龐大的引文網(wǎng)絡(luò),這個網(wǎng)絡(luò)可以為我們探索文獻間的關(guān)系,從而發(fā)現(xiàn)隱藏在引用中對科學(xué)研究和文獻規(guī)律非常有價值的知識。在這個引文網(wǎng)絡(luò)中,大量的文獻存在著關(guān)聯(lián),根據(jù)關(guān)聯(lián)強度和形式,將其分為直接引用、引用耦合和同被引三種類型。不同的關(guān)聯(lián)形式對應(yīng)不同的分析方法,對知識服務(wù)而言也會起到不同的作用。
文獻中的引用在不同程度上反映了文獻間的關(guān)系,這些施引和被引用文獻的聯(lián)系關(guān)系形成了引用網(wǎng)絡(luò),通過這個引用網(wǎng)絡(luò)可以得到與引用相關(guān)的統(tǒng)計、分析和評價數(shù)據(jù),例如文獻被引量、作者被引量、期刊被引量統(tǒng)計等等。文獻的被引量在一定程度上反映了研究成果的科學(xué)價值和學(xué)術(shù)影響,可以根據(jù)被引量對學(xué)術(shù)成果進行評價,同樣可以利用被引量對作者、機構(gòu)、期刊以及國家和地區(qū)的科研狀況、學(xué)術(shù)影響力等進行分析評價。另外,通過引用網(wǎng)絡(luò)的引用鏈我們可以發(fā)現(xiàn)一項研究的來龍去脈和發(fā)展軌跡,根據(jù)網(wǎng)絡(luò)中被引量高的結(jié)點我們可以很方便的得到在某一研究領(lǐng)域的重要或高影響力的文獻。
所謂同被引是指兩篇或多篇論文同時被其他文獻引用的現(xiàn)象,同被引強度一般通過同被引的次數(shù)來測度。同文獻耦合相似,同被引次數(shù)越高的文獻被認為在研究主題和研究內(nèi)容上越接近,文獻的相關(guān)度越高。與引用耦合相比同被引分析更為客觀,因為文獻被引用完全是一種被動性行為,作者本人很難控制,此外引用耦合的強度是固定不變的,同被引強度則具有動態(tài)變化性,因此同被引分析常常用于學(xué)科前沿的探測研究。
值得一提的是,在引文網(wǎng)絡(luò)的構(gòu)建過程中,需注意數(shù)據(jù)匹配的粒度問題。由于參考文獻是由各個作者自己標注的,不可避免的會存在信息誤差,例如書籍改版前后頁碼的不一致,多位作者合著文章被引時作者信息標注的差異問題等等,如果采用細粒度的精確的字符匹配算法,則往往會引起數(shù)據(jù)分析的不準確。因此在對引用網(wǎng)絡(luò)以及引用關(guān)聯(lián)進行分析時,為得到更準確的數(shù)據(jù),既要考慮數(shù)據(jù)的組織問題,也要考慮匹配算法問題,在信息主體一致的情況下,應(yīng)根據(jù)客觀需要,靈活的設(shè)置數(shù)據(jù)匹配的粒度。
根據(jù)作者寫作需要和寫作目的的不同,在引證過程中,引文充當?shù)囊媒巧哺鞑幌嗤?,大體上引用角色可以分為以下四種:①綜述性引用,也稱羅列式引用,作者通過引文列舉出目前的研究現(xiàn)狀,但不表達自己的觀點;②學(xué)術(shù)觀點的引用,是繼承式引用,指作者對該觀點持有贊同意見并在文章中進行表述;③學(xué)術(shù)啟發(fā)式引用,是一種發(fā)展式引用,作者不僅贊同此觀點,而且該觀點對作者新思想的形成具有啟發(fā)意義;④批評性引用,也稱為否定性引用,作者引用文獻的目的是為了批評和否定,繼而提出自己的觀點。
同一文獻中的引文常常具有不同的引用角色,同一篇引文在不同的文獻中也往往會充當不同的被引用角色。通過文獻引用角色的分析,我們同樣可以發(fā)現(xiàn)引用關(guān)系中隱藏的知識。例如,一篇文獻多次作為學(xué)術(shù)啟發(fā)式引用,說明了該文獻具有較高的研究價值,對之后的研究起到重要的啟發(fā)作用;相反,一篇文獻若被多位作者作為批評性引用,說明該文章可能真的存在一些問題。同理,對于學(xué)科分析也是如此,學(xué)術(shù)啟發(fā)式引用多的學(xué)科思維更加活躍,發(fā)展迅速;批評性引用多的學(xué)科則思想對撞激烈,可能存在多個觀點對立的學(xué)派。
引用角色為引文分析提供了新的分析視角,在引文索引中若能對每一篇參考文獻標注其引用角色,則可以利用這些標注信息,分析學(xué)者不同的研究特點、研究習(xí)慣,以及各學(xué)科間的發(fā)展對比,繼而可從更深層面發(fā)現(xiàn)研究領(lǐng)域內(nèi)重要的學(xué)術(shù)文獻,而不是僅僅從文獻的被引次數(shù)來衡量。
在引文分析過程中,不同的分析視角對應(yīng)不同類型的元素,有些元素能夠作為一個獨立的分析對象,并在引用過程中起到主導(dǎo)作用,我們稱之為引用的主體。對引用主體的分析能夠使我們更深入的理解文獻之間的引證關(guān)系,并挖掘出由此產(chǎn)生的多個主體間的關(guān)聯(lián)。
根據(jù)文章的具體內(nèi)容,可以將來源文獻的類型分為研究型、評論型和綜述型三種,進一步細分,研究型文章可分為理論研究和應(yīng)用研究等類型;評論型又可分為學(xué)術(shù)評論、圖書評論和學(xué)術(shù)批評等類型;綜述型可分為會議綜述和學(xué)術(shù)綜述等類型。每種類型都具有其鮮明的特點,從學(xué)科角度來看,我們可以通過對文章類型的統(tǒng)計看出某個學(xué)科的研究特征,如評論型文章較多,說明這一學(xué)科注重學(xué)術(shù)批評、學(xué)術(shù)思想活躍;綜述型文章則可以幫助學(xué)界進行學(xué)術(shù)回顧和總結(jié)。另外,我們也可以從文章的類型可以看出研究者的專業(yè)特長,如發(fā)表論文多為應(yīng)用型說明該學(xué)者在平時的科研工作中更注重實踐,一般具有較強的動手能力。此外,從文章的類型還可以看出一個期刊的收錄偏好,是偏重理論研究還是偏重于應(yīng)用實踐,能否接受不同意見,等等。
從來源文獻的引文數(shù)量中我們也能發(fā)現(xiàn)一些規(guī)律,例如學(xué)術(shù)綜述型文章的引文數(shù)量要普遍高于其他類型的文獻。從學(xué)科角度分析,引文數(shù)量能夠反映一個學(xué)科研究的整體學(xué)術(shù)規(guī)范程度和學(xué)者的學(xué)風(fēng)。因此,在引文索引中需要考慮對來源文獻的文章類型和引文的數(shù)量進行標注,通過文章類型的統(tǒng)計分析以及不同類型文章的引文數(shù)量的考察,可以幫助用戶發(fā)現(xiàn)學(xué)科研究的主流成果和研究成果中尚缺完備的方面。
一個學(xué)科要發(fā)展,根本動力在于學(xué)科的研究群體,在于每一位科研人員的努力。文獻作者是引用行為的施動者,在引證過程中起著決定性的作用。從與作者相關(guān)的數(shù)據(jù)資料中,我們可以發(fā)現(xiàn)眾多隱含的知識:例如,從學(xué)科發(fā)展的角度分析,發(fā)文作者的數(shù)量能反映一個學(xué)科的研究實力;作者的年齡分布反映了學(xué)科研究的人員結(jié)構(gòu)與學(xué)科發(fā)展前景;通過作者的性別統(tǒng)計可以分析出不同學(xué)科研究中性別的差異性;分析作者的研究領(lǐng)域還可以發(fā)現(xiàn)哪些方向是學(xué)科研究的熱點,主要有哪些學(xué)者在研究,結(jié)合時間數(shù)據(jù)還可以考察學(xué)科研究熱點的變化情況,這些都可以幫助年輕學(xué)者盡快找準研究方向,確定研究目標。
一篇文章可能有多個作者,同一作者也會發(fā)表多篇文章;一個作者常常需要引用多位作者的文章,自己的文章也同時被其他人引用,因此文獻與作者、作者與作者之間形成了復(fù)雜的網(wǎng)狀關(guān)聯(lián)。目前在圖書情報領(lǐng)域,針對作者合著和作者引用網(wǎng)絡(luò)的分析文章非常多,但由于對作者背景資料的缺乏,對作者以及作者之間關(guān)聯(lián)的分析還不夠全面和深入。
在傳統(tǒng)的引文索引數(shù)據(jù)庫中,僅存儲了發(fā)文作者的姓名、地區(qū)和所在機構(gòu)這幾項簡單的信息,如果能將作者的出生日期、性別、研究方向等詳細的背景資料也在數(shù)據(jù)庫中進行組織和存放,用戶通過引文索引就可以獲得更深層面的知識服務(wù),例如可以查看某領(lǐng)域年輕學(xué)者都在研究哪些內(nèi)容,可以分析和對比不同年齡段學(xué)者的研究特點如何,可以比較哪些學(xué)科更適合女性學(xué)者的發(fā)展,甚至可以對學(xué)科的發(fā)展前景作出預(yù)測。
經(jīng)初步統(tǒng)計,文獻的發(fā)文機構(gòu)主要來自于教育科研機構(gòu)、黨政機關(guān)、軍隊系統(tǒng)以及以醫(yī)院、圖書館、報社、出版社為代表的企事業(yè)單位,其中以教育科研機構(gòu)(如高等院校、研究所)最為普遍,從發(fā)文的內(nèi)容以及期刊名稱上也能看出不同類型機構(gòu)的發(fā)文具有鮮明的職業(yè)和專業(yè)特色。對發(fā)文機構(gòu)的相關(guān)統(tǒng)計數(shù)據(jù)進行分析,我們從中也能發(fā)現(xiàn)一些隱藏的知識和規(guī)律,比如從發(fā)文量和文章級別可以看出機構(gòu)的科研人數(shù)、科研力量,以及該機構(gòu)的研究特色等等;從發(fā)文數(shù)據(jù)可以分析各領(lǐng)域跨機構(gòu)合作狀況,對加強學(xué)者間的交流和學(xué)科的交叉發(fā)展具有重要的作用。傳統(tǒng)引文索引中,對于機構(gòu)信息的標注往往存在一些不足和誤區(qū),具體分析如下:
(1)作者的區(qū)分問題。一般來說,發(fā)文作者都會標注機構(gòu)信息,但因工作或?qū)W習(xí)需要,同一作者常常會標注多個機構(gòu),另外由于機構(gòu)名稱標注的不規(guī)范,有人用全稱有人用簡稱,以及機構(gòu)合并、更名等因素,相同的機構(gòu)會出現(xiàn)多個不同的名稱,這些都給基本的數(shù)據(jù)處理和數(shù)據(jù)分析帶來了困難,常常導(dǎo)致錯誤的分析結(jié)果。
(2)跨機構(gòu)合作問題。所謂跨機構(gòu)應(yīng)該是指處于不同機構(gòu)的不同學(xué)者之間的合作,若同一個作者標注多個機構(gòu)的情況則不屬于真正跨機構(gòu)合作的范疇。在目前的引文索引數(shù)據(jù)庫中,對于跨機構(gòu)合作并沒有進行很好的數(shù)據(jù)組織與標注,研究人員需要自己完成數(shù)據(jù)采集和處理工作,工作量大,并且各研究者在數(shù)據(jù)處理過程中也會因處理方式問題,造成分析結(jié)果的不準確。
(3)不同類型機構(gòu)的表示問題。如何對機構(gòu)進行分類并有效地表示是提供深層次知識服務(wù)的前提,例如要“檢索全國‘985’高校十年來的發(fā)文量和被引量”,在目前的引文索引中需要首先知道全國“985”高校是哪些學(xué)校,然后根據(jù)名單依次進行檢索,最后還需將所有信息進行匯總,不僅效率低下,而且還容易出現(xiàn)差錯。解決的方法是對機構(gòu)的類型進行科學(xué)的編碼,依據(jù)編碼信息可以快速的獲取數(shù)據(jù)進行分析處理,繼而為用戶提供所需的知識服務(wù)。
因此,面向知識服務(wù)的新型引文索引需要克服上述不足之處,在引文索引數(shù)據(jù)的組織過程中,要充分做好機構(gòu)信息的編碼和標注工作,要克服機構(gòu)名稱變化引起的問題。
除上述引用主體外,在引文索引中還存在一些其他的信息,如期刊、地區(qū)、關(guān)鍵詞、基金、發(fā)文時間等,這些信息在引文知識服務(wù)同樣起到重要的作用。
期刊選刊的標準問題,同樣是引文索引建設(shè)的重要研究內(nèi)容。對期刊分類的優(yōu)點在于,通過期刊的遴選幫助用戶有目的的尋找到需要的信息,并能有效的控制期刊的質(zhì)量,有利于學(xué)科的不斷發(fā)展進步。通常我們將期刊分為核心和非核心兩大類,而伴隨著不同引文索引系統(tǒng)的誕生,也產(chǎn)生出了多種分類方法和評價指標,這些都為全面客觀的反映學(xué)科發(fā)展全貌提供了良好的條件。此外,對于期刊還需注意期刊名稱的變革問題,通過考察期刊名稱的歷史沿革,用戶不僅能夠獲取更全面的期刊數(shù)據(jù),而且能對期刊的發(fā)展歷程有更深入的了解。
通過發(fā)文的地區(qū)信息可以對比分析不同區(qū)域的科研實力,研究地區(qū)之間的合作情況以及科研人員的區(qū)域流動性等社會化問題。目前,在文獻中對于作者的地區(qū)標識問題,并沒有形成統(tǒng)一的規(guī)定。大部分期刊采用了地名標注的方式,但地名標注同樣存在很多問題:有的用全稱有的用簡稱,有的標注省和市甚至到縣區(qū),而有的只標注市或從市到縣區(qū),另外還有地名變更等情況。因此在引文索引中,同樣需要對地區(qū)信息設(shè)置編碼,通過建立發(fā)文地區(qū)對照字典,將不同的地名按照地區(qū)進行合并、歸類,避免數(shù)據(jù)分析時產(chǎn)生錯誤。
關(guān)鍵詞是文獻研究內(nèi)容的的涉及主題體現(xiàn),結(jié)合文獻引用關(guān)系的關(guān)鍵詞統(tǒng)計,可以用來跟蹤學(xué)科研究的熱點和發(fā)展趨勢,具體包括關(guān)鍵詞的出現(xiàn)總頻次與各年度頻次變化兩個方面。在一段時間內(nèi),出現(xiàn)頻次高的關(guān)鍵詞一般可以認為是該領(lǐng)域的研究熱點;對于出現(xiàn)頻次是逐年上升的關(guān)鍵詞,結(jié)合關(guān)鍵詞最早出現(xiàn)的時間和學(xué)科半衰期數(shù)據(jù)可以判斷該關(guān)鍵詞是否是學(xué)科新的發(fā)展方向。
從發(fā)文的基金標注中我們大致也能判斷文章研究范疇和研究深度,一般來說,有基金資助的文章質(zhì)量要高于非基金文章,國家級項目、重點項目文章的質(zhì)量普遍要高于一般性項目文章。不同類型的基金在學(xué)科研究中的作用是不盡相同的,如“863”、“973”等科研項目代表了國家重點資助的科技攻關(guān)方向;國家級的基金項目,通常代表了領(lǐng)域內(nèi)最新的研究方向和科研動態(tài);專項基金一般為特殊地區(qū)、特殊行業(yè)或部門所設(shè);此外還有各單位自己設(shè)置的各類基金項目。因各類基金項目種類繁多,在引文索引中需要對基金信息進行科學(xué)的分類組織和有效的編碼標識。
時間是文獻資料非常重要的一個屬性,同時也是提供知識服務(wù)的必備屬性。例如,從不同時間段的發(fā)文量和被引量數(shù)據(jù)中可以跟蹤學(xué)科的發(fā)展路徑;從被引文獻的發(fā)文時間可以分析對比不同學(xué)科的特點;從時間刻度上跟蹤關(guān)鍵詞的變化可以對學(xué)科的研究熱點進行全面的分析;此外,眾多的分析評價指標也都與時間特征相關(guān)。
知識服務(wù)概念的提出是信息化社會發(fā)展的必然趨勢。隨著信息技術(shù)的不斷進步,電子數(shù)據(jù)資源的極大豐富,為引文索引的創(chuàng)建提供了良好的技術(shù)條件和數(shù)據(jù)基礎(chǔ),同時我們也要看到,知識服務(wù)的需求對引文索引的數(shù)據(jù)組織與架構(gòu)設(shè)計也提出了更高的要求。數(shù)據(jù)依然是服務(wù)的源泉,為了給用戶提供更有效更優(yōu)質(zhì)的服務(wù),必須深入分析數(shù)據(jù),總結(jié)數(shù)據(jù)的特征和數(shù)據(jù)之間的關(guān)聯(lián),掌握其呈現(xiàn)的規(guī)律,在引文索引的數(shù)據(jù)組織過程中注意將這些方面進行標引,為面向知識服務(wù)的引文索引建設(shè)提供強有力的數(shù)據(jù)保障。
[1]張曉林.走進知識服務(wù):尋找新世紀圖書情報工作的生長點[J].中國圖書館學(xué)報,2000,26(129):32-37.
[2]王崇德.我國科技期刊文獻的引文分析[J].情報科學(xué),1981,(5):35-41.
[3]張敏,陳友萱.文后參考文獻的作用與規(guī)范著錄[J].上海工程技術(shù)大學(xué)教育研究,2004,(3):44-46.
[4]朱大明.參考文獻的主要作用與學(xué)術(shù)論文的創(chuàng)新性評審[J].編輯學(xué)報,2004,16(2):91-92.
[5]朱大明.參考文獻引用的學(xué)術(shù)評價作用[J].編輯學(xué)報,2005,17(5):324-325.
[6]趙芙蓉.參考文獻在科技論文中的作用與引用[J].焦作大學(xué)學(xué)報,2008,(4):115-116.
[7]蘇新寧.中文社會科學(xué)引文索引(CSSCI)的設(shè)計與應(yīng)用價值[J].中國圖書館學(xué)報,2012,(5):95-102.
[8]Kessler M M.Bibliographic Coupling Between Scientific Papers[J].American Documentation,1963,14(1):10-25.
[9]Morris S A,Yen G,Wu Z.Time Line Visualization of Re search Fronts[J].Journal of American Society for Infor mation Science,2003,54(5):413-422.
[10]Small H.Co-citation in the Scientific Literature:A New Measure of the Relationship Between Two Documents[J].Journal of American Society for Information Sci ence,1973,24(7):256-269.