張永軍
合肥學院學報編輯部,安徽合肥,230601
國內(nèi)開放存取研究的知識圖譜與熱點主題分析
張永軍
合肥學院學報編輯部,安徽合肥,230601
摘要:從共詞分析的角度對我國開放存取研究領(lǐng)域的高頻關(guān)鍵詞進行研究,以定量與定性結(jié)合的方式來進行相應(yīng)的分析,并采取多元分析技術(shù)構(gòu)建高頻關(guān)鍵詞的相關(guān)及相異矩陣,運用SPSS軟件繪制出開放存取研究領(lǐng)域的聚類分析及多維尺度可視化圖譜,通過對可視化圖譜進行分析,展現(xiàn)各關(guān)鍵詞的不同聚類結(jié)果,探討國內(nèi)開放存取領(lǐng)域的研究現(xiàn)狀與熱點,并從開放存取對學術(shù)交流的影響研究、開放存取期刊研究、開放存取倉儲研究等方面進行闡述。
關(guān)鍵詞:開放存取;共詞分析;知識地圖;概念網(wǎng)絡(luò)
為了解決“學術(shù)期刊出版危機”,國際學術(shù)界、出版界、信息傳播界采取了開放存取(Open Access)或開放獲取行為,成功地推動了科研成果利用互聯(lián)網(wǎng)進行自由傳播。其作用可以概括為兩個方面:一方面是促進利用互聯(lián)網(wǎng)進行學術(shù)交流與出版,保障了科學信息的保存、提升了科學研究的公共利用程度,從而提高科學研究的效率;另一方面是促進了科學及人文信息的廣泛交流。開放存取自出現(xiàn)以來,OA期刊和OA倉儲迅速發(fā)展,學界上也取得了豐碩的成果。
1研究方法
本文采用內(nèi)容分析法——共詞分析法(co-word analysis),它是通過判斷學科領(lǐng)域中主題之間的關(guān)系,分析某一學科領(lǐng)域研究方向或研究主題的專業(yè)術(shù)語共同出現(xiàn)在一篇文獻中的現(xiàn)象,從而展現(xiàn)該學科的研究結(jié)構(gòu)與內(nèi)容。該方法成立的前提條件是:首先必須認識到關(guān)鍵詞是文章主旨的濃縮, 如果兩篇文章相同關(guān)鍵詞有兩個以上,則認為這兩篇文章在研究主題的定義、理論體系甚至在方法上是成正相關(guān)的,內(nèi)容是相近的。共詞文章數(shù)量越大,表明這類關(guān)鍵詞“距離”就越近[1]。利用現(xiàn)代的多元統(tǒng)計技術(shù)如聚類分析(Cluster Analysis)、因子分析(Factor analysis)和多維尺度分析(Multidimensional Scale Analysis)等,可以依據(jù)“距離”這個概念來分類一個學科內(nèi)的重要關(guān)鍵詞,從而得到該學科領(lǐng)域的研究現(xiàn)狀與研究內(nèi)容。就目前文獻研究熱點來看,共詞分析法主要是通過主題詞或關(guān)鍵詞分析鑒別某一學科研究熱點或主要的知識結(jié)構(gòu)[2]。共詞分析法是對當下已發(fā)表文獻的直接統(tǒng)計,它不同于共被引分析法,共詞分析法是尋找目前已發(fā)表論文集中關(guān)注的主題,反映的是在趨勢形成之后的焦點。共詞分析方法最早是在20世紀70年代中后期被法國文獻
計量學家引入的[3]。時至今日,該方法得到了逐步的完善和廣泛的應(yīng)用。
2關(guān)鍵詞的獲取與預(yù)處理
2.1關(guān)鍵詞的獲取
詞頻統(tǒng)計可以借助EXCEL軟件進行,選擇的關(guān)鍵詞在OA研究論文中出現(xiàn)頻次大于25,確定30個高頻關(guān)鍵詞作為共詞分析的依據(jù)(表1)。
2.2預(yù)處理關(guān)鍵詞
開放存取研究論文中出現(xiàn)頻率高的關(guān)鍵詞,在一定程度上可以代表當前OA的研究熱點。對所選擇的30個關(guān)鍵詞進行兩兩配對(上述統(tǒng)計結(jié)果是在1632條文獻中進行的),統(tǒng)計頻次,構(gòu)成共詞矩陣30×30,關(guān)鍵詞出現(xiàn)的頻次就是主對角線上的值,如表2所示。
表2 共詞矩陣(部分)
共詞矩陣中兩個關(guān)鍵詞各自詞頻大小值直接受這兩個關(guān)鍵詞共同出現(xiàn)頻次的影響,此矩陣是一個對稱矩陣。此時,還需引入一個表示關(guān)鍵詞共現(xiàn)相對強度的指標,才能真正揭示關(guān)鍵詞之間的共現(xiàn)關(guān)系。在文獻計量分析學中,該指標應(yīng)用較為廣泛的是Ochiia系數(shù)、Jaccard指數(shù)[4]。此處選擇Ochiia 系數(shù)法,為了揭示關(guān)鍵詞的共現(xiàn)關(guān)系,消除頻次懸殊造成的影響,可將共詞矩陣中的每個數(shù)字都除以與之相關(guān)的兩個詞總頻次開方的乘積,進而將共詞矩陣轉(zhuǎn)化為相關(guān)矩陣。其計算公式是:
Ochiia系數(shù)=
經(jīng)上式計算,矩陣中數(shù)值為1的表示某詞自身的相關(guān)程度,從而得到具體的相關(guān)矩陣(見表3)。
表3 Ochiia相關(guān)矩陣(部分)
相關(guān)矩陣中的數(shù)字為相似數(shù)據(jù),為了得到表示兩詞間相異程度的相異矩陣(表4),用“1”減去矩陣中的相似數(shù)據(jù)。相異矩陣與相關(guān)矩陣不同,該數(shù)據(jù)中的數(shù)據(jù)是不相似數(shù)據(jù),數(shù)值越大(即相似度越差),說明兩關(guān)鍵詞之間的距離越遠。
3研究熱點關(guān)鍵詞的共詞分析
3.1聚類分析
把沒有分類信息的資料按相似程度進行歸類,從而降低該類信息的維數(shù),這是研究“物以類聚”的
表4 Ochiia相異矩陣(部分)
一種方法,此法稱為聚類分析(Cluster Analysis)。依據(jù)不同個體之間差異很大,而同一類個體之間有較大的相似性,對事物本身的特性進行分類,前提條件是可以認為所有被研究的變量之間存在著不同程度的相似性(親疏關(guān)系)[2]。下面將上述處理后的相異矩陣導入到SPSS軟件中進行聚類分析,采用Ward's Method與Count中的Phi-squareMeasure方法,選擇Hierarchical Cluster,得到聚類分析樹形圖(圖1)和層次聚類分析凝聚狀態(tài)表(表5)。
圖1 聚類分析樹形圖
通過聚類分析樹狀圖,可以清晰地看到聚類分析中每一次類合并的具體情況。SPSS軟件將凝聚過程近似地表現(xiàn)在圖上,各類間的距離用數(shù)值0~25進行映射。關(guān)鍵詞之間的親疏程度可以通過聚類分析的結(jié)果進行反映,將“親緣關(guān)系”較近的關(guān)鍵詞再重新組合起來。從圖1與表5的凝聚結(jié)果看,它們的結(jié)果是相近似的。本文將類別確定為6類,其分層聚類形成的聚類結(jié)果樹形圖(圖1)。
表5 層次聚類分析的凝聚狀態(tài)表(部分)
3.2SPSS知識地圖分析
多元統(tǒng)計分析方法中的多維尺度分析(MultiDimensional Scaling,MDS)是分析研究對象的相似性或差異性[2]。利用MDS中的ALSCAL創(chuàng)建多維空間感知圖,選用歐基里德距離,選取“square symmetric”描述關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu)。一般在為0.20以內(nèi)的壓力系數(shù)(Stress,它是擬合度量值)是可接受的(其值越小說明擬合度越好),在0.60以上的判定系數(shù)(RSQ)是可接受的(值越大越好)[5]。此處得到的數(shù)據(jù)壓力系數(shù)為0.18872,判定系數(shù)為0.85609,結(jié)果滿意。
從圖2可以看出,開放存取對學術(shù)交流的影響研究、開放存取期刊研究、開放存取倉儲研究及開放存取資源長期保存研究等主題,是目前國內(nèi)開放存取研究的熱點。
圖2 多維尺度分析結(jié)果
4國內(nèi)開放存取研究熱點
4.1開放存取對學術(shù)交流的影響研究
隨著OA理論研究及實踐的深入,越來越多的組織和機構(gòu)推出開放獲取政策,傳統(tǒng)的基于印本的學術(shù)交流模式發(fā)生了改變,Open Access學術(shù)交流模式受到歡迎,不僅實現(xiàn)了學術(shù)資源的開放獲取,而且有利于知識的創(chuàng)新。劉錦宏等對OA學術(shù)交流模式進行研究,從作者、研究成果、信息中介、讀者及讀者評議等5個要素提出開放獲取學術(shù)交流模式的結(jié)構(gòu)[6](圖3),揭示了OA對促進創(chuàng)新的動態(tài)演化過程。
圖3 開放獲取學術(shù)交流模式的結(jié)構(gòu)
學術(shù)交流受OA 的影響主要有如下5個方面[7]:(1)基于學術(shù)交流參與者的影響層面。OA 的無償支付性、快速獲取性可以迅速為廣大科研人員掌握世界范圍內(nèi)最新研究成果成為可能,從而加速科研人員研究進程和成果轉(zhuǎn)化。(2)基于學術(shù)交流作用層面。OA 是學術(shù)成果的平臺,為科研人員及時獲取科研信息提供便利,降低了人們獲取信息的成本,從而提高了學術(shù)交流的開放性、交互性與效率,豐富了學術(shù)交流的內(nèi)容。(3)基于學術(shù)交流方式的影響層面。OA 打破了傳統(tǒng)學術(shù)交流的陳舊模式(作者—出版商—圖書館—用戶),破解了傳統(tǒng)學術(shù)交流中的價格、權(quán)限等問題,使得OA具備了非正式交流與傳統(tǒng)正式交流兩種模式的優(yōu)勢。(4)基于學術(shù)成果影響力的層面。OA 期刊的學術(shù)影響力正在持續(xù)上升,因此OA 可以提升科研人員知名度及其成果的學術(shù)影響力。(5)基于學術(shù)出版的影響層面。OA 在某種程度上打破了傳統(tǒng)科研成果的出版方式,與傳統(tǒng)出版模式相比,OA 信息發(fā)布的時效性強、過程簡便,是傳統(tǒng)出版方式不能比擬的。
4.2開放存取期刊研究
對OA期刊的出版模式研究通常包括經(jīng)濟機制、質(zhì)量控制和知識產(chǎn)權(quán),盡管OA期刊的評價問題與質(zhì)量控制有著密切的聯(lián)系,但對其研究往往是相對獨立的。OA期刊一般分為三種類型:綠色OA(Green OA)、金色OA(Gold OA)和混合型OA(Hybrid OA)。與傳統(tǒng)期刊相比較,OA期刊有以下特征:(1)版權(quán)方面。OA期刊版權(quán)由作者保留,例如署名權(quán)和保護作品完整權(quán)等,這與傳統(tǒng)出版方式要求把部分權(quán)利轉(zhuǎn)讓給出版商不同。從使用角度而言,他人可以通過開放存取免費使用已經(jīng)發(fā)表的研究成果,現(xiàn)行版權(quán)法明確規(guī)定作者不僅擁有限制作品傳播的權(quán)利,同時也擁有自由傳播作品的權(quán)利,所以這種出版模式與現(xiàn)行的版權(quán)法并不沖突。(2)使用權(quán)方面。傳統(tǒng)學術(shù)期刊賣給用戶的只有期刊的使用權(quán)。但OA不同,當作者同意其作品以開放存取方式出版時,即說明用戶已經(jīng)通過“創(chuàng)作共用(Creative Commons)”等許可協(xié)議享受了部分版權(quán)(包括閱讀、下載、復(fù)制、分享、保存、打印、檢索、鏈接等),而作者僅僅保留的是精神權(quán)利和阻止惡意傳播的復(fù)制權(quán)利。(3)出版模式。與傳統(tǒng)學術(shù)期刊出版模式不同,OA期刊的出版模式為:作者投稿(一般需支付審稿費)→OA期刊刊物審稿、組織同行評審→網(wǎng)絡(luò)傳播→讀者或圖書館免費使用。 傳統(tǒng)學術(shù)期刊的出版模式通常采用讀者付費的方式;OA期刊出版模式則大都采用作者付費的方式。(4)傳播方式與速度。OA期刊強調(diào)開放傳播,檢索和閱覽途徑多,覆蓋整個互聯(lián)網(wǎng);重視信息的直接性和交互性,重視學術(shù)交流的時效性。尤其是快捷的訪問方式可以大大提高論文的被引頻次。隨著OA的發(fā)展,越來越多的刊物加入OA的行列,如《自然》系列期刊將于2017年1月新增5個子刊:《Nature Astronomy》《Nature Biomedical Engineering》《Nature Ecology & Evolution》《Nature Human Behaviour》和《Nature Reviews Chemistry》。這5種新刊將與其他39個冠名《自然》的訂閱型、純在線期刊一起,在同一平臺“nature.com”上出版。該平臺上的期刊還包括排名最高的多學科類開放獲取期刊《Nature Communications》。去年,發(fā)表在“nature.com”上的內(nèi)容已有超過60%采用了開放獲取形式,供讀者免費獲取。
4.3開放存取倉儲研究
OA存儲也稱為OA知識庫,包括基于學科的存儲和基于機構(gòu)的存儲。我國大學和研究機構(gòu)建立OA 倉儲是大勢所趨,科研人員對自存儲的態(tài)度和意愿將是影響其建設(shè)的關(guān)鍵。國外一些機構(gòu)曾對科研人員的自存儲態(tài)度進行了調(diào)研,如英國Key Perspectives公司受JISC/OSI委托所做的一項全世界范圍內(nèi)的調(diào)查,為英國各機構(gòu)制訂自存儲政策提供了依據(jù)[8]。出版社對于OA存儲的政策:(1)綠色政策,出版社允許作者存儲未經(jīng)同行評議的投稿手稿和經(jīng)過同行評議修改的最終錄用稿;(2)藍色政策,出版社允許作者只可存儲錄用稿;(3)黃色政策,出版社允許作者只可存儲投稿手稿(部分出版社允許在限制開放時間下可存儲錄用稿);(4)白色政策,出版社沒有明確允許作者存儲論文的任何版本。存儲地點:一般出版社規(guī)定只能存儲到作者個人網(wǎng)站、所在機構(gòu)的知識庫和資助機構(gòu)規(guī)定的專門知識庫中。開放獲取時間:多數(shù)出版社規(guī)定了論文存儲后的禁止開放期,同一出版社的不同期刊的禁用期也往往不同,多為12個月。出版社均要求作者和接受存儲的知識庫在知識庫上提供完整的出版來源信息,并提供指向期刊網(wǎng)站的URL。
5結(jié) 語
本文應(yīng)用共詞分析方法,通過聚類、多維尺度等多元統(tǒng)計方法,以定量與定性結(jié)合的方式進行相應(yīng)的分析,以知識圖譜的形式進行直觀表現(xiàn),得知我國開放存取研究的一些情況。需要說明的是,本研究屬于探索性研究,難免存在一定的局限性。
參考文獻:
[1]馮璐,冷伏海.共詞分析方法理論進展[J].中國圖書館學報,2006(3):88-92
[2]張勤,馬費成.國外知識管理研究范式:以共詞分析為方法[J].管理科學學報,2007(6):65-75
[3]Law J,Bauin S,Courtial J P,et al .Ploicy and the mapping of scientific change:A co-word analysis of research into environmental acidification[J].Scientometrics,1988(14):251-264
[4]梁立明,謝彩霞.詞頻分析法用于我國納米科技研究動向分析[J].科學學研究,2003(2):138-142
[5]邱均平,李江.基于引文分析法的國內(nèi)“參考咨詢”的研究現(xiàn)狀分析[J].圖書情報知識,2007(1):54-57
[6]劉錦宏,李思潔,徐麗芳.開放獲取學術(shù)交流模式研究[J].科技與出版,2013(3):83-85
[7]完顏鄧,盛小平.基于共詞分析的國內(nèi)開放獲取研究主題探析[J].圖書情報工作,2013(3):94-100
[8]何燕,初景利,張冬榮.我國科研人員自存儲態(tài)度調(diào)查:以中國科學院科研人員為例[J].圖書情報工作,2008(5):121-124
(責任編輯:劉小陽)
doi:10.3969/j.issn.1673-2006.2016.05.009
收稿日期:2016-01-25
基金項目:中國科技期刊學研究基金“高??萍计诳母锇l(fā)展路徑初探”(GBJXC1267);安徽高校省級人文社會科學研究項目(SK2013B084)。
作者簡介:張永軍(1975-),安徽合肥人,碩士,副編審,主要研究方向:編輯學。
中圖分類號:TP315
文獻標識碼:A
文章編號:1673-2006(2016)05-0031-05