徐佳寧(徐州師范大學圖書館 江蘇 徐州 221116)
所謂“預印本”(Preprint),是指科研工作者的研究成果還未在正式出版物上發(fā)表,而出于交流或征詢意見的目的自愿先在同行中傳播的手稿。根據1996年David的定義,預印本是具有以下一條或一條以上條目的手稿:①經過復審準予出版的手稿;②以出版為目的的、已交出版社送審的手稿,是否予以出版尚未確定;③打算出版,但在送審前,為征求意見而在同行專家間進行傳播的手稿[1]。
為了以最快的速度交流最新研究進展和成果,避免從投稿到文章發(fā)表再從期刊上讀到同行的文章而耽擱半年到一年的時間,工作在最前沿的科學家們習慣于互相交換自己最新工作的論文預印本。
“電子預印本”是傳統(tǒng)紙本預印本的電子版,指由作者提交的、與研究相關的電子學術資源。現(xiàn)在電子預印本的概念已經泛化。首先,電子預印本內涵從期刊論文擴大到涵蓋會議論文、技術報告、工作論文、圖書的部分章節(jié)、研究數據等與研究相關的各種電子學術資源。其次,其外延既包括尚未出版的論文電子版,也包括已經出版的論文及不一定出版的論文的電子版(即僅為了征詢同行評議或評論而通過互聯(lián)網發(fā)布的科研論文)。
很多電子預印本服務器既接受正在審稿中的論文,也接受已經審稿錄用的或已經在傳統(tǒng)學術期刊上發(fā)表的由作者提交的論文電子版——后印本(postprint)及未來不會出版或發(fā)表的論文(有的電子預印本文獻是永遠不會投稿給任何期刊的)。 對于一些電子預印本服務器,電子預印本意味著任何電子形式的、與研究相關的、由作者提供的信息,不必是能夠出版的[2]。
“電子預印本文庫”(E-Preprint Server)是集中存儲學者們在線提交的論文電子預印本的數據庫,它允許任何人在線免費下載文庫中的論文。電子預印本的作者可以隨時更新其電子預印本,即使在經過同行評審程序之后亦然。
電子預印本文庫的出現(xiàn)改變了科學社群內的信息交流方式。它將報道最新研究成果的預印本集中放到互聯(lián)網上,便于檢索和利用,使每個科學家都有機會免費在線發(fā)布和獲取這些本來只是私人之間流傳、只有小圈子精英科學家才能讀到的預印本。電子預印本文庫具備交流速度快、范圍廣、發(fā)布自由、提供多媒體支持特性等優(yōu)點。
電子預印本在論文正式出版之前就可以在Web上獲得。通過電子預印本文庫,研究者可以迅速將其研究成果公布與分享,避免了審稿和等待出版的時滯。并且電子預印本文庫在體現(xiàn)網絡優(yōu)越性的同時,更能保證學術交流的可靠性,且能集中、快速地獲取,有利于避免重復研究、提高信息交流的時效性、提高科研效率。
從1991年美國物理學家金斯帕(Paul Ginsparg)在洛斯阿拉莫斯國家實驗室的NeXT計算機上建立了世界上第一個電子預印本服務器至今,預印本文庫已經歷了20年的發(fā)展[3-4]。目前預印本文庫發(fā)生了怎樣的變化?因特網上現(xiàn)有多少電子預印本文庫?預印本文庫中文獻收藏量如何?各學科發(fā)展情況如何?
為了考察電子預印本的發(fā)展現(xiàn)狀,我們通過搜索引擎和一些圖書館提供的電子預印本文庫列表,對因特網上著名的電子預印本文庫進行了在線調查研究。據文獻報道,20世紀初世界預印本文庫的總數量超過100個[2]。筆者在線調查了60余個電子預印本文庫、文獻庫(其中包含預印本)和電子預印本搜索系統(tǒng),主要對其名稱、網址、運行時段、服務器歸屬機構、國別、學科、收藏論文數量等數據進行在線收集,并進行統(tǒng)計分析。
經過調查發(fā)現(xiàn),目前因特網上的電子預印本文庫有3種:第一種是只收藏電子預印本,且允許所有學者在線提交的,如著名的arXiv、CogPrints 、PhilSci Archive、 SSRN eLibrary Database;第二種是只收藏電子預印本,允許本機構職員提交,但不對公眾開放提交的;第三種是收藏多種電子文獻的綜合型開放存取文庫,他們并非純粹的預印本文庫,而是大型學術文獻數據庫或開放獲取資源搜索引擎,但也有電子預印本在線提交系統(tǒng),允許在線提交論文的電子預印本,如RePEc、PubMed Central (PMC)、CiteSeerX。
據統(tǒng)計,目前世界上有很多電子預印本文庫,如美國、英國、德國、法國、瑞士、俄國、挪威、中國、日本等國家均有電子預印本文庫,其中美國、英國和德國的電子預印本文庫數量最多。被調查的這些電子預印本文庫基本上是由高校各學院、科研機構和學術組織構建的,其中高校的各學院建設的數量較多,這與其他類型的資源主要由圖書館建設有所不同,說明科學家是主要建設者;就學科專業(yè)電子預印本文庫的數量來講,尤以數學學科的專業(yè)電子預印本文庫數量最多,物理學專業(yè)的電子預印本文庫數量次之,再次是生命科學、醫(yī)學、經濟學、統(tǒng)計學等學科的電子預印本文庫。一些大型電子預印本文庫有研究項目提供技術和資金支持,如NDLTD(Networked Digital Library of Theses and Dissertations,網絡博碩士學位論文數字圖書館)由美國國家自然科學基金支持,E-LIS(E-prints in Library and Information Science,圖書館學情報學論文的電子版)是由RCLIS(Research in Computing, Library and Information Science,計算機、圖書館和信息科學研究)項目和西班牙文化部的DoIS(Documents in Information Science,信息科學檔案)項目支持的。
關于電子預印本文庫的運行情況,通過對收藏電子預印本文獻量排序發(fā)現(xiàn),目前電子預印本文庫的運行情況各不相同,差距較大。主要分為3種情形: 第一種是發(fā)展運行良好,提交量、下載量和瀏覽量都很大,說明科學家對這些電子預印本文庫的認可度和參與度都很高,如著名的arXiv、SSRN eLibrary Database、RePEc;第二種是維持運行,能夠正常運行但提交量比較小(有的年提交量僅為10-60篇),這些多是高校學院的二級學科電子預印本文庫,由于本身收藏范圍窄、影響力也小,所以提交量小,如丹麥南丹麥大學數學與計算科學系電子預印本文檔(運行時段為1990年至今,平均年提交量17篇左右)、德國達姆斯坦特大學數學系電子預印本系統(tǒng)(運行時段為1972年至今,年均60篇);第三種是關閉和轉并,由于提交量太少、關注度太低或其他原因(如項目結束、資金問題)而關閉不再接受新的提交,或者轉入其他電子預印本文庫。例如,AKT EPrints Archive由于項目結束而不再接受新的提交 ;美國路易斯安那大學數學系電子預印本系列(LSU Mathematics Electronic Preprint Series)由于提交量較少,年接收論文量20-30篇,于2004年停止接收新的論文;美國國家數學科學研究所電子預印本系列,年收到預印本論文量9-50篇,在1995-2005年正常運行,2006年起不再接收新的論文。
部分國內外電子預印本文庫的名稱、網址、運行時段、服務器歸屬、國別、學科、收藏論文數量等具體情況見下頁表1。
物理學、數學、天文學、計算機科學的電子預印本文庫受到同行的認可,其電子預印本文庫數量較多,且擁有眾多參與者;生命科學、醫(yī)學、經濟學、財經、法律、管理類學科的電子預印本文庫的瀏覽和下載量很高;而化學學科的電子預印本服務器(Chemistry preprint server)由于提交量小,已經停止接收提交論文。就學科而言,物理學是使用電子預印本的先鋒和主力軍,對于物理學家來講,電子預印本已經成為正式出版的必要前奏,現(xiàn)在半數的物理學家都會先把論文提交到arXiv。arXiv已經發(fā)展成為近50萬篇論文的集散地,其用戶自由下載不需受權限限制。2007年網站下載量達到4500萬篇,每月新遞交電子預印本文獻5000篇,日瀏覽量近百萬[5]。社會科學研究網e圖書館(SSRN E-Library)現(xiàn)有23萬余篇電子預印本論文,每月下載論文全文超過80萬篇次[6]。而化學電子預印本服務很難在化學家中推廣,2000年8月在美國化學會(The American Chemical Society,簡稱ACS)年會上推出的化學電子預印本服務器作為論文的一種永久的Web存檔方式和免費服務方式向公眾開放,由Elsevier提供服務器,結果由于沒有足夠數量的論文提交,預印本文庫于2004年不再接收新提交的論文,只是保留原已提交的論文并提供免費下載和服務。相對于物理學家來講,比較保守的化學家們對電子預印本并不感興趣,這可能與知識產權保護有關,化學、生物學研究需要大量的資金支持,科學成果要申請專
利或進行轉讓,過早發(fā)布電子預印本,科學家會顧慮內容被泄露。
表1 著名電子預印本文庫的具體情況
最初,許多數學、物理學的學院和學會建立了自己的小規(guī)模電子預印本服務器,20世紀末這種小型電子預印本服務器數量相當可觀,可能是考慮到這些分散的電子預印本文庫不能達到有效、快速交流和分享的目的,后來一些電子預印本文庫被關?;虿⑷氪笮投杏绊懥Φ碾娮宇A印本文庫,學科電子預印本文庫向集中和規(guī)?;l(fā)展。例如,美國數學會曾建立了覆蓋數學學科的電子預印本服務器,幾年后他們調整了策略,關閉了服務器,這些電子預印本服務器現(xiàn)在已經全部并入arXiv,但在其網站上保留了一個全部數學電子預印本服務器的列表;美國物理學會(American Physical Society,簡稱APS)也放棄了學會的電子預印本文庫,并且修改其旗下期刊的著作權條款,讓學會出版刊物上的文章能夠張貼在金斯帕的arXiv電子預印本文庫中;化學物理電子預印本數據庫(Chemical Physics Preprint Database)和濃縮物質電子預印本也已經轉入arXiv。美國、英國、德國的許多大學的學院都建立有電子預印本文庫,其中數學學院建立的電子預印本文庫最多,我國華東師范大學數學系也建有電子預印本文庫。只是這些學科預印本文庫規(guī)模比較小,有的僅供本院系的教師提交論文電子預印本,無法達到大范圍內科學論文的交流和分享的初衷。 目前這些小型電子預印本文庫有許多已經不再接受新的提交,只是繼續(xù)提供已經提交論文的瀏覽和下載。
電子預印本文庫基本上是由高校學院、科研機構和學術組織構建的,其創(chuàng)建者主要是科學家,只有極少數是由圖書館代為管理的。世界上第一個電子預印本服務器是由美國物理學家金斯帕(Paul Ginsparg)建立的,后來交由康乃爾大學圖書館維護。CogPrints是由英國南安普敦大學電子與計算機科學學院建立并維護運行的,CiteSeerx屬于賓夕法尼亞州立大學信息科學和技術學院。另外,許多高校的院系都建設電子預印本文庫,這些預印本文庫多是由科學家構建和維護的??梢姡娮宇A印本文庫的建設者和參與者都是學者,電子預印本文庫的產生和發(fā)展是以科學家為主導的,是由科學家自我交流的需求直接驅動的。
盡管電子預印本文庫沒有質量控制程序,只是進行簡單的科研機構郵箱識別注冊或同行推薦注冊,但其中的論文質量總體來講仍然較高,大量論文后來在正式期刊及高品質期刊上發(fā)表。ESI預印本文庫自1999年起開始對其庫內電子預印本進行評估,結果表明1993-1999年間共819篇預印本中有669篇(約占82%)已經在正式期刊上發(fā)表或成為著述的一部分;其中108篇文章發(fā)表在數學物理方面SCI(Science Citation Index,科學引文索引)影響因子位列前10名的刊物上,意味著13%的ESI的預印本論文進入了高品質期刊[7]。統(tǒng)計2010年1月arXiv預印本文庫的天體物理學分支接收的1032篇論文發(fā)現(xiàn),其中177篇目前已經在正式期刊上發(fā)表(截至2010年5月4日),發(fā)表的論文占總數的17.15%。
電子預印本用最快的速度交流最新的理論和實驗進展,避免了論文從投稿到發(fā)布的時滯;能夠快速將學術信息傳播給全世界的學者,使全世界的研究“一體化”,不論是在英國劍橋或印度加爾各答,都將有機會第一時間知道學科領域最新的進展;電子預印本具有交流速度快、范圍廣,發(fā)布自由、門檻低,有利于學術傳播及學術性強、可靠性高等特點,可以減少重復研究,提高了研究的品質和科研效率。電子預印本文庫利用互聯(lián)網集中、序化學術信息,加快學術交流,是一種重要的信息組織和學術交流方式。在物理學、數學、計算機科學等學科領域,預印本已經穩(wěn)定地成為科學家學術交流的重要媒介和科學交流系統(tǒng)中新的交流渠道。一方面,瀏覽查看電子預印本成為一些學科的科學家了解和獲取學科最新研究成果的途徑之一,目前許多物理學家已經把上arXiv瀏覽最新提交的論文作為每天必不可少的工作;另一方面,科學家引用電子預印本文獻的數量也不斷增加。以物理學為例,其電子預印本系統(tǒng)發(fā)展迅猛, 越來越多的人參考、引用電子預印本資料。據筆者統(tǒng)計,2000-2009年間ScienceDirect數據庫中的107種全文期刊的8118篇文章引用了arXiv預印本文庫的文章,其中著名期刊《 Physics Letters B 》(物理快報)的論文引用arXiv的電子預印本最多,共引1450篇次。發(fā)表在2003年天體物理學雜志(Astrophysical Journal)上75%的文章以預印本形式存放于arXiv預印本系統(tǒng)上,這75%的文章獲得了90%的引用率,以預印本形式開放獲取的文章引用率是非開放獲取文章引用率的3倍[8]。
一些很有影響力的期刊編輯部不接收已經先行在網上發(fā)布了電子版的論文(包括在電子預印本文庫發(fā)布的論文),研究人員為了在高質量期刊上發(fā)表文章以提高學術地位,只得放棄在電子預印本文庫發(fā)表論文,這成為電子預印本發(fā)展的障礙。如美國化學會既不允許作者發(fā)布審稿前和正在審稿的預印本及錄用的后印本,也不允許在線發(fā)布出版商出版后的PDF格式論文。但目前越來越多的科學期刊,包括《Nature Science》、《Springer Verlag Journals》等,明確表示允許作者在服務器上發(fā)布電子預印本。英國諾丁漢大學的RoMEO網站[9]列出了世界上眾多期刊學術機構出版物或出版社是否允許作者發(fā)布電子預印本的信息,并根據是否允許發(fā)布預印本、后印本及已發(fā)表文章的PDF全文,將期刊分為綠色(允許預印本和后印本或出版的PDF)、藍色(允許后印本或出版的PDF)、黃色(允許預印本)、白色(不允許預印本、后印本和出版的PDF)。從RoMEO的期刊一覽表可以看出,物理學、天文學、生物學、統(tǒng)計學、經濟學學會或官方研究院出版的期刊基本上是綠色或藍色的。
美國物理學會重視并參與電子預印本這種新的交流活動,修改其旗下期刊的著作權條款,允許學會出版刊物接受已經在arXiv預印本文庫中發(fā)布的文章。美國國立衛(wèi)生研究院(National Institutes of Health,簡稱NIH)獲得參議院批準,要求NIH資助完成的所有學術論文必須在發(fā)表后一年內提交到PubMed Central預印本文庫,免費向公眾開放。這些學會和研究機構的積極支持,消除了障礙、強化了意識、促進了電子預印本的發(fā)展。
在競爭的研究環(huán)境下,有些作者急于宣告其不成熟的研究結果,而電子預印本未經審查不免有質量方面的顧慮。同時,專利制度會使科學家不愿意先行發(fā)布具有商機的信息。另外,科學家因擔心文章被篡改、剽竊和被用于商業(yè)目的等而遠離電子預印本服務。
簡單易用、便于提交和檢索下載的電子預印本文庫界面設計才能留住更多的用戶。目前,大多數預印本文庫界面簡單,主要提供分類瀏覽和簡單檢索。但是有的電子預印本文庫檢索反應速度慢、提交鏈接不明顯、不便于提交,這會影響科學家的提交意愿。如何管理維護電子預印本資源、建立更成熟完善的管理系統(tǒng)也將是一項必須面對的重要工作。
為便于利用電子預印本資源,一些學術機構和社團還研發(fā)了預印本檢索系統(tǒng)(搜索引擎),這將促進電子預印本的利用和發(fā)展。如E-print Network[10]是由美國能源部科技信息局建立的電子預印本檔案搜索引擎,可檢索存放在學術機構、政府研究實驗室、私人研究組織以及科學家和科研人員個人網站的電子印本資源;MPRESS 數學預印本檢索系統(tǒng)[11]提供對十大歐洲預印本文庫的整合檢索,其中包括arXiv在奧格斯堡的鏡像,它是由歐洲數學會的Math-Net項目資助的;SINDAP[12]是中國和丹麥的一個預印本合作項目,提供來自17個預印本網站的檢索。另外,Google Scholar也可以檢索arXiv的論文,搜索時直接輸入論文的關鍵詞或標題即可,arXiv數據庫中的論文也會被檢出。
在國際學術界,電子預印本已獲得廣泛的認可,并得到足夠的重視。特別是在物理學、數學、計算機科學等學科領域,知識的快速傳播很重要,利用電子方式傳遞預印本成為必要的傳播手段,隨后的出版過程反而只是一種形式。而且越來越多的電子預印本被正式期刊論文錄用和引用,因為信息的及時性總是能加快科學前進的步伐。電子預印本文庫已經穩(wěn)定地成為科學交流系統(tǒng)中一種新的交流渠道,未來電子預印本文庫將進一步合并集中、向規(guī)?;l(fā)展,成為提供一站式服務、資源集中、內容可靠的最新科研成果交流平臺。然而,電子預印本文庫并未像許多科學家所預料的那樣——取代學術期刊的信息傳播和交流功能,讓學術期刊成為預印本文庫的虛擬期刊,而是作為一種并行的傳播方式與傳統(tǒng)期刊和其他新的交流方式多維地實現(xiàn)科學傳播的功能。
[1]呂世炅.預印本系統(tǒng):國際學術交流的重要平臺[J].情報學報,2004(5):547-551.
[2]Sharon M J. Preprint Servers: Status, Challenges, and Opportunities of the New Digital Publishing Paradigm [EB/OL].[2010-04-01]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.42.5827&rep=rep1&type=pdf.
[3]金斯帕——永遠在線的物理學[EB/OL].[2010-04-08]. http://www.qiji.cn/news/open/2003/11/28/20031128232449.htm.
[4]Tomaiuolo N G, Packer J G.Preprint Servers:Pushing the Envelope of Electronic Scholarly Publishing[EB/OL].[2010-04-08].http://www.infotoday.com/searcher/oct00/tomaiuo1o%26packer.htm.
[5]大敞科學之門[EB/OL].[2010-04-10].http://www.douban.com/group/topic/3553143/.
[6]Paper Downloads[EB/OL].[2010-04-08].http://papers.ssrn.com/so13/DisplayAbstractSearch.cfm.
[7]Evaluation of the ESI preprint series[EB/OL].[2010-04-08].http://www.esi.ac.at/preprints/evaluation.html.
[8]The Effect of Open Access and Downloads ('hits') on Citation Impact:a Bibliography of Studies[EB/OL].[2010-04-08]. http://opcit.eprints.org/oacitation-biblio.html.
[9]RoMEO[EB/OL].[2010-04-08].http://www.sherpa.ac.uk/romeo/.
[10]E-Print Network[EB/OL].[2010-04-01].http://www.osti.gov/eprints/.
[11]MPRESS[EB/OL].[2010-04-08].http://mathnet.preprints.org/.
[12]SINDAP[EB/OL].[2010-04-01]. http://egroups.istic.ac.cn/cgi-bin/egw_metasweep/2/screen.tcl/name=welcome&service=sindap&cont ext1=fixed&lang=chi.