胡志剛,侯海燕,林歌歌
(大連理工大學(xué)科學(xué)學(xué)與科技管理研究所,大連 116024)
從書信沙龍到開放獲取——芻議學(xué)術(shù)論文形態(tài)的演化*
胡志剛,侯海燕,林歌歌
(大連理工大學(xué)科學(xué)學(xué)與科技管理研究所,大連 116024)
近年來,為適應(yīng)互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代的新形勢(shì),學(xué)術(shù)期刊出版在形態(tài)上不斷創(chuàng)新,給學(xué)術(shù)論文的寫作、閱讀、評(píng)價(jià)等帶來很多新變化。學(xué)術(shù)論文文本的可讀性、機(jī)讀性和可交互性水平大幅提高,對(duì)于應(yīng)對(duì)大數(shù)據(jù)時(shí)代信息爆炸和文獻(xiàn)分析需求具有重要價(jià)值和意義。與此同時(shí),開放獲取運(yùn)動(dòng)促進(jìn)新型學(xué)術(shù)期刊出版和發(fā)行模式的興起,新的學(xué)術(shù)交流和知識(shí)傳播模式被提出,簡(jiǎn)化從作者到讀者的學(xué)術(shù)成果路徑,推動(dòng)學(xué)術(shù)成果更廣、更快地傳播。本文回顧學(xué)術(shù)論文從誕生到規(guī)范化、數(shù)字化、結(jié)構(gòu)化、開放獲取等里程碑式的過程,對(duì)于我國(guó)學(xué)術(shù)出版和數(shù)字圖書館領(lǐng)域找準(zhǔn)發(fā)展方向、追趕發(fā)展潮流具有重要意義。
學(xué)術(shù)論文;開放獲??;學(xué)術(shù)出版;知識(shí)傳播
隨著學(xué)術(shù)期刊數(shù)字出版和數(shù)字圖書館技術(shù)的發(fā)展,學(xué)術(shù)知識(shí)的傳播和學(xué)術(shù)信息的交流渠道正變得越來越通暢,學(xué)術(shù)論文文本在寫作格式、展現(xiàn)形式和評(píng)價(jià)方式上發(fā)生深刻變化。興起中的開放獲取運(yùn)動(dòng),將數(shù)字出版和發(fā)行的模式推到一個(gè)新的高度,以PLOS、Frontier、PeerJ等開放獲取期刊網(wǎng)站為代表,學(xué)術(shù)論文文本在美觀度、機(jī)讀性、交互性和多元指標(biāo)的可視化展現(xiàn)等方面更加突出??梢哉f,學(xué)術(shù)論文文本已進(jìn)入一個(gè)內(nèi)容與形式并重、人機(jī)友好度并重的新階段。
學(xué)術(shù)期刊和學(xué)術(shù)論文的誕生,可追溯到《學(xué)者雜志》(JOURNAL DES S?AVANS)和《哲學(xué)匯刊》(PHILOSOPHICAL TRANSACTIONS)的創(chuàng)辦[1-2]。從此,學(xué)術(shù)知識(shí)的傳播方式從書信、沙龍和演講的非正式形式[3],發(fā)展到目前利用數(shù)字出版和開放獲取進(jìn)行知識(shí)生產(chǎn)和傳播的新模式,經(jīng)歷了長(zhǎng)達(dá)300多年的發(fā)展歷程。這一歷程在過去的半個(gè)世紀(jì)里,更是取得突飛猛進(jìn)的進(jìn)展。隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)字出版和數(shù)字圖書館技術(shù)開始興起并蓬勃發(fā)展[4],學(xué)術(shù)論文文本中集成的內(nèi)容越來越立體和豐富,學(xué)術(shù)知識(shí)傳播的深度、廣度和效率大幅提高。
本文對(duì)學(xué)術(shù)論文文檔的演變歷程進(jìn)行回顧,梳理學(xué)術(shù)論文走向規(guī)范化、數(shù)字化和開放化的演化之路,并探討這種演化對(duì)科學(xué)知識(shí)的傳播和交流帶來的影響。此外,通過展現(xiàn)數(shù)字出版和數(shù)字圖書館技術(shù)的新變化,探討我國(guó)在數(shù)字出版和數(shù)字圖書館領(lǐng)域與國(guó)外出版商的差距。
學(xué)術(shù)論文是記錄和傳播科技知識(shí)的載體,是對(duì)學(xué)術(shù)研究的描述和文本展現(xiàn)。早期科學(xué)家通過著作、書信、沙龍和演講等渠道發(fā)表個(gè)人研究成果。與當(dāng)今科學(xué)發(fā)展依賴高校和科研機(jī)構(gòu)不同,早期科學(xué)是在沙龍和各類科學(xué)社團(tuán)里發(fā)展起來的,如羅馬的“山貓學(xué)會(huì)”、蒙托學(xué)會(huì)、皇家科學(xué)院等。17世紀(jì)以前,歐洲科學(xué)家主要通過私人通信來交流學(xué)術(shù)問題或宣布其研究成果。例如,牛頓與胡克、哈雷等曾在通信中討論引力的測(cè)算問題,胡克、哈雷就這一問題向牛頓提出自己的看法和建議,這對(duì)于牛頓重新完善引力的測(cè)算起到了很大作用[5]。
隨著科學(xué)研究的發(fā)展加快,書信沙龍的形式越來越不能適應(yīng)科學(xué)發(fā)展的需求。1665年,在科學(xué)學(xué)會(huì)的推動(dòng)下,世界科技期刊《學(xué)者雜志》和《哲學(xué)匯刊》相繼創(chuàng)刊,開啟了科技期刊出版和學(xué)術(shù)論文寫作的新時(shí)代??萍计诳癁榭萍汲晒恼故尽鞑ズ徒涣魈峁┓€(wěn)定可靠的平臺(tái),逐漸成為科學(xué)家提出新發(fā)明、傳播新理論的主要方式。
早期學(xué)術(shù)期刊主要用于發(fā)表自然科學(xué)領(lǐng)域的實(shí)驗(yàn)研究成果和發(fā)現(xiàn),此外,還用于發(fā)布包括圖書目錄、著名人物訃告、民事和宗教法庭的重要文告、判決及高校的決議通告等[6]。學(xué)術(shù)論文在形式上以書信體、實(shí)驗(yàn)報(bào)告體為主,通常為單一作者。在一篇論文(主要是實(shí)驗(yàn)報(bào)告)中,可能會(huì)同時(shí)論及多個(gè)不同研究問題,論述形式不拘一格,但以時(shí)間順序的描述為主。
在學(xué)術(shù)論文誕生的前兩個(gè)世紀(jì)里,發(fā)表的學(xué)術(shù)論文只是簡(jiǎn)單地記錄做了什么和看到了什么,注重研究結(jié)果(Results)的描述和科學(xué)觀點(diǎn)的提出。1850年以來,隨著科學(xué)研究中對(duì)研究方法(Methodology)的強(qiáng)調(diào),“實(shí)驗(yàn)和方法部分”開始在學(xué)術(shù)論文中獨(dú)立成節(jié)[7]。1935年后,包含引言(Introduction)、方法(Methods)、結(jié)果(Results)和結(jié)論(Discussion)四個(gè)部分的IMRAD論文結(jié)構(gòu)開始在醫(yī)學(xué)領(lǐng)域的期刊中出現(xiàn),并逐步被其他期刊和學(xué)科采用。1980年,IMRAD結(jié)構(gòu)已經(jīng)成為科技論文中普遍采用的一種形式[8]。
IMRAD指論文的四個(gè)主要組成部分:引言(Introduction)、材料與方法(Materials and Methods)、結(jié)果(Results)、討論與結(jié)論(Discussion and Conclusion)。其中,“引言”部分主要描述研究問題和研究背景,并對(duì)前人的研究進(jìn)行綜述;“材料與方法”部分主要介紹作者采用的材料、方法和技術(shù)路線;“結(jié)果”部分主要展現(xiàn)研究所得結(jié)果;“討論和結(jié)論”部分則是對(duì)研究結(jié)果的分析和解讀,并對(duì)引言提出的問題進(jìn)行回答。
對(duì)不同學(xué)科而言,IMRAD結(jié)構(gòu)還有很多變體。比如,在數(shù)據(jù)驅(qū)動(dòng)型學(xué)科,“材料與方法”被相應(yīng)改成“數(shù)據(jù)與方法”(Data and Methods);有些論文在“引言”之后還有獨(dú)立的“文獻(xiàn)綜述”(Literature Review)部分,以更為系統(tǒng)地展現(xiàn)已有研究進(jìn)展和前人研究成果;有些論文將“討論”和“結(jié)論”部分分開論述,或者只有“結(jié)論”,又或者只有“討論”。
1990年后,學(xué)術(shù)論文的規(guī)范化寫作從正文過渡到摘要[9],結(jié)構(gòu)化摘要的出現(xiàn)始于生命科學(xué)領(lǐng)域。結(jié)構(gòu)化摘要要求論文作者逐一列出論文背景(Background)、目標(biāo)(Objective)、方法(Material and Methods)、結(jié)果(Results)和結(jié)論(Conclusions)。顯然,由于摘要是讀者最先閱讀的部分,具有判斷一篇論文是否具有閱讀價(jià)值的作用,因此結(jié)構(gòu)化摘要的出現(xiàn)大大提高讀者篩選論文的效率。
高度規(guī)范化的學(xué)術(shù)論文結(jié)構(gòu),既方便學(xué)術(shù)論文的寫作和編輯出版,也方便學(xué)術(shù)知識(shí)的傳播、實(shí)踐和檢驗(yàn)。讀者可以根據(jù)論文作者列出的材料、數(shù)據(jù)、方法和工具對(duì)結(jié)果進(jìn)行重復(fù)實(shí)驗(yàn),既是對(duì)論文中科學(xué)知識(shí)的消化和學(xué)習(xí),也是對(duì)論文結(jié)論的驗(yàn)證。因此,在自然科學(xué)、生命科學(xué)、社會(huì)科學(xué)等領(lǐng)域,采用規(guī)范的學(xué)術(shù)論文結(jié)構(gòu)已經(jīng)成為約定俗成的學(xué)術(shù)論文寫作規(guī)范。
互聯(lián)網(wǎng)技術(shù)出現(xiàn)之前,學(xué)者主要通過圖書館查找文獻(xiàn)。20世紀(jì)90年代以來,得益于電子計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,紙質(zhì)版定期發(fā)行的學(xué)術(shù)期刊出版模式日漸式微,學(xué)術(shù)期刊出版和學(xué)術(shù)論文開啟數(shù)字化進(jìn)程,學(xué)者逐漸習(xí)慣通過文獻(xiàn)數(shù)據(jù)庫、機(jī)構(gòu)知識(shí)庫乃至社交網(wǎng)站查找和下載電子文本的學(xué)術(shù)論文。
20世紀(jì)末,學(xué)術(shù)論文的存儲(chǔ)和傳播進(jìn)入數(shù)字化時(shí)代,亟需一種通行的文檔存儲(chǔ)和分享的格式標(biāo)準(zhǔn)。由Adobe公司開發(fā)的PDF文件格式,憑借優(yōu)良的設(shè)計(jì),在與DjVu、Envoy、Common Ground Digital Paper、Farallon Replica、XPS及Adobe自身的PostScript格式的競(jìng)爭(zhēng)中脫穎而出,成為桌面出版工作流程最受歡迎的文檔格式[10]。
PDF的含義是便攜式文檔格式(Portable Document Format),是一種用獨(dú)立于硬件、操作系統(tǒng)和應(yīng)用程序的方式呈現(xiàn)文檔的文件格式。PDF格式的優(yōu)點(diǎn)是便于閱讀和打印,可讀性好,格式固定,不易被修改和編輯,具有很高的安全性和可靠性。PDF文件包含固定布局的平面文檔完整描述,包括文本、字形、圖形及其他需要顯示的信息。自PDF2.0版后,Adobe開始免費(fèi)分發(fā)PDF閱讀軟件Adobe Reader,使得PDF迅速成為固定格式文本業(yè)界的非正式默認(rèn)標(biāo)準(zhǔn)。
PDF的出現(xiàn)加快了學(xué)術(shù)論文的數(shù)字化進(jìn)程。世界著名的科技期刊出版商們相繼建立各自電子全文數(shù)據(jù)庫,提供PDF格式論文全文檢索和下載。例如,世界上最大的科技期刊出版集團(tuán)Elsevier通過ScienceDirect提供旗下2 000多種科技期刊的全文數(shù)據(jù)檢索、在線閱讀和PDF下載;Springer出版集團(tuán)的SpringerLink、John&Wiley集團(tuán)的OnlineLibrary等也都以PDF文檔全文作為學(xué)術(shù)論文的存儲(chǔ)和下載介質(zhì)。在我國(guó),中國(guó)知網(wǎng)、萬方數(shù)據(jù)、維普等中文期刊全文數(shù)據(jù)庫中,PDF文檔也是唯一提供的全文下載格式。
相較于學(xué)術(shù)論文紙質(zhì)出版,數(shù)字出版方式大幅降低科技知識(shí)的生產(chǎn)、存儲(chǔ)和傳播的成本;數(shù)字出版模式還極大地拓展學(xué)術(shù)期刊的讀者范圍,使期刊發(fā)行的邊際成本變得很小甚至沒有,期刊的國(guó)際化問題也迎刃而解;另外,數(shù)字出版有效縮短學(xué)術(shù)期刊出版的時(shí)滯。出版時(shí)滯一直是學(xué)術(shù)期刊出版的重要障礙,不僅影響學(xué)術(shù)期刊的競(jìng)爭(zhēng)力,也不利于學(xué)術(shù)成果的創(chuàng)新性保護(hù)。
站在數(shù)字圖書館領(lǐng)域角度,學(xué)術(shù)論文的數(shù)字化也方便了對(duì)論文文本進(jìn)行檢索、管理、挖掘和分析,有助于對(duì)知識(shí)的管理和利用[11]。數(shù)字圖書館領(lǐng)域各種新興文獻(xiàn)索引、文獻(xiàn)檢索、知識(shí)挖掘和知識(shí)服務(wù)技術(shù)的應(yīng)用,使學(xué)者更方便地從海量文獻(xiàn)發(fā)現(xiàn)內(nèi)容,從專業(yè)文獻(xiàn)中獲取知識(shí)。而學(xué)術(shù)論文的數(shù)字化,是開展所有工作的基礎(chǔ)和前提。
學(xué)術(shù)論文中包含很多結(jié)構(gòu)化信息。首先,論文的元數(shù)據(jù)包含標(biāo)題、作者、機(jī)構(gòu)、、期刊、期卷號(hào)等信息;其次,論文的正文部分,包含圖、表、章節(jié)、段落、致謝等結(jié)構(gòu)化信息;最后,論文的參考文獻(xiàn),也是學(xué)術(shù)論文不可或缺的有機(jī)組成部分。這種元數(shù)據(jù)和結(jié)構(gòu)化信息,對(duì)于學(xué)術(shù)論文的高效存儲(chǔ)、管理和解析具有重要價(jià)值。
而PDF格式文本不易標(biāo)記學(xué)術(shù)論文的元數(shù)據(jù)和結(jié)構(gòu)信息。雖然Adobe公司也在推動(dòng)PDF文檔的元數(shù)據(jù)存儲(chǔ)功能,以提高其在互聯(lián)網(wǎng)時(shí)代的適用性,但因其自身定位和功能的限制,在結(jié)構(gòu)化信息存儲(chǔ)方面,PDF格式并不是最合適的選擇。
HTML語言格式彌補(bǔ)了PDF格式的這一缺陷。HTML誕生于1989年,由歐洲粒子物理研究中心設(shè)計(jì)開發(fā),是一種超文本標(biāo)記語言(Hyper Text Markup Language)。由于其豐富的擴(kuò)展性和強(qiáng)大的表現(xiàn)力,得到迅速普及并開啟互聯(lián)網(wǎng)的Web時(shí)代。在數(shù)字出版和數(shù)字圖書館領(lǐng)域,HTML主要用于學(xué)術(shù)論文的前臺(tái)顯示。Elsevier、Springer、Wiley等出版商都提供HTML格式的全文閱讀功能。在論文全文的HTML頁面中,通過豐富的內(nèi)部鏈接和外部鏈接,可清晰展示論文的元數(shù)據(jù)信息(如作者、期刊等)和正文(章節(jié)結(jié)構(gòu)、圖表等)信息,并且通過集成引文鏈接服務(wù)網(wǎng)站(crossref.com、dx.doi.org等),讓讀者可以方便地跳轉(zhuǎn)到論文的參考文獻(xiàn)頁面,從而極大地提高學(xué)術(shù)論文交互性。
隨著計(jì)算機(jī)可視化技術(shù)的發(fā)展,HTML語言變得越來越復(fù)雜,兼容性問題也隨之出現(xiàn),為文檔結(jié)構(gòu)化存儲(chǔ)和數(shù)據(jù)交換帶來很多問題,這就需要一種更為精簡(jiǎn)純粹的文本語言。在此背景下,W3C成立專門工作組開發(fā)了一種新文本語言,稱為XML,即可擴(kuò)展標(biāo)記語言(eXtensible Markup Language)。XML是一種元標(biāo)記語言,可將文檔分為許多元素并對(duì)這些元素加以標(biāo)識(shí)。元素的類型、屬性等由DTD或XML Schema進(jìn)行聲明和定義。DTD(Document Type Definition),即文檔類型定義,用于定義文檔的結(jié)構(gòu)和語法,決定一個(gè)XML實(shí)體是否“有效”。
與HTML不同,XML將文本外觀從數(shù)據(jù)的內(nèi)容和結(jié)構(gòu)中分離,變得更簡(jiǎn)潔和純粹,因此很快成為數(shù)據(jù)交換主要的公共語言,在數(shù)字出版中廣泛應(yīng)用[12]。當(dāng)前,很多學(xué)術(shù)期刊出版商均以XML文檔作為出版工作流的媒介。沈錫賓等考察美國(guó)動(dòng)物科學(xué)學(xué)會(huì)聯(lián)盟基于XML的科技期刊出版工作流案例,展現(xiàn)了出版商如何借助相關(guān)軟件將Word文檔轉(zhuǎn)換成XML文檔,并基于XML進(jìn)行HTML語言的排版和在線出版[13]。
從某種意思上說,XML有點(diǎn)類似于數(shù)據(jù)庫,XML中的元素、元素屬性及元素和元素屬性間的關(guān)系,構(gòu)成數(shù)據(jù)庫中的表以及字段。借助簡(jiǎn)單的計(jì)算機(jī)程序,可以很容易地將XML格式的文檔轉(zhuǎn)化為其他格式的關(guān)聯(lián)數(shù)據(jù)。
XML還與學(xué)術(shù)出版中的本體技術(shù)和語義網(wǎng)技術(shù)有關(guān)。本體技術(shù)是為建立統(tǒng)一的數(shù)字資源模型而采取的一種解決方案。在數(shù)字出版中,需要建立一個(gè)統(tǒng)一的數(shù)字資源模型,以表示和記錄這些資源的內(nèi)容結(jié)構(gòu)、內(nèi)容特征、表現(xiàn)形式、載體方式以及資源間的關(guān)系,并按不同粒度進(jìn)行封裝、復(fù)用和交換。本體技術(shù)作為概念化明確的規(guī)范說明,可使人與人之間、計(jì)算機(jī)系統(tǒng)與計(jì)算機(jī)系統(tǒng)之間、人與計(jì)算機(jī)系統(tǒng)之間的知識(shí)處理和知識(shí)交換變得方便和順暢。
語義網(wǎng)是一種數(shù)據(jù)的網(wǎng)絡(luò),它不僅把數(shù)據(jù)放在互聯(lián)網(wǎng)上,而且試圖將數(shù)據(jù)聯(lián)系起來,并產(chǎn)生數(shù)據(jù)與現(xiàn)實(shí)事物的聯(lián)系,以方便人與機(jī)器閱讀、理解這些數(shù)據(jù)。當(dāng)前語義網(wǎng)主要表達(dá)形式之一是關(guān)聯(lián)數(shù)據(jù),它采用RDF(Resource Description Framework)數(shù)據(jù)模型,利用URI(Uniform Resource Identifier)命名數(shù)據(jù)實(shí)體,發(fā)布和部署實(shí)例數(shù)據(jù)和類數(shù)據(jù),從而可以通過HTTP協(xié)議揭示并獲取數(shù)據(jù),同時(shí)強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系,以及有益于人機(jī)理解的語境信息。其中,RDF作為XML的一種衍生版本,是關(guān)聯(lián)數(shù)據(jù)的基本數(shù)據(jù)模型。
繼數(shù)字出版之后,學(xué)術(shù)出版業(yè)即將迎來一場(chǎng)關(guān)于開放獲取的新革命。開放獲取是在學(xué)術(shù)論文數(shù)字化和結(jié)構(gòu)化的基礎(chǔ)上發(fā)展起來的,數(shù)字化和結(jié)構(gòu)化為開放獲取提供廣度和效度上的保障,使學(xué)者可以更便捷地獲取所需文獻(xiàn)資源。
自《布達(dá)佩斯開放獲取計(jì)劃》(Budapest Open Access Initiative)發(fā)布以來,越來越多的學(xué)術(shù)期刊開始嘗試開放獲取。近年來,隨著PLOS(2006)、Natural Communications(2010)、Scientific Report(2011)、PeerJ(2012)等新型開放獲取期刊的創(chuàng)辦,人們對(duì)于開放獲取運(yùn)動(dòng)的關(guān)注越來越多。根據(jù)DOAJ(Directory of Open Access Journals)網(wǎng)站的統(tǒng)計(jì),截至2016年8月,開放獲取期刊已經(jīng)有9 188種,這個(gè)數(shù)字還在不斷增長(zhǎng)。
開放獲取,指讀者可以通過公共網(wǎng)絡(luò)免費(fèi)獲取所需文獻(xiàn),開放獲取的全文允許讀取、下載、拷貝、分發(fā)、打印、檢索,以及法律允許的其他目的[14]。根據(jù)學(xué)術(shù)出版與學(xué)術(shù)資源聯(lián)盟、PLOS等機(jī)構(gòu)聯(lián)合發(fā)布的《期刊開放獲取手冊(cè)》的指導(dǎo)原則[15],開放獲取由6個(gè)原則構(gòu)成:讀者權(quán)(Reader Rights)、再使用權(quán)(Reuse Rights)、版權(quán)(Copy rights)、作者發(fā)布權(quán)(Author Posting Rights)、自動(dòng)發(fā)布(Automatic Posting)以及機(jī)讀性(Machine Readable)。這其中既包含讀者的權(quán)利(讀者的免費(fèi)閱讀權(quán))和作者的權(quán)利(作者發(fā)布權(quán)),也包含第三方的權(quán)利(再使用權(quán)、自動(dòng)發(fā)布、機(jī)讀性)。
讀者免費(fèi)閱讀權(quán)和作者免費(fèi)發(fā)布權(quán),打破了從作者到讀者的知識(shí)流通障礙,使學(xué)術(shù)論文可以最大程度地傳播,大幅提高學(xué)術(shù)交流的廣度。論文作者可以借助社交媒體(如Facebook、Twitter、ResearchGate、Mendeley等),自由地分享和推薦自己的最新研究,讓學(xué)術(shù)成果更快地被讀者了解和討論,從而給論文帶來更多的關(guān)注和引用。Norris等研究學(xué)術(shù)論文的開放獲取引用優(yōu)勢(shì),發(fā)現(xiàn)相比非開放獲取論文,開放獲取論文具有更高的平均被引次數(shù)[16]。
開放獲取是積極支持Altmetrics指標(biāo)的先鋒。Altmetrcis指標(biāo),一般譯為替代計(jì)量指標(biāo),衡量學(xué)術(shù)論文在社交媒體和學(xué)術(shù)社區(qū)上的分享和轉(zhuǎn)載次數(shù)等,廣義上也包括引用指標(biāo)之外的閱讀(view)和下載(download)次數(shù)等[17]。在傳統(tǒng)的期刊出版商對(duì)Altmetrics指標(biāo)等持保守和觀望態(tài)度時(shí),開放獲取期刊已普遍將Altmetrics指標(biāo)作為標(biāo)準(zhǔn)配置之一。在PLOS、Frontier、PMC、BMJ Open等期刊網(wǎng)站的論文閱讀頁面上,都提供了一篇論文的Altmetrics指標(biāo)信息。Altmetrics指標(biāo)改變了傳統(tǒng)基于引用次數(shù)的單一評(píng)價(jià)方式,將Web 2.0時(shí)代的新生事物囊括在對(duì)學(xué)術(shù)論文的單篇論文評(píng)價(jià)中,使學(xué)術(shù)論文在文本展現(xiàn)和評(píng)價(jià)體系上更加立體和多元。
此外,開放獲取期刊通常還支持XML格式的論文全文下載,以方便第三方對(duì)論文的再使用和再發(fā)布。XML格式比PDF格式更便于全文解析和元數(shù)據(jù)提取[18]。XML利用標(biāo)簽來標(biāo)記數(shù)據(jù)和定義數(shù)據(jù)類型,使得對(duì)全文的解析、元數(shù)據(jù)提取簡(jiǎn)單化[19]。一些常用的程序語言(如JAVA、Python、PHP、R等程序語言),也都支持XML文檔的解析。
近代科學(xué)誕生以來,科學(xué)技術(shù)的進(jìn)步與發(fā)展,一直伴隨著學(xué)術(shù)期刊和學(xué)術(shù)論文的發(fā)展和演變。尤其是近50年,不僅在期刊數(shù)量上呈現(xiàn)爆炸式增長(zhǎng),在學(xué)術(shù)期刊的出版形態(tài)和發(fā)行模式方面也發(fā)生深刻的變化。學(xué)術(shù)論文文本在規(guī)范化、數(shù)字化、結(jié)構(gòu)化和開放化等方面的發(fā)展,有效地提高了知識(shí)傳播的效率和廣度。
學(xué)術(shù)期刊和學(xué)術(shù)論文的演變是由科技發(fā)展的內(nèi)在要求和外部環(huán)境共同決定的,是從量變到質(zhì)變的過程??茖W(xué)研究的邏輯性、嚴(yán)謹(jǐn)性和可重復(fù)性決定了學(xué)術(shù)論文必須采用一種共同遵守的規(guī)范模式進(jìn)行論文寫作和生產(chǎn);信息化和數(shù)字化時(shí)代的到來為學(xué)術(shù)論文的傳播和流通提供新的機(jī)遇和條件。隨著學(xué)術(shù)期刊和論文數(shù)字化進(jìn)程的完成,由期刊出版商主導(dǎo)的封閉式學(xué)術(shù)論文網(wǎng)站開始成為學(xué)術(shù)交流中主要的甚至唯一的壁壘,在這一背景下開放獲取運(yùn)動(dòng)應(yīng)運(yùn)而生。
圖1展示了學(xué)術(shù)論文規(guī)范化、數(shù)字化、結(jié)構(gòu)化和開放化間的內(nèi)在關(guān)系。規(guī)范化和數(shù)字化構(gòu)成對(duì)學(xué)術(shù)論文進(jìn)行結(jié)構(gòu)化存儲(chǔ)的內(nèi)容條件和形式條件。從內(nèi)容方面,學(xué)術(shù)論文逐漸形成IMRAD結(jié)構(gòu)寫作規(guī)范,既體現(xiàn)知識(shí)生產(chǎn)過程中的完備性,又保證知識(shí)傳播過程的嚴(yán)謹(jǐn)性;在形式方面,學(xué)術(shù)論文從傳統(tǒng)的紙質(zhì)出版和發(fā)行方式,轉(zhuǎn)變成以PDF、HTML/XML文檔為載體的數(shù)字出版和發(fā)行方式。通過對(duì)學(xué)術(shù)論文的數(shù)字化和結(jié)構(gòu)化存儲(chǔ),打通了知識(shí)生產(chǎn)、傳播、利用的環(huán)節(jié)和鏈條,為學(xué)術(shù)交流和協(xié)同創(chuàng)新提供全方位的知識(shí)服務(wù)平臺(tái)。
圖1 學(xué)術(shù)論文的規(guī)范化、數(shù)字化、結(jié)構(gòu)化和開放化間的內(nèi)在關(guān)系
論文的開放性或開放獲取是未來學(xué)術(shù)出版的新模式。開放獲取也是科學(xué)研究的天然屬性。由于科學(xué)研究具有公有性,而學(xué)術(shù)論文最重要的作用是獲得最大范圍的學(xué)術(shù)承認(rèn),贏得優(yōu)先發(fā)表權(quán),所以學(xué)術(shù)論文本就應(yīng)該面向讀者開放獲取。但是,在紙質(zhì)化出版時(shí)代,由于出版和發(fā)行成本的約束,開放獲取無法實(shí)現(xiàn)。
數(shù)字化和結(jié)構(gòu)化為學(xué)術(shù)論文的開放獲取提供前提條件和有效途徑。數(shù)字化是實(shí)現(xiàn)開放獲取的必要前提,保障開放獲取論文可以零成本地進(jìn)行分發(fā);而結(jié)構(gòu)化是進(jìn)行開放獲取的有效途徑,只有結(jié)構(gòu)化存儲(chǔ)的數(shù)據(jù)才能最方便地被讀者檢索、閱讀和分享。開放獲取不僅進(jìn)一步提高學(xué)術(shù)論文在互聯(lián)網(wǎng)的可見度和曝光度,而且讓讀者更好地參與學(xué)術(shù)論文的互動(dòng)中。通過集成Altmetrics計(jì)量指標(biāo),開放獲取期刊網(wǎng)站可以記錄并展現(xiàn)論文讀者的閱讀、下載、分享和引用等行為,把讀者行為信息集成到學(xué)術(shù)論文的展示頁面。開放獲取不僅是數(shù)字出版模式上的創(chuàng)新,也是數(shù)字圖書館技術(shù)適應(yīng)Web 2.0和大數(shù)據(jù)時(shí)代的重要舉措。
應(yīng)該看到,我國(guó)學(xué)術(shù)出版無論是在學(xué)術(shù)論文的文本上還是在發(fā)行模式上都遠(yuǎn)落后于國(guó)外。由于缺乏先進(jìn)的期刊出版服務(wù)商的技術(shù)支持,國(guó)內(nèi)期刊網(wǎng)站建設(shè)還比較陳舊,大部分還停留在PDF格式的數(shù)字化時(shí)代。絕大多數(shù)期刊網(wǎng)站乃至主要的期刊全文數(shù)據(jù)庫(如中國(guó)知網(wǎng)、萬方數(shù)據(jù)等)都不支持HTML格式的論文閱讀,更難達(dá)到對(duì)各種Web 2.0元素和Altmetrics計(jì)量指標(biāo)的集成。如何通過借鑒國(guó)外學(xué)術(shù)論文文本處理的先進(jìn)工具和技術(shù),提高我國(guó)學(xué)術(shù)論文的數(shù)字化水平,搶占開放獲取時(shí)代學(xué)術(shù)出版的新機(jī)遇,是我國(guó)學(xué)術(shù)出版中值得關(guān)注的重要課題,也是推動(dòng)數(shù)字出版和數(shù)字圖書館融合發(fā)展的重要途徑。
[1] 李武.最早的兩份學(xué)術(shù)期刊[J].科技導(dǎo)報(bào),2012,30(10):81.
[2] 嚴(yán)小濤,廖建軍.期刊的誕生與存續(xù)[J].求索,2012(12):270.
[3] DAMPIERW C.科學(xué)史及其與哲學(xué)和宗教的關(guān)系[M].李珩,譯.桂林:廣西師范大學(xué)出版社,2009.
[4] 傅強(qiáng).數(shù)字出版:新的革命[J].浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2008,38(4):84-89.
[5] 沃爾夫.十六、十七世紀(jì)科學(xué)、技術(shù)和哲學(xué)史[M].周昌忠,苗以順,毛榮運(yùn),譯.北京:商務(wù)印書館, 1997.
[6] 張耀銘.學(xué)術(shù)評(píng)價(jià)存在的問題、成因及其治理[J].清華大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2015, 30(6):73-88.
[7] DAY R A, GASTEL B. How to write and publish a scientific paper[M]. 7th Rev. ed. New York: Greenwood Press,2011.
[8] SOLLACI L B, PEREIRA M G.The introduction, methods, results, and discussion(IMRAD)structure:a fifty-year survey[J].Journal of the Medical Library Association Jmla,2004,92(3):364-367.
[9] HAYNES R B,MULROW C D,HUTH E J,et al.More informative abstracts revisited[J].Annals of Internal Medicine,1990,113(1):69-76.
[10] 張立.數(shù)字出版相關(guān)概念的比較分析[J].中國(guó)出版,2006(12):11-14.
[11] 邱均平,沙勇忠,劉煥成.論數(shù)字圖書館的知識(shí)管理[J].情報(bào)資料工作,2001(5):5-8.
[12] 白杰,楊愛臣.XML結(jié)構(gòu)化數(shù)字出版的特點(diǎn)與流程[J].出版廣角,2015(5):28-31.
[13] 沈錫賓,顧恬,呂小東,等.國(guó)外一基于XML的科技期刊出版工作流個(gè)案剖析[J].中國(guó)科技期刊研究, 2011,22(4):581-583.
[14] 李春旺.網(wǎng)絡(luò)環(huán)境下學(xué)術(shù)信息的開放存?。跩].中國(guó)圖書館學(xué)報(bào),2005(1): 33-37.
[15] How Open Is It? Open Access Spectrum[EB/OL].[2016-09-01].http://blogs.lib.ucdavis.edu/schcomm/2013/10/22/how-open-is-it-open-accessspectrum/.
[16] NORRIS M, OPPENHEIM C, ROWLAND F. The citation advantage of open-access articles[J].Journal of the American Society for Information Science&Technology, 2008, 59(12):1963-1972.
[17] PRIEM J,TARABORELLI D,GROTH P,et al.Altmetrics:a manifesto[EB/ OL].(2010-10-26)[2016-09-01].http://altmetrics.org/manifesto.
[18] 李珍,田學(xué)東.PDF文件信息的抽取與分析[J].計(jì)算機(jī)應(yīng)用,2003,23(12):145-147.
[19] 胡志剛,陳超美,劉則淵,等.基于XML全文數(shù)據(jù)引文分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2012(11):71-77.
胡志剛,男,1984年生,講師,研究方向:科學(xué)學(xué)與科學(xué)計(jì)量學(xué)、全文引文分析、科學(xué)知識(shí)圖譜等。
侯海燕,女,1971年生,教授,研究方向:科學(xué)計(jì)量學(xué)、科技政策與管理,E-mail:htieshan@dlut.edu.cn。
林歌歌,女,1992年生,碩士研究生,研究方向:科學(xué)計(jì)量學(xué)。
From Letters and Salons to Open Access: Discussion on Evolution of Academic Papers
HU ZhiGang, HOU HaiYan, LIN GeGe
(Institute of Science of Science and S.T Management, Dalian University of Technology, Dalian 116024, China)
In recent years, in order to fit in with the new era of the internet and big data, academic periodical publishing makes continuous innovation in the form and pattern, and brings a lot of new changes to academic paper writing, reading and evaluation.The machine-readability and interoperability of academic paper text is extremely helpful to deal with the information explosion of big data era, and quite useful to satisfy the literature analysis demand. Besides, open access movement, an innovatory publishing and distribution pattern of academic journals is rising recently, which puts forward a brand new mode of academic exchanges and knowledge propagation, and greatly simplified the path from the author to the reader. Due to open access movement, academic knowledge is able to spread broader and faster. In this paper, the evolution of academic papers and publishing is reviewed. Its landmarks of process, including its birth, standardization, digitalization, structuration and open access are discussed. This review could be greatly significant for China academic publishing on how to find the development direction and keep pace with the trends.
Academic Papers; Open Access; Academic Publishing; Knowledge Propagation
G255.75
10.3772/j.issn.1673-2286.2016.10.005
* 本研究得到國(guó)家自然科學(xué)基金項(xiàng)目“開放獲取背景下的全文引文分析方法與應(yīng)用”(編號(hào):71503031)資助。
(2016-09-02)