[摘 要] 采用文獻計量學方法,對中國知網(wǎng)“中國學術(shù)期刊網(wǎng)絡(luò)出版總庫”中收錄的有關(guān)電子書研究學術(shù)論文,從文獻增長、著者、期刊、關(guān)鍵詞等方面進行較為詳細的統(tǒng)計分析。梳理國內(nèi)電子書研究發(fā)展現(xiàn)狀,揭示該主題研究論文的分布規(guī)律,并通過關(guān)鍵詞詞頻統(tǒng)計分析,建立高頻詞共詞表,歸納國內(nèi)電子書研究重點和研究熱點。
[關(guān)鍵詞] 電子書 文獻計量學 CNKI
[中圖分類號] G237 [文獻標識碼] A [文章編號] 1009-5853 (2013) 04-0085-06
[Abstract] Based on China Academic Journal Network Publishing Database, the paper did a bibliometric research on the journal articles about e-books in China. It made a large scale of quantitative analysis from many aspects such as literature growth and distribution, author distribution, source journals and citations, keywords and so on to reflect the overall development and hotspots of e-book research in recent years. Finally, with the deep analysis of key words, it generalized the current research hotspots and key points of e-book research.
[Key words] E-book Bibliometrics analysis CNKI
隨著知識和信息一體化社會的到來,傳統(tǒng)的文化生產(chǎn)方式隨著數(shù)字技術(shù)的發(fā)展而產(chǎn)生革命性的變更。電子書的誕生和發(fā)展是人類幾千年文化生產(chǎn)的創(chuàng)新性延續(xù),是對傳統(tǒng)出版業(yè)的一次顛覆。如果說邁克爾·哈特(Michael Hart)1971年發(fā)起的“谷登堡計劃”中數(shù)字化的《美國獨立宣言》(United States Declaration of Independence)還只是電子書雛形的話,那么美國暢銷小說作家斯蒂芬·金(Stephen King)在2000年與西蒙·舒斯特(Simon & Schuster)出版公司合作以電子書形式發(fā)表小說《騎彈飛行》(Riding the Bullet)則掀起了電子書的狂潮并迅速席卷全球。其后電子書作為數(shù)字出版的一種重要形式,在不斷探索標準格式、盈利模式、版權(quán)保護和新出版流程中經(jīng)歷了一段較為曲折的發(fā)展低谷期。2004年,采用電子墨水技術(shù)(E-ink)制造的電子書閱讀器橫空出世掀起了電子書發(fā)展的第二輪熱潮。近年來,亞馬遜Kindle模式和蘋果iPad模式的盛行,則將這股熱潮推向頂點?!皣鴥?nèi)電子書產(chǎn)業(yè)因為電子書閱讀器的火爆而持續(xù)升溫,電子書被視為傳統(tǒng)出版數(shù)字化轉(zhuǎn)型的重要拐點,產(chǎn)業(yè)前景被業(yè)界普遍看好,平臺服務(wù)商、內(nèi)容提供商、網(wǎng)絡(luò)運營商、硬件制造商、網(wǎng)絡(luò)分銷商等各方紛紛涉足電子書產(chǎn)業(yè)”[1]。
與業(yè)界的火爆相對應(yīng),電子書相關(guān)研究也成為學界關(guān)注的熱點。本文通過對電子書研究領(lǐng)域相關(guān)論文進行文獻計量分析,試圖揭示論文分布規(guī)律,歸納研究重點和熱點,為將來的電子書研究提供借鑒和參考。
1 數(shù)據(jù)來源和分析方法
發(fā)表電子書相關(guān)研究成果的期刊范圍較廣,加上對時間跨度和代表性等因素的考慮,本研究選定的數(shù)據(jù)來源為中國知網(wǎng)的“中國學術(shù)期刊網(wǎng)絡(luò)出版總庫”。這是目前中國最大、收錄最全的學術(shù)期刊全文數(shù)據(jù)庫,文獻報道量大、來源廣泛、檢索方便,且具有較高的準確性和可靠性。截至2012年10月,其收錄的國內(nèi)學術(shù)期刊達7900多種,其中核心期刊收錄率達96%。為了保證研究數(shù)據(jù)的準確性和可參考性,本研究將非學術(shù)類論文以及引文率和讀者利用率相對較低的論文剔除,并將論文來源類別限定為核心期刊。
檢索時間為2013年3月21日。為了保證檢索結(jié)果的查全率和查準率,選擇“題名”和“關(guān)鍵詞”進行檢索限定,構(gòu)建檢索式為:TI=(‘電子書’OR‘電子圖書’OR‘電紙書’OR‘ebook’OR‘electronicbook’OR‘e-book’) or KW=(‘電子書’OR‘電子圖書’OR‘電紙書’OR‘ebook’OR‘electronicbook’OR‘e-book’)。發(fā)表時間限定為2012年之前,共檢索出1471條結(jié)果。經(jīng)過查重并剔除與研究主題無關(guān)的論文以及會議通知、新聞報道、訪談等干擾文獻,最后得到有效統(tǒng)計記錄為1127條。
研究方法為文獻計量分析法,主要涉及文獻增長分析、著者分析、期刊分析、關(guān)鍵詞分析等方面。選用SPSS 18.0和EXCEL作為統(tǒng)計工具對數(shù)據(jù)進行統(tǒng)計分析。
2.1 文獻增長分析
將檢索得到的1127條記錄按照年代分布統(tǒng)計,得到如圖1所示的電子書研究論文年載文量分布折線圖??梢钥闯鲎钤绲囊黄撐某霈F(xiàn)在1992年。2000年以前發(fā)文量不大,年載文量都在20篇以內(nèi)。2000年至2003年出現(xiàn)了一個快速增長期。隨后幾年,年載文量或增或減,并無明顯增長或衰退現(xiàn)象,呈現(xiàn)緩慢且平穩(wěn)的發(fā)展態(tài)勢。2010年出現(xiàn)拐點,載文量呈爆發(fā)式增長態(tài)勢。
根據(jù)以上分析和圖1,不難發(fā)現(xiàn)電子書研究年載文量呈現(xiàn)出明顯的三個發(fā)展階段,這與電子書產(chǎn)業(yè)發(fā)展形成呼應(yīng)。2000年以前國內(nèi)電子書產(chǎn)業(yè)處于孕育期,業(yè)界熱情有余但動作不多,電子書形態(tài)更多是“軟盤”或“光盤”,并沒有引起學界的足夠重視,所以關(guān)于電子書的研究也不多。1998年以RocketBook和SoftBook為代表的電子書閱讀器出現(xiàn),掀起了電子書發(fā)展的第一波熱潮且很快波及國內(nèi),內(nèi)容商和技術(shù)商紛紛涉足電子書產(chǎn)業(yè)。2000年以后“掌上書房”“翰林電子書”等紛紛出爐,與此同時國外Adobe、微軟等巨頭,國內(nèi)超星、方正阿帕比等公司也紛紛涉足電子書領(lǐng)域,制訂格式標準、開發(fā)閱讀軟件,相應(yīng)地2000—2003年國內(nèi)電子書研究迎來了一個小高潮。隨后由于出版流程再造、版權(quán)保護、格式統(tǒng)一、盈利模式等問題的困擾,這一波電子書發(fā)展陷入困境,學界的研究熱度也趨冷。2007年底亞馬遜Kindle的橫空出世引爆了電子書發(fā)展的新高潮,國內(nèi)電子書市場漢王等終端制造商的發(fā)展空前火爆,其他通道、平臺、內(nèi)容等產(chǎn)業(yè)鏈各方也動作頻頻。2010年電子書市場202.87%的增長速度使得當年成為中國名符其實的“電子書元年”,相應(yīng)地電子書研究也勢如破竹、蓬勃發(fā)展,顯著標志就是相關(guān)論文數(shù)量的急劇增加。
以文獻累計數(shù)據(jù)為依據(jù),并對其進行回歸分析,可以發(fā)現(xiàn)文獻增長規(guī)律。將電子書研究論文根據(jù)年載文量統(tǒng)計得出年累積文獻量,再利用SPSS 18.0軟件進行曲線擬合。若以普賴斯(D.J.Price)曲線來擬合得出的擬合曲線為F(t)=5.950e0.279t,若用三次曲線擬合得出的擬合曲線為F(t)= 0.132t3+0.917t2+13.817t-19.967。結(jié)合圖2可以直觀看出,相比較普賴斯曲線(R2=0.874),電子書研究的文獻增長趨勢與三次曲線(R2=0.996)擬合得更好。這說明到現(xiàn)在為止電子書相關(guān)研究的文獻增長還處于初始階段:“絕對論文數(shù)量少且增長不穩(wěn)定,還沒有到達嚴格服從指數(shù)增長的發(fā)展階段”[2]。
2.2 著者分析
研究論文的合著情況一方面可以反映研究論文的深度和廣度,另一方面也可以反映該研究領(lǐng)域的學科性質(zhì)和研究方法等。在本文得到的1127篇論文中,除22篇是匿名作者以外,1105篇論文共有1591名作者,由此得出電子書研究論文的合作度為1.4398,合作率為0.2787,“明顯低于自然科學動輒0.7左右的合作率,也低于一般社會科學的合作率”[3]。這說明電子書研究雖然涉及多學科領(lǐng)域,但還是以個人自由研究為主,合作研究有待深化。另外從表1的統(tǒng)計數(shù)據(jù)可以看出,在近20年里,電子書研究合著論文數(shù)量呈現(xiàn)明顯增長趨勢,雖然合著比例并不嚴格按照線性增長,但總體還是在逐步提升。
根據(jù)普賴斯定律:“核心作者應(yīng)該完成所有專業(yè)論文總和的一半,核心作者的論文下限為N=0.749√(n_max ),n_max為所統(tǒng)計的年限中最高產(chǎn)作者的論文數(shù)量,發(fā)表論文數(shù)在N篇以上的作者即為核心作者?!盵4]本文對1105篇文獻按第一作者進行著者統(tǒng)計,發(fā)現(xiàn)發(fā)文最多的作者論文數(shù)量即n_max=5,根據(jù)公式計算出N約等于2。統(tǒng)計表明,第一作者發(fā)文數(shù)為2篇以上的作者人數(shù)為114人,共發(fā)文272篇,只占論文量的24.61%,很顯然沒有達到所有文獻的一半,這表明電子書研究的核心作者群尚未形成。同時結(jié)合表2可以看出,發(fā)表2篇以下論文的作者人數(shù)占總?cè)藬?shù)的97.17%。這也說明現(xiàn)階段國內(nèi)電子書研究比較零散,研究還不夠深入和持續(xù),暫未形成核心作者群。
本文統(tǒng)計了第一作者發(fā)文在4篇以上的高產(chǎn)作者的分布情況(見表3)。作者單位多集中在三大類,即高校圖書館、高??蒲袡C構(gòu)和出版單位。這些作者多年潛心于電子書研究,具有較深厚的理論功底,引領(lǐng)了國內(nèi)電子書研究的發(fā)展方向,他們或結(jié)合自身背景和研究特長,或從自身工作實踐出發(fā)關(guān)注電子書的版權(quán)保護、盈利模式、格式標準、定價等問題。如趙繼海從圖書館角度,圍繞電子書和DRM技術(shù)對圖書館的影響展開研究;李爽介紹和總結(jié)國外電子書發(fā)展情況;葉蘭則集中探討電子書采購流程、定價模式等。
本文對文章著者所在機構(gòu)的發(fā)文量進行統(tǒng)計,列出了發(fā)文數(shù)量在10篇以上的機構(gòu)(見表4)。不難發(fā)現(xiàn),高??蒲袡C構(gòu)和圖書館是研究電子書的主要力量。根據(jù)《中國電子圖書發(fā)展趨勢報告2011》的統(tǒng)計數(shù)據(jù)[5],2010年以前國內(nèi)電子書市場所占份額最大的業(yè)務(wù)類型為“數(shù)字圖書館”,可以說電子書在圖書館數(shù)字化轉(zhuǎn)型過程中發(fā)揮著非常重要的作用,電子書研究引起了圖書館研究人員的重視,所以清華大學圖書館、浙江大學圖書館、上海圖書館等機構(gòu)發(fā)文量排名靠前。而高??蒲袡C構(gòu)如武漢大學、南京大學、北京大學等則憑借其在圖書情報學、新聞傳播學等學科的科研力量,從多角度切入,電子書相關(guān)研究成果頗多。
2.3 期刊分析
布拉德福定律指出,如果將期刊按刊載某學科專業(yè)論文數(shù)量的多少以遞減順序排列,可以將期刊分為專門面向這個學科的核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū),各區(qū)的文章數(shù)量相等。此時存在常數(shù)a,使得三個區(qū)的期刊數(shù)構(gòu)成1:a:a2的等比關(guān)系。本文按照發(fā)文量大體相當?shù)脑瓌t,將1127篇論文分成3個區(qū)(見表5),載文量70篇以上的4種期刊為核心區(qū)期刊,載文量為358篇;載文量在40—70篇之間的6種期刊為相關(guān)區(qū)期刊,載文量為340篇;剩余的131種期刊為非相關(guān)區(qū)期刊,載文量429篇。但發(fā)現(xiàn)不存在常數(shù)a使三個區(qū)的期刊數(shù)成1:a:a2的等比關(guān)系,這說明電子書研究還處于起步發(fā)展階段,學科發(fā)展不成熟,所以論文來源分布不完全符合布拉德福定律。
為了更好地考察電子書領(lǐng)域核心期刊的情況,本文統(tǒng)計了載文量在30篇以上的期刊(見表6)。發(fā)現(xiàn)發(fā)文量30篇以上的期刊中,除了《出版廣角》《編輯學刊》和《圖書館工作與研究》外,其余均為新聞學與傳播學以及圖書館、情報與文獻學領(lǐng)域的CSSCI來源核心期刊。這說明研究電子書的相關(guān)論文學術(shù)水平較高,電子書研究受到新聞傳播和圖書情報領(lǐng)域?qū)<覍W者的廣泛關(guān)注和認可。
從期刊類型角度進行分析,從表6的高載文量期刊分布來看,電子書相關(guān)論文主要刊載在新聞傳播類和圖書情報類刊物上,而從表7總體來源期刊種類分布來看,89.27%的論文也分布在這兩類學科刊物上,且兩類期刊種類數(shù)量和載文量幾乎相等,其中圖書情報類期刊的載文量略高于新聞傳播類,而教育類、計算機類以及其他類別期刊的載文量僅占10%左右。這表明,電子書的相關(guān)研究主要吸引了新聞傳播學和圖書情報學領(lǐng)域的學者,且兩者科研能力相當;電子書相關(guān)研究還沒有吸引到更多跨學科和跨領(lǐng)域的研究,但已經(jīng)開始逐步向教育、計算機等領(lǐng)域滲透。
2.4 關(guān)鍵詞分析
“詞頻分析法是指利用能夠揭示或表達文獻核心內(nèi)容的關(guān)鍵詞或主題詞在某一研究領(lǐng)域文獻中出現(xiàn)的頻次高低來確定該領(lǐng)域研究熱點和發(fā)展動向的文獻計量方法”[6]。利用詞頻分析法分析高頻關(guān)鍵詞可以很好地歸納某一領(lǐng)域的研究熱點。為了保證研究的準確性,本文剔除了沒有關(guān)鍵詞的文獻,然后利用Excel對高頻關(guān)鍵詞進行統(tǒng)計,經(jīng)過同義詞和近義詞處理后,統(tǒng)計出排名前20的高頻關(guān)鍵詞(見表8)。統(tǒng)計結(jié)果顯示,與電子書相關(guān)的版權(quán)保護、電子書閱讀器、商業(yè)模式、數(shù)字技術(shù)、發(fā)展趨勢等成為學者關(guān)注和研究的熱點。同時,由于數(shù)字圖書館建設(shè)、數(shù)字閱讀、出版轉(zhuǎn)型等與電子書發(fā)展息息相關(guān),所以相關(guān)主題也出現(xiàn)在高頻關(guān)鍵詞表中,成為電子書研究的熱點。
高頻關(guān)鍵詞之間的共詞特性能更好地歸納某一學科專業(yè)的研究重點,因此本文利用共詞聚類分析法來分析電子書領(lǐng)域的研究重點。“共詞聚類分析法是通過文獻計量和聚類統(tǒng)計的方法,計算關(guān)鍵詞之間的聯(lián)系密切程度即在同一篇文獻中共同出現(xiàn)的頻率,把聯(lián)系密切的關(guān)鍵詞自動聚類的過程”[7]。利用軟件統(tǒng)計表7中高頻關(guān)鍵詞兩兩出現(xiàn)在同一篇文獻中的次數(shù),得到高頻詞共詞表(見表9),利用SPSS 18.0將統(tǒng)計出的共詞表轉(zhuǎn)化為相關(guān)矩陣,再利用多維尺度分析對其進行聚類分析,得出的多維尺度分析結(jié)果如圖3所示。由此可見,目前電子書的研究熱點和研究重點主要集中在以下幾個方面。
電子書與數(shù)字圖書館結(jié)合的研究。從圖3可以非常清晰地看到數(shù)字圖書館、圖書館、亞馬遜、數(shù)據(jù)庫、資源整合等高頻關(guān)鍵詞非常緊密地聯(lián)系在一起,形成一個聚類團。這反映圖書館相關(guān)研究人員非常關(guān)注電子書,他們從數(shù)字圖書館建設(shè)的實際出發(fā),探討電子書對于數(shù)字圖書館資源整合和數(shù)據(jù)庫建設(shè)的重要作用,以及圖書館如何利用電子書等新媒體來發(fā)展和拓展數(shù)字閱讀和數(shù)字借閱模式。
電子書發(fā)展對出版業(yè)的影響。這一主題也集中了較多文獻,從表7發(fā)現(xiàn)排名前四的高頻關(guān)鍵詞均與該主題相關(guān)。研究人員從電子書對傳統(tǒng)出版業(yè)的影響、出版企業(yè)的應(yīng)對措施、傳統(tǒng)出版轉(zhuǎn)型、出版流程再造等角度切入,研究了電子書發(fā)展與出版產(chǎn)業(yè)發(fā)展的互動關(guān)系。
電子書的發(fā)展模式研究。圖3顯示,數(shù)字閱讀、商業(yè)模式、數(shù)字版權(quán)、數(shù)字技術(shù)等高頻關(guān)鍵詞形成一個聚類團。這表明電子書的發(fā)展模式研究是電子書領(lǐng)域的研究熱點之一。研究者關(guān)注隨著電子書相關(guān)數(shù)字技術(shù)的發(fā)展和進步,與電子書發(fā)展緊密相關(guān)的數(shù)字版權(quán)保護、商業(yè)模式探索以及閱讀方式轉(zhuǎn)變等問題。
電子書產(chǎn)業(yè)鏈相關(guān)研究。電子書業(yè)界各方“跑馬圈地”和“群雄爭霸”的發(fā)展現(xiàn)狀吸引了不少研究者關(guān)注電子書產(chǎn)業(yè)鏈。研究者關(guān)注點主要是電子書閱讀器、平臺構(gòu)建、產(chǎn)業(yè)分工、盈利模式等。
3 結(jié) 語
通過對電子書相關(guān)研究論文的文獻增長、著者、期刊和關(guān)鍵詞等層面的文獻計量分析,本文探討了電子書研究文獻增長分布情況和增長規(guī)律,分析了電子書相關(guān)研究的合作度,核心作者、高產(chǎn)作者分布以及作者單位分布,梳理了來源期刊的分布情況,總結(jié)了電子書領(lǐng)域的研究熱點和研究重點。通過這些分析可以得出以下幾點結(jié)論。
(1)電子書研究關(guān)注度不斷增強??v觀1992年迄今的統(tǒng)計數(shù)據(jù),電子書相關(guān)研究論文在數(shù)量上已經(jīng)有了飛躍,尤其2010年以來論文數(shù)量實現(xiàn)了突破性增長。相信隨著電子書產(chǎn)業(yè)的逐步發(fā)展壯大,未來電子書研究會吸引越來越多專家和學者的關(guān)注,形成更多更高質(zhì)量的研究成果。
(2)電子書研究核心作者群還未形成。根據(jù)對著者的分析,我們發(fā)現(xiàn)電子書研究的核心作者群還未形成,已有的論文多為偶發(fā)性研究,并未形成持續(xù)的系統(tǒng)性研究,且研究的合作度較低,相關(guān)核心研究機構(gòu)和研究團隊也未形成。
(3)電子書的應(yīng)用研究還不夠。從研究電子書的作者背景、作者單位以及研究熱點分析中不難看出,目前電子書領(lǐng)域的研究多為高校學者或者圖書館研究人員從理論層面進行,而電子書的應(yīng)用屬性要求加強電子書的應(yīng)用和實踐研究。
(4)電子書的研究領(lǐng)域還有待拓展。根據(jù)對電子書相關(guān)研究論文的作者機構(gòu)、來源期刊分析,發(fā)現(xiàn)研究電子書的學者絕大多數(shù)來自新聞傳播學和圖書情報學領(lǐng)域,近90%的論文分布在新聞傳播學以及圖書館、情報與文獻學領(lǐng)域的期刊上。這說明電子書的研究領(lǐng)域還比較狹隘,跨學科研究和跨領(lǐng)域合作研究還比較少,研究領(lǐng)域有待進一步拓寬。
(5)電子書研究還有待深入。目前多數(shù)電子書相關(guān)研究還停留在表面,集中于電子書的基本概念、帶來的影響、如何利用以及國內(nèi)外業(yè)界動態(tài)的介紹,而電子書的格式、硬件、標準、流程、盈利模式、產(chǎn)業(yè)鏈等核心研究還不夠充分,規(guī)律性以及實證性研究還有所欠缺。
注 釋
[1]李鏡鏡,張志強.移動出版的發(fā)展模式及其評價[J].科技與出版,2010(8):37-40
[2]邱均平,劉華華.網(wǎng)絡(luò)信息計量學的文獻計量規(guī)律及發(fā)展現(xiàn)狀研究[J].圖書館論壇,2009,29(6):58-62
[3]賈玉英.我國圖書館讀者滿意度研究論文的文獻計量學分析[J].現(xiàn)代情報,2007,27(2):43-46
[4]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:255
[5]中國圖書商報,讀吧網(wǎng).中國電子圖書發(fā)展趨勢報告[R/OL].北京:中國圖書商報&讀吧網(wǎng),2011[2012-11-30].http://news.du8.com/viewnews-88935.html
[6]馬費成,張勤.國內(nèi)外知識管理研究熱點:基于詞頻的統(tǒng)計分析[J].情報學報,2006(2):163-171
[7]鐘偉金,李佳.共詞分析法研究(二):類團分析[J].情報雜志,2008(6):141-143
(收稿日期:2013-04-01)