【摘要】中國人文社會科學缺少自己的國際傳播平臺。這個傳播平臺,并非報紙、期刊、圖書等傳統(tǒng)海外發(fā)行媒介,而是數(shù)字時代將學術生產(chǎn)與學術傳播集于一身的人文社會科學主題圖書數(shù)據(jù)庫。文章闡述了世界人文社科數(shù)據(jù)庫出版的現(xiàn)狀與中國面臨的挑戰(zhàn),提出從傳統(tǒng)圖書出版到擁抱數(shù)字技術再到數(shù)據(jù)庫出版,這是中國傳統(tǒng)出版機構必須經(jīng)歷的一次蛻變,否則無法獲得重新飛翔的力量。
【關鍵詞】世界人文社科數(shù)據(jù)庫;出版;現(xiàn)狀;挑戰(zhàn)
【作者單位】何明星,中國文化走出去效果評估中心,北京外國語大學。
2016年5月27日,習近平總書記在《在哲學社會科學工作座談會上的講話》中指出,“我國哲學社會科學在國際上的聲音還比較小,還處于有理說不出、說了傳不開的境地”。這段話引起全國人文社會科學界廣泛討論,究其原因,除了中國人文社會科學學術創(chuàng)新能力亟須提高,還有一個重要的原因,那就是中國人文社會科學缺少自己的國際傳播平臺。這個傳播平臺,并非報紙、期刊、圖書等傳統(tǒng)海外發(fā)行媒介,而是數(shù)字時代將學術生產(chǎn)與學術傳播集于一身的人文社會科學主題圖書數(shù)據(jù)庫。依筆者的淺見,這是中國哲學社會科學有理說不出、說了傳不開的關鍵原因。
一、數(shù)據(jù)庫的知識傳承與創(chuàng)新
數(shù)據(jù)庫將知識生產(chǎn)與知識傳播完美集于一身,是數(shù)字技術催生的一種新型知識呈現(xiàn)方式。它改寫了人類的知識結構、知識圖譜和知識體系,改寫了人類的認知關系與邏輯關系。在呈現(xiàn)方式上,知識單元可以是一個關鍵詞、一個句子或一個單元,知識單元之間以知識樹的網(wǎng)狀形式彼此關聯(lián)。這個網(wǎng)可以將一個學科、一個領域完全連接起來。在使用方式上,通過關鍵詞、主題詞檢索,用戶隨時可以搜索出所需要的知識單元。知識單元的呈現(xiàn)方式根據(jù)數(shù)據(jù)庫的資源聚合數(shù)量而有所不同。聚合資源量越大的數(shù)據(jù)庫,其知識單元的數(shù)量越多,連接知識單元的網(wǎng)展開得越大,就像一棵根深葉茂的大樹,樹葉、樹冠、樹的枝杈要遠遠超過一棵小樹。
特別是人文社會科學領域,涉及哲學、歷史、宗教、文學、法學等的專業(yè)數(shù)據(jù)庫,恰恰是學術組織、學術生產(chǎn)賴以生存的生產(chǎn)平臺,同時也是知識的傳播平臺。以一個中國文學數(shù)據(jù)庫的結構框架為例,它可以將古代、現(xiàn)代以及當代所有文學作品收入其中,其中不僅有五千年中國所有作家的知識樹單元,還有進入中國五千年文學史的所有詩歌、小說、散文的知識樹單元。以此分類,可以將古往今來對中國文學作品的研究、文學批評的所有成果收入其中。在這樣一個文學數(shù)據(jù)庫的結構中,后來的中國文學家、文學研究者、文學批評依據(jù)歷史已有的成果,可以不斷創(chuàng)造出前人所沒有的體裁、文學內容,并進行前人所沒有進行的文學研究,其最新成果又可以分門別類地進入這個龐大的網(wǎng)狀知識體系中。我們對于思想創(chuàng)新、知識價值的評判,不需要像中國古人那樣“留取丹心照汗青”的歷史評判,一個學術創(chuàng)新是否是真正的創(chuàng)新,達到什么程度是創(chuàng)新,學人自己就可以依據(jù)龐大的數(shù)據(jù)庫所提供的知識單元來評判。數(shù)字化時代將人類文明的繼承與豐富、創(chuàng)新緊密地結合在一起。
由于數(shù)據(jù)庫框架本身也是一定知識結構、學術思想、文化價值的外在呈現(xiàn),因此一個國家擁有自我掌控的數(shù)據(jù)庫平臺、數(shù)據(jù)庫內容的數(shù)量,涉及知識生產(chǎn)與學術傳播的渠道與話語權。可以說,數(shù)據(jù)庫已經(jīng)成為一個國家、地區(qū)文化競爭力的核心形態(tài)。
放眼全球出版界,在教育、科技等學術專業(yè)出版領域,近30年里數(shù)據(jù)庫出版蓬勃發(fā)展,而且日益加速。數(shù)據(jù)庫出版的發(fā)端是期刊。期刊數(shù)據(jù)庫之所以最早得到學術界的青睞,就在于終端用戶可以閱讀其中的某一篇文章,也可以閱讀一系列相關主題文章。今天的學術界要想獲得一個主題在本領域內的相關學術研究進展情況,一般是依靠相關學術期刊數(shù)據(jù)庫,進行主題搜索,閱讀十幾篇學術文章,就可以了解大概情況。這與過去學人購買所有與該領域相關的圖書進行閱讀的緩慢積累過程有很大的不同。今天世界學術界的知識獲取方式與存儲方式,是30年前的學人所無法想象的。
與學術期刊同步進入數(shù)字化階段的,是百科全書、字典、詞典等工具書,數(shù)字技術在相關領域得到了廣泛的應用。百科全書、字典、詞典的使用者不再需要一頁一頁地翻查,通過檢索就可以直接找到所需要的知識點和答案,并且圖文并茂,甚至連聲音都有了;使用者再也不需要像30年前那樣,為一部大部頭的詞典、字典所占據(jù)的空間發(fā)愁,更不必體會搬運的困難了。緊隨其后的是歷史檔案的數(shù)字化,歐美發(fā)達國家的圖書館、檔案館以及博物館,基本完成了數(shù)字化轉型,有些甚至達到數(shù)字化的較高階段。
二、世界數(shù)據(jù)庫的出版商
在當今中國的高校里,我們可以找到任何一種數(shù)據(jù)庫。如以載體分類的期刊數(shù)據(jù)庫、圖書數(shù)據(jù)庫、學位論文數(shù)據(jù)庫、報紙數(shù)據(jù)庫、會議文獻數(shù)據(jù)庫、專利文獻數(shù)據(jù)庫、圖片數(shù)據(jù)庫、影像數(shù)據(jù)庫等等,內容覆蓋所有學科,如哲學、經(jīng)濟學、法學、教育學、文學、歷史學、理學、工學、農(nóng)學、軍事學、管理學、生物科學、醫(yī)學等專業(yè)研究領域。這些數(shù)據(jù)庫的出版與服務商90%以上為西方跨國出版集團壟斷。從性質上分,主要有三類。
第一類是由傳統(tǒng)紙介出版商轉型而來的數(shù)據(jù)庫出版商。如眾所周知的愛思唯爾(Reed Elsevier)集團是全球最大的科學與醫(yī)藥信息出版商,也是從紙質出版向網(wǎng)絡出版轉化最為成功的出版商之一。它旗下的Lexis Nexis網(wǎng)上查詢數(shù)據(jù)庫近年來飛速壯大,已成為全球重要的法律、法規(guī)、稅收和商業(yè)信息提供商。該數(shù)據(jù)庫包含了50億份可搜索的文件,包括美國政府的官方文件和法律、商務、學術、新聞資料。主要的用戶是法律界、工商界、學術界人士。訂閱者包括94%的財富500強公司、1650所美國大學和美國排名前100名的律師事務所。該網(wǎng)站每天的訪問量在200萬人次以上。湯姆森學習出版集團旗下的Thomson Gale數(shù)據(jù)庫,是面向圖書館、學校和工商企業(yè)的大型數(shù)據(jù)庫,包括600多個子數(shù)據(jù)庫,400萬篇論文、2600萬篇期刊文章,500萬份表格、地圖和照片。美國2400萬個有孩子的家庭,查詢Thomson Gale的數(shù)據(jù)庫,以完成幼兒園到高中的家庭作業(yè)。在北美洲,100%的圖書館使用Thomson Gale的數(shù)據(jù)庫。與愛思唯爾、湯姆森學習類似的還有施普林格出版集團、麥格勞·希爾公司、威利父子公司、牛津大學出版社等等。
第二類是由各種學科性的學會、協(xié)會轉型成為專業(yè)數(shù)據(jù)庫出版商。如英國機電工程師學會(1871年成立)創(chuàng)辦了INSPEC數(shù)據(jù)庫,這是以物理、電子與電機工程、計算機與控制工程、信息技術、生產(chǎn)和制造工程為主要專業(yè)方向的理工學科數(shù)據(jù)庫;美國數(shù)學學會(1888年創(chuàng)辦)依托全球600多個學術機構會員和3萬名個人會員創(chuàng)建了數(shù)學專業(yè)數(shù)據(jù)庫;美國亞洲研究協(xié)會依托全世界2萬名會員創(chuàng)建了全世界亞洲研究的文獻目錄數(shù)據(jù)庫(BAS);等等。筆者經(jīng)常使用的聯(lián)機計算機圖書館中心(OCLC,Online Computer Library Center)也是一個由公益性組織轉變?yōu)閿?shù)據(jù)庫服務商的機構。OCLC總部設在美國的俄亥俄州,成立于1967年,迄今為止全球圖書館數(shù)量為23815家(包括公共圖書館5051家,大學圖書館4833家,中小學校圖書館8897家,各類政府圖書館1604家,職業(yè)學院、社區(qū)學院圖書館1074家,企業(yè)圖書館1296家,協(xié)會機構圖書館661家及其他),涉及世界112 個國家和地區(qū)470 多種語言。某種程度上,這些學會、協(xié)會等組織的數(shù)據(jù)庫,比傳統(tǒng)出版商的數(shù)據(jù)庫更具有開發(fā)性。
第三類是政府機構主導數(shù)據(jù)庫,這是數(shù)據(jù)庫建設與研發(fā)投入的主要力量。美國外交部、法院、財政部等機構率先進行了檔案數(shù)字化,美國國家歷史檔案館可以免費提供數(shù)字檔案的查閱服務,美國教育部教育資源信息中心很早就創(chuàng)建了ERJC數(shù)據(jù)庫。
中國社會科學院江小平研究發(fā)現(xiàn),不僅美國,法國早在20世紀70年代就開始進行法國人文社會科學數(shù)據(jù)庫的開發(fā)與研制。在一個名為卡拉姆(Ca lame)的法國人文社會科學網(wǎng)絡數(shù)據(jù)庫檢索平臺上,可以檢索到201個法國人文社會科學數(shù)據(jù)庫,有105個機構參與了這些數(shù)據(jù)庫的研制。這105個機構中,法國文化與交流部的作用舉足輕重,主導研制了22個數(shù)據(jù)庫,法國國家科學研究中心直接署名的數(shù)據(jù)庫有10個,此外還有法國國防部、法國外交部、法國裝備部、法國生態(tài)與持續(xù)發(fā)展部、法國國家圖書館、法國新法蘭西時期移民研究課題組、法國文藝復興研究中心、文本歷史研究所、科學交流中心、里昂大學、法國教育研究所、雷恩第二大學、里昂第二大學、法國文獻出版社、里昂市圖書館等相關單位主導研制的數(shù)據(jù)庫。學科覆蓋面廣,歷史和現(xiàn)實問題并重??ɡ窓z索平臺涉及的學科領域,按數(shù)據(jù)庫的數(shù)據(jù)數(shù)量依次排序是:歷史學、社會學、藝術與藝術史、經(jīng)濟學、文學、政治學、地理學、法學、文化遺產(chǎn)與博物館學、考古學、語言學、社會人類學與人種學、教育學、宗教學、環(huán)境研究、音樂學與舞臺藝術、建筑學、人口學、心理學、哲學、信息與傳播學、管理學、古典文學、生物人類學、方法與統(tǒng)計學、性別研究、科學社會學。排在首位的是歷史學,排在第2位的是社會學,排在第3位的是藝術與藝術史,經(jīng)濟學和文學分別排在第4位和第5位[1]。
海外數(shù)據(jù)庫最主要的盈利模式為收取年費。年費收取受兩種因素影響——訂閱者規(guī)模和同時使用的用戶數(shù)。用戶數(shù)量一般以500人以下、500—2000人、2001—5000人為標準設置不同檔次的年費。從創(chuàng)造利潤的能力來看,針對專業(yè)在職人士的數(shù)據(jù)庫比學校、學生、圖書館的數(shù)據(jù)庫更有利可圖。但總體而言,數(shù)據(jù)庫用戶以機構用戶為主,這是世界著名跨國出版集團主要的盈利來源之一。
三、中國人文社科數(shù)據(jù)庫的現(xiàn)狀與挑戰(zhàn)
與全球數(shù)據(jù)庫蓬勃發(fā)展情況大相徑庭的是,除了少數(shù)自然科學領域,中國近600家出版社大部分還沒有涉足數(shù)據(jù)庫出版。目前,中國僅有期刊數(shù)據(jù)庫在世界上具備一定的競爭實力,分別是清華同方知網(wǎng)(北京)技術有限公司的中國知網(wǎng)、重慶維普資訊有限公司的中文科技期刊全文數(shù)據(jù)庫、北京萬方數(shù)據(jù)股份有限公司的萬方數(shù)據(jù)庫。據(jù)相關資料披露,中國知網(wǎng)(CNKI)收錄學術期刊近7000種,中國知識資源總庫已經(jīng)囊括我國90%的網(wǎng)絡學術信息資源,各類文獻數(shù)量超過7000萬篇,年銷售收入超過6.5億元。萬方數(shù)據(jù)和維普資訊年營收額分別超過3.1億元和0.73億元。但3家合計僅10億元出頭,與中國近1000家高校每年支付海外數(shù)據(jù)庫商超過500億元的總額相比,僅占微不足道的2%。在人文社會科學數(shù)據(jù)庫中,比較有規(guī)模的僅有超星公司的讀秀知識庫,但由于是由技術公司開發(fā)而非傳統(tǒng)出版機構主導,存在新書不多、知識更新緩慢等諸多問題。由傳統(tǒng)出版社主持開發(fā)的只有人民出版社的中國共產(chǎn)黨思想理論資源經(jīng)典數(shù)據(jù)庫,但使用范圍僅局限在國內各個相關機構。
數(shù)字化時代,中國出版社要想做大做強,有發(fā)展的后勁,必須要建立自己的數(shù)據(jù)庫,特別是在中國哲學、文學、歷史、宗教、藝術等具有中國獨有思想文化特色的領域,要建立起自己的知識譜系,在中國自己的文化價值邏輯起點上設立中國人文社會科學的知識單元,并依據(jù)中國哲學社會科學的價值判斷構建知識數(shù)據(jù)庫、知識網(wǎng),經(jīng)過一定時間的積累,在知識框架、內容資源的聚合方面形成世界競爭力,只有這樣,才能真正實現(xiàn)中國人文社會科學世界影響力的擴大。這是事關中國人文社會科學知識生產(chǎn)的百年大計,一些有優(yōu)勢學科的大學出版社、專業(yè)出版社應該大有作為,萬不可因為沒有短期的收益而棄之不顧。
由于數(shù)據(jù)庫能夠將知識生產(chǎn)與傳播集于一身,其知識存儲與傳播形態(tài)的資源吸納能力可以無限提升,因此,數(shù)據(jù)庫能完全取代以一本一本圖書傳承知識的傳統(tǒng)形態(tài),這意味著中國幾十家文學出版社將被一個“中國文學資源中心”所取代。這種趨勢在世界科技、教育等專業(yè)出版領域已經(jīng)日漸明顯。一些專業(yè)數(shù)據(jù)庫資源越豐富,其遍布世界的機構用戶越多,盈利能力越強,并反哺增強了資源的吸納能力,馬太效應日益明顯。一些中小出版機構無法與之競爭,只能淪為跨國數(shù)據(jù)庫的內容提供者。筆者注意到,一些西方跨國數(shù)據(jù)商,已經(jīng)通過各種方式,如免費進行數(shù)據(jù)加工獲得版權,支付一定比例的主編費、版權費等方式,獲取中國最為優(yōu)質的歷史檔案圖書資源,形成中文歷史數(shù)據(jù)庫,然后面向世界各大圖書館、研究機構進行銷售。這是在最為核心的領域進行資源競爭,可惜大多數(shù)中國出版社都沒有清醒地意識到這是自己在放棄陣地。如果中文數(shù)據(jù)庫仍然由西方跨國集團掌控,那么就談不上中國哲學社會科學的影響力了。
從傳統(tǒng)圖書出版到擁抱數(shù)字技術再到數(shù)據(jù)庫出版,這是中國傳統(tǒng)出版機構必須經(jīng)歷的一次蛻變,否則就無法獲得重新飛翔的能力。在所有鳥類中,鷹是世界上壽命最長的鳥,它的壽命可達70歲。但其中的關鍵是,鷹在40歲時,必須很努力地飛到一個懸崖上筑巢,停留150天進行艱苦的蛻變。它先用喙擊打巖石,直到老化的喙完全脫落,然后靜靜地等候新的喙長出來,再用新長出的喙把爪上老化的指甲一根一根地拔出來,當新的指甲長出來后,再把羽毛一根一根地拔掉。如此,5個月以后,新的羽毛長出來了,鷹才能夠獲得新生。
中國出版正在迎來一個世界化時代,這既是中國綜合國力日益增強帶來的必然結果,同時也是中國出版界近10年來持之以恒地實施“走出去”戰(zhàn)略,逐步邁向世界文化大國之路的必經(jīng)階段。正如唐代詩人李商隱的一句詩所言:“班騅只系垂楊岸,何處西南待好風?”中國出版社必須在世界視野下,像鷹一樣進行蛻變,拋棄傳統(tǒng)出版形態(tài),大膽擁抱數(shù)據(jù)庫出版,才能獲得重新飛翔的能力,真正不辜負這個偉大的時代。
[1]江小平. “法國人文社會科學網(wǎng)絡數(shù)據(jù)庫調研分析[J]. 國外社會科學,2010(3):39-40.