□鄒新明 朱本軍 張麗靜
2010年9月23日,北大圖書館自建數(shù)據(jù)庫(kù)“北大博文”(http://bowen.lib.pku.edu.cn/)正式對(duì)外發(fā)布。顧名思義,“北大博文”是匯集北大人博客文章的特色數(shù)據(jù)庫(kù)。
據(jù)筆者粗略的調(diào)查,“北大博文”是國(guó)內(nèi)首家收集整理博客文章的數(shù)據(jù)庫(kù),是網(wǎng)絡(luò)資源整理開發(fā)的新的嘗試。作為此類數(shù)據(jù)庫(kù)的探索性建設(shè),“北大博文”雖然并不完美,但它卻具有一定的探索和借鑒意義。筆者不揣淺陋,擬就“北大博文”的建設(shè)思路、具體做法及相關(guān)思考三方面略加介紹,以就教于方家。
“北大博文”是由北大圖書館特藏部創(chuàng)意建設(shè)的。最初的靈感來(lái)自對(duì)“博客”這一日漸流行的網(wǎng)絡(luò)交流傳播形式的關(guān)注。
“博客”是繼E-mail、BBS、ICQ 之后出現(xiàn)的網(wǎng)絡(luò)交流媒介之一,大約2000年左右在中國(guó)開始流行,在網(wǎng)上開設(shè)博客一度成為時(shí)尚。博客之所以吸引大眾的參與,在于它自由的表達(dá)方式和平等的發(fā)表環(huán)境。但毋庸諱言的是,精英博客的影響力一般遠(yuǎn)遠(yuǎn)大于普通人的博客。
在關(guān)注博客的過(guò)程中,我們注意到,北大的很多學(xué)者都開設(shè)了自己的博客,并且顯示出越來(lái)越巨大的影響力,這與他們以及北大在學(xué)術(shù)界的聲譽(yù)地位有很大的關(guān)系。從我們的深入調(diào)查看,雖然有的學(xué)者淺嘗輒止,但仍有不少學(xué)者對(duì)博客這種自由便捷的思想表達(dá)和傳播方式情有獨(dú)鐘,數(shù)年下來(lái),“積攢”了數(shù)百篇博文的學(xué)者大有人在。陳平原、饒毅、張維迎、曹文軒、賀衛(wèi)方、孔慶東、何懷宏、吳國(guó)盛、王岳川、張頤武、鄭也夫、林毅夫、汪丁丁、姚洋,……這些北大的名師,不僅在學(xué)術(shù)圈內(nèi)聲名顯赫,他們的博客在普通人群中也具有很強(qiáng)大的號(hào)召力,擁有眾多的愛(ài)好者、支持者。
北大學(xué)者博文的內(nèi)容,我們可以借用“北大博文”的廣告詞來(lái)概括:“這里有獨(dú)坐書齋的玄思冥想,這里有放眼天下的激揚(yáng)文字,這里有苦辣酸甜的北大往事,這里有睿智幽默的人生感悟?!睉?yīng)該說(shuō),“北大博文”的內(nèi)容正是北大學(xué)術(shù)文化傳統(tǒng)的很好的體現(xiàn)。眾所周知,北大學(xué)者既潛心學(xué)術(shù),苦苦求索,又以天下為己任,關(guān)心時(shí)事。翻開北大的百余年歷史,我們可以看到以北大教授為核心的《新青年》編輯部同仁對(duì)中國(guó)思想文化的巨大影響;可以了解回國(guó)之初發(fā)誓“二十年不談?wù)巍钡暮m,于1922年創(chuàng)辦《努力周報(bào)》,忍不住公開批評(píng)時(shí)政;可以發(fā)現(xiàn)抨擊孔、宋權(quán)貴,被稱為“傅大炮”的傅斯年……。可以說(shuō),北大的學(xué)術(shù)思想的影響,不僅限于北大,也不僅限于學(xué)術(shù)界,已經(jīng)擴(kuò)展到中國(guó)思想、文化、政治等廣闊領(lǐng)域。正是由于這種積極入世、關(guān)心天下事的傳統(tǒng),北大學(xué)者的博文往往關(guān)注當(dāng)下的時(shí)事問(wèn)題,如國(guó)家發(fā)展研究院、光華管理學(xué)院、經(jīng)濟(jì)學(xué)院的學(xué)者經(jīng)常對(duì)當(dāng)前經(jīng)濟(jì)熱點(diǎn)問(wèn)題提出自己的看法,北大法學(xué)院的教授則對(duì)時(shí)下的法律熱點(diǎn)問(wèn)題進(jìn)行解讀或批評(píng)等等。他們既具有廣博的專業(yè)知識(shí),又具有敏銳的現(xiàn)實(shí)洞察力,因此發(fā)表的博文往往分析透徹,切中要害,深受喜歡思考現(xiàn)實(shí)問(wèn)題的讀者的喜愛(ài)。
從北大學(xué)者博客的內(nèi)容看,這些博文相當(dāng)于書寫時(shí)代的日記、札記、隨筆等,這些資料不僅是他們個(gè)人的學(xué)術(shù)史和傳記的重要資料,也是北大學(xué)術(shù)史,乃至中國(guó)思想文化史的重要資料,這些博客將成為未來(lái)歷史學(xué)家研究我們這個(gè)時(shí)代的重要參考。此外,由于博客的自由隨意的特點(diǎn),很多博文更能反映北大學(xué)者的真性情,這些文字是在正式出版的著作、論文中難得一見的,因此更顯珍貴。
從目前北大學(xué)者的博客看,他們一般都散見于不同的網(wǎng)站,如新浪、搜狐、網(wǎng)易等,而且很多人的博客都經(jīng)歷了幾次“搬遷”,這就給閱讀者帶來(lái)很大不便。
另一方面,由于博客服務(wù)提供商的不穩(wěn)定性,而且由于他們提供的是免費(fèi)博客托管,往往對(duì)博客服務(wù)的安全性和穩(wěn)定性不承擔(dān)任何責(zé)任,一旦博客服務(wù)提供商出現(xiàn)問(wèn)題或者中斷服務(wù),后果可想而知。因此,博客在長(zhǎng)期存取方面存在很大的隱患。
鑒于上述原因,我們認(rèn)為有必要對(duì)北大學(xué)者的博客進(jìn)行收集整理,保存這些珍貴而易被忽視、遺失的資料,同時(shí)為讀者瀏覽提供方便。
據(jù)筆者調(diào)查,目前國(guó)內(nèi)討論圖書館收藏博客資源的論文僅有浙江傳媒學(xué)院圖書館朱丹陽(yáng)的《博客作為圖書館館藏資源的可能性初探》[1]。此外,武漢大學(xué)圖書館的謝春枝探討了博客長(zhǎng)期存取的問(wèn)題[2][3]。實(shí)踐方面,據(jù)介紹,英國(guó)2004年開始的第一個(gè)公眾網(wǎng)絡(luò)信息保存計(jì)劃UKWAC就包括博客的歸檔保存,而新加坡國(guó)家圖書館則計(jì)劃于2010年前對(duì)在新加坡注冊(cè)的所有博客進(jìn)行存檔。
在確定對(duì)北大學(xué)者博客進(jìn)行收集、整理、保存的必要性之后,我們對(duì)此項(xiàng)創(chuàng)意的可行性進(jìn)行了調(diào)查分析,主要包括以下三個(gè)方面。
1.2.1 硬件保證
就現(xiàn)在博文的情況而言,一般以文字為主,即使涉及圖片,一般都比較小。因此,博文數(shù)據(jù)庫(kù)對(duì)于計(jì)算機(jī)和網(wǎng)絡(luò)等硬件方面沒(méi)有太高的要求。
1.2.2 讀者群
隨著網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)閱讀已經(jīng)成為很多人的重要閱讀方式,這其中就包括博文的閱讀。而北大學(xué)者博客現(xiàn)在和潛在的影響力都不容低估,他們的博文會(huì)受到校內(nèi)外讀者的喜愛(ài)。
1.2.3 現(xiàn)有博文的規(guī)模
所謂“巧婦難為無(wú)米之炊”,“北大博文”能否成功的關(guān)鍵在于北大學(xué)者的博文是否已經(jīng)具有一定的規(guī)模。據(jù)我們不完全網(wǎng)絡(luò)調(diào)查,北大學(xué)者擁有自己博客的至少有70余人,其中經(jīng)常堅(jiān)持更新的有30余人,累計(jì)博文在一百篇以上的有22人,其中三人的累計(jì)量更是高達(dá)七八百篇。從上述調(diào)查情況看,“北大博文”已有數(shù)千篇的基本積累,并且可以保證每天數(shù)篇的更新量,既有一定規(guī)模,又有一定的發(fā)展前景。
如果說(shuō)上面討論的三個(gè)方面大致相當(dāng)于“北大博文”建設(shè)的天時(shí)、地利,那么可以說(shuō),“北大博文”還具備了建設(shè)的“人和”因素。首先,特藏部提出的“北大博文”創(chuàng)意得到北大圖書館領(lǐng)導(dǎo)的肯定和大力支持。其次,特藏部和系統(tǒng)部積極協(xié)作,特藏部負(fù)責(zé)“北大博文”的總體設(shè)計(jì),系統(tǒng)部負(fù)責(zé)軟件平臺(tái)的開發(fā)維護(hù)。于是,在各方面條件都很成熟有利的情況下,“北大博文”順利建成。
在進(jìn)行了一定的博文閱讀,并經(jīng)多次協(xié)商討論之后,我們決定采取先經(jīng)網(wǎng)絡(luò)聚合器收集,再人工遴選發(fā)布的辦法,對(duì)于沒(méi)有收集的舊博文和沒(méi)有訂閱地址的博客,則采取人工收集的方式,然后在發(fā)布平臺(tái)整理發(fā)布。
此外,我們認(rèn)為有必要對(duì)博文的內(nèi)容進(jìn)行一定的分析歸類,為讀者的閱讀提供一定的引導(dǎo)和幫助。經(jīng)過(guò)研究,我們?cè)O(shè)立了六大類欄目:人文時(shí)事、人生百味、北大往事、燕園論學(xué)、休閑娛樂(lè)、職場(chǎng)經(jīng)驗(yàn)。為方便讀者,“北大博文”首頁(yè)設(shè)有分類檢索和按院系瀏覽欄。
“北大博文”主要分為收集和發(fā)布兩大環(huán)節(jié),由于目前無(wú)法做到將二者結(jié)合,一步到位,系統(tǒng)部設(shè)計(jì)了采集和發(fā)布兩個(gè)平臺(tái),均采用開源軟件。在軟件平臺(tái)的選擇上,我們做了綜合考慮:一是數(shù)據(jù)要有很好的互操作性,便于管理和維護(hù),避免出現(xiàn)“信息孤島”。二是軟件平臺(tái)需要有非常好的開放性,便于圖書館本地設(shè)計(jì)界面風(fēng)格、增減功能?,F(xiàn)分別加以介紹:
2.2.1 開源采集平臺(tái)Gregarius
Gregarius是一款基于 Web的RSS/RDF/ATOM新聞聚合器。通過(guò)它可以收割來(lái)自不同博客源的數(shù)據(jù)。同時(shí)可以O(shè)PML標(biāo)準(zhǔn)導(dǎo)入/導(dǎo)出數(shù)據(jù)。
2.2.2 開源發(fā)布平臺(tái) WordPress
Word Press最初是一個(gè)專門用來(lái)發(fā)布個(gè)人博客的開源軟件,但最近一些年系統(tǒng)在開源社區(qū)的管理維護(hù)下逐漸升級(jí),不僅擁有了強(qiáng)大的內(nèi)容管理功能,而且具備良好的開放性。使用WordPress軟件的用戶可以直接從開源社區(qū)中下載使用其主題(http://wordpress.org/extend/themes/)和功能插件(http://wordpress.org/extend/plugins/),也可 以本地開發(fā)相應(yīng)主題和插件。除此之外,在數(shù)據(jù)互操作性方面也非常友好,用戶可以利用WordPress自帶數(shù)據(jù)工具導(dǎo)出XML格式的數(shù)據(jù),還可以利用開源社區(qū)的功能插件,如Export Post插件、Photo Gallery XML Export插件等與其他數(shù)據(jù)系統(tǒng)進(jìn)行數(shù)據(jù)互操作,避免系統(tǒng)成為一個(gè)信息孤島。
“北大博文”的操作比較簡(jiǎn)單,首先利用“北大博文聚合服務(wù)器”實(shí)時(shí)收集更新博文,然后通過(guò)Word-Press控制臺(tái)編輯發(fā)布博文。主要需要操作的各項(xiàng)包括添加博文題名,編輯博客文本,添加博主姓名、博客地址、博文時(shí)間、博主所在院系等內(nèi)容,給出博文分類等。
“北大博文”自發(fā)布以來(lái),已發(fā)布博文1300余篇,引起讀者的關(guān)注,受到讀者的好評(píng),讀者瀏覽量也不斷上升,月瀏覽量已經(jīng)上升到近9000次(2010年11月24日至12月23日)。從2010年11月24日至12月23日一個(gè)月的調(diào)查統(tǒng)計(jì)看,訪問(wèn)者52%來(lái)自北京,其余則來(lái)自北京以外各省市,以河南、廣東、江蘇、山東等省為多。
“北大博文”發(fā)布后,也吸引了一些讀者積極參與,經(jīng)濟(jì)學(xué)院、馬克思主義學(xué)院兩位老師主動(dòng)聯(lián)系我們,要求添加他們的博客。同時(shí),也有讀者與我們聯(lián)系,提出改善意見。
在進(jìn)行博文的收集整理過(guò)程中,筆者也對(duì)遇到的問(wèn)題進(jìn)行了一些思考。
收集發(fā)布博文的形式問(wèn)題,是采取我們目前的收集整理重新發(fā)布的方式,還是采取網(wǎng)絡(luò)聚合的方式?應(yīng)該說(shuō)這兩種方式各有利弊,前者便于工作人員對(duì)博客內(nèi)容進(jìn)行一定的篩選,并為讀者閱讀提供一定的引導(dǎo),不足是要一篇篇手工添加,比較費(fèi)時(shí)費(fèi)力,而且不能保持博客的原貌。后者只要添加訂閱地址,后續(xù)工作由網(wǎng)絡(luò)聚合器自動(dòng)執(zhí)行,比較方便易行,不足是不能對(duì)博客內(nèi)容進(jìn)行管理控制,而且對(duì)于沒(méi)有訂閱地址的博客無(wú)法收入,也無(wú)法回溯舊的博文。
博客是全部照收,還是有所挑選。筆者現(xiàn)在執(zhí)行的原則是堅(jiān)持原創(chuàng)性,對(duì)于轉(zhuǎn)貼的文字一律不收。在具體內(nèi)容上,一些與博文沒(méi)有直接關(guān)系的照片不收,一些容易引起歧義或爭(zhēng)執(zhí)的博文暫時(shí)不收。這樣的做法,無(wú)疑會(huì)對(duì)保持博文的完整性產(chǎn)生影響,具體應(yīng)該如何處理,還須進(jìn)一步探討。
從收藏內(nèi)容看,高校師生博客可以看作高校文庫(kù)的新的潛在收藏資源。從這一意義上說(shuō),“北大博文”現(xiàn)在的收錄范圍還是比較狹窄的,需要擴(kuò)充到學(xué)生和更多的老師。另外,由于人力有限,我們目前收錄的以北大人文社科的學(xué)者的博客為主,而且以最新博客為主,他們往日的積累還沒(méi)有完全回溯發(fā)布。因此,我們認(rèn)為,“北大博文”還有很多工作要做,具體包括:
3.3.1 收集和征集更多的博客
(1)教師博客
由于教師博客一般采用實(shí)名,這就為搜索他們的博客提供了方便。下一步準(zhǔn)備對(duì)理工科各院系老師的博客實(shí)行“地毯式搜索”,進(jìn)一步發(fā)現(xiàn)新的博客。此外還要通過(guò)一定的形式宣傳“北大博文”,征集博客地址。
(2)學(xué)生博客
學(xué)生博客一般不使用實(shí)名,即使采用實(shí)名,由于重名者很多,給辨別博主是否為北大學(xué)生帶來(lái)很大困難。北大學(xué)生思想活躍,他們的博客也是不容忽視的重要資源,因此必須想辦法通過(guò)諸如公開征集、深入調(diào)查等方式來(lái)收集他們的博客。
3.3.2 已經(jīng)收集博客的回溯
由于目前博文發(fā)布采取人工拷貝粘貼的方式,舊博客的回溯非常費(fèi)功夫,需要一定的人力保障。
3.3.3 關(guān)注并考慮是否收錄“微博”
“微博”由于技術(shù)門檻低,發(fā)布途徑多而頗受青睞。北大人的微博現(xiàn)狀如何,需要加以調(diào)查,并根據(jù)實(shí)際情況決定是否收入“北大博文”。
“北大博文”是我們對(duì)網(wǎng)絡(luò)資源整理開發(fā)的一個(gè)嘗試,它多少體現(xiàn)了E時(shí)代圖書館人在資源整合方面的重要作用,同時(shí)也提醒我們關(guān)注新的媒介資源,及時(shí)加以收集、整理和保存,并提供相應(yīng)的服務(wù)。
最后,我們希望“北大博文”能夠起到“拋磚引玉”的作用,期待更多同仁加入到博客的收集整理行列,彼此互通有無(wú),共同提高。
參考資料
1 朱丹陽(yáng).博客作為圖書館館藏資源的可能性初探.情報(bào)探索,2009(1):71-73
2 謝春枝.博客長(zhǎng)期存取的國(guó)外研究與實(shí)踐.圖書情報(bào)工作,2009,53(8):50-53
3 謝春枝.博客長(zhǎng)期存取的現(xiàn)狀和對(duì)策研究.圖書情報(bào)知識(shí),2009(6):81-86