摘要:建設(shè)科技名人檔案專題庫,有助于保存科技歷史、傳承科學(xué)文化、弘揚科學(xué)家精神。論文遴選出五個國內(nèi)外典型科技名人檔案專題庫,從資源維度(遴選原則、采集渠道、維護機制)和服務(wù)維度(檢索服務(wù)、交互服務(wù))調(diào)查科技名人檔案專題庫現(xiàn)狀,并從收集、管理、開發(fā)、利用四個方面總結(jié)建設(shè)困境,提出創(chuàng)新資源建設(shè)機制、完善平臺功能建設(shè)、加強檔案數(shù)據(jù)組織和強化數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)與協(xié)作共享的突破路徑。
關(guān)鍵詞:科技名人 檔案專題庫 名人檔案
科技名人是在科學(xué)研究與工程技術(shù)領(lǐng)域取得創(chuàng)造性成就、作出杰出貢獻的人物??萍济藱n案是科技名人在科研、工作、生活中直接或間接形成的具有保存價值的文字、圖表、聲像等不同形式的歷史記錄。隨著全社會檔案意識的增強,檔案館、圖書館、博物館等各類機構(gòu)開始注重科技名人檔案資源的收集,并開展了大量有益的實踐。諸多學(xué)者也圍繞科技名人檔案的概念內(nèi)涵、建檔過程與方法、資源開發(fā)利用等展開研究。[1]
本文以科技名人檔案專題庫為研究對象,通過網(wǎng)絡(luò)調(diào)查法與案例分析法調(diào)研國內(nèi)外五個典型科技名人檔案專題庫,分析專題庫建設(shè)與運行中面臨的困境,提出科技名人檔案專題庫建設(shè)的突破路徑。
本文遴選出五個具有代表性的國內(nèi)外科技名人檔案專題庫作為典型代表,并將其分為以下四種類型:(1)以高校為代表的人文研究機構(gòu),如希伯來大學(xué)愛因斯坦網(wǎng)上檔案館[2]、哥倫比亞大學(xué)口述歷史研究中心[3];(2)以中國科學(xué)院、工程院為代表的院士富集機構(gòu),如中國工程院院士館;(3)以檔案館為代表的文化保藏機構(gòu),如中國科學(xué)院檔案館科學(xué)家知識圖譜平臺;(4)以科學(xué)家博物館為代表的專門機構(gòu),如中國科學(xué)家博物館。下面將從資源內(nèi)容和服務(wù)功能兩個維度對科技名人檔案專題庫建設(shè)現(xiàn)狀展開分析。
(一)資源內(nèi)容現(xiàn)狀
1.資源遴選原則,以建設(shè)單位需求為導(dǎo)向打造特色資源。科技名人檔案專題庫首要服務(wù)于其建設(shè)單位,其建設(shè)運營的需求直接決定著數(shù)據(jù)資源遴選要求。(1)以服務(wù)學(xué)術(shù)研究為目標(biāo),從檔案編研與利用角度開展科技名人研究,幫助歷史學(xué)家、學(xué)者和公眾更好地理解人物經(jīng)歷與社會變遷,如哥倫比亞大學(xué)口述歷史研究中心重點加強口述歷史文字與音視頻檔案的建設(shè)。(2)以建設(shè)科技名人綜合信息平臺為目標(biāo),系統(tǒng)整合科技名人學(xué)術(shù)和非學(xué)術(shù)資源,多角度詮釋科技名人的人生經(jīng)歷、學(xué)術(shù)精神與科研歷程,打造科技名人綜合信息資源專題庫,如中國工程院院士館除了包含院士基本信息、成就貢獻、人生歷程等信息外,還包含院士聲像資料、書畫詩詞作品、成果思想等內(nèi)容。(3)以弘揚科學(xué)家精神為目標(biāo),圍繞本機構(gòu)、本地區(qū)、本領(lǐng)域科技名人,廣泛搜集并集中展示,如中國科學(xué)院檔案館科學(xué)家知識圖譜平臺,通過數(shù)據(jù)化加工、知識化組織、可視化呈現(xiàn)多維度展示科學(xué)家精神。(4)多元綜合目標(biāo),如中國科學(xué)家博物館從2009年開始系統(tǒng)、廣泛地收集科技名人的學(xué)術(shù)成長資料,以科技人物為專題系統(tǒng)采集相關(guān)檔案資源并進行開發(fā),已形成“采集、館藏、研究、展示、教育、宣傳”一體格局。不難發(fā)現(xiàn),國內(nèi)外專題庫在資源遴選思路上各有側(cè)重,國外聚焦于資源深度,而國內(nèi)則更聚焦于資源廣度,凸顯各自的建設(shè)特色。
2.資源采集渠道,以本機構(gòu)檔案為基礎(chǔ)實現(xiàn)來源多元化。國內(nèi)外各專題庫大多是在本機構(gòu)科技名人檔案資源的基礎(chǔ)上,結(jié)合外部合作或購置數(shù)據(jù)等渠道實現(xiàn)多元化集成。希伯來大學(xué)愛因斯坦網(wǎng)上檔案館的資源主要來自愛因斯坦捐贈給希伯來大學(xué)的檔案材料,還包括一些私人收藏和研究人員捐贈的材料。哥倫比亞大學(xué)口述歷史研究中心除了收錄自身主導(dǎo)開展的口述歷史項目檔案,還通過接受捐贈和合作項目等不斷擴大收集范圍。中國工程院院士館收錄的數(shù)據(jù)主要來自官方,也得到了各類出版機構(gòu)、媒體的支持。中國科學(xué)院檔案館科學(xué)家知識圖譜平臺主要依托館藏相關(guān)檔案資源,并以外部權(quán)威渠道發(fā)布的科學(xué)家公開信息為補充。中國科學(xué)家博物館依托采集工程收集的手稿、口述文字、錄音、著作、書信、證書等幾乎覆蓋所有檔案載體與門類。除此之外,它還收藏科學(xué)家史料解讀、人物報道、論文目錄等。
3.資源維護機制,以項目支持為依托更新數(shù)據(jù)??萍济藱n案專題庫的建設(shè)與運行通常為公益類事業(yè),需要穩(wěn)定、持續(xù)的財政支持與投入,一般依托持續(xù)性項目或?qū)iT機構(gòu)保障數(shù)據(jù)更新。希伯來大學(xué)愛因斯坦網(wǎng)上檔案館、哥倫比亞大學(xué)口述歷史研究中心擁有專業(yè)化檔案管理團隊,主要依賴持續(xù)的檔案征集、研究與合作項目確保資源更新。中國工程院院士館借助院士增選契機,實現(xiàn)院士名單與資源內(nèi)容的年度更新。中國科學(xué)院檔案館科學(xué)家知識圖譜平臺以項目形式進行資源建設(shè),綜合運用自然語言學(xué)習(xí)等技術(shù)以半自動化方式實現(xiàn)數(shù)據(jù)加工處理、關(guān)聯(lián)展示等。中國科學(xué)家博物館依托老科學(xué)家學(xué)術(shù)成長資料采集工程項目,按人、分批次實現(xiàn)內(nèi)容數(shù)據(jù)的長期更新。
(二)服務(wù)功能現(xiàn)狀
1.依靠普通檢索功能提供檔案資源查詢服務(wù)。普通檢索通常基于檔案的整理分類方式,允許用戶通過輸入關(guān)鍵詞來查找所需的檔案信息,一般分為基本檢索和高級檢索。如希伯來大學(xué)愛因斯坦網(wǎng)上檔案館提供普通檢索、高級檢索和專家檢索。哥倫比亞大學(xué)口述歷史研究中心在高級檢索中限定檢索范圍、排序方式、頁面顯示結(jié)果的數(shù)量,優(yōu)化檢索結(jié)果。中國工程院院士館擴大基礎(chǔ)檢索范圍,提供10個檢索字段。中國科學(xué)院檔案館科學(xué)家知識圖譜平臺允許用戶一框式檢索姓名和檔案資源題名。中國科學(xué)家博物館提供公眾版和學(xué)術(shù)版兩個門戶,均提供全文關(guān)鍵字檢索服務(wù)??傮w來看,大多數(shù)專題庫仍通過傳統(tǒng)檢索功能服務(wù)用戶。
2.通過社交媒體分享等提供簡單交互服務(wù)。移動互聯(lián)技術(shù)和社交網(wǎng)絡(luò)的迅速發(fā)展,使得檔案專題庫與用戶之間、用戶與用戶之間的互動更為緊密和多樣化。社交媒體強大的互動性、即時性和廣泛性為檔案專題庫提供了與用戶直接交流的渠道,如希伯來大學(xué)愛因斯坦網(wǎng)上檔案館支持臉書、推特等社交媒體分享。哥倫比亞大學(xué)口述歷史研究中心將用戶細分為校友、教員、學(xué)生與訪客,支持用戶與館員在線問答。中國工程院院士館提供留言、評論、基本信息下載、社交媒體分享等。然而社交媒體上的交流與互動往往呈現(xiàn)碎片化、表面化的特點,科技名人檔案的內(nèi)容常涉及科技、歷史、文化等領(lǐng)域,具有一定的深度和廣度,需要用戶投入更多的時間和精力去理解與消化。[4]
基于上述現(xiàn)狀分析,本文總結(jié)出目前科技名人檔案專題庫建設(shè)面臨資源、平臺、知識挖掘與開放四個方面的困境。
(一)資源建設(shè)缺乏保障機制
在資源采集方面,目前科技名人檔案專題庫資源建設(shè)仍然主要依賴特定項目的形式開展,資源采集工作大多通過人工定向的方式進行,雖然確保了資源的質(zhì)量相對可靠,但整體效率較為低下,而且難以形成持續(xù)性的資源增長機制。在資源整合方面,科技名人活動地域廣、時間跨度長,其在科研、教學(xué)、交流等活動中直接或間接產(chǎn)生的檔案材料數(shù)量龐大,且分散在許多機構(gòu)和個人手中,形成了多源異構(gòu)的檔案資源體系,因此需要視資源實際情況開展大量非標(biāo)準(zhǔn)化處理操作,才能將其有效整合到專題庫中。在數(shù)據(jù)維護方面,受限于項目形式,專題庫的資源難以保證長期更新維護。我們在實際調(diào)研中也發(fā)現(xiàn)有數(shù)據(jù)滯后、錯漏等問題,無法真實、準(zhǔn)確地反映科技名人的最新動態(tài)和研究成果。
(二)平臺功能和受眾單一
較為單一的平臺功能和受眾,限制了檔案資源的傳播。在功能方面,大多數(shù)科技名人檔案專題庫首先被定位為存儲庫,其功能設(shè)計相對基礎(chǔ)且單一,通常僅提供傳統(tǒng)的檢索功能,允許用戶通過關(guān)鍵詞、作者或日期等查找信息;支持簡單的瀏覽功能,用戶能夠按照分類查看檔案內(nèi)容;融入現(xiàn)代社交媒體元素,提供有限的分享、留言等功能,但缺乏深度互動和多樣化的傳播方式,限制了用戶對檔案資源的充分利用。在受眾方面,大多數(shù)科技名人檔案專題庫主要面向?qū)W者、研究人員等特定群體,在提供服務(wù)的內(nèi)容和形式上缺乏多元化,無法滿足不同用戶的個性化需求。例如,對于普通公眾而言,他們可能并不關(guān)心專業(yè)的資源內(nèi)容本身或數(shù)據(jù)分析,而是更加關(guān)注檔案背后的人物故事、精神內(nèi)涵及與之相關(guān)的歷史文化背景。
(三)知識挖掘和組織有待提升
雖然部分科技名人檔案專題庫嘗試運用知識圖譜、數(shù)據(jù)挖掘等前沿技術(shù)對科技名人檔案資源進行挖掘,呈現(xiàn)科技名人學(xué)術(shù)畫像、科研關(guān)系網(wǎng)等重要信息,但整體表現(xiàn)上仍顯不足,資源的可解讀、可關(guān)聯(lián)、可再組與可共享性有待提高。首先,可視化呈現(xiàn)往往以表層化、碎片化、孤立化形式存在,缺乏系統(tǒng)性和連貫性,用戶難以全面、深入理解科技名人的學(xué)術(shù)貢獻、科研歷程及其背后的社會文化背景。其次,專題庫之間的數(shù)據(jù)壁壘尚未完全打破,導(dǎo)致資源的共享性和互操作性受限,進一步影響了知識挖掘的深度和廣度。最后,新一代信息技術(shù)在檔案資源開發(fā)中的潛力有待挖掘,尤其是在科學(xué)家群體特征、科學(xué)家成長規(guī)律和科學(xué)家精神的深度挖掘與知識服務(wù)上有較大的提升空間,以進一步支撐數(shù)字時代科技記憶的保存與建構(gòu)。
(四)檔案資源開放關(guān)聯(lián)受限
部分科技名人檔案專題庫因版權(quán)限制、個人隱私保護要求或機構(gòu)內(nèi)部政策,無法完全面向公眾開放,一定程度上限制了公眾對檔案資源的獲取和利用。大多數(shù)科技名人檔案專題庫也未能提供開放的接口或通用的元數(shù)據(jù)導(dǎo)出功能。這意味著用戶在使用這些資源時往往受限于專題庫自身的界面和功能,難以進行深度的數(shù)據(jù)分析和個性化的應(yīng)用。這種封閉性不僅限制了用戶的創(chuàng)造力,也阻礙了檔案資源的進一步開發(fā)和利用。此外,目前科技名人檔案專題庫建設(shè)主體呈現(xiàn)多元化趨勢,涉及高校、科研院所、檔案館、圖書館等多個機構(gòu),由此帶來的管理分散、重復(fù)建設(shè)、合作度低、數(shù)據(jù)標(biāo)準(zhǔn)格式不統(tǒng)一等問題,也進一步限制了科技名人檔案專題庫橫向關(guān)聯(lián)拓展,影響了檔案資源的共享效率與范圍。
2011年,中國科學(xué)院學(xué)部啟動“中國科學(xué)院院士文庫”項目,系統(tǒng)采集、整理中國科學(xué)院院士科研生涯中積累的豐富檔案資料,經(jīng)過10余年建設(shè),初步建成中國科學(xué)院院士群體的檔案專題庫?;谏鲜鰡栴}分析,下面將結(jié)合中國科學(xué)院院士文庫建設(shè)實踐,提煉科技名人檔案專題庫在資源建設(shè)機制、功能建設(shè)、數(shù)據(jù)組織、協(xié)作共享等方面的突破路徑,為科技名人檔案專題庫建設(shè)與發(fā)展提供參考。
(一)創(chuàng)新資源建設(shè)機制,從人工采集到人機協(xié)同
科技名人檔案專題庫的核心是資源建設(shè),所以尤其要注重如何高效且全面地匯集高質(zhì)量的信息資源。首先,應(yīng)基于專題庫已有資源,持續(xù)開展多渠道人工采集,努力獲取或交換更多資源,不斷豐富和擴充專題庫的內(nèi)容,打牢資源基礎(chǔ)。其次,應(yīng)為科技名人團隊提供自主上傳檔案資料的渠道,鼓勵科技名人及其團隊直接參與到專題庫的建設(shè)中來,確保檔案資料的真實性和權(quán)威性,形成良性循環(huán)。最后,應(yīng)充分利用人工智能和大數(shù)據(jù)技術(shù),對互聯(lián)網(wǎng)上科技名人的學(xué)術(shù)成果、新聞資訊動態(tài)進行動態(tài)監(jiān)測、自動抓取和智能分析,保障檔案資源內(nèi)容的時效性和全面性。中國科學(xué)院院士文庫面向院士群體建設(shè)交互服務(wù)專題庫,通過網(wǎng)絡(luò)端、手機端給院士個人及其認(rèn)證的特定人員開放端口,供他們自主上傳圖片、語音、視頻等資源,并可對庫存檔案數(shù)據(jù)進行編輯,項目組對編輯內(nèi)容進行審查后可用于展示。
(二)完善平臺功能建設(shè),從資源匯集到分眾服務(wù)
大數(shù)據(jù)時代科技名人檔案專題庫作為連接科技名人和公眾的橋梁,既要注重資源的匯集與存儲、體現(xiàn)專題庫記憶庫的功能,[5]又要在數(shù)字賦能的加持下深度分析不同目標(biāo)人群的需求與習(xí)慣,從原來單純的檔案資源匯聚定位轉(zhuǎn)向利用檔案組織分眾服務(wù)定位,即根據(jù)受眾需求的差異性,面向特定群體提供特定檔案信息與服務(wù)。這一過程強調(diào)個性化和定制化,以滿足不同個體的需求。中國科學(xué)院院士文庫針對學(xué)術(shù)型用戶,重視學(xué)術(shù)類檔案資源的采集與組織,借鑒前端控制理念,[6]追蹤院士科研工作進展,及時增補學(xué)術(shù)成果檔案,檢索功能上加強智能化、個性化服務(wù);細化描述粒度,增強內(nèi)容的真實性和完整性,提高院士使用黏性;針對普通公眾,利用數(shù)據(jù)可視化技術(shù)展示檔案資源的規(guī)模和多樣性,多模態(tài)構(gòu)建院士鮮活生動的形象,同時提供圖文、音視頻結(jié)合的專題頁面,弘揚科學(xué)家精神。
(三)加強檔案數(shù)據(jù)組織,從數(shù)據(jù)管理到知識發(fā)現(xiàn)
充分運用新一代信息技術(shù)提升數(shù)據(jù)組織與知識挖掘能力,是科技名人檔案專題庫建設(shè)未來的發(fā)展方向。建設(shè)科技名人檔案專題庫,一要構(gòu)建動態(tài)數(shù)據(jù)更新機制,即當(dāng)科技名人有新的學(xué)術(shù)成果、榮譽獎項或其他動態(tài)信息時,利用爬蟲或API接口等大數(shù)據(jù)技術(shù)實現(xiàn)數(shù)據(jù)的自動更新,并對采集數(shù)據(jù)進行智能分類標(biāo)注,獲取高頻次、全覆蓋的科技名人新聞輿情監(jiān)測數(shù)據(jù)。二要加強對科技名人檔案的深度挖掘,實現(xiàn)從檔案數(shù)據(jù)的管理到檔案知識的發(fā)現(xiàn),可以借助大數(shù)據(jù)挖掘技術(shù),研究科技名人科學(xué)觀念或思維模式的形成機理,[7]利用可視化工具構(gòu)建學(xué)術(shù)譜系圖,挖掘科技名人及其學(xué)術(shù)共同體的學(xué)術(shù)譜系,揭示科技名人的知識傳承與發(fā)展脈絡(luò),[8]完善國家科技記憶。中國科學(xué)院院士文庫加強對院士基本信息、教育經(jīng)歷、工作經(jīng)歷、建言獻策等數(shù)據(jù)的標(biāo)注加工,在此基礎(chǔ)上深入挖掘院士的地域分布、行業(yè)分布、參政議政等多維度的信息;基于科技情報大數(shù)據(jù)技術(shù),從院士科研成果方面分析院士研究方向變遷路線、學(xué)術(shù)關(guān)系網(wǎng)絡(luò)等,展示院士個人科研畫像和學(xué)科發(fā)展軌跡。
(四)強化數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)與協(xié)作共享,從各自為政到開放共享
科技名人檔案專題庫應(yīng)加強檔案元數(shù)據(jù)標(biāo)準(zhǔn)化體系建設(shè),規(guī)范元數(shù)據(jù)格式和結(jié)構(gòu),構(gòu)建有效的元數(shù)據(jù)收集和更新機制,促進不同建設(shè)機構(gòu)與不同專題庫之間的元數(shù)據(jù)共享互通;[9]積極探索科技名人檔案數(shù)據(jù)開放模式,采取“分對象、分領(lǐng)域、分階段”的開放原則,逐步推動科技名人數(shù)據(jù)資源開放標(biāo)準(zhǔn)的建立,為實現(xiàn)數(shù)據(jù)可復(fù)用性提供國家層面的準(zhǔn)則支撐;借鑒國外LAM合作實踐,加強檔案館、圖書館、博物館、科技館的橫向聯(lián)動,建立數(shù)據(jù)協(xié)同、管理協(xié)同、服務(wù)協(xié)同等機制,鼓勵科研機構(gòu)、高校等主體間檔案數(shù)據(jù)的開放共享。例如,可以整合中國科學(xué)院院士文庫、中國工程院院士館等現(xiàn)存院士檔案資源,構(gòu)建中國院士數(shù)據(jù)的權(quán)威發(fā)布渠道和協(xié)作網(wǎng)絡(luò),打造“中國院士”管理協(xié)作網(wǎng)絡(luò),實現(xiàn)“中國院士”網(wǎng)絡(luò)的持續(xù)性、權(quán)威性、互助性建設(shè),[10]建立資源高度匯集的國家級科技名人檔案專題庫。
本文在充分調(diào)研國內(nèi)外科技名人檔案專題庫的基礎(chǔ)上,選取了五個國內(nèi)外具有代表性的科技名人檔案專題庫,深入調(diào)研分析現(xiàn)狀、梳理總結(jié)建設(shè)困境,并結(jié)合中國科學(xué)院院士文庫建設(shè)實踐提出突破路徑。但囿于目前實踐案例樣本較少,未來有待于持續(xù)追蹤國內(nèi)外相關(guān)情況以獲取更多樣本,對比國內(nèi)外之間的共性和差異,為我國科技名人檔案專題庫建設(shè)的進一步發(fā)展探明實踐路徑。
*本文系2024年中國科學(xué)院學(xué)部項目“中國科學(xué)院院士文庫”(項目編號:E429170301)研究成果。
注釋及參考文獻:
[1]高勝楠.我國科技名人建檔研究的現(xiàn)狀與問題[J].北京檔案,2020(1):29-32.
[2]The Hebrew University of Jerusalem. About AlbertEinsteinArchives[EB/OL].(2019- 04- 01)[2024-09-10].https://albert-einstein.huji.ac.il/aboutus.
[3]ColumbiaUniversityLibraries.OralHistoryPortal[EB/OL].(2022-01-01)[2024-09-10].https://library. columbia.edu/collections/oral-history-portal.html.
[4]任德昕,孟超.社交媒體環(huán)境下檔案文化傳播:挑戰(zhàn)與路徑[J].山西檔案,2024(1):92-94.
[5]馬繼萍.論科技名人檔案庫的功能定位與實現(xiàn)[D].武漢:湖北大學(xué),2017:23.
[6]陳建,章偉婷.科技名人檔案收集與利用的難點與路徑創(chuàng)新——以老科學(xué)家學(xué)術(shù)成長資料采集工程為例[J].檔案學(xué)刊,2022(4):70-78;98.
[7]覃兆劌,馬繼萍.論科技名人檔案與科技發(fā)展的互構(gòu)——以我國“老科學(xué)家學(xué)術(shù)成長資料檔案庫”建設(shè)為例[J].檔案學(xué)研究,2016(4):52-56.
[8]陳雨.數(shù)字人文視域下科技名人檔案知識化開發(fā)探析[J].檔案學(xué)研究,2023(4):99-107.
[9]王靜.科技名人檔案資源建設(shè)理論框架及保障體系[J].山西檔案,2023(2):150-157.
[10]武虹,高潔,李硯章,等.國內(nèi)外院士信息綜合集成與展示平臺的對比[J].科技導(dǎo)報,2020,38(17):92-99.
作者單位:1.中國科學(xué)院文獻情報中心2.中國科學(xué)院檔案館3.青島農(nóng)業(yè)大學(xué)檔案館