摘 要 論文基于軟件程序資源的多樣性和復雜性,從軟件程序資源保存范疇的界定出發(fā),在對軟件程序資源保存內容所面臨的采集、元數(shù)據(jù)規(guī)范等問題進行深入分析的基礎上,探討了目前主流保存技術策略在軟件程序資源保存領域的適用性,并從合理使用的角度分析了目前軟件程序資源保存所存在法律法規(guī)方面的困擾,最后從合作保存的角度提出我國未來軟件程序資源保存的發(fā)展方向,希望對我國軟件程序資源保存理論和實踐的發(fā)展提供一定的借鑒。
關鍵詞 軟件程序資源;圖書館;長期保存
分類號 G250.76
DOI 10.16810/j.cnki.1672-514X.2022.02.010
Abstract Based on the diversity and complexity of software resources, this paper starts from the definition of the scope of software resources preservation, analyzes the problems of collection and metadata specification faced by the content of software resources preservation, discusses the applicability of the current mainstream preservation technology strategy in the field of software resources preservation, and analyzes the current software resources preservation from the perspective of rational use. Finally, from the perspective of cooperative preservation, this paper puts forward the development direction of China’s future software resource preservation, hoping to provide some reference for the development of China’s application software resource preservation theory and practice.
Keywords Soft program resources. Library. Long term preservation.
0 引言
近年,隨著數(shù)字原生資源的不斷涌現(xiàn),數(shù)字資源長期保存已經(jīng)成為圖書館、博物館、檔案館等保存機構關注的重點問題之一。數(shù)字資源長期保存是保存機構在長期保存?zhèn)鹘y(tǒng)紙質材料和其他實物文物基礎上的邏輯延伸。就目前的保存內容看,大部分保存機構的保存重點僅限于組織和存儲現(xiàn)有保存實物的數(shù)字代用品和網(wǎng)絡原生數(shù)字資源,如電子版的圖書、網(wǎng)頁資源等,而對于軟件程序資源的管理和保存尚未引起廣泛關注。
應當認識到,現(xiàn)代社會人們對數(shù)字形態(tài)的資源越來越依賴,這些資源的原生形態(tài)是以“0”“1”組合呈現(xiàn)的,如不借助相應的軟件、硬件等外部環(huán)境,人類是無法讀取和理解的,必須通過適當?shù)能浖h(huán)境將其轉換為人類可讀的形式才能完成“識讀”操作。Esther Conway等學者曾指出,相對數(shù)字資源長期保存而言,軟件程序資源保存的復雜度相對較高,現(xiàn)有的數(shù)字資源長期保存項目對數(shù)字對象依賴的軟件運行環(huán)境關注較少,人們不應忽視[1]。Esther Conway等人將軟件程序資源保存定義為保存軟件的副本以便將來能重構和執(zhí)行,他強調指出,保存軟件程序資源是保存其他數(shù)據(jù)的必備條件,是保證數(shù)據(jù)存在和可重用的根本,軟件程序資源的保存應當涵蓋軟件的表現(xiàn)形式、描述模型和需要保存的屬性等方面。可以說軟件程序資源的長期保存既是一項舊課題,也是一項新課題,必須依照數(shù)字資源長期保存領域的相關規(guī)范來執(zhí)行,同時由于它也是長期保存領域亟待解決的全新問題,也應有機融入國家的數(shù)字資源長期保存體系之中[2]。
由于軟件程序資源的特殊性,針對軟件程序資源的保存面臨諸多困擾:首先,隨著云計算、人工智能、大數(shù)據(jù)等新技術的飛速發(fā)展,軟件程序資源保存的復雜性將會持續(xù)增加;其次,軟件程序資源間的強耦合關系以及軟件程序資源自身所具有的迭代性增長的特點,導致待保存的軟件程序資源版本數(shù)量眾多,且溯源性較差;第三,目前保存的數(shù)字對象內容所依賴的軟件環(huán)境復雜,特別是動態(tài)數(shù)字對象所依賴的軟件環(huán)境,大多鏈接不同系統(tǒng)數(shù)據(jù)庫,有些甚至鏈接多個位于不同服務器的外部軟件包,導致軟件程序資源的保存工作極其復雜[3]。此外,軟件程序資源的保存還涉及管理、經(jīng)費、法律等諸多問題,導致目前針對軟件程序資源長期保存的研究與實踐工作進展緩慢,且大多處于試驗階段。
為此,本文基于軟件程序資源的多樣性和復雜性,從軟件程序資源保存范疇的界定出發(fā),在對軟件程序資源保存內容所面臨的采集、元數(shù)據(jù)規(guī)范等問題進行深入分析的基礎上,探討目前主流保存技術策略在軟件程序資源保存領域的適用性,并從合理使用的角度分析目前軟件程序資源保存所存在法律法規(guī)方面的困擾,最后從合作保存的角度提出我國未來軟件程序資源保存的發(fā)展方向,希望對我國軟件程序資源保存理論和實踐的發(fā)展提供一定的借鑒。
1 保存范疇的界定問題
在探討軟件程序資源保存范疇之前,首先要明確軟件程序資源的保存涉及到的軟件單元、軟件系統(tǒng)、軟件環(huán)境等諸多元素。軟件單元主要指應用程序、系統(tǒng)程序或者某個程序的組件。軟件系統(tǒng)是指軟件單元的集合。軟件環(huán)境是指在安裝和運行過程中與軟件系統(tǒng)產(chǎn)生相互作用的一切基礎設施,通常包括處理器、操作系統(tǒng)、I/O設備、各種軟件庫、網(wǎng)絡系統(tǒng)等等[4]。
軟件程序資源的長期保存與紙質資源和數(shù)字靜態(tài)資源不同,與數(shù)字藝術品、原生數(shù)字新聞、數(shù)字游戲等數(shù)字化內容的長期保存相似,長期保存的過程都會著重保護與數(shù)字對象相關的軟件單元、軟件環(huán)境及其所依托的其他軟件系統(tǒng)。例如,保存創(chuàng)建和查看word文檔所必須的應用軟件程序必須同時保存與其運行相關的操作系統(tǒng)環(huán)境、插件元素及網(wǎng)絡、存儲、計算資源等。但軟件程序資源的保存又與數(shù)字游戲、數(shù)字藝術品等數(shù)字資源有所區(qū)別,因為后者更為重視數(shù)字內容的創(chuàng)造性。此外,軟件程序資源的版本迭代較游戲等數(shù)字對象更為頻繁,保存機構理論上應當將軟件程序資源更新的所有版本都保存下來。但是由于軟件程序資源版本數(shù)量眾多,有些軟件根本無法溯源,且使用范圍的劃分也較為復雜,如一些正版軟件則需要產(chǎn)品秘鑰才可使用,而一些破解軟件則情況更為混亂,難以管理,即使將軟件完全保存下來,其使用范圍也將嚴重受限。因此,軟件程序資源保存最根本的問題是需要明確哪些內容需要保存。
軟件程序資源保存范疇的界定除以上軟件資源的遴選問題外,每個軟件系統(tǒng)自身也存在沒有明確清晰界限分割的問題,很難判定一個軟件系統(tǒng)的開始與結束位置。此外,軟件程序資源保存的可選擇性較多,是僅僅保存源代碼、程序二進制可執(zhí)行版本,還是可執(zhí)行版本及其運行的軟件環(huán)境。保存哪些軟件程序資源、保存軟件程序資源的哪些版本及每種軟件程序資源需要保存哪些內容,應依據(jù)于保存機構明確的保存目的和目標,而保存目標的確定離不開對目標用戶群體的分析[5]。例如,當保存一個1990年的CAD文件時,為了保證用戶實現(xiàn)與當年相同的應用體驗,則需要提供一個來自那個時代的顯示設備及相關外設。因此,軟件程序資源保存范疇的界定應基于特定目標用戶群的具體應用情境展開。此外,軟件程序資源長期保存范疇的界定還取決于軟件程序資源的復雜性、保存項目可投入的人力、物力及財力資源等。由于各保存因素相互交織且軟件程序資源保存自身技術難度較大,因此目前尚無標準答案。
2 保存內容的核心問題
2.1 軟件程序資源采集及其障礙
軟件程序資源的保存依托于對源代碼的可獲取性,如軟件程序資源的源代碼及相關的文檔資源無法獲取,則軟件翻譯或軟件移植等保存策略無法執(zhí)行,即使采用仿真等保存策略難度也很大。現(xiàn)代信息技術的發(fā)展,一方面使得軟件編譯體系龐雜,不同的軟件隸屬于不同的編譯體系,依托于不同類別、不同版本的系統(tǒng)環(huán)境;另一方面使得不同軟件程序資源在功能、模塊、作用上相互交織融匯,形成不同的軟件程序資源群。由于軟件程序資源自身功能、結構復雜,且所需的技術環(huán)境多樣,不同軟件又由不同的機構開發(fā),服務于不同的目標人群。特別是大部分軟件程序資源受到版權、專利權在內的知識產(chǎn)權法的保護,因此對軟件程序資源的采集造成了很大障礙。
除了需要采集軟件體自身的內容外,還應當完成對其相關文檔信息的采集,可結合軟件程序資源保存的目的和性質,在保存軟件手冊的基礎上,以截屏、視頻記錄、口述歷史等形式保存軟件開發(fā)的目的、意義以及安裝、使用、技術環(huán)境等方面的信息。
2.2 元數(shù)據(jù)采集與規(guī)范問題
保存軟件程序資源之初,首先進行初步的應用場景和技術環(huán)境分析是非常必要的,可以借助對軟件程序資源的描述信息、軟件架構、應用場景、軟件開發(fā)商、所有權、許可信息以及存儲情況等內容的分析,確定元數(shù)據(jù)采集方法和核心元素集合[6]。當前軟件程序資源的組織和描述模式主要有兩個來源,一個是軟件程序資源的使用機構如研究所、大學等,以知識組織的方式為信息對象和集合提供描述和元數(shù)據(jù)信息;另一個是互聯(lián)網(wǎng)商業(yè)機構從軟件發(fā)行的角度對軟件程序資源進行組織與描述。但是,這兩種描述與組織方式并不完全適用于軟件程序資源。
由于軟件程序資源的復雜性和特殊性,導致其所具有的元數(shù)據(jù)比普通靜態(tài)數(shù)字資源更具復雜性。從不同的角度可以開發(fā)出不同的元數(shù)據(jù)模型,如從使用情境的角度出發(fā),采用以用戶為核心的方法,可以將用戶分成軟件開發(fā)者/設計者、軟件發(fā)行者、應用者、保存者/圖書館管理員等,根據(jù)不同的用戶角色的應用場景,應為每個用戶群體設置專有的元數(shù)據(jù)元素。雖然不同元數(shù)據(jù)模型會共用部分基本元數(shù)據(jù)元素,如標識符、標題、版本、發(fā)行人等信息,但是結合不同的應用場景,每個用戶群體又會有各自特殊的元數(shù)據(jù)描述需求。目前,專業(yè)的知識保存與組織機構,如圖書館、檔案館尚未廣泛開展針對軟件程序資源的保存工作,雖然有部分研究型圖書館和大學合作開展了一些軟件保存項目,并發(fā)布了部分元數(shù)據(jù)模型,但該項工作仍屬于嘗試階段。
2.3 運行環(huán)境的依賴性
軟件程序資源依托于與其相關的硬件資源、操作系統(tǒng)及其他軟件程序或軟件庫運行,特別是現(xiàn)代軟件架構對其所涉及的周邊軟件環(huán)境依賴性更強?,F(xiàn)代軟件架構為了增強軟件的可移植性,將計算機上運行的程序分成多個層級。面向最終用戶的應用程序處于整個軟件系統(tǒng)架構的最頂層,其所依賴的各類基礎庫是中間層,最底層是與硬件系統(tǒng)直接關聯(lián)的操作系統(tǒng)。軟件層級化的思想減少了重復開發(fā)造成的資源浪費,起到了錯誤隔離和安全保護的作用,為程序員帶來各種便利。但是,這種框架下運行的軟件程序資源所面臨的保存困難更大。一方面操作系統(tǒng)與應用程序間的調用都是通過規(guī)范的標準接口調用完成的,一旦標準被保存過程更改就會導致調用失敗,應用程序無法運行;另一方面,系統(tǒng)調用的接口設計是固定的,軟件程序必須將服務請求轉化為系統(tǒng)認可的調用請求,這無疑更增加了保存工作的復雜性和保存難度。
2.4 現(xiàn)代信息技術飛速發(fā)展的挑戰(zhàn)
現(xiàn)代信息技術的飛速發(fā)展對軟件程序資源的長期保存而言是把雙刃劍,一方面軟件程序資源的長期保存已受到多國關注,并變得日益重要;另一方面也給軟件程序資源的長期保存帶來巨大挑戰(zhàn),特別是對于部分注重用戶體驗的軟件,如僅保留比特和字節(jié)等信息,根本無法重現(xiàn)當時的軟件應用場景,更無法重現(xiàn)用戶當時的使用體驗。僅以Facebook為例,雖然Facebook自身不對其軟件系統(tǒng)進行保存,但由于Facebook不容許輸出使用體驗,只允許用戶輸出自己的數(shù)據(jù)。那么其他保存機構是否可以實際承擔對Facebook的保存任務,尚無定論。因此,實際上即使是Facebook自身可能也無法保存Facebook。部分專家為了保存使用Facebook、虛擬世界和其他基于云的服務體驗采用體驗記錄的方式,通過記錄用戶的使用原因,所使用的相關上下文信息以及使用感受等內容,保證未來用戶可以看到過去某個時期使用者所使用的軟件及其使用體驗。此外,很多軟件必須依托于溫度傳感器、操作設備、虛擬現(xiàn)實眼鏡、耳機等專用硬件設備才能正常工作,這對軟件程序資源的保存而言更具挑戰(zhàn)性。其將受限于技術保存策略的局限性,最終將可能造成無法獲得原始、功能完好的硬件設備。
2.5 軟件合理使用的局限性
軟件資源受到版權、專利權在內的知識產(chǎn)權法律的保護,因此軟件程序資源同其他數(shù)字資源一樣,在開始保存前必須考慮到專利代碼、保存管理權利及知識產(chǎn)權等問題。軟件程序資源的長期保存通常需要以軟件許可協(xié)議不容許的方式操作軟件,相應的保存機構通常需要得到軟件知識產(chǎn)權所有者授予的特定權限,才能執(zhí)行相關的長期保存任務。但是,由于軟件版本更替頻繁,來源多樣,很多軟件難以溯源,更無法找到軟件的權利所有者。這些問題都會造成軟件保存和重用的延遲。
目前,中國著作權法中關于合理使用的相關規(guī)定源于《伯爾尼公約》,該公約指出了“三步檢驗法”。此后,“三步檢驗法”也被《世界知識產(chǎn)權組織著作權條約》[7]和《知識產(chǎn)權協(xié)定》納入著作權例外的考慮范圍,并進一步在國際范圍內推廣[8]。其約定:(1)任何限制和例外必須是特例;(2)任何限制不得影響著作權人對作品的正常使用;(3)任何限制都不得損害著作權擁有者的合法利益。
美國的著作權法中關于合理使用的相關規(guī)定源于1841年,約瑟夫·斯托里法官在Folsom V.Marsh 案中提出的“四要素分析法”,之后《美國著作權法》第107條對“四要素分析法”的具體內容作出了正式規(guī)定,即檢驗合理使用的四個要素分別是:(1)使用的目的和性質,即該使用行為是商業(yè)性的還是以教育為目的非營利性的使用;(2)受著作權保護的作品的性質;(3)使用受著作權保護的作品的數(shù)量和比重;(4)該適用行為對著作權作品潛在市場和價值的影響。
雖然,中美等國在著作權法中都對“合理使用”進行了約定, 但就目前版權許可制度的完善程度與授權機制的健全程度而言,與軟件程序資源長期保存授權需求存在較大差距,甚至不具有可操作性。此外,目前我國版權合理使用制度的彈性較差,對新技術的敏銳性、適應性較低,從而使圖書館的保存權利受到嚴重約束。圖書館面對軟件程序資源長期保存遇到的版權困境,應以公共圖書館法為基礎,積極闡明版權立場,推動法律和政策支撐,促進合理使用制度的建立,以有效協(xié)調權利人、圖書館和公眾之間的利益關系,形成更加有利于圖書館事業(yè)發(fā)展的法律和政策環(huán)境。
3 軟件程序資源保存技術策略分析
面對軟件程序資源的復雜性和交互性,以及軟件開發(fā)商對軟件程序資源保護鎖設置的保護障礙,目前保存的主要方法是遷移、模擬、技術保存、虛擬化和軟件翻譯等,每種方法各有利弊。保存機構需要結合軟件程序資源的復雜性、保存項目可投入的人力、物力及財力資源等情況,合理選擇其中一種或幾種策略開展保存工作。
3.1 遷移與標準化
遷移是當前數(shù)字資源長期保存領域應用最為廣泛的保存策略。標準化與遷移類似,目前部分專家將標準化與遷移視為同一方法,如Corrado&Moulaison Sandy曾將標準化描述為“將數(shù)字對象遷移到有限數(shù)量的標準格式”[9]。對于圖像、文本等數(shù)字對象資源而言,雖然遷移和標準化會導致少量屬性信息的丟失,如一部分樣式信息、背景信息等,但由于其保留了主要數(shù)據(jù)內容及內容間的關聯(lián)關系信息,因此對大部分保存機構而言是可以接受的。目前,遷移和標準化策略已成為眾多保存機構主要使用的保存策略。但是,對于軟件程序資源而言,一部分原因是由于其自身結構復雜,設計獨特,與操作系統(tǒng)、軟件架構、數(shù)據(jù)庫、動態(tài)鏈接庫以及描述信息、所有權、許可信息等其他元素間具有強耦合關系,有些甚至與多個異構數(shù)據(jù)庫間具有復雜的軟件關聯(lián)關系,并與多個位于不同服務器的外部軟件包動態(tài)連接,即使微小的信息丟失也可能會導致所保存軟件對象的真實性和完整性受到威脅,甚至無法復原或運行,進而造成軟件保存工作失效。因此,僅僅依靠遷移或標準化策略,對于軟件程序資源的保存而言,存在一定的風險。
3.2 技術保存
技術保存是指保存完整的技術環(huán)境,即同時保存硬件和軟件。對于軟件程序資源而言,由于不同的軟件程序資源是依托于不同的技術環(huán)境創(chuàng)建的,因此在保存軟件程序資源的同時,也需要存儲軟件所依賴的不同技術環(huán)境資源并維護具有不同時代特征的眾多硬件、軟件系統(tǒng)。通常,需要保存的硬件涉及磁盤驅動器、主板、處理器、顯示卡等,需要保存的軟件環(huán)境不僅包括程序本身,還涉及操作系統(tǒng)、驅動程序、數(shù)據(jù)庫等軟件編譯、安裝和運行所需的環(huán)境。雖然技術保存似乎是軟件程序資源保存的一種較好方法,但是從長期來看,其持續(xù)性較差。伴隨信息技術的迅速發(fā)展,特別是近年云計算、大數(shù)據(jù)、霧計算、人工智能等技術的迅速發(fā)展,軟、硬件的更替性更加頻繁,很多硬件一旦過時便不再生產(chǎn)。隨著待保存的軟件程序資源越來越多,其依托的技術環(huán)境將越來越復雜,采用此種方法將最終導致很多資源無法獲取。
3.3 仿真
在執(zhí)行仿真時,計算機系統(tǒng)會補充由于硬件過時等原因造成的硬件缺失,并創(chuàng)建一套軟件程序資源可以運行的模擬運行環(huán)境,其容許操作系統(tǒng)在不同的硬件系統(tǒng)上運行,此外仿真還可以實現(xiàn)軟件程序資源的跨操作系統(tǒng)運行。通過模擬技術,可以實現(xiàn)依托虛擬計算機捕捉源代碼、可執(zhí)行程序、運行的基礎軟件環(huán)境以及軟件安裝和運行所需的其他重要屬性信息,從而在其他計算機上,或其他軟件環(huán)境中再現(xiàn)該軟件的運行環(huán)境。很多專家認為其可以實現(xiàn)軟件程序資源的高級別保存。近年很多正在使用的模擬器和虛擬計算系統(tǒng)可以被用于該策略,如開放源代碼再現(xiàn)性工具ReproZip等,但實際應用還需要結合實際的保存需求,并進行嚴格的測試。采用仿真策略,可以減少由于硬件過時導致軟件保存失效的風險,這顯然是技術保存無法實現(xiàn)的。但是,仿真策略也存在一定的缺陷:首先,仿真硬件的構建顯然是一項非常耗費計算資源的工作;其次,仿真器的維護也是一個極其困難的命題,很多仿真器可能根本無法構建待保存軟件安裝和運行所需技術環(huán)境的所有特征,因此為盡可能模擬原始技術環(huán)境,必須進行大量的測試和調整;此外,仿真技術的可信性是一個核心問題,仿真技術平臺與原始技術平臺有何不同,哪些差異是可以接受的,這些差異是否會造成原始目標的偏離,這些都是需要考慮的問題。同時,仿真器的開發(fā)和使用也同樣伴隨一系列的知識產(chǎn)權問題。
3.4 虛擬化
虛擬化技術可以實現(xiàn)將現(xiàn)有的計算機硬件整合成一個統(tǒng)一的資源池,從一個特定的硬件環(huán)境中模擬出另一個不同的系統(tǒng)環(huán)境,容許多個應用系統(tǒng)并發(fā)地在同一個硬件上運行[10]。虛擬化系統(tǒng)中每個應用軟件都是獨立的,都可以直接訪問底層的硬件資源?;谶@一特性,可以將軟件程序資源安裝在虛擬機上,通過虛擬機監(jiān)控器與底層硬件系統(tǒng)相互隔離,以實現(xiàn)底層硬件系統(tǒng)對上層軟件程序資源的透明,其在一段時期內有效保證了底層硬件運行環(huán)境的穩(wěn)定性。虛擬化策略與仿真策略雖然類似,但并不相同,不同的是,虛擬化策略必須依托底層硬件運行,對底層硬件的依賴性較強,而且虛擬化策略不像仿真策略那樣資源使用密集,例如依托X86 CPU體系結構的通用處理器構建底層虛擬化平臺,就可以延長軟件程序資源的生命周期,為軟件程序資源提供了良好的技術保護。但不容忽視虛擬化策略對硬件的強依賴性會導致該策略在很多情況下失效。此外,虛擬化系統(tǒng)本身也存在技術更替頻繁以及知識產(chǎn)權等諸多問題。
3.5 軟件翻譯與軟件移植
軟件翻譯一直以來是計算機科學界公認的軟件延續(xù)策略之一。依托代碼轉換器可以將用一種語言編寫的源代碼轉換為另一種語言。例如,SGJ(SegaGensisJava,SGJ)已用于將 SegaGensisBasic編寫的視頻游戲轉換為Java。該方法適用于那些僅具有少量源代碼的應用程序,但對于含有大量源代碼的軟件,轉換難度較大。此外,該策略依托于原始源代碼和文檔的完整性,如果源代碼和相關文檔有所缺失,該策略將無法有效實施。另外一種與軟件翻譯相關的方法是軟件移植。軟件移植主要用于保證軟件程序資源能夠在新技術環(huán)境下重用,例如保證應用系統(tǒng)在不同操作系統(tǒng)或不同硬件架構上運行。目前,軟件移植的主要類型有二進制移植(僅移植可執(zhí)行文件)和源代碼移植(移植源語言表達方式)[11]。二進制移植僅限于在極其相似的環(huán)境間遷移,而源代碼移植的前提是源代碼可獲取,且該方法可能會修改一個或多個軟件單元及其應用環(huán)境。由于軟件移植的局限性,其在軟件程序資源保存的實施過程中,利用率不如軟件翻譯高,一般僅用于幫助保存機構解決技術過時等問題。
3.6 模擬遷移結合
模擬遷移結合的方式是近年部分專家新提出的一種保存策略。但Anderson等人指出,用于資源保存的模擬器本身也是一種數(shù)字對象,一段時期后也同樣會過期[12]。當硬件范式更新時,基于模擬策略的軟件程序資源保存可采用兩種策略,一種是在最新硬件上重建一套模擬器,以保證原保存數(shù)字資源的有效性和完整性;另一種是利用模擬器的自我遷移能力,保證軟件程序資源保存的有效性,避免重建模擬器所耗費的大量人力和物力資源。由于目前該方法尚未廣泛使用,因此其易用性和可行性尚待進一步考量。
4 軟件程序資源長期保存的未來發(fā)展建議
軟件程序資源長期保存涉及的內容比較廣泛,需要多個專業(yè)硬件和軟件的副本、先進的技術知識和大量的實踐活動,因此軟件程序資源保存所需要的資金、技術、人力等資源非常巨大,僅憑借單一機構的力量難以很好地完成保存任務。國際上的主流做法是采用合作保存的模式,且合作形式多樣[13],有本國圖書館間的合作、跨國跨機構的合作,還有圖書館與科研機構、商業(yè)機構、大學等之間的合作。目前,國際上已經(jīng)有了幾個比較典型的合作案例。如2017年4月,聯(lián)合國教育、科學以及文化組織(教科文組織)和法國國家計算機科學和自動化研究所(INRIA)就INRIA合作發(fā)起的軟件遺產(chǎn)項目。該項目“旨在為后代建立一個通用和常年的軟件檔案”[14]?!败浖Wo網(wǎng)絡”項目也是一個基于合作的保存項目,其旨在建立一個合作聯(lián)盟,該項目通過主辦網(wǎng)絡研討會的方式,宣傳軟件資源保存的重要性、技術方案及實施途徑等重要的保存信息。項目下設多個子項目,主要包括“軟件保護合理使用最佳實踐手冊項目”“軟件維護和仿真基礎設施項目”和“促進保存實踐:圖書館、檔案館和博物館的軟件保存項目”等。此外,由JISC資助的軟件可持續(xù)研究項目也是一項研究軟件長期可持續(xù)發(fā)展的全國性項目,其在軟件可持續(xù)發(fā)展方面的很多研究都為軟件程序資源的保存實踐提供了有益參考。
我國軟件程序資源長期保存可借鑒國際上的主流做法,增強社會各界人士對我國軟件程序資源長期保存的危機意識。在宏觀上將軟件程序資源的長期保存融入國家信息化發(fā)展戰(zhàn)略,通過宏觀規(guī)劃、頂層設計,從軟件程序資源保存的角度進一步完善我國信息資源長期保存的政策體系,通過建立明確的責任體系,容許其他社會機構參與軟件程序資源長期保存事務的處理,以期發(fā)揮社會組織的力量;在微觀上將軟件程序資源的長期保存融入各保存機構的日常業(yè)務,在明確職責的前提下,促進各責任主體可以積極開展不同層次、不同領域、不同主體的合作。未來可以從以下幾個方面入手促進我國軟件程序資源長期保存的發(fā)展:
4.1 完善合作機制,明確責任分工
完善的合作保存機制是開展軟件程序資源長期保存成功與否的關鍵因素之一,也是合作機構間開展合作與交流的基礎。由于軟件程序資源的保存工作具有廣泛的社會性,涉及技術、法律、設備等諸多內容,因此需要建立一系列的政策、制度加以規(guī)范。根據(jù)我國國情,結合國際主流做法,可以由國家成立專門的機構主導工作,從宏觀規(guī)劃著手完善我國的長期保存政策、策略和制度,對全國性的研究與實踐工作進行統(tǒng)籌協(xié)調和管理。根據(jù)合作者各自的優(yōu)勢和劣勢明確各成員應當承擔的職責和義務,通過明確分工、責任到位、密切配合,避免重復建設和糾紛,保障合作保存工作的順利進行。
4.2 依托現(xiàn)代信息技術,構建合作保存平臺
應用云存儲、云計算等現(xiàn)代信息技術構建合作保存平臺,已成為目前合作保存平臺建設的主流做法。通過構建支持多類別異構終端的資源保存與服務平臺,建立跨區(qū)域的軟件程序資源長期保存與服務體系。堅持以用戶需求為導向,通過平衡各合作方的利益,有效整合保存資源,優(yōu)化保存結構,實現(xiàn)整體協(xié)同效應。通過共享保存成果,促進長期保存技術的研究與交流,保證軟件程序資源長期保存的良性發(fā)展。
4.3 協(xié)調多渠道資金,建立有效資金保障體系
軟件程序資源的長期保存是一項長期的系統(tǒng)工程,需要穩(wěn)定的經(jīng)費來源和資金保障。從國外部分長期保存項目看,很多保存項目都擁有多種渠道的經(jīng)費來源,這些項目不但擁有來自政府的經(jīng)費支持,還有來自各種基金會、公司、民間組織的資金支持,以保證項目的長期資金投入。有些國家為保障數(shù)字資源長期保存項目擁有可靠的經(jīng)費保障,還針對保存項目資金制定了相關的法規(guī),以避免因人員變動等原因影響資金的落實。目前,我國各保存項目的資金來源以國家或政府機構的專項投資為主,然而對于軟件程序資源保存而言,其支持力度還遠遠不夠。未來,可以在進一步加大政府支持力度的同時,通過爭取多渠道資金來源確保項目可靠資金保障體系的建立。
5 結語
軟件程序資源的長期保存既是一個迅速發(fā)展的新領域,也是長期保存領域的一個子集,與文獻資源的保存一樣,是數(shù)字資源長期保存領域不可或缺的一部分。保存機構需要意識到軟件程序資源保存的影響因素及其可能遇到的一系列挑戰(zhàn)。如果讀取文獻所需的軟件沒有被有效保存,將嚴重影響未來對相應文獻的研究工作。因此,面對軟件程序資源的長期保存的障礙和挑戰(zhàn),筆者認為我國軟件程序資源長期保存可借鑒國際上的主流做法,處理好與社會企業(yè)和資本的關系,形成基于資源交換、服務拓展、價值認同、行政導向的多層級社會合作機制。在宏觀上將軟件程序資源的長期保存融入國家信息化發(fā)展戰(zhàn)略,通過宏觀規(guī)劃、頂層設計,從軟件程序資源保存的角度進一步完善我國信息資源長期保存的政策體系;在中觀上,建立合理的合作保存機制,容許其他社會機構參與軟件程序資源長期保存事務的處理,通過建立明確的責任體系,積極開展不同層次、不同領域、不同主體的合作,以期發(fā)揮社會組織的力量;在微觀上將軟件程序資源的長期保存融入各保存機構的日常業(yè)務,在明確職責的前提下,促進各責任主體可以積極開展不同層次、不同領域、不同主體的合作。通過協(xié)調各方關系,積極擁抱社會合作力量,實現(xiàn)業(yè)態(tài)融合。
參考文獻:
CONWAY E.Towards a methodology for software preservation[EB/OL].[2011-02-18].http://www.cdlib.org/iPres/presentations/ConwaySoftware.pdf.
顧立平,樊舒,陳新蘭.軟件長期保存的策略研究[J].農業(yè)圖書情報,2019,31(10):4-11.
劉青,邵軍.原生數(shù)字新聞應用保存與存檔面臨的挑戰(zhàn)[J]. 蘭臺世界,2018(6):49-52.
魏仁選,周祖德,姜德生.軟件重用與移植的比較研究[J].計算機工程與應用, 2002(21):42-45.
趙玉宇.國外數(shù)字資源長期保存的熱點問題研究[J]. 圖書館建設,2011(6):19-27.
張靜文.國外數(shù)字游戲長期保存的研究進展[J]. 圖書情報工作, 2019,63(21):137-144.
熊琦.“用戶創(chuàng)造內容”與作品轉換性使用認定[J].法學評論,2017,35(3):64-74.
World Intellectual Property Organization (WIPO). Berne convention for the protection of literary and artistic works [EB/OL]. [2020-07-13]. https://www.wipo.int/treaties/en/text.jsp?file_id=283698.
CORRADO E M, SANDY H M.Digital preservation for libraries, archives, and museums [M]. 2nd ed.Lanham, MD: Rowman & Littlefield,2017:45-50.
燕楊. 基于虛擬化技術的電子文件長期保存策略探析[J]. 檔案天地, 2017(12):48-51.
魏仁選,周祖德,姜德生.軟件重用與移植的比較研究[J].計算機工程與應用, 2002(21):42-45.
CASTAGNE M.Consider the source: the value of source code to digital preservation strategies[M]. SLIS Stu- dent ResearchJournal ,2017,2(2): 48-58.
王若琳,劉莎,胡增存,等.國外圖書館數(shù)字資源長期保存策略探析[J]. 圖書館, 2014(2):56-59.
State News Service. Agreement on software preservation signed at UNESCO[R/OL].[2021-01-20].https://en.unesco.org/news/agreement-software-preservation-signedunesco
董曉莉 國家圖書館研究館員。 北京,100081。
(收稿日期:2021-04-02 編校:劉 明,謝艷秋)
3686500338262