○文/本刊通訊員 孫曉燕、蔡金剛
臺灣“數(shù)字典藏國家型科技計劃”執(zhí)行成效
○文/本刊通訊員 孫曉燕、蔡金剛
鑒于一期計劃成績非凡,2007年,臺當局“國科會”決定繼續(xù)實施二期計劃。在規(guī)劃構想方面,除了延續(xù)一期計劃的方向外,二期計劃的愿景與一期在定位上有顯著差異,即可持續(xù)經(jīng)營臺灣數(shù)字典藏,呈現(xiàn)臺灣語言、生物與文化的多樣性;推廣典藏成果應用,縮減數(shù)字落差;推動海外交流合作,共創(chuàng)人類新文明。二期計劃的三項重要目標為:呈現(xiàn)臺灣文化與自然多樣性;促成典藏內(nèi)容與技術融入產(chǎn)業(yè)、教育、研究與社會發(fā)展;推動典藏成果海外化、建立海外合作網(wǎng)絡。
依據(jù)此三項目標,該計劃辦公室設立了拓展臺灣數(shù)字典藏、推動人文社會經(jīng)濟與產(chǎn)業(yè)的發(fā)展,推動國際合作交流網(wǎng)絡3個主軸計劃,以及技術研發(fā)、網(wǎng)絡核心平臺兩個核心計劃。主軸分項計劃涉及推動各項工作以達成計劃的總體目標,并在核心分項資源的提供下,與典藏專業(yè)領域的各種文化、教育、研究機構以及產(chǎn)業(yè)應用建立連結(jié)、互動與對話,并進一步與國際合作伙伴相互交流。核心分項計劃通過技術與內(nèi)容的互相協(xié)調(diào),整合前端的產(chǎn)出與后勤支持工作,提供主軸分項計劃關鍵的生產(chǎn)力與競爭力要素,因此在第一期計劃執(zhí)行過程中,屬于跨分項、整合不同機構間的重要工作,例如聯(lián)合目錄、公共展示系統(tǒng)、異地備份系統(tǒng)、標準規(guī)范以及創(chuàng)新技術與平臺,都在此雙核心分項計劃中以協(xié)同合作的方式進行。
圖1 臺灣“數(shù)字典藏國家型科技計劃”二期組織架構圖
然而計劃趕不上變化。2007年1月,臺當局“立法院科技及資訊委員會”認為,將臺灣重要典藏文物加以數(shù)字化畢竟只是數(shù)字內(nèi)容產(chǎn)業(yè)的起點,為落實數(shù)字典藏與數(shù)字學習資訊的知識化與社會化,朝知識社會的發(fā)展與構建,進而實現(xiàn)提升臺灣競爭力的終極效益,有必要將“數(shù)字典藏國家型科技計劃”與晚一年實施的“數(shù)字學習國家型科技計劃”合二為一。
整合后的所謂“數(shù)字典藏與數(shù)字學習國家型科技計劃”于2008年開始執(zhí)行,至2012年結(jié)束。以“典藏多樣臺灣,深化數(shù)字學習”為總體目標,并致力達到如下的子目標:呈現(xiàn)臺灣多元文化與生物多樣性;應用數(shù)典內(nèi)容與科技促進產(chǎn)業(yè)、教育、研究與社會發(fā)展;儲備數(shù)字關連產(chǎn)業(yè)發(fā)展的基礎資源;深化數(shù)字學習在正規(guī)教育及終身學習的應用;奠定華語文數(shù)字教學的國際地位;推動數(shù)字典藏與學習成果國際化、建立國際合作網(wǎng)絡。共有中研院、“文化建設委員會”、“教育部”、“新聞局”、“研究發(fā)展考核委員會”、“原住民族委員會”、“國科會”、“國史館”、臺北故宮博物院等20個“部會”機構參與。
圖2 整合后的臺灣“數(shù)字典藏與數(shù)字學習國家型科技計劃”組織架構圖
該計劃團隊設置總主持人一人,共同主持人兩人;計劃辦公室有主任一人,負責整體計劃辦公室運作事宜,向總計劃共同主持人負責。計劃辦公室之上設有指導小組、咨議小組。此外,計劃辦公室還設有審查小組、工作小組,依據(jù)權責內(nèi)容分級審視該計劃的運作。
“國科會”希望通過這些“部會”和機構的參與,能夠擴大該計劃對于整體資訊社會的影響力,在一期典藏文物、精致文化成果的基礎上,更多強調(diào)本土內(nèi)涵、呈現(xiàn)臺灣文化多樣性脈絡、彰顯臺灣的文化主體性,從最底層的數(shù)字化檔案、整合深度后設數(shù)據(jù)描述的文化內(nèi)容、開發(fā)技術與創(chuàng)意結(jié)合的應用,呈現(xiàn)臺灣文化在人文領域、社會領域、自然環(huán)境領域的多樣性脈絡,全面性地將典藏與學習、內(nèi)容與技術融入到產(chǎn)業(yè)、教育、研究與社會發(fā)展的各個領域中,并結(jié)合可持續(xù)經(jīng)營的商業(yè)模式,將臺灣豐富深邃的數(shù)字內(nèi)容帶向國際舞臺,與世界建立平等互惠、合作創(chuàng)造的有機連結(jié)與創(chuàng)意互動,最終達到提升臺灣競爭力的終極效益。
圖3 臺灣“數(shù)字典藏國家型科技計劃”沿革
該計劃共設置了“拓展臺灣數(shù)字典藏”、“數(shù)字技術研發(fā)與整合”、“數(shù)字核心平臺”、“數(shù)字典藏與學習之學術與社會應用推廣”、“數(shù)字典藏與學習之產(chǎn)業(yè)發(fā)展與推動”、“數(shù)字教育與網(wǎng)絡學習”、“語文數(shù)字教學”及“數(shù)字典藏與學習的海外推展暨國際合作計劃”等8個核心分項計劃。各分項計劃分別設有分項計劃主持人、共同主持人若干名,及專案經(jīng)理與助理若干名,負責該計劃的整體各項事務運作。其中與數(shù)字典藏內(nèi)容有關的分項計劃有:
“拓展臺灣數(shù)字典藏計劃”主要目標是建立呈現(xiàn)臺灣文化、社會與自然環(huán)境的多樣性的數(shù)字內(nèi)容,并將基礎的數(shù)字化產(chǎn)出提供各分項計劃進行加值應用(包括教育、商業(yè)及學術研究等)。主要任務是提供方便的參與渠道,擴大數(shù)字典藏參與對象,推廣數(shù)字化標準與經(jīng)驗共享,降低數(shù)字典藏的建設成本,以深化加值為導向推動跨機構之計劃合作等。在“典藏臺灣多樣性”的大目標下,向民間公私營部門和機構公開征選數(shù)字內(nèi)容,其所涉及的領域包括臺灣自然、考古、語言文字、地理、族群文化、歷史、經(jīng)濟與民主歷程、藝術與美學、民間生活等。除了針對各種數(shù)字化物件、數(shù)位化工作流程及技術,結(jié)合國際標準,兼顧本土化的需求,形成島內(nèi)外相關領域的典范之外,未來還希望跨自然與人文、文化與科技領域,系統(tǒng)性的整合島內(nèi)數(shù)字資源,提供各知識領域的數(shù)字典藏內(nèi)容素材,促進全民對本土文化的認同。
圖4 2007~2011年臺灣“數(shù)字典藏國家型科技計劃”投入經(jīng)費與人力
“數(shù)字技術研發(fā)與整合”
圖5 “拓展臺灣數(shù)字典藏分項計劃”組織架構圖
主要目標為整合技術平臺,發(fā)展先進數(shù)字典藏及數(shù)字學習技術。主要任務是開展數(shù)字化技術研發(fā),并提供內(nèi)容典藏計劃資訊技術相關咨詢以及支援各項服務需求。主要研究方向分別是:多媒體技術、影音處理技術、語言處理技術、后設數(shù)據(jù)、缺字與異體字、系統(tǒng)整合服務以及數(shù)字學習環(huán)境與工具開發(fā)等。通過研發(fā)典藏系統(tǒng)所需的相關工具及擬定數(shù)字典藏相關規(guī)范,并配合未來無線網(wǎng)絡與多媒體發(fā)展趨勢,研發(fā)先進數(shù)字典藏資訊技術,建立技術支援與服務能量等,促進數(shù)字學習相關產(chǎn)業(yè)的發(fā)展,數(shù)字學習環(huán)境與工具開發(fā)子計劃,通過成立大型研究團隊及研究中心,整合島內(nèi)的研究資源,以促進數(shù)字學習領域更深入的研究與發(fā)展。
“數(shù)字核心平臺計劃”
主要目的是協(xié)助計劃辦公室建立并維持整體計劃運作的基礎架構,與整合、維護、展示及保存全體計劃產(chǎn)出的數(shù)字資料,并以追求自動化的計劃辦公室運作及最佳化的數(shù)字資料檢索、呈現(xiàn)與保存為主要目標。主要任務是籌辦年度成果展、建立辦公室自動化系統(tǒng)、維護資料室及出版推廣工作,以提供共通性核心服務;建立聯(lián)合目錄,以整合數(shù)字資料檢索平臺;規(guī)劃成果展示平臺,以促使計劃成果展示多元化、大眾化、精致化及國際化;建立異地備份長期保存機制,為數(shù)字化資料的長期保存提供一致化的使用界面,以達成計劃成果可持續(xù)保存與經(jīng)營的目標。
“數(shù)字典藏與學習之學術與社會應用推廣”
圖6 “數(shù)字技術研發(fā)與整合分項計劃”組織架構圖
主要目標為促成數(shù)字典藏與學習之內(nèi)容與技術融入文化、學術、社會和教育,健全數(shù)字典藏與學習的使用環(huán)境及推動社會大眾、學術界及研究單位等各界使用者運用數(shù)字典藏與學習的經(jīng)驗與知識,進而協(xié)助上述群體經(jīng)營共同創(chuàng)作的公共園地。主要任務為整合協(xié)調(diào)與策略擬定、成果管理與跨單位團隊合作,在島內(nèi)推廣數(shù)字典藏并與海外交流,同時推動盤點暨法律咨詢、商業(yè)競賽、海外推廣、應用競賽與教案設計比賽等應用推廣專案。
“數(shù)字典藏與學習之產(chǎn)業(yè)發(fā)展與推動”
圖7 “數(shù)字核心平臺分項計劃”組織架構圖
主要目標是厚植數(shù)字學習與典藏廠商核心能力,創(chuàng)新學習服務經(jīng)營模式,并有效運用獎勵刺激增加市場需求,輔導企業(yè)提升數(shù)字學習的應用成效。主要任務為:運用臺灣目前數(shù)字學習學術研究居全球領先地位,及企業(yè)產(chǎn)品能力已達一定品質(zhì)的優(yōu)勢,輔導并協(xié)助廠商將學術研究成果產(chǎn)品化,創(chuàng)造產(chǎn)學合作最佳價值;結(jié)合新興科技與應用,研究新興數(shù)字學習內(nèi)容與服務的商業(yè)模式;建立學習產(chǎn)業(yè)鏈(包括載具、行銷渠道、出版業(yè)等),協(xié)助出版業(yè)或載具業(yè)者與數(shù)字學習業(yè)者合作,促使異業(yè)整合; 推動數(shù)字學習業(yè)者協(xié)助補習教育業(yè)轉(zhuǎn)型數(shù)字化,擴大數(shù)字學習應用層面,提升學習效率,增加業(yè)者島內(nèi)商機;引進國際講師及專業(yè)顧問的豐富實務經(jīng)驗,提升業(yè)者專業(yè)能力,并促進國際交流與營銷。預期達到輔導數(shù)字典藏與學習產(chǎn)業(yè)升級,并協(xié)助其他相關產(chǎn)業(yè)競爭力提升。
圖8 “數(shù)字典藏與學習之學術與社會應用推廣分項計劃”組織架構圖
“數(shù)字典藏與學習之海外推展暨國際合作計劃”
目標為推動計劃成果國際化、建立國際合作網(wǎng)絡,藉由典藏與學習成果國際化推廣,展現(xiàn)臺灣豐富的資源,進而拓展臺灣經(jīng)驗于國際社會。以多元主題內(nèi)容,融合先進典藏與學習相關技術,提升臺灣研究領域深度與發(fā)展。參與國際組織與會議,將臺灣多年累積的數(shù)字成果、技術輸出海外,并與國際知名機構建立合作關系。希望藉由計劃執(zhí)行及推動,達到以下成果效益:執(zhí)行國際合作計劃,簽訂合作備忘錄;參與國際會議與發(fā)表計劃成果,提升臺灣能見度;舉辦國際會議拓展國際交流平臺;持續(xù)維護及擴增網(wǎng)站內(nèi)容,提供島內(nèi)外人士運用資源;持續(xù)參與及營運重要國際組織,深耕國際社群;整合島內(nèi)數(shù)字學習資源,提升國際競爭力。
通過該計劃開展各項典藏技術研發(fā),作為教學應用與創(chuàng)意增值的基礎。已完成的有“時間軸導覽”以及“動態(tài)在線藝廊”,皆已上網(wǎng)供各界試用。
在資料檢索應用方面,博客主題偵測可以找出最近的熱門主題或意見領袖,藉由掌握住社會脈動,影響意見領袖的看法,可以進而引導社會的趨勢?,F(xiàn)今研究搜尋網(wǎng)站效益的趨勢是收集并分析搜尋網(wǎng)站的使用者查詢紀錄與使用者標記,運用網(wǎng)頁探勘的技術。網(wǎng)頁查詢結(jié)果自動分群技術,可協(xié)助搜尋網(wǎng)站將重復的結(jié)果整合起來,提升查詢品質(zhì)。資料檢索研究中,網(wǎng)絡事件偵測可以自動群聚某些重要的事件,提供使用者在進行查詢時,擴充相關查詢詞及提供網(wǎng)頁建議。
圖9 “數(shù)字典藏與學習之產(chǎn)業(yè)發(fā)展與推動分項計劃”組織架構圖
影片視訊強化技術針對影像的局部對比強化問題,先后提出兩種有效技術。根據(jù)過去學者對人類視覺與影像局部對比關系的研究,該計劃提出在學術上更具理論基礎的新技術,并且得到相當好的實驗結(jié)果。
在影像與視訊內(nèi)容分析技術研發(fā)上,該技術結(jié)合影像灰階矩形特征與邊緣強度直方圖特征,加上階層式分類器進行視訊內(nèi)容人物偵測。此技術改進階層式分類器的架構,加入適當?shù)闹虚g階層,取代原先每一層互相獨立的方式,利用層與層之間的資訊來增加偵測正確率。研究團隊已提供臺灣師范大學奇美博物館技術服務,進行環(huán)物影片拍攝與環(huán)場環(huán)物虛擬博物館制作的技術教學。
在影片視訊優(yōu)化技術上,研發(fā)新對比強化技術結(jié)合加權式直方圖分解法(簡稱WHS)與灰階群聚法(簡稱GLG)兩技術進行視訊影片的對比強化處理,復合技術稱為WHSGLG。此外,將該技術功能提升針對區(qū)域性影像內(nèi)容進行處理,稱為AWHS-GLG。該計劃所構建的長期保存基礎架構是在各機構計劃建立儲存資源節(jié)點,以直接支持各機構所有備份與保存需求,改善各機構長久保存基礎架構。同時,結(jié)合各機構儲存資源,通過資料網(wǎng)格(datagrid)技術,建立整體數(shù)字典藏完整的長期保存基礎,提供備份與保存所需的各項服務。在過去多年的實際運作與服務經(jīng)驗下,驗證了此方法是兼顧長期保存與儲存擷取的最佳解決方案,無論就成本、長久技術變動的沖擊性都最小,而穩(wěn)定性、效能、安全性均最高。
該計劃開發(fā)的數(shù)據(jù)庫應用系統(tǒng),將能提升各部門后設數(shù)據(jù)的生產(chǎn)及管理品質(zhì),進而催化在研究上的用途。如植物標本檢索系統(tǒng)可查詢各種植物的分布狀況及圖鑒,對于相關領域的研究有所助益。漢字構形數(shù)據(jù)庫可用來解決文字學數(shù)字化的問題,尤其是缺字問題。漢字構形數(shù)據(jù)庫收錄古今漢字11萬多字,是一個記錄漢字形體知識的數(shù)據(jù)庫,這些知識包括:古今漢字的字形演變、古今漢字的字形結(jié)構、不同漢字間的使用關系等。
圖10 “數(shù)字典藏與學習之海外推展暨國際合作分項計劃”組織架構圖
圖11 影像與視訊內(nèi)容分析技術圖示
中文語意自動分析的中文斷詞及剖析技術廣受學術各界肯定,經(jīng)由剖析產(chǎn)生的語法結(jié)構樹數(shù)據(jù)庫是能提供語言學相關工作及研究者分析語法的工具;斷詞工具常用來協(xié)助處理中文各種自然語言問題,例如古漢語的處理、文件分類及檢索等。義類關系數(shù)據(jù)庫的建立除了可以用來幫助解歧外,也可以應用在中文剖析、全文檢索等方面。
多媒體影音典藏技術組發(fā)展的分鏡偵測、精華影片與畫面粹取,可以有效的將影片摘要與索引,讓使用者可以用較少的時間,了解整部影片的全貌,目前在一般的系統(tǒng)上很少利用這樣先進的技術。此外,影音線上編輯技術,可以讓使用者在Web上直接編輯影音的內(nèi)容,包括加入影片字幕、影片分段等,此技術已提出專利申請,技術上領先于一般影音系統(tǒng)。
研析后設數(shù)據(jù)標準整合服務,以資料編碼與傳輸標準作為一種共享暨互通式的整合框架,結(jié)合不同后設數(shù)據(jù)標準,以及各式數(shù)字物件,同時可進一步作為與數(shù)字學習及數(shù)字長久保存相互結(jié)合的應用。該計劃針對靜態(tài)數(shù)字影像檔相關后設數(shù)據(jù)標準進行研析,包括NISOIMG,LC-AV,MIX等,并以島內(nèi)主題計劃為個案進行數(shù)字典藏3類屬性(描述、結(jié)構、管理)后設數(shù)據(jù)的整合研發(fā),作為日后導入該計劃相關配套的草案。
“古典文獻文物的三維立體視訊數(shù)字典藏研究”探討應用于古典文獻文物的三維立體轉(zhuǎn)換芯片,由多種角度所拍攝出來的影像來產(chǎn)生三維立體影像,可以讓使用者不需經(jīng)過麻煩的立體輔助眼鏡,而是讓使用者直接用肉眼便可達到同樣且舒適的三維立體視覺效果。
2010年推出漢字構形數(shù)據(jù)庫2.64版,累計收錄古今漢字143,173個,此版本全面涵蓋古籍、文字學及宗教三大缺字應用范圍,已開放下載。
圖12 新對比強化技術處理范例
研發(fā)自動地理數(shù)字化技術,利用擷取后設數(shù)據(jù)中地理候選名詞描述資料,通過網(wǎng)絡探勘方式進行自動地理數(shù)字化模組,可進行單點、多點定位或是進一步處理范圍型資料分布,提供典藏單位將數(shù)據(jù)庫內(nèi)容自動定位至地圖上,進行整合呈現(xiàn)。
研發(fā)保護CSS檔案的技術,可以將秘密訊號藏入CSS檔案內(nèi),更可以抽取出這些秘密資訊,讓竊取檔案的人無法宣稱自己是檔案的撰寫者,使侵權者無所遁形。同時在多媒體數(shù)字版權管理新技術與應用的研究方面,以多媒體作秘密傳輸,用文字矩陣中表示坐標的數(shù)字隱藏秘密資訊。
開發(fā)進階性超頻譜掃描系統(tǒng)影像技術,采用芬蘭制造的光柵為基礎,采用延遲透鏡組成像于中階CCD模組,以多頻譜的運算模式,將影像呈現(xiàn)在液晶屏幕與標準四色印刷品上,達成初步的多頻譜復制系統(tǒng),突破目前國際色彩聯(lián)盟(ICC)色彩管理系統(tǒng)僅能在單一特定光源下保證色彩一致的限制,使文物能在不同照明環(huán)境下,外觀的色澤仍與原件相吻合。
目前大部分的辨識碼均以英文和數(shù)字作為出題的主要依據(jù),該計劃提出的新興人機辨識碼是以中文字作為基礎,稱為中文人機辨識碼。通過中文字的拆解組合,讓使用者不需有中文能力即可進行,而且配合觸控式屏幕,可以輕易地在移動裝置上進行使用。
圖13 臺灣“數(shù)字典藏與數(shù)字學習國家型計劃”重要網(wǎng)站關系圖
為豐富數(shù)字典藏內(nèi)容的多樣性,該計劃積極邀請擁有珍貴典藏品的部會機構或單位加入,同時為擴大數(shù)字典藏參與對象,通過公開征選計劃的方式,提供中小型典藏機構、公私立單位和一般大眾有共同參與的機會。為了向社會大眾展示典藏成果,提升該計劃在島內(nèi)外的知名度及影響力,并促進數(shù)字化內(nèi)容(含聯(lián)合目錄內(nèi)容與數(shù)字學習教材等)的利用,因此設立數(shù)字典藏與數(shù)字學習成果入口網(wǎng),包括各類數(shù)字內(nèi)容、網(wǎng)絡技術以及創(chuàng)意增值示范專題,向各界呈現(xiàn)計劃成果。使用者可以從單一平臺依主題和適用對象瀏覽各式網(wǎng)站訊息,并與各網(wǎng)站相連結(jié)以獲取完整資訊。
截止2013年底,臺灣“數(shù)字典藏與數(shù)字學習國家型科技計劃”結(jié)束為止,聯(lián)合目錄累計完成的藏品原件約447萬件,數(shù)字化產(chǎn)出約820萬筆數(shù)字化媒體材料。資料來源82%來自機構計劃,18%來自公開征選計劃,主題類型以文獻與檔案類為最主。
該計劃共建立了524個網(wǎng)站,目前仍在持續(xù)運作的有379個。通過大型展覽、發(fā)行出版品等途徑,舉辦推廣活動等方式,以多元化、精致化、大眾化方式進行計劃成果推廣,提升社會對于數(shù)字資源的了解與應用。該計劃展現(xiàn)數(shù)字典藏與數(shù)字學習成果入口網(wǎng)站群包括:入口網(wǎng)與專題、聯(lián)合目錄、成果網(wǎng)站資源庫及博客,迄今訪客已超過3000萬人次。
此外,為配合臺當局“臺灣書院”推動計劃,該計劃協(xié)助“國科會”建立“臺灣書院數(shù)字資訊整合平臺”,整合20個“部會”的入口網(wǎng)、數(shù)據(jù)庫等,將具有臺灣特色的數(shù)字資產(chǎn)通過分類的方式介紹給全世界,且拍攝宣傳影片,宣揚中華語文教學暨中文繁體字(臺灣稱“正體字”)推廣、臺灣研究暨漢學研究、臺灣文化的展現(xiàn)與輸出,作為國際認識臺灣的一個宣傳媒介。此平臺已于2011年10月中旬正式上線,并在美國紐約、休斯頓及洛杉磯三地成立“臺灣書院”的同時,正式將此平臺推向全球。
該計劃在執(zhí)行的過程中,逐步推動數(shù)字典藏珍貴成果資源與聯(lián)合目錄的多語化,通過翻譯的方式,將臺灣重要的數(shù)字典藏資源以英、日、西班牙語的方式呈現(xiàn),屏除語言的隔閡,不但可拓展臺灣數(shù)字典藏聯(lián)合目錄與成果資源內(nèi)容的使用族群,更能將臺灣數(shù)字典藏的成果推向國際市場,提升臺灣數(shù)字典藏成果在國際舞臺上的能見度。為了使該計劃在數(shù)字典藏目錄的多語化工作得以順利進行,自2009年度開始構建數(shù)字典藏聯(lián)合目錄翻譯平臺,進行初步的測試與評估,執(zhí)行聯(lián)合目錄的翻譯工作,執(zhí)行一年的多語化翻譯成果約有110萬字。
該計劃征集的史料成果當中,包括自美國空軍歷史研究部征集的航照及檔案資料,有助于對于二次世界大戰(zhàn)后期盟軍對臺灣的軍事戰(zhàn)略、作戰(zhàn)攻擊有更深入的了解,特別是有關于美軍空襲臺灣所做的研究準備、情報搜集及攻擊任務計劃,提供細致且精彩的檔案文獻及圖象資料。就臺灣史研究而言,這些材料可以提供研究二次大戰(zhàn)后期美日之間的軍事活動,以及對于臺灣基礎設施和社會的影響,同時當時美軍所搜集的臺灣各項軍事、人文及自然環(huán)境的情報資料,也成為臺灣歷史研究基礎素材。在檔案文獻部分,吉岡喜三郎文書原件的取得,則可通過第一線實務官僚的觀點,了解日本殖民時期臺灣警察及理蕃工作的執(zhí)行情形。
圖14 數(shù)字典藏聯(lián)合目錄流量趨勢
該計劃及項下機構計劃以國際合作方式,征集散佚海外珍藏,內(nèi)容涵蓋范圍包括圖書館、檔案館、博物館等各典藏機構珍貴藏品,有關的重要文化資產(chǎn)有器物、文獻、模式標本等型態(tài)與載體,內(nèi)容多元且形式多樣,可充實數(shù)字典藏數(shù)據(jù)庫、數(shù)字內(nèi)容知識庫,與臺灣現(xiàn)有的收藏相互補充,豐富島內(nèi)各領域研究主題重要資源,改善島內(nèi)學術研究資源環(huán)境。目前該計劃已與14個國家和地區(qū)96個機構建立了合作關系,包括德國自然史博物館、韓國閔貝類研究所、澳洲格里菲斯大學、美國國會圖書館、英國倫敦大學國王學院及法國巴黎自然史博物館等機構。通過與存放臺灣模式標本的海外機構的合作與交流,將模式標本相關資訊征集回臺灣。搜集到許多散落海外的臺灣產(chǎn)模式標本,并與島內(nèi)也在整理模式標本的機構做交流合作及網(wǎng)絡資訊的連結(jié),完整呈現(xiàn)臺灣模式標本資訊的網(wǎng)頁,未來更能與其他生物物種(動、植物)模式標本,結(jié)合臺灣生物物種模式標本資料,完整呈現(xiàn)在網(wǎng)際網(wǎng)絡上。另一方面,也征集取得多樣性的臺灣文史資源,不僅可支持歷史研究所需的完整與客觀的知識資訊來源,亦能促進臺灣史研究主題的拓展與研究成果展出。
例如臺灣本土魚類數(shù)字典藏的國際合作發(fā)展與研究計劃,與國際魚類數(shù)據(jù)庫進行合作交流,除了配合其整合需求而更改臺灣鏡像網(wǎng)站的網(wǎng)域名稱及更新網(wǎng)站統(tǒng)計軟件,也將協(xié)助推廣AquaMap數(shù)據(jù)庫的建立與其分布繪圖功能效能的提升,未來將提供臺灣“海鮮指引”的資料到國際上“海產(chǎn)食品指南”網(wǎng)站。
建立溝通平臺及合作機制,加速數(shù)字化知識的累積
通過“數(shù)字典藏國家型科技計劃”的實施,客觀上加速了臺灣島內(nèi)數(shù)字化知識的積累,許多珍貴史料、文獻也因該計劃而得以廣為學術界使用,例如中研院近代史研究所與臺灣“外交部”簽署合作協(xié)議,將國民政府成立之后的“外交”檔案寄存到近代史研究所,使中國近代外交檔案得以整合,近代史研究所也得以成為中國近代外交檔案的典藏中心。以往臺當局對中國近代外交與國際關系研究的資料取得限制較多,經(jīng)過對這批檔案進行數(shù)字化處理之后,配合部分檔案解密,其內(nèi)容對于研究中國近代外交史有莫大幫助。此外,臺灣“國史館”所藏臺當局各部門檔案資料也是史學研究者不可或缺的素材,臺灣文獻館也收藏豐富的臺灣省級機關檔案,臺灣“省咨議會”的史料,包含“參議會”、臨時“省議會”以及“省議會”時期的檔案、公報、議事錄等,是島內(nèi)最完整的臺灣省政建設資料,其查詢系統(tǒng)對相關領域的研究將產(chǎn)生重要影響。
再如中研院史語所利用該計劃,開展島內(nèi)民族文書的編目譯解與全文翻譯工作,提供了島內(nèi)中國西南少數(shù)民族研究相關重要史料。中研院史語所進行卑南語的“祭典”語料、布農(nóng)語南部方言語料和排灣語等翻譯工作,也極大促進了對該民族語言與文化的研究和了解。
提供在線知識服務網(wǎng),創(chuàng)新學術研究模式
憑借各館藏資源數(shù)字化的過程,如典藏品分類與后設數(shù)據(jù)建立等,有利于各典藏品學術價值的再發(fā)現(xiàn),以及既有價值的保存與使用,與資訊技術的結(jié)合改變既有的學術研究模式。例如中研院史語所的臺灣“國語自然語音數(shù)據(jù)庫”即提供語言學重要的研究介面,用以記錄及分析“國語”在臺灣使用時的種種不同社會意義;一方面通過建立語言典藏數(shù)據(jù)庫與量化分析語言資料,讓典藏的共時語言資料在未來也能用來印證歷時語言的演變;另一方面則可利用區(qū)域性標記、社會性標記、功能性標記來分別反映方言變因的地理因素、社會情境與社會階級因素、語言風格因素。
該計劃項下共有126個數(shù)據(jù)庫,提供學者及研究者可以經(jīng)由遠距網(wǎng)絡上線,或利用單機上線方式瀏覽,檢索檔案資料,快速有效的收集研讀所需檔案資料,減少研究成本,提高研究效率。例如“國史館”臺灣文獻館與“省政府檔案中心”合作,在檔案數(shù)字化后提供網(wǎng)絡線上檢索的功能,使用者只要鍵入欲查詢資料的關鍵詞,即可獲得數(shù)據(jù)庫中相關的資訊,便于讀者在查詢臺灣省政相關資料時不需要省府與文獻館兩地奔走,節(jié)省民眾在各典藏地之間往返的經(jīng)濟成本。
通過這些數(shù)據(jù)庫,臺灣民眾不但得以一窺古籍、古物等原貌,同時脆弱的珍貴原件也不需一再被提借,藉由數(shù)字化流程,影像檔案完整保存下來,并成為重要的文化資產(chǎn)。在有形的文化資產(chǎn)方面,例如臺灣文獻館的臺灣鹽業(yè)檔案數(shù)量龐大,文別種類多或時間演進紙質(zhì)老化、或保存不當,部分檔案已破損,即時數(shù)字化通過網(wǎng)絡傳輸,提供民眾了解臺灣鹽業(yè)專賣的樣貌。又如澎湖的石滬推估已有300年的歷史,其發(fā)展有其歷史與保存的價值,但是相關的建筑、人文、產(chǎn)業(yè)、信仰等的文化資產(chǎn)正逐年凋零,澎湖縣保護石滬文化資產(chǎn)已經(jīng)到了刻不容緩的境地。通過網(wǎng)際網(wǎng)絡無遠弗屆的屬性,將澎湖石滬的資訊傳送至世界各地,以期廣為流傳應用。在無形的文化資產(chǎn)方面,例如語言,亦得以通過數(shù)字化加以保存,如中研院臺灣南島語數(shù)字典藏計劃著重于原住民人才培育及語言保存和推廣,且持續(xù)培養(yǎng)相關研究人力,提供社會關于南島語、閩客語及古文字漢語相關學問的人才。
在數(shù)字典藏計劃中有許多標本物件,除可作為過去生物多樣性的最直接證據(jù),物種訊息的存證與利用及重要的系統(tǒng)研究基礎外,同時也可藉以偵測種間關系,并建立分類架構,近年來標本更可作為環(huán)境受到干擾的生物指標。另外,標本的參考價值和為歷史的見證,并可協(xié)助農(nóng)業(yè)和醫(yī)學上害蟲的鑒定、支持環(huán)境研究及生物防治計劃,因此標本的保存為相當重要且不可忽視的部分。
再如臺灣大學圖書館收藏的《田代文庫》、歌仔冊、《狄寶賽文庫》等為具有獨特性的珍本或獨一性的重要史料資料,通過原件影像數(shù)字化,完成上述該館重點特藏資料各原件的內(nèi)容判讀、詮釋及分析或描述等工作,通過網(wǎng)絡提供清晰且完整的文獻資料,將可拓展臺灣文學、語言學、史學及植物學等的深度研究與廣度。其中,《田代文庫》尚可與該校植物系的標本數(shù)字化成果結(jié)合,提供植物學者完整的學術研究資源。
由于以往臺灣地區(qū)的數(shù)字典藏工作大多以單一物件作為描述的標準,然而在網(wǎng)絡環(huán)境之下,資源合集層次的描述可提供使用者更完整的資訊,并可協(xié)助使用者在跨領域的檢索中,獲取更高層次的資訊。該計劃參考海外的相關研究,并考量島內(nèi)典藏單位的實際情形,訂定資源合集層次描述資料的相關標準,建立資源合集層次描述資料的欄位(schema)與相關的描述資料,以及《資源合集層次描述指引》手冊,可作為島內(nèi)外典藏單位進行多語化工作的參考依據(jù)。
推廣數(shù)字典藏成果,消弭社會數(shù)字落差
該計劃通過數(shù)字典藏素材的利用與公開,以第一期計劃的民族學藏品資料成果為媒介,例如通過1930年代臺灣民族志紀錄片中有關賽夏族與平埔族的影音光碟,建立與原住民部落的交流與合作,也藉由社區(qū)互動與公共參與,收集更深入的社會文化脈絡資料,并建立兼具整合性、系統(tǒng)性的多媒體數(shù)字數(shù)據(jù)庫,將數(shù)據(jù)庫提供給社區(qū)文物館及社區(qū)文史工作推廣,制作成鄉(xiāng)土教材,以實現(xiàn)知識普及和公共參與的目的。
圖15 2012年10月在臺中自然科學博物館舉辦“數(shù)字典藏與數(shù)字學習國家型計劃”10年總成果展
該計劃致力于偏遠鄉(xiāng)村原住民部落數(shù)字典藏推廣研究,由學界與民間組織組成工作團隊、調(diào)查部落對數(shù)字典藏的認知與保存文化的期待、根據(jù)調(diào)查結(jié)果建立部落數(shù)字典藏網(wǎng)站,逐步開始搜集部落典藏的素材。為了使數(shù)字典藏內(nèi)涵更加多元,并擴大數(shù)字化工作參與層面,該計劃建立“數(shù)字島嶼”平臺,廣泛向民間募集臺灣圖像,期盼能展現(xiàn)更豐富更完整的臺灣面貌。除了不同部門分工合作,彌補鄉(xiāng)村地區(qū)資源不足的困境,也掌握部落文化典藏的需求,使典藏成果貼近部落居民生活。該計劃項下子計劃通過至新竹尖石鄉(xiāng)新光小學推廣數(shù)字典藏,縮短城鄉(xiāng)差距,帶領原住民兒童認識數(shù)字化、了解考古知識并設計互動游戲來認識珍藏文物。
另外,該計劃還構建網(wǎng)絡電子書導覽系統(tǒng)平臺與一套“電子書自動產(chǎn)生器系統(tǒng)”軟件,配合臺灣“教育部”推動縮減城鄉(xiāng)數(shù)字落差相關計劃,向臺“教育部”設立的偏鄉(xiāng)數(shù)字機會中心捐贈軟件200套,協(xié)助偏遠鄉(xiāng)鎮(zhèn)改善數(shù)字落差現(xiàn)象。
該計劃還在島內(nèi)舉辦主題特展“通往數(shù)字國度的探索列車”,參展單位有臺灣大學、臺北故宮博物院、中研院、科博館等單位,充分展現(xiàn)各典藏單位的特色。其中由故宮所提供的《國寶總動員》影片也是在臺灣首次離開故宮院區(qū)播放,對于臺灣民眾可以進一步體驗典藏文物經(jīng)數(shù)字化后的便利性。
臺灣故宮博物院參與美國國家地理頻道拍攝紀錄片《舊寶藏.新未來:故宮博物院》的拍攝。由國家地理頻道紀錄該項目的360度環(huán)物攝影系統(tǒng)進行拍攝故宮古文物的情形。該紀錄片于2007年10月以34種語言轉(zhuǎn)播至全球166個國家和地區(qū),有超過2.5億的收視者,有助于宣傳與提升該計劃項下故宮數(shù)字典藏的專業(yè)形象,對臺灣執(zhí)行數(shù)字典藏計劃的宣傳上有加分效益。
通過授權,擴大教育應用與商業(yè)增值
該計劃自2005年起邀集業(yè)界廠商、官方與民間典藏單位,結(jié)合臺灣文化創(chuàng)意產(chǎn)業(yè),一同前往紐約參加全球最大規(guī)模的紐約國際授權展,不僅將學術與商業(yè)結(jié)合,提升學術資料在使用上的靈活度,也不斷延伸臺灣典藏的珍貴資料的發(fā)展可能。
該計劃開發(fā)的“圖庫文件授權數(shù)據(jù)庫系統(tǒng)”,提供項目內(nèi)部查詢各類授權圖片,主要的目的是用來收集已經(jīng)授權給數(shù)字典藏使用的檔案,例如圖片、影像與文件等,提供給該計劃內(nèi)各項非營利性活動使用,以提高授權典藏品的使用率,并藉由典藏品的使用,進而創(chuàng)造出更多的作品。例如臺灣大學地質(zhì)科學系授權三民書局使用巖石標本數(shù)字影像圖檔,包括角閃黑云母花崗巖、石英云母片巖等42件,使用在《高中基礎地球科學及其實驗活動手冊及教師手冊》以及《高中地球與環(huán)境(下)及教師手冊》教科書中。
通過技術轉(zhuǎn)讓,降低企業(yè)開發(fā)成本。例如對有心經(jīng)營Web2.0影音平臺的公司與個人,提供一套低開發(fā)成本的多媒體影音典藏技術解決方案來建立影音發(fā)布與分享平臺。此技術已轉(zhuǎn)讓給臺北藝術大學,并與宏碁科技公司合作,應用于臺當局“新聞局”的影音典藏與對外展示平臺。
在數(shù)字音樂充斥的今日,實體音樂檢索技術的經(jīng)濟效益龐大,需求殷切。該計劃所建立的自動音訊處理與檢索技術對開發(fā)中文環(huán)境的多媒體數(shù)字博物館將有具體的貢獻,這些技術均可供產(chǎn)業(yè)界參考。
中文語意自動分析技術中的斷詞技術已達實用價值,目前已與資策會、碩網(wǎng)資訊及凌網(wǎng)科技公司合作并轉(zhuǎn)讓技術,將有助推動語言處理(例如語音及文字辨識、資訊檢索等)相關產(chǎn)業(yè)發(fā)展及幫助建立完善的人機界面。