国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人文項目中數(shù)字化標準初探

2020-01-07 10:17:49其其格
科技創(chuàng)新與生產力 2020年3期
關鍵詞:成果人文數(shù)字化

其其格

(北京外國語大學,北京 100089)

近年來,數(shù)字人文成為圖書館領域十分熱門的話題,將人文資料用互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等新技術手段,變成可以機械統(tǒng)計、有可視化結果的數(shù)據(jù)源是圖書館新的數(shù)據(jù)服務方式。悄悄興起的數(shù)字人文運動,正在撼動圖書館保存管理圖書資料的傳統(tǒng)業(yè)務,越來越多的圖書館開始重視并參與到圖書資料數(shù)據(jù)化的統(tǒng)計分析課題中,將業(yè)務延伸到數(shù)據(jù)的管理與知識的組織服務中去。在此背景下,圖書館調整策略,升級業(yè)務,在本館文獻資源數(shù)據(jù)化的基礎上建設各自的數(shù)據(jù)平臺,提供更好服務的同時,也制造出了越來越多不同形式的數(shù)字人文平臺。這些平臺揭示了不同層面、不同內容、不同格式的文獻,并呈現(xiàn)出多樣的分析和檢索形式。隨著這些項目的推進與數(shù)字人文變革的深入,讀者將不得不奔波檢索于不同單位的數(shù)字項目中,而這些項目中很多共通的信息都不能相互鏈接使用,圖書館設置的一個個項目變成了知識分享的藩籬。

隨著各機構紛紛立項開展與推進數(shù)字人文項目,數(shù)字人文成果的獲取和推廣問題即將突顯,文獻數(shù)字化的數(shù)據(jù)標準、平臺標準、獲取標準及未來可融合的技術標準等一系列的行業(yè)標準,或許是未來數(shù)字人文做大做強,真正惠及學林,推動整個文史行業(yè)的研究熱度,提高影響力的關鍵。

1 數(shù)字人文項目實踐中的主要困境

關于圖書館數(shù)字人文發(fā)展中存在的問題,許多學者都有所討論。蔣萌[1]在《新時代圖書館數(shù)字人文發(fā)展研究》中認為,圖書館數(shù)字人文發(fā)展存在觀念滯后于傳統(tǒng)束縛、體系開放與邊界迷茫、方法創(chuàng)新與技術支撐薄弱3 個問題。黃水清[2]認為,人文計算的研究現(xiàn)狀可用“三多三少”來概括,首先是追熱點的論文多,有實質意義的成果少……其次是非人文學者關注多,人文學者關注少……最后是泛泛議論多,成功案例少。朱強[3]表示,數(shù)字人文項目兼容性不強、標準繁雜,很容易形成大量的信息孤島,會造成大量的重復建設;同時,隨著時間的推移,項目引導制下產生的數(shù)字人文成果由于項目到期的原因將面臨服務無法跟上、無法可持續(xù)發(fā)展等諸多問題。本文在文獻調查的基礎上,總結出數(shù)字人文項目實踐中的主要困境有以下4 點。

1)同質化文獻資源重復建設,造成資源浪費。在紛亂復雜的數(shù)字人文項目建設中,用什么樣的資源、做什么樣的平臺都是各機構自身的項目計劃,大多數(shù)項目的文獻來源為本館資源,而大館之間互通的文獻非常多,很難避免資源重復建設問題。針對這個問題,袁愛蓮[4]提到了特色學科資源重復建設的問題,認為各高校間可根據(jù)實際情況進行圖書館特色學科資源的協(xié)同采購和聯(lián)合建設,這樣不僅有助于減少各高校圖書館的特色學科資源建設成本,也可以避免特色學科資源的重復和浪費問題,并可以提升高校圖書館特色學科資源的利用效率。

對同一部書不斷重復進行數(shù)字化,必然造成人力、物力、財力的浪費,在眾多數(shù)字人文項目的建設中,文獻電子化如果能如袁愛蓮所言,形成一個協(xié)同采購的平臺,必然可以減少很多資源的浪費,但也不能忽視同一文獻的版本、鈐印、批注等文獻內容之外的價值。最好的做法是在數(shù)字人文項目建設中,既有相同文獻的協(xié)同采購,以加快項目的推進,又有文獻特色化的掌控,不流失文獻價值。

2)平臺技術使用不統(tǒng)一,影響了項目完成后進一步整合集中更全面揭示文獻的可能性。不同機構的數(shù)字人文項目采用的設計理念和技術不同,使得在項目建設初始階段就注定每家成果的差異性,但縱覽數(shù)字人文項目,圍繞不同主題的文獻資源、歷史資料而建設的項目庫比比皆是,從長遠看,同樣是史料,不同歷史階段的史料庫是否可以兼容;同樣是民族文獻庫,能否對接同行的資源庫等,都是電子資源庫大量建設之后面臨的問題。如第一階段的項目建設成果各自為政,各項目建設的平臺技術不能兼容,則從長遠看各平臺通力合作,整合資源,更好更便捷地為讀者服務就成為了難題。

3)多機構成果獲取之間存在藩籬,加大了讀者獲取資源的難度。隨著數(shù)字人文項目成果的逐步完成,特色資源的多少、檢索是否精準、分析模型好壞、界面是否友好、使用是否方便、信息揭示是否完整、準入門檻高低等因素,都將是讀者獲取信息的重要參考。在不久的將來,數(shù)字人文項目成果的大面積分布和海量不同單位項目賬號的獲取,會成為跨庫文獻檢索新的難點,文獻檢索技巧也從數(shù)據(jù)庫之間的使用和轉換,變成更多層級信息獲取的分析和博弈。在不久的將來,海量的數(shù)據(jù)將在不同機構多樣化的存在并且各自為政,加大了讀者獲取文獻的難度。可以預見,數(shù)字人文項目成果獲取的藩籬會極大地浪費科研與建設資源,提高知識獲取和分享的壁壘,割裂各機構文獻資源的紐帶。面對這個趨勢,筆者認為有必要在大多數(shù)字人文項目建設初期做一些預設,讓各自為政的機構和數(shù)據(jù)有互通共用的可能,讓各家的數(shù)字人文項目能夠取長補短,避免重復建設,讓數(shù)字人文的基本分析工具在大多數(shù)項目中通用。現(xiàn)階段,這個預設最好由基金發(fā)布部門和項目建設部門都認可的協(xié)會或單位制定,從頂端設計出發(fā),讓大多數(shù)項目有共通的可能。在本文中,稱之為數(shù)字人文標準制定。

另外一個困境是參與數(shù)字人文建設的機構單位越多,需要跨庫去找的資源就越多,本應檢索使用便捷的數(shù)據(jù)尋找起來越難。大量基金支持下的數(shù)字人文項目的展開,建立起越來越大規(guī)模的數(shù)據(jù),數(shù)據(jù)的檢索利用效率今后還有很大提升空間。

4)成果揭示的形式多樣,質量參差,分析工具多元,加大了讀者轉引困難。由于各家機構數(shù)字人文項目建設的情況不同,原始文獻的數(shù)字化階段也各有不同,有的剛剛起步,有的直接從縮微膠片、光盤、黑白掃描等不同形式的原有數(shù)字化形式轉換,數(shù)字項目結束后,讀者能夠獲取的文獻形式也差異很大,在圖像清晰度上,新數(shù)字化的文獻成果要高于縮微膠片、黑白掃描等早期數(shù)字化的文獻,利用這些文獻做進一步文字提取,數(shù)據(jù)分析的準確率更高;不同項目中底層設計的分析模型不同、參數(shù)不同,也會影響最終的分析結果。以北京大學為例,張乃帥、孫超在《北京大學圖書館長期保存系統(tǒng)建設與探索》提出,在數(shù)字人文資源及館藏資源的長期保存實踐中出現(xiàn)的問題有:數(shù)據(jù)庫商提供的回溯數(shù)據(jù)和更新數(shù)據(jù)格式不一致、部分功能需手動啟用、底層數(shù)據(jù)模型兼容性較差、數(shù)字人文資源保存難度大等[5]。北京大學作為國內頂級高校經(jīng)費充足、資源豐富,圖書館老師聯(lián)合學者引領著國內數(shù)字人文項目的推進和實踐,他們尚有此考慮,在更寬廣視野中的圖書館在數(shù)字人文項目建設中也必然面臨這樣的困境,這也是本問題提出的大背景。相信開展數(shù)字人文項目的機構在項目推進過程中,或多或少都會出現(xiàn)相關問題,同樣的文獻,因為數(shù)字化形式的不同,或者分析模型的不同,可能分析出不同的結果;而隨著數(shù)字人文成果的增加,本意為方便讀者做文獻分析的數(shù)字人文項目,也會因不同因素影響,可能出現(xiàn)不同的分析結果,導致數(shù)字人文項目中分析結果的科學性缺乏驗證。

2 數(shù)字人文項目發(fā)展期的標準化建設

由上述困境不難看出,隨著數(shù)字人文理念的傳播和文化保護意識的提升,數(shù)字人文建設項目遍地開花,但項目成果的形式與數(shù)據(jù)進一步分析使用情況值得深思。發(fā)展中的數(shù)字人文項目是智慧圖書館的數(shù)據(jù)化文獻特藏深層揭示分析的嘗試,還是未來科研標準化數(shù)據(jù)的締造者,都要看數(shù)字人文項目建設中數(shù)據(jù)格式、分析工具等是否能夠統(tǒng)一標準,項目成果能否達到行業(yè)使用共識?;谶@個認識,筆者認為數(shù)字人文項目建設中標準的制定必不可少。

1)制定可共同聯(lián)合的技術標準,讓更多的項目可有共建、聯(lián)合的可能性。鑒于目前各自為政的資源建設情況,各家成果不能實現(xiàn)共建共檢共引,讀者文獻檢索的結果就會非常雜亂。如果在項目建設初期打通基礎技術,那么隨著不同主題、不同概念的數(shù)字人文項目的完成,很多項目可以合并統(tǒng)一,形成更大規(guī)模的資源庫,方便讀者高效地檢索分析。在頂端設計、項目申請之前就制定好基本的標準,有利于資源的整合,促進更好地為讀者服務?;谶@個問題,李立睿在《國外iSchools 高校圖書館數(shù)字學術服務調查與分析》中提出,高校圖書館可以從重視用戶個性需求內容識別、以協(xié)同化模式推動服務進程、加強綜合化服務聯(lián)盟構建等方面深化數(shù)字學術服務發(fā)展[6]。協(xié)同化模式,共建聯(lián)合的形式逐漸被大家認可。

2)制定數(shù)據(jù)形式的標準,讓數(shù)字人文項目建設有所參考,讀者的信息獲取更有保障。我國幅員遼闊,圖書館眾多,不同地區(qū)不同性質的圖書館資源數(shù)字化情況不同,在數(shù)字人文項目建設中,有利用原本數(shù)字化資源進行的,也有從文獻數(shù)字化起步,經(jīng)過數(shù)字化步驟之后進一步整合資源形成可分析可視化的分析數(shù)據(jù)庫的。各家具體情況不同,所提供的原始數(shù)據(jù)不同,導致最終成果也各有特色,例如古籍內容揭示,有的提供黑白掃描時期不甚清晰的圖片入庫,那么進一步取詞分析則有難度;有的原始數(shù)據(jù)都是文本,那么追根溯源,考鏡源流,版本引用上存在困難。諸如此類,都是因為數(shù)字人文項目建設準入沒有標準導致的,在數(shù)字化項目興起階段,這些錯綜復雜的情況能夠反映我國數(shù)字資源的多元化存在情況,但是隨著行業(yè)成果的融合,標準化引用等進一步合作需求的出現(xiàn),項目元數(shù)據(jù)的格式、大小、呈現(xiàn)形式、分析工具等都需要有一定的標準。學術研究講究慎終追遠和前人成果,只有嚴格整合文獻資源,遵循必要的標準規(guī)則,才能讓數(shù)字人文項目平穩(wěn)落地,為讀者服務,為科研服務,產生更大的效能。

上海圖書館夏翠娟認為,圖書館應結合資源優(yōu)勢和專業(yè)優(yōu)勢,集中精力于基礎設施建設,促進跨機構資源整合、跨領域知識融通和跨網(wǎng)域開放獲取[7]。吉林大學薛歡雪針對可移動文物數(shù)據(jù)庫的構建探討了數(shù)字人文“一站式服務”的問題,認為對于任何特定的研究領域,似乎沒有“一站式商店”提供所有可用的數(shù)字資源。構建可移動文物數(shù)據(jù)庫的目的是通過互聯(lián)網(wǎng)和信息技術,有效地將圖書館、博物館和檔案館等資源進行整合,將數(shù)字資源與實物相鏈接,兼顧各自的優(yōu)勢,構建虛實結合的信息知識傳播形式,打造適合跨機構的數(shù)字化學術生態(tài)系統(tǒng)[8],并在可移動文物數(shù)據(jù)庫建構框架中,對整合跨機構的數(shù)字化學術生態(tài)系統(tǒng)提出了期待。

可見,學界對于數(shù)字人文項目的標準也有期待和呼喚,標準的出臺和實施是時代發(fā)展的必然。

3 數(shù)字人文項目實踐中標準制定應注意的問題

基于以上情況,數(shù)字人文項目推行幾年來,各種問題已經(jīng)開始出現(xiàn),各類圖書館在計劃、推進數(shù)字人文項目建設時應該注意以下4 點。

首先,要注意行業(yè)性標準的參考。標志性大館大力扶植基礎項目,并公開技術標準,小館盡量予以參考。這樣,小館在項目設計、項目實施中,可以避免很多因信息不對稱而造成的決策失誤,也能在未來業(yè)務拓展、開放獲取等不同情況下做到兼容。在這方面,國內已有成功的先例。如國家圖書館古籍普查設立的“古籍普查平臺”,其中對于古籍基本項目著錄格式都有清晰明確的要求,多家機構在本館古籍普查的同時,也統(tǒng)一了古籍著錄標準。再如,“中華古籍保護計劃”的“中華古籍資源庫”建設,在國家圖書館館藏資源電子化的同時,集成天津圖書館古籍法藏敦煌遺書等多館館藏資源。近年來,這一項目得到了眾多公共館的支持配合,各家同步進行古籍數(shù)字化平臺建設,建設成果可以在統(tǒng)一平臺上開放獲取,供讀者使用。這一項目的推進和實施,做到了在行業(yè)大標準的前提下兼容各館業(yè)務,形成大的數(shù)字人文項目。

其次,要注意以大館帶小館,大項目聯(lián)動小項目。數(shù)字項目制定之初,可以調研國家圖書館、上海圖書館等大館相關業(yè)務開展的經(jīng)驗和教訓,在基礎標準制定上盡量兼容可升級。例如,館藏古籍中家譜數(shù)字化建設,可以參考上海圖書館“上海圖書館藏家譜全文”數(shù)據(jù)庫,查重排除已經(jīng)數(shù)字化的家譜,增加本館特色,兼容上海圖書館系統(tǒng),讓大館大項目帶動小館小項目,可免去很多重復建設。

再次,要注意精簡門檻,合理配置,多庫聯(lián)合,更廣闊地揭示資源。在數(shù)字人文項目成果的揭示上,盡量少設置讀者閱覽門檻,或太拘泥本館資源,只求一城一池的發(fā)展,而是要開闊眼界,在兄弟單位尋求跨單位協(xié)作,各單位的特色資源聯(lián)合建設聯(lián)合展示,更全面廣闊地揭示資源。

最后,要注意引導OA 項目,將成果轉化為實際,推動產學研一體化。近年來,數(shù)字人文項目建設的同時,伴隨著開放獲取運動的極大發(fā)展。原來圖書館各自為政,資源獲取門檻較高的局面被一個個建設完備、OA 開放、獲取容易的大數(shù)字人文項目所打破。所以,各類圖書館都要意識到OA 潮流的發(fā)展,積極投入到共同建設、開放獲取的資源呈現(xiàn)中,在建設數(shù)字人文項目時就注重引導OA 項目,更大限度地推動產學研的快速轉化。

4 數(shù)字人文項目標準制定的意義與展望

由上可見,數(shù)字人文項目建設前期,數(shù)據(jù)格式、呈現(xiàn)形式、分析模型等標準的制定有利于合理優(yōu)化利用資源,推進我國文獻數(shù)字化的進程。這樣的頂端設計,需要從上而下,由項目的審批部門提出,貫徹到各個層級機構的項目中去。

習近平總書記在紀念改革開放四十周年的講話中指出,推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉化、創(chuàng)新性發(fā)展,傳承革命文化、發(fā)展先進文化,努力創(chuàng)造光耀時代、光耀世界的中華文化。數(shù)字人文的本質就是將傳統(tǒng)的古籍、史料等文化資源進行現(xiàn)代化的轉換分析,這類項目的推進既離不開國家和機構的支持,也離不開圖書館館員孜孜不倦地工作。而制定合理的項目標準,有助于圖書館推動優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉化、發(fā)展。圖書館作為傳統(tǒng)文獻的收藏機構,有責任和擔當做好標準化的數(shù)字人文項目,有能力和力量推動傳統(tǒng)文化光耀時代、光耀世界。而提供標準化、可兼容的數(shù)據(jù)產品,是為更多讀者,為更廣大群眾做好文化服務的基礎。綜上所述,數(shù)字人文背景下,館藏數(shù)字化的標準制定是整個行業(yè)文化轉換傳播的題中之意,有利于圖書館業(yè)務的發(fā)展和時代賦予圖書館責任擔當?shù)耐瓿伞?/p>

猜你喜歡
成果人文數(shù)字化
人文
北京紀事(2024年1期)2024-01-03 03:16:55
家紡業(yè)亟待數(shù)字化賦能
高中數(shù)學“一對一”數(shù)字化學習實踐探索
工大成果
高中數(shù)學“一對一”數(shù)字化學習實踐探索
“走出去”成果斐然
“健康照明”成果聚焦
人文紹興
中國三峽(2017年3期)2017-06-09 08:14:59
數(shù)字化制勝
“三醫(yī)聯(lián)動”擴大醫(yī)改成果
曲松县| 青海省| 崇义县| 西丰县| 铜川市| 五河县| 绥阳县| 盐亭县| 巴彦县| 漳浦县| 遂平县| 红河县| 思南县| 曲靖市| 安泽县| 广宗县| 图木舒克市| 桦南县| 砀山县| 西乌| 盈江县| 枝江市| 三河市| 桑日县| 黄石市| 山丹县| 宝应县| 瑞丽市| 如皋市| 青川县| 句容市| 隆安县| 湾仔区| 商河县| 岑溪市| 岳普湖县| 合肥市| 德安县| 格尔木市| 蒙山县| 湖州市|