国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

檔案數字化工作中的重難點探討

2019-12-17 12:24代清華
陜西檔案 2019年3期

文/代清華

檔案數字化工作,就是通過掃描儀、照相機等電子設備,將傳統的紙質檔案轉化為存儲在計算機數據庫中的數字圖像,是利用計算機技術將模擬信號轉換成數字信號的處理過程,以實現快速檢索、便捷利用、安全備份、小空間存儲等功效。

一、外包公司的選擇

檔案管理數字化是信息時代的必然要求。由于需要專業(yè)的設備和專門的團隊,目前,大部分綜合檔案部門都采用外包模式做紙質檔案的數字化工作。為保證質量,對外包公司的選擇將十分重要,如何在公開招標中有效避免惡性競爭,招到信譽好、團隊素質過硬的優(yōu)秀公司,這是對所有檔案部門的一種考驗。

數字化加工技術標準的制定一定要因地制宜,切合實際。如重點檔案(明清檔案、民國檔案、革命歷史檔案)的數字化加工標準要求相對較高,這部分檔案產生的時代過于久遠,且存在手寫體居多、組卷不規(guī)范等原因,數字化前處理的工作量很大,案卷級、文件級目錄著錄的要求很高,這就要求外包公司配備高素質的工作團隊,將大量的精力投入到目錄著錄和質檢中去,成本相對較高。而建國后的檔案數字化工作相對簡單,卷內文件多為印刷版,編目相對容易,技術標準的制定可以適當降低要求,數字化工作的成本也相對低廉。此外,還需要認真考察外包公司的保密資質、團隊配備、相關行業(yè)從業(yè)經驗、口碑、后期質保等情況。為減少磨合,保持連貫性,建議有條件的地區(qū)盡量采用同一家外包公司做紙質檔案數字化工作,以保證數據質量的穩(wěn)定。

檔案數字化工作開展近20年以來,由最初的“摸著石子過河”逐漸走向成熟,許多省份的檔案數字化率都已超過50%。隨著國家綜合數字檔案館建設步伐的加快,檔案數字化工作中的重難點問題逐漸凸顯,本文的探討希望能為做好檔案數字化工作起到參考與借鑒作用

二、數字化模式的選擇

目前采用的數字化模式大概主要有三種:第一種是先掃描,后編目;第二種是先整理搶救后數字化,或者整理、搶救、數字化一條龍式;第三種是直接進行數字化。三種模式各有利弊,各有千秋,可根據我們館藏的實際情況自主選擇。

第一種模式:先掃描,后編目。這種紙質檔案數字化掃描工作和文件級目錄著錄工作可以分屬兩個不同的職能部門。先將所有紙質檔案通過掃描轉變成機讀圖像數據,實體卷封存,再調用掃描數據編目。優(yōu)點是既能短時間內提高館藏檔案數字化率,又能有效緩解兩項工作集中在一個職能部門的工作壓力,同時還可相互質檢,降低差錯率;缺點是全文數據和目錄數據難以實現實時掛接,同時后期編目牽扯數據庫重新組件,可能導致數據庫數據和實體卷卷內文件不能一一對應的現象產生。散件的、編目難度相對較大的重點檔案可以采用這種模式進行數字化工作。

第二種模式:先整理搶救后數字化,或者整理、搶救、數字化一條龍式。先做整理搶救,重新組建編目,再進行數字化工作,一條龍式的加工模式減少了拆裝訂次數,有效避免了對實體檔案的多次傷害。缺點是成本較高,時間跨度久遠,短期內很難出數字化成果,再者,許多檔案部門的檔案整理、搶救、數字化工作分屬不同的職能處室,監(jiān)管難度加大。數量不多,年代久遠,紙張質量較差的重點檔案可以采用這種模式進行數字化工作。

第三種模式:不再做專門的整理搶救工作,直接進行數字化。大部分建國后紙質檔案,組建相對規(guī)范,紙張質量也不錯,卷內文件大多又都是印刷體,編目難度也相對較小,無需重新整理、搶救,可直接進行數字化工作。優(yōu)點是成本相對低廉,數字化難度較小,短期內能高質量出成果;缺點是大量數字化成果堆積,質檢難度加大。為保證數字化數據質量,可引進第三方監(jiān)理公司做數據質檢工作。

三、數據完整性和可用性

紙質檔案數字化的基本環(huán)節(jié)主要包括:數字化前處理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數據質檢、數據掛接、數據驗收、數據備份等。

(一)目錄的完整性與可用性

我們發(fā)現在檔案數字化加工的過程中,目錄著錄才是真正的重難點。著錄的完整、正確與否,都將會在后期的查詢利用中一一得以檢驗。檔案條目著錄應盡可能的標準化、規(guī)范化,才能更好地運用到后期的大數據平臺中去。各級檔案部門保管的重點檔案尤其是明清、民國檔案等,目錄形成年代久遠,大多以手寫體為主,有的書寫還極為不規(guī)范,繁體字、異體字、行書、草書相互交織在一起,辨識度低;加之用語習慣、行文風格等與現行公文大為不同,豎寫排版且文內幾乎無任何標點符號,文言文或半文言文居多,閱讀與理解難度較大等。這就要求我們的著錄人員不僅要有專業(yè)的文字功底,具有一定的編研能力,能通過參考相關案卷文檔資料,整理補充內容殘缺不全、文字模糊不清的部分,還需要博聞強識,能有效識別部分重點檔案中涉及的公文文種類別、公文知識、歷史實踐、引經據典等內容;同時還需要有一定的相關行業(yè)從業(yè)經驗,能準確理解《明清檔案著錄細則》《民國檔案目錄中心數據采集標準民國檔案著錄細則》《革命歷史檔案著錄細則》等相關標準規(guī)范,用專業(yè)的標識符號標注所需內容。如“+”表示題名與附件題名之間的連接符號;“;”表示兩個或兩個以上責任者、分類號、檔號、縮微號的間隔符號;“[]”表示考證得出的著錄內容;“?”表示不能確定的著錄內容,一般與“[]”配合使用;“□”表示每一個殘缺的文字,難以計數的殘缺文字用三個“□”表示等等,必須符合國家標準,規(guī)范使用。

建國后檔案目錄的著錄工作相對簡單,只需保證著錄項的完整性和可用性,重點注意錯字、別字、人名、地名及常識性錯誤即可。

著錄中常見問題匯總:

1.題名中出現的我省、我市、我縣、你省、你市、你縣、本省、本市、本縣、我單位、本單位等含混不清的字眼要改為具體的省、市、縣,對于城市的街道如果沒有寫城市名稱的要在前面加上[XX市],對農村的鄉(xiāng)、村要加上[XX市]或者[XX]縣。

2.文件題名只有“通知”“函”“電報”“合同”等文種信息的,原題名照錄,并根據其內容另擬題名附后,加“[]”號。例:通知[關于紀念xxx的通知]。

3.文件題名信息不全、不準確的,應該考證出具體內容補充進去,用“[]”加以說明。如:要求更改參加工作時間,應補充為:[李四]要求更改參加工作時間。

4.簡稱或縮寫要規(guī)范、準確,不產生歧義,類似“中辦廳、國辦廳、軍委辦公廳”等等要寫成中共中央辦公廳、國務院辦公廳、中央軍委辦公廳。

5.責任者應該按文件上的署名進行抄錄,機關團體責任者必須用全稱或規(guī)范的簡稱。

6.文件形成時間以制發(fā)文件所形成的時間為準。由8位數字組成,年度4位,月份2位,日期2位,如:20090618。對于無法考證的用0補齊,如20090000。

7.頁數是每份歸檔文件的總頁數。是包括正反兩面,從開始一直數到最后的所有頁數的總和,夾雜在其中的便簽、紙條、備注等也一并計算在內。

8.人事檔案如干部考察、獎懲、任免、職稱評定、知青安置、軍轉安置等檔案的要建立人名索引,即所有人名必須在題名或關鍵詞(人名較多的情況)中著錄出來,便于后期查詢利用。

(二)圖像的完整性和可用性

為最大限度地保持檔案原貌和清晰度,建議都采用彩色模式掃描,分辨率必須達到200dpi以上,圖像保證清晰、完整、真實可靠,排列順序與原始檔案保持一致。除在本地機房高質量保存外,還應進行數據備份,以便有效保證數據安全。

(三)數據掛接

數據掛接指借用相關軟件對數據庫中的目錄數據和與其對應的紙質檔案數字圖像進行掛接,以實現目錄數據與數字圖像的一一對應。數據掛接十分重要,掛接錯誤,前期的數字化成果就難以投入利用,所以掛接中一定要注意檢查目錄數據與紙質檔案數字圖像對應的準確性、已掛接數字圖像與實際掃描數量的一致性、數字圖像能否順利打開等,從而有效保證數字化數據的完整性和可用性。

四、數據安全

安全是檔案工作的重中之重。檔案安全不單指實體安全,數據安全也是其中必不可少的一部分。數字化成果是原始紙質檔案的副本,安全等級同于甚至高于原始紙質檔案要求,大多數檔案部門的數據都保存于本部門的機房中,因此,機房的安全尤為重要,一定要符合機房建設標準。除此之外,保密工作也必須嚴格按要求做到位。涉密檔案原則上不做數字化工作,已做數字化的涉密檔案要分開存儲,數據庫中只保留檔號即可。同時,檔案部門為保證數據安全,有效避免自然或人為災害的發(fā)生,還需對數字化加工的數據及時做好異質異地備份工作。