索 瑋
(衡水日報(bào)社,河北 衡水 053000)
報(bào)社新聞資料數(shù)字化資源建設(shè)分析
索 瑋
(衡水日報(bào)社,河北 衡水 053000)
隨著數(shù)字化信息技術(shù)的不斷發(fā)展,數(shù)字化信息資源的管理方式對(duì)促進(jìn)報(bào)社新聞資料的管理工作水平的提高,具有十分重要的作用。本文從數(shù)字化資源建設(shè)對(duì)報(bào)社新聞資料管理工作的重要性著手,對(duì)其建設(shè)流程進(jìn)行分析,并就一些值得注意的問題進(jìn)行探討,以期提供可借鑒價(jià)值。
報(bào)社新聞資料;數(shù)字化資源;建設(shè)
當(dāng)前,數(shù)字化信息技術(shù)的發(fā)展正在不斷完善,并且被廣泛應(yīng)用到各行業(yè)中,人們的生產(chǎn)生活中已經(jīng)逐漸出現(xiàn)了數(shù)字化報(bào)紙、雜志、資料庫等,數(shù)字化技術(shù)為人們的工作與學(xué)習(xí)提供了極大的便利,具有不可比擬的優(yōu)勢。報(bào)社作為新聞出版行業(yè)更應(yīng)該及時(shí)更新理念,適應(yīng)社會(huì)發(fā)展的新形勢,積極利用數(shù)字化技術(shù)提高新聞資料的利用性與傳播效率。
在傳統(tǒng)的新聞資料整理與收集過程中,人工作業(yè)的方式面對(duì)大量的新聞資料與信息使得工作效率較低,同時(shí)也無法保證資料內(nèi)容的準(zhǔn)確性,人為的失誤直接影響著新聞資料的整體水平。而數(shù)字化技術(shù)通過利用計(jì)算機(jī)技術(shù)與網(wǎng)絡(luò)信息技術(shù)對(duì)新聞資料進(jìn)行處理和加工,不僅有效避免了人工整理導(dǎo)致的錯(cuò)誤,先進(jìn)的處理軟件大大提高了資料的準(zhǔn)確性與整理速度,有效節(jié)約了工作時(shí)間與人員。
新聞資料在過去很長一段時(shí)間都是以紙質(zhì)介質(zhì)的形式存在的,這使得資料的保存面臨著時(shí)間推移帶來的老化、腐爛等問題,使得具有珍貴價(jià)值等重要的資料無法妥善保存,對(duì)報(bào)社自身的發(fā)展也有不利影響。數(shù)字化技術(shù)的管理方法從根本上直接解決了這一問題,數(shù)字信息的保存方式完全彌補(bǔ)了紙質(zhì)介質(zhì)的不足。[1]
由于報(bào)社過去是以紙質(zhì)介質(zhì)的方式保存和管理新聞資料的,這使得查閱工作也需要由人工的方式進(jìn)行,而大量的新聞資料無疑加大了工作人員的工作量,降低了工作效率,同時(shí)也無法提高查閱的準(zhǔn)確性。對(duì)于一些保存時(shí)間較長的資料人為操作不當(dāng)也會(huì)直接導(dǎo)致資料損毀。數(shù)字化資源建設(shè)通過將新聞資料信息數(shù)據(jù)保存在計(jì)算機(jī)中,徹底避免了這一問題,在資源庫中查閱資料不僅效率高,準(zhǔn)確性高,同時(shí)也不會(huì)出現(xiàn)損毀資料的情況。
首先,應(yīng)確定新聞資料數(shù)據(jù)要保存的最終形式,然后再進(jìn)行數(shù)字化加工處理。報(bào)社以往在保存新聞資料時(shí)采取直接將其存入資源數(shù)據(jù)庫的方式,但由于這種方式存在不足,如對(duì)圖片信息無法進(jìn)行存儲(chǔ)等,近年來大部分報(bào)社均利用PDF技術(shù)對(duì)新聞資料進(jìn)行保存。PDF技術(shù)即Portable Document Format,是由Adobe公司開發(fā)推出的一種電子文件顯示格式,當(dāng)前已經(jīng)成為世界通用的電子文檔格式。該技術(shù)能夠直接對(duì)新聞資料的原版面信息進(jìn)行保存,有效提高了資料的真實(shí)性,能夠?qū)Σ煌次募母袷?、字體及圖形等內(nèi)容進(jìn)行真實(shí)地保存,并且不受源文件應(yīng)用平臺(tái)的影響。PDF文件標(biāo)準(zhǔn)開發(fā)、跨平臺(tái)、自由授權(quán)以及保存原文件格式等優(yōu)勢使其得到了各行業(yè)的廣泛應(yīng)用。利用Adobe Acrobat Reader免費(fèi)軟件可以對(duì)其進(jìn)行查看、瀏覽、共享及打印,版面清晰度很高,能夠?yàn)樽x者提供良好的閱讀環(huán)境。[2]
其次,在確定保存方式后對(duì)資料進(jìn)行數(shù)字化加工處理,在這一流程可以利用掃描儀設(shè)備對(duì)新聞資料進(jìn)行掃描,然后利用OCR自動(dòng)識(shí)別程序、版式還原及數(shù)據(jù)標(biāo)引等步驟完成新聞資料的數(shù)字化資源建設(shè)。
在加工過程中,首先以文本格式將新聞資料的信息數(shù)據(jù)進(jìn)行轉(zhuǎn)化,接著對(duì)所有文章信息進(jìn)行整理、分類、標(biāo)引等,對(duì)信息進(jìn)行規(guī)整后將其轉(zhuǎn)化為XML格式,最后全部歸入資源數(shù)據(jù)庫的檢索系統(tǒng)。使用者可以將日期、作者、欄目、版次及標(biāo)題等內(nèi)容作為關(guān)鍵詞,在檢索系統(tǒng)中對(duì)新聞資料進(jìn)行查詢和閱讀,同時(shí)還可以對(duì)新聞資料進(jìn)行編輯、保存、復(fù)制及打印等。數(shù)字化的資源數(shù)據(jù)庫還具有一大優(yōu)點(diǎn),即讀者可以通過利用PDF格式,實(shí)現(xiàn)報(bào)紙?jiān)婷娌季值倪€原,文章與版面之間的對(duì)應(yīng)與關(guān)聯(lián)為讀者營造了熟悉的報(bào)紙閱讀氛圍,讀者可以根據(jù)個(gè)人需求進(jìn)行下載和打印,數(shù)字化資源建設(shè)為廣大讀者提供了更加便捷、高效的閱讀環(huán)境。
(一)提高新聞資料數(shù)據(jù)的共享性、開放性
隨著計(jì)算機(jī)技術(shù)與通信技術(shù)的快速發(fā)展,信息時(shí)代作為現(xiàn)代社會(huì)發(fā)展的重要標(biāo)志之一,信息的重要性在各行業(yè)的發(fā)展過程中具有不可忽視的重要作用。對(duì)于以傳播新聞信息為主要工作的報(bào)社來說,信息的利用更加突顯出決定性的作用。因此,在數(shù)字化資源建設(shè)的過程中可以通過不同報(bào)社之間的合作和溝通,提高信息的共享性與利用性,從而將信息所產(chǎn)生的價(jià)值最大化。
(二)積極引進(jìn)先進(jìn)技術(shù)提高資料的數(shù)據(jù)質(zhì)量
在新聞資料的數(shù)字化資源建設(shè)過程中,數(shù)據(jù)質(zhì)量不僅直接影響著新聞資料的使用結(jié)果,同時(shí)對(duì)報(bào)社新聞資料向信息數(shù)字化轉(zhuǎn)變具有重要作用。大量以紙質(zhì)介質(zhì)呈現(xiàn)的新聞資料在進(jìn)行數(shù)字化數(shù)據(jù)加工的工程中需要報(bào)社投入大量的人力、物力和財(cái)力,由于工作量巨大無法實(shí)現(xiàn)校正每個(gè)文字,因而報(bào)社應(yīng)通過積極引進(jìn)先進(jìn)的處理技術(shù)提高數(shù)據(jù)加工質(zhì)量,同時(shí)還可以與專業(yè)的數(shù)據(jù)處理公司合作。[3]
(三)加強(qiáng)對(duì)珍貴原始資料的保護(hù)
在數(shù)字化資源建設(shè)的過程中對(duì)報(bào)社長期保存的珍貴原始紙質(zhì)介質(zhì)的新聞資料應(yīng)采取措施進(jìn)行保護(hù),很多年代較長的新聞資料具有十分重要的價(jià)值和意義,報(bào)社應(yīng)制定相應(yīng)完善的保護(hù)方案,通過利用先進(jìn)的掃描設(shè)備等方法最大程度降低數(shù)字化加工對(duì)原始資料造成的不良影響。
在時(shí)代不斷發(fā)展的趨勢下,報(bào)社應(yīng)積極順應(yīng)信息時(shí)代的要求,通過利用數(shù)字化技術(shù)提高新聞資料管理工作的整體水平,加強(qiáng)數(shù)字化建設(shè),以實(shí)現(xiàn)為廣大讀者提供更加便捷、優(yōu)質(zhì)的服務(wù)。
[1] 王益.網(wǎng)絡(luò)時(shí)代的新聞資料數(shù)據(jù)庫與新聞網(wǎng)站之比較[J].圖書館理論與實(shí)踐,2010(6).
[2] 麥亞軍.應(yīng)對(duì)傳媒多元化強(qiáng)化新聞資料軟實(shí)力[J].新聞知識(shí),2014(1).
[3] 宋居文.探析新聞采編中新聞資料作用[J].企業(yè)文化(中旬刊),2015(1).
G203
A
1674-8883(2015)15-0308-01
索瑋(1981—),男,河北衡水人,本科,衡水日報(bào)社記者。