国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

視覺資源數(shù)字對象格式與精度研究

2009-07-29 10:00彭建波史國祥孫勁松
大學(xué)圖書館學(xué)報 2009年6期
關(guān)鍵詞:格式文件對象精度

彭建波 史國祥 孫勁松

摘要在文獻(xiàn)調(diào)研、網(wǎng)絡(luò)調(diào)研、實(shí)地走訪和實(shí)驗(yàn)的基礎(chǔ)上,對視覺資源數(shù)字對象常用的GIF、JPEG、JPEG2000、TIFF、DjVu等格式進(jìn)行了分析,指出JPEG是視覺資源數(shù)字化過程中得到廣泛應(yīng)用的一種成熟格式,JPEG2000是一種較好的替代格式;DjVu格式不適合視覺資源的數(shù)字化;視覺資源數(shù)字化的最佳格式模式是采用600dpi全彩色TIFF格式進(jìn)行掃描,再將掃描文件轉(zhuǎn)換為300dpi的JPEG2000格式,采用Deep Zoom技術(shù)進(jìn)行網(wǎng)絡(luò)呈現(xiàn)。

關(guān)鍵詞視覺資源數(shù)字化圖像格式Deep Zoom

1問題的提出

高等學(xué)校中英文圖書數(shù)字化國際合作計劃(cADAL)是國家發(fā)展和改革委員會、教育部、財政部確立的“十五”期間“211工程”公共服務(wù)體系建設(shè)的重要組成部分,目前正在進(jìn)行二期項(xiàng)目的建設(shè)準(zhǔn)備工作。CADAL美術(shù)資源數(shù)字化項(xiàng)目是以中國美術(shù)學(xué)院圖書館的美術(shù)資源為基礎(chǔ),聯(lián)合國內(nèi)其他美術(shù)院校圖書館,對涵蓋文字、圖像和影音信息的美術(shù)資源進(jìn)行大規(guī)模、系統(tǒng)化的數(shù)字化建設(shè),是CADAL二期擬建設(shè)的子項(xiàng)目之一。美術(shù)作品數(shù)據(jù)庫(群)的建設(shè)是其核心內(nèi)容,即將館藏的美術(shù)作品原件、高仿畫、文物、畫冊等視覺資源數(shù)字化,建設(shè)成國畫、油畫、版畫、雕塑、書法、篆刻、建筑等數(shù)據(jù)庫(群),同時,實(shí)現(xiàn)數(shù)據(jù)庫(群)的統(tǒng)一檢索。

從廣義上講,所有的圖像資源都是視覺資源,如地圖、照片、醫(yī)療圖像等;從狹義上講,視覺資源一般專指美術(shù)圖像資源,如北美地區(qū)的視覺資源協(xié)會(Visual Resources Association)便是專門研究美術(shù)圖像資源的行業(yè)協(xié)會。本文所指的視覺資源專指狹義上的美術(shù)圖像資源,在色彩上,它比地圖、醫(yī)療圖像等視覺資源具有更高的要求。選擇合適的數(shù)字對象格式與精度是視覺資源數(shù)字化建設(shè)的首要問題,它不僅關(guān)系到內(nèi)容的呈現(xiàn)方式,還關(guān)系到信息的存儲成本及其搜索、利用程度等問題。

本文擬根據(jù)文獻(xiàn)調(diào)研、網(wǎng)絡(luò)調(diào)研、實(shí)地走訪和實(shí)驗(yàn)等方式,探討視覺資源數(shù)字化過程中所應(yīng)選用的格式與精度。

2視覺資源數(shù)字對象的常用格式

視覺資源數(shù)字對象的格式達(dá)幾十種之多,主要有GIF、JPEG、JPEG2000、TIFF、PDF、PNG等等。針對國內(nèi)外視覺資源數(shù)字對象常用的幾種格式介紹如下:

GIF格式是一種壓縮的8位圖像文件,其特點(diǎn)是壓縮比高,磁盤空間占用較少,下載速度快,還增加了漸顯方式,但是,它不能存儲超過256色的圖像,不能用于存儲真彩的圖像文件。

JPEG格式由聯(lián)合照片專家組(Joint Photograph—ic Experts Group)開發(fā)并命名為“ISO 10918-1”,JPEG只是一種俗稱而已。目前各類瀏覽器均支持JPEG這種圖像格式,它主要用于壓縮靜態(tài)圖像,只能支持有損壓縮。JPEG格式的文件尺寸較小。下載速度快,適合在網(wǎng)絡(luò)上傳輸。

JPEG2000是JPEG的升級版,其壓縮率比JPEG高約30%,同時支持有損和無損壓縮,而且能實(shí)現(xiàn)漸進(jìn)傳輸。此外,它還支持“感興趣區(qū)域”特性,用戶可以指定影像上任何感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部分先解壓縮。

TIFF的正式名稱叫標(biāo)簽圖像文件格式(TaggedImage File Format,簡寫為TIFF),是一種主要用來存儲包括照片和藝術(shù)圖像在內(nèi)的圖像文件格式。它存儲的圖像細(xì)微層次的信息非常多,圖像的質(zhì)量也得以提高,非常有利于原稿的復(fù)制。該格式有壓縮和非壓縮二種形式,文件尺寸較大,不適合網(wǎng)絡(luò)傳輸。

DjVu格式是AT&T實(shí)驗(yàn)室針對掃描文檔、數(shù)字文檔或照片中高解析度的Web應(yīng)用開發(fā)的格式,其文檔壓縮率比現(xiàn)有的JPEG和GIF等格式彩色文檔優(yōu)5到10倍,比TIFF格式的黑白文檔好3到8倍。同樣的內(nèi)容,DjVu比PDF(或TIFF)的壓縮率高近一倍,對彩色圖像更是獨(dú)具優(yōu)勢,以300dpi全彩色方式掃描的文檔可被從25MB大小壓縮到30-100KB大小。

3視覺資源數(shù)字對象格式與精度的應(yīng)用現(xiàn)狀

在互聯(lián)網(wǎng)上,諸多項(xiàng)目對視覺資源數(shù)字對象的格式與精度有著不同的選擇,對這些項(xiàng)目進(jìn)行調(diào)研,對CADAL美術(shù)資源數(shù)字化項(xiàng)目選用合適的數(shù)字對象格式與精度有著重要的參考意義。調(diào)研發(fā)現(xiàn),視覺資源數(shù)字對象格式與精度的應(yīng)用主要有三種模式:

模式一:單一格式模式。在這種模式下,網(wǎng)站提供JPEG格式或GIF格式的圖像供用戶檢索、瀏覽。如香港迪志文化公司的“文淵閣四庫全書電子版”用GIF格式來處理插圖;西安建筑科技大學(xué)的“建筑數(shù)字博物館”中的圖像采用GIF格式或JPEG格式;大量的項(xiàng)目則是采用JPEG格式的圖像,如歐洲數(shù)字圖書館、大英圖書館“美術(shù)館在線”、日本國會圖書館“貴重書畫像”、蓬皮杜文化藝術(shù)中心、巴黎盧浮宮藝術(shù)圖像數(shù)據(jù)庫、意大利烏菲茲數(shù)字美術(shù)館、CAMIO藝術(shù)博物館在線、firstVIEW時裝圖片數(shù)據(jù)庫、臺灣華藝公司的“世界美術(shù)資料庫”和“故宮在線”、徐州師范大學(xué)圖書館“中國漢代畫像石(磚)數(shù)據(jù)庫”,等等。這些項(xiàng)目中的圖像文件大小不等,一般在100K-300K之間,如大英圖書館“美術(shù)館在線”中的圖像文件;較大的圖像文件可達(dá)到1M左右,如徐州師范大學(xué)圖書館“中國漢代畫像石(磚)數(shù)據(jù)庫”中的圖像文件。

模式二:保存文件與瀏覽文件同時在線提供模式。在這種模式中,對資源進(jìn)行數(shù)字化加工時一般選用TIFF格式,然后再將其轉(zhuǎn)換為低精度的JPEG格式,在網(wǎng)站中同時提供TIFF格式的保存文件和JPEG格式的瀏覽文件;TIFF格式文件供用戶下載使用,JPEG格式文件供用戶檢索、瀏覽。此模式最為典型的當(dāng)屬美國國會圖書館的“美國記憶”項(xiàng)目,其保存文件采用300dpi掃描的TIFF格式,文件大小達(dá)幾兆,甚至幾十兆;瀏覽文件采用300dpi的JPEG格式,文件大小從幾十K到幾M不等;縮略圖一般采用GIF格式,文件大小在100K左右。

模式三:保存文件與瀏覽文件分離模式。在這種模式中,對資源進(jìn)行數(shù)字化加工時一般選用TIFF格式,然后再將其轉(zhuǎn)換為低精度的JPEG格式;TIFF格式的源文件用于長期保存,不上網(wǎng)提供服務(wù),轉(zhuǎn)換后的JPEG格式文件上網(wǎng)提供檢索、瀏覽。如美國加州大學(xué)伯克利分校的SHRO(Slide and PhotographImage Retrieval Online,簡稱SPIRO)項(xiàng)目,其數(shù)字對象采用無壓縮的TIFF格式掃描,圖像大小一般為56-60M,保存在光盤上;將其轉(zhuǎn)換為128像素和650像素兩種JPEG格式后,上網(wǎng)提供檢索、利用。再如北京大學(xué)圖書館“古籍琳瑯”項(xiàng)目,其視覺資源采用300dpi的TIFF格式進(jìn)行掃描,源文件作為保存文件,不上網(wǎng)提供服務(wù),對源文件進(jìn)行衰減,轉(zhuǎn)化成

三種大小規(guī)格的JPEG文件后上網(wǎng)提供服務(wù),轉(zhuǎn)換后最大的圖像文件約2M左右?!爸袊鴶?shù)字科技館”項(xiàng)目、“數(shù)字故宮”項(xiàng)目和中國國家圖書館自建圖像數(shù)據(jù)庫項(xiàng)目等亦采用此種模式。

4對視覺資源數(shù)字對象格式與精度的實(shí)驗(yàn)

4.1實(shí)驗(yàn)環(huán)境

掃描儀采用中晶公司Microtek9800XL,最高分辨率為9600dpi,最高色彩深度達(dá)48位,最大掃面幅面為A3,掃描軟件為MICROTEK SCANWIZARDPRO V6.511。PC機(jī)采用IBM L150,CPU為CEL,ERON2.66,內(nèi)存1G,顯卡為NVIDIA GFMX4000。操作系統(tǒng)為WINXPSP3。圖片判讀工具為ACD,seel0;圖片傳輸測試軟件為FASTCOPY V1.92;網(wǎng)絡(luò)環(huán)境為百兆以太局域網(wǎng)。實(shí)驗(yàn)過程中,采用24位色彩深度和不同的分辨率對印刷版的畫冊進(jìn)行數(shù)字化加工。

4.2實(shí)驗(yàn)對象

視覺資源主要包括國畫、油畫、版畫、雕塑、書法、篆刻、攝影、建筑、環(huán)境藝術(shù)等類型。其中,雕塑、建筑和環(huán)境藝術(shù)是對立體作品拍攝產(chǎn)生的攝影作品,與攝影作品同類;書法和篆刻亦為同類作品。因此,在試驗(yàn)過程中,只需選取國畫、油畫、版畫、書法、攝影五類作品進(jìn)行數(shù)字化加工即可。實(shí)驗(yàn)對象統(tǒng)一采用A4幅面的畫冊進(jìn)行數(shù)字化掃描。

4.3實(shí)驗(yàn)結(jié)果

各類型資源實(shí)驗(yàn)結(jié)果如表1所示:

實(shí)驗(yàn)結(jié)果表明:各類型視覺資源采用相同的格式和精度進(jìn)行數(shù)字化所獲得的數(shù)字對象,其文件大小相差無幾。600dpi的TIFF文件最大,視覺效果最好;300dpi的TIFF文件要比600dpi的J-PEG和JPEG2000文件大,視覺效果要好;在掃描精度相同的情況下,JPEG2000文件比JPEG文件小,但視覺效果要好;DjVu文件最小,但視覺效果最差,肉眼看上去,感覺有一層霧,不清晰。從文件大小和傳輸時間來看,600dpi分辨率的各種格式文件和300dpi分辨率的TIFF文件大小均在5M以上,在數(shù)據(jù)下載量大的情況下,這樣大的文件將使網(wǎng)絡(luò)嚴(yán)重堵塞;300dpi的JPEG2000文件大小約2,6M,在局域網(wǎng)中的傳輸速度不到1秒,且其視覺效果比相同分辨率的JPEG和Djvu文件清晰,顯然是一種值得選擇的文件格式。

與大多數(shù)項(xiàng)目選用TIFF格式或JPEG格式不同,CADAL項(xiàng)目對視覺資源采用600dpi的TIFF格式進(jìn)行數(shù)字化加工,然后將TIFF格式文件轉(zhuǎn)換為300dpi的DjVu格式,上網(wǎng)提供服務(wù)。表2是按照CADAL加工規(guī)范轉(zhuǎn)換后的DjYu格式文件同按照300dpi掃描的DjVu格式文件和JPEG2000格式文件的大小對比表。

對照表表明:600dpi的TIFF格式文件轉(zhuǎn)換為300dpi的DjVu格式文件后,文件大小得到了大幅壓縮,比300dpi的DjVu掃描文件還要小。但是,從視覺效果來看,轉(zhuǎn)換后的DjVu格式文件清晰度遠(yuǎn)沒有300dpi的JPEG2000格式文件高。可見,DjVu格式不適用于視覺資源的數(shù)字化。

5視覺資源數(shù)字對象呈現(xiàn)的新技術(shù)——Deep Zoom

2009年4月21日,世界數(shù)字圖書館開通,其視覺資源數(shù)字對象采用了一種新的呈現(xiàn)技術(shù)——DeepZoom,它是由“Seal)argon”團(tuán)隊創(chuàng)建的一種新技術(shù)。Deep Zoom提供高效縮放SilverHght中幾乎任意的大圖像的功能,用戶可以以很大或很小的比例來顯示圖像,而不影響應(yīng)用程序顯示圖像的性能,影響性能的唯一因素是顯示器的像素數(shù)。簡單地說,DeepZoom技術(shù)就是能讓用戶查看很大的一副圖片,但僅僅將當(dāng)前顯示的部分發(fā)送到用戶的瀏覽器里;用戶也可以對圖像進(jìn)行平滑的縮放和平鋪,這就使得用戶不必花費(fèi)大量時間來下載一副很大的圖片數(shù)據(jù),而只需下載其中所要查看的那部分的數(shù)據(jù),從而節(jié)省下載時間和網(wǎng)絡(luò)帶寬。在Hard Rock Memora,bilia網(wǎng)站中,我們可以看到,對于由1001副高精度圖像組成的圖像集合,我們可以將其中任何一幅圖像進(jìn)行無限放大,圖像質(zhì)量依然非常清晰。

Deep Zoom的原理是通過使用圖像棱錐圖來實(shí)現(xiàn)按需提供分辨率不同的圖像。圖像棱錐圖將圖像平鋪到256x256的]PEG或PNG圖像圖塊中,并將圖像的低分辨率版本也存儲在圖塊中。每個圖塊存儲在單獨(dú)的文件中,并且每個棱錐圖級別存儲在單獨(dú)的文件夾中。在棱錐圖底部以最高分辨率顯示圖像本身,最高分辨率圖像旁邊存儲分辨率逐漸下降的版本,最低為4x4像素。每個棱錐圖級別上的圖像存儲在256x256像素圖塊中。這使Deep Zoom可以只提取屏幕上當(dāng)前圖像大小所需的那些圖塊,而不用下載整個圖像。通過Deep Zoom Composer軟件,可以將PNG、]PEG、TIFF、BMP格式的圖像以Deep Zoom技術(shù)呈現(xiàn)。

Deep Zoom技術(shù)為我們進(jìn)行視覺資源數(shù)字化建設(shè)提供了新的思路。如前所述,現(xiàn)有項(xiàng)目大多采用JPEG或TIFF格式,現(xiàn)在,我們可以運(yùn)用Deep Zoom來呈現(xiàn)]PEG或TIFF格式的圖像文件,這種方式將為用戶帶來更為快捷的瀏覽和更為流暢的縮放;由于用戶不必下載整幅圖像的數(shù)據(jù),網(wǎng)絡(luò)流量的壓力也將得以減輕。

6結(jié)論

CADAL美術(shù)資源數(shù)字化項(xiàng)目的建設(shè)目的是為美術(shù)專業(yè)教學(xué)、科研提供豐富的圖像資源,基于美術(shù)專業(yè)人員對圖像質(zhì)量的專業(yè)要求,其圖像質(zhì)量應(yīng)高于一般性的數(shù)字化項(xiàng)目。結(jié)合上述各調(diào)研項(xiàng)目的應(yīng)用現(xiàn)狀、實(shí)驗(yàn)結(jié)果,以及對Deep Zoom的研究,我們認(rèn)為:盡管DjVu格式能將文件壓縮到很小,但由于其視覺效果不理想,對視覺資源的數(shù)字化建設(shè)并不適用;視覺資源的數(shù)字化加工應(yīng)采用TIFF格式,掃描精度不低于600dpi,色彩深度應(yīng)達(dá)到24位及以上。掃描所得的源文件可離線保存在移動硬盤、光盤或磁帶庫中,作為數(shù)字資產(chǎn)長期保存。對源文件衰減、轉(zhuǎn)換為300dpi的JPEG2000格式后,可上網(wǎng)供用戶下載,同時運(yùn)用Deep Zoom技術(shù)將衰減后的JPEG2000文件在網(wǎng)絡(luò)上呈現(xiàn),供用戶檢索、瀏覽。

猜你喜歡
格式文件對象精度
神秘來電
使用“格式文件”將徠卡儀器數(shù)據(jù)導(dǎo)出成cass 格式的方法
基于DSPIC33F微處理器的采集精度的提高
攻略對象的心思好難猜
基于熵的快速掃描法的FNEA初始對象的生成方法
編寫徠卡TS02型全站儀格式文件的方法探索
GPS/GLONASS/BDS組合PPP精度分析
區(qū)間對象族的可鎮(zhèn)定性分析
回歸基礎(chǔ) 到底什么是RAW格式文件?
基于Office Open XML格式文件的電子取證方法研究
花垣县| 德令哈市| 沁阳市| 利川市| 沧州市| 绥阳县| 辰溪县| 西藏| 南安市| 泽普县| 克拉玛依市| 普安县| 胶州市| 德令哈市| 栖霞市| 连平县| 清镇市| 康马县| 崇州市| 蓬溪县| 丽江市| 富蕴县| 长阳| 湟源县| 乌苏市| 巴里| 西青区| 潜山县| 东乌珠穆沁旗| 永和县| 繁峙县| 凤山市| 巴彦县| 璧山县| 奈曼旗| 临邑县| 冀州市| 饶平县| 乐至县| 萨嘎县| 甘洛县|