国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于元數(shù)據(jù)的數(shù)字圖像管理

2015-12-17 01:53嚴(yán)明楊慧波
電腦知識(shí)與技術(shù) 2015年28期
關(guān)鍵詞:元數(shù)據(jù)數(shù)字圖像

嚴(yán)明 楊慧波

摘要:利用元數(shù)據(jù)對(duì)資源(特別是數(shù)字化資源)進(jìn)行描述,并據(jù)此對(duì)資源進(jìn)行管理和檢索,終始是最直接、最有效的手段。本文首先探討了數(shù)字圖像的描述需求,然后分析了目前常見的數(shù)字圖像的元數(shù)據(jù)標(biāo)準(zhǔn),最后提出了基于元數(shù)據(jù)的數(shù)字圖像管理的基本方法。

關(guān)鍵詞:數(shù)字圖像;元數(shù)據(jù);元數(shù)據(jù)標(biāo)準(zhǔn);圖像管理

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)27-0161-02

1 引言

隨著數(shù)碼影像設(shè)備的發(fā)展及普及,以及多媒體技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們面對(duì)的各種數(shù)字圖像信息迅速增長(zhǎng)。據(jù)報(bào)道,F(xiàn)acebook、微信等社交媒體每天上傳的圖片達(dá)數(shù)億張,一些單位或部門(如公安部門)每天收集和保存數(shù)萬、數(shù)十萬張圖片,即使對(duì)個(gè)人來說,許多人每年拍攝和保存的數(shù)碼照片也是成千上萬張。面對(duì)如此巨量的數(shù)字圖像信息,如何能快速地獲取和有效地利用,這就需要對(duì)其進(jìn)行科學(xué)、合理的組織、存儲(chǔ)和管理。

元數(shù)據(jù)(metadata)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息[1]。簡(jiǎn)言之,元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),其實(shí)質(zhì)是傳統(tǒng)的文獻(xiàn)資源的著錄信息在數(shù)字資源的一種擴(kuò)展。因此,利用元數(shù)據(jù)管理圖像是一種的最佳選擇。

2 數(shù)字圖像的描述需求

根據(jù)多媒體內(nèi)容描述接口MPEG-7標(biāo)準(zhǔn),多媒體內(nèi)容描述可以包括如下的信息[2]:有關(guān)內(nèi)容的產(chǎn)生和發(fā)展進(jìn)程的描述信息、與內(nèi)容使用有關(guān)的信息、有關(guān)內(nèi)容存儲(chǔ)特性的信息、有關(guān)容的低級(jí)特性的信息、從內(nèi)容捕捉到的實(shí)體的概念化信息、關(guān)于如何用有效方法瀏覽內(nèi)容的信息、關(guān)于用戶和內(nèi)容交互作用的信息等。這些描述可以分為一般性描述和基于內(nèi)容的描述。一般性描述是指從圖像外部導(dǎo)出的、不依賴于其內(nèi)容的信息,用于圖像的標(biāo)識(shí)和檢索,如標(biāo)題、作者、時(shí)間、文檔大小、存儲(chǔ)格式與編碼格式、使用信息(使用要求、版權(quán)等)等;基于內(nèi)容的描述又可以分為結(jié)構(gòu)性描述(用于描述所包括的對(duì)象之間的結(jié)構(gòu)與關(guān)系等)、低級(jí)特征描述(用于描述顏色、紋理等物理特征)和語(yǔ)義描述(用于描述包括的對(duì)象和事件)。

無論是從用戶的時(shí)間和精力來看,還是從實(shí)際應(yīng)用需求看,通常不可能對(duì)所有的圖像進(jìn)行全方位描述。不同類型數(shù)字圖像在功能、用途、消費(fèi)對(duì)象和使用方式等方面可能有所不同,因而對(duì)其描述需求也有所不同。例如對(duì)于某一張風(fēng)景圖片來說,一般人員只是從審美的角度對(duì)其進(jìn)行欣賞、獲得美的享受,可能僅需要了解該圖片是在何時(shí)何地拍攝的,專業(yè)攝影人員可能還需要了解該圖片拍攝時(shí)及后期處理的相關(guān)信息(如相機(jī)參數(shù)等),出版(發(fā)布)者可能還需要了解該圖片的來源等版權(quán)信息,等等。因此,圖像的元數(shù)據(jù)描述應(yīng)重點(diǎn)考慮用戶群及其應(yīng)用需求,有選擇地采用某個(gè)元數(shù)據(jù)標(biāo)準(zhǔn),或綜合應(yīng)用多個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)。

3 數(shù)字圖像的元數(shù)據(jù)標(biāo)準(zhǔn)

隨著數(shù)字圖像等相關(guān)技術(shù)的發(fā)展,針對(duì)數(shù)字圖像的元數(shù)據(jù)研究和應(yīng)用在不斷地深入,并已出現(xiàn)了一些面向不同應(yīng)用需求的元數(shù)據(jù)標(biāo)準(zhǔn)或規(guī)范。例如,數(shù)字圖書館聯(lián)盟(DLF)制定的MOA2元數(shù)據(jù)標(biāo)準(zhǔn)、美國(guó)國(guó)家標(biāo)準(zhǔn)化組織(NISO)發(fā)起制定的NISO Z39.87元數(shù)據(jù)標(biāo)準(zhǔn)等等。從元數(shù)據(jù)存儲(chǔ)方式和使用情況來看,元數(shù)據(jù)標(biāo)準(zhǔn)可以分兩類:一類是以獨(dú)立于數(shù)字圖像文件的數(shù)據(jù)(庫(kù))文件存儲(chǔ)元數(shù)據(jù),這類元數(shù)據(jù)標(biāo)準(zhǔn)(或規(guī)范)由具體的應(yīng)用行業(yè)、單位或軟件商制定,應(yīng)用于具體的應(yīng)用軟件或系統(tǒng),例如圖書、檔案、公安等部門(行業(yè))制定的圖像元數(shù)據(jù)標(biāo)準(zhǔn),ACD See軟件中使用ACD See元數(shù)據(jù)也屬于這一類。另一類是嵌入在數(shù)字圖像文件(JPEG、TIFF等類型的文件)中的元數(shù)據(jù),即元數(shù)據(jù)信息與圖像數(shù)據(jù)均保存在同一個(gè)圖像文件中,這類元數(shù)據(jù)標(biāo)準(zhǔn)主要有EXIF、IPTC等,目前許多圖像應(yīng)用軟件均支持這類元數(shù)據(jù)標(biāo)準(zhǔn)。

EXIF(Exchangeable Image File,可交換圖像文件)由JEIDA(Japan Electronic Industry Development Association,日本電子工業(yè)發(fā)展協(xié)會(huì))制訂的專門為數(shù)碼相機(jī)的照片而定制的元數(shù)據(jù)標(biāo)準(zhǔn),用于實(shí)現(xiàn)在不同的軟件或設(shè)備之間進(jìn)行圖像數(shù)據(jù)的交流,其典型應(yīng)用之一是數(shù)碼相機(jī)直接連接打印機(jī)輸出照片[3]。目前絕大多數(shù)數(shù)碼相機(jī)(包括掃描儀)均支持EXIF標(biāo)準(zhǔn),數(shù)碼相機(jī)在拍攝(掃描儀在掃描)過程中采集一系列的信息,然后把相關(guān)信息放置在JPEG、TIFF等文件的頭部,也就是說EXIF元數(shù)據(jù)信息是嵌入在 JPEG/TIFF 圖像文件格式內(nèi)的一組拍攝參數(shù)。EXIF所記錄的元數(shù)據(jù)信息非常豐富,主要包含:拍攝器材、拍攝參數(shù)、圖像處理參數(shù)、圖像描述及版權(quán)信息、GPS定位數(shù)據(jù)和縮略圖等。

IPTC是國(guó)際出版電訊委員會(huì)(International Press Telecommunications Council)制定的一種元數(shù)據(jù)標(biāo)準(zhǔn),用于識(shí)別傳輸文本和圖像[4]。該元數(shù)據(jù)標(biāo)準(zhǔn)中包含了標(biāo)題、關(guān)鍵詞、類別、創(chuàng)建者、版權(quán)聲明等一系列條目。雖然目前絕大多數(shù)數(shù)碼相機(jī)(包括掃描儀)均不直接支持IPTC標(biāo)準(zhǔn),但多數(shù)主流的圖像處理軟件(如Photoshop、ACD See等)均支持IPTC元數(shù)據(jù)的查看、編輯和檢索。

此外,與數(shù)字圖像相關(guān)的可用或可參考的元數(shù)據(jù)標(biāo)準(zhǔn)還有DC元數(shù)據(jù)標(biāo)準(zhǔn)和MPEG-7標(biāo)準(zhǔn)等。DC(Dublin Core Metadata Element Set,元數(shù)據(jù)標(biāo)準(zhǔn)都柏林核心元數(shù)據(jù)集,縮寫為DCMES、簡(jiǎn)稱為DC)是一個(gè)起源于圖書館界、基于內(nèi)容描述的元數(shù)據(jù)模型,它具有簡(jiǎn)練性、可擴(kuò)展性、易于人機(jī)理解性等特點(diǎn),已成為國(guó)際范圍內(nèi)通用的網(wǎng)絡(luò)資源描述元數(shù)據(jù)標(biāo)準(zhǔn)[5]。雖然DC主要面向網(wǎng)絡(luò)資源的著目描述,且僅包含15個(gè)基本元素,但通過對(duì)其進(jìn)行擴(kuò)展,制定針對(duì)圖像的修飾詞,可以用于全面描述數(shù)字圖像信息。MPEG-7標(biāo)準(zhǔn)(多媒體內(nèi)容描述接口)的目標(biāo)是制定一套標(biāo)準(zhǔn)的描述符合描述方案,用來描述各種類型的多媒體信息及它們之間的關(guān)系,以便更快更有效地檢索信息。MPEG-7的描述符與描述方案主要用于多媒體內(nèi)容的低層次特征的描述(如顏色、紋理等)和高層次特征的描述(如區(qū)域、分割、對(duì)象、事件以及與創(chuàng)作、作品、使用等相關(guān)的元數(shù)據(jù)),涉及圖像視覺特征的描述符有顏色描述符、紋理描述符、形狀描述符和位置描述符等。

4 基于元數(shù)據(jù)的數(shù)字圖像管理

無論是何種類型的用戶(包括個(gè)人和單位),保存大量的數(shù)字圖像,其主要目的都是為了今后的檢索與利用。作為單位或部門專業(yè)用戶(例如檔案局、公安局、新聞出版單位等),往往借助于專用的管理軟件對(duì)收集和存儲(chǔ)的數(shù)字圖像進(jìn)行管理;對(duì)于多數(shù)用戶(特別是個(gè)人用戶)來說,往往借助于通用的圖像處理軟件對(duì)數(shù)字圖像進(jìn)行管理。對(duì)于后者,基于元數(shù)據(jù)對(duì)數(shù)字圖像進(jìn)行管理一般需要做好以下三個(gè)方面的工作。

一是以合理的文件夾結(jié)構(gòu)來組織數(shù)字圖像文件的存儲(chǔ)。在絕大多數(shù)情況下,每張數(shù)字圖像都是以一個(gè)獨(dú)立的文件進(jìn)行保存的,創(chuàng)建合理的樹形文件夾結(jié)構(gòu)分類存儲(chǔ)和管理數(shù)字圖像文件,便于以導(dǎo)航方式查找和瀏覽數(shù)字圖像。雖然對(duì)于何謂“合理”沒有標(biāo)準(zhǔn)和規(guī)范可言,但采用類似于“時(shí)間——問題”的分類法是一種較好的選擇,這種分類法也便于按年度進(jìn)行增量備份。在實(shí)際應(yīng)用中,可以采取“年度—問題1—問題2……”的多級(jí)文件夾結(jié)構(gòu)(通常為3~5級(jí)文件夾)進(jìn)行數(shù)字圖像文件的分類組織和管理。例如,對(duì)于旅游過程中拍攝的照片,可以采用“年度—旅游—地點(diǎn)—景點(diǎn)”的文件夾結(jié)構(gòu)形式;對(duì)于工作過程中的照片,可以采用“年度—工作—會(huì)議—名稱”的形式,等等。

二是對(duì)文件夾中的數(shù)字圖像文件進(jìn)行批量重命名。通過數(shù)碼相機(jī)拍攝(或掃描儀掃描)的數(shù)字圖像文件的文件名都是由固定的字符(由數(shù)碼相機(jī)與掃描儀設(shè)備決定)及數(shù)字流水號(hào)組成,例如“DSC_0001、DSC_0002、DSC_0003……”。顯然,這樣的文件命名與照片內(nèi)容無關(guān),不便于今后的查看(有意義的文件名及文件夾名稱便于文件的導(dǎo)航瀏覽),且不同批次的照片會(huì)有重名現(xiàn)象。從數(shù)碼相機(jī)中將照片導(dǎo)入電腦時(shí)(不是直接復(fù)制),用戶可輸入一個(gè)名稱,在導(dǎo)入照片時(shí)系統(tǒng)將以該名稱加數(shù)字流水號(hào)對(duì)照片進(jìn)行重命名,這種重命名是對(duì)所有導(dǎo)入的照片進(jìn)行統(tǒng)一處理,用戶在整理歸類后將其分存在不同文件夾,往往需要對(duì)不同文件夾中的所有文件或部分文件再次進(jìn)行批量重命名。對(duì)此,雖然用戶可以使用諸如ACD See之類的圖像處理軟件或?qū)S玫闹孛浖ňW(wǎng)上可以找到許多這類專用的免費(fèi)軟件),但最簡(jiǎn)便的方法是直接使用Windows操作系統(tǒng)的文件“重命名”功能。其操作方法是:在“Windows資源管理器”中選擇某文件夾中的所有文件或多個(gè)文件,執(zhí)行(快捷)菜單中的“重命名”命令(此時(shí)選中的第一個(gè)文件名稱變成了可修改狀態(tài)),在“第一個(gè)文件”中輸入一個(gè)名稱,則系統(tǒng)自動(dòng)地對(duì)所選擇的所有文件進(jìn)行批量重命名(以輸入的名稱以及括號(hào)加數(shù)字流水號(hào)進(jìn)行命名,每個(gè)文件的數(shù)字流水號(hào)與當(dāng)前文件排序相關(guān))。

三是為數(shù)字圖像文件設(shè)置元數(shù)據(jù)。在一定意義上說,數(shù)字圖像的文件名及其存儲(chǔ)文件夾名(多級(jí)文件夾構(gòu)成的存取路徑)都是其元數(shù)據(jù),利用Windows操作系統(tǒng)的文件瀏覽和查找功能可以直接查看圖像文件,但文件名和文件夾名能描述的信息有限,用戶應(yīng)借助EXIF元數(shù)據(jù)、IPTC元數(shù)據(jù)對(duì)數(shù)字圖像做進(jìn)一步的描述,以便于今后的檢索與使用。對(duì)于多數(shù)用戶來說,為數(shù)字圖像設(shè)置多個(gè)關(guān)鍵詞是一種便于檢索圖像的常用方式,ACDsee等圖像管理軟件支持基于關(guān)鍵詞的圖像搜索。許多圖像處理軟件均支持關(guān)鍵詞的設(shè)置關(guān)鍵詞,但最簡(jiǎn)便的方法是直接通過設(shè)置一個(gè)或多個(gè)圖像文件的文件屬性實(shí)現(xiàn)。其操作方法是:在“Windows資源管理器”中選擇一個(gè)或多個(gè)圖像文件(同時(shí)為多個(gè)圖像文件設(shè)置相同的關(guān)鍵詞),執(zhí)行(快捷)菜單中的“屬性”命令,在“屬性”對(duì)話框“詳細(xì)信息”頁(yè)面的“標(biāo)記”文本框中輸入一個(gè)或多個(gè)關(guān)鍵詞(該“標(biāo)記”屬性與IPTC元數(shù)據(jù)的“關(guān)鍵詞”元素相對(duì)應(yīng))。

對(duì)于收集和保存的大量數(shù)字圖像,基于元數(shù)據(jù)進(jìn)行管理是一種必然選擇,即便是通過合適的文件夾結(jié)構(gòu)、文件(夾)名以及關(guān)鍵詞設(shè)置,大多數(shù)普通用戶僅基于Windows操作系統(tǒng)的文件管理功能及ACDsee軟件(即使是官方免費(fèi)版)即可滿足一般的數(shù)字圖像管理需求。

參考文獻(xiàn):

[1]李國(guó)輝,湯大權(quán),武德峰. 信息組織與檢索[M]. 北京:科學(xué)出版社.

[2]José M. Martínez. MPEG-7 Overview. http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm.

[3]華威.數(shù)碼圖片大揭秘——EXIF篇.中國(guó)攝影家,2009(6):120-123.

[4]華威.數(shù)碼圖片大揭秘——IPTC篇.中國(guó)攝影家,2009(4):103-105.

[5]Jane Hunter. An Application Profile which combines Dublin Core and MPEG-7 Metadata Terms for Simple Video Description. http://metadata.net/harmony/video_appln_profile.html.

猜你喜歡
元數(shù)據(jù)數(shù)字圖像
數(shù)字圖像相關(guān)法在地下管廊施工監(jiān)測(cè)中的應(yīng)用
ARGUS-100 藝術(shù)品鑒證數(shù)字圖像比對(duì)系統(tǒng)
基于來源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究
元數(shù)據(jù)與社會(huì)化標(biāo)簽在微視頻搜索中的應(yīng)用
高等院校智慧校園建設(shè)規(guī)劃與實(shí)現(xiàn)
財(cái)會(huì)信息資源元數(shù)據(jù)標(biāo)準(zhǔn)的研究
基于隱語(yǔ)義模型和用戶信任的個(gè)性化推薦模型
基于塊效應(yīng)測(cè)度的JPEG數(shù)字圖像盲取證
數(shù)字圖像相關(guān)法中的優(yōu)化插值濾波器
數(shù)字圖像修復(fù)在圖像壓縮上的應(yīng)用