国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《中文新聞圖片內容描述元數(shù)據(jù)規(guī)范》國家標準研制

2018-02-08 16:25張弛副教授碩士生導師中國傳媒大學計算機學院計算機系副主任主要研究方向為媒體信息數(shù)據(jù)化技術從事自然語言處理數(shù)據(jù)挖掘知識庫等方面的研究
中國傳媒科技 2018年2期
關鍵詞:圖片庫特征描述國家標準

(張弛,副教授,碩士生導師,中國傳媒大學計算機學院計算機系副主任,主要研究方向為媒體信息數(shù)據(jù)化技術,從事自然語言處理、數(shù)據(jù)挖掘、知識庫等方面的研究)

所謂“一圖勝千言”,視覺信息在人類社會信息生產(chǎn)和消費中始終扮演著重要角色。在融合媒體不斷發(fā)展的背景下,圖片憑借其信息量大、視覺吸引力強、數(shù)據(jù)量小等優(yōu)勢,在兩微一端應用、精品內容生產(chǎn)等方面不可或缺。資源價值的發(fā)揮有賴于資源的有效流通,而流通的前提是資源發(fā)現(xiàn)。圖片元數(shù)據(jù)是圖片特征描述的核心,也是圖片發(fā)現(xiàn)、流通的基礎。

國家標準——《中文新聞圖片內容描述元數(shù)據(jù)規(guī)范》(GB/T 35311-2017)于2017年12月底正式發(fā)布,填補了我國新聞圖片應用標準的一項空白,也是世界范圍內第一個以圖片視覺內容和語義特征描述為主的圖片元數(shù)據(jù)規(guī)范,專業(yè)性強,結構簡明,有較好的可擴展性和兼容性,具有較高的應用價值。

一、標準研制背景

視覺內容已經(jīng)成為連接媒體、品牌以及消費者的最高效的傳播媒介[1]。圖片是視覺內容存儲和傳播的重要載體。隨著互聯(lián)網(wǎng)技術和數(shù)碼設備的不斷發(fā)展和普及,圖片數(shù)量劇增、質量不斷提升、需求也日益擴大。多家國內外大型商業(yè)圖片公司、媒體機構等擁有千萬級甚至億級規(guī)模的高質量圖庫,為新聞、出版、印刷、廣告、營銷、素材制作等提供圖片素材。各類特色圖片庫以及自用為主的圖片系統(tǒng)更是不勝枚舉。

圖片特征描述在圖片存儲、管理、檢索、交易交換、智能推薦等生命周期各個階段都具有重要作用。沒有規(guī)矩不成方圓,我們需要圖片元數(shù)據(jù)標準來規(guī)范圖片生產(chǎn)的各個環(huán)節(jié)。原有圖片元數(shù)據(jù)相關標準各有側重,且大都缺乏對圖片視覺內容和語義特征的系統(tǒng)化規(guī)約,未能很好地滿足日益增長和不斷變化的圖片標注需求。目前大部分圖片應用系統(tǒng)從自身業(yè)務需求出發(fā),自定義了若干圖片元數(shù)據(jù)元素來描述圖片內容特征,這些私有化的元數(shù)據(jù)元素難以在不同業(yè)務間流轉交換,制約了圖片價值的發(fā)揮。

在此背景下,新華通訊社提出了《中文新聞圖片內容描述元數(shù)據(jù)規(guī)范》國家標準編制申請,經(jīng)全國中文新聞信息標準化技術委員會(以下簡稱新標委)上報國家標準委,被國家標準委批準列入“2014年第一批國家標準計劃項目”。該標準重點關注圖片視覺內容和語義特征描述,可用于圖片數(shù)據(jù)的采集、編輯、存儲、發(fā)布、檢索、交換等處理環(huán)節(jié)。

二、標準編制過程

2015年5月新標委秘書處牽頭組建標準編制組,確定了以媒體機構及大型商業(yè)圖片庫為主要調研對象、參考國外相關機構案例和國內外相關標準規(guī)范的工作路線。編制組歷時一年,先后對多家報社、商業(yè)圖片公司等單位進行實地調研,并充分借鑒了國內外圖片描述相關標準,形成了標準的征求意見稿。在經(jīng)過多次的意見反饋和修改后,于2016年底提交送審稿到新標委秘書處。經(jīng)新標委委員函審投票后,在2017年4月召開送審稿審查會。再次修改后形成報批稿,上報國家標準委批準發(fā)布。國家標準《中文新聞圖片內容描述元數(shù)據(jù)規(guī)范》于2017年12月底由國家標準委正式對外公布,可在國家標準全文公開系統(tǒng)[2]中查詢。

該標準的核心目標是更好地服務于圖片生產(chǎn)和消費的各個環(huán)節(jié),突出標準的實用性,因此,編制組在標準研制初期作了大量的調研工作。

調研對象包括兩類,一是現(xiàn)有相關國內外標準,二是標準主要應用對象。標準編制組首先對國內外標準,包括IPTC圖片元數(shù)據(jù)規(guī)范[3]、EXIF規(guī)范[4]、CNML標準[5]等進行研究。研究結果發(fā)現(xiàn),每個標準側重點不同。IPTC圖片元數(shù)據(jù)規(guī)范主要定義圖片描述型元數(shù)據(jù)項,幾經(jīng)改版后,補充了若干圖片內容描述的元數(shù)據(jù)項,但較為零散,在圖片內容語義特征描述方面不夠全面。EXIF規(guī)范主要涉及圖片技術型元數(shù)據(jù)。CNML標準主要對象是新聞稿件,圖片內容相關元數(shù)據(jù)定義相對較少。圖片元數(shù)據(jù)主要應用對象是圖片庫系統(tǒng)。在對圖片庫網(wǎng)站、媒體機構圖片庫系統(tǒng)的調研中發(fā)現(xiàn),個性化、私有化圖片元數(shù)據(jù)應用現(xiàn)象普遍存在,這其中部分元數(shù)據(jù)僅僅名稱不同,含義卻相近,部分元數(shù)據(jù)具有普遍應用價值。此外,舊的圖片庫系統(tǒng)越來越難以滿足應用需求,新的圖片庫系統(tǒng)設計時在圖片編目方面也存在較多困惑。標準調研過程及意見征集過程中得到了圖片各領域專家的積極配合和大力支持,使標準內容不斷得到豐富和完善。

三、標準主要內容與特色

(一)標準內容概覽

本標準的主要內容是對圖片元數(shù)據(jù)元素做出準確定義,尤其突出對圖片視覺內容特征和語義信息的描述。標準以編輯類圖片和創(chuàng)意類圖片為主要對象,定義了40個元數(shù)據(jù)元素,分別歸屬到公共元數(shù)據(jù)、編輯類圖片元數(shù)據(jù)和創(chuàng)意類圖片元數(shù)據(jù)三個部分。

本標準主要從四個角度進行元數(shù)據(jù)元素的篩選和梳理。一是“形”,即視覺表現(xiàn),主要指畫面中的主要事物及環(huán)境信息等;二是 “意”,即圖片主題,主要指概念、專題、分類等;三是“技”,即創(chuàng)作手法,主要指畫面構圖、攝影技術信息。四是圖片基本邏輯屬性,主要指圖片標識、新聞圖片標題和圖說等信息。標準具體內容詳見國家標準全文公開系統(tǒng)[2]。

(二)標準特色

1.從應用中來

實際應用中,圖片發(fā)現(xiàn)可分為檢索和推薦兩類。圖片檢索主要包括關鍵詞檢索、類別檢索、專題檢索和屬性過濾篩選等。關鍵詞檢索對于創(chuàng)意類圖片側重主題和畫面內容,對于編輯類圖片側重新聞人物、地點和事件信息。用于檢索結果集合篩選過濾的屬性主要集中在圖片色彩、片幅、尺寸、人物特征等。圖片推薦包括熱門、相似、個性化以及編輯推薦等,其中相似推薦大多以圖片色彩和主題相似分析為基礎。標準中定義的圖片內容元數(shù)據(jù)元素大部分來源于此。

2.有詳有略

標準中對人物特征描述和攝影技術進行了較為詳細的定義。人數(shù)、性別、年齡、民族、行為、表情、服飾、人物關系等人物信息,圖片色彩、畫幅方向、景別、色調、構圖方式、攝影技巧等攝影技術信息,對搜索結果過濾精化、圖片自動分析與推薦都具有重要作用。

標準中對圖片專題、自定義分類、畫面內容等未做細化規(guī)定,以適應多種不同業(yè)務場景的需要,可由用戶自定義擴展,提高標準的適用性。

3.強調規(guī)范化標注

標準中定義了22個可擴展的受控詞表,用于規(guī)范20個元數(shù)據(jù)元素的標注,減少主觀標注的不一致性,也便于支持圖片檢索時的結果集過濾。

4.層次化、體系化

標準編制組首先建立了一套圖片元數(shù)據(jù)體系架構,根據(jù)語義抽象程度不同,依次分為物理層、邏輯層、內容層和主題層。原有圖片元數(shù)據(jù)描述規(guī)范定義的元數(shù)據(jù)項集中在物理層和邏輯層。本標準主要定義了內容層和主題層元數(shù)據(jù),這相比傳統(tǒng)圖片基本屬性編目具有更高的辨識度和利用價值。

標準編制過程中,得到多位圖片領域專家的指導與支持,編制組從圖片特性、新聞圖片編輯、圖片應用現(xiàn)狀和發(fā)展等多個角度,不斷修正完善,形成了層次簡明清晰、專業(yè)性較強、體系較為完整的圖片內容描述元數(shù)據(jù)規(guī)范。

四、標準應用思考

標準來自于應用,服務于應用,更需要在應用中不斷完善。標準應用中有兩個方面的問題需要認真思考和應對。

第一是存量圖片標注和已有圖片庫系統(tǒng)改造問題。隨著圖片業(yè)務的不斷變化和升級,目前很大一部分圖片庫系統(tǒng)面臨升級改造問題。同時,存量圖片數(shù)量巨大,且已經(jīng)基于原有標準和自定義元數(shù)據(jù)進行了標注。升級圖片庫系統(tǒng)的同時,如何花費盡可能少的工作量完成存量圖片元數(shù)據(jù)信息向新的圖片元數(shù)據(jù)規(guī)范的轉換,是該標準推廣應用中的重要問題。圖片庫升級以及存量圖片元數(shù)據(jù)遷移是必要的,符合軟件生命周期規(guī)律,也是技術和業(yè)務發(fā)展的要求。較可行的方案是圖片系統(tǒng)設計人員整理出存量圖片已標注的元數(shù)據(jù)與新標準中元數(shù)據(jù)的對應關系,區(qū)分出直接對應、間接對應、無法對應等不同情況,最大程度的采用自動化方式實現(xiàn)部分元數(shù)據(jù)的遷移轉換,保留已標注元數(shù)據(jù)內容,再逐步完成新的元數(shù)據(jù)的標注工作。

第二是圖像智能處理技術與基于文本的圖片元數(shù)據(jù)規(guī)范在應用中的關系問題。隨著機器學習和人工智能技術的快速發(fā)展,計算機在圖像處理、圖像識別、圖像理解等方面的智能化程度和水平不斷提高,已由特定領域應用邁入通用領域應用,但同時我們不難發(fā)現(xiàn),基于文本的圖片特征描述仍然在圖片存儲、編輯、管理、檢索和交換中扮演主要角色。二者之間不是對立關系,而是相輔相成、互為補充的關系。圖片元數(shù)據(jù)標準在應用中可充分利用計算機自動處理技術,提高標注效率和質量;基于文本的圖片元數(shù)據(jù)標注結果具有豐富的圖片規(guī)格、內容、主題等特征,可在圖片自動處理與智能推薦等環(huán)節(jié)發(fā)揮重要作用。雙管齊下、各盡其能,使圖片更好地為社會生產(chǎn)生活服務。

五、總結與展望

國家標準《中文新聞圖片內容描述元數(shù)據(jù)規(guī)范》從新聞編輯用圖和創(chuàng)意用圖兩個應用角度,規(guī)定了中文新聞圖片視覺內容和語義信息的元數(shù)據(jù)元素集合,有利于跨領域、跨應用的圖片交換,更好地服務于圖片采編發(fā)和分析推薦等業(yè)務環(huán)節(jié)。標準中未涉及圖片版權元數(shù)據(jù)規(guī)約,應用中可遵循其他版權元數(shù)據(jù)標準。剛剛發(fā)布的這一版標準中尚未對數(shù)字圖表、漫畫、動圖等其他類型圖片的個性化元數(shù)據(jù)做出規(guī)定,但標準中已定義的元數(shù)據(jù)元素可適用于這些類圖片的標注。

該標準研制過程中得到了很多學者、領域專家的幫助和支持,編制組力求在完整性、專業(yè)性、實用性等方面達到相對平衡,但不斷完善才能保持其生命力。希望標準能夠得到越來越多的應用,并在應用中發(fā)現(xiàn)不足,促進標準的升級改版,從而更好地為應用服務。

[1]任悅,曾璜編著.《圖片編輯手冊》第四版.中國攝影出版社.2015年9月

[2]國家標準全文公開系統(tǒng) .http://www.gb688.cn/bzgk/gb/index

[3]IPTC Photo Metadata Standard.http://www.iptc.org/std/photometadata/specification/IPTC-PhotoMetadata

[4]EXIF Image Metadata.https://www.exif.org/imagemetadata.html

[5]全國中文新聞信息標準化技術委員會.國家標準GB/T 20092-2013《中文新聞信息置標語言》

猜你喜歡
圖片庫特征描述國家標準
船舶尾流圖像的數(shù)字化處理和特征描述技術
山東圖片庫
云南圖片庫
云南圖片庫
云南圖片庫
近期發(fā)布的相關國家標準(2019年12月10日)
近期發(fā)布的相關國家標準(2019年12月31日)
近期發(fā)布的相關國家標準(2020年03月06日)
近期發(fā)布的相關國家標準(2020年03月31日)
小學科學優(yōu)質微課程的特征描述
卢龙县| 永宁县| 扬中市| 漳平市| 法库县| 肥乡县| 策勒县| 和平县| 高阳县| 喜德县| 仪征市| 长寿区| 开原市| 贵阳市| 合作市| 木兰县| 颍上县| 额尔古纳市| 大竹县| 双流县| 明光市| 长子县| 阿荣旗| 新晃| 延庆县| 两当县| 烟台市| 上高县| 宁国市| 墨玉县| 仁寿县| 佳木斯市| 金塔县| 项城市| 中超| 遂溪县| 任丘市| 大名县| 肃南| 乌拉特中旗| 宁阳县|