郭淳
【摘要】網(wǎng)絡(luò)媒體資源的爆炸性增長對網(wǎng)絡(luò)媒體資源的管理提出了更高的要求,資源存儲精確化、元數(shù)據(jù)精確化和標引精確化是網(wǎng)絡(luò)媒體資源管理精確化需著眼的三個方面。
【關(guān)鍵詞】媒體資源信息管理精確化管理
網(wǎng)絡(luò)媒體資源管理精確化,就是精細和準確管理網(wǎng)絡(luò)上的圖片、視頻和音頻等媒體資源以提高資源的檢索、利用效率。網(wǎng)絡(luò)媒體資源管理精確化要從三個方面入手,資源存儲精確化、元數(shù)據(jù)精確化和標引精確化。
1 存儲精確化
圖片、視頻、音頻這些豐富的媒體資源數(shù)據(jù)量大,內(nèi)容不易更改,傳輸時間較長,因此要想做到對這些媒體資源在網(wǎng)絡(luò)上精確管理,首先要把資源更加精準地壓縮和命名。
網(wǎng)絡(luò)媒體資源的總體數(shù)量規(guī)模巨大,單純使用擴大存儲容量和增加網(wǎng)絡(luò)傳輸帶寬的辦法不太現(xiàn)實。網(wǎng)絡(luò)媒體資源管理要采用數(shù)據(jù)壓縮技術(shù),把媒體資源數(shù)據(jù)量壓下來,以壓縮的形式進行存儲和傳輸,既節(jié)省了存儲空間,又提高了傳輸效率。而且媒體資源本身確實有很大的壓縮潛力,媒體資源數(shù)據(jù)有大量的冗余信息,在可以接受的范圍進行壓縮,依然可以滿足用戶的需求。常用的視頻壓縮存儲格式有AVI、MOV、FLV、WMV和MPEG等,常用的音頻壓縮存儲格式有MP3、WMA、RA、MIDI等,常用的圖片壓縮存儲格式有JPEG、GIF、PNG、PSD和TIFF等。其中JPEG、GIF和PNG格式是支持網(wǎng)絡(luò)瀏覽的圖片格式,而PSD、TIFF格式不支持網(wǎng)絡(luò)瀏覽,但卻是教員和學(xué)員教學(xué)中常用的圖片格式,因此也是網(wǎng)絡(luò)媒體資源中常見的圖片格式。網(wǎng)絡(luò)媒體資源管理可以做到把PSD、TIFF格式的文件存儲一個GIF的縮略圖供網(wǎng)絡(luò)瀏覽使用,把源文件提供下載鏈接,這樣避免了教員和學(xué)員因為無法預(yù)覽而造成的無用下載,同時縮略圖還可供檢索使用。
圖片、視頻、音頻等媒體資源在網(wǎng)絡(luò)中通常還是以名字來體現(xiàn),容易修改且一目了然,無論是網(wǎng)絡(luò)媒體資源管理人員還是教員、學(xué)員都傾向于先通過名字來猜測資源的具體內(nèi)容。因此,命名精確化是網(wǎng)絡(luò)媒體資源管理精確化的基礎(chǔ)。做到精確化命名主要包括兩個方面。一是命名可以依據(jù)信息表征要素中準確表達資源特征的規(guī)則來進行,例如媒體資源的內(nèi)容、類型、拍攝者、時間、地點等,輔助元數(shù)據(jù)的自動提取,在錄入海量資源時節(jié)省時間和精力,避免僅使用阿拉伯?dāng)?shù)字或英文字母命名,不方便管理也無法實現(xiàn)資源檢索;二是命名要規(guī)整,避免夾雜無關(guān)信息,輔助檢索關(guān)鍵字的自動匹配,提高搜索引擎的檢索相關(guān)度。
2 元數(shù)據(jù)精確化
元數(shù)據(jù)是對數(shù)據(jù)資源的描述,即關(guān)于數(shù)據(jù)的數(shù)據(jù)。網(wǎng)絡(luò)媒體資源數(shù)據(jù)結(jié)構(gòu)復(fù)雜,其中有很多非結(jié)構(gòu)化數(shù)據(jù)是難以用一般的數(shù)據(jù)庫結(jié)構(gòu)加以管理。要想對這些結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)進行全面管理,只有通過建立網(wǎng)絡(luò)媒體資源的元數(shù)據(jù)來實現(xiàn)。結(jié)構(gòu)化的元數(shù)據(jù)不僅能夠描述數(shù)據(jù)信息,還可以規(guī)范信息的數(shù)據(jù)結(jié)構(gòu)和目錄內(nèi)容。
目前,國際上影響較大的元數(shù)據(jù)標準有美國高等教育協(xié)會提出的學(xué)習(xí)資源元數(shù)據(jù)規(guī)范、國際電氣和電子工程師協(xié)調(diào)學(xué)習(xí)技術(shù)標準委員會IEEE LTSC制定的LOM學(xué)習(xí)對象元數(shù)據(jù)模型以及OCLE的Dublin Core元數(shù)據(jù)標準,國內(nèi)主要有國家教育部教育信息化技術(shù)標準委員會的《中國現(xiàn)代遠程教育資源建設(shè)技術(shù)規(guī)范》、軍隊的《軍隊現(xiàn)代遠程教育資源建設(shè)技術(shù)規(guī)范》。但是在實際工作中,這些標準與規(guī)范的體系過于龐大,對于元數(shù)據(jù)描述的重要程度沒有區(qū)分,而且院校特色不明顯,因此對于網(wǎng)絡(luò)媒體資源的管理沒有提出明確的指導(dǎo)性建議。院校網(wǎng)絡(luò)媒體資源管理可以根據(jù)這些標準,建立一套與國際標準、國家標準和軍隊標準接軌且具有院校特色、科學(xué)性、實用性強的元數(shù)據(jù)標準,來優(yōu)化網(wǎng)絡(luò)媒體資源的組織形式,達到網(wǎng)絡(luò)媒體資源管理的精確化。
3 標引精確化
標引,就是通過標記指引人們方便、快捷地找到所需要的信息。網(wǎng)絡(luò)媒體資源在組織好以后,只有對其進行標引,才能使多種途徑的檢索成為可能。標引越精確,檢索的途徑越多,檢索的利用率就越高。例如,視頻網(wǎng)站優(yōu)酷,僅頂部導(dǎo)航就包含電視劇、電影、綜藝、體育、科技、財經(jīng)等23個標簽,整個網(wǎng)站有多種分類標簽、提供不同檢索視頻方式,以幫助用戶從多種途徑找到所需視頻。
圖片、視頻、音頻等媒體資源本身含有豐富的內(nèi)容特征,若對其進行精確標引,可以提高媒體資源的檢索效率。下面介紹圖片、視頻和音頻三種媒體資源的精確化標引方式。
圖片標引。對于圖片內(nèi)容有三類標引方法:一是依據(jù)圖片的物理層視覺特征進行標引,如顏色、色調(diào)、紋理、形狀等簡單直觀的特征信息;二是依據(jù)圖片的邏輯語義進行標引,即畫面中主體的視覺特征及空間位置關(guān)系,如圖片的最上方是直升機、中間是坦克戰(zhàn)斗群、最下方是陸地;三是依據(jù)圖片的抽象語義進行標引,即人在認知層面對圖像的描繪,如看到天安門廣場上的閱兵感到驕傲和自豪。
視頻標引。對于視頻內(nèi)容有兩類標引方法:一是類似于上述圖像的標引方法,提取顏色、紋理、邊緣等特征進行標引;二是采用軍事訓(xùn)練媒體資源管理系統(tǒng)的視頻分層的方法進行標引,把視頻劃分為節(jié)目、片段、場景、鏡頭和幀,分層標引使視頻檢索可以精確到鏡頭級,對視頻的管理和應(yīng)用更加精確。
音頻標引。對于音頻內(nèi)容有兩類標引方法:一是依據(jù)音頻的聲學(xué)特征進行標引,如音調(diào)、音色、音量等;二是依據(jù)音頻的語義特征進行標引,如聽到中國人民解放軍軍歌感到激昂。
資源存儲精確化、元數(shù)據(jù)精確化和標引精確化是網(wǎng)絡(luò)媒體資源管理精確化研究的著眼點,對于網(wǎng)絡(luò)媒體資源管理的精確化還有更多方面需要深入研究,將在未來的研究中開展。
【參考文獻】
[1] 陳翀,閆宏飛.網(wǎng)絡(luò)資源命名及用戶命名行為的分[J].情報學(xué)報,2009(8):583.
[2] 于代軍.軍校信息資源分類組織研究[M].北京:國防大學(xué)出版社,2012:186-187.
[3] 吳葉葵.數(shù)字圖書館中多媒體信息的組織與利用[J].現(xiàn)代情報,2006(6):101-102.
[4] 涂悅.基于內(nèi)容的音頻分類技術(shù)及其在多媒體檢索中的應(yīng)用[D].廣州:華南理工大學(xué),2012:7-8.
[5] 李振富,張俊星,李毅.分布式信息資源元數(shù)據(jù)標準化研究[J].現(xiàn)代電子技術(shù),2010(11):147-150.