新余市廣播電視臺(tái) 羅蘊(yùn)軍 黃瑞卿
隨著廣播電視行業(yè)的發(fā)展,廣播電視節(jié)目量劇增,產(chǎn)生了大量的音頻和視頻節(jié)目。如何保存和利用這些珍貴的媒體資產(chǎn),越來(lái)越成為各級(jí)廣播電視臺(tái)難以忽視的一項(xiàng)重要工作。媒體資產(chǎn)管理MAM(Media Assets Management)在這種條件下應(yīng)運(yùn)而生,成為廣播電視節(jié)目全面管理的首選方式。
隨著數(shù)字化、網(wǎng)絡(luò)技術(shù)的發(fā)展,近幾年媒體資產(chǎn)管理系統(tǒng)從技術(shù)架構(gòu)到應(yīng)用模式都已基本成熟,在廣電行業(yè)都已經(jīng)有了廣泛應(yīng)用。廣電行業(yè)媒資管理是對(duì)各種類型媒體及內(nèi)容(如視/音頻資料、文本文件、圖片等)進(jìn)行全面管理,即以先進(jìn)的管理理念和技術(shù)手段將媒資內(nèi)容進(jìn)行創(chuàng)建、編目、檢索、存儲(chǔ)、審核、發(fā)布等,解決了以往廣播電視節(jié)目大量資料管理效率低下的問題。其核心目的是使媒體資產(chǎn)永久化、生產(chǎn)化、資源化、便利化。
編目工作是廣電行業(yè)媒體資產(chǎn)管理的關(guān)鍵,編目數(shù)據(jù)質(zhì)量的高低反映了媒資數(shù)據(jù)的質(zhì)量及使用效果,影響了媒體資源管理水平的高低和節(jié)目資源的開發(fā)與利用。
編目即“編制目錄”,是將媒體的信息資源按照形式和內(nèi)容特征進(jìn)行分析、選擇和記錄,然后再按照一定的方法和規(guī)則進(jìn)行有序的組織,并為其編制目錄。編目是根據(jù)資源的內(nèi)容和形態(tài)特征,并按照一定的編目規(guī)則進(jìn)行,將編目對(duì)象中的信息以數(shù)據(jù)單元的形式加以提取和整理,并為視頻再利用提供檢索點(diǎn)的配置,便于用戶以各種途徑進(jìn)行檢索。
在廣電行業(yè)媒資管理的整個(gè)過程中,編目工作處于極重要位置,它的應(yīng)用是媒體資產(chǎn)內(nèi)容管理和實(shí)現(xiàn)媒體資產(chǎn)再利用的基礎(chǔ)。媒資編目是一個(gè)對(duì)音視頻對(duì)象進(jìn)行整理和提煉的過程,將其中有價(jià)值的畫面和資料的相關(guān)信息整理成為獨(dú)立的文件。目的是為了使信息系統(tǒng)化和有序化,有利于信息檢索、再利用以及數(shù)據(jù)的交換和信息資源的共享。在廣播電視臺(tái)中主要是對(duì)于現(xiàn)有音像資料的信息和各種資料進(jìn)行全面解釋,包括文字、圖像、聲音等信息,進(jìn)行加工使用。在編目之后,大量的媒體資料都能再重新被利用,比如可以對(duì)音視頻重新編輯生成新的廣播電視節(jié)目,或者了解該重要事件的背景信息和發(fā)展脈絡(luò)、參考原廣播電視節(jié)目中的文檔,還可以作為重要的歷史資料保存,成為歷史的重要見證。
廣電行業(yè)建立媒資管理系統(tǒng),可以將大量音視頻資料變成更有價(jià)值的資產(chǎn);可以與現(xiàn)有的節(jié)目制作、播出系統(tǒng)連接起來(lái),使新的音視頻資料直接成為新的資產(chǎn);可根據(jù)現(xiàn)有條件的具體情況,逐步開展數(shù)字化節(jié)目自動(dòng)播出、互聯(lián)網(wǎng)節(jié)目發(fā)送、節(jié)目點(diǎn)播、節(jié)目交易、交互電視、視音頻資料提供等新業(yè)務(wù)。隨著計(jì)算機(jī)和互聯(lián)網(wǎng)無(wú)線電技術(shù)的發(fā)展,媒體資產(chǎn)逐漸全面運(yùn)用,而視頻資料的原始擁有者,將成為媒體資產(chǎn)最大的受益者。所以,使用媒資編目是很多廣播電視臺(tái)的必然選擇。
根據(jù)實(shí)際需求,新余臺(tái)媒資管理系統(tǒng)采用IP-SAN架構(gòu)。核心存儲(chǔ)系統(tǒng)采用千兆以太網(wǎng)構(gòu)建在線核心存儲(chǔ)區(qū)域,同時(shí)構(gòu)建千兆以太網(wǎng)絡(luò)系統(tǒng)實(shí)現(xiàn)信息流和低碼流等數(shù)據(jù)的傳輸和控制。該系統(tǒng)對(duì)節(jié)目進(jìn)行編目分類及歸檔等工作,采用多級(jí)存儲(chǔ)的體系結(jié)構(gòu),配置獨(dú)立的編目工作站,實(shí)現(xiàn)媒資的編目;通過數(shù)據(jù)交換平臺(tái)實(shí)現(xiàn)與制作網(wǎng)絡(luò)和播出系統(tǒng)等的數(shù)據(jù)交換;同時(shí)實(shí)現(xiàn)部分歷史模擬磁帶的數(shù)據(jù)化。
該系統(tǒng)融合先進(jìn)的IT技術(shù),采用模板化的管理架構(gòu),可以由簡(jiǎn)到繁的自定義媒體資產(chǎn)管理系統(tǒng)的范圍,為整個(gè)網(wǎng)絡(luò)提供前期節(jié)目素材的歸檔、檢索、編目、回遷工作。媒資管理平臺(tái)是以文稿為主線,貫穿線索、剪輯、編目、檢索、查詢等新型媒資綜合業(yè)務(wù)管理平臺(tái)。
媒資系統(tǒng)對(duì)視音頻數(shù)據(jù)最初的處理主要是進(jìn)行編目、分類。編目子系統(tǒng)采用樹狀編目結(jié)構(gòu),節(jié)點(diǎn)的屬性采用模板的方式進(jìn)行定義,使不同類型的節(jié)目擁有不同的屬性,通過靈活自定義節(jié)點(diǎn)的屬性保障了編目結(jié)構(gòu)的可用性和可擴(kuò)展性。采用先進(jìn)的自動(dòng)或手動(dòng)轉(zhuǎn)場(chǎng)分析和歸檔進(jìn)程顯示使得編目歸檔工作更加人性化,系統(tǒng)將系統(tǒng)的編目前置,大大提高了媒體資產(chǎn)管理系統(tǒng)的時(shí)效性。
(1)編目功能。系統(tǒng)對(duì)素材進(jìn)行編目的功能主要包括:自動(dòng)編目、詳細(xì)編目、關(guān)鍵幀編目。編目中涉及到的技術(shù)要符合國(guó)家有關(guān)標(biāo)準(zhǔn)要求;自動(dòng)與手動(dòng)相結(jié)合,軟件與硬件相結(jié)合;在遷移的同時(shí)可自動(dòng)提取轉(zhuǎn)場(chǎng)幀、關(guān)鍵幀作為檢索畫面,實(shí)現(xiàn)自動(dòng)編目;為提高時(shí)效,一次編目完成基本著錄項(xiàng)目;提供專業(yè)水準(zhǔn)的詳細(xì)的二次編目,確保素材得到有效利用;編目后提供素材的檢索、瀏覽功能,能對(duì)視音頻進(jìn)行檢索、瀏覽;編目的同時(shí)可進(jìn)行基本的視音頻編輯工作,用于素材整理。
(2)抽幀功能。抽幀畫面的大小、壓縮方式可根據(jù)需要進(jìn)行設(shè)定;系統(tǒng)可自動(dòng)根據(jù)圖像實(shí)時(shí)或超實(shí)時(shí)自動(dòng)進(jìn)行抽幀工作;操作人員根據(jù)畫面選定關(guān)鍵幀,進(jìn)行手功抽幀工作;抽幀時(shí)應(yīng)可選擇抽幀模式,如新聞模式、電視劇模式等,各模式可對(duì)抽幀方式、關(guān)鍵幀數(shù)量進(jìn)行設(shè)定。
(3)編目流程。媒體資產(chǎn)管理系統(tǒng)對(duì)視音頻數(shù)據(jù)最初的處理主要是進(jìn)行編目、分類。對(duì)于資料的編目實(shí)質(zhì)上就是對(duì)資料的屬性進(jìn)行描述,其目的是為后續(xù)的查詢檢索工作提供充分的分類信息。編目信息描述得是否準(zhǔn)確、是否充分,直接影響到日后媒體資料的再利用率,關(guān)系到資產(chǎn)的增值情況。本系統(tǒng)對(duì)編目以及最后的審核校對(duì)進(jìn)行了規(guī)劃,具體的流程示意如圖1所示。
(4)架構(gòu)規(guī)劃。編目過程主要是針對(duì)視音頻內(nèi)容進(jìn)行分類描述,無(wú)需高質(zhì)量畫面,因此采用低碼流素材進(jìn)行編目,工作方式采用智能化操作與人工參與相結(jié)合的模式;編目工作站的編目體系設(shè)計(jì)為開放的體系,遵從國(guó)家廣電總局制定的《廣播電視音像資料編目規(guī)范》,同時(shí)還支持用戶的自定編目體系;系統(tǒng)的編目信息能夠以XML文件方式導(dǎo)出,便于節(jié)目信息交換和查詢檢索;系統(tǒng)設(shè)置了編目審核工作站,主要用來(lái)審核編目信息是否準(zhǔn)確,是否滿足定稿要求。審核通過的文件將被標(biāo)記下來(lái),元數(shù)據(jù)信息直接被保存到數(shù)據(jù)庫(kù)中,對(duì)應(yīng)的高低碼流文件也將被歸檔保存。
圖1 素材編目流程圖
由系統(tǒng)中間件提供的分類功能模塊是對(duì)節(jié)目?jī)?nèi)容歸屬類別的描述,主要用于提供按照資料內(nèi)容等條件的檢索依據(jù)。在分類模塊中主要具有自動(dòng)分類和人工分類兩大主要功能。對(duì)于內(nèi)容的歸屬分類可以是一對(duì)一、一對(duì)多的關(guān)系,即資料可以有一個(gè)歸屬或有多個(gè)歸屬,所以自動(dòng)分類和人工分類相互作用共同完成對(duì)內(nèi)容分類這一功能。
編目系統(tǒng)分類方式主要有兩種:一是按國(guó)家標(biāo)準(zhǔn)的規(guī)范化分類方式,二是根據(jù)用戶需要自行定義的分類方式。前者遵循的是國(guó)家廣電總局頒布的《廣播電視音像資料編目規(guī)范》、《廣播電視節(jié)目資料分類法》以及相關(guān)行業(yè)標(biāo)準(zhǔn)的要求,后者采用用戶自己制訂的分類標(biāo)準(zhǔn)。系統(tǒng)支持用戶可以自由選擇其中一種或兩種方法并存的方式對(duì)節(jié)目資料進(jìn)行維護(hù),新余臺(tái)同時(shí)采用了以上兩種分類方式。
信息的一次編目是資料入庫(kù)前所做的第一項(xiàng)工作。就新余臺(tái)而言,由于信息資料主要是視頻或音頻文件,這些視音頻文件是一種不能由一個(gè)具體數(shù)值來(lái)描述的非結(jié)構(gòu)化數(shù)據(jù),如何把這些非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換成可以用數(shù)據(jù)庫(kù)來(lái)記錄的結(jié)構(gòu)化數(shù)據(jù),是這個(gè)模塊所要完成的主要功能。在非編制作網(wǎng)中,對(duì)資料的編目操作按下列步驟實(shí)現(xiàn):
(1)選取要編目的資料?!熬幠恐行摹笨梢酝ㄟ^兩種方式檢索應(yīng)該編目的資料:一是使用插件的方式。即在“編目中心”中加入一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)插件的方式直接檢索網(wǎng)絡(luò)數(shù)據(jù)庫(kù),搜索編導(dǎo)自己的資料。就象打開文件的對(duì)話框一樣。這種方式對(duì)于編目來(lái)說,只操作一個(gè)軟件,簡(jiǎn)單方便。但需要網(wǎng)絡(luò)供應(yīng)商編寫插件或提供數(shù)據(jù)庫(kù)結(jié)構(gòu)。二是使用文件拖拽的方式。使用網(wǎng)絡(luò)本身的軟件進(jìn)行檢索資料,然后通過Windows標(biāo)準(zhǔn)的文件拖拽方式,直接拖到編目軟件中。這種方式需要網(wǎng)絡(luò)供應(yīng)商支持文件拖拽。這兩種方式已經(jīng)在“編目中心”中實(shí)現(xiàn)。
(2)編目?!熬幠恐行摹奔虞d資料后,編目人員就可以按照自己的創(chuàng)意對(duì)資料進(jìn)行描述。
(3)提交。當(dāng)編導(dǎo)完成了對(duì)素材的描述后,仍然通過“編目中心”的提交功能將該素材的XML描述發(fā)送到媒體網(wǎng)關(guān)上。
(4)遷移到媒體資產(chǎn)網(wǎng)絡(luò)的中心存儲(chǔ)。媒體網(wǎng)關(guān)接收到XML描述后,可以自動(dòng)將該素材遷移到媒體資產(chǎn)的在線存儲(chǔ)區(qū),供審查和選用。
二次編目主要是完成對(duì)音像資料所記錄的具體內(nèi)容為主的標(biāo)引。它是整個(gè)節(jié)目資料計(jì)算機(jī)管理系統(tǒng)的核心環(huán)節(jié),關(guān)系著媒資庫(kù)所藏資料是否能夠充分開發(fā)利用。主要包括以下功能:
(1)內(nèi)容自動(dòng)分析。是對(duì)音像資料的內(nèi)容做的概括描述,編目人員通過觀看MPEG-4的數(shù)字化文件來(lái)對(duì)資料內(nèi)容進(jìn)行總結(jié),一段音像資料可以由一個(gè)或幾個(gè)內(nèi)容摘要組成。
(2)關(guān)鍵幀自動(dòng)提取。在二次編目過程中,系統(tǒng)提供了對(duì)素材的關(guān)鍵幀提取的手動(dòng)和自動(dòng)兩種工作模式。自動(dòng)提取方式可以根據(jù)不同的需要進(jìn)行系統(tǒng)功能預(yù)設(shè)置(如:新聞?lì)愄崛》绞?、運(yùn)動(dòng)類提取方式)。有了關(guān)鍵幀抽取功能,為節(jié)目檢索提供了極大的方便。當(dāng)用戶訪問時(shí),可以檢索到關(guān)于視頻的標(biāo)題、描述,以及影片中的各個(gè)關(guān)鍵畫面。并且可以從某個(gè)關(guān)鍵幀開始瀏覽、觀看一個(gè)節(jié)目的不同部分。當(dāng)素材進(jìn)行上載時(shí),該系統(tǒng)上載工作站自動(dòng)進(jìn)行關(guān)鍵幀的自動(dòng)抽取,而且抽幀是根據(jù)視頻內(nèi)容的自動(dòng)轉(zhuǎn)場(chǎng),當(dāng)視頻畫面的內(nèi)容的變化量大于用戶預(yù)先設(shè)定值時(shí),自動(dòng)提取畫面首幀,加入視頻編目描述信息系統(tǒng)內(nèi)的元數(shù)據(jù)庫(kù),提高系統(tǒng)的編目工作效率,用戶可以讓系統(tǒng)在指定的時(shí)間范圍內(nèi)自動(dòng)抽取,也可以由人工手動(dòng)收取,抽取的范圍可以細(xì)化到逐幀。在二次編目中,可以對(duì)關(guān)鍵幀進(jìn)行編目。針對(duì)關(guān)鍵幀的編目與二次編目一樣,分類內(nèi)容可以自由指定,對(duì)關(guān)鍵幀的編目將有助于素材檢索時(shí)的準(zhǔn)確性。
(3)關(guān)鍵字自動(dòng)提取。提煉關(guān)鍵字和自由詞的準(zhǔn)確率十分重要,在我們的應(yīng)用系統(tǒng)中采用了成熟的全文索引產(chǎn)品,通過采用“正向掃描,一字先行,半字推進(jìn)”的分詞方式以及最長(zhǎng)匹配自動(dòng)分詞算法,從輸入的信息內(nèi)容中自動(dòng)抽取能夠反映文獻(xiàn)主題信息特征的關(guān)鍵詞。接著,采取某種自動(dòng)分類算法,將已經(jīng)抽取的能夠表征文獻(xiàn)主題的各種關(guān)鍵詞進(jìn)行組配并歸入到適當(dāng)類目當(dāng)中,同時(shí)給出相應(yīng)的主題詞和關(guān)鍵詞。最后,將自動(dòng)標(biāo)引結(jié)果保存到標(biāo)引結(jié)果數(shù)據(jù)庫(kù)中,從而實(shí)現(xiàn)自動(dòng)分詞、標(biāo)引等功能。并且,本模塊對(duì)新出現(xiàn)的詞匯可以進(jìn)行智能學(xué)習(xí)。
為滿足不斷變化的編目需求,歸檔保存后,系統(tǒng)提供多次編目的功能,對(duì)媒體對(duì)象進(jìn)行分級(jí)、分工的編目描述。多次編目后的素材需要再次經(jīng)過審查才能歸檔保存。
素材的編目屬性會(huì)由于實(shí)際生活中的事件發(fā)生而發(fā)生改變,因此,對(duì)素材的多次編目就顯得尤其重要。在對(duì)素材的多次編目中,可以為素材添加新的素材屬性描述,也可以去掉已經(jīng)不合適的素材屬性。而對(duì)于素材多次編目所添加的素材屬性,系統(tǒng)沒有任何數(shù)量和類型上的限制。
在一般編目的系統(tǒng)中,元數(shù)據(jù)一旦被定義,就很難再做修改。但新余臺(tái)采用的編目系統(tǒng)應(yīng)用了新技術(shù),提供的定義素材屬性這一功能,可以隨時(shí)增加任何一項(xiàng)新的屬性即新的元數(shù)據(jù)。如果對(duì)系統(tǒng)中定義的元數(shù)據(jù)不滿意或希望增加新條目,可以完全由編目人員自己完成修改工作。當(dāng)編目端調(diào)用這一類型的元數(shù)據(jù)時(shí),系統(tǒng)將生成新的標(biāo)引窗口,并且在索引端會(huì)自動(dòng)提供新的索引條目,從而使節(jié)目編目等元數(shù)據(jù)的增添變得十分靈活,極大的提高了系統(tǒng)的擴(kuò)展性,降低了系統(tǒng)對(duì)開發(fā)商的依賴程度。當(dāng)然,對(duì)元數(shù)據(jù)的修改工作是由通過特殊授權(quán)的工作人員來(lái)完成的。
在媒資管理的整個(gè)過程中,編目的應(yīng)用是媒體資產(chǎn)內(nèi)容管理和實(shí)現(xiàn)媒體資產(chǎn)再利用的基礎(chǔ)。廣播電視臺(tái)作為媒體資產(chǎn)最大和最重要的所有者,必須意識(shí)到媒體資產(chǎn)的重要性,應(yīng)做到提高編目人員的素質(zhì),規(guī)范編目標(biāo)準(zhǔn),細(xì)化編目工作,加強(qiáng)素材編目。此外,做好媒體資產(chǎn)管理中的編目工作,也有利于提高廣播電視節(jié)目的管理效率,實(shí)現(xiàn)音視頻資料的數(shù)字化。
見www.dcw.org.cn