羅 瓊 覃 俊 鄧 蕾
(廣西日報社,廣西 南寧 530015)
媒體融合在逐漸向縱深發(fā)展,傳統(tǒng)媒體過往的媒體資源管理狀態(tài)已然無法維持,在全媒體發(fā)展的進(jìn)程中,海量的媒體資源散落各處,加上無序、不集中存儲與粗放的管理模式,使得需要查詢資料時,只能通過傳統(tǒng)的人工方式四處查找。如此,想要快速查詢或者獲取歷史資料就會變得既麻煩又耗時,如何避免寶貴的歷史文獻(xiàn)信息的流失,改變內(nèi)部智能分享環(huán)節(jié)的缺失和無序的管理環(huán)境,從而共享到信息技術(shù)創(chuàng)新所帶來的數(shù)智化管理體系紅利,亦或是建設(shè)一套符合融媒發(fā)展需求的智能媒資系統(tǒng),是當(dāng)下國內(nèi)眾多傳統(tǒng)媒體所面臨的難題。例如偏重傳統(tǒng)紙媒方向的廣西日報傳媒集團(tuán),之前因條件限制,大多數(shù)的新聞信息資源管理處于粗放的狀態(tài),更不用說是對音視頻、圖片類資源進(jìn)行高效的管理和施與科學(xué)的處理手段了。
廣西日報傳媒集團(tuán)廣西云智能媒資庫的建設(shè)重點在于摒棄上述短板,在整合報社內(nèi)部資源的同時與廣西云平臺對接,搭建一套可對媒資內(nèi)容進(jìn)行檢索、獲取、共享等功能的系統(tǒng),通過在媒資管理業(yè)務(wù)流程中引入云計算及人工智能技術(shù),構(gòu)建起一個具備人臉識別、字幕識別、語言識別等功能的“智能化媒資管理平臺”。如此,才能有效解決集團(tuán)傳統(tǒng)媒資管理中的長期缺陷,使智能媒資管理系統(tǒng)得以從傳統(tǒng)檔案管理型媒資向生產(chǎn)服務(wù)型媒資轉(zhuǎn)變。與此同時,在既能對集團(tuán)旗下所有媒體平臺提供智能媒資管理服務(wù)的同時,作為自治區(qū)級平臺廣西云建設(shè)中不可分割的部分,還要面向廣西壯族自治區(qū)內(nèi)14個設(shè)區(qū)市、111個縣(市、區(qū))開放并提供服務(wù),為全區(qū)媒體融合發(fā)展提質(zhì)增效,以技術(shù)賦能縣級融媒體發(fā)展,夯實廣西云融媒平臺發(fā)展基石??傮w架構(gòu)如圖1。
圖1 總體架構(gòu)
隨著信息技術(shù)的日新月異的快速更迭,傳統(tǒng)媒體的媒資管理短板日益凸顯,極大地影響了媒體融合發(fā)展的效能。常年積淀的媒資散落各處,海量的寶貴信息資源根本無法體現(xiàn)其價值,造成媒資資源沒有得到有效利用,甚至造成無法實時地與外部進(jìn)行交互,新媒體在進(jìn)行內(nèi)容生產(chǎn)時也無法得以快速響應(yīng),阻礙了“移動優(yōu)先”的全媒體時代大量資訊快速生產(chǎn)的需要,這樣心有余而力不足的狀態(tài)在媒體融合向縱深發(fā)展的進(jìn)程中更為凸顯。當(dāng)前傳統(tǒng)媒體資源管理現(xiàn)狀主要表現(xiàn)如下。
海量音像及文本資料的存儲、再利用和管理困難。長年累月地積累,各媒體的音像素材數(shù)量龐大內(nèi)容豐富,音視頻資源格式、種類繁多,文件大小不一不易識別與交換、變現(xiàn),難以有效管理,具體表現(xiàn)如下。
管理混亂,圖片資料遺失嚴(yán)重。在傳統(tǒng)媒體單位,數(shù)據(jù)庫不完善或缺乏素材管理,辦公電腦、相機(jī)、存儲設(shè)備等載體的更新?lián)Q代,大部圖片資源散落在各部門、各平臺或者個人處以及檔案柜的光盤里,原素材難以匯總搜集整理乃至消失,管理處于粗放型的無序狀態(tài)。
資料安全缺乏保障。由于大量資料處于放羊型管理狀態(tài),音視頻磁帶及錄制介質(zhì)容易受環(huán)境及存儲的影響導(dǎo)致資料損失或損壞、丟失等情況常常發(fā)生,使媒資資源的安全性無法得到保障。
查找緩慢繁瑣,效率低下。因為數(shù)據(jù)庫的缺失或者不完善,傳統(tǒng)媒體中各管理部門不同存儲介質(zhì)不一,加上素材管理無序,無法匯聚統(tǒng)一,查找起來非常緩慢且繁瑣,給日常工作中對歷史圖片資料等的查詢造成了極大困難,這直接導(dǎo)致了獲取信息資料工作效率低下。
無法有效快速共享、獲取和交互。在傳統(tǒng)媒體體系中,大量的音像資料屬于員工個人資源由個人存儲,或散落在各個部門光盤里和各平臺上,已經(jīng)進(jìn)行規(guī)范化管理的,卻還是傳統(tǒng)的管理模式,無法有效快速共享和獲取、交互。
價值變現(xiàn)效果極低,難以精細(xì)化管理。傳統(tǒng)的資料管理不集中或粗放的管理方式,導(dǎo)致媒資流失嚴(yán)重。如果媒資缺乏智能的科學(xué)的管理手段,哪怕知道那些留存下來的海量音像資料價值極高,但要想變現(xiàn)或滿足于媒體融合的業(yè)務(wù)需要,也是困難重重。哪怕是做個鄉(xiāng)村振興專題展覽,都需要花費大量的人力和精力去找尋材料。無法使得媒體資產(chǎn)通過社會化媒體傳播發(fā)揮其潛能并且創(chuàng)造出社會價值。
因此,需要把這些痛點祛除,利用智能技術(shù)去驅(qū)動與賦能,在傳統(tǒng)媒體與新媒體的融合建設(shè)帶動下,讓變革與創(chuàng)新充分體現(xiàn)出傳統(tǒng)媒資應(yīng)有的價值。讓以往通過傳統(tǒng)技術(shù)和工具無法分析并獲取價值的非結(jié)構(gòu)性數(shù)據(jù),在大數(shù)據(jù)時代變成可以深入挖掘的寶藏。價值體現(xiàn)如下圖2。
圖2 價值體現(xiàn)
“不積跬步無以至千里,不積小流無以成江海”,在媒體逐漸向縱深融合發(fā)展的大潮中,要想解決上述面臨的問題,需要與時俱進(jìn)跟上融媒發(fā)展的步伐,建立一套專業(yè)智能化的媒資管理系統(tǒng)。將海量媒資資源,包括音視頻、圖像資料、文檔及動漫畫等盡可能地根據(jù)其不同的特點進(jìn)行安全地集中統(tǒng)一規(guī)范管理,并納入精細(xì)化的資產(chǎn)管理范疇,才能有效防止資產(chǎn)流失。目前,集團(tuán)已經(jīng)在這方面做出了改革,在平臺中納入第三方能力為己用,邊建設(shè)邊實踐邊迭代。
當(dāng)前,人工智能技術(shù)已廣泛應(yīng)用于各行各業(yè),我國媒體融合步伐正在逐漸向縱深發(fā)展,“媒體+AI”的應(yīng)用場景已然到來,并迅速融入人們的工作與生活中,各類傳統(tǒng)媒體、新興媒體已將人工智能技術(shù)大規(guī)模應(yīng)用于內(nèi)容采集、生產(chǎn)、管理、審核和分發(fā),檢索應(yīng)用乃至變現(xiàn)等環(huán)節(jié)。[1]
因于上述媒資管理系統(tǒng)的發(fā)展現(xiàn)狀和政策、技術(shù)背景,“媒資+AI”“非編+AI”的深度融合產(chǎn)品應(yīng)運而生,通過人臉識別、語音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)、字幕識別(OCR)、智能場景識別等人工智能技術(shù)賦能媒資內(nèi)容的匯聚、生產(chǎn)、審核、編目、檢索、統(tǒng)計、存儲及運營管理等環(huán)節(jié),使業(yè)務(wù)效率得以全面提升。[2]廣西日報傳媒集團(tuán)在智能媒資建設(shè)項目的建設(shè)中,亦在對上述能力進(jìn)行不斷嘗試,并基于自主研發(fā)的AI算法中去實現(xiàn)對視頻、音頻、圖片、文檔等資料進(jìn)行統(tǒng)一管理。該系統(tǒng)通過“大數(shù)據(jù)+人工智能”實現(xiàn)媒資的結(jié)構(gòu)化存儲和智能媒資檢索。主要通過以下手段提升智能媒資系統(tǒng)的功能和效用。
“存”。首先,建設(shè)項目中涵蓋的部分即是媒資存儲,其存儲功能支持高和低雙碼率,素材碼流高的用于歸檔存儲,低者則用于編目檢索等功能。同時利用成熟的分布式集群技術(shù)解決日益膨脹的內(nèi)容數(shù)據(jù)問題,這不僅可以降低數(shù)據(jù)通信成本和產(chǎn)品維護(hù)成本,同時還能夠為業(yè)務(wù)系統(tǒng)提供更穩(wěn)定、更安全的內(nèi)容、存儲以及數(shù)據(jù)分析與挖掘的一體化服務(wù)。
與此同時,可配合對已存入系統(tǒng)的媒資進(jìn)行多維度的自動化編目,并把入庫的媒資流程盡可能地簡化。在媒資管理中包括存儲在內(nèi)的許多個環(huán)節(jié)賦予AI能力,方便應(yīng)用人員通過系統(tǒng)進(jìn)行語音、標(biāo)簽、圖片、人臉等識別,以及將圖像、音視頻等內(nèi)容進(jìn)行文本化和結(jié)構(gòu)化。不論是一句話、一行字或是一個場景的媒資均有AI標(biāo)注,給檢索與再利用帶來了便利。
“用”??蓪崟r在線對系統(tǒng)內(nèi)各種信息資源進(jìn)行編目,或者欄目的靈活添加、字段的刪改等多種模式定義功能,支持遵循國家音像資料的編目結(jié)構(gòu)、原則;可針對節(jié)目、片段、場景、鏡頭等多層次的編目。支持對視頻片段進(jìn)行剪輯,播放并下載至本地。支持用戶對媒資進(jìn)行管理,包括添加媒資、查看媒資、搜索媒資,并對媒資進(jìn)行編輯和導(dǎo)出,為上層業(yè)務(wù)輸入媒資數(shù)據(jù),支持批量導(dǎo)出。
同時滿足用媒資時能夠提高主動檢索效率,以便于進(jìn)行數(shù)據(jù)服務(wù)時,讓媒資資產(chǎn)的價值得以加持,從而給報社在進(jìn)行數(shù)據(jù)評估變現(xiàn)時做出參考。
“審”。對媒資內(nèi)容的嚴(yán)格審核,無論在何時,都是主流媒體的一項硬性要求。在智能化的媒資管理系統(tǒng)中,對政治人物、敏感人物、涉黃涉暴等事實的準(zhǔn)確核查和審核,是對媒資內(nèi)容安全的極大保障。
“管”。實現(xiàn)并完善集團(tuán)媒資對象管理體系。這是基于面向?qū)ο蟮乃悸?,將集團(tuán)業(yè)務(wù)數(shù)據(jù)和業(yè)務(wù)邏輯緊密結(jié)合在一起,實現(xiàn)系統(tǒng)數(shù)據(jù)管理到內(nèi)容管理的轉(zhuǎn)化的目標(biāo)。納入系統(tǒng)內(nèi)進(jìn)行標(biāo)準(zhǔn)化的資源管理,內(nèi)容包括音視頻、圖像、文檔、flash動畫各種常用的格式;并且支持主流單反相機(jī)創(chuàng)建的原始格式圖片;文檔類支持DOC、RTF、XLS、PPT、PDF等格式。并且以上文件都能支持自動識別,瀏覽格式自動轉(zhuǎn)換,其他數(shù)字文件都可以普通文件形式存儲。此外,還可對所有租戶、應(yīng)用、角色權(quán)限等進(jìn)行統(tǒng)一管理。
“搜”。智能媒資已經(jīng)能夠滿足用戶的簡單檢索需求,因此釋放的人力,恰好能進(jìn)一步集中到專業(yè)需求度更強(qiáng)、資料服務(wù)量更大、社會效益更高的項目中。[3]在系統(tǒng)建設(shè)時,考慮到標(biāo)簽管理是非常重要的一環(huán),因此有一項功能是可以對媒資手工錄入自定義標(biāo)簽,同時收入錄入標(biāo)簽支持媒資檢索。支持媒資檢索,在用戶登錄媒資平臺時,可以自動展示最新上傳的素材,能夠通過篩選項,選擇查看圖片或者視頻等媒資類型。支持通過搜索關(guān)鍵詞、通用篩選項(時間、素材類型)、媒資專用篩選項(格式、時長、構(gòu)圖等)對媒資進(jìn)行查找和篩選。并且可以查看媒資的搜索結(jié)果,對命中的關(guān)鍵詞進(jìn)行高亮展示。
選擇按發(fā)布時間篩選媒資內(nèi)容,會彈出時間框選項,選擇具體檢索內(nèi)容發(fā)布時間區(qū)間,會自動篩選出該時間段媒資內(nèi)容進(jìn)行展示。可以查看包括媒資本身基礎(chǔ)信息和通過內(nèi)容理解、內(nèi)容萃取提取出的內(nèi)容詳情,并對視頻進(jìn)行編輯或者上下架。可針對視頻中解析出來的各類標(biāo)簽,點擊查看對應(yīng)的視頻片段。在識別功能上,需要滿足語音識別(比如針對足球領(lǐng)域、時政會議領(lǐng)域等)、OCR識別(比如視頻字幕、賽事的比賽時間等)、鏡頭識別(這是針對判斷鏡頭是否轉(zhuǎn)換,可以用于對長視頻進(jìn)行切片,將視頻轉(zhuǎn)化為最小顆粒度的媒資,便于更好地利用)、人臉查找(如明星、政要、足球球員、敏感人物等,這個功能的支持是建立在專門的人臉庫,來進(jìn)行特定人物的識別)、ASR(是語音引擎負(fù)責(zé)將語音請求轉(zhuǎn)換為識別的文字)。[4]
以支持識別視頻中出現(xiàn)的名人人臉為例,通過點擊查看對應(yīng)的視頻片段,通過與智能數(shù)據(jù)中心中的數(shù)據(jù)進(jìn)行匹配,展示識別出人臉或標(biāo)簽的詳細(xì)內(nèi)容。同時還支持識別視頻中的語音,并選擇指定段落進(jìn)行播放,支持識別視頻中的文字支持對視頻片段進(jìn)行智能剪輯,將在播放條上高亮顯示標(biāo)簽/文字/語音/人臉對應(yīng)的段落,輔助編輯進(jìn)行剪輯,快速定位到想要的段落,進(jìn)行剪輯并下載至本地。
通過以上環(huán)節(jié)的AI賦能,真正地實現(xiàn)了“AI+內(nèi)容”的有機(jī)結(jié)合。功能全景圖如下圖3。
圖3 功能全景圖
技術(shù)賦能融媒發(fā)展已毋庸置疑,并且逐漸地由幕后走到了臺前。廣西日報傳媒集團(tuán)建設(shè)的智能媒資管理系統(tǒng)主要包括兩部分:本地媒資管理系統(tǒng)與公有云智能化服務(wù)。本地媒資管理系統(tǒng)部署于本地的服務(wù)器中,本地上傳高碼率媒資文件后統(tǒng)一轉(zhuǎn)碼為低碼率文件,同步上傳到公有云(Magic短視頻智能生產(chǎn)平臺),調(diào)用云端智能能力對視頻/圖片進(jìn)行智能打標(biāo)簽服務(wù),并將打標(biāo)簽結(jié)果同步至本地媒資管理系統(tǒng)中。通過本地化媒資系統(tǒng)實現(xiàn)智能檢索、下載等功能。在云端的媒資文件還可以調(diào)用智能生產(chǎn)云服務(wù)工具,如直播拆條、視頻包裝、同期字幕、智能模板視頻、視頻去抖、視頻轉(zhuǎn)GIF、新聞拆條、視頻壓縮、文章自動轉(zhuǎn)視頻、海報視頻等云工具。在公有云的應(yīng)用平臺上還部署了語音識別、OCR識別、鏡頭識別、人臉識別、ASR等智能化功能,為融媒平臺提質(zhì)增效,為融媒產(chǎn)品加分。[5]
大數(shù)據(jù)技術(shù)的價值不止于海量數(shù)據(jù)本身,更在于如何對數(shù)據(jù)進(jìn)行有效的數(shù)據(jù)共享、組織及利用,提升數(shù)據(jù)處理能力,實現(xiàn)數(shù)據(jù)價值。[6]廣西日報社智能媒資管理系統(tǒng)將AI智能服務(wù)與媒資管理功能相結(jié)合,建設(shè)一套面向視頻、音頻、圖片類型本地化媒體資源管理系統(tǒng),并與廣西云融媒體平臺對接,實現(xiàn)媒資內(nèi)容的檢索、獲取、共享等功能。同時考慮到AI云服務(wù)具有高效率、快迭代、功能豐富等優(yōu)點,重塑了AI云服務(wù)+本地媒資管理系統(tǒng)+廣西云平臺的數(shù)據(jù)交互和服務(wù)共享能力,既能滿足集團(tuán)內(nèi)媒體資源管理需求,又能結(jié)合人工智能生產(chǎn)需求的智能媒資管理系統(tǒng),加強(qiáng)媒體資源的利用效率,提高媒體人內(nèi)容創(chuàng)作效率,統(tǒng)一服務(wù)能力,減少運營成本,效益明顯提升。
媒資系統(tǒng)的建設(shè)不應(yīng)停留在技術(shù)層面 ,更應(yīng)站在市場戰(zhàn)略性層面 ,對其核心競爭力和自身優(yōu)勢進(jìn)行分析規(guī)劃 ,使其更好地發(fā)展。[7]引入媒體資產(chǎn)管理概念和建立實用的媒體資產(chǎn)管理系統(tǒng),是關(guān)系到各行各業(yè)媒體技術(shù)提升和多種業(yè)務(wù)開展的戰(zhàn)略性行為。[8]提升傳播能力,增長用戶連接,亦是建設(shè)本系統(tǒng)的主要目的之一。2020年廣西云各媒體平臺總用戶超5178萬,發(fā)稿120余萬條次,新媒體總瀏覽量達(dá)114億次,點擊上億次的融媒體作品有23款,點擊千萬次以上的達(dá)180款。2021年至2022年1月3日,廣西云中心圈粉絲數(shù)合計5209萬。廣西日報傳媒集團(tuán)各新媒體平臺總閱讀數(shù)達(dá)197億次。點擊量超億次的融媒體精品達(dá)18款,超千萬次的有304款,創(chuàng)歷史新高?;ヂ?lián)網(wǎng)上60%的廣西原創(chuàng)新聞資訊出自廣西云;加強(qiáng)輿論引導(dǎo),傳遞主流價值觀。廣西云新聞客戶端常態(tài)化組織各市級縣級客戶端聯(lián)動直播,先后推出大型直播節(jié)目《壯美廣西·我們的年夜飯》《壯美廣西·我們的春晚》《2019記者節(jié)大直播“誰不說我家鄉(xiāng)好”》等,總閱讀量突破2000萬次。2019年,廣西云客戶端111個縣級分端共發(fā)稿約2.5萬條,直播386場;提升資源利用率,避免重復(fù)建設(shè)。2022年以來,廣西云新聞客戶端與全區(qū)縣級融媒體中心聯(lián)動相繼推出“八桂話防控 鄉(xiāng)音入民心”“空中課堂”“貧困縣風(fēng)采連線”“縣長帶貨”“云上對歌臺”以及“2020,我們行!14城接力贊廣西”5G+VR大型全景直播活動等,多個活動的點擊量超過1000萬,尤其是“空中課堂”的點擊量超過1億次,進(jìn)一步拓展了廣西云在地方的聯(lián)動性和影響力。目前,廣西云分端縣級客戶端的日均發(fā)稿量超過200條。
智能媒資管理系統(tǒng)的關(guān)鍵點是如何將AI智能服務(wù)與媒資管理功能相結(jié)合。傳統(tǒng)媒資脫胎于廣電行業(yè)的媒資系統(tǒng),具有非常重要的功能業(yè)務(wù)及繁冗的系統(tǒng)邏輯,且完全依賴于大量人力的投入。廣西日報傳媒集團(tuán)智能媒資管理系統(tǒng)主要分為本地化的媒資管理系統(tǒng)、本地化的OSS存儲和基于專屬云服務(wù)的智能生產(chǎn)系統(tǒng)。由于各系統(tǒng)涉及到本地化設(shè)備與云端服務(wù)、新建系統(tǒng)與已有系統(tǒng)等的交互銜接,因此該項目的重點工作不只是提供符合要求的產(chǎn)品,而且要做好系統(tǒng)間的接口對接,通過多種接口方式實現(xiàn)內(nèi)容、元數(shù)據(jù)、指令等信息的實時交互及AI能力服務(wù)調(diào)度。技術(shù)上的對接與系統(tǒng)的重塑,直接影響到用戶的使用體驗感,比如音頻的上傳與文字的轉(zhuǎn)換尚處于探索中,對各種場景的應(yīng)用,廣西日報傳媒集團(tuán)尚在邊建設(shè)邊使用邊迭代。