胡春虹
(云上貴州大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司,貴州 貴陽 550081)
貴州省廣播電視監(jiān)測(cè)中心作為貴州省惟一的廣播電視監(jiān)測(cè)部門,主要工作職責(zé)有:承擔(dān)廣播電視信號(hào)和廣播電視安全播出、廣告、IPTV節(jié)目、網(wǎng)絡(luò)視聽節(jié)目(含網(wǎng)絡(luò)廣播電視、手機(jī)視聽節(jié)目等)工作,為廣播電視管理提供技術(shù)服務(wù)和技術(shù)支持;承擔(dān)全省自辦廣播電視節(jié)目收聽收看工作;負(fù)責(zé)廣播電視信號(hào)監(jiān)測(cè)、安全播出保障體系建設(shè)、安全播出風(fēng)險(xiǎn)評(píng)估等安全播出日常管理以及應(yīng)急指揮調(diào)度等。
根據(jù)國家對(duì)廣播電視監(jiān)測(cè)監(jiān)管的要求,貴州省廣播電視監(jiān)測(cè)中心積極響應(yīng),在運(yùn)用大量新型人工只能技術(shù)的基礎(chǔ)上建立健全“技術(shù)先進(jìn)、標(biāo)準(zhǔn)統(tǒng)一、研判專業(yè)、制度規(guī)范”的廣播電視綜合監(jiān)管平臺(tái),開展廣播電視技術(shù)質(zhì)量監(jiān)測(cè)、IPTV監(jiān)測(cè)、視聽新媒體監(jiān)管、節(jié)目內(nèi)容監(jiān)管等工作,提高監(jiān)測(cè)監(jiān)管能力和水平,實(shí)現(xiàn)可持續(xù)升級(jí)、集約高效的廣播電視與視聽新媒體全業(yè)務(wù)監(jiān)測(cè)監(jiān)管。
貴州省廣播電視監(jiān)測(cè)中心監(jiān)測(cè)業(yè)務(wù)范圍如圖1所示。
(1)廣播電視節(jié)目安播監(jiān)測(cè)。負(fù)責(zé)對(duì)全省有線電視、模擬電視、開路電視、DTMB、衛(wèi)星信號(hào)、調(diào)頻廣播等播出信號(hào)的全省覆蓋播出情況、節(jié)目質(zhì)量傳輸情況、播出停播情況進(jìn)行監(jiān)測(cè)。
(2)廣播電視節(jié)目監(jiān)聽監(jiān)看。負(fù)責(zé)對(duì)全省自辦頻道中的廣告、新聞熱點(diǎn)、敏感人物進(jìn)行監(jiān)聽監(jiān)看,同時(shí)對(duì)全省IPTV直播、點(diǎn)播節(jié)目的播出情況進(jìn)行監(jiān)測(cè)。
(3)網(wǎng)絡(luò)視聽節(jié)目監(jiān)管。完成貴州省轄區(qū)內(nèi)互聯(lián)網(wǎng)視聽內(nèi)容監(jiān)管(涉廣電相關(guān)互聯(lián)網(wǎng)輿情、微信、微博、手機(jī)APP、融媒體中心平臺(tái)內(nèi)容監(jiān)管)。
廣播電視節(jié)目的監(jiān)管責(zé)任大、任務(wù)重、要求高。根據(jù)當(dāng)下的傳播技術(shù)發(fā)展形式,傳播內(nèi)容豐富多源、泥沙俱下,開辦主體魚龍混雜、訴求不一。根據(jù)中央和總局要求,各級(jí)廣播電視監(jiān)測(cè)中心必須立足于“為宣傳服務(wù),為安全播出服務(wù),為政府管理服務(wù)”,嚴(yán)防死守在廣播電視節(jié)目內(nèi)容監(jiān)聽監(jiān)看一線,始終為國家安全、社會(huì)穩(wěn)定、文化健康、網(wǎng)絡(luò)清朗保駕護(hù)航。
一方面,近年來廣播電視節(jié)目內(nèi)容監(jiān)管面臨諸多嚴(yán)峻問題。各種形態(tài)節(jié)目源數(shù)以十億計(jì),每日新增節(jié)目量超過數(shù)萬個(gè),這個(gè)數(shù)字還在持續(xù)增長,違規(guī)有害排查對(duì)象和范圍十分龐大;二是輿情信息日益紛繁復(fù)雜、波譎云詭,輿情研判要求和難度增大;三是視聽節(jié)目服務(wù)發(fā)展迅速,自制節(jié)目等新業(yè)態(tài)不斷涌現(xiàn),監(jiān)管工作需要及時(shí)迅速跟進(jìn);四是4G、5G等技術(shù)迅猛發(fā)展,手機(jī)網(wǎng)民規(guī)模不斷壯大,移動(dòng)APP傳播視聽節(jié)目的監(jiān)管面臨更大困難;五是微信、微博、短視頻、網(wǎng)絡(luò)直播等短平快傳播手段高速普及,視聽節(jié)目傳播速度及產(chǎn)品數(shù)量呈幾何倍數(shù)增長,更加泛在化,對(duì)監(jiān)管的覆蓋面和處置時(shí)效提出更高挑戰(zhàn);六是移動(dòng)互聯(lián)網(wǎng)電視影響力日漸增加,進(jìn)一步加強(qiáng)監(jiān)管,規(guī)范傳播秩序仍困難重重。
另一方面,要做好廣播電視監(jiān)管工作必須要有強(qiáng)有力的技術(shù)支撐手段。隨著新業(yè)務(wù)、新形態(tài)、新技術(shù)不斷涌現(xiàn),各種形態(tài)視聽節(jié)目通過多源、多屏、多終端、多元網(wǎng)絡(luò)等不斷衍生,呈現(xiàn)海量、交互、融合、微領(lǐng)域、移動(dòng)化等發(fā)展趨勢(shì),音視頻技術(shù)也向著云存儲(chǔ)、云播控、云計(jì)算、大數(shù)據(jù)等方面迅猛發(fā)展,無論是傳播內(nèi)容的海量化,還是傳播渠道的多元化,抑或是傳播速度的驟升化,僅靠人工是無法解決監(jiān)測(cè)監(jiān)管難題,更何況監(jiān)管智能單位人員編制十分緊缺??傮w來說,廣播電視節(jié)目監(jiān)聽監(jiān)看業(yè)務(wù)對(duì)技術(shù)的依賴性顯得越來越強(qiáng)烈。要滿足中央和總局的監(jiān)管要求,很好地完成監(jiān)管重任,就必須緊貼實(shí)際業(yè)務(wù)需求,優(yōu)化整合技術(shù)系統(tǒng)資源、大力擴(kuò)展系統(tǒng)功能,竭力提高系統(tǒng)性能,建設(shè)功能強(qiáng)大、覆蓋全面、反應(yīng)靈敏、處置及時(shí)的廣播電視監(jiān)管技術(shù)支撐手段,切實(shí)保障視聽新媒體信息文化安全、導(dǎo)向正確、空間清朗,并為國家安全和社會(huì)穩(wěn)定作出積極貢獻(xiàn)。
貴州省廣播電視綜合監(jiān)管平臺(tái)將各類人工智能識(shí)別引擎融合匯聚,打造成識(shí)別引擎資源池,通過上層各類業(yè)務(wù)系統(tǒng)下發(fā)不同的識(shí)別任務(wù),統(tǒng)一調(diào)度資源池中的人工智能資源算力[1],從而實(shí)現(xiàn)一體化綜合運(yùn)算平臺(tái)。如圖2所示。
圖2 人工智能引擎資源池架構(gòu)圖
語音識(shí)別引擎可以實(shí)現(xiàn)對(duì)廣播電視節(jié)目中出現(xiàn)的敏感話題、敏感人物等進(jìn)行精準(zhǔn)識(shí)別,可解決以往人工盯著電視、收音機(jī)一秒一秒收聽收看的局面,大大節(jié)省了人力,更提高了工作的效率。語音識(shí)別引擎是指用機(jī)器對(duì)語言信號(hào)進(jìn)行分析,根據(jù)語音單位例如音素、音節(jié)或單詞的特征參數(shù)和語法規(guī)則,甚至包括語音之間文意的規(guī)律性加以邏輯判斷來識(shí)別語言的過程[2]。
包括漢語普通話語音轉(zhuǎn)寫、中英文簡單混合語音轉(zhuǎn)寫、略帶口音語音轉(zhuǎn)寫、變語速語音轉(zhuǎn)寫、數(shù)字識(shí)別、字母識(shí)別、專有名詞識(shí)別、話音/非話音檢測(cè)、智能斷句及智能標(biāo)點(diǎn)預(yù)測(cè)、智能詞語替換、基于深度學(xué)習(xí)架構(gòu)的聲學(xué)模型訓(xùn)練、基于NGram的大規(guī)模語言模型訓(xùn)練。
轉(zhuǎn)寫過程包括預(yù)處理、特征提取、聲學(xué)模型、語言模型、發(fā)音詞典、解碼器等幾個(gè)部分,首先將音頻信號(hào)經(jīng)過降噪等語音增強(qiáng)、切分等預(yù)處理,然后將信號(hào)由時(shí)域轉(zhuǎn)換到頻率域,由特征提取模塊取適用于聲學(xué)建模的特征向量;聲學(xué)模型對(duì)聲學(xué)和發(fā)音學(xué)知識(shí)進(jìn)行建模,輸出每條語音的聲學(xué)模型得分;語言模型用于估計(jì)某條文本語句產(chǎn)生的概率,即語言模型得分;通過解碼器將所有候選句子的聲學(xué)模型得分和語言模型得分以及發(fā)音詞典信息融合在一起,輸出綜合得分最高的句子作為最終的轉(zhuǎn)寫結(jié)果。
文本識(shí)別引擎可以實(shí)現(xiàn)對(duì)廣播電視節(jié)目中的語音轉(zhuǎn)化的文字進(jìn)行語義分析,可解決以往人工必須收聽收看完整個(gè)視頻后才可理解節(jié)目大意的局面。
文本識(shí)別引擎首先對(duì)文本內(nèi)容進(jìn)行內(nèi)容清洗與過濾,通過垃圾過濾模型濾去無效文本或文本中無效部分內(nèi)容;對(duì)文本內(nèi)容進(jìn)行敏感等內(nèi)容的識(shí)別,利用深度雙向編碼表示將文本內(nèi)容及文本類別信息嵌入至特征表示中,送給轉(zhuǎn)換器模型進(jìn)行分類;有害內(nèi)容提取,對(duì)于識(shí)別為有害的文本,進(jìn)一步利用領(lǐng)域知識(shí)庫提取出其中的有害內(nèi)容要素;規(guī)則靈活定制,可根據(jù)用戶設(shè)定的規(guī)則進(jìn)行自定義關(guān)鍵詞配置,返回指定規(guī)則的有害文本內(nèi)容的檢出結(jié)果;自然語言處理,通過語義分析構(gòu)建智能機(jī)器學(xué)習(xí)算法,高效過濾復(fù)雜變種文本,如某些代音詞。
情感分析是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程,其中情感分析還可以細(xì)分為情感極性(傾向)分析,情感程度分析,主客觀分析等。在大多應(yīng)用場(chǎng)景下,只分為兩類。例如對(duì)于“喜愛”和“厭惡”這兩個(gè)詞,就屬于不同的情感傾向。基于機(jī)器學(xué)習(xí)的情感分析方法將這個(gè)問題轉(zhuǎn)化為一個(gè)分類問題來看待,對(duì)于情感極性的判斷,將目標(biāo)情感分為正、負(fù)2類。對(duì)訓(xùn)練文本進(jìn)行人工標(biāo)標(biāo)注,然后進(jìn)行有監(jiān)督的機(jī)器學(xué)習(xí)過程。
圖像識(shí)別引擎可以實(shí)現(xiàn)對(duì)廣播電視節(jié)目中出現(xiàn)的每一幀畫面進(jìn)行分析,快速識(shí)別出目標(biāo)臺(tái)標(biāo)、字幕、人臉等元素,節(jié)省了大量的人工觀看審查量[3]。
(1)臺(tái)標(biāo)識(shí)別。臺(tái)標(biāo)識(shí)別是一種利用機(jī)器學(xué)習(xí)的方法自動(dòng)對(duì)電視臺(tái)標(biāo)進(jìn)行識(shí)別的技術(shù)??梢詫?shí)現(xiàn)對(duì)電視是否顯示臺(tái)標(biāo)、是否遮擋臺(tái)標(biāo)、是否切換臺(tái)標(biāo)等情況進(jìn)行監(jiān)測(cè)。
(2)人臉識(shí)別。完成對(duì)廣播電視節(jié)目內(nèi)容中是否存在敏感人物的人臉識(shí)別檢測(cè),引擎通過逐幀的圖像識(shí)別析,對(duì)輸入的視頻內(nèi)容進(jìn)行人臉識(shí)別的檢測(cè),并將識(shí)別后的人臉與敏感圖像樣例庫的敏感人物進(jìn)行比對(duì),快速發(fā)現(xiàn)敏感人物圖像在輸入的視頻內(nèi)中出現(xiàn)的位置,并可通過播放的功能完成對(duì)敏感人物出現(xiàn)位置的快速監(jiān)看。
視頻識(shí)別引擎可以實(shí)現(xiàn)對(duì)廣播電視節(jié)目中出現(xiàn)的每一幀畫面結(jié)合語義進(jìn)行分析,快速識(shí)別出目標(biāo)字幕、片段等元素,節(jié)省了大量的人工觀看審查量。
(1)字幕識(shí)別。通過分析識(shí)別視頻圖像中的字幕,完成視頻圖像中的字幕內(nèi)容與關(guān)鍵詞庫的比對(duì)分析,當(dāng)檢測(cè)到視頻圖像的字幕內(nèi)容中與關(guān)鍵詞庫的某個(gè)關(guān)鍵詞內(nèi)容一致時(shí),自動(dòng)進(jìn)行標(biāo)記。并可通過視頻播放功能,定位到視頻畫面中的敏感關(guān)鍵詞字幕出現(xiàn)的某一幀圖像進(jìn)行調(diào)看。
(2)新聞拆條。結(jié)合新聞節(jié)目識(shí)別、候選新聞條目切換點(diǎn)檢測(cè)、播音員鏡頭檢測(cè)、新聞條目標(biāo)題字幕檢測(cè)與識(shí)別、多模態(tài)特征融合等技術(shù)以實(shí)現(xiàn)新聞視頻的自動(dòng)條目分割。為了便于后續(xù)新聞視頻點(diǎn)播、瀏覽及檢索等服務(wù)的開展,該方案還能夠給出一種包括新聞節(jié)目名稱、新聞條目起始點(diǎn)以及新聞條目標(biāo)題的新聞視頻結(jié)構(gòu)表示。
通過以上步驟,就能獲得比較準(zhǔn)確的新聞條目切分點(diǎn),結(jié)合通過VOCR自動(dòng)識(shí)別的新聞條目標(biāo)題,就能夠自動(dòng)地得到新聞視頻的完整編目信息,方便用戶對(duì)其瀏覽、檢索,避免了大量人工標(biāo)注的工作量。
綜上所述,貴州省廣播電視監(jiān)測(cè)中心建設(shè)的廣播電視綜合監(jiān)管平臺(tái)通過應(yīng)用本文介紹的各類人工智能技術(shù)之后,解決了以往違規(guī)識(shí)別檢出率低、識(shí)別精準(zhǔn)率低、人工投入成本高、設(shè)備資源投入多的局面,大大提高了監(jiān)測(cè)中心的職能業(yè)務(wù)效率。