周利紅 張軍軍 ??讕?/p>
摘? 要: 研究并設(shè)計(jì)了一個(gè)面向短視頻不良內(nèi)容的實(shí)時(shí)檢測(cè)平臺(tái)。該平臺(tái)研究的核心在于分層篩選系統(tǒng),通過基于短視頻外圍核心參數(shù)構(gòu)建的深度學(xué)習(xí)篩選模型完成海量篩選,再將檢測(cè)出的可疑不良短視頻傳遞給基于深度學(xué)習(xí)的短視頻內(nèi)容識(shí)別引擎進(jìn)行重點(diǎn)甄別,提出融合自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別、機(jī)器學(xué)習(xí)等的短視頻智能實(shí)時(shí)檢測(cè)平臺(tái)框架。
關(guān)鍵詞: 短視頻; 不良內(nèi)容; 智能檢測(cè); 分層篩選
Abstract: A platform for real-time short video bad content detecting is designed. The core of the research on the platform is a hierarchical screening system. A large-scale screening is performed through a deep learning screening model constructed based on the peripheral core parameters of short video, and the detected suspicious bad short videos are passed to the deep learning based short video content recognition engine for key screening. Thus a short video intelligent real-time detection platform framework, which incorporates natural language processing, computer vision, speech recognition, and machine learning, is put forward.
0 引言
隨著移動(dòng)互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展與普及,提供人類學(xué)習(xí)和娛樂的短視頻應(yīng)用也應(yīng)運(yùn)而生,如抖音等APP已進(jìn)入到千家萬戶[1]。與此同時(shí),網(wǎng)絡(luò)詐騙、庸俗、反動(dòng)等不良信息也隨之而來毒害廣大網(wǎng)民[2]。由于短視頻用戶網(wǎng)絡(luò)素養(yǎng)和科學(xué)認(rèn)知能力受限,尤其是青少年用戶面臨的威脅更加嚴(yán)重[3]。因此,從技術(shù)上架構(gòu)短視頻不良內(nèi)容的智能檢測(cè)平臺(tái)已迫在眉睫,利用人工智能、云計(jì)算、大數(shù)據(jù)等創(chuàng)新技術(shù),可讓短視頻網(wǎng)絡(luò)清朗起來[4,5]。
1 平臺(tái)整體框架
本平臺(tái)的總體框架如圖1所示,分步驟實(shí)現(xiàn)短視頻不良內(nèi)容的智能檢測(cè)。
首先,構(gòu)建一個(gè)統(tǒng)一的短視頻及外圍核心參數(shù)信息采集接口,將采集到的短視頻及外圍核心參數(shù)處理為統(tǒng)一格式,將海量短視頻相關(guān)數(shù)據(jù)投入到深度短視頻外圍數(shù)據(jù)智能分析引擎。
然后,通過深度短視頻外圍數(shù)據(jù)智能分析引擎中的外圍數(shù)據(jù)文本檢測(cè)子系統(tǒng)檢測(cè)外圍參數(shù)中的文本部分,結(jié)合基于短視頻外圍參數(shù)構(gòu)建的深度學(xué)習(xí)篩選模型進(jìn)行分類檢測(cè),完成海量篩查。將檢出的可疑不良視頻傳遞給深度智能短視頻檢測(cè)分析引擎。
再后,深度智能短視頻檢測(cè)分析引擎通過音頻提取識(shí)別檢測(cè)子系統(tǒng)及關(guān)鍵幀圖像檢測(cè)子系統(tǒng)分別對(duì)可疑不良短視頻提取的音頻數(shù)據(jù)及關(guān)鍵幀圖像檢測(cè),再結(jié)合深度學(xué)習(xí)模型做最終甄別確認(rèn)。
最后,將檢測(cè)所得結(jié)果做可視化展示,方便人工交互操作。前期可將判定結(jié)果交給人工做輔助判定,通過增強(qiáng)學(xué)習(xí),進(jìn)一步矯正系統(tǒng),提升正確率。
2 平臺(tái)實(shí)施方案
如圖2所示,短視頻不良內(nèi)容智能檢測(cè)平臺(tái)由數(shù)據(jù)獲取模塊、短視頻外圍數(shù)據(jù)檢測(cè)模塊、短視頻內(nèi)容檢測(cè)模塊和服務(wù)模塊構(gòu)成。
⑴ 數(shù)據(jù)獲取模塊
對(duì)采集到的各種途徑、各種形式的短視頻及外圍核心參數(shù)數(shù)據(jù)進(jìn)行統(tǒng)一預(yù)處理,格式化數(shù)據(jù),方便存儲(chǔ)及后續(xù)調(diào)用。
⑵ 數(shù)據(jù)存儲(chǔ)模塊
數(shù)據(jù)存儲(chǔ)模塊基于開源Hadoop架構(gòu),并結(jié)合Kafka Streaming實(shí)現(xiàn)針對(duì)對(duì)外服務(wù)接口的流式實(shí)時(shí)數(shù)據(jù)匹配和數(shù)據(jù)分析處理,通過針對(duì)整個(gè)系統(tǒng)的各個(gè)子系統(tǒng)之間構(gòu)建可靠的用于傳輸實(shí)時(shí)數(shù)據(jù)的管道,實(shí)現(xiàn)對(duì)流數(shù)據(jù)的分析和處理,極大提升系統(tǒng)的利用率,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)不良內(nèi)容的智能識(shí)別實(shí)時(shí)處理。
⑶ 數(shù)據(jù)可視化模塊
通過將數(shù)據(jù)與設(shè)計(jì)藝術(shù)進(jìn)行融合,提供專業(yè)、美觀、大氣的大數(shù)據(jù)可視化展示界面,有利于非技術(shù)人員對(duì)數(shù)據(jù)進(jìn)行理解,幫助專業(yè)數(shù)據(jù)分析人員快速了解數(shù)據(jù)和數(shù)據(jù)之間的關(guān)系。
⑷ 短視頻外圍數(shù)據(jù)檢測(cè)模塊
構(gòu)建短視頻外圍參數(shù)檢測(cè)分析引擎,實(shí)現(xiàn)短視頻外圍數(shù)據(jù)文本檢測(cè)子系統(tǒng)及短視頻外圍核心參數(shù)檢測(cè)子系統(tǒng),以高效完成海量數(shù)據(jù)篩選。
⑸ 短視頻內(nèi)容檢測(cè)模塊
構(gòu)建高內(nèi)聚、低耦合的深度智能內(nèi)容檢測(cè)分析引擎,實(shí)現(xiàn)音頻提取識(shí)別檢測(cè)子系統(tǒng)及關(guān)鍵幀圖像檢測(cè)子系統(tǒng),基于多模態(tài)數(shù)據(jù)融合做最終甄別確認(rèn)。每個(gè)檢測(cè)子系統(tǒng)獨(dú)立部署,并基于云服務(wù)器實(shí)現(xiàn)實(shí)時(shí)的檢測(cè)性能擴(kuò)展,以應(yīng)對(duì)突發(fā)的用戶需求提升的情況。
⑹ 服務(wù)模塊
服務(wù)模塊構(gòu)建統(tǒng)一的對(duì)外服務(wù),以Web Service接口的形式對(duì)外提供接口服務(wù),或直接輸出本地檢測(cè)客戶端,通過本地檢測(cè)客戶端中的數(shù)據(jù)進(jìn)行高速匹配形成緩沖,提升服務(wù)的實(shí)時(shí)性。
3 平臺(tái)關(guān)鍵技術(shù)
短視頻不良內(nèi)容檢測(cè)平臺(tái)關(guān)鍵技術(shù)研究路線如圖3所示,具體包括以下內(nèi)容。
⑴ 短視頻相關(guān)數(shù)據(jù)處理
短視頻相關(guān)數(shù)據(jù)處理包括短視頻外圍核心數(shù)據(jù)處理,可疑短視頻音頻提取識(shí)別和可疑短視頻關(guān)鍵幀提取識(shí)別,這些原始數(shù)據(jù)類型難以直接被用于不良內(nèi)容識(shí)別,需要對(duì)其進(jìn)行預(yù)處理。主要包括將不同格式的短視頻外圍核心數(shù)據(jù)處理為統(tǒng)一格式數(shù)據(jù);對(duì)被短視頻外圍數(shù)據(jù)檢測(cè)分析引擎標(biāo)記為可疑不良短視頻,需要通過語音識(shí)別技術(shù),將短視頻提取的音頻數(shù)據(jù)轉(zhuǎn)換為文檔數(shù)據(jù),通過關(guān)鍵幀抽取技術(shù)將短視頻數(shù)據(jù)轉(zhuǎn)化為圖像數(shù)據(jù)。
⑵ 基于深度學(xué)習(xí)的短視頻數(shù)據(jù)特征抽取
對(duì)短視頻數(shù)據(jù)進(jìn)行預(yù)處理之后,可得到文檔數(shù)據(jù)和圖像數(shù)據(jù),需要從中計(jì)算出對(duì)互聯(lián)網(wǎng)內(nèi)容具有較強(qiáng)表征能力的特征,以支持互聯(lián)網(wǎng)不良內(nèi)容識(shí)別模型的訓(xùn)練。
⑶ 基于單模態(tài)數(shù)據(jù)的短視頻不良內(nèi)容識(shí)別
對(duì)短視頻外圍核心數(shù)據(jù)及短視頻數(shù)據(jù)進(jìn)行預(yù)處理之后,得到的文檔數(shù)據(jù)和圖像數(shù)據(jù)中均有可能包含不良內(nèi)容,分別基于自然語言處理技術(shù)和計(jì)算機(jī)視覺技術(shù)對(duì)其進(jìn)行分析。
⑷ 基于多模態(tài)數(shù)據(jù)融合的互聯(lián)網(wǎng)不良內(nèi)容識(shí)別
基于短視頻內(nèi)容分析同時(shí)涉及文檔數(shù)據(jù)和圖像數(shù)據(jù)(音頻轉(zhuǎn)換得到的文檔和短視頻轉(zhuǎn)換得到的圖像)。對(duì)這些多源異構(gòu)數(shù)據(jù)進(jìn)行融合,可進(jìn)一步提高識(shí)別模型的準(zhǔn)確度。通過特征層融合方法、模型層融合方法和模型訓(xùn)練方法三個(gè)方面加以實(shí)現(xiàn)。
⑸ 大數(shù)據(jù)可視化
可視化技術(shù)是通過將數(shù)據(jù)表示為可視化圖形,并允許用戶以可交互的方式對(duì)數(shù)據(jù)進(jìn)行瀏覽和操作?;ヂ?lián)網(wǎng)原始數(shù)據(jù)(如網(wǎng)頁、視頻)可直接進(jìn)行可視化,因此主要研究空間數(shù)據(jù)、文本數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)和多維數(shù)據(jù)的可視化方法。
4 結(jié)束語
本文提出了一個(gè)面向短視頻不良內(nèi)容的智能檢測(cè)平臺(tái)框架設(shè)計(jì)方案,主要利用視頻播放日志等外圍核心數(shù)據(jù)的采集與大數(shù)據(jù)存儲(chǔ)和處理技術(shù),再融合視頻、音頻、文本等智能分析模型,實(shí)現(xiàn)面向不良內(nèi)容監(jiān)控的高效、快速、可擴(kuò)展、可視化的智能檢測(cè)模塊,為同類項(xiàng)目創(chuàng)新設(shè)計(jì)及工程實(shí)現(xiàn)提供了有價(jià)值的參考。
下一步的研究工作可針對(duì)不良內(nèi)容的語義模型,研究構(gòu)建面向短視頻不良內(nèi)容的知識(shí)圖譜,提高智能檢測(cè)模型精度,尤其可為基于社會(huì)輿情監(jiān)控的短視頻處理提供參考。
參考文獻(xiàn)(References):
[1] 劉鵬飛.短視頻與直播行業(yè)發(fā)展趨勢(shì)觀察[J].網(wǎng)絡(luò)傳播,2018.4.
[2] 武志強(qiáng).網(wǎng)絡(luò)短視頻治理工作刻不容緩[J].中國報(bào)業(yè),2019.4:20-21
[3] 雷靂.莫讓不良短視頻污染青年學(xué)生[J].人民論壇,2018.32:106-107
[4] 呂云玲,井佩光.短視頻內(nèi)容智能分析技術(shù)[J].電視技術(shù),2019.5.
[5] 鄧平,鄭鴻,羅冰峰.基于卷積神經(jīng)網(wǎng)絡(luò)的視頻大數(shù)據(jù)智能預(yù)警分析[J].四川電力技術(shù),2019.4:49-53