【摘 要】 ?在富媒體背景下,數(shù)字出版商不斷開發(fā)精品內(nèi)容,創(chuàng)新產(chǎn)品形式,優(yōu)化用戶的“多感官刺激”和“交互式體驗(yàn)”,但與此同時,其內(nèi)容審核工作也面臨嚴(yán)峻挑戰(zhàn)。將人工智能技術(shù)引進(jìn)出版行業(yè),充分發(fā)揮其深度學(xué)習(xí)、自然語言處理、語音轉(zhuǎn)寫、圖像識別等內(nèi)容審核相關(guān)技術(shù)優(yōu)勢,為數(shù)字出版作品把好質(zhì)量關(guān),推動數(shù)字出版事業(yè)轉(zhuǎn)型升級,實(shí)現(xiàn)高質(zhì)量發(fā)展。
【關(guān) ?鍵 ?詞】富媒體;數(shù)字出版;人工智能;深度學(xué)習(xí)
【作者單位】陳奎蓮,地質(zhì)出版社,富媒體數(shù)字出版內(nèi)容組織與知識服務(wù)重點(diǎn)實(shí)驗(yàn)室。
【中圖分類號】TP391.41;TP391.1 【文獻(xiàn)標(biāo)識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.10.003
“池水清不清,不僅取決于注入了多少清水,還取決于截斷了多少濁水流入,開辟了多少污水治理方式?!盵1]在“建”好新聞出版行業(yè)內(nèi)容質(zhì)量把控的同時,也要把“管”好提上日程。長期以來,內(nèi)容風(fēng)險管控都是傳媒行業(yè)實(shí)現(xiàn)可持續(xù)發(fā)展的“生命線”。在大數(shù)據(jù)、云計算、人工智能、5G蓬勃發(fā)展的時代,相對于傳統(tǒng)圖書出版行業(yè),數(shù)字出版作品的內(nèi)容把關(guān)面臨諸多挑戰(zhàn)。那么,數(shù)字出版企業(yè)如何在“牢固樹立質(zhì)量意識和精品意識”的同時,將人工智能等技術(shù)轉(zhuǎn)化為產(chǎn)業(yè)發(fā)展的內(nèi)生動力,做好內(nèi)容審核工作?這是一個值得關(guān)注和討論的問題。
一、富媒體數(shù)字出版與AI內(nèi)容審核
1.富媒體與數(shù)字出版
富媒體(Rich Media),通常來說指的是包含文本、音視頻等豐富形式和技術(shù)的信息傳播方式。相對于多媒體而言,富媒體的突出特性是交互性更強(qiáng),用戶使用過程中需要調(diào)動多重感官,產(chǎn)品體驗(yàn)更為直觀和生動。
借助5G網(wǎng)絡(luò)的逐步覆蓋和規(guī)?;逃茫幻襟w也將融合超高清視頻、VR/AR、3D動畫和互動視頻等多種內(nèi)容形態(tài)和多元技術(shù)手段,在廣告、網(wǎng)頁設(shè)計、傳媒出版等領(lǐng)域不斷創(chuàng)新業(yè)務(wù)模式,推動產(chǎn)學(xué)研一體化成果轉(zhuǎn)化。2020年初,新華網(wǎng)和中國移動咪咕公司合作建立5G富媒體實(shí)驗(yàn)室,“聚焦XR沉浸式體驗(yàn)技術(shù)應(yīng)用、互動融視頻技術(shù)產(chǎn)品、短視頻智能化生產(chǎn)技術(shù)應(yīng)用、富媒體通信產(chǎn)品及大數(shù)據(jù)精準(zhǔn)分發(fā)技術(shù)等具有前沿性和實(shí)用性的領(lǐng)域開展研究工作,打造優(yōu)質(zhì)內(nèi)容產(chǎn)品”[2]。
根據(jù)相關(guān)數(shù)據(jù)研究機(jī)構(gòu)發(fā)布的報告顯示,在2019年度,我國數(shù)字閱讀的用戶有7.4億人,同比增長了1.4%[3]。而作為國內(nèi)數(shù)字閱讀行業(yè)的“領(lǐng)頭羊”,掌閱APP憑借內(nèi)容資源優(yōu)質(zhì)、閱讀體驗(yàn)良好等產(chǎn)品優(yōu)勢,月活用戶已超出1.2億[4]。毫無疑問,我們已經(jīng)進(jìn)入一個“全民閱讀、數(shù)字閱讀”的時代,讀者所面臨的閱讀對象、閱讀介質(zhì)、閱讀環(huán)境和體驗(yàn)都發(fā)生了前所未有的改變,類似于“紙質(zhì)圖書的單純電子化”這種傳統(tǒng)的數(shù)字出版樣式已經(jīng)無法滿足讀者的個性化需求。而富媒體這種集合文字、圖片、聲音、視頻甚至沉浸式VR/AR體驗(yàn)于一身的信息傳播方式,將會助力數(shù)字出版商不斷開發(fā)精品內(nèi)容、創(chuàng)新產(chǎn)品形式,進(jìn)而提高受眾閱讀中的“多感官刺激”和“交互式體驗(yàn)”。
但與此同時,將富媒體應(yīng)用于數(shù)字出版,在5G時代來臨之后,相關(guān)出版商的內(nèi)容安全把控工作將會面臨巨大的挑戰(zhàn)。目前,國內(nèi)大多數(shù)數(shù)字出版企業(yè)仍采用傳統(tǒng)圖書的人工審核模式,富媒體數(shù)字出版逐步發(fā)展,信息和知識的體量呈現(xiàn)爆炸式增長,人工審核成本隨之攀升,審核精準(zhǔn)度也相對將大幅下滑。
2.AI與內(nèi)容審核
近年來,人工智能技術(shù)逐步成熟,實(shí)現(xiàn)了廣泛應(yīng)用和落地。早在2016年,AlphaGo戰(zhàn)勝李世石,人工智能技術(shù)逐步深入社會基礎(chǔ)領(lǐng)域;2017年,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,把人工智能提升到國家戰(zhàn)略層面,讓其成為新的產(chǎn)業(yè)發(fā)展風(fēng)口。具體在新聞出版行業(yè),除了“機(jī)器人新聞”“智能出版流程再造”等內(nèi)容生產(chǎn)環(huán)節(jié)的實(shí)踐應(yīng)用,人工智能技術(shù)對內(nèi)容審核工作也有所優(yōu)化和賦能。
AI審核模式,通常是指內(nèi)容生產(chǎn)商引入人工智能技術(shù),從事安全審核工作,針對文本、圖像、語音、視頻等各類型內(nèi)容,從多重維度識別和計算,為內(nèi)容把關(guān),確保守住底線,不碰紅線?,F(xiàn)階段,雖然數(shù)字出版企業(yè)引入AI審核模式的情況不甚理想,但諸如百度、阿里巴巴、今日頭條等互聯(lián)網(wǎng)巨擘,憑借超強(qiáng)的技術(shù)實(shí)力和商業(yè)思維,逐步在內(nèi)容審核領(lǐng)域采用“AI主導(dǎo)+人工輔助”的模式進(jìn)行風(fēng)險防控。這種內(nèi)容審核模式具有卓越的優(yōu)勢。首先,AI審核模式能夠大幅提升審核效率,解放人力;其次,依賴于行業(yè)通用模型,加之公司自身的特色數(shù)據(jù)庫,AI審核模式每天通過上億量級的數(shù)據(jù)訓(xùn)練,能夠建立一套精確度極高的計算模型,不斷優(yōu)化內(nèi)容審核質(zhì)量,降低疑似和誤判率。
二、AI在文本、音頻、圖像和視頻內(nèi)容審核中的應(yīng)用
1.文本內(nèi)容審核
文本是最廣泛存在的信息載體,對其內(nèi)容安全進(jìn)行嚴(yán)格審核具有較高的現(xiàn)實(shí)必要性,抓牢文本安全審查工作對數(shù)字出版企業(yè)等互聯(lián)網(wǎng)內(nèi)容提供商實(shí)現(xiàn)可持續(xù)和高質(zhì)量的發(fā)展,顯得尤為關(guān)鍵。
一般而言,文本內(nèi)容安全審核通過文本識別規(guī)則和語義識別規(guī)則來實(shí)現(xiàn)。
文本識別規(guī)則通常是利用關(guān)鍵字詞樣本庫實(shí)現(xiàn)對文本的過濾。在建立初期,樣本庫以北京大學(xué)“人民日報語料庫”和清華大學(xué)“現(xiàn)代漢語語料庫”為基礎(chǔ),經(jīng)過海量的訓(xùn)練,樣本庫可不斷抓取和積累文本特征數(shù)據(jù),通過智能算法和機(jī)器學(xué)習(xí),逐步建立和調(diào)試文本識別策略模型,將輸入的文本信息與關(guān)鍵字詞樣本庫進(jìn)行比對,識別出其中的不恰當(dāng)內(nèi)容。該樣本庫的建設(shè)與維護(hù),會隨人工復(fù)核報錯、網(wǎng)絡(luò)輿情預(yù)警、網(wǎng)絡(luò)內(nèi)容監(jiān)管政策等實(shí)時更新,以確保系統(tǒng)對文本審核的準(zhǔn)確率。
語義識別主要通過自然語言處理、數(shù)據(jù)挖掘、文本識別等相關(guān)技術(shù),聯(lián)系上下文內(nèi)容,結(jié)合待審核文本所處語境做相關(guān)性分析。其依據(jù)綜合設(shè)定的審核標(biāo)準(zhǔn),判定該文本是否通過智能審核系統(tǒng)的過濾,對于疑似案例移交內(nèi)容審核團(tuán)隊和專家進(jìn)行復(fù)核。例如在實(shí)務(wù)中,嗶哩嗶哩公司主要聘請專家審核委員會來協(xié)助平臺進(jìn)行內(nèi)容審核,在總編輯、審核總監(jiān)等無法準(zhǔn)確判斷視頻、直播或圖文的內(nèi)容是否符合國家有關(guān)規(guī)定時,經(jīng)總編輯室審批后,公司可以將相關(guān)問題轉(zhuǎn)交給專家審核委員會,由特聘的科研院校和司法界專業(yè)人士依據(jù)相關(guān)法律政策要求、實(shí)務(wù)經(jīng)驗(yàn),最終確定疑似內(nèi)容的判定結(jié)果,做出相應(yīng)對策。
2.音頻內(nèi)容審核
5G網(wǎng)絡(luò)逐步普及和應(yīng)用,輔之VR/AR、移動情境感知等技術(shù)加持,音視頻產(chǎn)品在內(nèi)容生產(chǎn)、產(chǎn)品形態(tài)、傳播趨勢等方面進(jìn)行了創(chuàng)新性變革,相關(guān)企業(yè)在內(nèi)容管理領(lǐng)域的業(yè)務(wù)量幾乎成指數(shù)級增長。因此,在原有審核人員和技術(shù)的基礎(chǔ)之上,繼續(xù)引進(jìn)人工智能研發(fā)自動檢測和過濾等算法和模型,對企業(yè)實(shí)現(xiàn)創(chuàng)新性發(fā)展具有重要意義。具體到數(shù)字出版領(lǐng)域,人工智能技術(shù)的“加盟”,將快速推動有聲讀物、動漫、數(shù)字音樂等音頻內(nèi)容的高效率、高質(zhì)量審核。
目前來看,對音頻內(nèi)容進(jìn)行安全審核主要是基于語音識別和文本語義分析兩種技術(shù)相結(jié)合的方法。
首先,將音頻信號轉(zhuǎn)化為文本文件或命令,利用大詞匯量連續(xù)語音識別技術(shù)完成高質(zhì)量識別。語音識別流程基本如下:音頻信號輸入之后,系統(tǒng)可對音頻進(jìn)行降噪、分割等預(yù)處理;通過時域方法、頻域方法或倒譜域方法等進(jìn)行音頻特征參數(shù)的提取;按照基于語音語料庫建立的聲學(xué)模型進(jìn)行模式匹配;再按照基于文本語料庫建立統(tǒng)計的語言模型和詞典等對音頻進(jìn)行后處理;輸出最終識別結(jié)果。
其次,在語音識別和轉(zhuǎn)寫實(shí)現(xiàn)的基礎(chǔ)上,對文本語義進(jìn)行情感分析也是完成音頻內(nèi)容審核工作的關(guān)鍵一環(huán)。整個運(yùn)作流程大概分為幾個步驟。一是利用機(jī)械式分詞法、理解式分詞法、統(tǒng)計式分詞法等完成中文分詞。計算機(jī)在詞與詞中間自動增加分隔符,使內(nèi)容發(fā)布人的原意可以被準(zhǔn)確表征出來[5]。二是對照專門/特殊領(lǐng)域的情感傾向詞匯庫,文本分類器按既定的標(biāo)準(zhǔn)和規(guī)則,對識別后的文本內(nèi)容按照各自主題進(jìn)行標(biāo)記和分類。通用型情感傾向詞匯庫的建立一般是從知網(wǎng)中選取情感色彩傾向較明顯的詞匯和部分修飾語,以此為基礎(chǔ)進(jìn)行語義相似度計算,對詞匯規(guī)模再擴(kuò)展,建立最終詞匯庫;而專門領(lǐng)域情感傾向詞典的建立則是依賴前期從特定領(lǐng)域的語料中進(jìn)行撒網(wǎng)式搜尋和海量積累,建立相關(guān)專門/特殊領(lǐng)域的詞匯庫。三是將專門/特殊領(lǐng)域的情感傾向詞匯庫和通用型的情感傾向詞匯庫相結(jié)合作為參考,對文本語義進(jìn)行情感標(biāo)記和分析,最終輸出判定結(jié)果。
在數(shù)字出版領(lǐng)域,音頻內(nèi)容審核技術(shù)將有效推動有聲讀物、錄音/錄像制品、知識服務(wù)等產(chǎn)品內(nèi)容的有效識別和過濾,節(jié)省審核成本。機(jī)器和算法為主的審核機(jī)制也將降低人工因主觀情感色彩偏差而導(dǎo)致的誤判率,將更為有力地推動數(shù)字出版產(chǎn)業(yè)轉(zhuǎn)型升級,實(shí)現(xiàn)高質(zhì)量發(fā)展。
3.圖像內(nèi)容審核
移動通信技術(shù)的日益成熟,催生了數(shù)字出版產(chǎn)業(yè)如知識服務(wù)掛圖、短視頻、VR視頻作品等新的產(chǎn)品形態(tài),圖像數(shù)據(jù)出現(xiàn)井噴式增長,內(nèi)容審核的人力、物力資源缺口巨大,純?nèi)斯ず秃唵蔚摹八惴ㄟ^濾”開始頻繁失效[6]。在人工智能浪潮下,圖像內(nèi)容審核技術(shù)如何實(shí)現(xiàn)自身與數(shù)字出版產(chǎn)業(yè)的融合與發(fā)展,是一個值得關(guān)注的問題。
在判定圖像性質(zhì)是否違規(guī)方面,除了以往普遍采用的純?nèi)斯ぁ?4×7”鑒別,還有通過匹配圖像的MD5值機(jī)器審核其合法性,利用圖像的RGB顏色值來識別膚色比例,以及借助建立模型鑒別異常動作和敏感身體部位等方法。雖然綜合以上基本能夠?qū)崿F(xiàn)常規(guī)圖像的內(nèi)容審核,但是鑒于審核效率低、技術(shù)上較易規(guī)避、誤報率高等問題,相關(guān)企業(yè)在現(xiàn)階段及時更新內(nèi)容審核技術(shù)解決方案,成為推動跨越式發(fā)展的剛需。
人工智能時代促進(jìn)了深度學(xué)習(xí)技術(shù)的探索與發(fā)展,機(jī)器通過純圖像的方法進(jìn)行內(nèi)容審核開始嶄露頭角。經(jīng)網(wǎng)易、百度、字節(jié)跳動等老牌互聯(lián)網(wǎng)企業(yè)的實(shí)踐證明,基于深度學(xué)習(xí)算法尤其是CNN模型在對不良圖像內(nèi)容進(jìn)行識別的過程中呈現(xiàn)優(yōu)異性能[7]。通過模擬人腦的神經(jīng)網(wǎng)絡(luò),經(jīng)過前期海量數(shù)據(jù)的訓(xùn)練和迭代,逐步建立起具備高層次表現(xiàn)力的識別模型,其對圖像內(nèi)容數(shù)據(jù)進(jìn)行多層次、高精確度的計算,大幅減少人工復(fù)核成本。
目前,對圖像內(nèi)容審核的技術(shù)包括但不限于圖像分類、目標(biāo)檢測、人臉識別、OCR以及圖像特征檢索等技術(shù)。具體來說,基于深度學(xué)習(xí)算法的圖像內(nèi)容審核技術(shù),首先會對圖像整體完成分類和識別,其次會對圖像中的人臉和文本分別定位和分析,之后還將對其中的物品、服飾、動作等內(nèi)容進(jìn)行定位和特征識別以完成二次校驗(yàn),最終輸出圖像的判定結(jié)果。在圖像審核流程中,經(jīng)常用到的圖像分類算法包括ResNet、DenseNet等,目標(biāo)檢測算法較為常用的是SSD、YOLO-v3等。另外,人臉識別技術(shù)在內(nèi)容審核領(lǐng)域的應(yīng)用較傳統(tǒng)人臉識別有所差異,主要針對圖像中出現(xiàn)的模糊人臉、小臉、漫畫、側(cè)臉、旋轉(zhuǎn)人臉等特殊情況,通過“在檢測模型中增加角度分支結(jié)構(gòu)和金字塔結(jié)構(gòu)等手段”[8]來解決這些識別難題。除此之外,為確保圖像內(nèi)容的審核準(zhǔn)確率,利用OCR技術(shù)對圖像中出現(xiàn)的文本單獨(dú)識別,當(dāng)遇到傾斜、倒立、仿射變換、豎排、手寫體以及其他特殊字體和排版時,實(shí)務(wù)中通常使用數(shù)據(jù)驅(qū)動取得直接的效果,并將旋轉(zhuǎn)角度增設(shè)進(jìn)識別網(wǎng)絡(luò)對文本角度完成輔助預(yù)判。該智能圖像內(nèi)容審核技術(shù)對數(shù)字出版工作者來說,除少量復(fù)雜情況,基本能夠?qū)崿F(xiàn)對專題知識庫、知識掛圖、動漫作品或視頻制品任意截圖等圖像內(nèi)容的自動化、高精準(zhǔn)識別和過濾。
4.視頻內(nèi)容審核
基于人類的“生動性偏見”和移動通信網(wǎng)絡(luò)的高速發(fā)展,短視頻、直播產(chǎn)業(yè)依然方興未艾。自2019年5G商用元年之后,長視頻和VR/AR直播等傳播業(yè)態(tài)叩響了用戶“注意力經(jīng)濟(jì)”的大門,迎來發(fā)展風(fēng)口。與此同時,海量視頻數(shù)據(jù)中不可避免地夾雜著眾多暴力、恐怖等不良主題,給計算機(jī)的內(nèi)容審核技術(shù)帶來嚴(yán)峻挑戰(zhàn)。因此,智能、自動和高效地識別視頻內(nèi)容,對引領(lǐng)健康內(nèi)容生產(chǎn)和傳播、規(guī)范行業(yè)發(fā)展秩序都具有顯著意義。
近年來,深度學(xué)習(xí)在語音識別、目標(biāo)檢測、圖像分類、特征提取方面取得了關(guān)鍵性進(jìn)展,使得基于深度神經(jīng)網(wǎng)絡(luò)識別視頻內(nèi)容成為可能。但是,“由于視頻數(shù)據(jù)的抽象性和非結(jié)構(gòu)化特征,目前深度神經(jīng)網(wǎng)絡(luò)在視頻內(nèi)容識別領(lǐng)域尚未達(dá)到其在靜態(tài)圖像相關(guān)任務(wù)上的水平”[9],因此,在現(xiàn)階段,其在數(shù)字出版領(lǐng)域的應(yīng)用大多停留在理論研究層面,具有廣闊的技術(shù)研發(fā)和應(yīng)用前景。尤其是目前5G網(wǎng)絡(luò)逐步商用,其所具有的超大帶寬、超低時延等優(yōu)勢,將完美承載計算機(jī)運(yùn)行相關(guān)視覺算法的速率要求,從技術(shù)環(huán)境層面,為數(shù)字出版領(lǐng)域如動漫短視頻、VR/AR衍生品、主題影視作品、游戲等視頻類內(nèi)容的安全審核奠定基礎(chǔ)。
一般而言,基于深度學(xué)習(xí)的視頻內(nèi)容識別主要涉及圖像物體檢測算法和視頻動作識別算法兩大類。前者是針對視頻逐幀或抽取關(guān)鍵幀的圖像,利用深度卷積神經(jīng)網(wǎng)絡(luò)等方法提取特征,實(shí)現(xiàn)對目標(biāo)的分類和識別;后者主要涉及視頻的動態(tài)特征提取,也就是說,將視頻內(nèi)容在時間維度和空間維度中呈現(xiàn)的特征進(jìn)行融合,增強(qiáng)特征的提取和表達(dá)能力,提高計算機(jī)對視頻中動作的識別質(zhì)量。視頻內(nèi)容中的信息量巨大,除視頻數(shù)據(jù)外,計算機(jī)對內(nèi)容包含的音頻數(shù)據(jù)進(jìn)行挖掘也十分必要。在語音識別和轉(zhuǎn)寫的基礎(chǔ)上,提取相應(yīng)的語義進(jìn)行情感分析,最終全面綜合音頻特征和以上圖像特征、視頻動態(tài)特征等,視頻內(nèi)容的識別精確度將會得到顯著提高。
在影視相關(guān)平臺的內(nèi)容審核實(shí)務(wù)中,對于用戶制作或上傳的視頻作品應(yīng)做以下操作。首先,人工進(jìn)行一審,主要是對視頻的標(biāo)題、簡介等文字信息設(shè)置關(guān)鍵詞高亮顯示,隨機(jī)截取視頻畫面10張左右,放大后快速判斷視頻是否違規(guī),對違規(guī)內(nèi)容進(jìn)行屏蔽并加入MD5黑名單。其次,基于一審過濾,在經(jīng)過MD5對比審核之后,后臺結(jié)合文字信息及視頻內(nèi)容進(jìn)行二次審核或秒審,甄別隱蔽違規(guī)或版權(quán)侵權(quán)內(nèi)容,并對視頻屬性進(jìn)行分類。最后,主要是根據(jù)關(guān)鍵詞、政府通知、違規(guī)樣本、企業(yè)自律數(shù)據(jù)庫等內(nèi)容進(jìn)行日監(jiān)控、定期或?qū)m椀然夭?,全方位防范確保安全,除此之外,還會對一、二審屏蔽的視頻再進(jìn)行抽樣檢查,防止誤刪。
三、結(jié)語
富媒體集合文字、圖片、聲音、視頻、VR/AR于一身,助力數(shù)字出版商不斷開發(fā)精品內(nèi)容,創(chuàng)新產(chǎn)品形式,提高受眾閱讀的“多感官刺激”和“交互式體驗(yàn)”。但與此同時,富媒體應(yīng)用于數(shù)字出版產(chǎn)業(yè),尤其是5G時代來臨之后,信息和知識的體量呈現(xiàn)爆炸式增長,相關(guān)出版商的內(nèi)容安全把關(guān)工作面臨嚴(yán)峻挑戰(zhàn)。對于內(nèi)容審核,目前國內(nèi)的數(shù)字出版商大多都延續(xù)傳統(tǒng)圖書的人工審核模式,但由于人工審核成本攀升,審核精準(zhǔn)度大幅下滑,其迫切地需要尋求新的內(nèi)容審核解決方案。
近年來,人工智能技術(shù)逐步成熟,并實(shí)現(xiàn)了廣泛應(yīng)用和落地,其對新聞出版行業(yè)的內(nèi)容審核工作也有所賦能。內(nèi)容生產(chǎn)商逐步引入人工智能技術(shù)從事專門的安全審核工作,針對文本、圖像、語音、視頻等各類型內(nèi)容,從多重維度進(jìn)行識別和計算,大幅提升審核效率,解放人力。具體來看,在文本內(nèi)容審核方面,一般通過文本識別規(guī)則和語義識別規(guī)則來實(shí)現(xiàn);在音頻內(nèi)容審核方面,主要是基于語音識別和文本語義分析兩種技術(shù)相結(jié)合的方法;在圖像內(nèi)容審核方面,相關(guān)的技術(shù)包括圖像分類、目標(biāo)檢測、人臉識別、OCR以及圖像特征檢索等;在視頻內(nèi)容審核方面,基于深度學(xué)習(xí)的視頻內(nèi)容識別,主要涉及圖像物體檢測和視頻動作識別兩種算法。
綜上所述,將人工智能技術(shù)引入出版行業(yè),充分發(fā)揮深度學(xué)習(xí)、自然語言處理、語音轉(zhuǎn)寫、圖像識別等內(nèi)容審核相關(guān)技術(shù)優(yōu)勢,為數(shù)字出版產(chǎn)品的內(nèi)容把好質(zhì)量關(guān),嚴(yán)格響應(yīng)政府關(guān)于網(wǎng)絡(luò)內(nèi)容生態(tài)治理方面的政策號召,確保守住底線,不碰紅線,推動數(shù)字出版事業(yè)轉(zhuǎn)型升級,實(shí)現(xiàn)高質(zhì)量發(fā)展。
|參考文獻(xiàn)|
[1]葉蓁蓁. 主流媒體引導(dǎo)力,可否這樣實(shí)現(xiàn)?[EB/OL]. (2018-12-21)[2020-02-28]. http://media. people. com. cn/n1/2018/1221/c423025-30480487. html .
[2]劉廈. 新華網(wǎng)·中國移動咪咕5G富媒體實(shí)驗(yàn)室揭牌[EB/OL]. (2020-01-15)[2020-02-24]. https://baijiahao. baidu. com/s?id=1655789839750676594&wfr=spider&for=pc.
[3]2019年中國數(shù)字閱讀市場研究報告發(fā)布 人均閱讀量近8本[EB/OL]. (2020-01-06)[2020-02-24]. http://www.ce. cn/xwzx/gnsz/gdxw/202001/06/t20200106_34054178. shtml.
[4]掌閱獲QuestMobile2019年度榜單數(shù)字閱讀用戶規(guī)模No. 1 [EB/OL]. (2020-01-09)[2020-02-24]. http://finance. ynet. com/2020/01/09/2317945t632. html.
[5]童帥. 三網(wǎng)融合下語音內(nèi)容情感傾向分類系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 武漢:華中科技大學(xué)碩士學(xué)位論文,2013.
[6]王宏宇. 網(wǎng)絡(luò)不良圖片識別技術(shù)研究[J]. 電腦知識與技術(shù),2018 (12):195-196+199.
[7]江英. 圖片與文本過濾技術(shù)在信息監(jiān)控中的應(yīng)用研究[D]. 南昌:南昌大學(xué)碩士學(xué)位論文,2019.
[8]網(wǎng)易易盾,深度學(xué)習(xí)圖像算法在內(nèi)容安全領(lǐng)域的應(yīng)用[EB/OL]. (2019-08-30)[2020-02-27]. https://dun. 163. com/news/p/eaedbda67e54494e90e039479d3976af.
[9]門鑫. 基于深度學(xué)習(xí)的視頻內(nèi)容識別和搜索算法研究[D]. 北京:北京郵電大學(xué)碩士學(xué)位論文,2019.