国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的臺(tái)標(biāo)檢測在網(wǎng)絡(luò)視頻審核中的應(yīng)用

2018-09-20 11:29劉琨
無線互聯(lián)科技 2018年15期
關(guān)鍵詞:深度學(xué)習(xí)

劉琨

摘要:電視臺(tái)標(biāo)檢測是網(wǎng)絡(luò)視頻審核的常用方法,但傳統(tǒng)臺(tái)標(biāo)檢測方法檢測成功率較低,文章將基于深度學(xué)習(xí)的SSD算法應(yīng)用于臺(tái)標(biāo)檢測。首先選取79類237個(gè)常見臺(tái)標(biāo)視頻作為臺(tái)標(biāo)基準(zhǔn)庫,以每秒一幀的速率對(duì)臺(tái)標(biāo)基準(zhǔn)庫進(jìn)行處理,共127 980張圖像頓,其中95 586張用于臺(tái)標(biāo)檢測模型訓(xùn)練,32 394張用于模型測試,算法每訓(xùn)練2 000次進(jìn)行模型迭代,共訓(xùn)練90 000次并選取最優(yōu)模型。經(jīng)過大量的臺(tái)標(biāo)樣本實(shí)驗(yàn)測試,準(zhǔn)確率可達(dá)98.2%,優(yōu)于權(quán)威文獻(xiàn)中經(jīng)典方法。表明該方法具有較高準(zhǔn)確率和高擴(kuò)充性。

關(guān)鍵詞:網(wǎng)絡(luò)視頻審核;臺(tái)標(biāo)檢測;深度學(xué)習(xí);SSD;高擴(kuò)充性

電視臺(tái)的臺(tái)標(biāo)是確定電視臺(tái)的臺(tái)名、節(jié)目取義的重要信息,是區(qū)分不同電視臺(tái)唯一標(biāo)志。為了聲明視頻的所有權(quán),往往會(huì)在播放的視頻中加入臺(tái)標(biāo)。隨著科技的迅猛發(fā)展,互聯(lián)網(wǎng)每天都會(huì)產(chǎn)生大量視頻,電視臺(tái)標(biāo)是視頻的特有標(biāo)識(shí),通過識(shí)別臺(tái)標(biāo)來進(jìn)行網(wǎng)絡(luò)視頻審核顯得尤其重要。因此視頻臺(tái)標(biāo)識(shí)別一直是學(xué)術(shù)界研究的熱點(diǎn)。

在臺(tái)標(biāo)的研究中,王建等采用圖像分割方法進(jìn)行臺(tái)標(biāo)識(shí)別,通過時(shí)域抽樣方法選取代表幀序列,計(jì)算梯度圖像序列,并進(jìn)行邊緣匹配;史迎春等利用空間分布直方圖和HSV空間的彩色直方圖相結(jié)合的方法對(duì)臺(tái)標(biāo)特征進(jìn)行描述,并采用知識(shí)庫輔助直方圖統(tǒng)計(jì)的方法進(jìn)行臺(tái)標(biāo)識(shí)別;金陽等提出的極坐標(biāo)角點(diǎn)對(duì)匹配方法,雖然較好地解決了半透明臺(tái)標(biāo)檢測問題并且準(zhǔn)確率有了較大提升,但算法實(shí)時(shí)性較差。

2016年李世石在與基于深度學(xué)習(xí)的AlphaGo圍棋比賽中落敗,2017年,深度學(xué)習(xí)在醫(yī)療影像處理、安防安保、金融領(lǐng)域等的應(yīng)用越來越廣泛。故本文提出將深度學(xué)習(xí)應(yīng)用到臺(tái)標(biāo)檢測這一研究熱點(diǎn)。臺(tái)標(biāo)檢測也屬于目標(biāo)檢測,當(dāng)前目標(biāo)檢測領(lǐng)域最先進(jìn)的SSD(Single Shot Detector)算法,已經(jīng)成功應(yīng)用到體育領(lǐng)域關(guān)于網(wǎng)球鷹眼機(jī)器人的改進(jìn),交通領(lǐng)域?qū)τ诩t綠燈的識(shí)別等。因此,本文提出將SSD應(yīng)用到臺(tái)標(biāo)檢測。

1 SSD算法

SSD是建立在深度學(xué)習(xí)框架caffe的基礎(chǔ)之上的?,F(xiàn)今流行的檢測方法都是先生成一些假設(shè)的邊界盒子,然后再提取特征,之后經(jīng)過一個(gè)分類器,判斷里面是什么物體。但這類方法不足以實(shí)時(shí)地進(jìn)行檢測。而SSD消除了中間的邊界盒子、像素或特征重采樣的過程,算法的核心就是預(yù)測物體以及對(duì)其類別進(jìn)行評(píng)分,同時(shí)在特征地圖上使用小的卷積核,去預(yù)測一系列邊界盒子的盒子偏移。以下為算法的詳細(xì)介紹。

1.1 SSD模型結(jié)構(gòu)

SSD是基于一個(gè)前向傳播CNN網(wǎng)絡(luò),產(chǎn)生一系列固定大?。╢ixed-size)的邊界盒子,以及每一個(gè)盒子中包含物體實(shí)例的可能性,即得分。之后,進(jìn)行一個(gè)非極大值抑制(non-maximum suppression)得到最終的預(yù)測。算法框架的最開始部分,稱作基礎(chǔ)網(wǎng)絡(luò)(base network),是用于圖像分類的標(biāo)準(zhǔn)架構(gòu)。在基礎(chǔ)網(wǎng)絡(luò)后,添加一些卷積層,這些層的大小逐漸減小,可以進(jìn)行多尺度預(yù)測。

1.2 SSD模型訓(xùn)練

1.2.1 目標(biāo)函數(shù)

1.2.2 為默認(rèn)盒子選擇尺度和縱橫比

一般來說,CNN的不同層有著不同的感受野。然而,在SSD結(jié)構(gòu)中,默認(rèn)盒子不需要和每一層的感受野相對(duì)應(yīng),特定的特征圖負(fù)責(zé)處理圖像中特定尺度的物體。在每個(gè)特征圖上,默認(rèn)盒子的尺度計(jì)算如下:

1.2.3 負(fù)樣本選取策略

經(jīng)過匹配后,很多默認(rèn)盒子是負(fù)樣本,這將導(dǎo)致正樣本、負(fù)樣本不均衡,訓(xùn)練難以收斂。因此,將負(fù)樣本根據(jù)置信度進(jìn)行排序,選取最高的幾個(gè),并且保證負(fù)正樣本的比例為3:1。

2 基于SSD的臺(tái)標(biāo)檢測

總步驟為數(shù)據(jù)選取,臺(tái)標(biāo)數(shù)據(jù)格式轉(zhuǎn)換,臺(tái)標(biāo)檢測模型訓(xùn)練,臺(tái)標(biāo)檢測模型測試?,F(xiàn)選取關(guān)鍵步驟進(jìn)行詳細(xì)介紹。

2.1 數(shù)據(jù)選取

在網(wǎng)上選取相同時(shí)間長度的79類237個(gè)視頻,抽取視頻圖像幀,對(duì)圖像幀中的臺(tái)標(biāo)進(jìn)行標(biāo)注,若圖右上角及正下方出現(xiàn)cctvl3,則一張圖像幀對(duì)應(yīng)的標(biāo)注格式即為cctv13{106, 20, 178, 20, 178, 67, 106, 67}; cctv13{369,319, 440, 319, 440, 345, 369, 345}。

2.2 臺(tái)標(biāo)格式轉(zhuǎn)換

對(duì)視頻圖像幀進(jìn)行臺(tái)標(biāo)結(jié)果標(biāo)注后,編寫程序?qū)?biāo)注結(jié)果進(jìn)行處理,將txt文本中數(shù)據(jù)按序轉(zhuǎn)換為XML格式。并編寫程序,將127 980個(gè)XML格式的文件打亂分成兩部分,其中95 586張用于模型訓(xùn)練,32 394張用于模型測試。

2.3 模型訓(xùn)練

編寫程序,將95 586個(gè)XML格式數(shù)據(jù)文檔及對(duì)應(yīng)的視頻圖像幀進(jìn)行編碼轉(zhuǎn)換為1 mdb格式,以便SSD進(jìn)行模型訓(xùn)練。

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)平臺(tái)

實(shí)驗(yàn)所用平臺(tái)設(shè)備為:操作系統(tǒng):Ubuntix 14.04;GPU:NVIDIA GTX1080Ti;驅(qū)動(dòng):CUDA 8.0,軟件為caffe(SSD)+ Pycharm Community。

3.2 實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)選取圖像幀進(jìn)行模型測試,采用的是迭代80 000次模型進(jìn)行測試。

圖1是東方衛(wèi)視(dfws)新聞的截圖,算法對(duì)所有臺(tái)標(biāo)進(jìn)行了檢測并評(píng)分。

3.3 實(shí)驗(yàn)對(duì)比

鑒于模型訓(xùn)練所需時(shí)間較長,故本文要求每訓(xùn)練2 000次,模型便進(jìn)行一次輸出,輸出到94 000代截止。對(duì)模型準(zhǔn)確率的統(tǒng)計(jì)如圖2所示。

我們發(fā)現(xiàn),模型大概迭代到80 000代基本達(dá)到收斂,準(zhǔn)確率達(dá)98.2%。

3.4 實(shí)驗(yàn)總結(jié)

本文將當(dāng)下最前沿的深度學(xué)習(xí)技術(shù)與臺(tái)標(biāo)檢測這一工程實(shí)際問題相結(jié)合,經(jīng)過實(shí)驗(yàn),明顯提高了臺(tái)標(biāo)檢測的準(zhǔn)確率。

4 結(jié)語

臺(tái)標(biāo)檢測是網(wǎng)絡(luò)視頻審核的常用方法,但一直以來,很多算法在臺(tái)標(biāo)檢測的成功率上一直表現(xiàn)不佳。本文率先提出將基于深度學(xué)習(xí)的目標(biāo)檢測算法應(yīng)用于臺(tái)標(biāo)檢測,在進(jìn)行大量實(shí)驗(yàn)后,臺(tái)標(biāo)檢測成功率有了明顯提升。此外,為了進(jìn)一步提高臺(tái)標(biāo)檢測的速度,以后會(huì)選取性能更好的GHJ進(jìn)行模型訓(xùn)練,以及擴(kuò)充樣本類別,使得可檢測的臺(tái)標(biāo)種類得到提升。

[參考文獻(xiàn)]

[1]吳月鳳,何小海,張峰.SURF算法和RANSAC算法相結(jié)合的臺(tái)標(biāo)檢測與識(shí)別[J].電視技術(shù),2014(13):191-195.

[2]王建,賀翼虎,周源華.新聞視頻靜態(tài)圖形標(biāo)識(shí)分割[J].上海交通大學(xué)學(xué)報(bào),2006(5):758-761.

[3]史迎春,周獻(xiàn)中,方鵬飛.綜合利用形狀和顏色特征的臺(tái)標(biāo)識(shí)別[J].模式識(shí)別與人工智能,2005(2):216-222.

[4]鄧曄.深度學(xué)習(xí)技術(shù)與安防行業(yè)的超融合[J].中國安防,2017(5):26-30.

[5]LIU W, ANGUELOV D, ERHAN D, et al.SSD:single shot multibox detector[C].Amsterdam:European Conference on ComputerVision, 2016:21-37.

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
搭建深度學(xué)習(xí)的三級(jí)階梯
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
構(gòu)建“單元整合、主題牽引”詩歌鑒賞“深度學(xué)習(xí)”課堂的策略
临桂县| 含山县| 盐津县| 萝北县| 汪清县| 顺平县| 涟水县| 竹北市| 建湖县| 巨鹿县| 商河县| 海晏县| 汤原县| 蓝田县| 玉龙| 大同县| 辽阳市| 霍州市| 昌邑市| 武夷山市| 达州市| 常德市| 颍上县| 余干县| 安新县| 花莲县| 额敏县| 阿勒泰市| 墨竹工卡县| 镇安县| 婺源县| 达尔| 徐州市| 惠东县| 承德市| 商河县| 广南县| 龙胜| 阿克苏市| 连南| 罗城|