朱婷婷
摘要:目標(biāo)檢測是電子計算機(jī)所涉及的一個課題之一,且具有一定的挑戰(zhàn)性。本文基于深度學(xué)習(xí)的單步目標(biāo)檢器特征增強(qiáng)算法展開了討論和實驗,希望能夠有效的促進(jìn)我國電子計算機(jī)應(yīng)用技術(shù)的進(jìn)一步發(fā)展。
關(guān)鍵詞:單步目標(biāo)檢測技術(shù);特征增強(qiáng)算法;深度學(xué)習(xí)
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)06-0132-01
0 引言
眾所周知,主觀判斷是與所接受的視覺信息相互聯(lián)系的,而對于人類來說,圖像以及動態(tài)視頻能夠清晰的將信息進(jìn)行有效的表達(dá)和傳遞。因此,在新的形勢之下,對目標(biāo)檢測技術(shù)進(jìn)行更深層次的研究具有一定積極的意義,能夠促使我國進(jìn)一步有效的實現(xiàn)城市交通智能化、工業(yè)檢測智能化、航空航天智能化。在目標(biāo)檢測技術(shù)的研究基礎(chǔ)上,能夠?qū)D像進(jìn)行有效的處理,從而將出現(xiàn)在圖像動態(tài)視頻中的目標(biāo)物以最短的時間檢測出來。根據(jù)相關(guān)研究表明,在目標(biāo)檢測系統(tǒng)中,要想進(jìn)一步有效的實現(xiàn)實時性和魯棒性,是具有一定困難。對于魯棒性來說,無法對目標(biāo)人群的行為軌跡進(jìn)行有效的預(yù)判,需要將環(huán)境中的不確定因素進(jìn)行考慮;而實時性是系統(tǒng)所必須具備的基礎(chǔ)性能,鑒于該系統(tǒng)的圖像處理方法不能過于復(fù)雜,本文在傳統(tǒng)的行人特征基礎(chǔ)上,對單步目標(biāo)檢測技術(shù)展開了課題性研究。
1 單步目標(biāo)檢測器特征增強(qiáng)算法的相關(guān)概述
行人單步目標(biāo)檢測算法是電子計算機(jī)進(jìn)行視覺領(lǐng)域中的研究課題之一,為進(jìn)一步有效的實現(xiàn)該項計算,需要在原有的計算體系基礎(chǔ)上將圖像處理、模式識別、機(jī)器學(xué)習(xí)等相關(guān)專業(yè)技術(shù)進(jìn)行添加。就目前來說,進(jìn)行單步目標(biāo)檢測便是通過特征加強(qiáng)機(jī)器學(xué)習(xí)的方式來展開研究,并將機(jī)器學(xué)習(xí)的算法進(jìn)行有效的創(chuàng)新和優(yōu)化,以達(dá)到課題研究目標(biāo)。但是對于單步目標(biāo)檢測算法來說,仍舊存在許多不足和可改進(jìn)之處[1]。(1)行人外形特征無法確定,圖像中的目標(biāo)人群會因為穿著的改變而在形象上發(fā)生改變,當(dāng)目標(biāo)行人與行人之間的距離發(fā)生改變后其大小特征同樣會隨之發(fā)生改變。(2)行人所處的環(huán)境發(fā)生改變也會影響檢測算法的準(zhǔn)確性和穩(wěn)定性,一般來說,影響因素為客觀環(huán)境、自然環(huán)境等等。(3)單步目標(biāo)檢測算法一般都是應(yīng)用到視頻監(jiān)控中,這也就意味著目標(biāo)點會隨時處于動態(tài)化,需要在實際應(yīng)用過程中具有實時性。
2 單步目標(biāo)檢測器特征算法
2.1 傳統(tǒng)目標(biāo)檢測算法
目標(biāo)檢測是電子計算機(jī)進(jìn)行視覺領(lǐng)域研究的重要課題之一,也是最為基礎(chǔ)的項目,其主要研究目標(biāo)在于能夠?qū)D像或動態(tài)視頻中的目標(biāo)進(jìn)行精確的定位或分類。就傳統(tǒng)目標(biāo)檢測算法來說,在較長的一段時間段,都是以可變形組件模型算法為基礎(chǔ)算法。隨著信息技術(shù)的不斷創(chuàng)新與發(fā)展,在傳統(tǒng)目標(biāo)檢測算法基礎(chǔ)上進(jìn)行了計算法的研究和應(yīng)用,逐漸形成了更多具有優(yōu)勢的計算方法。
2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的單步檢測算法
為進(jìn)一步有效的提高現(xiàn)代化網(wǎng)絡(luò)效率,相關(guān)研究學(xué)者提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的檢測計算方法,即YOLO網(wǎng)絡(luò)。在新的網(wǎng)絡(luò)環(huán)境中,能夠以更快的速度來對所鎖定的目標(biāo)人群進(jìn)行精準(zhǔn)定位和分類。該網(wǎng)絡(luò)更進(jìn)一步在所有卷積層中加入批標(biāo)準(zhǔn)化概念,并應(yīng)用卷積網(wǎng)絡(luò)取代傳統(tǒng)意義上的全連接層,支持邊框預(yù)測功能的實現(xiàn)。除此以外,SSD網(wǎng)絡(luò)以Anchor Box為基礎(chǔ),支持多個特征層的同步性預(yù)測。同時,為進(jìn)一步有效保證單步檢測計算正確率,該項網(wǎng)絡(luò)要對損失函數(shù)進(jìn)行有效的規(guī)劃和設(shè)計,從而將極端樣本所存在的種種問題進(jìn)行及時的解決和優(yōu)化,盡可能的將其所有優(yōu)勢都展現(xiàn)出來[2]。
3 網(wǎng)絡(luò)架構(gòu)
3.1 單步目標(biāo)檢測器SSD
在卷積層基礎(chǔ)上進(jìn)行SSD網(wǎng)絡(luò)構(gòu)建。SSD網(wǎng)絡(luò)系統(tǒng)中進(jìn)行了采樣卷積層的添加,被添加的卷積層、基礎(chǔ)網(wǎng)絡(luò)層都被應(yīng)用到邊框預(yù)測中,用于確定置信度和目標(biāo)實際偏移量。所有預(yù)測出來的數(shù)值都將由兩個獨立的卷積層所產(chǎn)生,對于每一個卷積層來說在其邊框回歸上會產(chǎn)生四個數(shù)值,并產(chǎn)生不同類別的置信度,最后采用相關(guān)的計算法對所有數(shù)據(jù)進(jìn)行準(zhǔn)確的計算。
3.2 具有方向性的特征提取塊
在對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行特征提取時,常常采用的是級聯(lián)的方式來輔助網(wǎng)絡(luò)的計算與檢測,并對加深層網(wǎng)絡(luò)展開采樣活動。因此,對于這一類結(jié)構(gòu)來說,為準(zhǔn)確獲取到目標(biāo)圖片的基礎(chǔ)信息或語義信息,需要在網(wǎng)絡(luò)深度的基礎(chǔ)上進(jìn)行有效的提取,才能夠為目標(biāo)群體的信息分類提供一定的幫助。但是,隨著網(wǎng)絡(luò)深度的不斷加深,很有可能會將目標(biāo)信息所要獲取的信息弄丟,且在準(zhǔn)確性上也無法保證。但是,對于多尺度的預(yù)測來說,整個信息數(shù)據(jù)預(yù)測過程中都沒有將尺度特征進(jìn)行有效的關(guān)聯(lián)。特征層的卷積將特征提取的方式進(jìn)行了統(tǒng)一,因此,所提取到的信息及圖片特征在各個方向上不具備差異性[3]。
3.3 多尺度預(yù)測
將特征提取模塊與多尺度特征進(jìn)行有效的融合,仍然需要進(jìn)行特征圖金字塔的建立,從而有效的實現(xiàn)對于數(shù)據(jù)進(jìn)行多尺度的預(yù)測。因此,在進(jìn)行研究過程中,將特征金字塔加入到其中,并對大小不同的每層特征圖進(jìn)行多尺度預(yù)測。
3.4 網(wǎng)絡(luò)訓(xùn)練
為了構(gòu)建魯棒性強(qiáng)的模型,在數(shù)據(jù)擴(kuò)增方面,與經(jīng)典SSD的方法基本一致,通過對原始數(shù)據(jù)進(jìn)行隨機(jī)裁切、翻轉(zhuǎn)操作,來擴(kuò)充訓(xùn)練數(shù)據(jù)集。為了檢測具有不同寬高比的各類物體,本文設(shè)置了具有5種不同寬高比的默認(rèn)檢測框,與經(jīng)典SSD的一致,分別是1、2、3、1/2、1/3。實際中,以默認(rèn)檢測框為中間變量,來實現(xiàn)檢測框與預(yù)測檢測框之間的轉(zhuǎn)換。在準(zhǔn)備訓(xùn)練數(shù)據(jù)時,需要將實際檢測框與最符合的對應(yīng)起來,形成從實際檢測框與默認(rèn)檢測框的對應(yīng)[4]。
實際訓(xùn)練中我們發(fā)現(xiàn)預(yù)選框與真實框經(jīng)過匹配后產(chǎn)生的負(fù)樣本(沒有匹配到真實框的預(yù)選框)數(shù)量一般要遠(yuǎn)大于正樣本(匹配到真實框的預(yù)選框)數(shù)量,這種正負(fù)樣本不平衡會導(dǎo)致網(wǎng)絡(luò)預(yù)測值向負(fù)樣本靠近以及網(wǎng)絡(luò)難以收斂等問題。因此算法訓(xùn)練時將負(fù)樣本按照置信損失進(jìn)行排序,選擇排名靠前的負(fù)樣本作為訓(xùn)練,使得正負(fù)樣本數(shù)量平衡(一般指定正樣本和負(fù)樣本的比例達(dá)到1:3),提升網(wǎng)絡(luò)分類性能。
4 結(jié)語
綜上所述,隨著深度卷積神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展與應(yīng)用,人們對于目標(biāo)檢測算法的準(zhǔn)確率有著越來越高的要求,作為電子計算機(jī)視覺領(lǐng)域的研究課題之一目標(biāo)檢測技術(shù)面臨著巨大的挑戰(zhàn)與全新的機(jī)遇。本文提出了一種基于深度學(xué)習(xí)的單步目標(biāo)檢測器特增強(qiáng)算法,能夠在保證數(shù)據(jù)計算準(zhǔn)確率的同時保證系統(tǒng)的及時性。
參考文獻(xiàn)
[1] 寇大磊,權(quán)冀川,張仲偉.基于深度學(xué)習(xí)的目標(biāo)檢測框架進(jìn)展研究[J].計算機(jī)工程與應(yīng)用,2019(11):25-34.
[2] 路雪,劉坤,程永翔.一種深度學(xué)習(xí)的非機(jī)動車輛目標(biāo)檢測算法[J].計算機(jī)工程與應(yīng)用,2019(8):182-188+214.
[3] 師燕妮.基于深度學(xué)習(xí)目標(biāo)檢測與跟蹤技術(shù)的研究[J].電子設(shè)計工程,2019,27(6):59-63.
[4] 袁明新,張麗民,朱友帥,等.基于深度學(xué)習(xí)方法的海上艦船目標(biāo)檢測[J].艦船科學(xué)技術(shù),2019(1):111-115+124.
Feature Enhancement Algorithm of Single-step Target Detector Based on Deep Learning
ZHU Ting-ting
(Gaoxinxing Science and Technology Group Co., Ltd. , Guangzhou Guangdong? 510530)
Abstract:Target detection is one of the topics involved in computer, and it is challenging to some extent. In this paper a one-step target detector feature enhancement algorithm based on in-depth learning is discussed and experimented, hoping to effectively promote the further development of computer application technology in China.
Key words:single-step target detection technology; feature enhancement algorithm; in-depth learning