楊云 吳戀 邱南亞 羅集景 黃小朝
摘要:本文旨在基于深度學(xué)習(xí)圖像識別的技術(shù)上對網(wǎng)絡(luò)色情圖片進(jìn)行識別及過濾進(jìn)行研究與探討。在人工智能的機器學(xué)習(xí)上的一個新興的探討方向就是深度學(xué)習(xí),其技術(shù)可以實現(xiàn)在圖像中辨別出異類的目標(biāo)和對象的效果,為實現(xiàn)這種效果此技術(shù)運用了多種算法對圖像進(jìn)行必要的操作。圖像識別技術(shù)的核心在于對圖像的特征進(jìn)行提取和分類,其中圖像識別技術(shù)中最主要的技術(shù)是圖像的特征的提取,也是用來權(quán)衡一個圖像識別算法的好與壞。本文通過基于深度學(xué)習(xí)的圖像識別技術(shù)進(jìn)一步對色情圖片的識別及其過濾的模型進(jìn)行探討。
關(guān)鍵詞:深度學(xué)習(xí);圖像識別算法;模型
中圖分類號: TP311? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)21-0191-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
21世紀(jì),互聯(lián)網(wǎng)不僅可以作為人與人之間的一種通訊方式,還成了資源傳輸和共享手段,而手機作為終端處理器,不僅僅局限于通訊和發(fā)短信,人們還可以利用手機更加快捷地獲得所需要的信息,顯然互聯(lián)網(wǎng)對于人們的生活方式起到了不少的促進(jìn)作用,但互聯(lián)網(wǎng)相比傳統(tǒng)的媒體傳播介質(zhì)有所區(qū)別,互聯(lián)網(wǎng)顯得更加難以管理。這也導(dǎo)致了一些為了獲取網(wǎng)絡(luò)暴力的不法分子利用了互聯(lián)網(wǎng)的特性進(jìn)行違法犯罪。各種不良信息諸如色情圖片,色情小說等,也在互聯(lián)網(wǎng)上肆意傳輸,這給網(wǎng)絡(luò)帶來了很多不健康的信息,對網(wǎng)絡(luò)使用者造成了傷害,特別是對于未滿18歲使用者的身心健康。那么如何對這些不良的色情圖片進(jìn)行攔截就顯得至關(guān)重要了。本文將運用圖像識別技術(shù)來對網(wǎng)絡(luò)上的色情圖片進(jìn)行攔截。
1 深度學(xué)習(xí)圖像識別的發(fā)展及歷程
近幾年來,人工智能在深度學(xué)習(xí)方向上的研究有了非??捎^的突破,特別在圖像識別方面。圖像識別的研究經(jīng)過了三個階段,這三個階段分別是對字圖像和物體的識別。而這些技術(shù)原理都離不開神經(jīng)網(wǎng)絡(luò)??梢圆豢鋸埖卣f,如今出現(xiàn)類似的模型都是屬于神經(jīng)網(wǎng)絡(luò)的模型,比如著名的反向傳播算法[1],這一算法從1986年被威廉姆斯、欣頓和魯梅爾哈特在《自然》雜志上發(fā)表到現(xiàn)今都是普遍運用的。神經(jīng)網(wǎng)絡(luò)的主要發(fā)展方向有兩個方面,其一:由2012年和2014年的ImageNet競賽冠軍獲得者用到的模型來看[2],模型的層次在加深,這也意味著未來研究模型的層次會不斷加深。其二:為使識別的正確性達(dá)到最佳,模型的結(jié)構(gòu)復(fù)雜度會逐漸增加。有結(jié)果表明,為了在不同尺度上實現(xiàn)融合圖像的有效信息效果,需要并行多分辨率起始結(jié)構(gòu),才能在不同尺度上實現(xiàn)融合圖像的有效信息效果。另一方面,采用低秩分解的方法構(gòu)造了參數(shù)尺寸較大的隱層,大大減小了模型的參數(shù)尺寸??梢娚窠?jīng)網(wǎng)絡(luò)的發(fā)展對于圖像識別技術(shù)能在未來更多領(lǐng)域得到應(yīng)用起到了不可磨滅的作用。圖像識別技術(shù)在未來的生活中必將隨處可見,它的應(yīng)用前景是不可估計的。
2 基于深度學(xué)習(xí)圖像識別的模型及算法
建立在深度學(xué)習(xí)的基礎(chǔ)上,在對圖像識別方向進(jìn)行研究的過程中,許多網(wǎng)絡(luò)模型被運用到,其中就包括了遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)以及圖像處語義分割算法。下文將探討基于深度學(xué)習(xí)圖像識別的網(wǎng)絡(luò)色情圖片識別與過濾常用到的幾種網(wǎng)絡(luò)模型及算法。
2.1 卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)
卷積神經(jīng)網(wǎng)絡(luò)是由多種算法層組成的神經(jīng)網(wǎng)絡(luò),通過這些層的計算,可以實現(xiàn)海量圖像數(shù)據(jù)的降維,最終使其能夠被訓(xùn)練達(dá)到識別圖片的目的,卷積網(wǎng)絡(luò)簡單可以劃分為卷積、池化和上采樣三步來完成。對于傳送的圖片來說,要讓計算機判斷出該圖片是否是色情圖片,需要完成三個步驟,首先是卷積,需要選擇一個合適尺寸的卷積核(也可看作過濾器)來對圖片進(jìn)行卷積操作,過濾掉各個小區(qū)域,由此可以在現(xiàn)實訓(xùn)練中取到過濾掉的小區(qū)域的特征值;其次是池化(也就是下采樣),將原始圖片不斷縮小到一個很小的尺寸得到一個特征圖,不斷縮小是因為即使做了卷積圖片還是很大,所以下采樣來降低數(shù)據(jù)維度;最后是上采樣(反卷積),其和卷積相像,運算的方法都為相乘和相加,上采樣目的是為了放大還原圖片。通過這些操作來實現(xiàn)對計算機的訓(xùn)練,使之實現(xiàn)在使用網(wǎng)絡(luò)時可以自動清除掉那些色情圖片的效果和目的。
2.2 圖像語義分割算法
在對海量的圖片數(shù)據(jù)進(jìn)行處理和理解時,圖像的語義分割和自動標(biāo)注技術(shù)在工作中占據(jù)主要地位[3],為了使計算機實現(xiàn)視覺上與人類相同的目的,人們研發(fā)出了很多技術(shù)和模型,其中就有圖像語義分割算法技術(shù),此技術(shù)也成了計算機在視覺上的核心技術(shù)。語義分割過程就像PS摳圖一樣,需要盡可能地貼合每個物體的邊框,由此讓計算機對圖片完成像素級的理解,并給圖片中的各個像素點進(jìn)行標(biāo)注標(biāo)簽和分類。對于網(wǎng)絡(luò)上的發(fā)送傳播的色情圖片,需要對該圖片進(jìn)行語義分割,完成圖片的分割、標(biāo)注和理解。圖像語義分割的實現(xiàn)需要用到以下三類方法,分別為“閾值法”、像素聚類法和圖像邊緣分割法,在色情圖片的分割上,利用這些方法獲取到前后背景、圖片紋信息和邊緣信息,最終得到預(yù)期的分割結(jié)果。
3 基于深度學(xué)習(xí)的網(wǎng)絡(luò)色情圖片識別算法分析
3.1 色情圖片識別原理分析與探究
色情圖片識別是利用神經(jīng)網(wǎng)絡(luò)的模糊識別來實現(xiàn)的,就像人類可以辨別并判斷出很多顏色各異或形狀不一的圖像是什么類型的圖像一樣,這就是所謂的模糊識別。圖片的模糊識別需要對圖片的特征進(jìn)行提取和訓(xùn)練,并對圖片進(jìn)行分類處理,大概流程如圖1所示。這里主要探討的是圖像分割技術(shù)在圖片識別中的實現(xiàn)。為了提取到圖片的特征,可以對圖片顏色、形狀和紋理等進(jìn)行分割標(biāo)記。最后利用統(tǒng)計法、結(jié)構(gòu)法、神經(jīng)網(wǎng)絡(luò)發(fā)、模板匹配法和集合變換法進(jìn)行圖片識別。在這過程中也會用到BP[4]來確定權(quán)重的數(shù)值表示,隨后構(gòu)建FP[5]來確定圖片是否是色情圖片。
3.2 圖片特征提取
圖片識別過程中,對圖片的特征提取是很重要的一個步驟,為了達(dá)到提取這些特征的目的,人們研究出了很多算法和技術(shù)?;谠诰W(wǎng)絡(luò)上傳送的圖片大部分都是有明顯差異的,比如顏色,可以利用顏色直方圖的方法在海量圖片數(shù)據(jù)中進(jìn)行色情圖片和非色情圖片的比對,如圖2所示,可明顯看出圖片的差異。但是在這海量的圖片數(shù)據(jù)中還有很多圖片是顏色相近的,這就很難使計算機識別出哪些是色情圖片而非健康的圖片,因此只能從除顏色以外的特征去獲取其他的特征信息,比如形狀和紋理特征,利用卷積算法和圖像分割算法等算法來對圖片進(jìn)行特征提取和分類。
4 總結(jié)與展望
圖像識別其實就是在做視覺上的認(rèn)知,讓計算機能模擬人的思想去辨別、認(rèn)識事物。要想實現(xiàn)對圖片的識別工作其實難度不是很大,因為該技術(shù)的基本算法思想并不是很復(fù)雜,只是在實現(xiàn)信息處理上較為麻煩。提取出的特征信息有時會十分突出,有時又很個別,這便會影響機器的識別速率,然而圖像特征信息通常是用來表示圖像的信息的,這些問題都是可以解決的。因此圖像識別技術(shù)會更多并且更好的應(yīng)用在人們的生活中。有了圖像識別技術(shù)就可以解決網(wǎng)絡(luò)的發(fā)展帶來的色情信息的泛濫的問題,堵截色情圖片的發(fā)送與散播,可以給廣大網(wǎng)民朋友營造一種健康舒適的網(wǎng)絡(luò)環(huán)境,這個舉措對提高各界網(wǎng)民的綜合素質(zhì)有著不可或缺的作用,也對網(wǎng)絡(luò)能夠在未來建造出一個健康且文明的環(huán)境有著很大的意義。
參考文獻(xiàn):
[1] Rumelhart D E, Hinton G E, Williams R J. Learning internal representations by error propagation. Nature, 1986,323(99):533-536.
[2] Szegedy Christian. Going deeper with convolutions.arXiv preprint arXiv:1409.4842 (2014).
[3] 董志貴,王福林,宋慶鳳,等.基于BP神經(jīng)網(wǎng)絡(luò)的無約束優(yōu)化方法[J].統(tǒng)計與決策,2019(1):79-82.
[4] 吳福朝,張鈴.基于FP算法的神經(jīng)網(wǎng)絡(luò)綜合方法[J].小型微型計算機系統(tǒng),1998(1):69-72.
[5] 曹攀,錢軍浩,陳智,等.基于圖像分層樹的圖像語義分割方法[J].計算機應(yīng)用研究,2018,35(8):2514-2519.
【通聯(lián)編輯:唐一東】