馬晨
就現(xiàn)如今的社會而言,計(jì)算機(jī)技術(shù)以及通信網(wǎng)絡(luò)的發(fā)展非常的迅速,在這種情況下,信息消費(fèi)對于人們生活所造成的影響也越來越大,其不僅能在一定程度上提高效率,在某些活動中也成了必不可少的一項(xiàng)數(shù)據(jù)支持。在網(wǎng)絡(luò)環(huán)境中所存在的數(shù)據(jù)格式也隨著技術(shù)的變化而變化,流媒體就是其中的關(guān)鍵,而本文主要對基于視頻流的圖像識別技術(shù)發(fā)展與應(yīng)用進(jìn)行了研究。
【關(guān)鍵詞】視頻流 圖像識別技術(shù) 發(fā)展與應(yīng)用
在視頻流背景下的圖像識別技術(shù),其所涉及的方面有很多,其中就包括了社會工作過程中的存儲和管理,這兩項(xiàng)工作在進(jìn)行過程中就會和數(shù)據(jù)的挖掘以及分析有著一定的聯(lián)系,將圖像識別技術(shù)應(yīng)用到其中,就能有效地實(shí)現(xiàn)儲存和管理工作,最大程度提高工作效率。在社會不斷發(fā)展背景下,圖像識別技術(shù)也得到了較大的發(fā)展,而筆者主要是對視頻流背景下的圖像識別技術(shù)發(fā)展與應(yīng)用進(jìn)行具體的分析,具體如下。
1 基于視頻流的圖像識別技術(shù)的發(fā)展
就目前的網(wǎng)絡(luò)環(huán)境來看,流數(shù)據(jù)格式屬于較為常見的一種形式,并且這一形式所涉及的范圍也越來越廣泛,不再局限于以往常規(guī)傳媒以及安全領(lǐng)域中了,也正是因?yàn)槿绱?,相關(guān)的制作工作人員再實(shí)際工作過程中,其不僅具相應(yīng)的專業(yè)知識人員,還存在不專業(yè)的人員。在這種情況下,視頻流工作過程中就一定要采用更加自動化的動作方式,以此來更好地完成相應(yīng)的工作,而圖像識別技術(shù)在其中就得到了較為廣泛的應(yīng)用。在傳媒以及安全領(lǐng)域,圖像識別技術(shù)在其中有著較大的需求,其主要是因?yàn)檫@以領(lǐng)域需要對大量數(shù)據(jù)進(jìn)行儲存以及閱讀操作,同時(shí)還需要對工業(yè)環(huán)境進(jìn)行實(shí)時(shí)的監(jiān)控,因此,在流媒體環(huán)境下圖像識別技術(shù)的應(yīng)用也越發(fā)的廣泛。就目前而言,圖像識別技術(shù)在這些領(lǐng)域中的應(yīng)用也已經(jīng)越發(fā)的成熟,流媒體其本身就是由較多的數(shù)據(jù)幀所組成的,因此,在這一領(lǐng)域中使用圖像識別技術(shù)就能更好地促進(jìn)這一領(lǐng)域的發(fā)展。如果就其應(yīng)用角度來看,我國發(fā)現(xiàn)有著較多領(lǐng)域都有著一定的需求,其具體表現(xiàn)在以下幾個(gè)方面:流格式數(shù)據(jù)的存儲與檢索、工業(yè)環(huán)境中對于數(shù)字儀表的自動讀取、安全領(lǐng)域的自動識別等方面,由此可見,基于視頻流的圖像識別技術(shù)有著較為良好的發(fā)展趨勢。
2 基于視頻流的圖像識別技術(shù)的應(yīng)用
就目前而言,有著較多的流媒體領(lǐng)域,而在這所有的領(lǐng)域中,圖像識別技術(shù)在其中的發(fā)展是非常顯著的,并且也取得了一定的成果。而圖像識別技術(shù)在不同領(lǐng)域中的應(yīng)用,其需求狀況以及圖像特征也就存在著較大的不同,所以在實(shí)際應(yīng)用過程中也就會有著不同的技術(shù)可以選擇。因此,在實(shí)際工作過程中,要想確保圖像識別技術(shù)在其中的應(yīng)用效果,就一定要按照實(shí)際情況進(jìn)行合理的選擇,這樣才能保障良好的使用效果。為了更好地保障圖像識別技術(shù)的應(yīng)用效果,筆者也對其進(jìn)行了以下的分析:
2.1 文字識別
針對流媒體數(shù)據(jù)格式中的文字識別這一方面,在實(shí)際工作過程中,其主要有三種工作方式,分別是基于邊緣、區(qū)域、紋理,其中,基于邊緣這一識別方式,其主要是在使用過程中,在圖像上尋找垂直邊緣,以此來對文字進(jìn)行檢測,在工作過程中則主要是先對圖像邊緣進(jìn)行確定,然后再采用平滑濾波或形態(tài)學(xué)膨脹方式將圖像中的文字連接成文字塊,最后再對其進(jìn)行識別,這一識別方式在使用過程中有著較為良好的使用效率,但是,在使用過程中如果圖像背景較為復(fù)雜的話,文字區(qū)域反差就會比較小,從而就會致使誤碼率偏高?;趨^(qū)域這一識別方式,其主要是在文字像素顏色較為相似的情況下展開的,這種識別方式其比較適合用在新聞視頻中的文字識別,但是,在實(shí)際使用過程中其不能對工業(yè)儀表等示值進(jìn)行有效地識別,所以在使用過程中,其應(yīng)用領(lǐng)域以及應(yīng)用效果就有著一定的局限性。而基于紋理這一識別方式,其在應(yīng)用過程中則主要是利用圖像中所存在的紋理特征進(jìn)行對比,以此來確定在一個(gè)像素點(diǎn)是否屬于文字區(qū)域,這種識別方式其在使用過程中,有著較強(qiáng)的通用性,能夠有效地對文字進(jìn)行識別,同時(shí)對于不同類型的圖像也能進(jìn)行有效地識別,就比如說對于運(yùn)動物體的識別也有著較為顯著的作用,但是,在應(yīng)用這一種識別方式的過程中,其工作量較大,所以使用效率就較為低下,同時(shí)還不能抵抗較高噪音的影響。
2.2 人臉識別
在應(yīng)用圖像識別技術(shù)的過程中,除了要對文字進(jìn)行識別之外,對于人臉的識別也是現(xiàn)如今使用較為廣泛的技術(shù)之一,而這也是圖像識別技術(shù)之一。人臉識別相對于文字識別來說,其工作過程更加的復(fù)雜,我國在這一方面也經(jīng)過了較為漫長的研究和探索,并且就目前而言也還是存在著一定的問題。就目前而言,我國在人臉識別這一領(lǐng)域中,其較為常見的方式主要是為人臉建立起對應(yīng)的面部模型用于圖像中的識別和對比,在對比之后如果匹配了就能對相應(yīng)的面部數(shù)據(jù)進(jìn)行相應(yīng)的分析,最后就能實(shí)現(xiàn)識別這一功能。
綜上,在圖像識別技術(shù)應(yīng)用過程中,其無論是文字識別還是人臉識別,其在實(shí)際操作過程中都需要具備相應(yīng)的軟件以及硬件的支持,這樣才能將圖像識別技術(shù)合理的應(yīng)用到其中。除此之外,在實(shí)際應(yīng)用過程中,系統(tǒng)本身學(xué)習(xí)能力也是其中一個(gè)較為重要的技術(shù)因素,就比如說,在對視頻流字幕進(jìn)行定位處理的過程中,在同一個(gè)場景之內(nèi),其字幕也會存在不同的問題,就像是其色彩以及大小等方面都會產(chǎn)生變化,因此,在使用圖像識別技術(shù)的過程中,一定要實(shí)現(xiàn)系統(tǒng)主動學(xué)習(xí)這一功能,這樣在應(yīng)用過程中才會更加的有效。除此之外,在實(shí)際使用過程中,針對于人工智能這一方面,相關(guān)人員也可以加大研究,這樣也能夠?qū)D像識別技術(shù)的價(jià)值真正發(fā)揮出來。
3 結(jié)語
綜上所述,本文主要對基于視頻流的圖像識別技術(shù)發(fā)展以及應(yīng)用進(jìn)行了具體的分析,一起能夠更好地將圖像識別技術(shù)的作用以及價(jià)值發(fā)揮出來,更好地促進(jìn)該技術(shù)的發(fā)展。
參考文獻(xiàn)
[1]呂東澤.基于視頻流的圖像識別技術(shù)發(fā)展與應(yīng)用[J].新媒體研究,2016,2(04):98-100.
[2]高考.基于視頻流的人臉檢測識別系統(tǒng)研究[D].西安科技大學(xué),2015,15(14):58-60.
[3]孔強(qiáng)強(qiáng).基于視頻圖像處理的交通流量檢測技術(shù)研究[D].太原科技大學(xué),2012,96(04):85-86.
作者簡介
馬晨(1987-),女,陜西省府谷縣人?,F(xiàn)供職于西安航空學(xué)院。研究方向通信與信息系統(tǒng)專業(yè)。
作者單位
西安航空學(xué)院 陜西省西安市 710000