商 睿
圖像識別技術(shù)是將所需物體進(jìn)行有效信息采集,并依據(jù)所采集信息,在數(shù)據(jù)庫里進(jìn)行關(guān)鍵信息檢索,從而將所需物體歸類到不同種類的圖像處理信息技術(shù)。其本質(zhì)是將物體這一個體范圍投影到類別范圍。這種技術(shù)主要是對圖像所體現(xiàn)的信息進(jìn)行識別。圖像識別技術(shù)的發(fā)展主要經(jīng)歷了文本信息提取識別,分割圖像信息識別,三維物體信息識別3個階段。圖像識別系統(tǒng)主要由劃分圖像,提取圖像有效信息,檢索關(guān)鍵信息并以此分類將個體投影到類別這三大部分組成,是目前世界上較為先進(jìn)的識別技術(shù)[1]。
圖像識別技術(shù)的原理是基于人們對事物的認(rèn)知過程。當(dāng)人們看到一個陌生的事物時,會在潛意識里在自己的大腦存儲庫里搜尋這種事物的關(guān)鍵詞。圖像識別技術(shù)亦是如此,它是先掃描面前的物體,通過圖像分割等步驟及方法,提取出有效信息并根據(jù)有效信息進(jìn)行檢索得出物體種類后歸類。只不過圖像處理技術(shù)搜尋的關(guān)鍵是在于事物的特征是否明顯,若特征明顯,那么搜尋的效率就高,反之特征不明顯或者模糊不清,那么搜尋的效率就低。
圖像識別技術(shù)的發(fā)展主要經(jīng)歷了文本信息提取識別,分割圖像信息識別,三維物體信息識別三個階段。文字識別興起于1950 年,主要是識別字母數(shù)字符號為基礎(chǔ)的印刷文明。隨著時代的發(fā)展,圖像識別技術(shù)開始識別手寫文字,且應(yīng)用廣泛在許多專業(yè)設(shè)備中都有其身影。數(shù)字圖像識別技術(shù)于19世紀(jì)60 年代中期興起,其具體出現(xiàn)的時間有待考證。這種識別技術(shù)主要是對二維世界的信息提取與檢索分類,是在圖像識別技術(shù)發(fā)展中,應(yīng)用較為廣泛的識別技術(shù)。在人類社會發(fā)展中起了非常重要的作用。這種技術(shù)除了感知與認(rèn)識的作用外,還有著易于儲存運(yùn)輸處理方便等巨大優(yōu)勢,極大滿足了人們對于圖像信息提取處理的認(rèn)識傳播的需求。以上兩種均是針對于二維世界,而近代興起的物體識別則是針對于三維世界,但物體識別也是在數(shù)字圖像識別的基礎(chǔ)上興起的,它通過對物體本身及環(huán)境的感知達(dá)到識別的目的。物體識別屬于高級計(jì)算機(jī)視覺領(lǐng)域,對我們生活產(chǎn)生著不可替代的意義。
圖像識別分兩大步,第一步是對圖像進(jìn)行分割。對于圖像的分割,就目前來看有著3 種基本方法。第一種是依據(jù)圖像的閾值不同進(jìn)行分割。這是較為常用的一種方法。這種方法本質(zhì)上是基于不同目標(biāo)的灰度值來選取信息,具有用時短效率高的巨大優(yōu)勢。但是這種分割的局限性也很大,如不易區(qū)分閾值從而造成提取出大量無效或具有干擾性信息。第二種方法是依據(jù)區(qū)域不同來進(jìn)行圖像分割。分割有兩種基本形式,一種是區(qū)域生長,一種是分裂合并。與其他方法不同的是,這種方法可以有效避免因無法區(qū)分閾值而提取出大量無效信息的問題,并且這種方法注意到了維護(hù)空間的連接性。因此,具有很強(qiáng)的魯棒性。第三種方法是通過檢測圖像像素的灰度值,并識別這些像素灰度值的差異,從而探測到圖像的邊緣地區(qū)來進(jìn)行分割的方法。這種方法的科學(xué)技術(shù)含量較高,且需要按一定策略,將檢測所得邊緣點(diǎn)鏈接形成輪廓,構(gòu)成所需圖像分割領(lǐng)域。第二步是進(jìn)行圖像的匹配。在圖像匹配這一步中,現(xiàn)在最為常用的方法是細(xì)節(jié)匹配。這一步相較于上一步更為復(fù)雜,需要將一定信息數(shù)據(jù)帶入公式,再依據(jù)公式檢測出細(xì)節(jié)是否匹配[2]。
航空與衛(wèi)星遙感技術(shù)是當(dāng)今圖像識別技術(shù)應(yīng)用較多的領(lǐng)域。其主要分為兩個方面,一是攝影,二是圖像識別,其中圖像識別又分為光學(xué)機(jī)器掃描(紅外探測系統(tǒng))和多光譜遙感技術(shù)。紅外探測系統(tǒng)是依據(jù)地物發(fā)射的熱輻射溫度的差異,將紅外輻射能量以亮度表示的一種圖像化系統(tǒng)。多光譜遙感技術(shù)則是一種特殊的技術(shù)。在地物的輻射中,一般來說產(chǎn)生的是較寬的、連續(xù)的電磁波,在這樣的電磁波里難以直接獲取信息。而如果把這種電磁波分割成許多個比較瞎站的光譜段,就可以獲得一些有效信息。這種以攝影或掃描的方式,在同一時間獲得同一目標(biāo)的、來自不同光短信息的技術(shù)就是多光譜遙感技術(shù)。這種技術(shù)在當(dāng)下研究航空衛(wèi)星圖像時是一種非常重要的內(nèi)容,也是圖像識別技術(shù)的重大應(yīng)用[2]。
人臉識別技術(shù)是圖像識別技術(shù)在生物信息提取識別方面的一種最為廣泛、最為主要的應(yīng)用。人臉識別是近年來各領(lǐng)域研究的熱點(diǎn)問題。這是一種依據(jù)捕捉人眼鼻嘴的參數(shù)比例,在數(shù)據(jù)庫進(jìn)行搜索識別技術(shù)[3]。但是這種技術(shù)也存在著一種缺陷,當(dāng)外部環(huán)境或者人表情姿態(tài)發(fā)生變化是人臉識別的性能就會將下降,因此在人臉識別技術(shù)上,很多研究者對光照及姿態(tài)變化進(jìn)行了專門的研究,找到了多種解決的方法,如針對于光照變化的構(gòu)建圖像模型,針對于姿態(tài)變化的線形對象類思想,當(dāng)然也有同時針對光照和姿態(tài)變化的三維建模思想,這些方法思想在近幾年均有了較大的進(jìn)展[4],但在實(shí)際應(yīng)用方面還存在著較大的挑戰(zhàn)。
在農(nóng)業(yè)生產(chǎn)方面,圖像識別技術(shù)主要應(yīng)用于識別不同的植物,如花伴侶App[5]。花伴侶App 是一種面向大眾新型知識服務(wù)App,它是基于中國植物圖像庫,將里面的植物按照所屬群科分類。人們只需要拍張照,就能知道這個植物是什么種類,是什么科的。方便了人們的生活,對于擴(kuò)大人們對植物的認(rèn)識有著非常重要的意義。
圖像識別技術(shù)在交通方面應(yīng)用較為寬泛,如汽車標(biāo)志定位技術(shù),用于定位車標(biāo),在現(xiàn)實(shí)生活中具有重要意義。車標(biāo)識別技術(shù)的原理并不復(fù)雜,利用攝像頭等攝影工具,把車標(biāo)拍照后上傳到數(shù)據(jù)庫,再通過數(shù)據(jù)庫進(jìn)行關(guān)鍵信息的檢索,即可得到我們所需要的信息。但是由于車標(biāo)識別技術(shù)中的定位并不準(zhǔn)確,因此帶來識別中車標(biāo)大小尺寸的差異,所以如何減小這種差異也成為研究智能圖像識別技術(shù)的熱點(diǎn)。除此之外,圖像識別技術(shù)在維護(hù)交通安全方面有著重要的作用,交警可以將監(jiān)控信息上傳,通過人臉識別,在信息庫中搜索相近的信息得出相似度最高的人員,從而協(xié)助交警抓住肇事逃逸人。因此圖像識別技術(shù)對交通安全的維護(hù)有著一定促進(jìn)作用。
圖像識別技術(shù)在軍事上有著重要的應(yīng)用,對軍事化的發(fā)展起到一定的促進(jìn)作用。如在軍事演習(xí)中所使用的遙感技術(shù),對地面物體的信息提取分析將所得主要信息呈現(xiàn)在所需人的屏幕上。除此之外,圖像識別技術(shù)還有利于軍事勘察,并且對于軍事勘察有著不可替代的作用。
機(jī)器視覺也可運(yùn)用于對貨架中的商品進(jìn)行識別。這一工作的原理是:先讓機(jī)器分析與識別大量的圖片,同時糾正機(jī)器判斷出錯的數(shù)據(jù),同時使用神經(jīng)網(wǎng)絡(luò)的算法反復(fù)學(xué)習(xí)。在這樣過程之后,計(jì)算機(jī)就獲得了具有簡單的識物功能。在此基礎(chǔ)上,繼續(xù)對機(jī)器進(jìn)行訓(xùn)練,使其可以認(rèn)識貨架上商品的包裝,是瓶裝還是袋裝亦或其他類型,甚至是什么品牌、口味與規(guī)格。這樣的機(jī)器可以準(zhǔn)確識別成千上萬種商品,大大提高無人超市的管理等工作的效率。
圖像識別技術(shù)在當(dāng)今世界中起著不可替代的作用,它的應(yīng)用范圍大到軍事航空,小到日常生活,在現(xiàn)實(shí)產(chǎn)生著重要意義,極大的方便了人們的生活,并且協(xié)助人們維護(hù)社會日常準(zhǔn)則。但是圖像識別技術(shù)在當(dāng)下并不完善,它還存在著許多未知領(lǐng)域和技術(shù)難題等待著我們的探索和完善,除此之外,圖像識別技術(shù)也并不是人們所想象中的那樣,它對人類同樣存在著一些威脅,只不過尚未表現(xiàn)出來。因此,針對圖像識別技術(shù),我們在積極開發(fā)它的同時,也要注意合理運(yùn)用。