石鐵山
摘 要:近年來(lái),伴隨著圖像處理技術(shù)的飛速發(fā)展,圖像識(shí)別技術(shù)被廣泛應(yīng)用在各個(gè)領(lǐng)域中,發(fā)揮著越來(lái)越重要的作用。圖像識(shí)別技術(shù)作為一種建立在信息技術(shù)基礎(chǔ)上的技術(shù),其主要是借助計(jì)算機(jī)替代人工,快捷地處理各種物理信息。本文就人工智能中的圖像識(shí)別技術(shù)進(jìn)行簡(jiǎn)單探討。
關(guān)鍵詞:人工智能 圖像識(shí)別 技術(shù)
中圖分類(lèi)號(hào):G64 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)12(c)-0015-02
伴隨著計(jì)算機(jī)技術(shù)和微電子技術(shù)的快速發(fā)展,推動(dòng)了圖像識(shí)別技術(shù)的產(chǎn)生和發(fā)展,并逐漸成為人工智能領(lǐng)域中重要的組成部分,并廣泛地運(yùn)用于面部識(shí)別、指紋識(shí)別、醫(yī)療診斷、衛(wèi)星云圖識(shí)別等領(lǐng)域中,發(fā)揮重要作用。
1 圖像識(shí)別技術(shù)概述
1.1 圖像識(shí)別技術(shù)的含義
圖像識(shí)別技術(shù)主要指的是通過(guò)對(duì)比存儲(chǔ)的信息(存儲(chǔ)在記憶中的信息)和當(dāng)前信息(進(jìn)入感官的信息)從而識(shí)別圖像的一種技術(shù)。圖像識(shí)別技術(shù)是建立在圖像描述的基礎(chǔ)上,而描述主要指的是通過(guò)符號(hào)或者數(shù)字等對(duì)景物中或者圖像中的相關(guān)特征予以描述,甚至描述目標(biāo)相互之間的關(guān)系,從而獲得目標(biāo)特征以及相互之間關(guān)系的一種抽象表達(dá)。在應(yīng)用圖像識(shí)別技術(shù)提取圖像或者景物中的個(gè)性特征時(shí),可以借助模板匹配模型。在具體應(yīng)用實(shí)踐中,特別識(shí)別除了要弄清識(shí)別的對(duì)象具有是什么樣的物體外,還應(yīng)該明確其所在的位置和姿態(tài)。當(dāng)前圖像識(shí)別技術(shù)已經(jīng)被廣泛應(yīng)用的各個(gè)領(lǐng)域中,例如交通領(lǐng)域中的車(chē)牌號(hào)識(shí)別、交通標(biāo)志識(shí)別;軍事領(lǐng)域中的飛行物識(shí)別、地形勘察;安全領(lǐng)域中的指紋識(shí)別、人臉識(shí)別等。
1.2 圖像識(shí)別技術(shù)的原理
眾所周知,人眼才能產(chǎn)生視覺(jué)效果,可見(jiàn)人的眼睛具有很強(qiáng)的圖像識(shí)別能力。當(dāng)圖像所處的位置、角度、距離等發(fā)生改變時(shí),視覺(jué)效果也會(huì)相應(yīng)改變,在人眼視網(wǎng)膜上形成的圖像形狀和大小也會(huì)相應(yīng)改變,但是這并不會(huì)影響人們對(duì)圖像的判斷。圖像識(shí)別作為人工智能中重要的構(gòu)成部分,該技術(shù)的原理其實(shí)跟人眼識(shí)別的原理存在相似性,都是基于圖像具有明顯的特征。圖像特征作為圖像識(shí)別的重點(diǎn),以英文大寫(xiě)字母“A”為例,該字母有一個(gè)突出的尖角,O存在一個(gè)圈,而Y可以看作是有鈍角、銳角、線條共同構(gòu)成,通過(guò)捕捉和識(shí)別這些特殊信息,便可以實(shí)現(xiàn)圖像的識(shí)別。另外,客觀地判斷圖像的性質(zhì)和內(nèi)容,并對(duì)其代表的含義進(jìn)行分析。圖像識(shí)別技術(shù)更為貼切地模仿人眼識(shí)別圖像的原理,縮小該技術(shù)和人眼識(shí)別效果二者的差異,借助專(zhuān)門(mén)的計(jì)算機(jī)程序,模擬人類(lèi)對(duì)圖像的識(shí)別過(guò)程,從而獲得更多涉及圖像識(shí)別的模型。當(dāng)計(jì)算機(jī)捕捉到某個(gè)圖像時(shí),假如該圖像特征能夠匹配到人記憶中的感官刺激,便可以成功識(shí)別出該圖像[1]。
2 人工智能中圖像識(shí)別技術(shù)的過(guò)程
由于圖像識(shí)別技術(shù)的產(chǎn)生是基于人工智能的基礎(chǔ)上,所以計(jì)算機(jī)圖像識(shí)別的過(guò)程與人腦識(shí)別圖像的過(guò)程大體一致,而計(jì)算機(jī)圖像識(shí)別僅僅是通過(guò)科技和技術(shù)的形式展現(xiàn)出來(lái),歸納起來(lái),該過(guò)程主要包括4個(gè)步驟:第一,獲取信息數(shù)據(jù)。獲取信息數(shù)據(jù)是圖像識(shí)別的前提,獲取數(shù)據(jù)主要是借助各種傳感器將光、聲音等特殊信號(hào)轉(zhuǎn)變成電信號(hào),以獲得相應(yīng)的信息和數(shù)據(jù),在圖像識(shí)別技術(shù)中,獲取的信息通常為圖像的特征以及特殊數(shù)據(jù),并且保證這些數(shù)據(jù)和信息能夠用于區(qū)分不同圖形的特征,并將其存儲(chǔ)在計(jì)算機(jī)數(shù)據(jù)庫(kù)中,以便為接下來(lái)識(shí)別做準(zhǔn)備。第二,預(yù)處理信息數(shù)據(jù)。這一過(guò)程的操作主要包含對(duì)圖像去噪、變換、平滑等,主要目的是凸顯圖像的特征和重要信息。第三,抽取和選擇特征。抽取和選擇圖像的特征作為圖像識(shí)別技術(shù)中核心部分,特別是在識(shí)別這一模式下,對(duì)圖形的特殊提出了嚴(yán)格的要求,主要是因?yàn)槌槿『瓦x擇圖像特征質(zhì)量直接影響著圖像最終是否能夠被成功識(shí)別,簡(jiǎn)而言之這一過(guò)程就是提取不同圖像的特殊特征,提取不同圖形的特殊特征,選擇出能夠區(qū)分圖像的特征,然后有選擇地存儲(chǔ)這些特征,并讓計(jì)算機(jī)對(duì)這些特征進(jìn)行記憶。第四,設(shè)計(jì)分類(lèi)器并分類(lèi)決策。該步驟乃圖像識(shí)別的最后一步,設(shè)計(jì)分類(lèi)器主要指的是通過(guò)某種程度制定出一個(gè)識(shí)別規(guī)則,通過(guò)該規(guī)則能夠根據(jù)某種規(guī)律來(lái)識(shí)別圖像,從而提高圖像識(shí)別過(guò)程的辨識(shí)率,通過(guò)該規(guī)律能夠凸顯出相似的特征,從而提高圖像識(shí)別過(guò)程的辨識(shí)率,此后再通過(guò)識(shí)別特殊特征,最終實(shí)現(xiàn)對(duì)圖像的評(píng)價(jià)和確認(rèn)[2]。
3 人工智能中的圖像識(shí)別技術(shù)的常見(jiàn)形式
3.1 模式識(shí)別形式
在人工智能的圖像識(shí)別技術(shù)中,最有效的模型便是模式識(shí)別,模式識(shí)別能夠在大量數(shù)據(jù)和信息的基礎(chǔ)上識(shí)別圖像。模式識(shí)別形式是相關(guān)領(lǐng)域研究者在總結(jié)多年實(shí)踐經(jīng)驗(yàn)和對(duì)圖像識(shí)別的認(rèn)知基礎(chǔ)上,運(yùn)用計(jì)算機(jī)開(kāi)展相關(guān)計(jì)算,再應(yīng)用數(shù)學(xué)原理進(jìn)行推理,從而自動(dòng)完成識(shí)別圖像的形狀、字符、格式、曲線等各個(gè)特征,在識(shí)別的同時(shí)評(píng)價(jià)這些特征。模式識(shí)別模式主要由兩個(gè)階段構(gòu)成:一是學(xué)習(xí)階段,該階段的實(shí)質(zhì)為存儲(chǔ)過(guò)程,即提前采集并存儲(chǔ)圖像特殊的特征、信息、樣本等,在利用計(jì)算機(jī)的存儲(chǔ)記憶功能按照既定的識(shí)別規(guī)律對(duì)這些熟悉聚合信息進(jìn)行分類(lèi)和識(shí)別,最后構(gòu)成對(duì)應(yīng)的圖像識(shí)別程序。二是實(shí)現(xiàn)階段,該階段要求圖像必須跟腦中的模板完全符合,這樣才能確保識(shí)別程序的完成,站在現(xiàn)實(shí)角度分析,計(jì)算機(jī)的識(shí)別功能和人腦識(shí)別功能存在較大的差異,對(duì)計(jì)算機(jī)而言,其在識(shí)別過(guò)程中可以按照之前存儲(chǔ)的特征、信息、數(shù)據(jù)等,將其與最新獲得的圖像信息作匹配,假如按照一定的規(guī)律二者可以成功匹配,那么證實(shí)該圖像已經(jīng)被識(shí)別。值得注意的是:這種識(shí)別是有限的,因此假如某些特征非常相似,便很有可能識(shí)別錯(cuò)誤。
3.2 神經(jīng)網(wǎng)絡(luò)圖像識(shí)別形式
這種識(shí)別屬于一類(lèi)比較新型的識(shí)別形式,神經(jīng)網(wǎng)絡(luò)圖像識(shí)別形式是在傳統(tǒng)圖像識(shí)別的基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法。該形式中,神經(jīng)網(wǎng)絡(luò)屬于人工神經(jīng)網(wǎng)絡(luò)中最具代表性的類(lèi)型,但是其并不是動(dòng)物本身存在的神經(jīng)網(wǎng)絡(luò),而是人類(lèi)模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)后通過(guò)人工的形成產(chǎn)生的。在神經(jīng)網(wǎng)絡(luò)圖像識(shí)別形式中,遺傳算法和BP網(wǎng)絡(luò)二者有機(jī)融合構(gòu)成的神經(jīng)網(wǎng)絡(luò)圖像識(shí)別是最具代表性的一類(lèi),并且被廣泛應(yīng)用在各個(gè)領(lǐng)域中。運(yùn)用神經(jīng)網(wǎng)絡(luò)圖像識(shí)別形式對(duì)圖像識(shí)別時(shí),通常需要先對(duì)圖像的特征進(jìn)行提取,再將提取到的圖像所有特征映射到神經(jīng)網(wǎng)絡(luò)上,通過(guò)這種方式對(duì)圖像識(shí)別分類(lèi)。
3.3 非線性降維識(shí)別形式
對(duì)計(jì)算機(jī)圖像識(shí)別技術(shù)而言,其最大特征為異常高維,這主要體現(xiàn)于不管圖像其自身的分辨率高低,該圖形形成的數(shù)據(jù)信息大部分擁有多維性特征,如此一來(lái)便增加了計(jì)算機(jī)識(shí)別難度。如果要想提升計(jì)算機(jī)圖像識(shí)別的能力,降維是最直接也最有效的方式。降維又由兩類(lèi)構(gòu)成,一是線性降維;二是非線性降維。其中比較常見(jiàn)的線性降維方法有主成分分析(PCA)和線性奇異分析(LDA)兩類(lèi),線性降維最大優(yōu)點(diǎn)為理解,不難理解,但是線性降維是對(duì)整體的數(shù)據(jù)集合開(kāi)展處理,因此獲得的投影為最優(yōu)低維度。但是在將線性降維運(yùn)用在實(shí)踐中,發(fā)現(xiàn)運(yùn)算的過(guò)程很復(fù)雜,并且需要占據(jù)較大的空間,耗費(fèi)較長(zhǎng)的時(shí)間。非線性降維是在線性降維的基礎(chǔ)上誕生的,這種圖像識(shí)別技術(shù)屬于一類(lèi)高效的非線性特征提取方法。非線性降維識(shí)別形式能夠有效發(fā)現(xiàn)圖像的非線性機(jī)構(gòu),并且能夠在保證不破壞其基本結(jié)構(gòu)的前提下實(shí)現(xiàn)降維,從而確保了計(jì)算機(jī)圖像識(shí)別盡可能在最低的維度上運(yùn)行,極大地提升了識(shí)別的速率[3]。
4 結(jié)語(yǔ)
綜上所述,隨著科技的不斷發(fā)展和進(jìn)步,圖像識(shí)別技術(shù)作為現(xiàn)代科技發(fā)展的產(chǎn)物,受到了社會(huì)各界的廣泛關(guān)注,并且逐漸被廣泛運(yùn)用在各行各業(yè)中。本人堅(jiān)信,在未來(lái)的發(fā)展中,圖像識(shí)別技術(shù)將不斷得到推廣和普及,造福人類(lèi)。
參考文獻(xiàn)
[1] 張嘉豐.關(guān)于人工智能中圖像識(shí)別技術(shù)的研究[J].電子技術(shù)與軟件工程,2018(23):250-251.
[2] 孟廣仕.圖像識(shí)別技術(shù)在人工智能中的應(yīng)用[J].信息與電腦:理論版,2018(12):152-153.
[3] 宋炯,柏松平,燕華.基于人工智能的圖像識(shí)別技術(shù)探討[J].科技傳播,2018,10(1):106-107.