金立 王文 鄧磊
摘要:隨著科學技術的進步,作為新一輪產(chǎn)業(yè)變革的核心驅動力,計算機視覺技術能在催生新技術、新產(chǎn)品的同時,對傳統(tǒng)行業(yè)也賦予了較強的發(fā)展動力,引發(fā)了經(jīng)濟結構的重大變革。本文將對基于模板的目標識別、基于特征的目標識別、基于分類器的目標識別、基于運動的目標識別這幾種識別模型進行詳細介紹。
關鍵詞:人工智能;目標識別;分類器
中圖分類號:F49 ? 文獻標識碼:A ? 文章編號:1672-9129(2018)15-0154-01
Abstract: With the advancement of science and technology, as the core driving force of a new round of industrial transformation, computer vision technology can give birth to new technologies and new products, and also give strong development momentum to traditional industries, triggering economic structure. A major change. This paper will introduce the recognition models based on template-based target recognition, feature-based target recognition, classifier-based target recognition, and motion-based target recognition.
Keywords: artificial intelligence; target recognition; classifier
1 前言
機器視覺技術就是使用計算機技術來完成人的視覺作用。使用計算機模仿人類視覺系統(tǒng)的科學,讓計算機擁有類似人類的視覺系統(tǒng)。自動駕駛、智能導航機器人、產(chǎn)品質(zhì)量監(jiān)測等領域均需要通過計算機視覺技術方能實現(xiàn)。近幾年來隨著深度學習的發(fā)展,圖像分割等算法的優(yōu)化,計算機視覺技術更是得到了飛速的發(fā)展。計算機視覺技術實現(xiàn)流程大致可分為計算機圖像獲取、圖像處理、圖像處理、分類器處理這幾步。
2 目標識別發(fā)展現(xiàn)狀
目前,目標跟蹤的主要難點有復雜背景下的目標提取、目標與目標以及目標與背景之間的相互遮擋、陰影的處理、多攝像機的數(shù)據(jù)融合、目標跟蹤的實時性等。目前,世界各國都非常重視計算機視覺的發(fā)展。從數(shù)量、規(guī)模等角度來看,機器人、目標識別、自然語言處理是其中最為熱門的三個方向。
3 基于模板的目標識別
目標模板匹配有兩種方法:基于固定模板的匹配和基于變形模板的匹配。
在物體形狀相對于視覺傳感器視角不變的情況下,基于固定模板匹配的方法是非常有效的[1]?;诠潭0迤ヅ涞姆椒ㄊ怯嬎愠龉潭ǖ哪繕四0搴秃蜻x圖像區(qū)域之間的差異性,對該差異性結果閾值化之后判斷是否匹配。當需要識別的目標模式過于復雜而不能用單一模板建模時,可使用幾個相關的目標局部模板來識別目標。
變形模板(Deformable Template)匹配的目標識別方法適用于會發(fā)生變形的視覺非剛性問題,由于在大多數(shù)視頻中要識別的目標是可變形的視覺非剛性問題,因此變形模板匹配的目標識別方法廣泛應用于各種識別跟蹤任務中。變形模板是利用先驗概率分布知識建立起來的參數(shù)化集合模型,模型中的參數(shù)按照一定的優(yōu)化準則迭代運算使模板最大限度地與目標圖像相匹配,最終達到精確識別目標的目的。其處理流程為:
3.1在提取特征輪廓時,圖元模型在圖像上一定范圍內(nèi)移動,并動態(tài)地調(diào)整模型的參數(shù);
3.2當圖元模型的位置與參數(shù)達到最佳擬合時,能量函數(shù)應達到極小,此時就認為識別到了目標。
4 基于形狀特征的目標識別
最初的目標識別是提取一個或多個特征用來對感興趣的目標進行建模,然后在目標模型的基礎上進行模板匹配,這些特征可以是目標的形狀、大小、紋理和顏色等。
形狀模型利用形狀特征對目標進行描述和建模,其基本思想是:
4.1使用手工標定物體的輪廓邊界點,構成訓練集;
4.2對這些樣本的形狀進行配準,使用主成分分析的方法對配準后的形狀向量建立統(tǒng)計形狀模型;
4.3建立局部的灰度模型,得到初始形狀,根據(jù)已經(jīng)訓練完成的模型對輸入的圖像加以匹配和搜索,對參數(shù)不斷進行最優(yōu)化調(diào)整,迭代搜索出與物體最佳匹配的目標輪廓,從而識別出目標。
5 基于分類器的目標識別
基于分類器的目標識別算法,也稱作基于統(tǒng)計理論的方法,它把目標識別問題看做是圖像中背景和帶識別目標的分類問題。目前最常用的基于分類器的目標識別算法有ANN(人工神經(jīng)網(wǎng)絡)算法、AdaBoost算法、SVM(支持向量機)學習算法等。這些方法處理流程如下:
5.1獲取大量用于訓練分類器的正樣本(待檢測的目標)和負樣本(圖像背景),分別計算其特征;
5.2利用各種分類算法(ANN、AdaBoost、SVM)對正、負樣本的特征進行訓練得到分類器;
5.3根據(jù)訓練得到的分類器來判斷圖像中的檢測窗口是否包含待檢測的目標。
6 基于運動的目標識別
基于運動的目標識別算法是指從圖像序列中將運動的目標區(qū)域識別出來。通常情況下,目標分類、跟蹤和行為理解等后處理過程僅僅考慮圖像中對應的運動目標像素區(qū)域,因此運動目標的正確識別對后期處理非常重要。由于場景的動態(tài)變化,如天氣、光照、陰影及雜亂背景干擾等,使得基于運動的目標識別的精度和可靠性受場景影響大。目前常用的基于運動的目標識別方法有幀差法、光流法和背景差分法[2]。
結語:目前,計算機視覺技術發(fā)展迅速,已具備初步的產(chǎn)業(yè)規(guī)模。在未來計算機視覺技術也將應用于社會生產(chǎn)的各個地方。計算機視覺技術作為一項能引領未來的戰(zhàn)略技術,世界各國都紛紛圍繞人工智能出臺規(guī)劃和政策,加快促進人工智能的技術和產(chǎn)業(yè)發(fā)展。所以目標識別技術的研究是具有重要的理論意義與實際應用價值。
參考文獻:
[1]PAN J, HU B, ZHANG J Q. Robust and Accurate Object Tracking Under Various Types of Occlusions [J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(2): 223-36.
[2]周世威, 寇力強, 譚相錄. 基于OpenCV運動目標的檢測研究 [J]. 電腦編程技巧與維護, 2011, No.230(08): 88-9+91.