王鵬
摘要:針對人工智能的高速發(fā)展,充分優(yōu)化模式識別技術(shù)中算法,能夠達(dá)到較高的準(zhǔn)確率和高效率。本論文分析了模式識別中的圖形的變化和圖像壓縮處理算法。闡述人工智能中自相關(guān)算法。
關(guān)鍵詞:模式識別;自相關(guān)算法;圖像壓縮
模式識別是人類的一項基本能力,人們在日常生活中經(jīng)常做“模式識別”行為。模式是對對象的描述。而識別就是將一個對象分類到一個模式類中。因此,模式識別是一門涉及度量的描述或分類(識別)的科學(xué)。基本上,模式識別是對一組過程或事件的區(qū)分或分類。要分類的事件集可以是一組物理對象或一組心理狀態(tài)。
自動模式識別所涉及的過程包括從真實和模擬環(huán)境收集的數(shù)據(jù)中提取、識別、分類和描述模式。這些數(shù)據(jù)的實際例子包括波形、圖像、社會和經(jīng)濟系統(tǒng)產(chǎn)生的數(shù)據(jù)、動植物的測量、物理和心理學(xué)實驗的數(shù)據(jù)以及人口普查數(shù)據(jù)等等。在實踐中,模式識別是研究識別數(shù)據(jù)中模式的系統(tǒng)的操作和設(shè)計的研究領(lǐng)域。它包括判別分析、特征提取、錯誤估計、聚類分析(統(tǒng)計模式識別)、語法推理和句法分析(句法模式識別)等子學(xué)科。重要的應(yīng)用領(lǐng)域是圖像分析、字符識別、語音分析、人機診斷、人員識別和工業(yè)檢測等。
在圖像處理技術(shù)方面,模式識別和圖像之間的這種聯(lián)系導(dǎo)致了與數(shù)字圖像處理,也就是使用計算機對圖像的一般操作上有很大的重疊。圖像處理技術(shù)是本研究的另一項核心技術(shù)。例如,當(dāng)我使用相機為管道流剪切圖片作為基礎(chǔ)數(shù)據(jù)收集時,我應(yīng)該做的是對這些圖片進(jìn)行預(yù)處理。因此,這是一個重要的步驟。下面,我將介紹圖像形成、圖像預(yù)處理和分類圖像壓縮JPEG壓縮理論。
根據(jù)不同的應(yīng)用領(lǐng)域,存在一些常見的圖像格式:RGB、GIF、JPEG、JPEG2000和PSD格式。
■ RGB:理論上有256*256*256種顏色。像素是RGB圖像中的最小單
位。R、 G,B是圖像的紅、綠、藍(lán)的值。RGB圖像,有時稱為真彩色圖像,在MATLAB中存儲為m×n×3的數(shù)據(jù)數(shù)組,該數(shù)組定義每個像素的紅色、綠色和藍(lán)色分量。RGB圖像不使用調(diào)色板。每個像素的顏色由存儲在像素位置的每個顏色平面中的紅色、綠色和藍(lán)色強度的組合來確定。圖形文件格式將RGB圖像存儲為24位圖像,其中紅色、綠色和藍(lán)色分量各為8位。這將產(chǎn)生1600萬種顏色。真實圖像復(fù)制的精確性導(dǎo)致了常用術(shù)語“真彩色圖像”。RGB數(shù)組可以是類,或。在類的RGB數(shù)組中,每個顏色分量的值介于0和1之間。顏色分量為(0,0,0)的像素顯示為黑色,顏色分量為(1,1,1)的像素顯示為白色。每個像素的三個顏色分量沿數(shù)據(jù)數(shù)組的第三維存儲。例如,像素(10,5)的紅色、綠色和藍(lán)色分量分別存儲在和中。雙重的uint8公司uint16公司雙重的RGB(10,5,1)RGB(10,5,2)RGB(10,5,3)
■ GIF:圖形交換格式:壓縮率高,占用磁盤空間小。GIF由CompuServe開發(fā),用于在線顯示圖像(1987年,在使用JPG和24位顏色之前,用于8位視頻板)。GIF使用索引顏色,僅限于256色調(diào)色板(下一頁)。GIF對于舊的8位256色視頻板來說是一個很好的匹配,但是對于今天的24位照片圖像來說,它是不合適的。GIF文件不存儲圖像的縮放分辨率ppi值,因此每次打印時都需要縮放。這對于屏幕或網(wǎng)絡(luò)圖像來說并不重要。GIF文件格式是為CompuServe屏幕設(shè)計的,屏幕不會出于任何目的使用ppi。實際上,它在網(wǎng)頁中被廣泛使用。GIF的缺點是不能加載256色以上的圖像。
■ JPEG:JPEG是由聯(lián)合攝影專家組[14]開發(fā)的圖像壓縮標(biāo)準(zhǔn)。JPEG是彩色圖像的有損壓縮技術(shù)。雖然它可以將文件大小減少到正常大小的5%,但在壓縮過程中會丟失一些細(xì)節(jié)。例如,1.37 MB的BMP文件可以壓縮為20.3 KB。但是,壓縮后的圖像無法恢復(fù)。更多詳情見第1.2.3節(jié)。
■ JPEG2000:JPEG2000是一種新的圖像編碼標(biāo)準(zhǔn),它為許多高端和新興的圖像應(yīng)用程序提供了至關(guān)重要的功能集。JPEG2000提供高壓縮,圖像質(zhì)量優(yōu)于所有現(xiàn)有的標(biāo)準(zhǔn)編碼技術(shù)。JPEG2000壓縮圖像可以以最適合的分辨率發(fā)送到設(shè)備,而無需額外的存儲開銷。在傳統(tǒng)的JPEG壓縮過程中經(jīng)常出現(xiàn)的鋸齒狀和塊狀像素化(由于圖片被分成塊)已經(jīng)消失了。JPEG2000基于最先進(jìn)的小波壓縮技術(shù)。它的壓縮比比JPEG高30%。JPEG2000支持有損壓縮和無損壓縮。
■ PSD:這是原生的Photoshop文件格式,可以在Elements或Photoshop中打開。Photoshop文件不會被壓縮并保留Photoshop的所有功能。結(jié)構(gòu):PSD被組織成5個主要的數(shù)據(jù)段:頭段、3個信息塊和位圖數(shù)據(jù)。短標(biāo)頭始終包含8PPS的“簽名”,以及以下字段:位圖的寬度、高度和位深度。信息數(shù)據(jù)的第一塊稱為“顏色模式數(shù)據(jù)塊”。它以塊的長度值開頭。如果圖像有調(diào)色板,則它位于此處;下一個塊稱為“圖像資源塊”。與前一個塊一樣,它首先給出塊的長度。
模式識別中的圖像自相關(guān)算法是一種重要的公式,該算法研究了自相關(guān)在模板匹配中的應(yīng)用,可以識別出兩幅圖像是否相同。因此,自相關(guān)是一種非常有效的圖像匹配方法。它對噪聲具有很強的糾錯性,并且可以規(guī)范化以允許模式匹配獨立于圖像。自相關(guān)算法的程序代碼是基于公式實現(xiàn)的。
在數(shù)字信號處理理論中,相關(guān)是研究兩個信號相似性的量化技術(shù)。兩個信號之間的相關(guān)性是一種標(biāo)準(zhǔn)的特征檢測方法,也是更復(fù)雜的一個組成部分技術(shù)。信號處理的教科書相關(guān)的介紹描述了卷積定理以及使用快速傅立葉在頻域中有效計算相關(guān)的可能性轉(zhuǎn)換。交叉性和自相關(guān)性是估計兩個序列相關(guān)程度的標(biāo)準(zhǔn)方法。開發(fā)比較M和N的函數(shù),并測量M和N的相似性。給出:
在本文的研究中,需要探索的核心技術(shù)是圖像自相關(guān)匹配和模式識別。涉及的基本技術(shù)有圖像存儲、RGB模型、圖像處理方法、JPEG圖像壓縮、計算機圖形圖像的匹配。
參考文獻(xiàn)
[1] K.S.Fu, “Digital Pattern Recognition”, Second Corrected and Updated Edition, Springer-Verlag Berlin Heidelberg New York, 1980.
[2] R.A.VAUGHAN, “Pattern Recognition and Image Processing in Physics”, SUSSP, 1990.
[3] Sammon, Jr, J.W, 1970. An optimal discriminant plane, IEEE Trans, comput, (short notes), Vol. C-19, pp.826-829.
北京政法職業(yè)學(xué)院2020年度院級科研項目課題ky202016。
(北京政法職業(yè)學(xué)院)