国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合PCA與混沌自適應(yīng)遺傳算法的圖像識別

2019-06-06 04:21:26曹曉杰王文強于德鑫
軟件導(dǎo)刊 2019年3期
關(guān)鍵詞:主成分分析

曹曉杰 王文強 于德鑫

摘 要:針對圖像特征識別轉(zhuǎn)為特征選擇優(yōu)化的問題,提出主成分分析與混沌自適應(yīng)遺傳算法結(jié)合的圖像目標(biāo)識別算法。首先通過PCA將圖像特征線性組合轉(zhuǎn)變?yōu)榈途S空間幾個綜合變量;同時改進遺傳算法,利用混沌Tent模型生成均勻分布的初始種群、種群交叉及變異概率與種群適應(yīng)度結(jié)合自適應(yīng)變化,利用類內(nèi)類間距與特征相關(guān)性重新構(gòu)造適應(yīng)度函數(shù),采用精英保留策略進行子代選擇,得到最優(yōu)特征子集;最后利用概率神經(jīng)網(wǎng)絡(luò)與支持向量機分類器進行訓(xùn)練,識別測試圖像。仿真實驗表明,PCA與混沌自適應(yīng)遺傳算法結(jié)合能降低特征空間維數(shù),使識別性能得到較好提升。

關(guān)鍵詞:圖像特征識別;主成分分析;混沌自適應(yīng)遺傳;類內(nèi)類間距;精英保留

DOI:10. 11907/rjdk. 181875

中圖分類號:TP317.4文獻標(biāo)識碼:A文章編號:1672-7800(2019)003-0191-05

0 引言

隨著模式識別與人工智能的快速發(fā)展,圖像識別作為其分支也得到了長足發(fā)展,在工業(yè)生產(chǎn)、醫(yī)學(xué)、軍事、計算機方向的應(yīng)用越來越多。在實際應(yīng)用中,人工操作應(yīng)用識別技術(shù)并不能使其發(fā)揮應(yīng)有作用,所以識別技術(shù)與人工智能結(jié)合愈加緊密。當(dāng)前,圖像識別結(jié)合人工智能的常用算法包括遺傳算法[1] 、粒子群優(yōu)化算法[2]等,以及先進的數(shù)學(xué)工具, 如小波分析[3]、模糊數(shù)學(xué)[4]等,在實際應(yīng)用中已得到較好發(fā)展,智能識別正向更高效、更精確的方向邁進、向更寬廣領(lǐng)域開拓。

主成分分析(PCA)屬于一種簡單的特征選擇方法,在圖像利用特征識別領(lǐng)域廣受關(guān)注。PCA基本原理是在數(shù)據(jù)間進行K-L去相關(guān)變換,利用新生成的成分代替原數(shù)據(jù)信息,同時新成分之間互不相關(guān),去除原數(shù)據(jù)錯誤干擾、冗余信息。但PCA特征向量并不是最有利于分類的,文獻[5]提出核主成分分析是PCA算法的一種非線性處理改進,文獻[6]提出一種主成分分析和遺傳算法相結(jié)合的特征識別方法。利用遺傳算法進行特征選擇,但是遺傳算法在求解問題時易陷入局部最優(yōu)、收斂等缺點。目前針對上述問題已有許多改進方法,如文獻[7]提出的利用互信息與遺傳算法結(jié)合,文獻[8]-[10]利用混沌模型改進遺傳算法,該算法利用Logistic映射生成初始種群,但并不能維持種群多樣性。

本文提出一種PCA與改進遺傳算法相結(jié)合的新算法。該算法先利用主成分分析對組合的特征數(shù)據(jù)進行分析,去除冗余信息,映射為少數(shù)幾個綜合特征;然后利用Tent序列的遍歷性生成初始群體,使其均勻分布在可行解域,為避免算法運行陷入局部收斂、提升尋優(yōu)速度,考慮到標(biāo)準(zhǔn)遺傳算法交叉和變異概率采取固定值,不利于種群多樣性且影響搜索速度,因此本文采用隨算法運行、依據(jù)適應(yīng)度值自適應(yīng)變化的交叉與變異概率確保種群多樣性,提升尋優(yōu)效率和識別率;最后依據(jù)新算法選出的特征數(shù)據(jù),利用支持向量機與概率神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練識別,驗證算法性能。

1 圖像預(yù)處理與特征生成

進行圖像目標(biāo)識別時,首先對圖像進行預(yù)處理。將圖像二維數(shù)字化灰度圖像轉(zhuǎn)變?yōu)槎S平面上像素點的分布,每個像素點的灰度值為f(x,y)。對圖像處理具體步驟如下:①將圖像進行歸一化,使大小相同;②利用直方圖均衡化,使圖像顯示更多細(xì)節(jié);③對圖像進行邊緣檢測,顯示圖像邊線;④利用二值化算法銳化圖像;⑤對圖像進行中值濾波處理;⑥將得到的灰度圖轉(zhuǎn)為二進制圖像;⑦根據(jù) Hu[11]提出的利用二階與三階中心矩構(gòu)造7個不變矩公式,計算圖像的Hu不變矩。

Reiss & Flusser分別獨立提出具有尺度、平移和旋轉(zhuǎn)變化的3個仿射不變矩[12]。兩種矩特征因為計算方式、量綱不同,不能直接組合在一起,需要進行歸一化,本文所利用的min-max歸一化公式為:

2 主成分分析(PCA)

主成分分析(PCA) 是一種以K-L變換[13]為基礎(chǔ)的統(tǒng)計分析方法, 該方法基本思路是對高維數(shù)據(jù)集的各維進行相關(guān)計算,轉(zhuǎn)變?yōu)榈途S數(shù)據(jù)集。將原始數(shù)據(jù)信息通過PCA轉(zhuǎn)換,生成新的低維主成分,組成新的特征空間。新特征空間的特征名為主成分,各主成分之間互不相關(guān),且根據(jù)對應(yīng)的貢獻率降序排列。

主成分分析是利用映射,將高維特征轉(zhuǎn)變到由幾個低維綜合特征組成的空間 [14],具體操作如下:

3 改進遺傳算法

標(biāo)準(zhǔn)遺傳算法處理問題需要條件較少,且在對待非線性問題時,有較好的優(yōu)化性、并行性等優(yōu)點,因此得到廣泛應(yīng)用。算法優(yōu)化過程中較容易陷入局部極值解,得不到最好的結(jié)果,且易發(fā)生“早熟狀況”。本文針對標(biāo)準(zhǔn)遺傳算法進行改進。

3.1 改進初始群體的產(chǎn)生過程

標(biāo)準(zhǔn)遺傳算法初始群體都是利用計算機的偽隨機自動生成,并不能保證初始群體的多樣性。前人已對初始群體的產(chǎn)生進行改進,其中利用混沌變量的隨機性、遍歷性、規(guī)律性等特點解決非線性問題的混沌優(yōu)化方法已發(fā)展成熟。許多學(xué)者利用遺傳算法過程的混沌模型優(yōu)化初始種群,以提高算法性能。

還有許多學(xué)者利用Logistic映射混沌系統(tǒng)產(chǎn)生初始群體,但是Logistic混沌序列的分布并不是均勻的,不利于實現(xiàn)搜索最優(yōu)。

Logistic混沌映射與Skew Tent混沌映射[15]的模型公式如下所示。

為驗證Skew Tent模型比Logistic模型分布更均勻,更符合生成遺傳的初始種群,給定一個初始值,分別經(jīng)過兩個模型迭代10 000次,得到生成的數(shù)據(jù)遍歷分布如圖1、圖2所示。

Logistic混沌映射與 Skew Tent映射結(jié)果統(tǒng)計對比如圖3、圖4所示。

從圖中可以看出,Logistic模型映射結(jié)果多在0~1兩端,出現(xiàn)在中間數(shù)值次數(shù)都較低,分布出現(xiàn)兩端極化,最多與最少次數(shù)相差較大,出現(xiàn)山谷狀;而Skew Tent結(jié)果分布比較均勻,最多與最少次數(shù)相差不大,總體比較平滑。所以本文利用Skew Tent分布均勻、遍歷的特性,在解空間中映射出二進制編碼形成初始群體,克服隨機產(chǎn)生的不均勻,提升搜索性能。具體產(chǎn)生步驟包括:根據(jù)待處理數(shù)據(jù)的維數(shù)L,先形成L個不同但相差不大的起始值,對于Tent混沌模型方程,根據(jù)要形成的初始種群規(guī)模大小M,經(jīng)過方程迭代M代產(chǎn)生相應(yīng)的混沌變量,形成M×L。

各元素經(jīng)過二值方式處理,公式如下:

即可得到長度為L的M個二進制串組成的初始種群 ,每個二進制串代表一個可行域內(nèi)的個體。

3.2 自適應(yīng)交叉變異概率

標(biāo)準(zhǔn)遺傳算法(GA)采用固定交叉、變異概率,雖在算法運行過程中起到一定作用,但也帶來一定副作用。交叉概率較大時,使算法搜索能力提高,但也會對有利的交叉項產(chǎn)生破環(huán);交叉概率較低時,算法搜索不易起作用。變異操作主要為了保證多樣性,較大的變異概率可能使算法易產(chǎn)生優(yōu)解[16],可能使算法變成純粹的隨機搜索,交叉概率較低時,能減小群體重要基因流失,也可能無法得到優(yōu)解,無法發(fā)揮作用。綜上所述,本文采用交叉、變異概率隨個體適應(yīng)度值自適應(yīng)變化,利用個體適應(yīng)度,與當(dāng)代平均適應(yīng)度,結(jié)合最優(yōu)解得出個體的交叉變異概率,克服早熟,使優(yōu)解能夠留下,且不陷入局部極值解。如式(6)所示。

3.3 適應(yīng)度函數(shù)

適應(yīng)度指群體中單個個體適應(yīng)環(huán)境的能力,遺傳算法以此評定個體優(yōu)劣。遺傳算法運行過程基本不利用外部信息,僅以適應(yīng)度評判[17]。適應(yīng)度函數(shù)的設(shè)計影響算法能力,因此對于識別分類問題,需要尋求相關(guān)適應(yīng)度函數(shù)構(gòu)造法。

類內(nèi)間距離準(zhǔn)則用于評價特征對同類樣本的聚散[18]。同類樣本間距離之和越小,最大距離越小,聚集越緊密(類內(nèi)距離越小越便于區(qū)分),說明特征對同類樣本的聚合能力越強。不同類樣本位于特征結(jié)構(gòu)空間的不同范圍,距離越大則不同類樣本區(qū)分度越大,因此類間距離越大越便于分類。因需要將個體進行分類,且個體之間也存在差異,所以相應(yīng)選擇類內(nèi)距離、類間距離結(jié)合特征向量相似度構(gòu)造適應(yīng)度函數(shù)。

3.4 精英保留策略

該策略基本思想是:適應(yīng)度最好的個體盡量存儲到子代群體。具體步驟如下:

步驟一:記錄當(dāng)前群體中適應(yīng)度值最大、最小的個體。

步驟二:得到群體最好的個體,如果大于前群體中最大個體適應(yīng)度值,則用前者代替后者。

步驟三:將當(dāng)前適應(yīng)度值最小的個體用目前為止適應(yīng)度值最大的個體替換。

該策略能保證最優(yōu)個體不被破壞,并且能完整遺傳到子代中,這是遺傳算法一個很重要的收斂條件[19]。

混沌自適應(yīng)遺傳算法特征選擇的流程如圖5所示。

4 圖像目標(biāo)識別具體步驟

在圖像目標(biāo)識別中,對于圖像信息的采集多數(shù)是多特征、加噪聲、非線性的數(shù)據(jù)集合,所以特征的選擇優(yōu)化非常重要,在利用采集到的信息時,需要對特征中的噪聲、冗余信息或不相關(guān)特征進行分析篩選。本文從特征選擇出發(fā),利用PCA與混沌自適應(yīng)遺傳算法相結(jié)合應(yīng)用到圖像目標(biāo)識別,利用選擇后的最優(yōu)解,選取組合出新的特征空間結(jié)構(gòu),具體步驟如下:

步驟一:對圖像進行預(yù)處理。

步驟二:根據(jù)Hu不變矩與仿射不變矩公式計算每幅圖像的特征,組成特征空間以表示圖像信息。

步驟三:利用PCA對表示圖像的數(shù)據(jù)集進行特征處理,將求得的特征值由大到小排序,特征值對應(yīng)特征向量,組成新的特征空間。

步驟四:應(yīng)用SKew Tent混沌模型生成遺傳算法初始群體。

步驟五:根據(jù)公式計算個體適應(yīng)度值。

步驟六:進行輪盤賭選擇、自適應(yīng)交叉變異運算。

步驟七:對群體個體進行精英保留。

步驟八:根據(jù)終止條件判斷算法是否滿足,若滿足,則停止;若不滿足,循環(huán)到步驟六,繼續(xù)運行。

步驟九:利用新算法得出最優(yōu)解,在圖像數(shù)據(jù)集中選取相應(yīng)的特征,組成新的數(shù)據(jù)特征空間。利用得到的數(shù)據(jù)集,采用概率神經(jīng)網(wǎng)絡(luò)[20]與支持向量機[21]兩種分類器進行圖像目標(biāo)識別分類。

5 實驗結(jié)果與分析

本文采用150幅飛機目標(biāo)圖像和50幅小型汽車目標(biāo)圖像,組合成300幅圖像作為試樣樣本。先對圖像進行預(yù)處理,根據(jù)步驟二得到圖像的特征空間。根據(jù)實驗要求選取飛機圖像100幅、汽車圖像100幅組成訓(xùn)練樣本集,剩余100幅組合生成測試樣本集。

樣本示例如圖6、圖7所示,矩特征如表1所示。

本文分別選取300幅圖像Hu不變矩特征數(shù)據(jù)、仿射不變矩特征數(shù)據(jù)、Hu矩與仿射不變矩的組合特征數(shù)據(jù),標(biāo)準(zhǔn)遺傳算法選擇組合數(shù)據(jù)得到的新特征集、PCA處理后的特征集、PCA與標(biāo)準(zhǔn)遺傳選擇后的特征集及本文新算法選擇的特征集,其特征集維數(shù)如表3所示。

對于各部分取得的特征矩進行整理,利用概率神經(jīng)網(wǎng)絡(luò)與支持向量機作為分類器,對特征數(shù)據(jù)進行訓(xùn)練測試,結(jié)果如圖8、圖9所示。

從上述實驗結(jié)果可以看出,相對于使用單一類的特征矩,組合特征矩代表更豐富的目標(biāo)信息,識別率也有提高;相對于以單一特征表示圖像信息,發(fā)現(xiàn)多種特征組合可以包含圖像更多信息,但特征維數(shù)較大;使用單一的PCA與標(biāo)準(zhǔn)遺傳算法及PCA結(jié)合標(biāo)準(zhǔn)遺傳算法處理能有效降低特征維數(shù),但識別率提高不大;而通過本文PCA與混沌自適應(yīng)遺傳結(jié)合處理,不但能有效降低特征維數(shù),降低識別過程運算量,且能夠提高識別準(zhǔn)確率。

6 結(jié)語

本文將PCA與混沌自適應(yīng)遺傳算法結(jié)合,應(yīng)用于圖像識別特征選擇過程,相較于單一的PCA算法與單一的遺傳算法,本文算法在特征選擇方面有較大優(yōu)勢,可減少選取的特征維數(shù),相對提高識別過程的運算速度,且實驗測試結(jié)果證明圖像目標(biāo)的識別正確率有所提高。

本文算法雖已取得較好效果,為了將其更好地應(yīng)用到實際中,還需要更高的準(zhǔn)確率,所以未來將在圖像預(yù)處理階段尋求新的處理方法,使圖像目標(biāo)更加明顯,使提取的特征更加準(zhǔn)確、全面。另外,本文算法分類器僅應(yīng)用了簡單的神經(jīng)網(wǎng)絡(luò),后續(xù)需要研究神經(jīng)網(wǎng)絡(luò)優(yōu)化,以便進一步提高識別正確率。

參考文獻:

[1] BHARDWAJ A,TIWARI A,BHARDWAJ H. A genetically optimized neural net-work model for multi-class classification[J]. Expert Systems with Applications,2016,60(10):211-221.

[2] BUI K T T, BUI D T,ZOU J G,et al. A novel hybrid artificial intelligent approach based on neural fuzzy inference model and particles warm optimization for horizontal displacement modeling of hydropower dam [J]. Neural Compution & Applications,2018,29 (12):1495-1506.

[3] SU H Z,LI X,YANG B B,et al. Eavelet?support vector machine- based prediction model of dam deformation[J]. Mechanical Systems and Signal Processing, 2018,110:412-427.

[4] WEI G W,ALSAADI F E,HAYAT T,et al. A linear assignment method for multiple criteria decision analysis with hesitant fuzzy sets based on fuzzy measure[J]. International Journal of Fuzzy Systems,2017,19 (3):607-614.

[5]魏弦. 基于核主成分分析的熱誤差模型自變量優(yōu)化[J]. 電子測量與儀器學(xué)報,2017,31(12):2017-2022.

[6] 苑瑋琦,于清澄. 一種基于改進主成分分析的人臉識別方法[J]. 激光與紅外,2007(5):478-480.

[7] 涂昌慧,葛紅,胡天亮. 基于遺傳算法和互信息公式結(jié)合的特征選擇[J]. 華南師范大學(xué)學(xué)報:自然科學(xué)版,2014,46(6):28-32.

[8] 申情,蔣云良,沈張果,等. 基于組合混沌遺傳算法的最小測試用例集生成[J]. 電信科學(xué),2016,32(6):93-102.

[9] 方仕勇,鄒恩,辛建濤,等. 新型混沌遺傳算法在多約束QoS路由的應(yīng)用[J]. 計算機應(yīng)用研究,2012,29(8):3078-3080.

[10] 王世瑋,張迪,魏明磊, 等. 基于混沌多目標(biāo)遺傳算法的分布式電源規(guī)劃[J]. 寧夏電力,2017(2):1-6+14.

[11] 崔彥平,葛杏衛(wèi). 復(fù)雜背景下回轉(zhuǎn)體目標(biāo)識別方法研究[J]. 半導(dǎo)體光電,2010,31(6):931-935+940.

[12] 楊紅梅,劉志剛,韓志偉,等. 基于仿射不變矩的電氣化鐵路絕緣子片間夾雜異物檢測[J]. 鐵道學(xué)報,2013,35(4):30-36.

[13] 宣國榮,鄭俊翔,楊程云,等. 巴氏距離和K-L變換結(jié)合的特征選擇[J]. 計算機工程與應(yīng)用,2004(36):90-92.

[14] 唐莉,張永波,祝雪萍,等. 基于主成分分析法與量變質(zhì)變判別模式的汛期分期[J]. 水力發(fā)電,2018(5):27-31.

[15] 李雪巖,李雪梅,李學(xué)偉,等. 基于混沌映射的元胞遺傳算法[J]. 模式識別與人工智能,2015,28(1):42-49.

[16] 張大科,錢謙. 一種新型自適應(yīng)遺傳算法在多峰函數(shù)優(yōu)化中的應(yīng)用[J/OL]. 軟件導(dǎo)刊:1-4 [2018-06-01].? http://kns.cnki.net/kcms/detail/42. 1671.TP.20180529.1755.010.html.

[17] 金芬,孫春華,鐘鳴. 遺傳算法中適應(yīng)度函數(shù)的改進[J]. 機械設(shè)計與制造,2010(3):218-219.

[18] 周爽,張鈞萍,蘇寶庫. 基于最速上升算法的超光譜圖像波段選擇搜索算法[J]. 計算機應(yīng)用研究,2008(11):3501-3503.

[19] 孫明華,崔海濤,溫衛(wèi)東. 基于精英保留遺傳算法的連續(xù)結(jié)構(gòu)多約束拓?fù)鋬?yōu)化[J]. 航空動力學(xué)報,2006(4):732-737.

[20] 賀靜,徐成武,任密林. 基于概率神經(jīng)網(wǎng)絡(luò)的IPv6入侵檢測技術(shù)研究[J]. 太原理工大學(xué)學(xué)報,2017,48(6):969-972+983.

[21] 劉方園,王水花,張煜東. 支持向量機模型與應(yīng)用綜述[J]. 計算機系統(tǒng)應(yīng)用,2018,27(4):1-9.

(責(zé)任編輯:江 艷)

猜你喜歡
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
計算機教育(2016年8期)2016-12-24 10:38:04
關(guān)于AI上市公司發(fā)展水平評價
大學(xué)生創(chuàng)業(yè)自我效能感結(jié)構(gòu)研究
塔里木河流域水資源承載力變化及其驅(qū)動力分析
我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實證研究
時代金融(2016年29期)2016-12-05 15:41:07
基于NAR模型的上海市房產(chǎn)稅規(guī)模預(yù)測
主成分分析法在大學(xué)英語寫作評價中的應(yīng)用
江蘇省客源市場影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
考試周刊(2016年84期)2016-11-11 23:57:34
長沙建設(shè)國家中心城市的瓶頸及其解決路徑
元谋县| 大同市| 东莞市| 古交市| 健康| 赤城县| 堆龙德庆县| 白银市| 深泽县| 县级市| 巴中市| 常熟市| 沙坪坝区| 固始县| 黑河市| 江安县| 交口县| 宝兴县| 东乡族自治县| 阳朔县| 永寿县| 克拉玛依市| 山阴县| 长汀县| 呼玛县| 香河县| 于田县| 施甸县| 老河口市| 汕头市| 邹城市| 安义县| 富蕴县| 扎囊县| 武夷山市| 和顺县| 台山市| 庄浪县| 西丰县| 菏泽市| 和平县|