劉繼紅,黃根銀,郭思宇,師 藝
(西安郵電大學(xué) 電子工程學(xué)院,陜西 西安 710121)
色差是彩色印刷行業(yè)評價產(chǎn)品質(zhì)量的一項(xiàng)重要技術(shù)指標(biāo),隨著人工智能技術(shù)的快速發(fā)展,利用機(jī)器視覺代替?zhèn)鹘y(tǒng)人工目視檢測色差逐漸受到人們的關(guān)注[1]。但是,由于機(jī)器視覺系統(tǒng)的頻譜傳輸特性與人眼不一致,導(dǎo)致采集的圖像存在顏色失真,在計算色差之前需要對圖像進(jìn)行顏色校正,才能保證色差檢測的精度[1-3]。
目前提出的顏色校正模型一般都是通過建立圖像顏色和被檢測物真實(shí)顏色之間的映射關(guān)系實(shí)現(xiàn)的。其中,多項(xiàng)式回歸模型和人工神經(jīng)網(wǎng)絡(luò)模型是最具有代表性的兩類模型。多項(xiàng)式回歸模型是較早提出的一類顏色校正模型,在數(shù)碼相機(jī)顏色管理工程[4]和舌色圖像校正[5]等應(yīng)用中已經(jīng)取得了較好的效果。例如,文獻(xiàn)[6]提出的根多項(xiàng)式回歸模型能校正曝光變化引起的顏色失真,文獻(xiàn)[7]利用自動分段方法,進(jìn)一步提高了多項(xiàng)式回歸模型的精度和泛化能力,但是,現(xiàn)有的多項(xiàng)式回歸模型的精度仍然難以滿足微弱色差檢測的需求。為了滿足微弱色差的檢測需求,近年來具有非線性映射能力的神經(jīng)網(wǎng)絡(luò)顏色校正模型引起了廣泛關(guān)注,開始提出的神經(jīng)網(wǎng)絡(luò)模型都是結(jié)合后向傳播(Back Propagation,BP)算法和其他互補(bǔ)算法實(shí)現(xiàn)的[8-9],目前報道的模型則以卷積神經(jīng)網(wǎng)絡(luò)為主,具有更強(qiáng)的顏色空間映射能力,但是,這種校正的卷積神經(jīng)網(wǎng)絡(luò)模型需要數(shù)目龐大的訓(xùn)練集,且訓(xùn)練過程相對復(fù)雜[10-11]。
針對卷積神經(jīng)網(wǎng)絡(luò)模型存在的問題,文獻(xiàn)[12]提出了一種基于極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)的組合策略。和BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)相比,ELM的結(jié)構(gòu)簡單,可快速訓(xùn)練,但由于隨機(jī)初始化輸入權(quán)重和隱藏層節(jié)點(diǎn)偏置,存在模型性能不穩(wěn)定的問題。
為了提高ELM模型性能的穩(wěn)定性,擬對經(jīng)典的ELM模型進(jìn)行改進(jìn)并應(yīng)用于顏色校正。改進(jìn)模型基于經(jīng)典的ELM,在其訓(xùn)練過程中融入具有全局最優(yōu)化搜索能力的遺傳算法(Genetic Algorithm,GA),改善隨機(jī)初始化參數(shù)導(dǎo)致的性能不穩(wěn)定問題。進(jìn)一步,借鑒文獻(xiàn)[13-14]中結(jié)合自適應(yīng)機(jī)制(Adaptive Mechanism,AM)和模擬退火算法(Simulated Annealing,SA)的思路,改進(jìn)GA全局最優(yōu)化搜索性能,設(shè)計一種自適應(yīng)模擬退火遺傳算法優(yōu)化的極限學(xué)習(xí)機(jī)(Adaptive Simulated Annealing Genetic Algorithm-based Extreme Learning Machine,ASA-GA-ELM)顏色校正模型,以在保持結(jié)構(gòu)簡單、訓(xùn)練快速優(yōu)點(diǎn)的同時,實(shí)現(xiàn)參數(shù)全局優(yōu)化搜索,并提高顏色校正精度。
ELM是一種由輸入層、單隱藏層和輸出層組成的前饋神經(jīng)網(wǎng)絡(luò)[15],其結(jié)構(gòu)示意圖如圖1所示。圖中,xi(i=1,2,…,L)表示第i個輸入變量;yn(n=1,2,…,N)表示第n個輸出變量;wij(j=1,2,...,M)表示第i個輸入層節(jié)點(diǎn)到第j個隱藏層節(jié)點(diǎn)的輸入權(quán)重;bj表示第j個隱藏層節(jié)點(diǎn)的偏置,它通過隨機(jī)初始化或人為給定,且不需要更新;βjn表示第j個隱藏層節(jié)點(diǎn)到第n個輸出層節(jié)點(diǎn)的輸出權(quán)重,訓(xùn)練過程僅計算輸出權(quán)重,因此,ELM是一個線性參數(shù)模型,其訓(xùn)練過程易于在全局極小值收斂[15]。
圖1 ELM模型網(wǎng)絡(luò)結(jié)構(gòu)示意圖
ELM模型標(biāo)準(zhǔn)算法采用如下步驟進(jìn)行訓(xùn)練。
步驟1訓(xùn)練開始時,隨機(jī)設(shè)定輸入權(quán)重wij和隱藏層節(jié)點(diǎn)偏置bj。
步驟2根據(jù)設(shè)定的參數(shù)計算隱藏層輸出矩陣,并求解其對應(yīng)的廣義逆矩陣。
步驟3利用廣義逆矩陣計算輸出權(quán)重βjn,使得誤差函數(shù)最小。
GA和SA是改進(jìn)ELM模型將要用到的兩種全局優(yōu)化算法。其中,GA算法是一種隨機(jī)全局搜索算法,其模擬自然選擇和遺傳中發(fā)生的復(fù)制、交叉和變異等現(xiàn)象,通過選擇、交叉和變異操作,產(chǎn)生一群更適合環(huán)境的個體[16]。提出的ASA-GA-ELM顏色校正模型主要利用GA對ELM的輸入權(quán)重和偏置實(shí)施全局最優(yōu)化搜索。
SA算法也是一種隨機(jī)搜索算法,其思想為借鑒金屬的退火過程,當(dāng)金屬由高溫變成低溫時會遍歷所有可能的結(jié)果,從而篩選出最優(yōu)解[17]。在SA算法遍歷所有解的過程中,除了接受“好”的解以外,還按照Metropolis準(zhǔn)則接受不好的解,從而增加找到最優(yōu)解的可能性。利用SA算法的這一特性能夠防止遺傳算法出現(xiàn)“早熟”和后期收斂速度慢等問題。
ASA-GA-ELM模型的設(shè)計主要包括兩步。首先利用AM和SA改進(jìn)GA的選擇、交叉和變異操作,然后,把改進(jìn)后的GA融入ELM的訓(xùn)練過程,得到新的模型訓(xùn)練算法。
對GA中個體的適應(yīng)值f進(jìn)行變換,其變換方式為[13]
(1)
式中:fmax和fmin分別表示當(dāng)前種群的最大和最小適應(yīng)值;k為當(dāng)前的迭代次數(shù);kmax表示最大迭代次數(shù);a為大于0的常數(shù)。
根據(jù)種群樣本差異性和個體差異性自適應(yīng)調(diào)整交叉率和變異率,以實(shí)現(xiàn)增大種群多樣性和提高收斂速度的目的。
種群樣本差異性E1和個體差異性E2可以被分別表示為
式中,favg表示當(dāng)前種群中個體的平均適應(yīng)度。
定義變量z為
式中:e1為截止到當(dāng)前迭代過程,E1的最大值;Emax和Emin分別表示本次迭代中E2的最大和最小值。
利用隨遺傳迭代過程變化的變量z調(diào)整交叉率Pc和變異率Pm[13],其計算表示式分別為
Pc=b(1+z)
(2)
Pm=c(1+dz)
(3)
式中,b、c和d均為常數(shù)。
另外,在交叉和變異操作過程中,采用SA算法中的玻爾茲曼機(jī)制接受新個體,設(shè)定交叉劣化允許率為[14]
式中:fnew和fold分別表示新個體和老個體的適應(yīng)值;T表示當(dāng)前溫度。
設(shè)計的用于紅、綠、藍(lán)(Red Green Blue,RGB)3通道彩色圖像顏色校正的ASA-GA-ELM模型的訓(xùn)練算法流程圖如圖2所示。訓(xùn)練開始后,首先,隨機(jī)選擇隱藏層節(jié)點(diǎn)的初始輸入權(quán)重和偏置;其次,執(zhí)行改進(jìn)的GA選擇、交叉和變異操作,搜索輸入權(quán)重和隱藏層節(jié)點(diǎn)偏置的全局最優(yōu)值;再次,依次計算輸出層權(quán)重和誤差函數(shù)值;最后,根據(jù)誤差函數(shù)值大小判斷繼續(xù)優(yōu)化或結(jié)束訓(xùn)練。
圖2 ASA-GA-ELM模型的訓(xùn)練算法流程
從圖2可以看出,與訓(xùn)練ELM模型的標(biāo)準(zhǔn)算法相比,這里在每次訓(xùn)練時都執(zhí)行改進(jìn)的GA選擇、交叉和變異操作,搜索輸入權(quán)重和隱藏層節(jié)點(diǎn)偏置的全局最優(yōu)值。當(dāng)應(yīng)用于RGB3通道彩色圖像顏色校正時,ASA-GA-ELM模型的輸入、輸出層節(jié)點(diǎn)數(shù)均為3,隱藏層節(jié)點(diǎn)數(shù)由具體應(yīng)用確定,激活函數(shù)采用Sigmoid函數(shù),誤差函數(shù)為訓(xùn)練集中所有圖像顏色校正后與對應(yīng)標(biāo)準(zhǔn)顏色色差的均值,在訓(xùn)練算法中其目標(biāo)值為0.01。
為了驗(yàn)證所提ASA-GA-ELM模型的性能,采用Matlab對使用機(jī)器視覺系統(tǒng)采集的色卡圖像集進(jìn)行測試。實(shí)驗(yàn)中機(jī)器視覺系統(tǒng)中的工業(yè)相機(jī)和鏡頭分別為??低暤腗V-CS200-10GC和維視智造的BT-23C2514MP,其中,相機(jī)的拜爾插值模式設(shè)置為“最優(yōu)”,且關(guān)閉自動白平衡和自動增益功能。照明光源采用亮度可調(diào)節(jié)的環(huán)形LED光源和D65光源。
首先,基于標(biāo)準(zhǔn)色卡構(gòu)建圖像顏色校正數(shù)據(jù)集,訓(xùn)練ASA-GA-ELM模型并確定隱藏層節(jié)點(diǎn)數(shù)。其次,使用訓(xùn)練好的模型校正圖像顏色,分別從目視主觀評價、與其它模型比較兩個方面驗(yàn)證ASA-GA-ELM模型的顏色校正效果。最后,通過調(diào)節(jié)照明光源亮度和更換光源類型,驗(yàn)證ASA-GA-ELM模型的魯棒性。
使用U版Pantone色卡集構(gòu)建數(shù)據(jù)集,以所有2 161種色卡顏色的RGB值作為標(biāo)準(zhǔn)顏色值,以機(jī)器視覺系統(tǒng)采集色卡圖像的RGB值作為待校正顏色值。
U版Pantone色卡集中的顏色按色系依次排列,等間隔選取1 080種色卡,采用其RGB值和所采集圖像的RGB值構(gòu)成數(shù)據(jù)集,隨機(jī)選取其中的80%作為訓(xùn)練集,另外的20%為驗(yàn)證集。
根據(jù)構(gòu)建的數(shù)據(jù)集,通過訓(xùn)練和驗(yàn)證測試確定ASA-GA-ELM模型的隱藏層節(jié)點(diǎn)數(shù)。設(shè)定種群數(shù)n=100,最大迭代次數(shù)kmax=100,降溫速率為0.8。設(shè)定式(1)、式(2)和式(3)中的a、b、c和d分別為0.6、0.5、0.001和4時,ASA-GA-ELM模型在測試集上的色差均值隨隱藏層節(jié)點(diǎn)數(shù)的變化如圖3所示??梢钥闯?當(dāng)隱藏層節(jié)點(diǎn)數(shù)大于30后,模型性能趨于穩(wěn)定。因此,以下實(shí)驗(yàn)中ASA-GA-ELM模型的隱藏層節(jié)點(diǎn)數(shù)均設(shè)置為30。
圖3 色差均值隨模型隱藏層節(jié)點(diǎn)數(shù)的變化
圖4給出了隨機(jī)選取的16種色卡圖像的顏色校正的主觀評價結(jié)果。其中,圖4(a)和圖4(b)分別為機(jī)器視覺系統(tǒng)采集的原始圖像和用ASA-GA-ELM模型校正之后的圖像,而圖4(c)是由色卡標(biāo)準(zhǔn)顏色值生成的圖像。
圖4 顏色校正的主觀評價結(jié)果
觀察圖4可見,采集的圖像經(jīng)過校正之后,其顏色更加接近標(biāo)準(zhǔn)色卡的顏色,視覺上能感受到色差明顯減小,殘余色差比較微弱。實(shí)驗(yàn)中隨機(jī)選取更多的色卡觀察,均有類似圖4所示現(xiàn)象,表明ASA-GA-ELM模型具有在全色域上校正顏色失真的能力。
從數(shù)據(jù)集剩余的1 081種顏色中隨機(jī)選取5組、各216種顏色作為測試集,每組重復(fù)3次實(shí)驗(yàn),色差計算使用CIEDE2000公式[18]。校正前測試集中各樣本的色差如表1所示。全部樣本的色差都大于3 NBS,且平均色差大于12 NBS??梢?機(jī)器視覺系統(tǒng)采集的圖像存在明顯的顏色失真,計算色差前需要進(jìn)行顏色校正。
表1 測試集校正前的色差統(tǒng)計結(jié)果
接下來,使用ASA-GA-ELM模型校正測試樣本的顏色,計算校正后的色差。同時,與多項(xiàng)式回歸模型[5]、BP神經(jīng)網(wǎng)絡(luò)模型[8]、ELM模型[12]進(jìn)行校正性能對比。其中,多項(xiàng)式回歸模型為3次20項(xiàng)、BP神經(jīng)網(wǎng)絡(luò)是單隱藏層且節(jié)點(diǎn)數(shù)為7、ELM模型的隱藏層節(jié)點(diǎn)數(shù)為90。對比模型的參數(shù)都為在相同訓(xùn)練集和驗(yàn)證集上的優(yōu)化結(jié)果。對測試集使用4種方法校正顏色后的色差統(tǒng)計結(jié)果如表2所示。
表2 測試集校正后的色差統(tǒng)計結(jié)果
由表2可以看出,和表1測試集校正前的色差統(tǒng)計結(jié)果所示色差對比, 4種方法都具有在全色域上的顏色校正能力,其中,ASA-GA-ELM模型把色差的4項(xiàng)統(tǒng)計參數(shù)值依次降低到了校正前的14.40%、37.05%、35.41%和11.98%。和其他校正模型相比,ASA-GA-ELM模型除最大色差比BP神經(jīng)網(wǎng)絡(luò)模型稍大外,色差均值和標(biāo)準(zhǔn)差均為最小,且色差大于3 NBS的占比明顯減小。根據(jù)人眼視覺感知與色差的關(guān)系[19],當(dāng)色差值小于3 NBS時,屬于微弱色差,說明ASA-GA-ELM模型在全色域上具有更好的泛化能力。這是因?yàn)?顏色校正是復(fù)雜的非線性問題,ASA-GA-ELM模型比多項(xiàng)式回歸模型具有更強(qiáng)的非線性逼近能力。另外,利用自適應(yīng)模擬退火遺傳算法能夠得到最優(yōu)的ELM初始權(quán)重和偏置,從而避免了BP神經(jīng)網(wǎng)絡(luò)模型對初始權(quán)重和閾值敏感以及ELM模型隨機(jī)初始化參數(shù)導(dǎo)致的性能不穩(wěn)定等問題,提高了模型顏色校正的精度。
對圖4(a)與圖4(c)、圖4(b)與圖4(c)中對應(yīng)位置圖像之間的色差進(jìn)行計算,將計算結(jié)果分別用色差矩陣A、矩陣B表示。色差矩陣A、矩陣B分別為
由矩陣A和矩陣B可以看出,兩個矩陣中元素的數(shù)值分別與表1和表2的統(tǒng)計結(jié)果相吻合,且色差值與目視感受基本一致,進(jìn)一步證明了校正模型的有效性。
通過改變機(jī)器視覺系統(tǒng)照明光源亮度以及更換光源類型驗(yàn)證ASA-GA-ELM模型的魯棒性。照明條件改變后重新采集色卡圖像,保持模型超參數(shù)不變,訓(xùn)練后校正圖像顏色。設(shè)定表2所示結(jié)果的照明亮度為1,改變照明條件,照明條件變化時的校正結(jié)果如表3所示。
表3 照明條件變化時的校正結(jié)果
由表3可以看出,當(dāng)分別把照明亮度顯著調(diào)暗為0.83或調(diào)亮至1.16時,測試集上校正后的色差均值、最大值和標(biāo)準(zhǔn)差都有所增大,但是,和校正前的色差表1相比,仍有明顯的校正效果。在把光源更換為D65后,色差均值略增大,但是校正的標(biāo)準(zhǔn)差更小。以上結(jié)果證明ASA-GA-ELM模型能適應(yīng)照明光源亮度在一定范圍內(nèi)變化以及光源類型更換。
為了提高機(jī)器視覺系統(tǒng)顏色失真的校正精度,采用AM和SA改進(jìn)了GA的選擇、交叉和變異操作,把改進(jìn)后的GA融入ELM模型訓(xùn)練算法,提出了一種ASA-GA-ELM顏色校正模型。在Pantone色卡U版數(shù)據(jù)集上的顏色校正實(shí)驗(yàn)結(jié)果表明,所提出的模型能夠有效校正顏色失真,校正后的圖像色差顯著減小。在相同的測試集上,校正后圖像色差的平均值、標(biāo)準(zhǔn)差和色差大于3NBS的占比都更小。另外,調(diào)節(jié)照明光源亮度和更換光源類型的測試結(jié)果表明ASA-GA-ELM模型具有良好的魯棒性。由于是全色域顏色校正,仍有一定比例的圖像色差大于3 NBS,因此,在下一步工作中將研究全色域和局部色域校正相結(jié)合的多級ASA-GA-ELM模型,進(jìn)一步提高顏色校正精度。