萬曉霞, 梁金星, 劉強
(武漢大學 印刷與包裝系, 湖北,武漢 430079)
?
寬帶光譜成像系統(tǒng)最優(yōu)訓練樣本選擇方法研究
萬曉霞, 梁金星, 劉強
(武漢大學 印刷與包裝系, 湖北,武漢 430079)
為解決現(xiàn)有標準色卡或顏色樣本集因數(shù)量大、存在嚴重顏色冗余而導致的光譜成像工作繁重的問題,提出一種基于寬帶光譜成像系統(tǒng)光譜重建誤差最小化的最優(yōu)訓練樣本選擇方法. 通過現(xiàn)有顏色樣本集中最有效樣本的選擇,實現(xiàn)寬帶光譜成像系統(tǒng)訓練樣本的優(yōu)化. 研究通過偽逆方法進行光譜重建,以光譜均方根誤差作為評價依據(jù),從顏色樣本集中逐步挑選訓練樣本,實現(xiàn)每次迭代所確定訓練樣本對樣本集重建光譜誤差的最小化. 實驗結(jié)果表明,在選擇相同數(shù)量訓練樣本條件下,本研究方法所構(gòu)建訓練樣本的光譜和色度精度明顯優(yōu)于現(xiàn)有方法.
光譜成像;訓練樣本;光譜重建;誤差分析
光譜成像技術(shù)在光譜與色度方面具有較高成像質(zhì)量,近些年在數(shù)字成像領域發(fā)展迅速,同時在文物藝術(shù)品的高保真數(shù)字化典藏、保護及再現(xiàn)復制方面發(fā)揮越來越突出的優(yōu)勢,當前光譜成像系統(tǒng)主要分為窄帶與寬帶光譜成像系統(tǒng)兩類[1-2]. 寬帶光譜成像系統(tǒng)中,物體表面光譜反射率重建工作大多基于訓練樣本完成,即先獲得典型代表性訓練樣本,通過訓練樣本計算由多通道數(shù)字響應信號到光譜反射率值的轉(zhuǎn)換矩陣,完成光譜反射率重建[2],因而訓練樣本的選擇直接影響著光譜反射率的重建精度. 目前常用一些標準色卡作為訓練樣本,如Color Checker DC (CCDC)、 Color Checker Rendition Chart (CC)、Esser Test Chart TE221 (Esser)、ANSI IT8 Charts以及Munsell Surface Colors等進行光譜重建工作[3-8],但大部分的標準色卡具有較多數(shù)量的顏色色塊,這給光譜成像過程中的數(shù)據(jù)處理帶來了巨大的工作量.
研究發(fā)現(xiàn),上述一些標準色卡包含大量的冗余色塊,選用其中少數(shù)部分色塊便能表征標準色卡幾乎全部光譜和色度特征信息[3]. 基于此,為保證光譜重建精度的同時提高光譜成像技術(shù)的工作效率,Hardeberg等[4]提出一種最小條件數(shù)(CN_based)訓練樣本選擇方法,用于光譜成像系統(tǒng)的響應特性表征. Mohammadi等[5]提出了一種光譜聚類分析的訓練樣本選擇方法,首先根據(jù)距離分析對樣本集進行聚類分析,然后從每個聚類中挑選出與本聚類中其余樣本向量夾角總和最小的樣本作為代表樣本,組成訓練樣本集. Cheung等[6]提出了4種基于空間距離分析挑選訓練樣本的方法,使選擇的訓練樣本與已選訓練樣本集中的每個樣本的光譜或色度特性盡可能不同,通過實驗證明最小最大色度(MAXMINC)方法選擇的訓練樣本具有最高的重建精度. 以上提出的訓練樣本選擇方法都是基于一個相同的原則,即要求選擇出的訓練樣本中的代表色塊在光譜或色度屬性上相互之間差別最大. Shen等[7]提出了一種基于特征向量分析(EV_based)的訓練樣本選擇方法,使每次迭代確定的新的訓練樣本集光譜主成分對全部樣本的光譜主成分覆蓋率最大,實現(xiàn)訓練樣本對全部樣本的光譜重構(gòu)誤差最小化. 但上述所有訓練樣本選擇方法均是完全基于對樣本集自身的特征分析,并未聯(lián)系到實際及光譜成像系統(tǒng)特性,所選擇的訓練樣本雖然能夠高效的重建全部樣本的光譜反射率,但不是最優(yōu)的訓練樣本選擇方法. 劉振等[8]針對寬帶光譜成像系統(tǒng)的藝術(shù)品復制應用,提出了一種面向復制的子空間追蹤訓練樣本選擇方法,通過對樣本集光譜空間進行分解,將重建樣本的色度子空間光譜反射率與訓練樣本色度子空間光譜反射率之間的相似性作為樣本選擇依據(jù),雖然實現(xiàn)了色度精確的前提下最大限度的提高光譜重建精度,但實際的光譜重建效率和精度仍受到方法本身限制.
針對上述方法的不足,本文提出了一種基于真實光譜成像系統(tǒng)的光譜重建誤差最小化訓練樣本選擇方法. 首先搭建真實寬帶光譜成像系統(tǒng),利用搭建的真實寬帶光譜成像系統(tǒng)拍攝獲得樣本集的多通道數(shù)字信號;然后通過偽逆方法進行光譜重建,使每次迭代確定的訓練樣本集重建顏色樣本集的光譜誤差最小化,逐步挑選典型訓練樣本,直到光譜重建誤差開始收斂時確定最終的訓練樣本集,其中包括重復樣本;最后利用主成分分析光譜重建將方法的性能與現(xiàn)有方法進行了全面的比較.
1.1 線性化系統(tǒng)模型
假設光譜成像系統(tǒng)的光電轉(zhuǎn)換函數(shù)為線性模型[4],則系統(tǒng)的第i個通道圖像像素的響應值可以用式(1)來表示為
(1)
式中:λ為波長變量;di為第i個通道圖像像素響應值;l(λ)為光源的相對光譜功率分布;r(λ)為物體表面任一像素點的光譜反射率;fi(λ)為鏡頭與濾光片的總透射率;s(λ)為光譜成像系統(tǒng)CCD傳感器的光譜敏感度函數(shù);bi和ni分別為CCD暗電流噪聲和固定模式噪聲,可通過暗電流去除和光照不均勻性校正來消除.
本研究采用實驗選定的兩個濾光片分別與CCD配合獲得3通道數(shù)據(jù),因此共有6個通道,i取值為1~6. 為了更簡明地表達線性化的系統(tǒng)模型,令mi(λ)=l(λ)fi(λ)s(λ),寫成矩陣表達形式如下
(2)
式中:M為光譜響應矩陣;R為光譜圖像矩陣;D為數(shù)字響應響應矩陣;B和N分別為暗電流噪聲和固定模式噪聲向量. 經(jīng)暗電流和光照不均勻性校正后的光譜成像系統(tǒng),可認為B和N均為0,因此可將式(2)簡化為式(3)的形式
(3)
式(3)即為基本的系統(tǒng)響應模型.
1.2 偽逆(pesudoiverse, PSE)光譜重建方法
基于式(3)所表達的光譜成像系統(tǒng)模型,針對獲得的每個重建樣本的6通道系統(tǒng)響應信號,可以通過轉(zhuǎn)換矩陣T重建得到其對應的光譜反射率,其中轉(zhuǎn)換矩陣T是通過訓練樣本的光譜反射率矩陣乘以對應的系統(tǒng)響應值的偽逆矩陣得到,如式(4)所示
(4)
式中:R訓練為訓練樣本的光譜反射率矩陣;PINV為計算偽逆的函數(shù);D訓練為訓練樣本的系統(tǒng)響應矩陣. 則重建樣本的光譜反射率信息就可以通過式(5)得到
(5)
1.3 主成分分析(principalcomponentanalysis,PCA)光譜重建方法
基于式(3)表達的光譜成像系統(tǒng)模型,首先對訓練樣本的光譜反射率進行奇異值分解
(6)
(7)
綜合現(xiàn)有的訓練樣本選擇方法方法可知,Hardeberg方法、Mohammadi方法以及Cheung方法均是挑選在光譜反射率空間或色度空間差別最大樣本,雖然這些方法能夠得到有效的訓練樣本集,但并不是最優(yōu)的訓練樣本組合.Shen的方法雖然分析了訓練樣本集與總樣本集的等效性,并以此為基礎進行訓練樣本的選擇,但只是單純的從樣本集之間的等效性進行分析,未聯(lián)系到實際的光譜成像系統(tǒng)特性,致使選擇的訓練樣本集在實際光譜成像過程中并非最優(yōu)的訓練樣本集. 劉振等并非以最大程度的精確重建物體表面光譜反射率為主要目的,而且方法應用范圍有限. 針對上述方法的不足之處,研究提出了一種基于真實光譜成像系統(tǒng)的光譜重建誤差最小化訓練樣本選擇方法,方法總體描述如圖1所示,具體如下.
首先利用專業(yè)設備測量獲取顏色樣本集Θ的光譜反射率矩陣R;然后搭建光譜成像系統(tǒng),并對光譜成像系統(tǒng)的暗電流水平、固定模式噪聲、光照不均勻性、各通道線性化響應程度進行標定;第3步利用標定后的真實光譜成像系統(tǒng)對樣本集Θ進行拍攝,并根據(jù)第2步對光譜成像系統(tǒng)的標定結(jié)果對拍攝的樣本集進行校正,獲得顏色樣本集校正后的數(shù)字響應信號矩陣D. 第4步和第5步為本文方法的核心,以Ω代表選定的訓練樣本集,利用第1部分介紹的偽逆方法作為訓練樣本選擇時的光譜重建方法,從選擇第一個訓練樣本開始,針對樣本集Θ中的每一個樣本Ri,利用式(4)計算得到樣本對應的轉(zhuǎn)換矩陣T為
(8)
然后利用式(5)對樣本集Θ進行光譜重建
(9)
以光譜重建誤差(root mean square, RMS)作為評價指標
(10)
挑選出光譜重建誤差最小的一個樣本作為第一個訓練樣本
(11)
此時,訓練樣本集中的第一個樣本被選定,
(12)
以此類推,在挑選剩余的第2個到第k(k小于最大樣本數(shù))個訓練樣本時有
(13)
直到滿足式(14)所表示的條件時完成訓練樣本選擇,此時確定的訓練樣本集Ωk對樣本集Θ光譜重建誤差開始達到最小,當繼續(xù)增加滿足式(13)的訓練樣本sk+1,sk+2,…,sm時,訓練樣本集Ωk+1,Ωk+2,…,Ωm對樣本集Θ的光譜重建誤差僅有極其微弱減小趨勢,基本收斂于最小值Jmin,
(14)
本文方法在每挑選一個新的樣本加入到Ω時,都要將樣本集Θ中所有的樣本遍歷一次,其中包括已經(jīng)存在于Ω中的樣本,如此設計算法可以充分利用有效訓練樣本在真實光譜成像系統(tǒng)中的貢獻度,使最終確定的訓練樣本集Ω在真實光譜成像系統(tǒng)前提條件下最大程度地表征樣本集Θ的光譜特征.
為了考察提出的訓練樣本選擇方法的效果,采用仙娜(Sinar 75H)數(shù)碼相機配合通過前期研究得到的BG7和OG515帶通濾光片組成寬帶光譜成像系統(tǒng),使用X-rite ColorEye 7000A分光光度計測量濾光片在360~750 nm范圍內(nèi)的相對光譜透射率曲線,如圖2(a)所示. 針對每個濾光片,在標準A光源scanlite1000照明下獲得其3通道圖像,首先對獲得的3通道圖像進行暗電流校正、系統(tǒng)噪聲去除、線性化校正以及光照不均勻性校正等處理,然后通過光譜圖像配準算法將在兩個濾光片下獲得的3通道圖像進行配準,組合獲得6通道圖像,提取每個樣本的6通道數(shù)字響應值,通過偽逆光譜重建方法進行訓練樣本集的選擇工作. 實驗顏色樣本集選用由154種礦物質(zhì)顏料在11種顆粒度粒徑下涂制而成的1 687個顏料樣本,這154種礦物質(zhì)顏料包含了幾乎古代壁畫所使用的所有礦物質(zhì)顏料,使用spectrolino在D50/2°條件下通過3次測量求平均的方法得到1 687個礦物顏料色塊在380~730 nm范圍內(nèi)的相對光譜反射率,如圖2(b)所示.
為全面評價訓練樣本集對總樣本集光譜重建的精度,除采用式(11)所定義的光譜均方根誤差RMS之外,同時選取目前常用的CIE標準光源D50和1 931觀察者條件下的CIEDE2000色差公式對重建精度進行評價. 圖3為使用本文提出的方法挑選的訓練樣本的數(shù)目與光譜重建誤差RMS以及CIEDE2000色差變化關(guān)系,圖3(a)、3(b)子圖中的水平虛線表示使用全部1 687個樣本作為訓練樣本通過偽逆方法進行光譜重建的光譜誤差RMS和色差CIEDE2000,分別為0.027 9和2.25.
由圖3結(jié)果可知,光譜成像系統(tǒng)的光譜重建誤差RMS和DE2000的分布隨著訓練樣本數(shù)目增加而迅速降低. 其中,當訓練樣本數(shù)量達到25個時,光譜成像系統(tǒng)的重建光譜誤差RMS和色差DE2000已經(jīng)十分接近使用1 687個樣本作為訓練樣本的重建誤差水平,與Mohammadi以及Shen等[5,7]的研究結(jié)果相似. 當訓練樣本數(shù)量達到38個時,光譜成像系統(tǒng)的重建光譜誤差RMS開始收斂于0.027 7,超過使用1 687個樣本作為訓練樣本的重建光譜誤差水平;此時光譜成像系統(tǒng)的光譜重建色差DE2000達到最小值2.29,38個樣本中有兩個重復一次的樣本. 當繼續(xù)增加樣本數(shù)量超過38個時,光譜成像系統(tǒng)的重建光譜誤差RMS雖有微小降低,但仍然收斂于0.027 7;重建色差DE2000隨著訓練樣本數(shù)量的增加逐漸接近于使用1 687個樣本重建的水平,但接近速度非常緩慢,此時訓練樣本集中重復出現(xiàn)的色塊數(shù)量和色塊的重復次數(shù)都開始增加. 因此,可以認為當訓練樣本數(shù)量達到38個時,可作為1 687個色塊組成的樣本集在本實驗真實寬帶光譜成像系統(tǒng)下光譜重建的最優(yōu)訓練樣本集. 此外,本文方法確定的最優(yōu)訓練樣本在本實驗寬帶光譜成像系統(tǒng)下,重建的光譜誤差小于使用所有樣本作為訓練樣本重建的光譜誤差. 分析原因可能為使用1 687個樣本作為訓練樣本時,計算得到的轉(zhuǎn)換矩陣的精度會受到數(shù)據(jù)冗余以及其中部分具有較大噪聲顏色樣本的影響,從而導致光譜重建的整體精度下降,這與Shen的方法相似[7].
將本文提出的方法與上述已有的幾種方法等在不同數(shù)量訓練樣本條件下的光譜重建結(jié)果進行比較,同時為了證明本文訓練樣本選擇方法所確定的最優(yōu)訓練樣本集適用于其它方法進行光譜重建,采用前6主成分分析光譜重建方法將本文方法與現(xiàn)有其他方法比較,光譜重建結(jié)果如圖4所示.
由圖4可知,本文光譜成像訓練樣本選擇方法在不同數(shù)量的訓練樣本數(shù)目條件下,無論是光譜誤差RMS還是色差DE2000,均明顯小于Hardeberg、Mohammadi、Cheung以及Shen等的方法. 由圖4(a)可知,當訓練樣本數(shù)量達到25個時,使用本文提出的方法重建的精度與使用1 687個樣本重建精度光譜誤差已經(jīng)十分接近,繼續(xù)增加訓練樣本的數(shù)量時,本文方法訓練樣本的光譜重建精度已經(jīng)達到
穩(wěn)定誤差水平,圖4(b)中光譜重建的色差誤差水平也表現(xiàn)出基本相同趨勢. 由此可知,使用本文基于偽逆光譜重建誤差最小化訓練樣本選擇方法挑選的最優(yōu)訓練樣本集,同樣適用于其他光譜重建方法.
表1為不同訓練樣本選擇方法選擇不同數(shù)量訓練樣本所花費的時間(單位:s),計算條件為聯(lián)想ThinkPad E420 2.3 GHz內(nèi)存為2G筆記本電腦,采用Matlab 2009a軟件平臺實現(xiàn). 由表中時間數(shù)據(jù)可知,由于算法的設計,除Mohammadi方法隨選擇的訓練樣本數(shù)量增加時間減小之外,其余方法的計算時間均隨著選擇的訓練樣本數(shù)量增加. 縱向比較不同數(shù)量訓練樣本下的計算時間可知,新方法計算效率整體介于Cheung和Shen方法之間,且隨著選擇樣本數(shù)量的增加逐漸與Hardeberg方法相當,計算效率可以得到保證.
表1 不同訓練樣本選擇方法計算效率
圖5為在本實驗寬帶光譜成像系統(tǒng)下,使用36個訓練樣本,通過已有訓練樣本選擇方法以及本文方法對其中兩個樣本的重建結(jié)果. 從圖中可以看出,雖然本文提出的訓練樣本選擇方法的重建光譜反射率與實際測量的光譜反射率之前仍存在一定程度偏差,但優(yōu)于上文中介紹的4種方法.
為解決標準色卡或顏色樣本集因數(shù)量大、存在嚴重顏色冗余而導致的光譜成像工作繁重的問題,研究提出了一種基于真實光譜成像系統(tǒng)重建光譜誤差最小化的訓練樣本選擇方法,彌補了現(xiàn)有方法的不足. 以154種礦物顏料在不同顆粒度粒徑下涂制成1 687個礦物質(zhì)顏料樣本集為實驗對象,針對搭建的寬帶光譜成像系統(tǒng),對本文提出的算法進行驗證,并與現(xiàn)有的方法進行了比較. 實驗表明,使用本文提出的方法在任意數(shù)量訓練樣本條件下的光譜重建精度優(yōu)于現(xiàn)有的訓練樣本選擇方法,且計算效率可以得到保證.
[1] 楊萍,廖寧放,何麗,等.高速窄帶多光譜成像系統(tǒng)光譜重建技術(shù)研究[J].影像技術(shù),2008(6):14-18.
Yang Ping, Liao Ningfang, He Li, et al. Study on image acquisition and spectral construction based on speedy multi-spectral imaging system[J]. Image Technology, 2008(6):14-18. (in Chinese)
[2] Zhao Y, Berns R S. Image-based spectral reflectance reconstruction using the matrix R method[J]. Color Research & Application, 2007,32 (5):343-351.
[3] Kohonen O, Parkkinen J, J??skel?inen T. Databases for spectral color science[J]. Color Research & Application, 2006,31(5):381-390.
[4] Hardeberg J Y, Schmitt F, Brettel H. Multispectral color image capture using a liquid crystal tunable filter[J]. Optics Eng, 2002,41(10):2532-2548.
[5] Mohammadi M, Nezamabadi M, Berns R S, et al. Spectral imaging target development based on hierarchical cluster analysis[C]∥Proceedings of Twelfth Color Imaging Conference: Color Science and Engineering, Systems, Technologies and Applications (IS&T). Scottsdale, Arizona, USA:[s.n.], 2004:59-64.
[6] Cheung V, Westland S. Methods for optimal color selection[J]. Journal of Imaging Science and Technology, 2006,50(5):481-488.
[7] Shen H L, Zhang H G, Xin J H, et al. Optimal selection of representative colors for spectral reflectance reconstruction in a multispectral imaging system[J]. Applied Optics, 2008,47(13):2494-2502.
[8] 劉振,萬曉霞,黃新國,等.基于寬帶多通道的光譜反射率重建方法研究[J].光譜學與光譜分析,2013(4):1076-1081.
Liu Zhen, Wan Xiaoxia, Huang Xinguo, et al. The study on spectral reflectance reconstruction based on wideband multi-spectral acquisition system[J]. Spectroscopy and Spectral Analysis, 2013(4):1076-1081. (in Chinese)
(責任編輯:李兵)
Optimal Training Sample Selection for Broadband Spectral Imaging System
WAN Xiao-xia, LIANG Jin-xing, LIU Qiang
(School of Printing and Packaging, Wuhan University, Wuhan, Hubei 430079, China)
The existing standard colorcharts or databases always have large sample size and suffer from color redundancy, which inevitability leads to a time-consuming process for practical spectral imaging. In order to resolve this problem, an optimal training sample selection method was proposed whose main idea was choosing the most effective samples from existing database based on error analysis of spectral reconstruction. A typical spectral imaging workflow was set up where the pseudoinverse (PSE) method was employed for spectral reconstruction and spectral root-mean-square error (RMS) was used as evaluation metric. Through minimizing the RMS error for each iteration, the method selected the optimal samples one by one from existing databases. The experimental results show that the proposed method has higher effectiveness both in spectral and colorimetric accuracy than the current existing methods when choosing the same number of training samples.
spectral imaging; training sample; spectral reconstruction; error analysis
2015-02-28
國家自然科學基金資助項目(61275172);國家“九七三”計劃項目(2012CB725302);中國博士后科學基金面上資助項目(2014M560625)
萬曉霞(1965—),女,教授,博士生導師,E-mail:wan@whu.edu.cn.
梁金星(1989—),男,博士生,E-mail:jxliang@whu.edu.cn.
TH 744
A
1001-0645(2016)06-0641-06
10.15918/j.tbit1001-0645.2016.06.017