張 博 葉中付徐 旭
(中國(guó)科學(xué)技術(shù)大學(xué)電子工程與信息科學(xué)系合肥230027)
一種基于二維算法的新穎的多目標(biāo)光纖光譜數(shù)據(jù)處理流程?
張 博 葉中付?徐 旭
(中國(guó)科學(xué)技術(shù)大學(xué)電子工程與信息科學(xué)系合肥230027)
郭守敬望遠(yuǎn)鏡(Large Sky Area Multi-Object Fiber Spectroscopic Telescope, LAMOST)、斯隆數(shù)字巡天(Sloan Digital Sky Survey,SDSS)、英澳望遠(yuǎn)鏡(Anglo-Australia Telescope,AAT)等大多數(shù)多目標(biāo)光纖光譜望遠(yuǎn)鏡現(xiàn)用的數(shù)據(jù)處理流程都是基于一維算法的.以LAMOST為例提出多目標(biāo)光纖光譜數(shù)據(jù)處理流程方法.在LAMOST現(xiàn)用數(shù)據(jù)處理流程中,在預(yù)處理過(guò)程之后,通過(guò)基于一維模型的抽譜算法從二維觀測(cè)目標(biāo)光譜數(shù)據(jù)中得到一維抽譜結(jié)果作為中間數(shù)據(jù).后續(xù)的處理步驟都基于一維模型的算法.然而,這種數(shù)據(jù)處理流程不符合觀測(cè)光譜的形成機(jī)理.因此,在每個(gè)步驟中都引入了不可忽略的誤差.為了解決這一問(wèn)題,提出了一種還未被用于LAMOST及其他望遠(yuǎn)鏡數(shù)據(jù)處理系統(tǒng)的新穎的數(shù)據(jù)處理流程.重新設(shè)計(jì)安排了各個(gè)數(shù)據(jù)處理模塊的順序,各關(guān)鍵步驟算法都是基于二維模型的.核心算法將詳細(xì)論述.此外,列出了部分實(shí)驗(yàn)結(jié)果來(lái)證明二維算法的有效性和優(yōu)越性.
望遠(yuǎn)鏡,儀器:光譜儀,方法:數(shù)值,技術(shù):圖像處理,技術(shù):分光鏡
郭守敬望遠(yuǎn)鏡,即大天區(qū)面積多目標(biāo)光纖光譜望遠(yuǎn)鏡(Large Sky Area Multi-Object Fiber Spectroscopic Telescope,LAMOST)是大口徑兼大視場(chǎng)光學(xué)望遠(yuǎn)鏡的世界之最[1].
目前為止,LAMOST(http://www.lamost.org/public/dr/algotrithms/data-reducti on?locale=en)和斯隆數(shù)字巡天(Sloan Digital Sky Survey,SDSS)[2]、英澳望遠(yuǎn)鏡(Anglo-Australia Telescope,AAT)的光譜儀系統(tǒng)(AAOmega spectrograph system)[3]、歐洲南方天文臺(tái)(European Southern Observatory,ESO)的甚大望遠(yuǎn)鏡(Very Large Telescope)的大型光纖陣列多目標(biāo)攝譜儀(Fiber Large Array Multi Element Spectrograph, FLAMES)(ftp://ftp.eso.org/pub/dfs/pipelines/gira ff e/giraf-pipeline-manual-2.12.pdf)等多目標(biāo)光纖光譜望遠(yuǎn)鏡上所使用的數(shù)據(jù)處理系統(tǒng),從總體上來(lái)說(shuō),都是基于一維算法的,也就是說(shuō),它們的主要處理步驟都在一維方向上處理數(shù)據(jù).
然而,CCD相機(jī)上的二維觀測(cè)光譜是由原始一維光譜通過(guò)光譜儀的光柵之后,以點(diǎn)擴(kuò)展函數(shù)(point spread function,PSF)的形式將能量傳遞到鄰近像素形成的.在空間方向,每根光纖的能量在每個(gè)波長(zhǎng)位置以固定的PSF的形式擴(kuò)散到鄰近像素.因此在數(shù)據(jù)處理過(guò)程中空間和波長(zhǎng)這兩個(gè)方向不應(yīng)分開(kāi)進(jìn)行.由此可知,之前的基于一維算法的數(shù)據(jù)處理流程是不合適的,忽略了空間方向和波長(zhǎng)方向之間的相關(guān)性,破壞了數(shù)據(jù)的完整性,在每個(gè)步驟中造成了不可忽略的誤差累計(jì).
盡管某些算法在一定程度上改進(jìn)了上述缺陷,但是沒(méi)有從本質(zhì)上在二維方向上進(jìn)行從二維光譜到一維光譜的抽譜過(guò)程.部分算法在建立二維PSF模型之后仍然利用一維算法抽譜.例如,Piskunov和Valenti等人的最優(yōu)抽譜算法[4?5],它在首次迭代中將流量疊加,忽視了波長(zhǎng)方向的影響,后面的迭代過(guò)程無(wú)法彌補(bǔ)這一問(wèn)題.也有算法建立二維PSF模型并在兩個(gè)方向上進(jìn)行抽譜,但是由于抽譜結(jié)果的振鈴問(wèn)題嚴(yán)重,不得不對(duì)解卷積后的抽譜結(jié)果重新卷積上矩陣回到與原始數(shù)據(jù)相同的二維光譜存儲(chǔ)起來(lái),不能求解出原始的一維光譜[6?7].
綜上所述,根據(jù)二維觀測(cè)光譜的形成機(jī)理,提出了一種新的基于二維算法的多目標(biāo)光纖光譜數(shù)據(jù)處理流程.以LAMOST為例展示該系統(tǒng)流程.與現(xiàn)用的一維算法處理流程相比減小了誤差.下面將詳細(xì)論述所提的數(shù)據(jù)處理系統(tǒng)流程,包括關(guān)鍵步驟二維算法的核心思想.此外,給出了抽譜模塊和減天光模塊在LAMOST數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果,并與之前LAMOST在用數(shù)據(jù)處理系統(tǒng)進(jìn)行比較.
二維原始光譜數(shù)據(jù)的形成機(jī)理可用圖1解釋說(shuō)明.
圖1 CCD上的二維目標(biāo)光譜的形成原理圖Fig.1 Schematic diagram of formation mechanism of the 2-D observed spectra on CCDs
λ代表來(lái)自目標(biāo)天體的原始一維光譜.為了在保證數(shù)據(jù)完整性的同時(shí)滿足數(shù)學(xué)計(jì)算的要求,二維觀測(cè)光譜中的像素點(diǎn)(x′,y′)組成的矩陣可以在波長(zhǎng)方向上按列重新排列成一個(gè)向量Q.其中每個(gè)像素qi(i=1,2,···,N)是由每個(gè)對(duì)應(yīng)的二維高斯PSF(Gji)映射到原始一維光譜上的每個(gè)像素點(diǎn)λj(j=1,2,···,M)而形成的.
圖2分別列出LAMOST上正在使用的和提出的基于二維算法的光譜數(shù)據(jù)處理流程.
圖2 多目標(biāo)光纖光譜數(shù)據(jù)處理流程.左:LAMOST正在使用中的數(shù)據(jù)處理流程系統(tǒng).右:所提算法數(shù)據(jù)處理流程系統(tǒng)Fig.2 Multi-object fiber spectral data processing procedure.Left panel:the using processing procedure on LAMOST.Right panel:the proposed processing procedure
提出的基于二維算法的數(shù)據(jù)處理流程步驟如下:
(1)首先進(jìn)行預(yù)處理流程,如減本底,宇宙射線的檢測(cè)和剔除,光纖追跡和一些參數(shù)的調(diào)控.
(2)用二維算法進(jìn)行波長(zhǎng)定標(biāo)和流量定標(biāo).定標(biāo)步驟在其他關(guān)鍵步驟之前實(shí)施可以提高光譜數(shù)據(jù)的處理精度.
(3)經(jīng)過(guò)精確的定標(biāo)之后,先進(jìn)行基于二維模型的減天光過(guò)程,這樣的安排可以在利用更多天光信息的同時(shí),避免在抽譜步驟中引入誤差影響減天光的精度.
LAMOST的每個(gè)光譜儀上有250根光纖,其中有10根是采樣天光,skyi(x,y)(i= 1,2,···,10).對(duì)于在空間方向處于相同位置的切片,將它們按照波長(zhǎng)值的大小重新排列,建立一條新的二維天光光譜sky′(x,y).這條新的二維天光光譜的天光采樣率比原來(lái)的天光光譜提高了10倍.
(4)通過(guò)基于二維高斯(或二維指數(shù)多項(xiàng)式)模型的二維抽譜算法進(jìn)行抽譜步驟,從獲得的二維光譜中還原出原始一維光譜.
(5)最后進(jìn)行光譜的合并,得到一維目標(biāo)光譜.
波長(zhǎng)定標(biāo)模塊、減天光模塊和抽譜模塊是光譜數(shù)據(jù)處理流程中的關(guān)鍵步驟.它們的精確度決定了最終從系統(tǒng)中得到的一維目標(biāo)光譜的真實(shí)性.下文中將對(duì)這些算法詳細(xì)闡述.其他光譜數(shù)據(jù)處理模塊(預(yù)處理模塊、后續(xù)處理模塊)與LAMOST現(xiàn)用光譜數(shù)據(jù)處理系統(tǒng)流程中所用方法相同,這里不再贅述.
3.1 二維波長(zhǎng)定標(biāo)算法
二維波長(zhǎng)定標(biāo)算法的主要步驟如圖3所示.
圖3 二維波長(zhǎng)定標(biāo)算法的流程圖Fig.3 Flow chart of the 2-D wavelength calibration algorithm
(1)基于先驗(yàn)定標(biāo)系數(shù)和定標(biāo)燈譜表用插值法建立一維模擬定標(biāo)燈譜.
(2)用對(duì)應(yīng)的PSF將一維模擬定標(biāo)燈譜擴(kuò)展為二維模擬定標(biāo)燈譜.
(3)對(duì)于二維模擬定標(biāo)燈譜和實(shí)際定標(biāo)燈譜在空間方向位置相同的對(duì)應(yīng)光譜切片做相關(guān)運(yùn)算.
(4)如果相關(guān)運(yùn)算的結(jié)果大于設(shè)定的閾值,則定標(biāo)系數(shù)的值設(shè)為當(dāng)前切片的定標(biāo)系數(shù);否則回到步驟(1)重新調(diào)節(jié)定標(biāo)系數(shù).其中計(jì)算定標(biāo)系數(shù)的方法可以參照參考文獻(xiàn)[8-11].
(5)在所有切片(或所選的空間方向接近輪廓中心位置的切片)的定標(biāo)系數(shù)都計(jì)算完畢之后,用加權(quán)平均法計(jì)算最終的定標(biāo)結(jié)果.
3.2 基于二維天光背景模型的減天光算法
在建立新的二維天光光譜sky′(x,y)之后,對(duì)它的每個(gè)切片進(jìn)行B樣條曲線擬合,獲得一條完整的一維天光光譜
其中,xk是B樣條曲線的節(jié)點(diǎn)坐標(biāo).Bk,d(x)代表第k個(gè)d階B樣條基函數(shù).Pk,y是空間分量y對(duì)應(yīng)的擬合參數(shù),即擬合控制點(diǎn).
每個(gè)一維切片數(shù)據(jù)上的空間方向位置為y的40960個(gè)像素點(diǎn)作采樣點(diǎn),代入B樣條曲線擬合函數(shù),就獲得了對(duì)應(yīng)的線性方程組,然后可以通過(guò)最小二乘法和Cholesky分解法計(jì)算求解出相應(yīng)的擬合控制點(diǎn)Pk,y.
按照上述的B樣條曲線擬合方法,可以得到空間方向位置為y的天光切片根據(jù)空間方向位置合并所有的一維天光切片,就可以建立天光背景模型,即合并得到的完整的二維天光光譜sky′′(x,y).
對(duì)于每根二維目標(biāo)光譜,按照光譜上的每個(gè)像素點(diǎn)對(duì)應(yīng)的波長(zhǎng)值在二維天光背景模型上插值查找,得到其對(duì)應(yīng)的天光流量值并減去,便完成了減天光處理流程.二維減天光算法的細(xì)節(jié)描述可以參照參考文獻(xiàn)[12].
3.3 基于二維高斯模型的抽譜算法
如第2部分和圖1所闡述的,觀測(cè)光譜的形成過(guò)程可以用公式表示為:
PSF(Gji)可以用二維高斯函數(shù)模型或二維指數(shù)多項(xiàng)式模型進(jìn)行模擬.模型的參數(shù)可以分別通過(guò)對(duì)應(yīng)的平場(chǎng)光譜圖像和定標(biāo)燈譜圖像估計(jì)出來(lái).模型的詳細(xì)解釋和證明可以參照參考文獻(xiàn)[13-14].
方程(2)可以表示為矩陣形式:
抽取原始一維光譜的過(guò)程也就是求解二維光譜形成過(guò)程的逆過(guò)程.也就是說(shuō),通過(guò)求解方程(3)可以得到原始光譜λ.
為了解決參考文獻(xiàn)[6-7]方法中的振鈴問(wèn)題,可以利用對(duì)偶約束的稀疏重建方法, GPSR-BB(Barzilai-Borwein Gradient Projection for Sparse Reconstruction)算法[15]求解方程.
考慮到多目標(biāo)光纖光譜實(shí)測(cè)數(shù)據(jù)的特點(diǎn),即除了部分特征光譜輪廓流量高達(dá)105,其他位置的連續(xù)譜流量相對(duì)很小(0–100).因此原始一維光譜可以看做是稀疏分布的.在保證求解方程(3)的最近似解的同時(shí)保持解的稀疏性,可以轉(zhuǎn)化為如下二次規(guī)劃問(wèn)題:
其中,τ是一個(gè)非負(fù)參數(shù).
(4)式中的算法涉及G和GT的子矩陣運(yùn)算,因此在λ的非零解較少的情況下有效.原始一維光譜λ中的連續(xù)譜的流量值雖然較低,但是這些大量的非零值分量是不可忽略的.因此需要改進(jìn)上述算法.
因此,上述抽譜問(wèn)題可以轉(zhuǎn)化為邊界約束的二次規(guī)劃問(wèn)題(bound-constrained quadratic program,BCQP),將(4)式中的λ分解為正負(fù)兩部分.
(5)式的詳細(xì)求解過(guò)程可以參照參考文獻(xiàn)[16].
我們以LAMOST光譜數(shù)據(jù)為例證明所提多目標(biāo)光纖光譜數(shù)據(jù)處理流程的有效性.為了著重驗(yàn)證數(shù)據(jù)處理流程中二維算法的效果,實(shí)驗(yàn)圍繞流程中的關(guān)鍵步驟進(jìn)行.下面將展示目前為止得到的抽譜模塊和減天光模塊的部分實(shí)驗(yàn)結(jié)果.
4.1 抽譜部分實(shí)驗(yàn)結(jié)果
為了驗(yàn)證二維抽譜算法的優(yōu)越性,選取LAMOST光譜數(shù)據(jù)處理系統(tǒng)中正在使用的孔徑抽譜算法(ftp://ftp.eso.org/pub/dfs/pipelines/gira ff e/giraf-pipeline-manual-2.12.pdf)和基于一維高斯模型的輪廓擬合算法[16]作為對(duì)比算法.實(shí)驗(yàn)中,為了更清晰地展示抽譜結(jié)果的光譜輪廓細(xì)節(jié),選取整條光譜的一部分展示在圖中.
為了驗(yàn)證二維抽譜算法的準(zhǔn)確性和對(duì)噪聲的穩(wěn)定性,首先用LAMOST的模擬數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證.這些模擬數(shù)據(jù)都是基于LAMOST系統(tǒng)的相關(guān)參數(shù)和光譜特征仿真生成的.分別在無(wú)噪聲和噪聲大小不同的條件下進(jìn)行抽譜,抽譜結(jié)果如圖4所示,圖中流量值為歸一化的結(jié)果.
圖4 LAMOST模擬數(shù)據(jù)抽譜結(jié)果.SNR=10.31.(a)原始一維光譜;(b)孔徑抽譜算法;(c)一維高斯輪廓擬合算法;(d)二維高斯抽譜算法Fig.4Extraction results of LAMOST simulated data.SNR=10.31.(a)The original 1-D spectrum;(b) the aperture extraction algorithm;(c)the profile fitting algorithm based on 1-D Gauss model;(d)the 2-D Gauss extraction algorithm
將抽譜結(jié)果量化進(jìn)行客觀評(píng)價(jià),分別建立抽譜前光譜的信噪比(signal noise ratio, SNR)評(píng)價(jià)指標(biāo):
其中,qi代表二維觀測(cè)光譜上像素點(diǎn)的流量值,代表去除噪聲后的二維觀測(cè)光譜上像素點(diǎn)的流量值.抽譜結(jié)果與真實(shí)的原始一維光譜的誤差為:
其中,λj表示抽取出來(lái)的一維光譜,表示原始的一維光譜.誤差ε的值越高,抽譜的結(jié)果和原始光譜越接近,即抽譜的精度越高.不同噪聲條件下抽譜結(jié)果的誤差列在表1.
為了證明算法的實(shí)用性,在LAMOST實(shí)測(cè)數(shù)據(jù)[17]上的實(shí)驗(yàn)結(jié)果如圖5所示.雖然實(shí)測(cè)光譜數(shù)據(jù)的抽譜結(jié)果的理論值是不可知的,但是從圖5中可以看出二維算法的抽譜結(jié)果光譜輪廓的半峰寬更窄,流量值更高.一維抽譜算法忽略了波長(zhǎng)方向的影響,因此抽譜結(jié)果有輪廓擴(kuò)展和未包含所有流量的問(wèn)題.模擬數(shù)據(jù)的實(shí)驗(yàn)也可以參照參考文獻(xiàn)[13-14].綜合模擬數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果可知,二維抽譜算法比一維抽譜算法更加精確.
圖5 LAMOST實(shí)測(cè)數(shù)據(jù)抽譜結(jié)果.(a)孔徑抽譜算法;(b)一維高斯輪廓擬合算法;(c)二維高斯抽譜算法;(d)(a)、(b)、(c)的細(xì)節(jié)Fig.5 Extraction results of LAMOST real data.(a)The aperture extraction algorithm;(b)the profile fitting algorithm based on 1-D Gauss model;(c)the 2-D Gauss extraction algorithm;(d)details of(a), (b),and(c)
4.2 減天光部分實(shí)驗(yàn)
實(shí)驗(yàn)是基于LAMOST實(shí)測(cè)數(shù)據(jù)仿真的模擬數(shù)據(jù)進(jìn)行的.數(shù)據(jù)模型是嚴(yán)格按照LAMOST數(shù)據(jù)特征進(jìn)行仿真的[17].LAMOST光譜數(shù)據(jù)系統(tǒng)中廣泛使用的一維B樣條曲線擬合減天光算法[2]作為對(duì)比實(shí)驗(yàn)算法.實(shí)驗(yàn)結(jié)果如圖6所示.
基于二維天光背景模型的算法重建的天光光譜相比一維算法的結(jié)果更加光滑,毛刺更少.二維算法結(jié)果中的天光殘差的毛刺幅度和數(shù)目都小于一維算法結(jié)果.更多的實(shí)驗(yàn)結(jié)果和比較可以參照參考文獻(xiàn)[12].相比于LAMOST現(xiàn)用一維減天光算法,二維減天光算法可以更加有效地減天光.
表1 不同噪聲條件下(SNR)的LAMOST模擬數(shù)據(jù)抽譜結(jié)果與原始光譜之間的誤差(ε)Table 1 The errors(ε)under di ff erent conditions of noises(SNR)between the spectrum extraction result and the original spectrum on LAMOST simulated data
本文提出了一種新的多目標(biāo)光纖光譜數(shù)據(jù)處理流程.鑒于通過(guò)光譜儀獲取的二維光譜數(shù)據(jù)的形成原理,處理流程中的所有算法都是基于二維模型的.對(duì)其中關(guān)鍵處理模塊(波長(zhǎng)定標(biāo),減天光,抽譜)的算法原理進(jìn)行了詳細(xì)的闡述說(shuō)明.以LAMOST系統(tǒng)為例展示了所提光譜數(shù)據(jù)處理流程.基于LAMOST數(shù)據(jù)的部分實(shí)驗(yàn)結(jié)果證明了算法的有效性和優(yōu)越性.綜上所述,建議LAMSOT采用所提的基于二維算法的光譜數(shù)據(jù)處理系統(tǒng),這將大大提高光譜數(shù)據(jù)處理的精度和有效性.此外,由于光譜儀成像的相似性,所提光譜數(shù)據(jù)處理流程也適用于其他望遠(yuǎn)鏡系統(tǒng).
[1]Cui X Q.Proc.SPIE,2006,626703:1
[2]Bolton A S,Burles S.NJPh,2007,9:443
[3]Sharp R,Birchall M N.PASA,2010,27:91
[4]Piskunov N E,Valenti J A.A&A,2002,385:1095
[5]Ritter A,Hyde E A,Parker Q A.PASP,2014,126:170
[6]Bolton A S,Schlegel D J.PASP,2010,122:248
[7]Schlegel D,Abdalla F,Abraham T,et al.2011,arXiv:1106.1706
[8]Ye G H,Zhu J,Ye Z F.PASA,2012,29:66
[9]Wang S,Qin H Q,Ye Z F.EA,2010,28:195
[10]葉根紅,葉中付,祝佳.天文學(xué)報(bào),2013,54:478
[11]Ye G H,Ye Z F,Zhu J.ChA&A,2014,38:272
[12]Zhu J,Ye Z F.PASA,2012,29:78
[13]Zhang B,Ye Z F,Xu X.ExA,2013,36:1
[14]Zhang B,Zhu J,Ye Z F.ExA,2012,33:211
[15]Figueiredo M A T,Nowak R D,Wright S J.ISTSP,2007,1:586
[16]Qin H Q,Ye Z F,Luo A L,et al.Proc.SPIE,2008,701934:1
[17]Zhao G,Zhao Y H,Chu Y Q,et al.RAA,2012,12:723
A Novel Spectral Data Processing Procedure on Multi-Object Fiber Spectral Data Based on 2-D Algorithms
ZHANG Bo YE Zhong-fu XU Xu
(Department of Electronic Engineering and Information Science,University of Science and Technology of China,Hefei 230027)
The data processing procedures currently used on most multi-object fiber spectroscopic telescopes,such as Large Sky Area Multi-Object Fiber Spectroscopic Telescope(LAMOST),the Sloan Digital Sky Survey(SDSS),the Anglo-Australia Telescope (AAT),etc.,are based on one-dimensional(1-D)algorithms.In this paper,LAMOST is taken as an example to display the proposed multi-object fiber spectral data processing procedure.In the using processing procedure on LAMOST,after the pretreatment process,the two-dimensional(2-D)observed raw data are extracted into 1-D intermediate data simply based on 1-D model.Then the subsequent key steps are all done by 1-D algorithms.However,this processing procedure is not in accord with the formation mechanism of the observed spectra.Therefore,it brings a considerable error in each step.To solve the problem,we propose a novel processing procedure that has not been used on LAMOST or other telescopes.The modules of the procedure are reordered,and the main steps are all based on 2-D algorithms.The principles of the core algorithms are explained in detail.Besides,some partial experimental results are shown to prove the effectiveness and superiority of the 2-D algorithms.
telescopes,instrumentation:spectrographs,methods:numerical,techniques:image processing,techniques:spectroscopic
P111;
:A
10.15940/j.cnki.0001-5245.2016.01.009
2015-05-21收到原稿,2015-08-11收到修改稿
?國(guó)家自然科學(xué)基金項(xiàng)目(11078016)資助
?yezf@ustc.edu.cn