李衛(wèi)疆,亓 鑫,王 鋒
(昆明理工大學(xué)云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)
?
基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法*
李衛(wèi)疆,亓鑫,王鋒
(昆明理工大學(xué)云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明650500)
天文圖像背景復(fù)雜且包含噪聲,從圖像中自動識別和分割出有效的天文現(xiàn)象是一個熱點(diǎn)和難點(diǎn)。提出了一種基于方形網(wǎng)格結(jié)構(gòu)的太陽圖像的目標(biāo)檢測方法。此方法將太陽圖像劃分成等大小的方形網(wǎng)格結(jié)構(gòu),基于多閾值選取策略和基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法分離目標(biāo)區(qū)域和背景區(qū)域。實(shí)驗(yàn)結(jié)果表明,該方法在切割準(zhǔn)確度及時間開銷方面取得滿意的效果,對圖像噪聲具有良好的抗干擾性?;诜叫尉W(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法為多種類型的太陽活動的研究提供一種通用的圖像分割方法,也為解決海量天文數(shù)據(jù)存儲的問題提供了一種可行的方案。
基于方形網(wǎng)絡(luò)結(jié)構(gòu)的太陽活動目標(biāo)檢測方法;太陽活動;圖像分割;多閾值;太陽動力學(xué)天文臺
FITS格式以擴(kuò)展性好、數(shù)據(jù)量大等優(yōu)點(diǎn)成為天文學(xué)中普遍采用的文件格式[1]。美國宇航局的太陽動力學(xué)天文臺(Solar Dynamics Observatory, SDO)已能采集4 096像素 × 4 096像素、大小為32 MB的原始FITS圖像。圖像越清晰所提供的信息越多,但同時增加了圖像存儲的時空開銷,天文圖像大數(shù)量級存儲正成為一個棘手的問題。文[2-3]提出分區(qū)域提取特征的方法,并得到廣泛的應(yīng)用。許多圖像分割方法的提出依然沒有解決現(xiàn)有的問題,因?yàn)榉指罱Y(jié)果保留不相關(guān)的背景區(qū)域,數(shù)據(jù)集大小沒有顯著變化,這些將增加后期特征提取的時空開銷。
本文嘗試對FITS圖片集進(jìn)行一定可行的刪減,包括對圖片中目標(biāo)區(qū)域的分離,背景區(qū)域的刪除,這種處理可以在很大程度上減小數(shù)據(jù)集,減小存儲開銷,同時太陽活動區(qū)域被完好地保留。
受多種因素的影響,導(dǎo)致采集的FITS圖像存在多種噪聲,包括外部噪聲和內(nèi)部噪聲[4]。本文提出基于方形網(wǎng)格結(jié)構(gòu)的太陽現(xiàn)象目標(biāo)檢測方法,在多種噪聲干擾的情況下依然能有效標(biāo)注完整的太陽現(xiàn)象區(qū)域,實(shí)驗(yàn)結(jié)果表明,該方法對噪聲具有良好的抗干擾性能。
近年,隨著天文數(shù)據(jù)的急劇增加,太陽特征自動檢測和識別的方法得到了很大的發(fā)展。
種子區(qū)域生長法(Seeded Region Growing, SRG)是區(qū)域分割的常用方法,最早由文[5]提出。該方法能將具有相同特征的聯(lián)通區(qū)域分割出來。即使是早期最簡單的種子區(qū)域生長法也會面臨3個難點(diǎn):種子點(diǎn)的位置選擇,種子數(shù)目的選取,以及區(qū)域生長策略的使用。文[6]結(jié)合邊界提取提出的區(qū)域生長方法將太陽活動按照磁性顯著性的不同定義成不同的封閉輪廓,該方法的初始種子位置選自最大磁性強(qiáng)度的像素點(diǎn)。文[7]將被標(biāo)注區(qū)域的質(zhì)心作為種子結(jié)點(diǎn),進(jìn)而使用多種子的區(qū)域生長方法檢測太陽活動區(qū)。另外的一些研究[8-9]也提出了結(jié)合形態(tài)學(xué)方法的區(qū)域生長算法。
分水嶺算法是邊緣分割的常用方法,計(jì)算方法由文[10]提出。分水嶺算法對于區(qū)域邊緣具有良好的識別能力,并將不同邊緣特征的聯(lián)通區(qū)域分割出來。文[11]將形態(tài)學(xué)重構(gòu)方法與分水嶺算法結(jié)合,對粒狀結(jié)構(gòu)明顯的太陽現(xiàn)象起到較好的分割效果。文[12]提出一種基于多閾值的多級跟蹤算法,達(dá)到既定閾值水平的像素逐漸加入到相鄰的顆粒中,同時保持不同顆粒間的最小距離。這種方法是以分水嶺算法為基礎(chǔ)實(shí)現(xiàn)的。文[13]提出另一種標(biāo)記控制的分水嶺方法,用來自動檢測粒狀結(jié)構(gòu)。
閾值分割是最常用的圖像分割方法之一。文[14]提出自適應(yīng)的暗條活動分割方法,暗條的中心點(diǎn)位置和半徑的檢測采用級聯(lián)Hough變換圓。文[15]結(jié)合區(qū)域生長法和全局閾值分割暗條。文[16]利用全局閾值、局部閾值結(jié)合的數(shù)學(xué)形態(tài)學(xué)方法分割暗條活動。
種子區(qū)域生長法和分水嶺方法因各自特點(diǎn)被廣泛用于太陽活動分割,尤其是活動區(qū)[6-7]、暗條[8],這些太陽活動具有明顯的灰度特征。然而,日冕噴射、暗條激活等太陽活動,其灰度特征相對不明顯,種子區(qū)域生長法和分水嶺方法對以上太陽活動的分割會造成過度分割或圖像空洞兩種極端的結(jié)果。相比而言,閾值分割方法更簡單高效,并且適用性良好。
本文提出一種自動檢測太陽活動的方法,該方法在分割太陽活動之后,能將活動區(qū)域保存為新的數(shù)據(jù)集。首先,該方法構(gòu)造了一種基于方形網(wǎng)格的存儲單元用于存儲圖像的灰度值,然后利用閾值選取策略從閾值區(qū)間選擇合適的閾值。最后,利用基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法實(shí)現(xiàn)不同閾值的分割方法分割不同的太陽活動。
本部分詳細(xì)介紹基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法的內(nèi)容,包括方形網(wǎng)格結(jié)構(gòu)以及多閾值方法。
2.1圖像初始化
不可見的背景區(qū)域(灰度區(qū)間0~99)、可見區(qū)域中的較暗區(qū)域(灰度區(qū)間100~150)與較亮區(qū)域(灰度區(qū)間151~255)共同構(gòu)成了可見的目標(biāo)區(qū)域。圖像初始化處理如下:
置為0目標(biāo)區(qū)域置為255
原始FITS圖像灰度范圍是0~65 535,將灰度等級從16位降到8位,不僅能減少存儲空間,而且能減少圖像處理的時間。
2.2網(wǎng)格結(jié)構(gòu)
未經(jīng)處理的數(shù)據(jù)集圖像的尺寸很大,如果對圖像每個像素點(diǎn)進(jìn)行處理,會面臨巨大的時空開銷。本文提出的網(wǎng)格劃分能在一定程度上縮減這種開銷。
步驟1: 網(wǎng)格劃分
[M,N]表示原始圖像大小為M行、N列。m×n則代表每個網(wǎng)格圖像的大小,給出m、n的求解公式:
(1)
步驟2: 圖像存儲
(1)建立直角坐標(biāo)系
水平方向以方形網(wǎng)格的列數(shù)為單位,垂直方向以方形網(wǎng)格的行數(shù)為單位,對圖像的所有方形網(wǎng)格的存儲和計(jì)算都建立在這個坐標(biāo)系的基礎(chǔ)上,這樣對圖片的處理將以網(wǎng)格為單位。
[pixel_row, pixel_col]表示像素點(diǎn)的坐標(biāo);[cell_row, cell_col]代表網(wǎng)格圖像的坐標(biāo)。因此原始FITS圖像能夠存儲在一個四維數(shù)組中,該數(shù)組定義如下:
Block(pixel_row,pixel_col,cell_row,cell_col),
(2)
(2)降維
計(jì)算復(fù)雜性理論強(qiáng)調(diào)在運(yùn)算效率方面,低維的數(shù)據(jù)結(jié)構(gòu)要比高維的數(shù)據(jù)結(jié)構(gòu)表現(xiàn)更優(yōu)[17]。因此,采用三維數(shù)組存儲原始FITS圖像。
Block(pixel_row,pixel_col,index),
(3)
如圖1(a),原始FITS圖像被網(wǎng)格劃分。圖1(b)表示四維數(shù)組結(jié)構(gòu)存儲原始圖像。圖1(c)表示三維數(shù)組結(jié)構(gòu)存儲原始圖像??紤]到實(shí)驗(yàn)采用的數(shù)據(jù)集圖像有1 024像素 × 1 024像素和768像素 ×768像素兩種,可分別分割成32行 × 32列和24行 × 24列數(shù)量的方形網(wǎng)格,劃分后的每個單元格都包含同等數(shù)量的像素個數(shù)。
圖1方形網(wǎng)格結(jié)構(gòu)
Fig.1Thestructureofthesquaregrid
將網(wǎng)格作為最小的劃分單位,相對于傳統(tǒng)以單個像素作為最小劃分單位,具有3點(diǎn)優(yōu)勢:
(1)對圖像的處理過程加快;
(2)針對不同區(qū)域的網(wǎng)格選取不同的閾值,提高處理精度;
(3)有效防止圖像噪聲的干擾。
2.3最小外接矩形
最小外接矩形(Minimum Bounding Rectangle, MBR)是圖像分類和識別研究中最常用的方法,被用來提取目標(biāo)區(qū)域的幾何特征[18]。這里介紹一種基于方形網(wǎng)格結(jié)構(gòu)的最小外接矩形,求解過程如下:
步驟1: 縫隙碼
第2.2節(jié)中,建立了網(wǎng)格圖像直角坐標(biāo)系,因此,縫隙碼定義如下:
其中,Pk∈{P0,P1,P2…Pn-1}存儲每個凸點(diǎn)的坐標(biāo)值;P0=(u0,v0)表示起始點(diǎn)的坐標(biāo);dl表示Pk移動的方向,dl∈{0, 1, 2, 3}。
如圖2,目標(biāo)區(qū)域的邊界縫隙碼表示為
{(u0,v0)232323230300300100101121232211}
P0P7P14P21
圖2目標(biāo)區(qū)域邊界縫隙碼
Fig.2The crack chain code of the target region boundary
步驟2: 求解最小外接矩形
dl∈{1, 3}代表垂直方向;dl∈{0, 2}代表水平方向,P0、P7、P14、P21是縫隙碼中的邊界極值。最后可求出最小外接矩形的4個坐標(biāo)點(diǎn):
2.4基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法策略
將上述基于方形網(wǎng)格結(jié)構(gòu)而提出的改進(jìn)方法應(yīng)用于以下算法。
輸入:一張來自數(shù)據(jù)集的原始FITS圖像
輸出:一張包含完整太陽活動的目標(biāo)區(qū)域圖像
2:ifIMG?[0, 99]∨IMG?[256, ∞]
3:setIMGto0 ∨setIMGto255
6:Block(pixel_row,pixel_col,index)→img
7: if existMBR(img)∨~existMBR(img)
8: set threshold to T2 ∨ set threshold to T1
9: count the number:Block(pixel_row,pixel_col,index)≥T
10: ifT≥threshold_number
11: setBlock(pixel_row,pixel_col,index) to 255
12: else setBlock(pixel_row,pixel_col,index) to 0
13: count the density of connected square grids
14: ifdensity≤threshold_density
15: remove the grid area
16: else end
圖像歸一化的目的是將原FITS圖像的像素灰度范圍從原來的(0, 65 535)限定為(0, 255),從而減小時間開銷和計(jì)算難度。參考每張F(tuán)ITS圖像的灰度特征選取閾值T1和T2。對閾值T的選取要滿足先行條件,即判斷圖像的外接矩形是否存在。而Threshold_number和Threshold_density則取自經(jīng)驗(yàn)值。結(jié)果如圖3。
圖3GBTD處理過程
Fig.3The processing procedure of GBTD
(d)所占原圖比例35%,對比(d)與(a),處理結(jié)果極大地去除了背景區(qū)域的干擾,接下來的實(shí)驗(yàn)從若干方面驗(yàn)證基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法的可行性。
3.1數(shù)據(jù)集
本文采用的數(shù)據(jù)來源于太陽動力學(xué)天文臺*http://www.cs.montana.edu/angryk/SDO/data/,包含8種太陽現(xiàn)象,每種200張,共1 600張,如表1。
3.2閾值選取策略
通過觀察圖像,發(fā)現(xiàn)了太陽圖像的一些特征,具有明顯太陽現(xiàn)象的區(qū)域灰度值較大,而不可見的背景區(qū)域灰度值較小。常用的灰度級數(shù)有8、16、32等,而人眼識別程度最高的級數(shù)是8[19],可行的閾值范圍在100~255之間,將灰度間劃分成100~150、151~200、201~255,然后采用8位共256個灰度等級,繪制灰度范圍0~255的灰度直方圖。
表1 8種太陽現(xiàn)象
借助灰度直方圖的統(tǒng)計(jì)結(jié)果,閾值區(qū)間100~150所占比例高于60%,151~200和201~255所占比例低于40%。這種差異在灰度圖像中表現(xiàn)為明顯的紋理特征,進(jìn)而幫助我們選取閾值T1和T2。
3.3評估切割精確度
下面的實(shí)驗(yàn)給出一種衡量切割精確度的方法。選擇各種太陽活動的數(shù)據(jù)集的50張圖片,一共有400副圖像,然后手動標(biāo)注出這些圖像中的太陽活動區(qū)。標(biāo)記區(qū)域可以是完整的一個區(qū)域,或者是離散的多個區(qū)域的組合。以手動標(biāo)記區(qū)域?yàn)闃?biāo)準(zhǔn),分別比較種子區(qū)域生長法、基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法、分水嶺方法的精確度。結(jié)果見圖4和圖5。
圖4對比了3種方法的切割精度,每個方法包含400組數(shù)據(jù),觀察這些離散數(shù)據(jù)點(diǎn)發(fā)現(xiàn),分水嶺方法達(dá)到了較高的切割精度,其次是基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法,最差的是種子區(qū)域生長法。實(shí)際上,每種方法的平均切割精度,種子區(qū)域生長法是0.53,基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法是0.56,分水嶺法是0.61。
圖5比較了3種方法的時間開銷,明顯的區(qū)別在于基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法的時間成本最小,其次是種子區(qū)域生長法,最差的是分水嶺方法。另外,每種方法的平均時間消耗,基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法是0.41 s,種子區(qū)域生長法為2.10 s,分水嶺方法是2.53 s。
圖43種方法的切割精度比較
Fig.4Comparison of cutting accuracy among three methods
圖53種方法的時間開銷比較
Fig.5Comparison of time consumption among three methods
3.4評估抗噪性
圖片噪聲作為隨機(jī)誤差,是圖像處理中最常見的干擾因素。為了測試基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法對多種噪聲的抗干擾性,選取密度均為0.05的椒鹽噪聲和高斯噪聲分別加入到圖像中,分別與未加噪聲的原圖進(jìn)行分割相似度的比較(分割相似度是指對噪聲圖像與原圖分割后的圖像的相似度),結(jié)果見圖6。
圖6(a)高斯噪聲圖片與原圖的分割相似度;(b)椒鹽噪聲圖片與原圖的分割相似度
Fig.6(a)Comparison of Gaussian noise image and original image in segmentation similarity;(b)Comparison of salt and pepper noise image and original image in segmentation similarity
觀察圖6,加入兩種噪聲后的圖片與原圖對比,均達(dá)到很高的分割相似度,這一結(jié)果在圖6(a)中維持在90%及以上,而在圖6(b)中超過95%。出現(xiàn)相似度較低的情況,其原因是多方面的,既跟高斯噪聲的分布相關(guān),也與圖片中太陽活動的分布特點(diǎn)相關(guān),可通過縮小網(wǎng)格的大小改進(jìn)實(shí)驗(yàn)結(jié)果。
本文根據(jù)數(shù)據(jù)集圖像的灰度分布特點(diǎn),提出一種基于方形網(wǎng)格結(jié)構(gòu)的太陽現(xiàn)象目標(biāo)檢測方法,其中,多種閾值選取策略能應(yīng)用于不同的數(shù)據(jù)集,具有一定的可移植性?;诜叫尉W(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法不僅能識別完整的太陽現(xiàn)象,而且有效降低了數(shù)據(jù)集存儲的開銷。在接下來的研究中會考慮采用自動閾值選取策略來改進(jìn)基于方形網(wǎng)格結(jié)構(gòu)的太陽活動目標(biāo)檢測方法,以期獲得更優(yōu)的分割結(jié)果。
[1]崔辰州, 李文, 于策, 等. FITS數(shù)據(jù)文件的檢索和訪問[J]. 天文研究與技術(shù)——國家天文臺臺刊, 2008, 5(2): 116-123.
Gui Chenzhou, Li Wen, Yu Ce, et al. Search and location of FITS data files[J]. Astronomical Research & Technology——Publications of National Astronomical Observatories of China, 2008, 5(2): 116-123.
[2]Banda J M, Angryk R A. Selection of image parameters as the first step towards creating a CBIR system for the Solar Dynamics Observatory[C]// DICTA′10 Proceedings of the 2010 International Conference on Digital Image Computing: Techniques and Applications. 2010: 528-534.
[3]Banda J M, Liu C, Angryk R A. Region-based querying of solar data using descriptor signatures[C]// IEEE International Conference on Data Mining Workshops. 2013: 1-7.
[4]Burger H C, Sch?lkopf B, Harmeling S. Removing noise from astronomical images using a pixel-specific noise model[C]// 2011 IEEE International Conference on Computational Photography (ICCP). 2011: 1-8.
[5]Yokoya N, Levine M D. Range image segmentation based on differential geometry: a hybrid approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 11(6): 643-649.
[6]James McAteer R. T, Gallagher P T, Ireland J, et al. Automated boundary-extraction and region-growing techniques applied to solar magnetograms[J]. Solar Physics, 2005, 228(1): 55-66.
[7]Benkhalil A, Zharkova V V, Zharkov S, et al. Active region detection and verification with the solar feature catalogue[J]. Solar Physics, 2006, 235(1): 87-106.
[8]Gao Jianlin, Zhou Mengchu, Wang Haimin. A threshold and region growing combined method for filament disappearance area detection in solar images[C]// Conference on Information Sciences and Systems. 2001.
[9]Parnell C E, DeForest C E, Hagenaar H J, et al. A power-law distribution of solar magnetic fields over more than five decades in flux[J]. The Astrophysical Journal, 2009, 698: 75-82.
[10]Vincent L, Soille P. Watersheds in digital spaces: an efficient algorithm based on immersion simulations[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991, 13(6): 583-598.
[11]Feng Song, Xu Zhi, Deng Linhua, et al. Automatic segmentation of granules of the solar photosphere using morphological reconstruction and watershed transform[C]// 6th International Conference on Intelligent Networks and Intelligent Systems (ICINIS). 2013: 300-303.
[12]Bovelet B, Wiehr E. A new algorithm for pattern recognition and its application to granulation and limb faculae[J]. Solar Physics, 2011, 201(1): 13-26.
[13]Xie Z X, Yu D R, Zhang J, et al. Properties of magnetic elements in the quiet Sun using the marker-controlled watershed method[J]. Astronomy and Astrophysics, 2009, 505(2): 801-810.
[14]Yuan Y, Shih F Y, Jing J, et al. Automatic solar filament segmentation and characterization[J]. Solar Physics, 2011, 272: 101-117.
[15]Gao J L, Wang H M, Zhou M C. Development of an automatic filament disappearance detection system[J]. Solar Physics, 2002, 205(1): 93-103.
[16]Shih F Y, Kowalski A J. Automatic extraction of filaments in Hα solar images[J]. Solar Physics, 2003, 218(1): 99-122.
[17]Ben-Sasson E, Galesi N. Space complexity of random formula in resolution[C]// IEEE Conference on Computational Complexity. 2001: 42-51.
[18]盧蓉, 范勇, 陳念年, 等. 一種提取目標(biāo)圖像最小外接矩形的快速算法[J]. 計(jì)算機(jī)工程, 2010, 36(21): 178-180.
Lu Rong, Fan Yong, Chen Niannian, et al. Fast algorithm for extracting minimum enclosing rectangle of target image[J]. Computer Engineering, 2010, 36(21): 178-180.
[19]謝維信, 秦桉. 人的視覺對灰度級別的分辨能力及視覺內(nèi)部噪聲的研究[J]. 航天醫(yī)學(xué)與醫(yī)學(xué)工程, 1991, 4(1): 51-55.
Xie Weixin, Qin An. The gray level resolution and intrinsic noise of human vision[J]. Space Medicine & Medical Engineering, 1991, 4(1): 51-55.
A Square Grid Structure for Target Detection of Solar Activities
Li Weijiang, Qi Xin, Wang Feng
(Computer Technology Application Key Laboratory of Yunnan Province, Kunming University of Science and Technology,Kunming 650500, China, Email: hrbrichard@126.com)
Astronomical image background is complicated and contains a lot of noise. To identify and segment astronomical activities effectively and automatically from an astronomical image is difficult and a research hot-spot. This paper proposes a target detection method for solar activity based on the structure of square grid (GBTD). For this method, the solar image is divided into a square grid structure with the same size. Based on multiply-thresholds selection strategy and GBTD strategy, it segments the target area and background area. The experimental results show that this method delivers satisfactory performance in accuracy and time-cost; it also produces an obvious anti-jamming performance for image noise. GBTD method provides a general image segmentation method for investigations of various types of solar images; it also provides a feasible method for solving the problem of mass astronomical data storage.
GBTD; Solar activities; Image segmentation; Multi-threshold; SDO
國家自然科學(xué)基金 (61363045) 資助.
2015-11-23;
2015-12-31
李衛(wèi)疆,男,博士. 研究方向:信息檢索. Email: hrbrichard@126.com
TP391.41
A
1672-7673(2016)04-0481-08
CN 53-1189/PISSN 1672-7673