国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Mark5B+GPU脈沖星觀測系統(tǒng)

2014-05-13 01:24李佳功徐永華李志玄季凱帆
天文研究與技術(shù) 2014年4期
關(guān)鍵詞:中央處理器脈沖星色散

李佳功,徐永華,李志玄,汪 敏,季凱帆

(1.昆明理工大學云南省計算機應用重點實驗室,云南 昆明 650500;2.中國科學院云南天文臺,云南 昆明 650011)

基于Mark5B+GPU脈沖星觀測系統(tǒng)

李佳功1,徐永華2,李志玄2,汪 敏2,季凱帆1

(1.昆明理工大學云南省計算機應用重點實驗室,云南 昆明 650500;2.中國科學院云南天文臺,云南 昆明 650011)

云南天文臺40 m射電望遠鏡進行的脈沖星觀測數(shù)據(jù)量巨大,必須實現(xiàn)數(shù)據(jù)的實時處理,否則將會產(chǎn)生海量的數(shù)據(jù)積壓。為實現(xiàn)這一目標,采用圖形處理器架構(gòu),對Mark5B數(shù)據(jù)進行解碼、消色散、折疊等處理。實驗結(jié)果表明,對以1 s 8 MB的實時采樣,可以在0.51 s內(nèi)處理完成,從而實現(xiàn)了實時處理的要求。首先介紹這一觀測系統(tǒng)各部分的圖形處理器實現(xiàn),然后相對于傳統(tǒng)中央處理器構(gòu)架,對各部分的運算速度進行了詳細的對比。針對時間開銷最大的消色散部分,分析了單次傅里葉變換的數(shù)據(jù)量大小對執(zhí)行效率的影響。從系統(tǒng)最終的輸出輪廓和柱狀圖上可以看到實時處理的結(jié)果符合要求。最后對存在的問題和未來的工作進行了討論。

脈沖星;40 m射電望遠鏡;GPU;相干消色散;CUDA

CN53-1189/P ISSN1672-7673

脈沖星輻射的電磁波在傳播過程中,由于受到星際介質(zhì)的干擾,不同頻率的電磁波經(jīng)過星際介質(zhì)后產(chǎn)生的延遲不同,會讓所看到的脈沖星輪廓展寬,影響對脈沖星的觀測,所以在進行脈沖星觀測時通常要進行消色散處理。消色散分為兩種方式,一種是相干消色散,通過軟件處理的方式祛除色散,另一種是非相干消色散,是通過濾波器組延遲信號的方式祛除色散。相干消色散可以完全祛除色散,但是需要進行大量的浮點計算。

隨著A/D采樣芯片工作時鐘的提高和數(shù)字電路技術(shù)的發(fā)展,可以在更高頻率與帶寬上將模擬信號進行數(shù)字化處理,最高可以達到5 GHz采樣,采用8 bit單通道觀測每秒數(shù)據(jù)量達到5 GB,利用磁盤存儲長時間的原始數(shù)據(jù),然后再進行事后處理非常困難,因此迫切需要進行實時處理。在對Mark5B數(shù)據(jù)處理過程中,相干消色散花費時間最長,單純的中央處理器在處理1 s的數(shù)據(jù)時要花費數(shù)秒的時間,不能滿足實時觀測的需要。為滿足后端對每秒內(nèi)的Mark5B數(shù)據(jù)在1 s內(nèi)處理完,采用基于英偉達(NVIDA)公司的CUDA架構(gòu)對Mark5B數(shù)據(jù)進行處理。

國內(nèi)數(shù)字化脈沖星系統(tǒng)的研發(fā)還處于起步階段。國家天文臺和新疆天文臺分別從澳大利亞Australia Telescope National Facility(ATNF)引進了PDFB系統(tǒng)。新疆天文臺利用VLBI終端進行了相干消色散的初步研究。云南天文臺利用國內(nèi)自主研發(fā)的VLBI終端在相干消色散方面開展工作,并取得了一系列成績[1-2]。上海天文臺則在DBBC硬件平臺上開發(fā)了非相干消色散模塊,成功進行了觀測并獲得較好的結(jié)果[3]。國家天文臺基于計算機集群對相干消色散算法開展了研究[4]。國際上有英國Low-Frequency Array For Radio Astronomy(LOFRA)系統(tǒng)[5],澳大利亞的Australian Square Kilometre Array Pathfinder (ASKAP)脈沖星觀測系統(tǒng)[6],法國南錫天文臺的相干消色散脈沖星觀測系統(tǒng)[7]。關(guān)于圖形處理器的有英國的相干消色散的脈沖星搜索系統(tǒng)[8]和澳大利亞的非相干消色散脈沖星觀測系統(tǒng)[9]。

本文采用圖形處理器架構(gòu),對Mark5B數(shù)據(jù)進行解碼、消色散、折疊等處理,對脈沖星輪廓的折疊采用了tempo2預報文件的方式,可以輸出PSRFITS格式并且最終顯示脈沖星的輪廓。在解碼、折疊采用CUDA多線程技術(shù),對系統(tǒng)消耗時間最多的相干消色散部分使用了CUDA的傅里葉變換庫cufft。提高了整個系統(tǒng)的效率,為實時脈沖星觀測系統(tǒng)的實現(xiàn)準備了條件。

CUDA是基于英偉達(NVIDA)公司推出的基于圖形處理器系統(tǒng)的運算平臺。隨著圖形圖像卡技術(shù)的發(fā)展,圖形處理器顯示出強大的運算功能,而且圖形處理器為顯示圖像做了優(yōu)化,在計算上已經(jīng)超越了通用的中央處理器。由于其特點是處理密集型數(shù)據(jù)和并行數(shù)據(jù)計算,因此CUDA非常適合需要大規(guī)模并行計算的領(lǐng)域。圖形處理器高性能計算集群的高計算能力,性格便宜,配置靈活,易于擴展,使用方便和高效。它可以滿足國內(nèi)眾多學科的高計算能力要求高的性能價格比。而CUDA快速傅里葉變換(cufft)庫給用戶提供一個簡單的接口實現(xiàn)傅里葉變換,可以讓計算快速傅里葉變換的速度提升10倍以上[10]。

1 觀測系統(tǒng)和觀測流程

1.1 觀測系統(tǒng)

云南天文臺40 m射電望遠鏡現(xiàn)配備有S和X波段饋源及S/X雙波段致冷接收機。數(shù)字化脈沖星觀測系統(tǒng)分為3部分:數(shù)據(jù)采集、數(shù)據(jù)記錄和數(shù)據(jù)處理。數(shù)據(jù)采集采用DBBC(Digital Base Band Converter),6通道,單通道帶寬可從0.5 MHz一直到32 MHz;數(shù)據(jù)記錄終端采用美國Haystack天文臺研制的用于VLBI聯(lián)測的Mark5B記錄系統(tǒng),記錄速率最高可達2 G;數(shù)據(jù)處理采用基于圖形處理器的CUDA架構(gòu),進行解碼、消色散、折疊以及輸出等。觀測系統(tǒng)的流程如圖1。

圖1 觀測系統(tǒng)流程圖Fig.1 The flowchart of the observation system

1.2 觀測流程

脈沖星的觀測步驟為,首先啟動DBBC控制程序,加載信號處理板和信號綜合板,設置BBC本振,檢查模式設置和時鐘,等待DBBC初始化完成,然后檢測VLBI Mark5B記錄終端網(wǎng)絡狀態(tài)和Mark5B硬盤是否正常工作。下載Schedule相關(guān)文件,生成summary文件并修改模擬FS機的PRC文件,檢測硬盤是否可以記錄足夠的數(shù)據(jù),檢查分頻器的接線是否按照PRC文件中的設置連接。在DBBC和Mark5B正常啟動后,啟動控制計算機,選擇所要觀測的脈沖星源,例如J0835-4510,然后編寫該脈沖星的觀測綱要文件。采用在S波段觀測J0835-4510脈沖星,觀測設置為1通道,2 bits量化,帶寬16 MHz,觀測通道頻率為2 240 MHz,接著啟動DBBC數(shù)據(jù)采集終端,控制計算機根據(jù)觀測綱要文件開始記錄Mark5B數(shù)據(jù),將記錄好的Mark5B數(shù)據(jù)存儲在圖形處理器計算機上。運行程序?qū)ark5B數(shù)據(jù)處理,最后顯示脈沖星的輪廓。

2 數(shù)據(jù)處理流程

數(shù)據(jù)處理流程包括4方面:數(shù)據(jù)解碼、相干消色、散折疊輪廓和輸出PSRFITS。

2.1 Mark5B數(shù)據(jù)解碼

Mark5B硬盤的數(shù)據(jù)格式如表1。

表1 Mark5B硬盤的數(shù)據(jù)格式Table 1 The header format of a data frame on the Mark5B hard disk

對于Mark5B數(shù)據(jù),把數(shù)據(jù)劃分成等長的硬盤幀(DF),每個硬盤幀包括4個32比特字的幀頭,跟著2 500個32比特字的數(shù)據(jù)。從表1可以看出,Mark5B幀頭的Word0是一個固定的同步字,這樣在解碼的時候就可以通過驗證Word0確保數(shù)據(jù)的完整性,Word1包括用戶自定義數(shù)據(jù)以及每秒內(nèi)的硬盤幀數(shù),Word2和Word3是用來提取數(shù)據(jù)產(chǎn)生的MJD值,用于折疊輪廓時數(shù)據(jù)要折疊的位置。對于第2個字節(jié)的JJJSSSS,JJJ代表MJD的后3位,SSSSS代表UTC當天時間的秒數(shù),根據(jù)JJJ和SSSSS就可以準確地計算記錄數(shù)據(jù)的MJD時間,而不必通過計算得到,可以確保數(shù)據(jù)處理的準確性。

對于Mark5B數(shù)據(jù)解碼的過程,首先Mark5B是2 bit代表1個采樣點,所以1個字節(jié)可以解碼成4個浮點型數(shù)據(jù)。采用中央處理器解碼時,首先讀取第1個字節(jié)進行解碼,然后讀取下一個字節(jié)直至數(shù)據(jù)全部完成解碼。對于圖形處理器進行解碼的時候,首先把原始數(shù)據(jù)從中央處理器傳到圖形處理器,然后分配多個線程,第1個線程實現(xiàn)第1個字節(jié)的解碼,第2個線程實現(xiàn)第2個字節(jié)的解碼,以此類推。由于每個線程之間是并行執(zhí)行的,可以利用圖形處理器實現(xiàn)對解碼的加速,最后把圖形處理器解碼后的數(shù)據(jù)傳回中央處理器進行消色散處理[11]。

在實驗中,對以1 s 8 MB的采樣數(shù)據(jù)在中央處理器端解碼需要0.21 s,在圖形處理器端可以利用多線程進行解碼,首先把數(shù)據(jù)從中央處理器傳到圖形處理器,然后利用多線程進行解碼,最后把解碼后數(shù)據(jù)傳回中央處理器。采用1×1線程進行解碼需要0.35 s,采用1×256線程進行解碼需要0.19 s,采用256×256線程進行解碼需要0.09 s,采用8192×256只需要0.05 s,雖然利用圖形處理器會額外產(chǎn)生中央處理器與圖形處理器之間傳輸數(shù)據(jù)的時間,但是用圖形處理器解碼的綜合效率仍然可以提高4倍以上。

2.2 相干消色散

由于受到色散效應的影響,往往接收的信號導致脈沖星輪廓變寬,為了消除色散效應的影響,需要對數(shù)據(jù)進行消色散處理。實驗中采用的是相干消色散的方法,相干消色散的原理是將所接收的信號進行快速傅里葉變換到頻域,然后將頻域上的各頻點的信號乘以頻率響應函數(shù)Chirp,再經(jīng)過逆傅里葉變換到時域,實現(xiàn)將不同頻率成分的信號對齊到某一個頻點。這里,頻率響應Chirp函數(shù)表示為:

其中V0為所選基準頻率;V為電磁波頻率和基準頻率的差Vx-V0,數(shù)據(jù)變換到頻域后,與Chirp相乘即可實現(xiàn)所需相移。

相干消色散的循環(huán)卷積流程如圖2。在進行逆傅里葉變換得到時域數(shù)據(jù)后,此時得到的時域數(shù)據(jù)并不是所有點都是有效的。因為在離散化傅里葉變換算法中,當一列數(shù)據(jù)與另一N點的數(shù)據(jù)進行卷積時,每一點的卷積值取決于這一點前后各nd/2點。于是,進行每次消色散時,有效數(shù)據(jù)為去掉頭尾各nd/2點后所得的數(shù)據(jù)。因為每次頭尾都去掉了一部分數(shù)據(jù)為了保證數(shù)據(jù)的時域連續(xù)性,每次取來作傅里葉變換的數(shù)據(jù)的前一段nd,應取為前一次作傅里葉變換的數(shù)據(jù)的最后一段nd。消色散過程如下:

(1)首先設置一次要處理的傅里葉變換點數(shù)N;

(2)計算N點數(shù)據(jù)的頻率響應函數(shù)Chirp;

(3)將N的數(shù)據(jù)進行傅里葉變換,然后再頻域乘以頻率響應函數(shù)Chirp;

(4)將相乘的結(jié)果進行逆傅里葉變換到時域;

(5)在時序的數(shù)據(jù)頭和尾分別丟棄nd/2的數(shù)據(jù),存儲余下的N-nd數(shù)據(jù);

(6)從輸入的數(shù)據(jù)流讀取下一個N-nd點,然后加上一次數(shù)據(jù)的最后nd數(shù)據(jù)組成新的N點數(shù)據(jù),繼續(xù)執(zhí)行(2)步驟直至數(shù)據(jù)處理完畢。

這一部分是整個數(shù)據(jù)處理時間開銷最大的部分,因此采用CUDA提供的CUFFT庫函數(shù)利用圖形處理器進行處理,從而極大地加快了運算速度。對于其效率的分析,在第3節(jié)中有詳細說明。

圖2 循環(huán)卷積流程圖Fig.2 The flowchart of the cyclic convolution

2.3 折疊輪廓

由于脈沖星是微弱的具有周期性的射電源,為了從噪聲中提取微弱的脈沖信號,可以對消色散的數(shù)據(jù)按照周期進行折疊處理以提高信噪比。首先使用脈沖星數(shù)據(jù)處理常用軟件tempo2生成觀測數(shù)據(jù),當天的脈沖星輪廓預報文件0835-4510.polyco,此文件用于折疊脈沖星的輪廓。

對于1通道,單偏振,帶寬16 MHz,中心頻率是2 240 MHz,程序會從幀頭讀取記錄數(shù)據(jù)的MJD時間,然后計算數(shù)據(jù)應該折疊的位置,由于很多點會折疊在一個位置上,最后取這些點的平均值,就是此位置的值,根據(jù)這些值就可以形成脈沖星的輪廓圖。折疊步驟如下:

(1)對Mark5B數(shù)據(jù)進行相干消色散處理,計算處理后的時序數(shù)據(jù)采樣率Tsamp;

(2)創(chuàng)建一個nbins=1 024的一維數(shù)組用于存放需要折疊的數(shù)據(jù);

(3)將(1)處理后采樣率為Tsamp的數(shù)據(jù)通過0835-4510.polyco計算出所要折疊在nbins的位置,第j個采樣點的相位是j/pfold,pfold為脈沖星周期;

(4)找到每一個采樣點最接近的nbins位置,然后把這個采樣點的值加在nbins上;(5)重復第(3)步驟直至顯示出脈沖星的輪廓[12]。

2.4 輸出PSRFITS

PSRFITS是天文觀測常用數(shù)據(jù)格式,實驗的處理結(jié)果輸出為PSRFITS格式,進而可以利用psrchive、tempo2等脈沖星處理軟件對數(shù)據(jù)進行處理。

3 數(shù)據(jù)處理結(jié)果與分析

實驗中使用的脈沖星觀測系統(tǒng)的硬件配置如表2。

表2 硬件系統(tǒng)配置Table 2 The configuration of the hardware system

實驗中分別采用中央處理器與圖形處理器(配置如表2)兩種不同的方式對J0835-4510在采用1通道、單偏振、2 bit采樣、總帶寬16 MHz觀測模式下1 s內(nèi)8 MB數(shù)據(jù)進行處理。對于1 s的數(shù)據(jù)是8 MB,每一個字節(jié)可以解碼為4個浮點型數(shù)據(jù),所以要處理的浮點型數(shù)據(jù)量為32 M。在去掉頭尾數(shù)據(jù)后,將其進行分段傅里葉變換,表3和表4對比中央處理器與圖形處理器各個模塊的處理時間以及cufft庫與fftw3.0庫在選擇不同傅里葉變換點數(shù)時做相干消色散所需要的時間。

表3 中央處理器測試時間Table 3 The running times of the CPU architecture in the tests

表4 圖形處理器測試時間Table 4 The running times of the GPU architecture in the tests

從表3和表4可以看出,在中央處理器下,消色散所占用的時間是整個系統(tǒng)的80%左右,在圖形處理器下,消色散所占用的時間是整個系統(tǒng)的60%左右,而對于其他部分解碼、折疊占用時間相對較少。所以把消色散處理的時間盡可能優(yōu)化,對整個系統(tǒng)的優(yōu)化效果最為明顯。圖形處理器在處理單次傅里葉變換點數(shù)為16 K和32 K時,所花費的總時間比中央處理器僅僅快了2倍,但是在傅里葉變換點越來越多達到2 048 K的時候,圖形處理器的優(yōu)勢已經(jīng)呈現(xiàn)出來。當傅里葉變換點數(shù)為16 K時,所分的段數(shù)為2 249,隨著傅里葉變換點數(shù)的增加,段數(shù)是逐漸減小的,在cufft下,每做一次傅里葉變換時間都很短,而fftw所花費的時間越來越多。所以當傅里葉變換單次點數(shù)增加時,圖形處理器所花費的總時間會遠遠小于中央處理器。中央處理器在傅里葉變換點數(shù)32 K時效率最高,所花費時間是4.24 s,而圖形處理器在fft點數(shù)2 048 K時,做消色散所消耗的時間僅有0.3 s,達到了14倍的效率。

在對解碼、折疊分別采用CUDA的多線程實現(xiàn),解碼、折疊比中央處理器架構(gòu)的快4倍、2倍。從圖3可以看出,中央處理器在整個系統(tǒng)所花費的最短時間是4.80 s。而圖形處理器最少時間僅有0.51 s。采用圖形處理器的系統(tǒng)比中央處理器的系統(tǒng)能達到9倍的優(yōu)化效果。

根據(jù)以上計算結(jié)果,利用脈沖星常用數(shù)據(jù)處理軟件psrchive的pazi命令可以查看輸出數(shù)據(jù)的輪廓[13]。圖4是J0835-4510在1通道、2 bit采樣、帶寬為16 MHz、中心頻率為2 206 MHz,在中央處理器架構(gòu)下處理10 s的Mark5B數(shù)據(jù)得到輪廓圖,信噪比為76,圖5是J0835-4510在GPU架構(gòu)下處理10 s的Mark5B數(shù)據(jù)得到的輪廓圖,信噪比為76.8。與在中央處理器架構(gòu)下處理的結(jié)果相比,脈沖星的輪廓基本上是一致的,信噪比可以滿足脈沖星觀測的要求,證明了利用圖形處理器實時處理的結(jié)果是符合要求的。

圖3 CPU和GPU分別在1 s的數(shù)據(jù)量不同F(xiàn)FT點數(shù)下系統(tǒng)的總時間,fftw和cufft分別在1 s的數(shù)據(jù)量不同fft點數(shù)下相干消色散的時間Fig.3 The running times of the CPU and GPU architectures for FFT operations of various data-point numbers. Also plotted are the running times of coherent removal of dispersion with the FFTW and CUFFT for data of 1 second but of various data-point numbers

4 結(jié) 論

本文提出了利用圖形處理器實時處理Mark5B數(shù)據(jù)的脈沖星觀測系統(tǒng),與之前的云南天文臺40 m射電望遠鏡實現(xiàn)的相干消色散算法相比,在脈沖星輪廓的折疊采用了tempo2預報文件的方式,可以獲得更精確的脈沖星輪廓。

對系統(tǒng)消耗時間最多的相干消色散部分使用了CUDA的傅里葉變換庫cufft,在對脈沖星J0835-4510進行觀測,觀測設置為單通道、2 bit采樣、帶寬為16 MHz、中心頻率為2 206 MHz。對以1 s的數(shù)據(jù)8 MB實時采樣,可以在0.51 s內(nèi)處理完成,與中央處理器架構(gòu)的系統(tǒng)相比,相干消色散的效率至少提高了14倍,在解碼、折疊采用CUDA多線程技術(shù)的使用,使整個系統(tǒng)的效率提高了9倍,為實時脈沖星觀測系統(tǒng)準備了條件。

圖4 J0835-451在中央處理器下輪廓圖Fig.4 The pulse profile of the J0835-4510 resulting from the processing with the CPU architecture

圖5 J0835-451在圖形處理器下輪廓圖Fig.5 The pulse profile of the J0835-4510 resulting from the processing with the GPU architecture

隨著圖形處理器技術(shù)在脈沖星觀測領(lǐng)域的不斷發(fā)展,不僅可以滿足云南天文臺40 m射電望遠鏡的觀測需要,還可以面對國內(nèi)新建的大射電望遠鏡,提供一種可能的脈沖星觀測終端。本文對圖形處理器技術(shù)在天文研究各領(lǐng)域以及其他方面的應用起到推動作用。

實驗中目前僅可以完成單通道帶寬為16 MHz、2 bit數(shù)據(jù)量的實時觀測,但在對多通道的實時觀測效果并不理想。未來準備采用圖形處理器集群對Mark5B數(shù)據(jù)進行處理,并且利用MPI多主機間并行計算以及OpenMP多核并行技術(shù),為實現(xiàn)多通道以及更寬帶寬的脈沖星實時觀測做準備。

致謝:感謝云南天文臺射電天文組成員的大力支持和熱情幫助,在此深表謝意。

[1] 徐永華,羅近濤,李志玄,等.基于MARK5B+DSPSR的基帶數(shù)字脈沖星觀測系統(tǒng)[J].天文研究與技術(shù)——國家天文臺臺刊,2013,10(4):352-358.

Xu Yonghua,Luo Jintao,Li Zhixuan,et al.A pulsar observation system with a Mark 5B recording system and a DSPSR software[J].Astronomical Research&Technology——Publications of National Astronomical Observatories of China,2013,10(4):352-358.

[2] 李志玄,汪敏,郝龍飛,等.基于DBBC+Mark 5B記錄系統(tǒng)的脈沖星觀測[J].天文研究與技術(shù)——國家天文臺臺刊,2011,8(1):1-7.

Li Zhixuan,Wang Min,Hao Longfei,et al.Observations of pulsars with a record system combining a DBBC and a Mark 5B[J].Astronomical Research&Technology——Publications of National Astronomical Observatories of China,2011,8(1):1-7.

[3] 羅近濤,李斌,陳嵐,等.上海天文臺25 m射電望遠鏡首次單天線脈沖星觀測[J].中國科學院上海天文臺年刊,2011(32):129-135.

Luo Jintao,Li Bin,Chen Lan,et al.The first single-dish pulsar observation at the 25 m radio telescope of Shanghai astronomical observatory[J].Annals of Shanghai Observatory Academia Sinica,2011(32):129-135.

[4] 劉建偉,金乘進.基于計算機集群的脈沖星相干消色散系統(tǒng)研究[J].科學技術(shù)與工程,2009,9(13):3612-3615+3620.

Liu Jianwei,Jin Chengjin.Pulsar coherent dedispersion system based on the computer cluster [J].Science Technology and Engineering,2009,9(13):3612-3615+3620.

[5] van Leeuwen J,Stappers B W.Finding pulsars with LOFAR[J].Astronomy and Astrophysics,2010,509:7-15.

[6] Stairs I H,Keith M J,Arzoumanian Z,et al.Pulsars with the Australian Square Kilometre Array Pathfinder[C]//Radio Pulsars:An Astrophysical Key to Unlock the Secrets of the Universe. AIP Conference Proceedings.2011:335-340.

[7] Ait allal D,Weber R,Cognard I,et al.RFI mitigation in the context of pulsar coherent dedispersion at the Nan?ay radio astronomical observatory[C]//17th European Signal Processing Conference(EUSIPCO 2009),2009:2052-2056.

[8] Magro A,Karastergiou A,Salvini S,et al.Real-time,fast radio transient searches with GPU dedispersion[J].Monthly Notices of the Royal Astronomical Society,2011,417(4):2642-2650.

[9] Barsdell B R,Bailes M,Barnes D G,et al.Accelerating incoherent dedispersion[J].Monthly Notices of the Royal Astronomical Society,2012,422(1):379-392.

[10] CUFFT LIBRARY USER′S GUIDE[M/OL].NVIDA Corporation,2013.dirac.ruc.dk/manuals/ cuda-5.5/CUFFT_Library.pdf.

[11] van Straten W,Bailes M.DSPSR:digital signal processing software for pulsar astronomy[J]. Publications of the Astronomical Society of Australia,2011,28(1):1-14.

[12] van Straten W,Demorest P,Oslowski S.Pulsar data analysis with PSRCHIVE[J].Astronomical Research and Technology,2012,9(3):237-256.

[13] Lorimer D R,Kramer M.Handbook of Pulsar Astronomy[M].Cambridge University Press,2005:168-170.

An Observation System for Pulsars Based on a GPU Architecture and a Mark5B

Li Jiagong1,Xu Yonghua2,Li Zhixuan2,Wang Min2,Ji Kaifan1
(1.Key Laboratory of Applications of Computer Technologies of the Yunnan Province,University of Science and Technology of Kunming,Kunming 650500,China,Email:jkf@cnlab.net;2.Yunnan Observatories,Chinese Academy of Sciences,Kunming 650011,China)

Massive pulsar data are being generated through the 40m radio telescope of the Yunnan Observatories.A huge amount of data obtained by the telescope will stay unused if they are not processed in real time.To realize the needed real-time processing we have established a system of a GPU architecture to process data recorded by a Mark5B.The processing includes decoding,coherent removal of dispersion,and data-folding.Our test results show that data obtained in 1 second can be processed within 0.51 second,which meets the requirements of real-time processing.In the paper we first introduce the implementation of each part of the observation system using the GPU architecture.We then compare the speed of each part of the system to that within a traditional CPU architecture.We particularly present the analysis of how the execution efficiency of a single Fourier-transform operation in the removal of dispersion is affected by the amount of data involved,as such operations are the most time consuming in the processing.Result profiles of tests with the system also show that our system meets the requirements of real-time processing.We finally discuss problems of the current system and future studies.

Pulsar;40m radio telescope;GPU;Coherent removal of dispersion;CUDA

P145.6

A

1672-7673(2014)04-0335-08

2013-12-25;

2014-01-16

李佳功,男,碩士.研究方向:GPU并行計算的脈沖星相干消色散技術(shù)的研究和應用.Email:lijiagong@cnlab.net

季凱帆,男,研究員.研究方向:云計算在天文上的應用.Email:jkf@cnlab.net

猜你喜歡
中央處理器脈沖星色散
“光的折射”“光的色散”知識鞏固
脈沖星方位誤差估計的兩步卡爾曼濾波算法
色散的成因和應用
“光的折射”“光的色散”隨堂練
『光的折射』『光的色散』隨堂練
惡劣環(huán)境下互聯(lián)網(wǎng)通信接口自適應轉(zhuǎn)換系統(tǒng)設計
宇宙時鐘——脈沖星
關(guān)于計算機中央處理器的研究
CPU與GPU探究
計算機中央處理器的研究
上饶市| 通州市| 基隆市| 濮阳县| 梅河口市| 宁武县| 临西县| 修文县| 永登县| 九台市| 孝感市| 京山县| 澄迈县| 罗定市| 周至县| 子长县| 宜宾县| 北海市| 武宁县| 互助| 罗平县| 新津县| 松阳县| 论坛| 南丹县| 彭水| 咸宁市| 花莲县| 连云港市| 荥经县| 康乐县| 新乐市| 肥东县| 金溪县| 凤庆县| 乌苏市| 舒城县| 新民市| 呼伦贝尔市| 泰兴市| 阿城市|