王顯海 孟 橋 張健偉 張?zhí)硪?/p>
(東南大學(xué)射頻與光電集成電路研究所, 南京 210096)
一種基于IWOLA的脈沖星消色散數(shù)字終端設(shè)計
王顯海 孟 橋 張健偉 張?zhí)硪?/p>
(東南大學(xué)射頻與光電集成電路研究所, 南京 210096)
在基于FPGA的脈沖星消色散數(shù)字終端中,為了解決片內(nèi)高速RAM資源的系統(tǒng)設(shè)計瓶頸,提出了一種基于IWOLA算法的多相濾波器組(PFB),并基于該算法構(gòu)建了一種針對寬帶實輸入信號的脈沖星消色散數(shù)字終端.該數(shù)字終端通過約簡多子帶進行處理.理論分析結(jié)果表明,該數(shù)字終端節(jié)省了系統(tǒng)對高速RAM和后續(xù)信號處理單元的需求,在保證時間分辨率的前提下提高了頻率分辨率.另外,該數(shù)字終端計算效率高,且克服了基于PDFT算法的系統(tǒng)設(shè)計缺陷.當(dāng)脈沖星消色散終端中FFT模塊的長度為8 192時,基于IWOLA算法的脈沖星消色散數(shù)字終端最大節(jié)省了25%的BRAM資源.仿真實驗結(jié)果表明,該系統(tǒng)的性能滿足設(shè)計要求.
PDFT;IWOLA算法;FPGA;消色散
脈沖星是高速旋轉(zhuǎn)的中子星,在地球引力波、星際介質(zhì)和脈沖星導(dǎo)航等研究領(lǐng)域具有重要意義.脈沖星信號在通過星際介質(zhì)的傳播過程中會引起色散問題,需要對其進行消色散處理,這是脈沖星觀測中必不可少的一個重要環(huán)節(jié),也是消耗硬件資源的一個核心部分.脈沖星觀測中用于非相干消色散的頻域數(shù)據(jù)主要來自于頻譜儀,因此,頻譜儀在脈沖星觀測中起著重要的作用.
脈沖星信號極其微弱,在觀測中要求系統(tǒng)具有盡可能寬的處理帶寬和高的時間或頻率分辨率.基于FFT的數(shù)字頻譜儀能較好地滿足這2個指標(biāo)要求,根據(jù)實現(xiàn)算法的不同,可以將其分為基于組合復(fù)FFT算法的頻譜儀和基于多相濾波器組(PFB)的頻譜儀[1-3].前者結(jié)構(gòu)較為復(fù)雜,對片上RAM資源占用較多[3];后者計算效率較高,尤其適合于寬帶信號的處理,它可以分為基于多相濾波器DFT(PDFT)算法和基于加權(quán)疊加(WOLA)算法的頻譜儀[4-5].基于PDFT算法的頻譜儀系統(tǒng)架構(gòu)主要由多相濾波器組和FFT模塊組成.受FPGA內(nèi)RAM的限制,一般用于實現(xiàn)1 024的幾倍到幾十倍級別的通道劃分.超高頻率分辨率的頻譜儀一般采用PFB和FFT兩級來實現(xiàn),需要片外RAM進行大量數(shù)據(jù)緩存[6].WOLA算法是一種有效的頻帶劃分實現(xiàn)形式[7],具有低功耗的特點,解決了一般多相結(jié)構(gòu)進行頻帶劃分時通道數(shù)與數(shù)據(jù)抽取率必須相同的限制問題,提高了系統(tǒng)的設(shè)計靈活性[8],近年來已廣泛應(yīng)用于子帶編碼、OFDM、音頻信號處理和射電天文等領(lǐng)域[9-13].
本文提出了一種應(yīng)用于寬帶實信號的IWOLA算法,并基于該算法構(gòu)建了一種脈沖星消色散數(shù)字終端.這種數(shù)字終端能同時對寬頻帶內(nèi)的多個子頻帶進行處理.另外,與基于組合復(fù)FFT算法和WOLA算法的頻譜終端相比,基于IWOLA算法的脈沖星數(shù)字終端更加節(jié)省FPGA的RAM資源.
基于PDFT算法的PFB推導(dǎo)是通過將數(shù)據(jù)抽取率等于PFB通道數(shù)來實現(xiàn)的,這限制了系統(tǒng)結(jié)構(gòu)的靈活性.為了克服這一問題,文獻[14]提出了一種基于WOLA算法的PFB,它是PFB的一種有效實現(xiàn)形式[15],最初應(yīng)用于短時傅里葉變換(STFT)中.STFT是指在FFT之前對數(shù)據(jù)進行加窗處理,其數(shù)學(xué)表達式為
(1)
式中,x(m)為輸入信號序列;w(n)為分析窗;y(n,ω)為短時傅里葉變換的輸出;n為當(dāng)前時刻;m為求和變量;ω為歸一化的數(shù)字頻率.
令k1為0~K-1間的任意整數(shù),v1為離散時間點,且k1=ωK/2π,v1=n/D,v1D-m=-q1,q1=l1K+p1.其中,D為數(shù)據(jù)抽取率;K為FFT的長度;l1為0~D-1間的任意整數(shù);p1為通道序號.則基于WOLA算法的PFB數(shù)學(xué)表達式為[14-15]
式中,Rv1(p1)為加權(quán)疊加運算,它代替了PDFT算法中的卷積運算,且
l1=0,1,2,…,D-1
p1=0,1,2,…,K-1
v1=0,1,2,…,∞
(3)
利用圖1(a)中的子帶劃分方法,在式(2)所描述的PFB系統(tǒng)中實現(xiàn)了對信號頻帶的劃分.當(dāng)輸入信號是帶寬為奈奎斯特采樣頻率一半的實信號時,需要處理K/2+1個通道數(shù)據(jù).但鑒于實信號頻譜的對稱性,只需計算K/2個通道的數(shù)據(jù)即可.因此,對于實輸入信號,可以對WOLA算法進行改進,約減一個需要處理的子帶,節(jié)省一個后續(xù)處理的子系統(tǒng)資源.令Wk(ejω)為濾波器的頻率響應(yīng),如圖1所示,只要將各子通道的中心頻率沿X軸正方向平移π/K,便可減少一個后續(xù)處理的子系統(tǒng).由此便可導(dǎo)出基于IWOLA算法的PFB.
(a) 實信號通道的一般劃分方法
(b) 實信號通道經(jīng)過搬移之后的劃分方法
令k=(ω-π/K)K/2π,式(1)可改寫為
(4)
假定v=n/D,vD-m=-q,q=lK+p,其中,k為0~K-1間的任意整數(shù),v為離散時間點,l為0~D-1間的任意整數(shù),可以得到
w(-q)e-j2πkq/Ke-jπvD/Ke-jπq/K=
w(-lK-p)e-j2πk(lK+p)/Ke-jπvD/Ke-jπ(lK+p)/K=
w(-lK-p)e-jπp/Ke-j2πkp/K=
(5)
式中
Fv(p)=Rv(p)e-jπp/K
l=0,1,2,…,D-1
p=0,1,2,…,K-1
v=0,1,2,…,∞
(6)
與式(2)相比,式(5)中多了2個指數(shù)項和1個(-1)l次方項.式(5)的計算過程見圖2.基于IWOLA算法的PFB的框架圖見圖3.
圖2 y(v,k)的計算過程
圖3 基于IWOLA算法的PFB框架圖
將基于IWOLA算法的PFB應(yīng)用于脈沖星消色散數(shù)字終端,可滿足同時對幾路數(shù)據(jù)進行消色散的應(yīng)用要求,并較好地兼顧信號處理帶寬、頻率分辨率和時間分辨率的要求.系統(tǒng)框架如圖4所示.PFB的數(shù)據(jù)抽取率D=8,K=8,系統(tǒng)只需計算4個輸出通道的數(shù)據(jù)即可,每個通道的輸出都是復(fù)數(shù)數(shù)據(jù).將1.2 GHz帶寬的實信號劃分為4個子帶,在保持每個子帶頻率分辨率的同時,提高了系統(tǒng)的時間分辨率.每個子通道的數(shù)據(jù)通過累加積分模塊后,根據(jù)需要輸出至不同的計算機,進行消色散處理.與組合復(fù)FFT算法的終端相比,基于IWOLA算法的脈沖星數(shù)字終端設(shè)計相對簡單.其設(shè)計過程既利用了IP Core的復(fù)數(shù)計算能力,又避免了組合復(fù)FFT算法中復(fù)數(shù)FFT到實數(shù)FFT數(shù)據(jù)解算的復(fù)雜處理過程.
圖4中的ADC工作于時鐘交錯模式,需要對時鐘相位和時延差異引起的增益誤差、偏置誤差和相位延遲誤差進行修正.實輸入信號經(jīng)過ADC后轉(zhuǎn)換成高速數(shù)據(jù)流,其速率為2.4×109樣本/s,每個數(shù)據(jù)樣本寬度為8 bit;然后分成4路送入FPGA的數(shù)據(jù)接口模塊,完成數(shù)據(jù)的正確接收,每路數(shù)據(jù)速率為6×108樣本/s.數(shù)據(jù)接口模塊將4路數(shù)據(jù)流分成8路速率為3×108樣本/s的數(shù)據(jù)流,送入基于IWOLA算法的PFB中,完成信號頻帶劃分;然后,對輸出的4路復(fù)信號分別進行長度為8 192的FFT計算,每一路的頻譜分辨率為36.6 kHz.另外,將FFT模塊輸出的頻域數(shù)據(jù)經(jīng)功率計算模塊后,送入積分模塊按時間進行疊加,從而提高了信號的信噪比,降低了數(shù)據(jù)輸出量.累加次數(shù)是由積分時間長度控制的.
圖4 基于IWOLA的脈沖星消色散數(shù)字終端(D=8)
基于IWOLA算法的PFB是在基于WOLA算法的PFB上進行的,將各子帶的中心頻率沿X軸正方向平移π/K個長度,因此,兩者性能相同,由兩者構(gòu)成的系統(tǒng)的性能也相同.由于系統(tǒng)中PFB的濾波器特性曲線難以達到理想的矩形形狀,因此,PFB輸出的4個通道的過渡邊緣信號會被抑制,但這并不影響脈沖星的消色散處理.另一方面,本文所提的PFB可以方便地向脈沖星信號處理軟件輸出多通道時域數(shù)據(jù).
在IWOLA算法中,當(dāng)輸入信號為實信號時,只有K/2組輸出信號需要送入后續(xù)處理單元進行處理,節(jié)省了一路信號處理需求,尤其是節(jié)省了FPGA上的RAM資源,可在復(fù)雜的數(shù)字系統(tǒng)中產(chǎn)生較大的經(jīng)濟價值.下面將基于IWOLA算法的脈沖數(shù)字終端與基于WOLA算法和基于組合復(fù)FFT算法的脈沖星數(shù)字終端對FPGA片上RAM資源的利用率進行比較.
3.1 本文終端與基于WOLA算法終端的比較
由式(5)可知,IWOLA算法較WOLA算法增加了2個指數(shù)項和1個(-1)l次方項.(-1)l次方項并不會消耗FPGA上的RAM資源.以Xilinx FPGA為例,當(dāng)數(shù)據(jù)位寬為16 bit時,2個指數(shù)項總共使用了2×16×(K2/D+2K)/(18×1 024)個18 KB RAM和0個DSP資源.此外,當(dāng)數(shù)據(jù)位寬為22 bit、相位因子位寬為16 bit、輸出選項為unscaled output時,在Xilinx FPGA上實現(xiàn)一個8 192點FFT將占用57個18 KB RAM和33個DSP資源.不同的數(shù)據(jù)抽取率和不同通道劃分?jǐn)?shù)下系統(tǒng)對BRAM的節(jié)省量見圖5.由圖可知,一方面,資源節(jié)省量小于0意味著系統(tǒng)較基于WOLA算法的脈沖星數(shù)字終端多占用了BRAM資源,此時應(yīng)減少PFB的相應(yīng)通道劃分?jǐn)?shù);另一方面,系統(tǒng)對BRAM的節(jié)省量隨后續(xù)處理子單元復(fù)雜度的增加而增加,因此,選擇合適的抽取因子和通道數(shù)能使系統(tǒng)既滿足設(shè)計指標(biāo)又占用最少的FPGA資源.射電天文終端要求同時處理左右旋2路信號,而增加的2個指數(shù)項乘積因子可以被2路處理單元共用,因此,BRAM的資源節(jié)省量可能增加1倍,達到13.6%.
圖5 Xilinx FPGA內(nèi)BRAM的節(jié)省量
3.2 本文終端與基于組合復(fù)FFT算法終端的比較
文獻[3]所提出的基于組合復(fù)FFT算法的數(shù)字終端對FPGA的RAM資源占用較多.為了定量比較該終端與基于IWOLA算法的終端對FPGA資源的節(jié)省數(shù)量,在Xilinx FPGA上實現(xiàn)了基于IWOLA算法的脈沖星數(shù)字終端和文獻[3]中的32 768點組合復(fù)FFT算法的脈沖星數(shù)字終端.為了增加與基于組合復(fù)FFT算法的數(shù)字終端的可比性,假定圖4中輸入到8 192點FFT模塊的位寬為8 bit,給出了經(jīng)ISE綜合后的資源占用對比結(jié)果(見表1).由表可知,基于IWOLA算法的脈沖星消色散終端節(jié)省了25%的BRAM.
表1 基于IWOLA算法的數(shù)字終端與基于組合復(fù)FFT的終端資源占用對比
占用FPGA資源的類型基于組合復(fù)FFT的數(shù)字終端基于IWOLA算法的數(shù)字終端使用量占用率/%使用量占用率/%Slice內(nèi)的寄存器194134255045Slice內(nèi)的查找表1505662294010查找表觸發(fā)器對12698581915165輸入輸出單元2847813BRAM176427217全局時鐘驅(qū)動器515412DSP48E處理單元81159616
為了驗證基于IWOLA算法的脈沖星消色散終端的正確性,下面進行功能仿真分析.設(shè)K=8;D=8;數(shù)據(jù)采樣頻率fs=2.4 GHz;輸入信號由3個實正弦信號組成,其頻率分別為400.00, 400.07和1 140.00 MHz.基于IWOLA算法的PFB將帶寬為0~fs/2的寬帶實信號劃分成4個帶寬為300 MHz的復(fù)信號,對4路復(fù)信號分別進行FFT處理.由第2節(jié)可知,這一過程的實質(zhì)是實信號在經(jīng)過IWOLA解調(diào)后輸出4路復(fù)信號,再分別進行8 192點FFT處理,其中第i個通道的中心頻率為ifs/K+fs/(2K).當(dāng)3個輸入信號經(jīng)過系統(tǒng)處理后,會有2個輸入信號落在第2個通道內(nèi),1個輸入信號落在第4個通道內(nèi),第3個通道內(nèi)沒有有用信號.第2,3,4通道的信號輸出時域和頻域數(shù)據(jù)見圖6.仿真結(jié)果驗證了系統(tǒng)的正確性.
(a) 第2通道信號虛部的時域波形
(b) 第2通道的頻域波形
(c) 第3通道信號虛部的時域波形
(d) 第3通道的頻域波形
(e) 第4通道信號虛部的時域波形
(f) 第4通道的頻域波形
本文提出了一種針對寬帶實信號的IWOLA算法,并基于該算法構(gòu)建了一種脈沖星消色散數(shù)字終端.比較了基于IWOLA算法、基于WOLA算法和基于組合復(fù)FFT算法的脈沖星消色散數(shù)字終端對FPGA片上RAM資源的消耗量.結(jié)果表明,在相同條件下,基于IWOLA算法的脈沖星消色散數(shù)字終端節(jié)省了更多的系統(tǒng)硬件資源,克服了FPGA片上RAM不足引起的設(shè)計瓶頸,具有良好的實用價值.最后,對基于IWOLA算法的脈沖星消色散數(shù)字終端進行了功能仿真,驗證了其功能的正確性.
References)
[1]Richards B, Nicolici N, Chen H, et al. A 1.5GS/s 4096-point digital spectrum analyzer for space-borne applications [C]//2009IEEECustomIntegratedCircuitsConference. San Jose, CA, USA, 2009: 499-502.
[2]Hochgürtel S, Klein B. Space-efficient FPGA-implementation of FFTs in high-speed applications[C]//5thFPGAWorldConference. Stockholm, Sweden, 2008: 69-72.
[3]Wang X H, Meng Q, Han J L, et al. A wideband real-time spectrometer based on combined complex FFT for radio astronomy[C]//IEEE9thInternationalSymposiumonCommunicationSystems,Networks&DigitalSignalProcess. Manchester, UK, 2014: 691-695.
[4]Wang H, Lu Y X, Wang X G. Channelized receiver with WOLA filterbank[C]//2006InternationalConferenceonRadar. Shanghai, China, 2006: 1-3.
[5]He S S, Torkelson M. A new approach to pipeline FFT processor[C]//The10thInternationalParallelProcessingSymposium. Honolulu, HI, USA, 1996: 766-770.
[6]Parsons A, Backer D, Chen C, et al. A new approach to radio astronomy signal processing: packet switched, FPGA-based, upgradeable, modular hardware and reusable, platform-independent signal processing libraries [EB/OL]. (2005-10)[2014-08-23]. https://casper.berkeley.edu/wiki/Papers.
[7]Brennan R L, Abutalebi R, Sheikhzadeh H. Adaptive filtering using a highly oversampled weighted overlap-add filterbank in an ultra low-power system[C]//TheThirty-SixthAsilomarConferenceonSignals,SystemsandComputers. Pacific Grove, CA, USA, 2002: 806-810.
[8]Liu T, Wang Z G, Wang T, et al. Flexible approach to WOLA-based wideband IF signal analysis[C]//The11thIEEEInternationalConferenceonElectronicMeasurement&Instruments. Harbin, China, 2013: 192-196.
[9]Brennan R, Schneider T. An ultra low-power DSP system with a flexible filter bank [C]//The35thAsilomarConferenceonSignals,SystemsandComputers. Pacifica Grove, CA, USA, 2001: 809-813.
[10]Heller P N, Karp T, Nguyen T Q. A general formulation of modulated filter banks [J].IEEETransactionsonSignalProcessing, 2002, 47(4): 986-1002.
[11]Ravinder K, Khader M A, Rao H N. Implementation of scaled down model of heterogeneous spectrometers for radio astronomy applications using Xilinx FPGAs[J].JournalofEngineeringResearchandApplications, 2013, 3(5): 1596-1599.
[12]Hochgürtel S. Efficient implementations of high-resolution wideband FFT-spectrometers and their application to an APEX galactic center line survey[D]. Bonn, Germany: Mathematisch-Naturwissenschaftlichen Fakult?tder Rheinischen Friedrich-Wilhelms-Universit?t, 2013.
[13]Klein B, Philipp S D, Güsten R, et al. A new generation of spectrometers for radio astronomy: fast Fourier transform spectrometer[C]//2006MillimeterandSubmillimeterDetectorsandInstrumentationforAstronomyⅢ. Orlando, Florida,USA, 2006: 627511-1-627511-12.
[14]楊綠溪.現(xiàn)代數(shù)字信號處理[M].北京:科學(xué)出版社,2007: 448-454.
[15]Tsakiris N, Hall P, Herfurth S, et al. A 6 GHz digital receiver using COTS prototyping boards [C]//2013InternationalConferenceonRadar. Adelaide, South Australia, 2013: 537-541.
Design of digital backend based on IWOLA for pulsar de-dispersion
Wang Xianhai Meng Qiao Zhang Jianwei Zhang Tianyi
(Institute of RF- & OE-ICs, Southeast University, Nanjing 210096, China)
In a field programmable gate array (FPGA)-based digital backend for pulsar de-dispersion, in order to overcome the bottleneck caused by high-speed on-chip random-access-memory (RAM) resources for system design, a polyphase filter bank (PFB) based on improved weighted overlap-add (IWOLA) algorithm is proposed. Based on this algorithm, a digital backend for pulsar de-dispersion towards wideband real signals is presented. It works with reduced multiband. The theoretical analysis results show that the proposed digital backend saves the system requirements for high-speed on-chip RAM and the subsequent signal processing units, improving the frequency resolution under the premise of guaranteed time resolution. Additionally, it has high computation efficiency and resolves the system design defect caused by polyphase filter discrete Fourier transform (PDFT) algorithm. The digital backend based on the IWOLA algorithm saves the block RAM (BRAM) resources up to 25% when the length of the following FFT in system is 8 192. The simulation results show that the performance of the proposed system meets the requirements of design.
PDFT (polyphase filter discrete Fourier transform); IWOLA (improved weighted overlap-add) algorithm; FPGA (field programmable gate array); de-dispersion
10.3969/j.issn.1001-0505.2015.02.002
2014-10-29. 作者簡介: 王顯海(1980—),男,博士生;孟橋(聯(lián)系人),男,博士,教授,博士生導(dǎo)師,mengqiao@seu.edu.cn.
王顯海,孟橋,張健偉,等.一種基于IWOLA的脈沖星消色散數(shù)字終端設(shè)計[J].東南大學(xué)學(xué)報:自然科學(xué)版,2015,45(2):208-213.
10.3969/j.issn.1001-0505.2015.02.002
P161.4
A
1001-0505(2015)02-0208-06