李小文,彭德義,王 丹
(重慶郵電大學(xué)重慶市移動(dòng)通信技術(shù)重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
LTE TDD系統(tǒng)上行采用集中式 DFT-擴(kuò)展-OFDM機(jī)制,使上行具有更低的峰均比[1],在其物理層上行鏈路接收過(guò)程中,需根據(jù)上行帶寬的分配,對(duì)經(jīng)過(guò)信道估計(jì)及均衡等流程處理后的數(shù)據(jù)進(jìn)行離散傅里葉逆變換(inverse discrete Fourier transform,IDFT)。由于3GPP協(xié)議規(guī)定一個(gè)資源塊包含12個(gè)子載波,對(duì)IDFT的序列長(zhǎng)度提出了限制,為12的整數(shù)倍[2]。這種限制就導(dǎo)致了IDFT不能采用經(jīng)典的長(zhǎng)度為2的冪的快速反傅里葉變換方法來(lái)實(shí)現(xiàn),文獻(xiàn)[3]提出一種Cooley-Turky算法,針對(duì)非2的整數(shù)次冪長(zhǎng)度的序列采用質(zhì)數(shù)分解劃分-組合法,所述算法性能得到一定的保證,但實(shí)現(xiàn)復(fù)雜度過(guò)高。文獻(xiàn)[4]結(jié)合信道均衡器和解調(diào)器性能,提出一種有效的DFT(discrete Fourier transform)Spread-OFDM接收算法,但是只給出了理論上的推導(dǎo)及復(fù)雜度分析,并未給出具體的實(shí)現(xiàn)過(guò)程。根據(jù)文獻(xiàn)[5],對(duì)非2的整數(shù)次冪的序列長(zhǎng)度通過(guò)添零湊成2的整數(shù)次冪,進(jìn)行IFFT后的輸出序列,相當(dāng)于對(duì)未添零的序列進(jìn)行IDFT后的輸出序列進(jìn)行線性插值?;诖?,本文采用基于2-N點(diǎn)FFT算法和線性插值的符號(hào)抽選相結(jié)合的方法,提出一種解上行傳輸預(yù)編碼的實(shí)現(xiàn)方案,并在TMS320C64x芯片中進(jìn)行實(shí)現(xiàn)。
在TD-LTE上行發(fā)送端,即用戶設(shè)備(user equipment,UE)端,根據(jù)e-NodeB端的資源分配指示,采用集中式資源映射的方式,即DFT產(chǎn)生的頻域信號(hào)按原有的順序集中映射到IFFT的輸入端。根據(jù)3GPP TS36 211標(biāo)準(zhǔn),將UE端經(jīng)過(guò)物理層處理流程中調(diào)制模塊之后的復(fù)值符號(hào)d(0),…,d(Msymb-1)分為組(M是調(diào)制模塊輸出的符號(hào)長(zhǎng)度),每一組symb對(duì)應(yīng)一個(gè)SC-FDMA復(fù)值符號(hào)。
(2)式中:α2,α3,α5都是非負(fù)整數(shù)。
在TD-LTE上行接收端,即e-NodeB端,通過(guò)接收天線接收一個(gè)子幀的數(shù)據(jù)依次進(jìn)行解上行基帶信號(hào)、解資源映射、信道估計(jì)及信道均衡等流程處理后,針對(duì)一個(gè)子幀的每一個(gè)SC-FDMA(single-carrier frequency-division multiple access)符號(hào)中的子載波對(duì)應(yīng)的復(fù)值符號(hào)進(jìn)行傅里葉逆變換,以便于后續(xù)的解調(diào)及相關(guān)的譯碼等流程處理。本節(jié)詳細(xì)給出上行解傳輸預(yù)編碼的算法流程,并對(duì)幾種上行解預(yù)編碼算法的性能進(jìn)行仿真比較。
設(shè)X(0),…,X(M-1)為信道均衡模塊輸出的M點(diǎn)的有限長(zhǎng)度序列,即為一個(gè)SC-FDMA符號(hào)的子載波數(shù)目長(zhǎng)度,根據(jù)公式
可以對(duì)輸入序列X(0),…,X(M -1)取共軛得到X*(0),…,X*(M -1)之后進(jìn)行M點(diǎn)的DFT(discrete Fourier transform),再對(duì)DFT后的序列取共軛即可。為了能夠采用快速傅里葉變換,本文對(duì)輸入的共軛序列X*(0),…,X*(M -1)添加N-M個(gè)零,得到 X*(0),…,X*(M - 1),0,…,0 。然后采用N點(diǎn)的快速傅里葉變換得到序列x(0),…,x(N-1),再對(duì)該序列采用線性插值算法進(jìn)行抽選,抽選公式為
對(duì)于上述N點(diǎn)DFT過(guò)程,采用快速傅里葉變換(fast Fourier transform,F(xiàn)FT)方法,基于時(shí)間抽取(decimation in time,DIT)的基2 復(fù)數(shù)算法[6-7]。傅立葉變換式如下:
輸入為經(jīng)過(guò)倒序后的逆序數(shù)據(jù),輸出為順序數(shù)據(jù)[8]。本文將傳統(tǒng)的DIT-FFT算法流程進(jìn)行一定的變形,根據(jù)信號(hào)流圖的轉(zhuǎn)置定理,將傳統(tǒng)DIT-FFT算法信號(hào)流圖中的所有支路方向倒轉(zhuǎn)或者反向,保持各支路的旋轉(zhuǎn)因子不變,將輸入序列和輸出序列相互交換,則整個(gè)信號(hào)網(wǎng)絡(luò)的系統(tǒng)函數(shù)不改變。因此我們就可以在進(jìn)行蝶形運(yùn)算時(shí),加法運(yùn)算過(guò)程省去了與旋轉(zhuǎn)因子的相乘,而僅在減法運(yùn)算過(guò)程與旋轉(zhuǎn)因子相乘,從而有效提高了在匯編實(shí)現(xiàn)時(shí)代碼的運(yùn)行效率。并給出8點(diǎn)的DIT基2FFT算法示意圖(如圖1所示)。
因此,可以用(6)—(7)式計(jì)算DIT基2FFT算法。
(6)—(7)式中:WN為旋轉(zhuǎn)因子;xi(k)表示第i級(jí)運(yùn)算中第k個(gè)元素。
圖1 8點(diǎn)的DIT基2FFT算法示意圖Fig.1 Algorithm graph of 8 point DIT 2-based FFT
根據(jù)以上的算法描述,進(jìn)行計(jì)算機(jī)仿真,從終端通過(guò)射頻線直連過(guò)來(lái)的信號(hào)經(jīng)解基帶信號(hào)、解資源映射、信道估計(jì)及信道均衡等流程得到的12列長(zhǎng)度為M的數(shù)據(jù)(若上行發(fā)送了探測(cè)參考信號(hào)(sounding reference signal,SRS)則為11列)。分別進(jìn)行不同的解傳輸預(yù)編碼算法得到的星座圖如圖2所示。從圖2容易看出,采用非插值算法的性能均劣于其他3種算法,而線性插值和拋物插值算法相比于Cooley-Turkey算法性能稍有些損失,但是并不明顯。同時(shí)可以看出,采用拋物插值算法比線性插值算法所帶來(lái)的性能增益也并不明顯,但是采用拋物插值將帶來(lái)比較大的復(fù)雜度的提升,所以綜合性能和實(shí)現(xiàn)復(fù)雜度的考慮,本文采用基于線性插值的符號(hào)抽選方法。
圖2 各種算法仿真星座圖Fig.2 Constellation graph of algorithms simulation
TMS320C6000最初主要是為了移動(dòng)通信基站的信號(hào)處理而推出的超級(jí)處理芯片,該芯片屬于高速定點(diǎn)DSP,最高時(shí)鐘頻率為1 GHz,處理性能達(dá)8 000 MIPS,比傳統(tǒng)DSPs要快一個(gè)數(shù)量級(jí),因此在測(cè)試儀表的開(kāi)發(fā)領(lǐng)域有廣闊的應(yīng)用前景[9]。C64x系列DSP最主要的特點(diǎn)是在體系結(jié)構(gòu)上采用了甚長(zhǎng)指令集(very long instruction word,VLIW),由一個(gè)超長(zhǎng)的機(jī)器指令字來(lái)驅(qū)動(dòng)內(nèi)部的多個(gè)功能單元。由于每條指令的字段之間相互獨(dú)立,故可單周期發(fā)射多條指令,從而實(shí)現(xiàn)更高的指令級(jí)并行效率。CPU采用哈佛結(jié)構(gòu),程序總線和數(shù)據(jù)總線分開(kāi),取指令與執(zhí)行指令可并行運(yùn)行。C64x系列DSP芯片的大容量,高運(yùn)算能力等這一些優(yōu)點(diǎn)使其在無(wú)線基站、終端等場(chǎng)合廣泛應(yīng)用,特別是運(yùn)算精度能滿足測(cè)試儀表的開(kāi)發(fā)條件[10]。
基于上行接收端處理流程及以上算法流程,前端模塊處理后的數(shù)據(jù)是一個(gè)復(fù)數(shù)占據(jù)內(nèi)存空間為一個(gè)字的大小(實(shí)部和虛部分別占高16位和低16位),根據(jù)上行分配的最大帶寬為100 MB,同時(shí)假設(shè)上行未發(fā)送探測(cè)參考信號(hào),且采用正常循環(huán)前綴,則經(jīng)過(guò)均衡后輸出的序列長(zhǎng)度為100×12×12,即最多占據(jù)1 440個(gè)字的內(nèi)存空間。然后針對(duì)每一個(gè)SC-FDMA符號(hào)的子載波序列進(jìn)行解傳輸預(yù)編碼過(guò)程,具體的處理流程圖如圖3所示。
圖3 解傳輸預(yù)編碼處理流程圖Fig.3 Dealing flow chart of transform decoding
e-NodeB端對(duì)接收的上行數(shù)據(jù)以子幀為單位進(jìn)行處理,其中前端模塊包括對(duì)射頻輸入信號(hào)的解基帶信號(hào)、解資源映射、信道估計(jì)以及信道均衡等處理流程。由于UE所占據(jù)的頻域資源是由e-NodeB端分配的,故在進(jìn)行上行接收時(shí),根據(jù)分配的頻域資源確定子載波數(shù)目,從而也就確定了IDFT的點(diǎn)數(shù)M。將信道均衡輸出序列分為12列(若上行發(fā)送了SRS,則分為11列),每一列占據(jù)M個(gè)字的內(nèi)存空間。解上行預(yù)編碼模塊主要工作是對(duì)每一列進(jìn)行相應(yīng)地處理,包括先對(duì)每一列輸入序列進(jìn)行共軛處理,然后在輸入序列后面添加一定數(shù)目的零,將輸入序列長(zhǎng)度增加到2 048,再進(jìn)行相應(yīng)的FFT。之后從2 048個(gè)復(fù)值符號(hào)中根據(jù)線性插值公式抽選M個(gè),并進(jìn)行共軛處理,如此循環(huán)所需的列數(shù)次。在本實(shí)現(xiàn)方案中用到的變量、具體內(nèi)存分配情況(按最大分配情況)及相應(yīng)的說(shuō)明見(jiàn)表1。
表1 輸入輸出參數(shù)Tab.1 Parameters of input and output
綜上所述,本文的上行解預(yù)編碼實(shí)現(xiàn)主要分為以下步驟。
步驟1 取每一列數(shù)據(jù)進(jìn)行共軛處理,為了保證FFT處理的精度,在共軛處理模塊內(nèi)部對(duì)數(shù)據(jù)按照最大值進(jìn)行量化處理。
步驟2 在共軛輸出序列后添加一定數(shù)目的零,使其長(zhǎng)度增加到2 048,例如每一列數(shù)據(jù)長(zhǎng)度為M,則所需添零數(shù)目為2 048-M。
步驟3 在基2 DIT-FFT過(guò)程中,共進(jìn)行11級(jí)計(jì)算,只是在第1級(jí)蝶形運(yùn)算之前,先進(jìn)行序列的倒序,其他級(jí)的蝶形運(yùn)算完,將所得輸出數(shù)據(jù)立即存儲(chǔ)到原輸入數(shù)據(jù)所占用的存儲(chǔ)單元。采用這種原位計(jì)算方法可以有效的節(jié)省內(nèi)存空間。根據(jù)蝶形運(yùn)算過(guò)程中旋轉(zhuǎn)因子的變換規(guī)律,本文預(yù)先將旋轉(zhuǎn)因子存儲(chǔ)成一個(gè)表的形式,當(dāng)進(jìn)行到該級(jí)運(yùn)算時(shí),只需從表中讀取數(shù)據(jù)進(jìn)行運(yùn)算,這樣有效地減少了代碼空間,使實(shí)現(xiàn)程序更加簡(jiǎn)潔。
步驟4 采用基于線性插值的抽選方法,在FFT輸出的2 048個(gè)數(shù)據(jù)中抽選M個(gè)。具體實(shí)現(xiàn)過(guò)程中,首先計(jì)算偏移位置,根據(jù)偏移位置從輸入序列中提取相鄰的兩個(gè)數(shù)據(jù)data1和data2,并計(jì)算相應(yīng)的權(quán)系數(shù)coff1和coff2,然后分別進(jìn)行相乘后相加,判斷是否達(dá)到輸出序列長(zhǎng)度,否則返回計(jì)算下一偏移位置。
步驟5 對(duì)抽選的M個(gè)數(shù)據(jù)進(jìn)行共軛處理,此處可以直接調(diào)用第一步的共軛處理函數(shù)。然后判斷是否已處理完整個(gè)子幀的數(shù)據(jù),若未處理完則繼續(xù)從均衡后的數(shù)據(jù)中讀取下一列進(jìn)行以上所述處理。
由此,基于DSP的上行解預(yù)編碼具體實(shí)現(xiàn)流程如下圖4所示。
圖4 解傳輸預(yù)編碼實(shí)現(xiàn)流程圖Fig.4 Implementing flow chart of transform decoding
在進(jìn)行DSP軟件設(shè)計(jì)時(shí),需要對(duì)程序進(jìn)行優(yōu)化,盡量減少或者消除程序中的“NOP”指令,特別是循環(huán)體內(nèi)的“NOP”指令。通過(guò)在CCS3.3上進(jìn)行程序的仿真運(yùn)行。本文采用上行帶寬分配為5 MB的模式,即上行子載波數(shù)目M為120個(gè)。整體及其各子模塊實(shí)現(xiàn)cycle數(shù)如表2所示。
表2 不同模塊處理速率Tab.2 dealing velocity of different modulations
TMS320C64x芯片的主頻為1 GHz,一個(gè)指令周期耗時(shí)1 ns,故本文提出上行解預(yù)編碼算法DSP實(shí)現(xiàn),整體可以達(dá)到56.55 Mbit/s的處理速率,且達(dá)到一定輸出信噪比,滿足TD-LTE系統(tǒng)的性能要求。
本文從TD-LTE系統(tǒng)上行解預(yù)編碼的理論出發(fā),根據(jù)TD-LTE綜合測(cè)試系統(tǒng)的特點(diǎn),通過(guò)鏈路級(jí)仿真比較,綜合性能和實(shí)現(xiàn)復(fù)雜度考慮,采用一種最優(yōu)的基于2-N點(diǎn)FFT算法和線性插值的符號(hào)抽選相結(jié)合的算法,提出了一種簡(jiǎn)單有效的解上行預(yù)編碼實(shí)現(xiàn)方案,并對(duì)其在TMS320C64xDSP中進(jìn)行實(shí)現(xiàn)。該實(shí)現(xiàn)方案已成功運(yùn)用于TD-LTE無(wú)線綜合測(cè)試儀器和射頻一致性測(cè)試系統(tǒng)的上行接收機(jī)中。
[1]沈嘉,索士強(qiáng),全海洋,等.3GPP長(zhǎng)期演進(jìn)(LTE)技術(shù)原理與系統(tǒng)設(shè)計(jì)[M].北京:人民郵電出版社,2008.SHEN Jia,SUO Shi-qiang,QUAN Hai-yang,3GPP Long Term Evolution:Principle and System Design[M].Beijing:Posts&Telecommunications proess,2008.
[2]3GPP.TS 36.211 v8.7.0 Evolved Universal Terrestial Radio Access(E-UTRA)Physical Channels and Modulation[EB/OL].[2009-06-12].http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/
[3]BERNARDINI R,CORTELAZZO G,MIAN G A.A Family of FFT algorithms of complexity intermediate between the MD Cooley-Turkey FFT and the MD prime-factor FFT[J].IEEE Transactions On Circuits and Systems,1993,38(8):746-749.
[4]PRASAD N,WANG Shuang-quan,WANG Xiao-dong.Efficient Receiver Algorithms for DFT-Spread OFDM Systems[J].IEEE Transactions On Wilreless Communication,2009,8(6):3216-3225.
[5]唐恬,趙璨.TD-LTE終端測(cè)試儀器的IDFT實(shí)現(xiàn)方法及其系統(tǒng):中國(guó)101980494A[P].2011-02-23.TANG Tian,ZHAO Can.IDFT Implementing Method and System of TD-LTE User Equipment Testing Instrument:China 101980494A[P].2011-2-23.
[6]何方白,張德民.數(shù)字信號(hào)處理[M],北京:高等教育出版社,2009:121-129.HE Fang-bai,ZHANG De-min.Digital Signal Processing[M].Altitude Educational Press,2009:121-129.
[7]BEHESHTI B.On Performance of LTE UE DFT and FFT Implementations in Flexible Soft ware Based Baseband Processors[J]IEEE Transactions On Wilreless Communications,2009,6(4):1-4.
[8]CHANGWei-hsin,TRUONG Q.N On the Fixed-Point Accuracy Analysis of FFT Algorithms[J].IEEE Transactions On Signal Processing,2007,56(10):4176-4182.
[9]田黎育,何佩琨.TMS320C6000系列DSP編程工具與指南[M].北京:清華大學(xué)出版社,2006:32-50.TIAN Li-yu,HE Pei-kun.TMS320C600 Series DSP Programming Tools and Guides[M].Beijing:The John Hopkins University Press,2006:32-50.
[10]李小文,潘迪.基于DSP的LTE TDD上行信道估計(jì)實(shí)現(xiàn)[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2010,22(1):14-18.LI Xiao-wen,PAN Di.Implementation Of LTE-TDD Uplink Uhannel Estimation Based On DSP[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2010,22(1):14-18.
重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版)2012年2期