杜秀麗 江煥承 陳 波 邱少明
(1.大連大學(xué)通信與網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室,大連,116622;2.大連大學(xué)信息工程學(xué)院,大連,116622)
基于并行技術(shù)和流水線的LMS自適應(yīng)濾波算法*
杜秀麗1,2江煥承2陳 波1,2邱少明1,2
(1.大連大學(xué)通信與網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室,大連,116622;2.大連大學(xué)信息工程學(xué)院,大連,116622)
針對(duì)現(xiàn)有自適應(yīng)濾波算法中數(shù)據(jù)處理效率低的問(wèn)題,提出了基于并行技術(shù)和流水線的最小均方誤差(Least mean square,LMS)自適應(yīng)濾波算法。該算法構(gòu)建基于并行技術(shù)的多輸入多輸出濾波器結(jié)構(gòu),成倍提高系統(tǒng)濾波處理速度;設(shè)計(jì)基于流水線的LMS自適應(yīng)濾波權(quán)系數(shù)求解方法,有效改善了權(quán)系數(shù)計(jì)算效率。最后利用現(xiàn)場(chǎng)可編程門(mén)陣列(Field programmable gate array,FPGA)對(duì)該算法進(jìn)行了驗(yàn)證,結(jié)果表明,對(duì)于四級(jí)并行流水線四階LMS自適應(yīng)濾波器,其數(shù)據(jù)處理速率提高了約8倍,在相同的數(shù)據(jù)處理速率下,其功耗可降低約84%,從而提高了LMS自適應(yīng)濾波處理速率,降低了系統(tǒng)功耗,實(shí)現(xiàn)了高速、超高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波處理。
自適應(yīng)濾波;并行技術(shù);最小均方誤差;流水線
自適應(yīng)濾波算法廣泛應(yīng)用于圖像處理、雷達(dá)成像、儀器儀表以及自適應(yīng)控制等領(lǐng)域。隨著數(shù)字信號(hào)處理技術(shù)的快速發(fā)展,數(shù)據(jù)處理速率也越來(lái)越高,傳統(tǒng)的自適應(yīng)濾波算法已不能滿足現(xiàn)代數(shù)字信號(hào)處理中高速性、實(shí)時(shí)性的要求,如何實(shí)現(xiàn)高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波已成為制約高速數(shù)據(jù)濾波發(fā)展的重要因素,因此研究高速信號(hào)的自適應(yīng)濾波算法不僅具有重要的理論意義,更有利于自適應(yīng)濾波技術(shù)在高速數(shù)據(jù)處理領(lǐng)域的發(fā)展與應(yīng)用。
典型的自適應(yīng)濾波算法主要有遞歸最小二乘(Recursive least square,RLS)算法[1]和最小均方誤差(Least mean square,LMS) 算法[2]等。高斯提出的RLS自適應(yīng)濾波算法具有較好的收斂性能和穩(wěn)定性,但是以增加計(jì)算復(fù)雜度和降低系統(tǒng)穩(wěn)定性為代價(jià),因此難以應(yīng)用于高速信號(hào)處理;Widrow和Hoff提出的LMS自適應(yīng)濾波算法因其實(shí)現(xiàn)簡(jiǎn)單、魯棒性好、對(duì)信號(hào)統(tǒng)計(jì)特性變化具有穩(wěn)健性等特點(diǎn),被廣泛應(yīng)用于自適應(yīng)濾波領(lǐng)域。文獻(xiàn)[3,4]提出了適用于電子信號(hào)處理(Digital signal processing,DSP)的LMS算法,該算法主要應(yīng)用于低速信號(hào)的自適應(yīng)濾波處理;文獻(xiàn)[5,6]介紹了適用于軟件實(shí)現(xiàn)的LMS算法,其算法實(shí)現(xiàn)復(fù)雜度較高,計(jì)算量較大,無(wú)法實(shí)現(xiàn)高速信號(hào)的自適應(yīng)濾波;文獻(xiàn)[7,8]提出了基于現(xiàn)場(chǎng)可編程門(mén)陣列(Field programmable gate array,FPGA)的LMS算法,將現(xiàn)有的LMS算法進(jìn)行了改進(jìn),使其適用于FPGA實(shí)現(xiàn),使得自適應(yīng)濾波速率得到了進(jìn)一步的提升,但由于濾波器結(jié)構(gòu)及其參數(shù)計(jì)算算法的復(fù)雜性,使其仍難以滿足高速信號(hào)的自適應(yīng)濾波處理。基于此,本文提出了一種基于并行技術(shù)和流水線相結(jié)合的LMS自適應(yīng)濾波算法。與現(xiàn)有基于FPGA的LMS自適應(yīng)濾波算法相比,該算法改善了現(xiàn)有自適應(yīng)濾波結(jié)構(gòu)效率低的問(wèn)題,克服了權(quán)系數(shù)計(jì)算速率慢的缺點(diǎn),滿足了高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波處理。
圖1 LMS自適應(yīng)濾波算法結(jié)構(gòu)Fig.1 Traditional LMS adaptive filtering structure
LMS算法是一種線性自適應(yīng)濾波算法,其通過(guò)自行調(diào)整濾波器權(quán)系數(shù), 使濾波器的輸出信號(hào)與期望輸出信號(hào)之間的均方誤差最小,其原理如圖1所示。主要包含兩個(gè)基本過(guò)程[9](1)濾波過(guò)程:計(jì)算線性濾波器輸出對(duì)輸入信號(hào)的響應(yīng)。(2)自適應(yīng)過(guò)程:(a)通過(guò)比較輸出結(jié)果與期望響應(yīng)產(chǎn)生估計(jì)誤差;(b)根據(jù)估計(jì)誤差自動(dòng)調(diào)整濾波器權(quán)系數(shù)。
基本LMS算法的迭代公式為
(1)
(2)
(3)
式中:y(n)為濾波器輸出信號(hào);w(n)為自適應(yīng)濾波器在時(shí)刻n的權(quán)向量;x(n)為時(shí)刻n的輸入信號(hào)向量;e(n)為誤差信號(hào);d(n)為期望信號(hào);式(3)表示抽頭權(quán)向量更新公式,μ為控制收斂速度的常數(shù),其為步長(zhǎng)因子。LMS算法收斂的條件為:0<μ<1/Kmax,Kmax為輸入信號(hào)自相關(guān)矩陣的最大特征值。
針對(duì)現(xiàn)有LMS自適應(yīng)濾波算法中濾波器單輸入單輸出結(jié)構(gòu)數(shù)據(jù)處理速率較慢的問(wèn)題,將并行技術(shù)應(yīng)用到濾波器結(jié)構(gòu)中,實(shí)現(xiàn)并行多輸入多輸出濾波結(jié)構(gòu),提升數(shù)據(jù)處理速率;同時(shí)將流水線技術(shù)應(yīng)用于LMS自適應(yīng)濾波算法權(quán)系數(shù)求解方法,可以提高濾波器工作頻率。
2.1 基于并行技術(shù)的LMS自適應(yīng)濾波結(jié)構(gòu)
并行處理[10-11]涉及系統(tǒng)體系結(jié)構(gòu)、算法映射、布局布線和程序設(shè)計(jì)等多項(xiàng)技術(shù)。利用計(jì)算中運(yùn)算數(shù)據(jù)的并發(fā)性,在并行處理中將多個(gè)輸入數(shù)據(jù)在一個(gè)時(shí)鐘周期內(nèi)并行地計(jì)算,從而使數(shù)據(jù)處理速率提升為并行級(jí)數(shù)相當(dāng)?shù)谋稊?shù)。并行處理結(jié)構(gòu)也能用于降低系統(tǒng)功耗。
對(duì)于現(xiàn)有LMS自適應(yīng)濾波器結(jié)構(gòu),其FPGA實(shí)現(xiàn)的傳播延時(shí)Tseq與其關(guān)鍵路徑上各種MOS管柵極和雜散電容的充放電荷密切相關(guān)[8],傳播延時(shí)(即系統(tǒng)最小時(shí)鐘周期)的計(jì)算公式為
(4)
式中:Ccharge表示在單個(gè)時(shí)鐘周期里充放電的電容;V0為電源電壓;Vt為閾值電壓;k為工藝參數(shù)。其功耗為
(5)
式中:f= 1/Tseq。
現(xiàn)有LMS自適應(yīng)濾波結(jié)構(gòu)是一種單輸入單輸出(Single input single output,SISO)系統(tǒng),運(yùn)用并行處理技術(shù)可以將SISO系統(tǒng)變換為L(zhǎng)通道并行多輸入多輸出(Multiple input multiple output,MIMO)系統(tǒng),對(duì)于L通道并行MIMO系統(tǒng),其處理過(guò)程關(guān)鍵路徑保持不變, 但在相同的時(shí)間里處理的數(shù)據(jù)量是原來(lái)的L倍,相當(dāng)于數(shù)據(jù)處理速率提升為原來(lái)的L倍。這樣,系統(tǒng)有效處理速率提高到與并行級(jí)數(shù)相當(dāng)?shù)腖倍。
并行處理技術(shù)可以通過(guò)降低電源電壓來(lái)降低功耗,在一個(gè)L通道并行MIMO系統(tǒng)中,關(guān)鍵路徑充放電電容保持不變,在相同數(shù)據(jù)處理速率下,L通道并行MIMO系統(tǒng)電路的時(shí)鐘周期增加到LTseq,則其充電電壓可降低為βV0(0<β<1)。L通道并行MIMO系統(tǒng)的功耗Ppar可降低為現(xiàn)有LMS自適應(yīng)濾波結(jié)構(gòu)功率Pseq的β2(0<β<1)倍,即
(6)
圖2 四通道并行MIMO LMS自適應(yīng)濾波結(jié)構(gòu)Fig.2 LMS filter structure based on four channels
L通道并行MIMO系統(tǒng)傳播延時(shí)為
(7)
在相同數(shù)據(jù)處理速率下,功耗系數(shù)β(0<β<1)可由式(4),(7)導(dǎo)出。
對(duì)于四階LMS自適應(yīng)濾波器,本文以四通道并行MIMO系統(tǒng)為例分析。在相同時(shí)鐘頻率下,其數(shù)據(jù)處理速率提高為原數(shù)據(jù)處理速率的4倍;在相同數(shù)據(jù)處理速率下,其功耗降低為原功耗的β2倍,其結(jié)構(gòu)實(shí)現(xiàn)如圖2所示。
2.2 基于流水線的權(quán)系數(shù)求解方法
Merlino提出的流水線技術(shù)[10,12]是一種在單時(shí)鐘周期進(jìn)行多指令運(yùn)算的處理技術(shù)。流水線可以大幅縮短數(shù)據(jù)處理關(guān)鍵路徑延時(shí),從而可提高濾波器工作頻率和數(shù)據(jù)處理速率,或在同樣工作頻率下降低系統(tǒng)功耗。流水線通過(guò)沿著數(shù)據(jù)運(yùn)算通路插入流水線寄存器的方法來(lái)減小關(guān)鍵路徑延時(shí)。加入M級(jí)流水線后,濾波器工作頻率可近似提高M(jìn)倍。對(duì)于M級(jí)流水線系統(tǒng), 其關(guān)鍵路徑近似縮短為原始路徑長(zhǎng)度的1/M,單級(jí)流水線充放電電容減小為Ccharge/M,總電容并沒(méi)有變化。如果時(shí)鐘頻率f保持不變,在原來(lái)對(duì)電容Ccharge充放電的同樣時(shí)間內(nèi),現(xiàn)在只需要對(duì)Ccharge/M進(jìn)行充放電。這意味著,電源電壓可以降低到β′V0。這樣加入M級(jí)流水線濾波器的傳播延時(shí)為
(8)
功耗為
(9)
因此,流水線系統(tǒng)的功耗降低為原來(lái)的β′2倍。在相同時(shí)鐘速率下,可得傳播延時(shí)Tseq=Tpip,從而由式(4,9)求得β′(0<β′<1)。
圖3為加入四級(jí)流水線的LMS自適應(yīng)濾波權(quán)系數(shù)求解結(jié)構(gòu)。加入流水線的權(quán)系數(shù)求解結(jié)構(gòu)改進(jìn)了誤差函數(shù)e′(n)求解方法,運(yùn)用4組誤差值的平均值作為誤差函數(shù),提升了誤差函數(shù)計(jì)算的穩(wěn)定性,從而提高了自適應(yīng)濾波算法的穩(wěn)定性,改進(jìn)后的權(quán)系數(shù)求解公式為
(10)
(11)
如圖3所示,通過(guò)加入四級(jí)流水線,其關(guān)鍵路徑近似變?yōu)樵囗?xiàng)結(jié)構(gòu)的1/4,濾波器工作頻率可提高為原工作頻率的4倍;在相同工作頻率下,其功耗可降低為原功耗的β′2(0<β′<1)倍。
圖3 四級(jí)流水線LMS自適應(yīng)濾波權(quán)系數(shù)求解方法Fig.3 LMS filter coefficient based on 4 stages pipelines
圖4 系統(tǒng)處理速率及功耗與流水線級(jí)數(shù)關(guān)系Fig.4 Relationship between pipeline stages and system frequency, power consumption
綜上所述,加入并行技術(shù)和流水線的LMS自適應(yīng)濾波算法,可大幅提高現(xiàn)有LMS自適應(yīng)濾波處理速率,從而提高有效實(shí)現(xiàn)高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波處理。
分別對(duì)加入流水線的權(quán)系數(shù)求解結(jié)構(gòu)最小時(shí)鐘周期、功耗與流水線級(jí)數(shù)的關(guān)系進(jìn)行仿真,結(jié)果如圖4所示。由圖4可知對(duì)于四階LMS自適應(yīng)濾波權(quán)系數(shù)求解結(jié)構(gòu)而言(流水線級(jí)數(shù)為0級(jí)時(shí)即為現(xiàn)有自適應(yīng)濾波器),當(dāng)流水線級(jí)數(shù)小于等于4級(jí)時(shí),其最小時(shí)鐘周期與功耗均隨流水線級(jí)數(shù)增加而減小,系統(tǒng)時(shí)鐘速率提升,功耗下降;當(dāng)流水線級(jí)數(shù)大于4時(shí),由于系統(tǒng)最小延時(shí)即為乘法器延時(shí),因此其最小時(shí)鐘周期保持不變,隨著流水線級(jí)數(shù)的增加,其引入的延遲單元不斷增多,系統(tǒng)功耗逐漸增大。綜上所述對(duì)于四階LMS自適應(yīng)濾波權(quán)系數(shù)求解結(jié)構(gòu),其流水線級(jí)數(shù)為4時(shí),系統(tǒng)數(shù)據(jù)處理速率最快,功耗最低,系統(tǒng)最優(yōu)。
基于并行技術(shù)和流水線的LMS自適應(yīng)濾波算法的FPGA實(shí)現(xiàn),本文采用xilinx FPGA的Virtex5開(kāi)發(fā)平臺(tái),運(yùn)用Xilinx FPGA集成開(kāi)發(fā)環(huán)境Xilinx ISE Design Suite 12.1進(jìn)行代碼的設(shè)計(jì)、編譯、仿真以及在線驗(yàn)證,并將其應(yīng)用于100M以太網(wǎng)信號(hào)自適應(yīng)濾波處理。
表1對(duì)現(xiàn)有LMS自適應(yīng)濾波算法與4級(jí)并行流水線LMS自適應(yīng)濾波算法在設(shè)計(jì)實(shí)現(xiàn)時(shí)的硬件資源消耗、系統(tǒng)關(guān)鍵路徑以及功耗等方面進(jìn)行對(duì)比分析。 由表1可知,引入了4級(jí)并行MIMO結(jié)構(gòu)與4級(jí)流水線技術(shù),雖然使用了較多的硬件資源,但卻大幅縮短了系統(tǒng)關(guān)鍵路徑,使得自適應(yīng)濾波器工作頻率可提高為原工作頻率的(2TM+4TA)/TM倍(TM為乘法器延時(shí),TA為加法器延時(shí)),從而可大幅提高LMS自適應(yīng)濾波處理速率,降低系統(tǒng)功耗。
對(duì)100 MB以太網(wǎng)信號(hào)的自適應(yīng)濾波測(cè)試,將改進(jìn)前后的自適應(yīng)濾波處理算法在FPGA中實(shí)現(xiàn)。通過(guò)測(cè)試可知,改進(jìn)后的數(shù)據(jù)處理速率由原有的40 MB/s提升到190 MB/s,使得數(shù)據(jù)處理速率得到大幅提升,功耗提升了84%,從而有效降低處理系統(tǒng)功耗。
表1 改進(jìn)前后消耗資源對(duì)比
運(yùn)用FPGA在線調(diào)試工具Chipscope Analyzer進(jìn)行在線測(cè)試,圖5為現(xiàn)有LMS自適應(yīng)濾波結(jié)構(gòu)測(cè)試結(jié)果,圖6為4通道并行LMS自適應(yīng)濾波結(jié)構(gòu)測(cè)試結(jié)果,由圖5,6的對(duì)比可知,對(duì)于加入并行技術(shù)的4通道并行LMS自適應(yīng)濾波結(jié)構(gòu), 其數(shù)據(jù)處理方式由傳統(tǒng)的單路實(shí)現(xiàn)提升為4路實(shí)現(xiàn),數(shù)據(jù)輸入輸出從單輸入輸出提升為4通道并行輸入并行輸出,從而大幅提升了數(shù)據(jù)處理效率,在相同系統(tǒng)時(shí)鐘速率下,4通道并行LMS自適應(yīng)濾波算法濾波速率是現(xiàn)有LMS自適應(yīng)濾波算法的4倍。
圖5 現(xiàn)有LMS自適應(yīng)濾波算法輸入輸出Fig.5 The in/out of traditional LMS filtering structure
圖6 4通道并行LMS自適應(yīng)濾波算法輸入輸出Fig.6 The in/out of 4-channel parallel LMS filtering system
圖7 濾波前后時(shí)域頻域分析 Fig.7 Time and frequency domain analysis before and after filtering
圖7為4級(jí)并行流水線LMS自適應(yīng)濾波結(jié)構(gòu)濾波前后對(duì)比仿真。如圖所示,標(biāo)準(zhǔn)信號(hào)為100 MHz的正弦信號(hào),采樣率為2 000 MHz;濾波器輸入信號(hào)為加入期望為0,方差為0.25的高斯白噪聲的標(biāo)準(zhǔn)信號(hào)。由時(shí)域、頻域?qū)Ρ瓤芍?,該系統(tǒng)可很好地濾除信號(hào)中加入的白噪聲,在提升系統(tǒng)處理速度、降低功耗的同時(shí)有效地實(shí)現(xiàn)了噪聲的濾除。
綜上分析,運(yùn)用流水線和并行技術(shù),使得改進(jìn)后自適應(yīng)濾波工作頻率提升為傳統(tǒng)自適應(yīng)濾波的(2TM+4TA)TM倍,功耗降低為傳統(tǒng)LMS自適應(yīng)濾波算法的15.79%,從而大幅提高了數(shù)據(jù)處理速度,有效降低了系統(tǒng)功耗,實(shí)現(xiàn)了高速、超高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波處理。
本文研究了高速數(shù)據(jù)LMS濾波算法、流水線和并行技術(shù),將流水線和并行技術(shù)應(yīng)用于LMS自適應(yīng)濾波算法,提出了一種基于并行技術(shù)和流水線的最小均方誤差( LMS)自適應(yīng)濾波算法的實(shí)現(xiàn)結(jié)構(gòu)。該結(jié)構(gòu)改善了現(xiàn)有自適應(yīng)濾波結(jié)構(gòu)效率低的問(wèn)題,克服了權(quán)系數(shù)計(jì)算速率慢的缺點(diǎn),大幅提高了數(shù)據(jù)處理速率;在相同的數(shù)據(jù)處理速率下,其功耗可降低約84%;最后通過(guò)FPGA實(shí)現(xiàn)了基于并行流水線LMS自適應(yīng)濾波算法。仿真實(shí)驗(yàn)表明,該算法雖然使用了較多的硬件資源,但卻大幅提高了數(shù)據(jù)處理速度,有效降低了系統(tǒng)功耗,可用于高速數(shù)據(jù)流的實(shí)時(shí)自適應(yīng)濾波處理。
[1] 周直, 唐斌, 祝俊. 寬帶數(shù)字信道化并行結(jié)構(gòu)及FPGA實(shí)現(xiàn)[J].數(shù)據(jù)采集與處理,2010,25(5):661-665.
Zhou Zhi, Tang Bin, Zhu Jun. Wideband digital channelized parallel architecture and its FPGA implementation[J]. Journal of Data Acquisition and Processing,2010,25(5):661-665.
[2] 趙秋領(lǐng), 馮立輝, 趙克, 等. LMS 算法在微石英音叉陀螺信號(hào)解調(diào)中的應(yīng)用[J]. 儀器儀表學(xué)報(bào),2013,34(2): 366-370.
Zhao Qiuling, Feng Lihui, Zhao Ke, et al. Application of LMS algorithm in signal demodulation of micro-quartz tuning gyroscope[J]. Chinese Journal of Scientific Instrument, 2013,34 (2): 366-370.
[3] Zhou Jianjun, Lin Chunsheng, Chen Hao. A method for aircraft magnetic interference compensation based on small signal model and LMS algorithm[J]. Chinese Journal of Aeronautics, 2014, 27(6): 1578-1585.
[4] 徐艷紅. 基于模糊LMS算法的自適應(yīng)噪聲消除器[J]. 數(shù)據(jù)采集與處理, 2012,27(S1): 66-69.
Xu Yanhong. Adaptive noise canceller based on fuzzy LMS algorithm[J]. Journal of Data Acquisition and Processing, 2012,27(S1): 66-69.
[5] 陳 琳, 李建勛, 戴虎,等. 自適應(yīng)濾波在動(dòng)態(tài)推力測(cè)量中的應(yīng)用[J]. 宇航學(xué)報(bào), 2010, 7(31):1819-1824.
Chen Lin, Li Jianxun, Dai Hu, et al. Application of adaptive filter in dynamic thrust measurement[J]. Journal of Astronautics, 2010, 7(31):1819-1824.
[6] 任自釗, 徐建城, 閆永鵬. 一種改進(jìn)的變步長(zhǎng) LMS自適應(yīng)濾波算法及性能分析[J]. 計(jì)算機(jī)應(yīng)用研究, 2011, 3(28): 954-956.
Ren Zizhao, Xu Jiancheng, Yan Yongpeng. Improved variable step size LMS adaptive filtering algorithm and its performance analysis [J]. Application Research of Computers, 2011, 3(28): 954-956.
[7] 付學(xué)志, 劉忠, 胡生亮, 等. 基于FPGA的改進(jìn)型最小均方自適應(yīng)時(shí)延估計(jì)器[J]. 系統(tǒng)工程與電子技術(shù), 2011, 33(5):1191-1196.
Fu Xuezhi, Liu Zhong, Hu Shengliang, et al. Improved LMS adaptive time delay estimator based on FPGA [J]. Systems Engineering and Electronics, 2011, 33(5):1191-1196.
[8] Borisagar K R, Sedani B S, Kulkami G R. Simulation and performance analysis of LMS and NLMS adaptive filters in non-stationary noisy environment[J]. Gwalior, 2011, 6(10):32-35.
[9] 高金定. 平穩(wěn)環(huán)境下LMS算法優(yōu)化分析及其FPGA實(shí)現(xiàn)[J]. 壓電與聲光, 2013,35(3):445-451.
Gao Jinding. Optimization analysis of LMS algorithm in stationary environment and its FPGA implementation [J]. Piezoelectrics &Acoustooptics, 2013,35(3):445- 451.
[10]Polpo A, Pereira C. Reliability nonparametric Bayesian estimation in parallel system [J]. IEEE Trans on Reliability, 2009, 58(2): 364-373.
[11]鄧軍, 楊銀堂. 全數(shù)字接收機(jī)中一種基于并行流水線與快速 FIR算法的插值濾波器結(jié)構(gòu)及其實(shí)現(xiàn)[J]. 電子與信息學(xué)報(bào), 2010, 32(9):2089-2094.
Deng Jun, Yang Yintang. Structure of interpolation filter based on parallel pipelining and fast FIR algorithm and its implementation for all digital receiver[J]. Journal of Electronics & Information Technology, 2010, 32(9):2089-2094.
[12]Merlino P, Abramo A. A fully pipelined architecture for the LOCO-I compression algorithm [J]. IEEE Trans on Very Large Scale Integration (VLSI) Systems, 2009, 17(7): 967-971.
LMS Adaptive Filter Algorithm Based on Parallelism and Pipeline
Du Xiuli1,2, Jiang Huancheng2, Chen Bo1,2, Qiu Shaoming1,2
(1.Key Laboratory of Communication and Network, Dalian University, Dalian, 116622, China; 2.College of Information Engineering, Dalian University, Dalian, 116622, China)
To increase low efficiency of handling high-speed data in existing adaptive filter algorithms, an least mean squarse(LMS) adaptive filter algorithm based on parallel technology and pipeline is proposed. The proposed algorithm accelerates data processing speed to improve the speed of weight coefficient computing significantly, and reduces the critical path to improve the system working clock effectively. In the experiment based on FPGA, for the LMS adaptive filter based on 4-channel parallel structure and 4-stage pipelines, its data processing rate increases by eight times, and the power consumption can be reduced to 16%, with the same rate of data processing. It can thus realize the real-time LMS adaptive filtering process of high-speed or hyper-speed data stream.
adaptive filtering; parallelism; least mean squares(LMS); pipeline
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(“八六三”計(jì)劃)(2014AAXX10E)資助項(xiàng)目;遼寧省教育廳科學(xué)技術(shù)研究項(xiàng)目(L2014495)資助項(xiàng)目。
2015-02-07;
2015-05-18
TP274.2
A
杜秀麗(1977-),女,教授,研究方向:現(xiàn)代數(shù)字信號(hào)處理,E-mail: dxlxts@126.com。
邱少明(1977-),男,副教授,研究方向:信號(hào)采集與濾波。
江煥承(1990-),男,碩士研究生,研究方向:信號(hào)濾波技術(shù)。
陳波(1972-),男,教授,研究方向:高速信號(hào)處理。