馮艷清 李德生 熊愛金
摘要:針對定點DSP在進行取自然對數(shù)運算時運算速度慢,無法滿足日益增長的高速數(shù)字信號處理需求這一問題提出一種快速算法。該算法在分析浮點數(shù)據(jù)存儲格式的基礎(chǔ)上推導(dǎo)出該快速算法,并用c語言在TMS320C6455平臺上進行了仿真實現(xiàn),仿真驗證了該算法可以極大提高取自然對數(shù)運算速度。
關(guān)鍵詞:定點DSP;自然對數(shù);快速算法
中圖分類號:TP312 文獻標識碼:A
文章編號:1009-3044(2019)31-0294-02
1背景
DSP芯片采用特殊設(shè)計的哈佛結(jié)構(gòu),用來實現(xiàn)各種數(shù)字信號處理算法。按照DSP芯片工作的數(shù)據(jù)格式來分類,DSP芯片可分為定點DSP和浮點DSP。TI公司的TMS320C54X,TMS320C55X、TMS320C67Ix等系列的DSP芯片屬于定點DSP芯片,由于這類DSP芯片運行功耗低,在現(xiàn)代的電子系統(tǒng)設(shè)計中還在廣泛采用。在數(shù)字信號處理運算過程中,取自然對數(shù)時一種常用的運算,但定點DSP由于沒有浮點乘法器,所以在進行該運算時運算速度較慢,無法滿足對運行時間要求嚴格的場合。本文分析了浮點數(shù)據(jù)的存儲格式,運用對數(shù)基本運算規(guī)則,提出一種快速取對數(shù)的算法并用C語言進行了仿真實現(xiàn)。
2算法原理
計算機使用二進制數(shù)系處理浮點數(shù)據(jù),在一個典型的32位處理系統(tǒng)中,單精度浮點數(shù)據(jù)被分成3個字段,如圖1所示。
3算法實現(xiàn)
3.1實現(xiàn)平臺概述
算法在TMS320C6455上進行了實現(xiàn)與仿真運行。TMS320C6455是rrI公司的一款高性能單核定點DSP,主頻高達1.25GHz,0.8ns的指令周期.每周期執(zhí)行8條32位指令,最大峰值速度達到8000MIPS。與64X DSP架構(gòu)相比,代碼尺寸平均縮短了20%至30%,周期效率提高了20%、新指令包括復(fù)雜的32位寬乘法以及同步加減法指令,提高了快速傅里葉變換以及離散余弦變換的性能。同時提供了高速接口SRIO和千兆以太網(wǎng)控制器(MAC)。
3.2 C語言實現(xiàn)算法
3.3算法驗證
在TMS320C6455軟件仿真平臺下進行了兩種算法的仿真運行并進行對比,算法1使用C語言標準數(shù)學(xué)庫進行運算,算法2使用本算法進行運算。通過仿真軟件時鐘測量功能可知:算法1運行需要5274個時鐘,算法2運行需要394個時鐘,算法2運行時間壓縮到算法1的92%,極大地提高了計算速度。仿真結(jié)果如圖2所示。
4結(jié)束語
本算法利用浮點數(shù)據(jù)在內(nèi)存地址空間中的存儲格式及對數(shù)運算的性質(zhì),將取對數(shù)運算轉(zhuǎn)換為一個浮點乘法及查詢表操作,以空間換時間,極大地節(jié)省了取常用對數(shù)的運算速度。本算法在基于定點DSP的數(shù)字信號處理過程中得到了廣泛應(yīng)用,可方便地移植到其他對運行速度要求嚴格的定點DSP、單片機等32位處理平臺上。