謝迎娟,折夏煜,褚嘉敏,王 亮,蔡 莉,王海濱,韓光潔
1(河海大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,南京 211100) 2(北京微電子技術(shù)研究所,北京 100076) 3(中國(guó)科學(xué)院 近代物理研究所,蘭州 730000) 4(江蘇省輸配電裝備技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 常州 213000) E-mail:wanghaibin@hhu.edu.cn
在過去的幾十年里,各種先進(jìn)的計(jì)算系統(tǒng)得到廣泛的開發(fā)和應(yīng)用.超級(jí)計(jì)算機(jī)日新月異,各類計(jì)算中心和服務(wù)器無處不在,已經(jīng)深度融入人類生產(chǎn)生活的方方面面.但與此同時(shí),一方面,傳統(tǒng)的計(jì)算系統(tǒng)在一些重要的物理限制(如功耗、面積等指標(biāo))下不能有效地進(jìn)一步增強(qiáng)性能,摩爾定律已經(jīng)接近極限;另一方面,對(duì)于一部分產(chǎn)業(yè)來說,計(jì)算系統(tǒng)需要得到精確的結(jié)果[1],但在越來越多的應(yīng)用系統(tǒng)中,并不需要嚴(yán)格意義上的正確結(jié)果.例如,圖像處理算法的計(jì)算通常在像素級(jí)進(jìn)行,輕微的質(zhì)量缺陷是可以容忍的,人類視覺系統(tǒng)無法察覺.人們?cè)絹碓秸J(rèn)識(shí)到,過度的精確性從來就不是免費(fèi)的,它消耗了我們的時(shí)間和世界的能源.因此,通過犧牲不必要的精度,可以在功率和性能上獲得極大的優(yōu)化.
近似計(jì)算(Approximate Computing)利用計(jì)算結(jié)果的準(zhǔn)確性來優(yōu)化系統(tǒng)資源的使用,是加速處理器的最可行方法之一[2].對(duì)于許多可以接受不準(zhǔn)確結(jié)果的系統(tǒng)來說,如人工智能、機(jī)器學(xué)習(xí)[3]、數(shù)字信號(hào)處理(Digital Signal Processing,DSP)、多媒體、機(jī)器學(xué)習(xí)和模式識(shí)別[4]等,它已經(jīng)成為一種比傳統(tǒng)計(jì)算架構(gòu)更可取的新方案.受人腦容錯(cuò)能力的啟發(fā),近似計(jì)算在不犧牲功能和“感知”的情況下通過適當(dāng)?shù)亟档陀?jì)算精度,來協(xié)調(diào)和權(quán)衡計(jì)算質(zhì)量(例如,精度)和計(jì)算消耗(例如,功耗和面積)[5].
近似計(jì)算可以應(yīng)用于硬件和軟件以及不同的系統(tǒng)層[6].在電路級(jí),由于其在許多計(jì)算應(yīng)用中的重要作用,近似算法單元的設(shè)計(jì)得到了廣泛的研究.近些年來,各種近似加法器已經(jīng)被提出,以達(dá)到降低功耗和延遲的目的.而相比于加法器,乘法器的結(jié)構(gòu)更加復(fù)雜,面積和功耗往往是同位寬加法器的數(shù)倍,因此近似乘法器對(duì)性能的優(yōu)化更加可觀.相比于精確乘法器,近似乘法器通過適當(dāng)?shù)胤艑掃\(yùn)算精度,簡(jiǎn)化或刪除部分運(yùn)算電路,不僅可以節(jié)省開銷,并且能夠優(yōu)化電路中關(guān)鍵路徑的延時(shí),加快計(jì)算速度[7].對(duì)于一些處理過程本身就是不精確的應(yīng)用來說,近似乘法器甚至可以對(duì)原有的不精確部分進(jìn)行補(bǔ)償,得到更好的處理結(jié)果.
本文基于精確二進(jìn)制乘法器,提出了操作數(shù)裁剪模塊和低開銷部分積累加算法,設(shè)計(jì)了一種新型近似乘法器.并對(duì)該近似乘法器的誤差特性和開銷性能進(jìn)行仿真,與主流輸入級(jí)近似方法進(jìn)行對(duì)比.
一般地,在數(shù)字電路中,近似計(jì)算可以運(yùn)用于近似乘法器的3個(gè)部分:
1)輸入級(jí)近似:
通過編碼或者直接截?cái)嗟姆绞剑瑴p少了部分積的產(chǎn)生和運(yùn)算過程.1962年,J.N.Mitcheu提出了對(duì)數(shù)乘法器,即將兩個(gè)二進(jìn)制乘數(shù)通過以2為底的對(duì)數(shù)運(yùn)算轉(zhuǎn)化為其近似的二進(jìn)制對(duì)數(shù),再通過加法器將二者相加,最后將和還原為近似積[8].但是將數(shù)字轉(zhuǎn)化為近似對(duì)數(shù)時(shí)較為麻煩,導(dǎo)致功耗增加.迭代對(duì)數(shù)乘法器(Iterative Logarithmic Multiplier,ILM)是以精度為代價(jià)對(duì)其進(jìn)行改進(jìn)的簡(jiǎn)潔算法,但是誤差比對(duì)數(shù)乘法器大.G.Zervakis等人利用部分積穿孔技術(shù)實(shí)現(xiàn)了乘法運(yùn)算的近似,并以穿孔位置及大小為變量對(duì)近似乘法器的精度和開銷進(jìn)行了分析比較[9].S.Vahdat等人提出了基于截?cái)嗪蜕崛氲膭?dòng)態(tài)近似乘法器(Truncation-and Rounding-based Scalable Approximate Multiplier,TOSAM),獲得了較高的精確度,但是功耗降低的程度有限[10].S.Narayanamoorthy等人提出的加強(qiáng)型靜態(tài)片段法乘法器(Enhanced Static Segment Multiplier,ESSM)主要思想為采用多個(gè)固定片段,當(dāng)判斷高位的片段為全0時(shí)采用下一個(gè)片段[11].另外,動(dòng)態(tài)范圍無偏乘法器(Dynamic Range Unbiased Multiplier,DRUM)[12]和基于取整的乘法器(Rounding-Based Approximate,RoBA)[13]也是兩種誤差較小的近似算法,但是面積與功耗較大.其中,DRUM引入了最高有效位檢測(cè)模塊(Leading-One Detector,LOD),動(dòng)態(tài)地對(duì)最有效的位進(jìn)行乘法運(yùn)算.
2)部分積產(chǎn)生級(jí)近似:
通過在相乘的過程中避免低位部分積的產(chǎn)生,從而減少相乘的運(yùn)算步驟.生成部分乘積的一種簡(jiǎn)單方法是將乘數(shù)的每一位乘上被乘數(shù),這可以通過簡(jiǎn)單的邏輯運(yùn)算來實(shí)現(xiàn).另一種方法是將乘法器編碼為高基數(shù),并將已編碼的乘法器乘以被乘數(shù).隨著基數(shù)的增加,對(duì)乘法器的編碼就變得更加復(fù)雜.因此,為了降低復(fù)雜度,可以使用近似編碼器來生成部分乘積[14].W.Liu等人提出了兩種有效的以4為基數(shù)近似Booth編碼器[15].
3)部分積求和級(jí)近似:
通過對(duì)重要位(即高位)精確求和而對(duì)不重要位(即低位)近似求和,從而縮短進(jìn)位鏈,減小延時(shí)開銷.H.R.Mahdiani等人提出了一種不精確的陣列乘法器,將部分積樹中一些最不重要的列作為常數(shù)忽略掉[16].另外,在高速乘法器的設(shè)計(jì)中,壓縮器或計(jì)數(shù)器被廣泛用于加速部分積的求和.O.Akbari等人提出了4種近似4∶2的壓縮器并運(yùn)用于乘法運(yùn)算中[17].M.Ha和S.Lee提出了一種近似4∶2的壓縮器,并在部分積累積步驟中引入了誤差恢復(fù)模塊,提高了乘法的精度[18].
本文將針對(duì)乘法器的輸入級(jí),設(shè)計(jì)新型近似乘法器,并與主流近似乘法器進(jìn)行比較.
精確乘法器的二進(jìn)制運(yùn)算流程如圖1所示.其中,操作數(shù)A和操作數(shù)B為乘法的輸入項(xiàng)的二進(jìn)制表示,可寫為:
圖1 乘法器的運(yùn)算流程Fig.1 Operation flow of the reference multiplier
(1)
(2)
其中,n1、n2分別是儲(chǔ)存兩個(gè)二進(jìn)制操作數(shù)A、B的寄存器位寬,ai、bi分別是二進(jìn)制操作數(shù)A、B從低位開始第i位的值(i≥0).
對(duì)于位乘積模塊,本文采用將乘數(shù)的每一位乘上被乘數(shù)的邏輯運(yùn)算方法生成部分積樹.對(duì)部分積樹進(jìn)行累加,得到乘積的二進(jìn)制輸出O:
O=A×B
(3)
一般地,將操作數(shù)中2的指數(shù)越大的位稱為高位,反之為低位.高位為重要位,即高位被更改比低位對(duì)乘法結(jié)果的影響更大.
基于穿孔的近似乘法器從低位開始舍去操作數(shù)的部分位,在可接受精確度范圍內(nèi)減少部分積累加步驟.通過改變穿孔起點(diǎn)和長(zhǎng)度,實(shí)現(xiàn)運(yùn)算精度和開銷之間的權(quán)衡.
在該近似乘法器中,設(shè)置操作數(shù)的穿孔起點(diǎn)及長(zhǎng)度分別為j、k,則穿孔后進(jìn)行位乘積的輸入項(xiàng)為:
(4)
(5)
生成部分積樹后,進(jìn)行累加,得到乘積的二進(jìn)制輸出Oq:
Oq=Aq×Bq;
(6)
本節(jié)將基于精確乘法器的二進(jìn)制運(yùn)算流程,提出操作數(shù)裁剪方法和低開銷部分積累加算法,設(shè)計(jì)一種新型近似乘法器.運(yùn)算流程圖如圖2所示,通過以下4步實(shí)現(xiàn):
圖2 基于操作數(shù)裁剪的近似乘法器運(yùn)算流程Fig.2 Operation flow of the proposed approxiamte multiplier
1)操作數(shù)裁剪
操作數(shù)A和B操作數(shù)為該近似乘法器的輸入項(xiàng).
首先,根據(jù)儲(chǔ)存兩個(gè)二進(jìn)制操作數(shù)A、B的寄存器位寬,設(shè)置分別對(duì)A和B進(jìn)行近似操作的截取間隔數(shù)k、l(k、l為正整數(shù)).
根據(jù)截取間隔數(shù)k、l確定A和B的近似標(biāo)志位,設(shè)A的近似標(biāo)志位:
Ac=or(a2k+2,a2k+3,…,an1-1)
(7)
記B的近似標(biāo)志位:
Bc=or(b2l+2,b2l+3,…,bn2-1)
(8)
其次,根據(jù)近似標(biāo)志位Ac、Bc確定簡(jiǎn)化的乘法輸入項(xiàng).圖3為對(duì)操作數(shù)A進(jìn)行截取操作的示意圖.
圖3 操作數(shù)截取操作示意圖Fig.3 Diagram of operand pruning
若Ac=0,表示二進(jìn)制操作數(shù)A從低位開始的第2k+2位-第n1-1位均為零,則將A左移兩位;若Ac=1,表示二進(jìn)制操作數(shù)A從低位開始的第2k+2位-第n1-1位不全為零,則不對(duì)A進(jìn)行移位操作.
最后,對(duì)二進(jìn)制操作數(shù)A的第0位-第2k-1位進(jìn)行近似截取操作,保留第0位及第k位,去除第1-第k-1位及第k+1-第2k-1位,共去除2k-2位,同時(shí)更新第2k位的值a′2k,得到簡(jiǎn)化的乘法輸入項(xiàng)Ap,表示為:
(9)
其中,當(dāng)0 a′2k=or(and(a2k-1,ak-1),a2k) (10) 當(dāng)k≥3時(shí), a′2k=or(and(a2k-1,a2k-2),a2k) (11) 同樣地,對(duì)B進(jìn)行移位和截取操作. 若Bc=0,表示二進(jìn)制操作數(shù)B從低位開始的第2l位-第n2-1位均為零,則將B左移兩位;若Bc=1,表示二進(jìn)制操作數(shù)B從低位開始的第2l位-第n2-1位不全為零,則不對(duì)B進(jìn)行移位操作. 對(duì)二進(jìn)制操作數(shù)B的第0位-第2l-1位進(jìn)行近似截取操作,保留第0位-第l位,去除第1-第l-1位及第l+1-第2l-1位,共去除2l-2位,同時(shí)更新第2l位的值b′2l,得到簡(jiǎn)化的乘法輸入項(xiàng)Bp,表示為: (12) 其中,當(dāng)l<3時(shí), b′2l=or(and(b2l-1,bl-1),b2l) (13) 當(dāng)l≥3時(shí), b′2l=or(and(b2l-1,b2l-2),b2l) (14) 2)位乘積 通過位乘積模塊,得到部分積樹.同樣地,該模塊生成部分乘積所使用的方法是將乘數(shù)的每一位乘上被乘數(shù),通過簡(jiǎn)單的邏輯運(yùn)算來實(shí)現(xiàn). 3)部分積累加 當(dāng)對(duì)部分積進(jìn)行累加時(shí),記部分積樹的第m行部分積為Dm(m=1,2,…,P). 累加的具體操作為:首先,分別利用全加器和半加器對(duì)D1、D2、D3、D4按位進(jìn)行累加操作,得到新的部分積D′3和D′4;然后分別利用全加器和半加器對(duì)D′3、D′4、D5按位進(jìn)行累加操作,得到新的部分積D″4和D″5;重復(fù)累加操作,直到所有部分積都累加完成得到最終乘法結(jié)果O,O為二進(jìn)制操作數(shù). 需要注意的是,累加操作一共執(zhí)行P-2步,其中第一步后部分積減少兩行,其余P-3步后部分積每次減少一行. 4)移位 在輸入項(xiàng)截取模塊中,根據(jù)近似標(biāo)志位Ac、Bc的大小確定是否對(duì)A、B進(jìn)行移位操作.因此,在部分積累加模塊后,需要根據(jù)Ac、Bc的大小對(duì)部分積累加結(jié)果進(jìn)行移位操作,得到最終的乘積輸出Op: Op=Ap×Bp (15) 以8位乘法器為例,分析精確和近似乘法器的開銷. 對(duì)于精確乘法器,通過位乘積運(yùn)算得到的部分積樹共有8行.圖4(a)為對(duì)部分積樹進(jìn)行累加的過程簡(jiǎn)化圖,其中一個(gè)黑點(diǎn)代表一個(gè)數(shù)據(jù),如圖例所示,虛線框內(nèi)包含兩個(gè)數(shù)據(jù)的為加法器,加法器內(nèi)包含3個(gè)數(shù)據(jù)的為全加器. 由圖4(a)可得,基于部分積樹,每一步運(yùn)算后部分積減少一行.因此,8位精確乘法器一共需7步計(jì)算得到最終的結(jié)果. 對(duì)于基于穿孔的近似乘法器,設(shè)置j=0,k=2,則位乘積運(yùn)算得到的部分積樹共有6行,圖4(b)為累加操作的簡(jiǎn)化過程.基于部分積樹,基于穿孔的近似乘法器一共需要5步計(jì)算得到最終的結(jié)果.相比于精確乘法器,基于穿孔的近似乘法器將部分積累加步驟減少了2步. 對(duì)于本文提出的基于操作數(shù)裁剪的近似乘法器,設(shè)置k=l=2,則乘法器的輸入項(xiàng)更新為: (16) (17) 其中, a′4=or(and(a3,a1),a4) (18) b′4=or(and(b3,b1),b4) (19) 在該近似乘法器中,通過裁剪輸入項(xiàng)的部分位,使得對(duì)部分積樹進(jìn)行累加時(shí),第1步操作實(shí)現(xiàn)對(duì)前4行的累加,即前4行部分積樹內(nèi)同一位只包含兩個(gè)或3個(gè)部分積.圖4(c)為k和l均設(shè)置為2時(shí),8位近似乘法器的部分積累加過程.若k和l設(shè)置為1,則該近似乘法器無法實(shí)現(xiàn)低功耗部分積累計(jì)算法;若k和l設(shè)置為3,則會(huì)大大降低乘法計(jì)算的精度.所以,對(duì)于8位近似乘法器,本文將k和l均設(shè)置為2. 圖4 8位乘法器的部分積累加簡(jiǎn)化圖Fig.4 Accumulation of partial products of(left)the reference 8-bit multiplier,(middle)the perforated-based 8-bit approximate multiplier,(right)the proposed 8-bit approximate multiplier 位乘積運(yùn)算得到的部分積樹一共6行,基于部分積樹,該近似乘法器一共需要4步計(jì)算得到最終的結(jié)果.因此,相比于8位精確乘法器,本文所提出的近似乘法器將部分積累加步驟減少了約42.8%. 同理,為了滿足低功耗部分積累加算法要求并保證精度需求,對(duì)于10位近似乘法器,將k和l均設(shè)置為3,則乘法器的輸入項(xiàng)更新為: 英國(guó)Romax科技有限公司是世界領(lǐng)先的工程技術(shù)咨詢公司,總部位于英國(guó)諾丁漢,在齒輪箱、軸承和機(jī)械傳動(dòng)系統(tǒng)方面擁有豐富的經(jīng)驗(yàn)和近30年的咨詢歷史。Romax出色的工程團(tuán)隊(duì)和高級(jí)虛擬產(chǎn)品開發(fā)與仿真軟件RomaxDESIGNER家族系列產(chǎn)品,為全球傳動(dòng)汽車、新能源汽車、軌道交通等工業(yè)領(lǐng)域的大型設(shè)備供應(yīng)商提供設(shè)計(jì)、分析及認(rèn)證支持等服務(wù)。 (20) (21) 其中, a′6=or(and(a4,a5),a6) (22) b′6=or(and(b4,b5),b6) (23) 位乘積運(yùn)算得到的部分積樹一共6行,圖5為位累加算法的簡(jiǎn)化過程.由圖5可知,基于部分積樹,該近似乘法器一共需要4步計(jì)算得到最終的結(jié)果. 圖5 10位近似乘法器的部分積累加簡(jiǎn)化圖Fig.5 Accumulation of partial products of the proposed 10-bit approximate multiplier 而對(duì)于10位二進(jìn)制精確乘法器,一共需要9步部分積累加步驟.因此,近似乘法器將部分積累加步驟減少了約56%. 對(duì)于本文所提出的近似乘法器,其操作數(shù)裁剪方法和低功耗部分積累加算法是通用的.對(duì)于不同位寬的乘法器,通過設(shè)置k和l的數(shù)值,決定輸入項(xiàng)需要裁剪的位,就可實(shí)現(xiàn)低功耗的部分積累加算法. 各種近似算法單元差別較大.通常地,在近似乘法器設(shè)計(jì)完成后,以下幾個(gè)指標(biāo)可以用于綜合衡量其誤差特性: 1)誤差率.指近似計(jì)算單元錯(cuò)誤輸出占總輸出的比例,可以反應(yīng)近似計(jì)算單元出錯(cuò)的頻率; 2)平均誤差距離.指近似輸出與精確輸出的差值,大量輸入下的平均效應(yīng)能更好地反應(yīng)近似計(jì)算單元的誤差累積效應(yīng),平均誤差距離越大,誤差累積越嚴(yán)重,對(duì)輸出質(zhì)量影響越大.近似計(jì)算單元的所有輸入具有隨機(jī)性,可以認(rèn)為呈現(xiàn)均勻分布,因此對(duì)所有輸入下的誤差距離求均值即可獲得平均誤差距離; 3)最大誤差距離.指近似計(jì)算單元在單次計(jì)算中可能出現(xiàn)的最大誤差,反應(yīng)最大的誤差嚴(yán)重程度.最大誤差距離越大,越容易對(duì)應(yīng)用的結(jié)果產(chǎn)生嚴(yán)重影響. 在本文中,使用6000對(duì)操作數(shù)來衡量8位近似乘法器的誤差特性,數(shù)值大小為0-255的隨機(jī)正整數(shù),仿真結(jié)果如表1所示.除了本文所提出的基于操作數(shù)裁剪的近似乘法器以及精確乘法器,與基于穿孔的近似乘法器、DRUM、ESSM等主流輸入級(jí)近似方法也進(jìn)行了對(duì)比分析. 由表1可知,DRUM是一種精度較高的近似乘法器,平均誤差距離和最大誤差距離分別為0.84%和6.35%.這是因?yàn)樗肓藘蓚€(gè)最高有效位檢測(cè)模塊,以及兩個(gè)多路復(fù)用器選擇進(jìn)行乘法運(yùn)算的數(shù)據(jù)位,動(dòng)態(tài)地對(duì)最有效的位進(jìn)行乘法運(yùn)算.但是在實(shí)際應(yīng)用中,該乘法器會(huì)導(dǎo)致較大的面積與功耗開銷. 表1 近似乘法器誤差特性仿真結(jié)果Table 1 Simulation results of error characteristics of approximate multipliers 基于穿孔的近似乘法器精度非常低,其最大誤差距離為100%,并不會(huì)隨著參數(shù)改變而降低.這是因?yàn)樵摻瞥朔ㄆ魈幚砗?jiǎn)單,保留輸入項(xiàng)中高位的數(shù)據(jù)而舍去低位的數(shù)據(jù),如果當(dāng)輸入項(xiàng)數(shù)值較小或者保留位的值均為0時(shí),就會(huì)導(dǎo)致該次結(jié)果的誤差距離為100%. 與之相比,本文所提出的近似乘法器精度有很大的提升,平均誤差距離和最大誤差距離分別為3.01%和20.47%.這是因?yàn)?,本文所提出的基于操作?shù)裁剪的近似乘法器在對(duì)輸入項(xiàng)裁剪之前,考察了高位全為0的情況.若高位不全為0,則直接裁剪;若高位全為0,則進(jìn)行移位操作后裁剪,在部分積累加結(jié)束后再進(jìn)行一次移位操作得到最終結(jié)果.另外,該近似乘法器在裁剪之后,更新了輸入項(xiàng)中部分高位,彌補(bǔ)了數(shù)據(jù)裁剪對(duì)精度的影響. ESSM與基于操作數(shù)裁剪的近似乘法器一樣,進(jìn)行了高位考察及移位操作,保證了較高的精確度,其平均誤差距離和最大誤差距離分別為1.62%和8.75%. 基于Xilinx Vivado 2019.1平臺(tái),本節(jié)將比較精確乘法器、本文提出的基于操作數(shù)裁剪的近似乘法器、基于穿孔的近似乘法器、DRUM、ESSM的性能與資源開銷,具體包括查找表(Look-up-tables,LUTs)資源使用量、寄存器資源使用量和片上功耗等. 以8位二進(jìn)制乘法器為例,圖6展示了LUT使用量、功耗開銷以及平均誤差距離的三維圖.為便于在圖中展示,將精確乘法器、基于操作數(shù)裁剪的近似乘法器、基于穿孔的近似乘法器分別記作PM、TRU-M、PER-M. 從圖6中可以看出,一個(gè)8位精確乘法器的LUT使用量和片上功耗分別為72和14.7w.PER-M乘法器減少了資源使用和功耗開銷,其LUT使用量和片上功耗以及分別為35和9.9w,但是該乘法器誤差很大,平均誤差距離約為7%. 圖6 多種近似乘法器LUT使用量、片上功耗以及平均誤差距離的三維圖Fig.6 3-D graph of LUT usage,power consumption on chip and average error distance of various approximate multipliers DRUM和ESSM是兩種精度較高的乘法器,平均誤差距離分別約為0.8%和1.6%,但是資源使用量和功耗較大,LUT使用量分別為93和69,片上功耗分別為14.3w和12.9w. 本文所提出的近似乘法器的LUT使用量、片上功耗以及平均誤差距離分別為60、7.8和3%,以3%的精度損失減少了約16.7%的資源使用和46.9%的片上功耗. 基于精確二進(jìn)制乘法器,本文設(shè)計(jì)了一種新型近似乘法器.對(duì)于8位和10位二進(jìn)制乘法器,利用操作數(shù)裁剪模塊和低開銷部分積累加算法,可以將部分積累加步驟分別減少約42.8%和56%. 本章對(duì)各個(gè)乘法器進(jìn)行了實(shí)現(xiàn),并采用誤差率、平均誤差距離和最大誤差距離衡量了誤差特性.結(jié)果顯示,本文所提出的近似乘法器的精度相比于基于穿孔的近似乘法器有很大的提升,平均誤差距離和最大誤差距離分別為3.01%和20.47%.由性能評(píng)估可知,相比于精確乘法器,該近似乘法器以3.01%的精度損失減少了約16.7%的資源使用和46.9%的片上功耗.3.4 開銷分析
4 實(shí)驗(yàn)結(jié)果與分析
4.1 誤差特性仿真
4.2 性能評(píng)估
5 結(jié) 論