ARM移動處理器的架構(gòu)解析

2014-10-20 10:23黃宇鍇

科技資訊 2014年3期

黃宇鍇

摘要：由于電池和散熱的限制，移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題，對移動應(yīng)用處理器來說，所有的一切都得圍繞一個詞進行：省電。。

關(guān)鍵詞：ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號： TP3 文獻標(biāo)識碼：A 文章編號：1674-098X（2014）01（B）-0000-00

隨著半導(dǎo)體工藝的日趨先進，智能手機（Smartphone 或者 Superphone）、平板電腦（Tablet 或者 Pad）已經(jīng)成為許多網(wǎng)友最常使用、最多關(guān)注、更新最快的電子消費產(chǎn)品，高度便攜性是這類產(chǎn)品的最關(guān)鍵成功原因。

所謂便攜性自然是指產(chǎn)品必須足夠輕便而且需要有足夠的續(xù)航能力，因此這就要求產(chǎn)品的原件必須足夠省電，只有這樣才能減少散熱和電池體積這兩個最占體積和重量的問題。因此對于傳統(tǒng)的 CPU 由于功耗問題不能完全適用于手機、平板。

按照 ISA（指令集架構(gòu)）劃分，因為目前的手機、平板等移動設(shè)備的 CPU 無非是 ARM、Intel/AMD 兩大陣營，而就是應(yīng)為功耗的原因。在移動設(shè)備中ARM幾乎占了統(tǒng)治的地位。下面就通過對現(xiàn)在市場中的最新的兩款A(yù)RM架構(gòu)進行解析。

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比，Cortex-A15 有非常明顯的變化：

（1）整數(shù)流水線最短工位數(shù)達(dá)到 15 級，管芯面積占用比 Cortex-A9 高一倍。

（2）采用三路超標(biāo)量微架構(gòu)，可以每個周期取指四條指令，解碼器每個周期可以為發(fā)送單元提供 3 條指令，而指令發(fā)射單元可以亂序提供最高 8 個微操作供執(zhí)行單元運行。

相比之下，A9 的解碼器只能每周期跑兩條指令，派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

（3）Cortex-A15 的動態(tài)分支預(yù)測技術(shù)和 Cortex-A8/A9 差不多，但是 A15 引入了一個 64 條目的 microBTB，而此前的 A8/A9 并不具備這樣的分層結(jié)構(gòu)。動態(tài)分支預(yù)測能力是影響現(xiàn)代風(fēng)格處理器的關(guān)鍵因素之一，像 Pentium 4 的 BTB 是 4K 條目，SandyBridge 據(jù)說達(dá)到 8K～16K。

雖然 A15 的兩級 BTB 條目總數(shù)較 A8/A9 少，但是 A15 的 Return Stack 條目數(shù)從 8 條增加到了 18 條，取指帶寬從之前的 64-bit 提升到 128-bit，而且完全支持邊界非對齊地址的拾取。

（4）Cortex-A15 支持 VFPv4，具備硬件 FMA 指令執(zhí)行，可以在同頻下提供兩倍的峰值浮點性能。此外，A15 還具備硬件除法指令，在 A9 上這需要接近 50 個周期來執(zhí)行。

（5）A15 的周邊總線為 AMBA4，128-bit master 界面，A9 的 AMBA3 的 master 界面是 64-bit。

（6）雖然 ARMv7 是 32-bit ISA，但是現(xiàn)在 Cortex-A15 支持 40-bit 物理定址（類似于當(dāng)年的 Pentium Pro 和 Atlhon），而且 L1/L2 Cache 具備 ECC，因此理論上適用于服務(wù)器級應(yīng)用。

（7）A15 和 A9 都有一個類似的 small loop 緩存，用于存放小循環(huán)，讓執(zhí)行單元無需訪問指令 cache 就能抓到指令。在 A9 上它可以存放大小為 64 字節(jié)的指令。

而在 A15 上則是 32 條目，可以存放兩條前轉(zhuǎn)分支和一條后轉(zhuǎn)分支，而且 A15 的 small loop 緩存存放的是已經(jīng)解碼的微操作，這意味著連解碼步驟也能節(jié)省掉。

Cortex A15 的整數(shù)性能為 3.5～4.01 DMIPS/MHz，相比起 A9 的 2.5 DMIPS/MHz 和 A8 的 2.0 DMIPS/MHz 有明顯的改進，不過因為三路超標(biāo)量而帶來的各種資源增加，A15 需要更先進的制程（32 納米或更先進）才能在手機、平板上變得比較適用。

2 高通 Krait 內(nèi)核微架構(gòu)特點

Krait 微架構(gòu)是高通第四代 Snapdragon（驍龍）處理器所搭配的 CPU 內(nèi)核微架構(gòu)，是 ARMv7 架構(gòu)的實現(xiàn)，屬于高通的 ARM 架構(gòu)級授權(quán)、自行研發(fā)的處理器內(nèi)核微架構(gòu)。

Krait 的前身是 Scorpion，在產(chǎn)品布局上它和 Scorpion 有些類似，例如 Scorpion 定位于 Cortex-A8 和 Cortex-A9，而 Krait 的定位也是類似，即 Cortex-A9 和 Cortex-A15 之間，具備一些 Cortex-A15 的特征。

例如 L0 cache（Cortex-A15 上有類似作用的 loop buffer，相當(dāng)于 L0 I-cache，指令調(diào)度器無需經(jīng)過解碼器就能抓到小循環(huán)的微操作指令）、三路超標(biāo)量、VFP4 浮點單元、128-bit SIMD 處理能力（高通稱 SIMD 單元為 VeNum，ARM 自己則稱之為 NEON）以及基于 A15 同級的半導(dǎo)體制程節(jié)點。至于有人說 Krait 是 A9 的改進版，這樣的觀點我很難認(rèn)同，它和 Scorpion 都類似于當(dāng)年 DEC 獲得 ARMv4 ISA 授權(quán)而自行研發(fā)的微架構(gòu)。

不過另一方面，Krait 的亂序執(zhí)行要遜色于 Cortex-A15，后者具備八個指令發(fā)射端口和八個執(zhí)行端口，每一個執(zhí)行端口都對應(yīng)一個（準(zhǔn)）保留站（有些類似于 AMD K7-K10），而 Krait 只有四個指令發(fā)射端口和七個執(zhí)行端口，并且采用的是類似 Cortex-A9 或者說 Pentitum Pro 方式的單個大規(guī)模指令發(fā)射隊列單元。

3 總結(jié)

由于電池和散熱的限制，移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗電問題，對移動應(yīng)用處理器來說，所有的一切都得圍繞一個詞進行：省電。省電不只光靠制程上的改進，還有芯片本身的設(shè)計也是極為重要的，

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008（07）

摘要：由于電池和散熱的限制，移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題，對移動應(yīng)用處理器來說，所有的一切都得圍繞一個詞進行：省電。。

關(guān)鍵詞：ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號： TP3 文獻標(biāo)識碼：A 文章編號：1674-098X（2014）01（B）-0000-00

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比，Cortex-A15 有非常明顯的變化：

（1）整數(shù)流水線最短工位數(shù)達(dá)到 15 級，管芯面積占用比 Cortex-A9 高一倍。

相比之下，A9 的解碼器只能每周期跑兩條指令，派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

（5）A15 的周邊總線為 AMBA4，128-bit master 界面，A9 的 AMBA3 的 master 界面是 64-bit。

2 高通 Krait 內(nèi)核微架構(gòu)特點

3 總結(jié)

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008（07）

摘要：由于電池和散熱的限制，移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題，對移動應(yīng)用處理器來說，所有的一切都得圍繞一個詞進行：省電。。

關(guān)鍵詞：ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號： TP3 文獻標(biāo)識碼：A 文章編號：1674-098X（2014）01（B）-0000-00

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比，Cortex-A15 有非常明顯的變化：

（1）整數(shù)流水線最短工位數(shù)達(dá)到 15 級，管芯面積占用比 Cortex-A9 高一倍。

相比之下，A9 的解碼器只能每周期跑兩條指令，派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

（5）A15 的周邊總線為 AMBA4，128-bit master 界面，A9 的 AMBA3 的 master 界面是 64-bit。

2 高通 Krait 內(nèi)核微架構(gòu)特點

3 總結(jié)

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008（07）

科技資訊2014年3期

科技資訊的其它文章: 高鐵車載ATP“無線連接超時”故障淺析; 智能光交換網(wǎng)絡(luò)的解決方案及應(yīng)用; 一種智能燈光控制器的設(shè)計; 大型風(fēng)電場中央監(jiān)控系統(tǒng)的研究; 提高自動化設(shè)備可靠性的智能控制系統(tǒng)的研究; 基于小波和分?jǐn)?shù)階傅里葉變換的混沌圖像加密

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

ARM移動處理器的架構(gòu)解析