国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ARM移動處理器的架構(gòu)解析

2014-10-20 10:23黃宇鍇
科技資訊 2014年3期

黃宇鍇

摘要:由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。。

關(guān)鍵詞:ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號: TP3 文獻標(biāo)識碼:A 文章編號:1674-098X(2014)01(B)-0000-00

隨著半導(dǎo)體工藝的日趨先進,智能手機(Smartphone 或者 Superphone)、平板電腦(Tablet 或者 Pad)已經(jīng)成為許多網(wǎng)友最常使用、最多關(guān)注、更新最快的電子消費產(chǎn)品,高度便攜性是這類產(chǎn)品的最關(guān)鍵成功原因。

所謂便攜性自然是指產(chǎn)品必須足夠輕便而且需要有足夠的續(xù)航能力,因此這就要求產(chǎn)品的原件必須足夠省電,只有這樣才能減少散熱和電池體積這兩個最占體積和重量的問題。因此對于傳統(tǒng)的 CPU 由于功耗問題不能完全適用于手機、平板。

按照 ISA(指令集架構(gòu))劃分,因為目前的手機、平板等移動設(shè)備的 CPU 無非是 ARM、Intel/AMD 兩大陣營,而就是應(yīng)為功耗的原因。在移動設(shè)備中ARM幾乎占了統(tǒng)治的地位。 下面就通過對現(xiàn)在市場中的最新的兩款A(yù)RM架構(gòu)進行解析。

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比,Cortex-A15 有非常明顯的變化:

(1)整數(shù)流水線最短工位數(shù)達(dá)到 15 級,管芯面積占用比 Cortex-A9 高一倍。

(2)采用三路超標(biāo)量微架構(gòu),可以每個周期取指四條指令,解碼器每個周期可以為發(fā)送單元提供 3 條指令,而指令發(fā)射單元可以亂序提供最高 8 個微操作供執(zhí)行單元運行。

相比之下,A9 的解碼器只能每周期跑兩條指令,派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

(3)Cortex-A15 的動態(tài)分支預(yù)測技術(shù)和 Cortex-A8/A9 差不多,但是 A15 引入了一個 64 條目的 microBTB,而此前的 A8/A9 并不具備這樣的分層結(jié)構(gòu)。動態(tài)分支預(yù)測能力是影響現(xiàn)代風(fēng)格處理器的關(guān)鍵因素之一,像 Pentium 4 的 BTB 是 4K 條目,SandyBridge 據(jù)說達(dá)到 8K~16K。

雖然 A15 的兩級 BTB 條目總數(shù)較 A8/A9 少,但是 A15 的 Return Stack 條目數(shù)從 8 條增加到了 18 條,取指帶寬從之前的 64-bit 提升到 128-bit,而且完全支持邊界非對齊地址的拾取。

(4)Cortex-A15 支持 VFPv4,具備硬件 FMA 指令執(zhí)行,可以在同頻下提供兩倍的峰值浮點性能。此外,A15 還具備硬件除法指令,在 A9 上這需要接近 50 個周期來執(zhí)行。

(5)A15 的周邊總線為 AMBA4,128-bit master 界面,A9 的 AMBA3 的 master 界面是 64-bit。

(6)雖然 ARMv7 是 32-bit ISA,但是現(xiàn)在 Cortex-A15 支持 40-bit 物理定址(類似于當(dāng)年的 Pentium Pro 和 Atlhon),而且 L1/L2 Cache 具備 ECC,因此理論上適用于服務(wù)器級應(yīng)用。

(7)A15 和 A9 都有一個類似的 small loop 緩存,用于存放小循環(huán),讓執(zhí)行單元無需訪問指令 cache 就能抓到指令。在 A9 上它可以存放大小為 64 字節(jié)的指令。

而在 A15 上則是 32 條目,可以存放兩條前轉(zhuǎn)分支和一條后轉(zhuǎn)分支,而且 A15 的 small loop 緩存存放的是已經(jīng)解碼的微操作,這意味著連解碼步驟也能節(jié)省掉。

Cortex A15 的整數(shù)性能為 3.5~4.01 DMIPS/MHz,相比起 A9 的 2.5 DMIPS/MHz 和 A8 的 2.0 DMIPS/MHz 有明顯的改進,不過因為三路超標(biāo)量而帶來的各種資源增加,A15 需要更先進的制程(32 納米或更先進)才能在手機、平板上變得比較適用。

2 高通 Krait 內(nèi)核微架構(gòu)特點

Krait 微架構(gòu)是高通第四代 Snapdragon(驍龍)處理器所搭配的 CPU 內(nèi)核微架構(gòu),是 ARMv7 架構(gòu)的實現(xiàn),屬于高通的 ARM 架構(gòu)級授權(quán)、自行研發(fā)的處理器內(nèi)核微架構(gòu)。

Krait 的前身是 Scorpion,在產(chǎn)品布局上它和 Scorpion 有些類似,例如 Scorpion 定位于 Cortex-A8 和 Cortex-A9,而 Krait 的定位也是類似,即 Cortex-A9 和 Cortex-A15 之間,具備一些 Cortex-A15 的特征。

例如 L0 cache(Cortex-A15 上有類似作用的 loop buffer,相當(dāng)于 L0 I-cache,指令調(diào)度器無需經(jīng)過解碼器就能抓到小循環(huán)的微操作指令)、三路超標(biāo)量、VFP4 浮點單元、128-bit SIMD 處理能力(高通稱 SIMD 單元為 VeNum,ARM 自己則稱之為 NEON)以及基于 A15 同級的半導(dǎo)體制程節(jié)點。至于有人說 Krait 是 A9 的改進版,這樣的觀點我很難認(rèn)同,它和 Scorpion 都類似于當(dāng)年 DEC 獲得 ARMv4 ISA 授權(quán)而自行研發(fā)的微架構(gòu)。

不過另一方面,Krait 的亂序執(zhí)行要遜色于 Cortex-A15,后者具備八個指令發(fā)射端口和八個執(zhí)行端口,每一個執(zhí)行端口都對應(yīng)一個(準(zhǔn))保留站(有些類似于 AMD K7-K10),而 Krait 只有四個指令發(fā)射端口和七個執(zhí)行端口,并且采用的是類似 Cortex-A9 或者說 Pentitum Pro 方式的單個大規(guī)模指令發(fā)射隊列單元。

3 總結(jié)

由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。省電不只光靠制程上的改進,還有芯片本身的設(shè)計也是極為重要的,

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008(07)

摘要:由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。。

關(guān)鍵詞:ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號: TP3 文獻標(biāo)識碼:A 文章編號:1674-098X(2014)01(B)-0000-00

隨著半導(dǎo)體工藝的日趨先進,智能手機(Smartphone 或者 Superphone)、平板電腦(Tablet 或者 Pad)已經(jīng)成為許多網(wǎng)友最常使用、最多關(guān)注、更新最快的電子消費產(chǎn)品,高度便攜性是這類產(chǎn)品的最關(guān)鍵成功原因。

所謂便攜性自然是指產(chǎn)品必須足夠輕便而且需要有足夠的續(xù)航能力,因此這就要求產(chǎn)品的原件必須足夠省電,只有這樣才能減少散熱和電池體積這兩個最占體積和重量的問題。因此對于傳統(tǒng)的 CPU 由于功耗問題不能完全適用于手機、平板。

按照 ISA(指令集架構(gòu))劃分,因為目前的手機、平板等移動設(shè)備的 CPU 無非是 ARM、Intel/AMD 兩大陣營,而就是應(yīng)為功耗的原因。在移動設(shè)備中ARM幾乎占了統(tǒng)治的地位。 下面就通過對現(xiàn)在市場中的最新的兩款A(yù)RM架構(gòu)進行解析。

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比,Cortex-A15 有非常明顯的變化:

(1)整數(shù)流水線最短工位數(shù)達(dá)到 15 級,管芯面積占用比 Cortex-A9 高一倍。

(2)采用三路超標(biāo)量微架構(gòu),可以每個周期取指四條指令,解碼器每個周期可以為發(fā)送單元提供 3 條指令,而指令發(fā)射單元可以亂序提供最高 8 個微操作供執(zhí)行單元運行。

相比之下,A9 的解碼器只能每周期跑兩條指令,派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

(3)Cortex-A15 的動態(tài)分支預(yù)測技術(shù)和 Cortex-A8/A9 差不多,但是 A15 引入了一個 64 條目的 microBTB,而此前的 A8/A9 并不具備這樣的分層結(jié)構(gòu)。動態(tài)分支預(yù)測能力是影響現(xiàn)代風(fēng)格處理器的關(guān)鍵因素之一,像 Pentium 4 的 BTB 是 4K 條目,SandyBridge 據(jù)說達(dá)到 8K~16K。

雖然 A15 的兩級 BTB 條目總數(shù)較 A8/A9 少,但是 A15 的 Return Stack 條目數(shù)從 8 條增加到了 18 條,取指帶寬從之前的 64-bit 提升到 128-bit,而且完全支持邊界非對齊地址的拾取。

(4)Cortex-A15 支持 VFPv4,具備硬件 FMA 指令執(zhí)行,可以在同頻下提供兩倍的峰值浮點性能。此外,A15 還具備硬件除法指令,在 A9 上這需要接近 50 個周期來執(zhí)行。

(5)A15 的周邊總線為 AMBA4,128-bit master 界面,A9 的 AMBA3 的 master 界面是 64-bit。

(6)雖然 ARMv7 是 32-bit ISA,但是現(xiàn)在 Cortex-A15 支持 40-bit 物理定址(類似于當(dāng)年的 Pentium Pro 和 Atlhon),而且 L1/L2 Cache 具備 ECC,因此理論上適用于服務(wù)器級應(yīng)用。

(7)A15 和 A9 都有一個類似的 small loop 緩存,用于存放小循環(huán),讓執(zhí)行單元無需訪問指令 cache 就能抓到指令。在 A9 上它可以存放大小為 64 字節(jié)的指令。

而在 A15 上則是 32 條目,可以存放兩條前轉(zhuǎn)分支和一條后轉(zhuǎn)分支,而且 A15 的 small loop 緩存存放的是已經(jīng)解碼的微操作,這意味著連解碼步驟也能節(jié)省掉。

Cortex A15 的整數(shù)性能為 3.5~4.01 DMIPS/MHz,相比起 A9 的 2.5 DMIPS/MHz 和 A8 的 2.0 DMIPS/MHz 有明顯的改進,不過因為三路超標(biāo)量而帶來的各種資源增加,A15 需要更先進的制程(32 納米或更先進)才能在手機、平板上變得比較適用。

2 高通 Krait 內(nèi)核微架構(gòu)特點

Krait 微架構(gòu)是高通第四代 Snapdragon(驍龍)處理器所搭配的 CPU 內(nèi)核微架構(gòu),是 ARMv7 架構(gòu)的實現(xiàn),屬于高通的 ARM 架構(gòu)級授權(quán)、自行研發(fā)的處理器內(nèi)核微架構(gòu)。

Krait 的前身是 Scorpion,在產(chǎn)品布局上它和 Scorpion 有些類似,例如 Scorpion 定位于 Cortex-A8 和 Cortex-A9,而 Krait 的定位也是類似,即 Cortex-A9 和 Cortex-A15 之間,具備一些 Cortex-A15 的特征。

例如 L0 cache(Cortex-A15 上有類似作用的 loop buffer,相當(dāng)于 L0 I-cache,指令調(diào)度器無需經(jīng)過解碼器就能抓到小循環(huán)的微操作指令)、三路超標(biāo)量、VFP4 浮點單元、128-bit SIMD 處理能力(高通稱 SIMD 單元為 VeNum,ARM 自己則稱之為 NEON)以及基于 A15 同級的半導(dǎo)體制程節(jié)點。至于有人說 Krait 是 A9 的改進版,這樣的觀點我很難認(rèn)同,它和 Scorpion 都類似于當(dāng)年 DEC 獲得 ARMv4 ISA 授權(quán)而自行研發(fā)的微架構(gòu)。

不過另一方面,Krait 的亂序執(zhí)行要遜色于 Cortex-A15,后者具備八個指令發(fā)射端口和八個執(zhí)行端口,每一個執(zhí)行端口都對應(yīng)一個(準(zhǔn))保留站(有些類似于 AMD K7-K10),而 Krait 只有四個指令發(fā)射端口和七個執(zhí)行端口,并且采用的是類似 Cortex-A9 或者說 Pentitum Pro 方式的單個大規(guī)模指令發(fā)射隊列單元。

3 總結(jié)

由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。省電不只光靠制程上的改進,還有芯片本身的設(shè)計也是極為重要的,

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008(07)

摘要:由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗

電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。。

關(guān)鍵詞:ARM架構(gòu)、ARM Cortex-A15、Krait

中圖分類號: TP3 文獻標(biāo)識碼:A 文章編號:1674-098X(2014)01(B)-0000-00

隨著半導(dǎo)體工藝的日趨先進,智能手機(Smartphone 或者 Superphone)、平板電腦(Tablet 或者 Pad)已經(jīng)成為許多網(wǎng)友最常使用、最多關(guān)注、更新最快的電子消費產(chǎn)品,高度便攜性是這類產(chǎn)品的最關(guān)鍵成功原因。

所謂便攜性自然是指產(chǎn)品必須足夠輕便而且需要有足夠的續(xù)航能力,因此這就要求產(chǎn)品的原件必須足夠省電,只有這樣才能減少散熱和電池體積這兩個最占體積和重量的問題。因此對于傳統(tǒng)的 CPU 由于功耗問題不能完全適用于手機、平板。

按照 ISA(指令集架構(gòu))劃分,因為目前的手機、平板等移動設(shè)備的 CPU 無非是 ARM、Intel/AMD 兩大陣營,而就是應(yīng)為功耗的原因。在移動設(shè)備中ARM幾乎占了統(tǒng)治的地位。 下面就通過對現(xiàn)在市場中的最新的兩款A(yù)RM架構(gòu)進行解析。

1 ARM Cortex-A15 內(nèi)核微架構(gòu)特點

和 Cortex-A9 相比,Cortex-A15 有非常明顯的變化:

(1)整數(shù)流水線最短工位數(shù)達(dá)到 15 級,管芯面積占用比 Cortex-A9 高一倍。

(2)采用三路超標(biāo)量微架構(gòu),可以每個周期取指四條指令,解碼器每個周期可以為發(fā)送單元提供 3 條指令,而指令發(fā)射單元可以亂序提供最高 8 個微操作供執(zhí)行單元運行。

相比之下,A9 的解碼器只能每周期跑兩條指令,派發(fā)單元每周期派發(fā) 4 個微操作給執(zhí)行單元。

(3)Cortex-A15 的動態(tài)分支預(yù)測技術(shù)和 Cortex-A8/A9 差不多,但是 A15 引入了一個 64 條目的 microBTB,而此前的 A8/A9 并不具備這樣的分層結(jié)構(gòu)。動態(tài)分支預(yù)測能力是影響現(xiàn)代風(fēng)格處理器的關(guān)鍵因素之一,像 Pentium 4 的 BTB 是 4K 條目,SandyBridge 據(jù)說達(dá)到 8K~16K。

雖然 A15 的兩級 BTB 條目總數(shù)較 A8/A9 少,但是 A15 的 Return Stack 條目數(shù)從 8 條增加到了 18 條,取指帶寬從之前的 64-bit 提升到 128-bit,而且完全支持邊界非對齊地址的拾取。

(4)Cortex-A15 支持 VFPv4,具備硬件 FMA 指令執(zhí)行,可以在同頻下提供兩倍的峰值浮點性能。此外,A15 還具備硬件除法指令,在 A9 上這需要接近 50 個周期來執(zhí)行。

(5)A15 的周邊總線為 AMBA4,128-bit master 界面,A9 的 AMBA3 的 master 界面是 64-bit。

(6)雖然 ARMv7 是 32-bit ISA,但是現(xiàn)在 Cortex-A15 支持 40-bit 物理定址(類似于當(dāng)年的 Pentium Pro 和 Atlhon),而且 L1/L2 Cache 具備 ECC,因此理論上適用于服務(wù)器級應(yīng)用。

(7)A15 和 A9 都有一個類似的 small loop 緩存,用于存放小循環(huán),讓執(zhí)行單元無需訪問指令 cache 就能抓到指令。在 A9 上它可以存放大小為 64 字節(jié)的指令。

而在 A15 上則是 32 條目,可以存放兩條前轉(zhuǎn)分支和一條后轉(zhuǎn)分支,而且 A15 的 small loop 緩存存放的是已經(jīng)解碼的微操作,這意味著連解碼步驟也能節(jié)省掉。

Cortex A15 的整數(shù)性能為 3.5~4.01 DMIPS/MHz,相比起 A9 的 2.5 DMIPS/MHz 和 A8 的 2.0 DMIPS/MHz 有明顯的改進,不過因為三路超標(biāo)量而帶來的各種資源增加,A15 需要更先進的制程(32 納米或更先進)才能在手機、平板上變得比較適用。

2 高通 Krait 內(nèi)核微架構(gòu)特點

Krait 微架構(gòu)是高通第四代 Snapdragon(驍龍)處理器所搭配的 CPU 內(nèi)核微架構(gòu),是 ARMv7 架構(gòu)的實現(xiàn),屬于高通的 ARM 架構(gòu)級授權(quán)、自行研發(fā)的處理器內(nèi)核微架構(gòu)。

Krait 的前身是 Scorpion,在產(chǎn)品布局上它和 Scorpion 有些類似,例如 Scorpion 定位于 Cortex-A8 和 Cortex-A9,而 Krait 的定位也是類似,即 Cortex-A9 和 Cortex-A15 之間,具備一些 Cortex-A15 的特征。

例如 L0 cache(Cortex-A15 上有類似作用的 loop buffer,相當(dāng)于 L0 I-cache,指令調(diào)度器無需經(jīng)過解碼器就能抓到小循環(huán)的微操作指令)、三路超標(biāo)量、VFP4 浮點單元、128-bit SIMD 處理能力(高通稱 SIMD 單元為 VeNum,ARM 自己則稱之為 NEON)以及基于 A15 同級的半導(dǎo)體制程節(jié)點。至于有人說 Krait 是 A9 的改進版,這樣的觀點我很難認(rèn)同,它和 Scorpion 都類似于當(dāng)年 DEC 獲得 ARMv4 ISA 授權(quán)而自行研發(fā)的微架構(gòu)。

不過另一方面,Krait 的亂序執(zhí)行要遜色于 Cortex-A15,后者具備八個指令發(fā)射端口和八個執(zhí)行端口,每一個執(zhí)行端口都對應(yīng)一個(準(zhǔn))保留站(有些類似于 AMD K7-K10),而 Krait 只有四個指令發(fā)射端口和七個執(zhí)行端口,并且采用的是類似 Cortex-A9 或者說 Pentitum Pro 方式的單個大規(guī)模指令發(fā)射隊列單元。

3 總結(jié)

由于電池和散熱的限制,移動應(yīng)用處理器不可能像臺式處理器那樣相對較少地考慮耗電問題,對移動應(yīng)用處理器來說,所有的一切都得圍繞一個詞進行:省電。省電不只光靠制程上的改進,還有芯片本身的設(shè)計也是極為重要的,

參考文獻

[1] 吳春華. 基于ARM和uClinux的嵌入式系統(tǒng)的構(gòu)建研究[D]. 浙江大學(xué) 2004

[2] 續(xù)蕾. RISC架構(gòu)下的ARM微處理器應(yīng)用研究[J]. 計算機與信息技術(shù). 2008(07)

兴文县| 彰化县| 克东县| 巫溪县| 广汉市| 太湖县| 河西区| 琼结县| 土默特左旗| 吴堡县| 象山县| 仙桃市| 敦煌市| 酒泉市| 祁连县| 延庆县| 定远县| 上栗县| 绥宁县| 平顶山市| 靖安县| 明水县| 阿拉善左旗| 上栗县| 阿勒泰市| 沙坪坝区| 丹巴县| 壶关县| 阿瓦提县| 科尔| 金门县| 焉耆| 田林县| 介休市| 西林县| 民丰县| 金门县| 广德县| 房山区| 叶城县| 夹江县|