為突破顯示存儲器的技術(shù)瓶頸,采用創(chuàng)新堆疊方案的高帶寬存儲器應(yīng)運(yùn)而生,它不僅擁有更寬的數(shù)據(jù)傳輸通道、比普通的圖形存儲器擁有更高的效率,而且更節(jié)能。
絕大部分電腦組件的技術(shù)都存在一定的技術(shù)限制,例如存儲器的大小、性能、容量受到存儲單元存儲電荷的技術(shù)和連接方式的限制。因而,為了在固態(tài)硬盤上存儲更多的數(shù)據(jù),業(yè)界需要尋找突破這些技術(shù)瓶頸的方法。三星公司首家采用堆疊技術(shù)突破存儲單元存儲的技術(shù)限制,將閃存單元的存儲密度從每芯片32GB提高到256GB,并推出容量高達(dá)2TB的固態(tài)硬盤。而通過這種堆疊的方案,高帶寬存儲器(High Bandwidth Memory,簡稱HBM)不僅擁有更高的存儲密度,還可以提供更高的數(shù)據(jù)傳輸通道,擁有更快的傳輸速率,而且更節(jié)能。
AMD的R9 Fury X是第一個使用HBM顯存的顯示卡,它所使用的HBM顯存通過4層存儲芯片堆疊而成。因而,R9 Fury X比普通配備GDDR5顯存的顯示卡更節(jié)能,同時,擁有更快的傳輸速率。
除了AMD,韓國內(nèi)存制造商SK Hynix也是HBM顯存技術(shù)的推動者,他們計劃在2016年推出第二代的HBM顯存,有望能夠進(jìn)一步提高顯示卡的性能,而在同一時間,使用GDDR5顯存的顯示卡在性能上并沒有顯著的改進(jìn)。
目前,顯存占據(jù)顯示卡的大部分空間,而且它們的能耗占顯示卡能耗的1/3。由于4K分辨率和虛擬現(xiàn)實(shí)技術(shù)的發(fā)展對顯示卡存儲器的需求不斷提高,所以在使用GDDR5顯存的顯示卡上,AMD公司為其高端顯示卡配備了8GB的顯存,16組存儲器芯片圍繞著GPU。由于每個存儲器芯片需要經(jīng)由32條線路連接到GPU,16個芯片將需要512條連接線路,形成512位(最大)的接口,所以在顯示卡的印刷電路板中,已經(jīng)無法容納更多的存儲芯片,無論是空間還是能耗都已經(jīng)達(dá)到了極限。如果要進(jìn)一步地增加顯存,那么只能縮小存儲芯片的尺寸或者增加存儲芯片的存儲密度。
高帶寬存儲器可以解決上述問題,并可以兩倍于普通GDDR5顯存的1024位接口與GPU連接。這里,硅通孔(Through Silicon Via,簡稱TSV)垂直互連技術(shù)和中介層(Interposer)兩項(xiàng)重要的技術(shù)創(chuàng)新是關(guān)鍵。HBM由多個存儲芯片堆疊而成,每一層包含多個存儲體,也就是多個存儲單元的分組。而TSV是一種用于堆疊芯片互連的技術(shù),通過在硅晶圓上以蝕刻或激光的方式鉆出直徑約為10μm的小孔,再填充銅等金屬,TSV可以實(shí)現(xiàn)多層芯片的連接。1024 TSV將垂直通過HBM的4個層,最終通過小觸點(diǎn)利用微凸點(diǎn)(micro-bumps)技術(shù)與較低級別的邏輯控制系統(tǒng)連接,它們將組成每個具有128位帶寬的8個通道,負(fù)責(zé)存儲器堆棧與GPU或者顯示卡其他輸出端口(例如HDMI顯示器端口或者主板的PCI-E)之間的數(shù)據(jù)傳輸。
HBM與GPU之間的數(shù)據(jù)傳輸是無法通過普通的數(shù)據(jù)線來實(shí)現(xiàn)的,因?yàn)槊總€HBM與GPU的連接線多達(dá)1 024條,當(dāng)4塊HBM環(huán)繞著GPU時,連接線將超過4 000條,再加上地址與控制命令的數(shù)據(jù)線,連接線約為5 000條。為此,一個被稱為中介層的新元件將負(fù)責(zé)HBM與GPU的連接:中介層位于HBM模塊與GPU的下方,原則上,中介層將會是一個不用于計算的芯片,只是負(fù)責(zé)簡單的連接和引導(dǎo)。數(shù)以千計的TSV被連接到中介層,通過小觸點(diǎn)連接,并由中介層導(dǎo)向GPU。
在HBM的架構(gòu)中,中介層要求GPU和HBM彼此相鄰,確保它們盡可能地接近,方可獲得最佳的通信效果,TSV可以良好地散熱。接口方面,每一個HBM 1024位的連接是普通GDDR5顯存的兩倍,因而,可以以一個較低的時鐘頻率實(shí)現(xiàn)每秒512GB的數(shù)據(jù)吞吐量。對于顯存來說這是一個新的記錄,而在上述各種因素的影響下,使用HBM顯存的顯示卡可以擁有更低的功耗以及產(chǎn)生更少的熱量。不過,HBM也并不是沒有缺點(diǎn)的,對于第一代HBM來說,重要的缺點(diǎn)是最大容量只有4GB,對于游戲或者4K分辨率的內(nèi)容來說,這樣的容量是足以應(yīng)付的,但是一些特殊的圖形功能,例如一個精心設(shè)計的抗鋸齒系統(tǒng),則需要更多的內(nèi)存。為了滿足未來的需求,SK Hynix目前正在開發(fā)2.0版本的HBM顯存,2016年新一代的HBM將可能用于英偉達(dá)的下一個顯示卡平臺Pascal上。每個2.0版本HBM顯存模塊容量將可以達(dá)到8GB,并且與GPU的數(shù)據(jù)傳輸速率將翻一翻,達(dá)到1TB/s。