国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

突破能耗屏障超導(dǎo)計算機技術(shù)初探

2021-03-12 03:27李實
微型計算機 2021年3期
關(guān)鍵詞:邏輯電路功耗架構(gòu)

李實

計算機是推動人類進入信息技術(shù)時代的核心設(shè)備。隨著計算機和相關(guān)產(chǎn)業(yè)的快速發(fā)展,人類社會的技術(shù)能力也得到了大幅度的增強,互聯(lián)互通的程度也得到了極大提高。但是,隨著計算機持續(xù)發(fā)展以及人類所使用計算機的數(shù)量成倍增加,計算機背后的能耗問題逐漸凸顯了出來。2015年,《EnergyEfficiency》(能源效率)雜志就曾經(jīng)披露過一個研究報告,其中顯示游戲PC的耗電量占據(jù)了當(dāng)年所有PC耗電量的21%,達到了75TWh,相當(dāng)于1.6億臺冰箱的耗電量。而根據(jù)2017年的數(shù)據(jù),當(dāng)時全球數(shù)據(jù)中心的總耗電量約為416TWh,約占當(dāng)年地球總發(fā)電量的3%。除此之外,隨著全球超級計算機的發(fā)展和不斷增加的部署,超算背后的能耗問題也越來越受到大家的關(guān)注,比如目前全球排名第一的超算—日本Fugaku,其功耗就高達29899kW,相當(dāng)于它運行1小時就需消耗接近3萬度電,這還不包含為這個超算提供服務(wù)的相關(guān)設(shè)備以及維護的消耗。

另一方面,計算機和相關(guān)設(shè)備不斷提升的能耗需求也帶來了一個嚴重的問題—那就是散熱。有人甚至估計,未來超算等設(shè)備有可能不得不建立在河流、湖泊甚至南北極周圍,因為超算在達到其計算能力的上限之前,散熱和功耗問題將首先成為最大的攔路虎,需要流動的河水、湖水或者極地的低溫氣候才能使得超算等設(shè)備處于能正常工作的溫度區(qū)間。因此從現(xiàn)在的技術(shù)發(fā)展來看,計算機尤其是超算等設(shè)備的功耗和散熱等問題,可能在不久之后的未來成為阻擋人們獲取更多算力的絆腳石。

為了解決這個問題,研究人員開始考慮現(xiàn)有技術(shù)路徑之外的實現(xiàn)方法。比如采用全新的計算架構(gòu)、專用單元或者不斷改善軟件架構(gòu)等。不過,這都沒有一個技術(shù)來得直接,那就是利用超導(dǎo)效應(yīng)和量子力學(xué)有關(guān)技術(shù)來實現(xiàn)超導(dǎo)計算機。超導(dǎo)的特性就是沒有電阻、能耗極低,這有助于幫助人們建立低功耗的計算設(shè)備。在超導(dǎo)計算機的研發(fā)上,從1956年麻省理工D.A.Buck的《Thecryotron—asuperconductivecomputercomponent》論文中提到了的超導(dǎo)狀態(tài)實現(xiàn)量子計算的構(gòu)想開始,人們就不斷地努力著?,F(xiàn)在,包括中國、歐盟、日本和美國等都在超導(dǎo)計算上推出了各自獨特的技術(shù)和構(gòu)想。近期,來自日本橫濱國立大學(xué)的研究人員在論文《MANA:AMonolithicAdiabaticiNtegrationArchitectureMicroprocessorUsing1.4-zJ/opUnshuntedSuperconductorJosephsonJunctionDevices》中提到了一種超導(dǎo)計算機的實現(xiàn)方式。借由這個論文,我們一起來了解一下超導(dǎo)計算機以及相關(guān)的內(nèi)容。

超導(dǎo)約瑟夫結(jié)構(gòu)和AQFP邏輯

如果要制作一臺計算機,那么首先得擁有制造計算機芯片最基本的材料,然后再制作出非門、與門、與非門等一系列具有功能的邏輯門,并將其配合使用實現(xiàn)功能。在目前的硅基芯片中,人們使用半導(dǎo)體材料,制作出了P型半導(dǎo)體、N型半導(dǎo)體、PN結(jié)等結(jié)構(gòu),經(jīng)過組合使用后,獲得了一個完整的半導(dǎo)體芯片和相關(guān)功能。

如果是超導(dǎo)計算機的話,也需要進行類似的步驟。在這里,本文首先先介紹一個概念,那就是超導(dǎo)約瑟夫森結(jié)。

超導(dǎo)約瑟夫森結(jié)是目前超導(dǎo)計算研發(fā)中的一個重要方向。約瑟夫森結(jié)由兩個互相微弱連接的超導(dǎo)體構(gòu)成。這里的微弱連接是指兩個超導(dǎo)體之間可以使用薄絕緣層,或者一小段非超導(dǎo)金屬,抑或是一小段可以弱化接觸點超導(dǎo)性的狹窄部分,不同的連接有著不同的名稱,比如SIS、SNS或者SsS,本文中使用的是SIS。

超導(dǎo)約瑟夫森結(jié)的特性是具有臨界電流。當(dāng)流過超導(dǎo)約瑟夫森結(jié)的電流小于臨界電流時,超導(dǎo)約瑟夫森結(jié)的兩端是沒有電壓降低的。但是如果流過超導(dǎo)約瑟夫森結(jié)的電流稍大于臨界電流,就會觸發(fā)多重安德烈夫反射,這在電路測試中會表現(xiàn)為明顯的尖峰。繼續(xù)增大電流并超過超導(dǎo)體之間絕緣體的帶隙的話,電流和電壓的表現(xiàn)就會變得很線性。由于超導(dǎo)約瑟夫森結(jié)在臨界電流上的獨特表現(xiàn),使之有可能成為邏輯電路的候選結(jié)構(gòu)。

實際上根據(jù)日本橫濱國立大學(xué)的論文,超導(dǎo)約瑟夫森結(jié)已經(jīng)成功實現(xiàn)了多種邏輯電路結(jié)構(gòu),包括高效快速單通量邏輯結(jié)構(gòu)(ERSFQ)、高效SFQ邏輯(eSFQ)、互反量子邏輯(RQL)、LR偏置RSFQ邏輯以及低壓RSFQ邏輯(LV-RSFQ)等。但這些邏輯都屬于非絕熱邏輯,雖然借由超導(dǎo)特性,無論這些邏輯單元以什么頻率工作,他們的開關(guān)能量消耗都是不變的。但是考慮其非絕熱邏輯電路的特性,其工作能耗較高,不是超導(dǎo)計算機最佳選擇。實際上,日本研究人員使用的是一種絕熱邏輯電路,所謂絕熱邏輯電路,是指電路可以通過回收節(jié)點電容上的電荷至電源實現(xiàn)能量的重復(fù)利用,相比非絕熱邏輯電路,絕熱邏輯電路消耗電能大幅度降低,其能量消耗只會隨著頻率上升而上升,并且呈現(xiàn)線性狀態(tài)。另外,在時鐘頻率方面,絕熱電路時鐘頻率最高大約為10GHz,再高可能無法保持絕熱狀態(tài),但是非絕熱電路的時鐘頻率最高可以達到770G Hz,但是代價是開關(guān)能量可能更高。

日本研究人員使用的是一種被稱為絕熱量子通量參數(shù)邏輯電路(AQFP)的設(shè)計,這種電路在使用無分流超導(dǎo)約瑟夫森結(jié)器件的測試中,在4.2K的溫度以及四相5GHz交流電的驅(qū)動下,每個邏輯開關(guān)的能量僅為每單位1.4zJ,大約是1×10的-21次方焦耳。考慮到將周圍環(huán)境降低至4.2K的能量開銷,因此將每個AQFP邏輯開關(guān)的能量乘以1000,結(jié)果為1.4aJ,也這也僅僅是1×10的-18次方焦耳。這個數(shù)值相比目前7nm工藝、0.8V電壓下的類似電路,其效率高出大約80倍。實際上,即使考慮散熱所需的能量開銷,擴大1000倍也是一個非??鋸埖臄?shù)字了。由于AQFP工作在超導(dǎo)狀態(tài)下,其功耗相對非超導(dǎo)狀態(tài)下的電路存在好幾個數(shù)量級的優(yōu)勢,因此無論怎么比較,它依舊能夠帶來巨大而顯著的能耗降低。

從AQFP到MANA

在這里,研究人員確定了使用AQFP來制造超導(dǎo)計算機,并給出了一個由AQFP制造出來的加法器。研究人員發(fā)現(xiàn),由于互連線存在寄生電感,因此AQFP單元的驅(qū)動距離很有限,大約只有1mm,之后就必須插入另一個緩沖區(qū)作為中繼器來放大信號。當(dāng)然,在真正的芯片制造中,這樣的問題可能會得到比較好的解決。在解決了這些問題之后,研究人員們帶來了一個被稱為MANA的微架構(gòu),也就是MonolithicAdiabaticiNtegrationArchitecture絕熱集成微處理器架構(gòu)。

研究人員推出MANA架構(gòu)的目的是為了證明AQFP邏輯也能夠執(zhí)行計算,包括邏輯處理和數(shù)據(jù)存儲等,并且所有的這些工作都可以基于單一技術(shù)、單個邏輯家族以及單個芯片內(nèi)完成。由于這個芯片僅僅用于驗證芯片邏輯設(shè)計和工作可行性,因此包括芯片的IPC、吞吐量等指標(biāo)就不在研究人員的考慮之內(nèi)了。并且,由于這是一種全新的芯片體系結(jié)構(gòu),它缺乏系統(tǒng)集成工具,所有的設(shè)計都是由手工完成的,因此整體規(guī)模比較小,架構(gòu)也相對簡單,時鐘單元方面采用了四相時鐘設(shè)計,需要程序控制予以配合。

研究人員給出的MANA的架構(gòu)圖、支持的核心指令等。MANA的功能包括指令緩沖、解碼、發(fā)出以及帶有外部IO訪問的RF階段、執(zhí)行階段和回寫階段等。在架構(gòu)圖中,研究人員使用不同顏色標(biāo)識了MANA的不同部分。其中綠色的是指令的緩沖、存儲和發(fā)出部分,包括4×16b的緩存、PC&指令fetch以及指令解碼、棕色的RFX寄存器階段、橙色的ALU和位移執(zhí)行階段、藍色的數(shù)據(jù)回寫和緩沖階段。

整個MANA的處理過程非常簡單。比如它的寄存器只是一個16×4b容量的、2讀/1寫的小型寄存器。寄存器的$14和$15用于保存IO數(shù)據(jù)、$0是恒定的零寄存器。外部IO數(shù)據(jù)通過串行方式進入$14和$15,其中前者包含內(nèi)存字節(jié)數(shù)據(jù)比較高的部分,后者包含比較低的部分。數(shù)據(jù)進入后,控制標(biāo)志就可以標(biāo)明$14和$15是可以進行處理的有效數(shù)據(jù),被送入后面的執(zhí)行部分。執(zhí)行部分只有一個4bit的整數(shù)ALU和一個4bit的位移單元,值得一提的是,這兩個單元是串行的,也就是說無論數(shù)據(jù)是否需要進行整數(shù)或者位移計算,都必須通過這兩個單元。數(shù)據(jù)經(jīng)過處理后,再交給回寫單元進行判斷。

整個處理器的架構(gòu)可以用“簡陋”來形容,考慮到MANA只是用于驗證AQFP是否可以實現(xiàn)制作超導(dǎo)計算機,因此這樣的邏輯關(guān)系和計算架構(gòu)也基本夠用了。

在基本架構(gòu)確定了之后,研究人員就可以根據(jù)這個基本架構(gòu)來搭建包括軟件環(huán)境、組合邏輯設(shè)計、內(nèi)存、時鐘方面的設(shè)計了,另外他們還需要進行組件集成。實際上由于這類芯片采用了全新的架構(gòu),其絕大部分部件都是沒有先例可循的,因此研發(fā)人員不得不采用手工制造的方式來完成。在超導(dǎo)材料方面,AQPF制作采用的是金屬鈮和絕緣層氧化鋁,因此又被稱為Nb-AlO材料。金屬鈮在10K以下的溫度時能夠呈現(xiàn)超導(dǎo)特性,最終芯片也要工作在這個溫度下。

從MANA到第一個測試芯片

MANA從藍圖到實際產(chǎn)品采用的是AISTHSTP10kA/cm2Nb/AlOx/Nb超導(dǎo)芯片制作工藝。不過有點令人沮喪的是,由于前期對芯片尺寸的估計比較保守,因此后期不得不使用較大的1cm×1cm的基板來完成芯片制作,但是研究人員發(fā)現(xiàn)他們的高頻率探頭設(shè)備不支持這么大的尺寸,不得不改用低頻率探頭來完成有關(guān)功能的測試,并且整個芯片的頻率被限定在100KHz之下,也就是0.1MHz。但是,研究人員為了證明MANA真的能在高頻率也就是GHz下運行,在后期也單獨制作了一個包括ALU和數(shù)據(jù)轉(zhuǎn)移器的小尺寸設(shè)備,這個芯片被稱為“EX”,其尺寸只有2mm×3.5mm,運行頻率大于1GHz,并成功完成了測試。

測試人員將整個芯片放置在溫度僅為4.2K的液氦中進行測試工作。在經(jīng)過一系列的設(shè)置和啟動后,測試人員開始在較低的頻率也就是100KHz下運行MANA芯片,并演示了2個簡單的四指令程序,比如讓數(shù)據(jù)和寄存器某位數(shù)據(jù)相加,比較兩個數(shù)據(jù)的大小,讓寄存器內(nèi)數(shù)據(jù)相加,比如“3+2”、“9-5”、“9-(4+3)”等操作,同時還使用示波器進行探測,以確定芯片是真的在工作且工作后的結(jié)果是正確的。

對于“EX”芯片,由于缺失部分功能,因此研發(fā)人員只能用一些更簡單方法測試,包括臨界進位傳播測試,其中控制信號被設(shè)置為固定的加法。測試總共在12個EX芯片上完成,其中7個可以完成正確的功能,最大工作頻率約為1.2GHz~2.5GHz。一些芯片的輸出不穩(wěn)定或者振蕩,可能是由于磁通捕獲或者其他原因等。

如何判斷超導(dǎo)芯片的功耗和性能

MANA的出現(xiàn)和成功實踐,證明超導(dǎo)材料、AQFP制造芯片是完全可行的。那么,超導(dǎo)芯片和傳統(tǒng)芯片在能耗、性能方面孰優(yōu)孰劣呢?

MANA在研發(fā)和測試中使用的是液氦冷卻,因此研發(fā)人員認為,這樣一來,這種芯片所對應(yīng)的計算機設(shè)備,是不可能出現(xiàn)在移動市場、個人電腦市場的,針對的只能是超大型計算機,也就是超算。

首先,研究人員使用了兩臺LindeLR280液氦冷卻系統(tǒng),并且認為整個系統(tǒng)包括室內(nèi)其余的設(shè)備總計需要2MW電源功率。接下來,研究人員計算了在2MW的冷卻設(shè)備支持下,采用AQPF芯片實現(xiàn)類似GA100和英特爾北極星芯片的功能的話,能夠冷卻多少芯片。為此,研發(fā)人員設(shè)定了2個假定條件,A是假設(shè)在芯片模擬中,采用AQPF的數(shù)量和現(xiàn)在的芯片晶體管數(shù)量相當(dāng),B是采用AQPF的數(shù)量是4倍于現(xiàn)在的晶體管才能實現(xiàn)相同的性能。相比之下,B假定顯得相當(dāng)保守。

在這個估計中,以AQPF芯片在1.5GHz運行時開關(guān)總量為0.2zJ每單位、5GHz以1.4zJ每單位來計算的話,在4.4K的溫度下,以AQPF芯片制作的GA100GPU,在假設(shè)A下功耗為15.2mW,在假設(shè)B下為60.9mW,以AQPF制作的英特爾CPU在假設(shè)A下為0.7mW,在假設(shè)B下為2.9mW。無論是CPU還是GPU,其功耗都顯著低于現(xiàn)有產(chǎn)品好幾個數(shù)量級。比如GA100芯片,實際應(yīng)用中TDP功耗不會低于350W,相比采用AQPF材料制作并保持超導(dǎo)狀態(tài)的話,功耗高了大約23026倍。因此,即使采用2MW冷卻設(shè)計,整個系統(tǒng)也能容納A假設(shè)下的66980個GPU和1429000個CPU,或者B假設(shè)下的16750個GPU和357100個CPU。

那么,以兩臺LindeLR280液氦冷卻系統(tǒng)冷卻的AQFP超算能達到怎樣的計算水平呢?以美國能源部的百億億次計算機為例,這款計算機需要的冷卻功耗是20MW,達到的計算能力預(yù)計超過1EFLOPS。如果同樣冷卻功耗的LindeLR280液氦冷卻系統(tǒng)組建AQFP超導(dǎo)超算的話,使用AQPF版本的英偉達GA100芯片,A預(yù)測下雙精度性能可以高達6.5EFLOPS,B預(yù)測下也能達到1.6EFLOPS。對于英特爾來說,A預(yù)測下計算性能可達23.3EFLOPS,B預(yù)測下則為5.8EFLOPS。由于這只是預(yù)測,實際的計算性能更可能會位于A和B條件預(yù)測之中。但即使如此,這也已經(jīng)是一個令人驚訝的性能表現(xiàn)數(shù)據(jù)了。

可能只是一小步,但是也能看到未來

從本文對日本研究人員所做的工作介紹來看,目前超導(dǎo)計算機和相關(guān)產(chǎn)品的研究,已經(jīng)從之前的理論進入了實際階段,研究人員開始試制超導(dǎo)芯片并進行了簡單測試,然后通過實驗數(shù)據(jù)預(yù)估了超導(dǎo)計算機在超算等同檔次設(shè)備上的應(yīng)用情況。當(dāng)然,日本研究人員本次進行的研究還是初步的,它只是超導(dǎo)計算的一小步,但是可以窺探到的未來卻是廣闊而不可限量的。

接下來,人們會在超導(dǎo)材料、制造工藝以及實現(xiàn)方式上面做更多的探索,比如目前采用金屬鈮和相匹配的液氦,成本過于昂貴,如果換用高溫超導(dǎo)材料會不會得到同樣的結(jié)果且更為容易生產(chǎn)和推廣?如果最終高溫超導(dǎo)材料能做到液氮溫度下超導(dǎo)且可以用于計算機設(shè)計的話,那么超導(dǎo)芯片必將快速崛起。還有在芯片設(shè)計環(huán)境、軟件配套上的一系列產(chǎn)品,可以想象這又是一個龐大的萬億級別市場。超導(dǎo)的未來,值得期待。

猜你喜歡
邏輯電路功耗架構(gòu)
基于FPGA的RNN硬件加速架構(gòu)
基于任務(wù)映射的暗硅芯片功耗預(yù)算方法
功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實踐
數(shù)字電子時鐘邏輯電路的教學(xué)設(shè)計與仿真
LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實現(xiàn)
數(shù)字電路功耗的分析及優(yōu)化
基于軟件技術(shù)的組合邏輯電路模型分析與實現(xiàn)研究
短區(qū)間自動閉塞車站接近區(qū)段邏輯電路設(shè)計
IGBT模型優(yōu)化及其在Buck變換器中的功耗分析
一種基于FPGA+ARM架構(gòu)的μPMU實現(xiàn)
马龙县| 肇东市| 平乐县| 北流市| 进贤县| 江华| 太康县| 开远市| 白山市| 新乡市| 嵩明县| 金秀| 潜江市| 宝丰县| 兰考县| 丹棱县| 北川| 伊宁县| 申扎县| 武宣县| 上蔡县| 峨边| 洪雅县| 闸北区| 昆明市| 阿城市| 曲水县| 静乐县| 湘潭县| 澄城县| 石门县| 五峰| 尤溪县| 思茅市| 安泽县| 兰溪市| 登封市| 江西省| 富裕县| 彩票| 天全县|