Chiplet封裝結(jié)構(gòu)與通信結(jié)構(gòu)綜述

2022-01-19 09:22:24陳桂林王觀武許東忠

計(jì)算機(jī)研究與發(fā)展 2022年1期

陳桂林王觀武胡健王康許東忠

1(國(guó)防科技大學(xué)第六十三研究所南京 210007)2(戰(zhàn)略支援部隊(duì)31121部隊(duì) 南京 210042)

在芯片過(guò)去幾十年的發(fā)展過(guò)程中，研究者傾向于將更多的功能集成到一個(gè)芯片上，形成了今天智能手機(jī)和服務(wù)器上的片上系統(tǒng)形態(tài)[1]，以手機(jī)上的片上系統(tǒng)(system on chip, SoC)為例，它集成了計(jì)算核心、圖像處理核心、數(shù)字處理核心、通信模塊、片上存儲(chǔ)等.將多個(gè)功能模塊集成降低了芯片的功耗，增加了芯片可靠性，更極大地節(jié)省了主板空間.不過(guò)大量的知識(shí)產(chǎn)權(quán)(intellectual properties, IP)集成引發(fā)了芯片內(nèi)部的通信問(wèn)題，此時(shí)研究者們引入了一種新的通信范式，即片上網(wǎng)絡(luò)(network on chip, NoC)[2]，用它來(lái)代替?zhèn)鹘y(tǒng)的總線結(jié)構(gòu).

近年來(lái)，隨著芯片功能的復(fù)雜化，為了符合摩爾定律的規(guī)律，SoC芯片的成本正在大幅度提高.首先，在最先進(jìn)的工藝下完成芯片所有功能單元的設(shè)計(jì)極大地增加了設(shè)計(jì)成本；其次，更多的功能單元和更大的片上存儲(chǔ)將會(huì)導(dǎo)致芯片的面積增加，進(jìn)而導(dǎo)致芯片良率下降，造成芯片的生產(chǎn)成本提高.針對(duì)這些問(wèn)題，芯片制造商探索了2條解決路徑：1)將面積過(guò)大的2DSoC做成單片3D(monolithic 3D, M3D)芯片，技術(shù)上采取外延延伸，在層間電介質(zhì)的頂部沉積1層新鮮的硅，以形成有源器件的新表面；2)將大芯片拆分成單個(gè)的小芯片(Chiplet)再封裝起來(lái).但是由于目前的單片3D IC的工藝制造困難，除了閃存以外，M3D并沒(méi)有達(dá)到堆疊式芯片集成(基于Chiplet集成)所能看到的投資水平.因此隨著硅芯片尺寸達(dá)到制造極限[3]，更多的研究機(jī)構(gòu)和芯片制造廠商開(kāi)始尋求使用先進(jìn)的連接和封裝技術(shù)，將原先的芯片拆成多個(gè)體積更小、產(chǎn)量更高且成本更低的Chiplet，再重新組裝起來(lái).這種封裝技術(shù)類似于芯片的系統(tǒng)級(jí)封裝(system in package, SiP)[4].SiP不同于SoC和分立器件，它是介于兩者之間的折中方案，三者之間的比較如表1所示：

Table 1 Advantages and Disadvantages of Chiplet Technology, SoC and Discrete Devices

Chiplet方案正在被學(xué)術(shù)界[5-8]和廠商[9-20]廣泛研究采用.本文收集整理了Chiplet封裝結(jié)構(gòu)和通信結(jié)構(gòu)的相關(guān)資料，方便讀者對(duì)其有一個(gè)整體的了解.

1 M3D和Chiplet

1.1 M3D

M3D是一種新興技術(shù)，其集成密度比傳統(tǒng)的基于硅通孔(TSV)的堆疊式3D IC高出幾個(gè)數(shù)量級(jí)[21].近年來(lái)，雖然各大芯片廠商已經(jīng)開(kāi)始大量生產(chǎn)裸片堆疊結(jié)構(gòu)的3D芯片，但是仍然有產(chǎn)商堅(jiān)持在研究單體3D芯片，因?yàn)殡S著技術(shù)的發(fā)展，只要可以克服關(guān)鍵的制造挑戰(zhàn)，M3D芯片可以提供更好的成本和性能折中方案.目前三星和高通仍在繼續(xù)開(kāi)展研究，并將其看作是SoC摩爾定律縮放的一種延續(xù).

研究表明有2種方法可以實(shí)現(xiàn)M3D芯片：一種是外延生長(zhǎng)，在層間電介質(zhì)的頂部沉積一層新鮮的硅，以形成有源器件的新表面；另一種是將高質(zhì)量硅層或者完整的器件層從犧牲晶圓轉(zhuǎn)移到主晶圓上.IBM在2002年國(guó)際電子設(shè)備會(huì)議上就展示了轉(zhuǎn)移完整器件層的可行性[22].另外CEA-Leti和M3D研究所也已經(jīng)開(kāi)發(fā)出了轉(zhuǎn)移硅層的技術(shù).該技術(shù)是基于意法半導(dǎo)體研究開(kāi)發(fā)的FD-SOI工藝，其中晶圓鍵合技術(shù)是這種工藝的關(guān)鍵特征.另外這種層轉(zhuǎn)移工藝對(duì)準(zhǔn)精度的要求要比使用硅通孔(through silicon via, TSV)的芯片堆疊技術(shù)高出近2個(gè)數(shù)量級(jí)[23]，因?yàn)樗蕾囉诠饪淘O(shè)備的精度，而不是層轉(zhuǎn)移和粘接設(shè)備.

此外，M3D的高密度集成也是由于其設(shè)計(jì)制造中使用了單體層間通孔(monolithic inter-tier vias, MIV)技術(shù)，這種技術(shù)類似于金屬對(duì)金屬過(guò)孔，可以實(shí)現(xiàn)非常細(xì)粒度的3D分區(qū)，但是MIV對(duì)工藝的要求非常高，圖1展示了具有14 nm和28 nm NAND門的邏輯門、M3D采用的MIV和堆疊式芯片采用的TSV外形尺寸比較[24].

Fig. 1 Relative size comparison of 3D vias and NAND gates (14 nm and 28 nm)

因此，在先進(jìn)的工藝節(jié)點(diǎn)下，雖然M3D可以作為現(xiàn)有工藝節(jié)點(diǎn)的擴(kuò)展，但是由于其精度的要求高和制造的困難程度大，現(xiàn)有的成熟產(chǎn)品只在存儲(chǔ)領(lǐng)域有應(yīng)用[25]，在制造工藝取得突破以前，堆疊式芯片仍然是各大芯片廠商的首選方案.

1.2 Chiplet

Chiplet的概念最早出現(xiàn)在2014年海思(Hisilicon)與臺(tái)積電(Taiwan Semiconductor Manufacturing Company, TSMC)的晶圓級(jí)封裝(chip-on-wafer-on-substrate, CoWoS)[9]產(chǎn)品上，不過(guò)真正得到推廣是在美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(Defense Advanced Research Projects Agency, DARPA)的公共異構(gòu)集成和IP重用戰(zhàn)略(common heterogeneous integration and IP reuse strategies, CHIPS)項(xiàng)目[10].Chiplet是指一種IP核，也指代一種設(shè)計(jì)模式，為了將IP核重用而將其芯片化并單獨(dú)封裝起來(lái).與傳統(tǒng)的單芯片方案相比，Chiplet的設(shè)計(jì)良率更高，成本更小.研究表明當(dāng)芯片面積小于10 mm2時(shí)，單芯片和Chiplet方案的良率差別很小，但是一旦芯片面積超過(guò)200 mm2，單芯片方案的良率會(huì)比Chiplet方案低20%以上.可以預(yù)期，在700～800 mm2的面積上，單芯片方案的良率可能不超過(guò)10%.Chiplet的另一個(gè)優(yōu)勢(shì)是允許將不同工藝下的芯片封裝連接起來(lái)，對(duì)于模擬電路工程師來(lái)說(shuō)，為了適應(yīng)摩爾定律的變化，在先進(jìn)工藝的約束下設(shè)計(jì)放大器變得十分困難.如果采用Chiplet方案，可以在適合的工藝節(jié)點(diǎn)設(shè)計(jì)模擬電路，使用最先進(jìn)的工藝設(shè)計(jì)計(jì)算核心，提高先進(jìn)工藝的利用效率，同時(shí)也降低了成本.例如Intel在其Chiplet方案Foveros中[11]，將計(jì)算芯片使用先進(jìn)工藝實(shí)現(xiàn)，將電源管理、模擬電路及各類傳感器使用大節(jié)點(diǎn)工藝實(shí)現(xiàn).Chiplet還可以將不同公司的芯片結(jié)合起來(lái)，例如最近宣布的采用AMD Radeon Graphics技術(shù)的Intel Core處理器[12].

目前Chiplet的發(fā)展很快，各大芯片廠商已經(jīng)有基于Chiplet設(shè)計(jì)的產(chǎn)品，如AMD的第1代EPYC處理器[13]、第2代EPYC處理器[14]和第3代Ryzen處理器，Intel的Stratix 10 FPGA[15]和Lakefield處理器[11]，Nvidia的MCM-GPU[16]，法國(guó)CEA的96核處理器[17]，賽靈思(Xilinx)的Vertix-7 FPGA[18-19]，Marvell的MoChi[20]架構(gòu)等.這些芯片都是基于Chiplet設(shè)計(jì)的，但是他們的封裝方式和芯片之間的通信方式各不相同.目前主要用于集成電路封裝芯片的3種互連技術(shù)分別是：引線鍵合技術(shù)(wire bond, WB)、倒裝芯片技術(shù)(flip chip, FC)和硅通孔技術(shù).

現(xiàn)有的封裝結(jié)構(gòu)區(qū)分主要通過(guò)2個(gè)方面：1)多個(gè)芯片是堆疊還是大面積拼接;2)芯片的拼接是否通過(guò)額外的中介層.基于這2個(gè)方面標(biāo)準(zhǔn)封裝結(jié)構(gòu)可以分為2D，2.5D，3D.通信結(jié)構(gòu)主要分為2種：傳統(tǒng)的總線或者NoC結(jié)構(gòu)、其他基于總線或NoC的創(chuàng)新結(jié)構(gòu).采用2D封裝結(jié)構(gòu)的芯片既可以采用基于總線的通信結(jié)構(gòu)，也可以采用基于NoC的通信結(jié)構(gòu).但是采用2.5D和3D封裝結(jié)構(gòu)的芯片大多使用基于NoC的通信結(jié)構(gòu).因?yàn)樵?D封裝中基于總線的通信結(jié)構(gòu)設(shè)計(jì)過(guò)于復(fù)雜，引線太多，且理想的調(diào)度算法不易實(shí)現(xiàn).

2 Chiplet的封裝結(jié)構(gòu)

目前Chiplet主流的封裝方式有通過(guò)TSV進(jìn)行堆疊，使用硅橋完成芯片的大面積拼接或采用中介層來(lái)完成芯片的連接.其中中介層可以分為有源中介層和無(wú)源中介層.這些封裝方式按照結(jié)構(gòu)又可以分為2D，2.5D，3D.

2.1 2D結(jié)構(gòu)

我們將不通過(guò)額外中介層，直接互連芯片的形式稱為2D封裝，也叫多芯片模塊(multi-chip module, MCM)化封裝，其中最具代表性的是AMD采用其稱為無(wú)限結(jié)構(gòu)(infinity fabric, IF)的互連方式將多個(gè)Chiplet連接在一起，無(wú)限結(jié)構(gòu)主要是由可擴(kuò)展數(shù)據(jù)結(jié)構(gòu)(scalable data fabric, SDF)和可擴(kuò)展控制結(jié)構(gòu)(scalable control fabric, SCF)組成.SDF中的芯片到芯片通信方法是這種多芯片封裝方法的關(guān)鍵，該方法由SDF的相關(guān)AMD套接字?jǐn)U展器(coherent AMD socket extender, CASE)組件實(shí)現(xiàn).

第1代EPYC芯片[11]結(jié)構(gòu)如圖2(a)，基于14 nm工藝實(shí)現(xiàn)，由4個(gè)Zeppelin die構(gòu)成的，每個(gè)Zeppelin die包含2個(gè)CPU核心(CPU complex, CCX)，CCX是AMD Zen架構(gòu)的最基本組成單元，每個(gè)CCX整合了4個(gè)Zen內(nèi)核，每個(gè)核心都有獨(dú)立的L1與L2緩存，核心內(nèi)部擁有完整的計(jì)算單元，4個(gè)核心共享L3緩存.此外，每個(gè)Zeppelin die還包括單獨(dú)的內(nèi)存，I/O complex和IF的控制與接口，每個(gè)Zeppelin die之間通過(guò)IF互連.EPYC芯片面積最終為852 mm2(每個(gè)Zeppelin的面積為213 mm2)，如果在沒(méi)有多芯片支持的情況下創(chuàng)建1個(gè)32核的單片芯片，最終芯片的面積為777 mm2[26]，只節(jié)省了10%的面積，但是這種大型模具的制造成本和測(cè)試成本比4種小型芯片高出40%.除了成本上的優(yōu)勢(shì)外，多芯片設(shè)計(jì)還比單芯片版本提高了約20%的產(chǎn)量.

在第2代EPYC[12]，為了突破以前芯片只能通過(guò)邊界連接的界限，改變傳統(tǒng)的以計(jì)算為核心的芯片設(shè)計(jì)思想，計(jì)算核心小芯片(core chiplet die, CCD)變成了可配置單元(每個(gè)CCD包含2個(gè)CCX)，處理器的核心變成了輸入輸出芯片(IOD)，其設(shè)計(jì)結(jié)構(gòu)如圖2(b)所示，其中CCD采用7 nm工藝實(shí)現(xiàn)，IOD采用14 nm工藝實(shí)現(xiàn)，芯片的封裝結(jié)構(gòu)還是2D的.但是采用組合工藝實(shí)現(xiàn)的芯片造價(jià)比單獨(dú)7 nm實(shí)現(xiàn)的造價(jià)低.

Fig. 2 The structure of EPYC

2.2 2.5D結(jié)構(gòu)

Fig. 3 The architecture of Stratix 10

我們將通過(guò)硅中介層來(lái)實(shí)現(xiàn)芯片連接的封裝方式稱為2.5D封裝[27].具體來(lái)說(shuō)，就是將芯片水平的堆在硅襯底上，硅襯底上帶有TSV垂直互連通孔和高密度金屬布線，這種只帶有TSV和金屬連線的硅襯底平臺(tái)被稱為無(wú)源中介層(passive interposers)[28-29].2.5D封裝是目前主流的封裝形式，Intel的嵌入式多硅片互連橋(embedded multi-die interconnect bridge, EMIB)技術(shù)[30]、TSMC的CoWoS架構(gòu)[31]、Marvell的MoChi架構(gòu)[20]都是典型的2.5D封裝結(jié)構(gòu)，其中EMIB技術(shù)沒(méi)有使用全硅中介層，而是在襯底上安裝了1個(gè)很小的嵌入式硅橋，允許主芯片和輔助Chiplet以高帶寬和短距離連接在一起，和大型中介層相比，這種方案實(shí)現(xiàn)的花費(fèi)更小，Stratix 10 FPGA就是使用EMIB實(shí)現(xiàn)的.如圖3所示，Stratix 10的中心是Intel的HyperFlex FPGA，周圍是6個(gè)Chiplet，其中4個(gè)是高速收發(fā)芯片，2個(gè)是高帶寬內(nèi)存芯片，物理上連接每個(gè)Chiplet到中心FPGA的就是EMIB，它們被封裝在1個(gè)芯片內(nèi).采取這種方案，Stratix 10集成了3個(gè)廠商的6種技術(shù)，實(shí)現(xiàn)了不同廠商之間基于Chiplet的互用性.另外存儲(chǔ)芯片中HBM也是采用2.5D堆疊方式實(shí)現(xiàn)的.

對(duì)于采用無(wú)源中介層的2.5D封裝結(jié)構(gòu)，無(wú)源中介層只作為芯片之間的連接，無(wú)源中介層中不含有有源器件，僅包含芯片和TSV之間的金屬布線用于信號(hào)進(jìn)入/離開(kāi)芯片.圖4是1個(gè)2.5D封裝結(jié)構(gòu)的實(shí)例.2.5D封裝結(jié)構(gòu)通常將芯片面朝下安裝在具有一系列微型凸點(diǎn)(micro-bumps, μbumps)的中介層上.目前的μbumps間距為40～50 μm，正在開(kāi)發(fā)20 μm和10 μm的間距技術(shù).μbumps提供從上層堆疊的芯片到中介層里金屬布線層的連接.金屬布線層采用與常規(guī)2D獨(dú)立芯片上金屬互連相同的后端工藝制造.中介層上還使用了1個(gè)超薄芯片，用于TSV將輸入輸出路由到C4凸點(diǎn).數(shù)據(jù)從芯片出發(fā)，通過(guò)1個(gè)微凸點(diǎn)，穿過(guò)中介層的金屬布線層，在通過(guò)另一個(gè)C4凸點(diǎn)，最后達(dá)到目標(biāo)芯片的頂層金屬.

Fig. 4 2.5D packaging structure

Fig. 5 3D packaging based on active interposer

2.5D的封裝設(shè)計(jì)方式有利于將多個(gè)制造商不同工藝的芯片組合起來(lái)，無(wú)需協(xié)調(diào)組成芯片的設(shè)計(jì)方式.但是中介層只有連接芯片的作用，造成了資源上的浪費(fèi).因此越來(lái)越多的芯片制造商開(kāi)始在中介層中使用有源邏輯，以進(jìn)一步優(yōu)化系統(tǒng).

2.3 3D結(jié)構(gòu)

3D封裝是指利用TSV將芯片像積木一樣垂直堆疊起來(lái)，其中利用有源中介層(active interposer)的芯片堆疊方式嚴(yán)格劃分屬于2.7D.法國(guó)CEA提出的96核處理器[17]，就是采用基于有源中介層的封裝方式，Intel提出的Lakefield架構(gòu)[11]，采用Foveros封裝技術(shù)，在2D平面上通過(guò)EMIB實(shí)現(xiàn)芯片互連，在3D垂直方向通過(guò)TSV實(shí)現(xiàn)芯片的堆疊，內(nèi)存芯片HMC也是采用3D封裝技術(shù).TSMC基于扇出(fan-out, FO)技術(shù)[32]提出的InFO封裝技術(shù)去掉了硅中介層，直接將芯片埋進(jìn)塑料里，以銅柱實(shí)現(xiàn)3D封裝互連，應(yīng)用到手機(jī)處理器的封裝中可以減少30%的厚度，蘋(píng)果公司的A10處理器首次使用了這個(gè)技術(shù)，并使用在之后的A11,A12處理器中.

與完全采用3D堆疊的芯片散熱問(wèn)題[33]相比，借用有源中介層實(shí)現(xiàn)的封裝芯片降低了功率密度，簡(jiǎn)化了輸電網(wǎng)絡(luò)，因此散熱可以與標(biāo)準(zhǔn)的2D封裝媲美.并且有源中介層可以實(shí)現(xiàn)電源管理、部分模擬電路以及系統(tǒng)輸入輸出等功能，可以實(shí)現(xiàn)SoC的基礎(chǔ)架構(gòu)邏輯(時(shí)鐘、測(cè)試、調(diào)試)和傳感器.如圖5所示，使用有源中介層的3D封裝方式是將先進(jìn)工藝實(shí)現(xiàn)的計(jì)算芯片堆疊在大工藝節(jié)點(diǎn)制造的基底芯片上，計(jì)算芯片和基底芯片通過(guò)TSV互連，同時(shí)計(jì)算芯片之間的通信則是通過(guò)基底芯片中的互連實(shí)現(xiàn)的.基于此，設(shè)計(jì)人員可在新的產(chǎn)品形態(tài)中融入不同的技術(shù)專利模塊與各種存儲(chǔ)芯片和I/O配置.并使得產(chǎn)品能夠分解成更小的“芯片組合”.以Intel第1款CPU混合架構(gòu)產(chǎn)品Lakefield[11]為例，高性能運(yùn)算芯片采用10 nm實(shí)現(xiàn)，基地硅片采用22 nm實(shí)現(xiàn)，集成了CPU處理器、GPU核心顯卡、內(nèi)存控制器、圖像處理單元、顯示引擎，以及各種各樣的I/O輸入輸出、調(diào)試和控制模塊.最后這顆芯片的尺寸長(zhǎng)寬只有12 mm×12 mm，高度僅1 mm，待機(jī)功耗2 mW.

互聯(lián)網(wǎng)+立足于云端，各類信息數(shù)據(jù)較多?；ヂ?lián)網(wǎng)滲透到文化領(lǐng)域中，能夠在技術(shù)應(yīng)用、商業(yè)模式以及產(chǎn)業(yè)組織中發(fā)揮重要作用，符合當(dāng)前時(shí)代發(fā)展的特點(diǎn)。隨著現(xiàn)代信息技術(shù)的快速發(fā)展，人們的閱讀方式也在逐步發(fā)生轉(zhuǎn)變。傳統(tǒng)的紙質(zhì)閱讀方式逐漸轉(zhuǎn)變?yōu)殡娮訒?shū)等數(shù)字文件，同時(shí)，用戶的學(xué)習(xí)模式也在發(fā)生變化。在科學(xué)技術(shù)的帶動(dòng)下，圖書(shū)館行業(yè)要堅(jiān)持與時(shí)俱進(jìn)，將先進(jìn)的思想理念融入到互聯(lián)網(wǎng)技術(shù)和云計(jì)算技術(shù)當(dāng)中。此外，應(yīng)適當(dāng)創(chuàng)新高校圖書(shū)館的知識(shí)服務(wù)模式，使高校圖書(shū)館向著現(xiàn)代化、開(kāi)放化的趨勢(shì)發(fā)展，為用戶信息資源的獲取帶來(lái)更多便利。

由此可以看出通過(guò)3D堆疊的SiP封裝來(lái)進(jìn)行異質(zhì)芯片整合將成為后摩爾定律時(shí)代重要的解決方案，芯片不再?gòu)?qiáng)調(diào)制程微縮，而是將不同制程芯片整合為1顆SiP模塊.

3 Chiplet的通信結(jié)構(gòu)

Fig. 6 Implementation of NoC with different interposers

芯片的主流通信結(jié)構(gòu)有總線和片上網(wǎng)絡(luò)2種，但是目前Chiplet之間的通信沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)，各個(gè)廠商都有自己的通信方案.例如AMD采用的可擴(kuò)展數(shù)據(jù)結(jié)構(gòu)(SDF)[13]，TSMC采用的LIPINCON技術(shù)[31]，Intel采用的高級(jí)接口總線(advanced interface bus, AIB)[30]和其他廠商的NoC結(jié)構(gòu)[17,34].本文不討論具體的通信細(xì)節(jié)和標(biāo)準(zhǔn)協(xié)議，只討論各個(gè)產(chǎn)商采取的通信結(jié)構(gòu).大多數(shù)Chiplet之間的通信結(jié)構(gòu)還是基于總線和NoC的創(chuàng)新.例如AMD的第1代EPYC處理器就是類似總線的通信結(jié)構(gòu)，沒(méi)有路由節(jié)點(diǎn)，芯片之間只能進(jìn)行邊到邊的通信.第2代EPYC處理器就類似于NoC的結(jié)構(gòu)，中間的I/O芯片是起到節(jié)點(diǎn)路由的功能，所有的芯片通信都必須通過(guò)它來(lái)調(diào)度.基于總線的通信結(jié)構(gòu)更加簡(jiǎn)潔，沒(méi)有路由節(jié)點(diǎn)的開(kāi)銷，但是一旦Chiplet的數(shù)量過(guò)多，通信就會(huì)變得低效，并且只針對(duì)邊到邊的通信結(jié)構(gòu)也不支持多個(gè)芯片通信.如果采用路由節(jié)點(diǎn)，以2代EPYC為例，芯片設(shè)計(jì)以I/O芯片為核心，將計(jì)算芯片變成可擴(kuò)展的部分，如圖2(b)，所有計(jì)算芯片通過(guò)無(wú)線結(jié)構(gòu)和I/O芯片相連，數(shù)據(jù)的輸入輸出由I/O芯片統(tǒng)一調(diào)配，各個(gè)計(jì)算芯片之間沒(méi)有數(shù)據(jù)通信.這就消除了原先計(jì)算芯片之間相連，但是只能邊與邊通信的限制.并且采用I/O芯片統(tǒng)一調(diào)配的方式還可以有效降低芯片通信死鎖的風(fēng)險(xiǎn)，缺點(diǎn)是所有芯片的通信都必須通過(guò)I/O芯片，一旦芯片過(guò)多，需要設(shè)計(jì)高效的仲裁算法且仍會(huì)效率降低.解決方案是采用中介層來(lái)實(shí)現(xiàn)片上網(wǎng)絡(luò).

不同中介層實(shí)現(xiàn)NoC的方法不同[35]，為了在有源中介層中實(shí)現(xiàn)NoC，我們只需將NoC鏈接(電線)和路由節(jié)點(diǎn)(晶體管)都放在中介層，圖6(a)顯示一個(gè)小型的采取有源中介層的NoC實(shí)例，其中NoC的鏈接和節(jié)點(diǎn)全部在中介層上.如果使用無(wú)源中介層，不能放有源器件，如圖6(b)，將路由器的活動(dòng)組件(例如緩沖區(qū)、仲裁器)放置在CPU裸片上，但是NoC鏈接仍使用中介層的路由資源.這種方法可以利用中介層的金屬層進(jìn)行NoC路由，但要花費(fèi)一些CPU裸片來(lái)實(shí)現(xiàn)NoC的邏輯組件.圖6中的2個(gè)NoC在拓?fù)浜凸δ苌隙际窍嗤?

基于中介層的NoC結(jié)構(gòu)更加高效，但是節(jié)點(diǎn)開(kāi)銷較大，不過(guò)在大量Chiplets通信的情況下性能更好.NoC提供了統(tǒng)一的接口來(lái)連接不同的系統(tǒng)組件.NoC方法不是要求系統(tǒng)設(shè)計(jì)人員對(duì)每個(gè)通信模塊之間實(shí)現(xiàn)特定的接口，而是采用了模塊化和可擴(kuò)展性更高的設(shè)計(jì)方法，從而使不同的小芯片自然地組合在一起.路由會(huì)顯著影響網(wǎng)絡(luò)性能、可靠性和功耗[36].設(shè)計(jì)不正確的路由算法可能會(huì)導(dǎo)致網(wǎng)絡(luò)中的資源依賴關(guān)系，從而導(dǎo)致死鎖，這可能對(duì)系統(tǒng)造成致命影響.解決死鎖的方案有虛擬通道[37-38]和轉(zhuǎn)向模型[39-40]，其中虛擬通道必須提前配置且每個(gè)虛擬通道都有自己的輸入緩沖區(qū)，增加虛擬通道的數(shù)量會(huì)增大NoC的面積，代價(jià)很高；另外，在3DNoC中，基于轉(zhuǎn)向的算法要求每個(gè)路由節(jié)點(diǎn)都與其他芯片層垂直連接，增加了每個(gè)芯片層的TSV區(qū)域開(kāi)銷，代價(jià)也很高.因此，針對(duì)這種具有各種拓?fù)浣Y(jié)構(gòu)的小芯片系統(tǒng)，南加州大學(xué)和多倫多大學(xué)聯(lián)合提出了一種模塊化的，沒(méi)有死鎖的路由方法[41].該方案無(wú)需了解其他Chiplet或中介層NoC的詳細(xì)信息，每個(gè)Chiplet都可以單獨(dú)設(shè)計(jì).從任何一個(gè)Chiplet的角度看，系統(tǒng)的其他部分(與Chiplet的總數(shù)或者中介層的復(fù)雜性無(wú)關(guān))都可以看作1個(gè)虛擬節(jié)點(diǎn)，然后應(yīng)用了轉(zhuǎn)向限制的邊界路由將Chiplet和虛擬節(jié)點(diǎn)連接起來(lái)，這種模塊化的方法易于分析和優(yōu)化Chiplet的粒度.

4 Chiplet的發(fā)展機(jī)遇和挑戰(zhàn)

本文討論了Chiplet的興起和發(fā)展.隨著SoC的集成度不斷增加，先進(jìn)工藝制程的芯片的研發(fā)成本和制造成本呈幾何式增長(zhǎng)，摩爾定律已經(jīng)接近極限.為了拓展摩爾定律，芯片設(shè)計(jì)者將IP硬核逐漸芯片化，形成Chiplet，然后以SiP的形式封裝形成系統(tǒng)，這也是摩爾定律的一次革命.目前Chiplet封裝和通信的發(fā)展仍然充滿挑戰(zhàn)，首先是封裝標(biāo)準(zhǔn)和通信接口不統(tǒng)一，各個(gè)廠家都有自己的方案；其次是散熱問(wèn)題，將多個(gè)芯片堆疊封裝在一個(gè)有限空間會(huì)造成溫度過(guò)高；再者是芯片網(wǎng)絡(luò)通信問(wèn)題，每個(gè)芯片都有自己的通信網(wǎng)絡(luò)，整個(gè)網(wǎng)絡(luò)如何避免死鎖；最后是沒(méi)有成熟的EDA工具，在芯片設(shè)計(jì)中30%～40%的成本是工具軟件，DARPA的CHIPS項(xiàng)目中的一個(gè)關(guān)鍵工作就是EDA工具，Chiplet的互連、封裝和測(cè)試都需要工具的支持.不過(guò)挑戰(zhàn)總是伴隨著機(jī)遇，以下4個(gè)方面或許會(huì)是Chiplet未來(lái)的發(fā)展趨勢(shì).

1) 任何技術(shù)的革命都伴隨著多門學(xué)科的研究突破，Chiplet的3D封裝散熱問(wèn)題可能隨著滿足集成電、熱、力特性的新材料開(kāi)發(fā)得到解決.

2) 工藝技術(shù)的創(chuàng)新會(huì)推動(dòng)封裝結(jié)構(gòu)的創(chuàng)新，新型引線鍵合技術(shù)、圓片鍵合技術(shù)的開(kāi)發(fā)應(yīng)用將會(huì)推動(dòng)封裝結(jié)構(gòu)由2D向3D的裝換.

3) 3D封裝結(jié)構(gòu)帶來(lái)的通信問(wèn)題可以使用3DNoC來(lái)解決，但3DNoC存在更多的死鎖隱患，因此未來(lái)通信結(jié)構(gòu)的研究會(huì)聚焦對(duì)3DNoC開(kāi)發(fā)高效的避免死鎖的方法.

4) 開(kāi)發(fā)新的集成系統(tǒng)測(cè)試工具和方法.

最后，隨著5G時(shí)代的到來(lái)，基于Chiplet的產(chǎn)品設(shè)計(jì)成本低、上市周期快，未來(lái)在穿戴領(lǐng)域、物聯(lián)網(wǎng)領(lǐng)域都有廣闊的應(yīng)用前景.

作者貢獻(xiàn)聲明：陳桂林負(fù)責(zé)論文觀點(diǎn)的歸納總結(jié)提煉；王觀武和王康負(fù)責(zé)收集Chiplet封裝的相關(guān)資料；胡健負(fù)責(zé)收集Chiplet通信的相關(guān)資料；許東忠指導(dǎo)論文結(jié)構(gòu)和Chiplet的發(fā)展方向.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡