高 成,高 然,黃姣英,何明瑞
(北京航空航天大學(xué) 可靠性與系統(tǒng)工程學(xué)院,北京 100191)
GPU 作為電子系統(tǒng)核心器件之一,使用范圍廣泛且數(shù)量大,高性能的GPU 能滿足武器裝備自主可控和國產(chǎn)計(jì)算機(jī)性能指標(biāo)的戰(zhàn)略需求。但受限于用量有限、產(chǎn)品迭代次數(shù)不足,國產(chǎn)GPU 仍存在很多問題。
與其他集成電路類似,國產(chǎn)GPU 中電子元器件種類較多,且由于結(jié)構(gòu)和應(yīng)用環(huán)境的不同,失效模式表現(xiàn)各異,失效機(jī)理千差萬別,失效物理模型多種多樣。通過調(diào)研發(fā)現(xiàn),在實(shí)際使用過程中,焊點(diǎn)和引腳的失效占很大的比例,尤以焊點(diǎn)熱疲勞和隨機(jī)振動(dòng)疲勞為主[1]。封裝中的焊點(diǎn)失效問題,已經(jīng)成為了制約其產(chǎn)品性能和可靠性的關(guān)鍵性因素。這是因?yàn)殡S著技術(shù)的進(jìn)步和人們對運(yùn)算性能要求的不斷提升,使得元器件在生產(chǎn)和使用過程中集成度不斷提高,但特征尺寸卻不斷縮小[2],導(dǎo)致焊點(diǎn)所承受的熱載荷和隨機(jī)振動(dòng)載荷越來越高,成為器件中最薄弱的連接環(huán)節(jié)。
針對工作中出現(xiàn)的焊點(diǎn)的熱疲勞失效和隨機(jī)振動(dòng)疲勞失效問題,可以通過實(shí)驗(yàn)進(jìn)行研究,但這樣做成本高、耗時(shí)長、可重復(fù)性較差。因此有必要采取以有限元仿真與基于故障物理的疲勞壽命預(yù)測為手段研究電子元器件失效問題。然而,國內(nèi)外關(guān)于焊點(diǎn)失效問題的文獻(xiàn)研究對象多為單個(gè)器件,并通過器件的對稱性簡化建模[3],所得到的大多為1/2 或1/4 的封裝模型。這樣做建模過程簡單且耗時(shí)短,但并未考慮板級中其他器件與該器件的相互影響,導(dǎo)致仿真出的器件應(yīng)力應(yīng)變狀態(tài)與真實(shí)的情況不相符,從而無法準(zhǔn)確定位器件上的危險(xiǎn)焊點(diǎn)與薄弱環(huán)節(jié),并對外界載荷作用下焊點(diǎn)疲勞壽命的評估產(chǎn)生影響。
本文從板極仿真角度對GP101 單板進(jìn)行可靠性評估,不僅考慮到了器件之間的相互作用,使得模型更接近真實(shí)情況,而且提高了電子元器件上焊點(diǎn)應(yīng)力應(yīng)變與真實(shí)結(jié)果的擬合度,使得定位危險(xiǎn)焊點(diǎn)更準(zhǔn)確,疲勞壽命預(yù)測更加精準(zhǔn)。
GP101 單板中包含了多種不同的結(jié)構(gòu),且不同的結(jié)構(gòu)在材料屬性和尺寸大小方面都存在較大的差異。若將GP101 單板上所有的器件和材料進(jìn)行還原會導(dǎo)致模型過于復(fù)雜而無法運(yùn)算。在建立GP101 單板的三維裝配體模型時(shí),需要做出合理的假設(shè)并將其簡化。
因此,將整板的幾何仿真模型分為本次仿真重點(diǎn)研究的GP101 芯片、PCB 板以及電路板上的其他器件,并假設(shè)忽略電阻電容等微小電子器件的影響。同時(shí)再將GP101 芯片簡化為塑封體、基板和焊點(diǎn)。GP101 芯片采用的是FBGA 封裝形式,在焊接過程中,由于器件重量和表面張力的作用,焊球坍塌,焊點(diǎn)固化后呈橢球形[4]。為進(jìn)一步簡化問題的求解,把焊球視作為兩端截頂?shù)那蝮w。最終建立的焊球的三維模型如圖1 所示,GP101 芯片三維模型如圖2 所示。
圖1 焊球三維模型圖Fig.1 3D model of solderjoint
圖2 GP101 芯片三維模型圖Fig.2 3D model of GP101 chip
單板上的器件數(shù)量眾多,其中主要關(guān)注的是GP101 芯片的應(yīng)力應(yīng)變情況,因此通過篩選出電路板上其他器件中的重點(diǎn)器件來進(jìn)行簡化分析。篩選時(shí),認(rèn)為體積小且距離GP101 芯片較遠(yuǎn)的器件對其產(chǎn)生的影響有限,所以選擇和GP101 芯片距離近、體積大、會對芯片產(chǎn)生較大影響的器件進(jìn)行建模。最終選用的重點(diǎn)器件為MT41J128M16JT-093(4 個(gè))、SiI164CT64(2 個(gè))和SAA7111A(1 個(gè))。
將基板、PCB 板、塑封體所用的材料視為各向同性線彈性材料,認(rèn)為材料的屬性與溫度的變化無關(guān),需要的材料參數(shù)有密度、楊氏模量、泊松比和熱膨脹系數(shù)。而焊點(diǎn)所用的材料為非線性材料,還需要得到其與溫度相關(guān)的彈性模量。
焊點(diǎn)的材料為63Sn37Pb,在熱循環(huán)載荷作用下,不但會發(fā)生彈性變形和塑性變形,還會產(chǎn)生與時(shí)間和溫度相關(guān)的蠕變變形[5]。為了考慮焊點(diǎn)的蠕變效應(yīng),需要建立焊料的本構(gòu)模型。因此選用Anand 模型來描述63Sn37Pb 材料的熱力學(xué)特征。
除此之外,在熱循環(huán)載荷下對GP101 單板進(jìn)行分析時(shí),還需要賦予模型材料比熱和導(dǎo)熱系數(shù)[6],這樣才能對模型整體進(jìn)行溫度仿真以及完成后續(xù)的熱疲勞壽命運(yùn)算。材料的比熱和導(dǎo)熱系數(shù)的具體參數(shù)如表1所示。
表1 各組成部分的熱學(xué)性能參數(shù)Tab.1 Thermal performance parameters of each component
將模型單元定義為SOLID186 單元,SOLID186 單元為SOLID185 的高階單元,該單元支持與時(shí)間無關(guān)的塑性變形和彈性變形、與時(shí)間和溫度相關(guān)的蠕變變形、應(yīng)力剛化等現(xiàn)象,并能模擬大幅度的變形和承受較大的應(yīng)力,對壓縮性很差或者不可壓縮的材料也可以模擬,因此,適合于本次模擬仿真實(shí)驗(yàn)的情況。
在對GP101 單板進(jìn)行網(wǎng)格劃分時(shí),對單板上所有的焊點(diǎn)采用掃掠網(wǎng)格劃分方法,對其他部分均采用自動(dòng)網(wǎng)格劃分方法。為了確保精度與運(yùn)算效率,將焊點(diǎn)和PCB 板的Element Size(單元尺寸)分別更改為0.16 mm 和4.0 mm。最終經(jīng)過網(wǎng)格劃分得到的焊點(diǎn)共有24047 個(gè)單元,154024 個(gè)節(jié)點(diǎn)。
局部放大后的GP101 芯片的網(wǎng)格劃分結(jié)果如圖3所示,GP101 單板總體網(wǎng)格劃分的結(jié)果如圖4 所示。
圖3 GP101 芯片的網(wǎng)格劃分結(jié)果Fig.3 Grid generation results of GP101 chip
圖4 GP101 單板的網(wǎng)格劃分結(jié)果Fig.4 Grid generation results of GP101 board
根據(jù)美軍標(biāo)MIL-STD-883 的熱循環(huán)載荷條件中的Test condition B,并結(jié)合GP101 芯片的工作溫度[7],最終確定所選取的溫度循環(huán)的范圍為-55~125 ℃,將溫度載荷施加在GP101 單板各組成部分的外表面。
同時(shí),考慮到器件的實(shí)際工作情況,將零應(yīng)力應(yīng)變狀態(tài)下(即熱循環(huán)加載前)的參考溫度設(shè)為室溫T=25 ℃。焊點(diǎn)的應(yīng)力應(yīng)變在熱循環(huán)過程中呈現(xiàn)為周期性變化,而且一般在幾個(gè)周期后趨于穩(wěn)定[8],因此在進(jìn)行有限元分析時(shí)選取四個(gè)熱循環(huán)周期進(jìn)行計(jì)算。每個(gè)周期由五個(gè)載荷步組成,在最高溫和最低溫時(shí)均保溫15 min,從最低溫升至最高溫和從最高溫降至最低溫時(shí)間均為6 min,升降溫速率為固定值30 ℃/min。每個(gè)循環(huán)周期的時(shí)長為42 min[9]。熱循環(huán)的溫度載荷曲線如圖5 所示。
圖5 熱循環(huán)的溫度載荷曲線Fig.5 Temperature load curve of thermal cycle
GP101 單板通過PCB 板上的七個(gè)通孔固定在計(jì)算機(jī)中,以此限制其在其他方向上的平移和旋轉(zhuǎn)。將PCB 板上七個(gè)通孔的內(nèi)側(cè)面設(shè)置為固定約束,從而模擬GP101 單板通過螺栓固定在計(jì)算機(jī)內(nèi)部的工作狀態(tài)。
熱循環(huán)載荷加載結(jié)束后,得到的GP101 單板的應(yīng)變能分布如圖6 所示。其中圖6(b)為局部放大后的GP101芯片焊點(diǎn)的應(yīng)變能分布圖,將應(yīng)變能最大的焊點(diǎn)視作危險(xiǎn)焊點(diǎn),圖6(c)為危險(xiǎn)焊點(diǎn)的應(yīng)變能分布圖。
通過圖像可以分析得出,GP101 芯片上焊點(diǎn)的應(yīng)變能基本呈現(xiàn)為從圖6(b)的上方向下方遞增的趨勢。結(jié)合圖6(a)中GP101 芯片的位置和圖6(b)局部放大后GP101 芯片焊點(diǎn)的應(yīng)變能分布,可以看出,焊點(diǎn)應(yīng)變能較高的位置集中在GP101 芯片與MT41J128M16JT-093 相鄰近的位置。
圖6 GP101 單板的應(yīng)變能分布圖Fig.6 The strain energy diagrams of GP101 board
Darveaux 模型是基于能量對焊點(diǎn)的壽命進(jìn)行評估的壽命預(yù)測模型[10]。通過結(jié)合施加熱載荷后每次循環(huán)周期得出的結(jié)果和數(shù)據(jù),提取對應(yīng)周期的焊點(diǎn)的應(yīng)變能或應(yīng)變能密度,從而最終得到其與焊點(diǎn)壽命之間的關(guān)系。
要得出焊點(diǎn)的壽命,首先需要得到焊點(diǎn)的平均應(yīng)變能密度增量。為了盡量降低計(jì)算結(jié)果受仿真軟件中網(wǎng)格劃分帶來的影響,通常采用體積加權(quán)平均法來計(jì)算焊點(diǎn)的平均應(yīng)變能密度[11]。
式中:Wave為焊點(diǎn)的體積加權(quán)平均應(yīng)變能密度;i為焊點(diǎn)上各部分對應(yīng)的單元的單元號;N為焊點(diǎn)劃分的單元總數(shù);vi為焊點(diǎn)上對應(yīng)單元部分的體積;Wi為焊點(diǎn)上對應(yīng)單元部分的應(yīng)變能密度;ΔWave即為所要求的焊點(diǎn)的體積加權(quán)平均應(yīng)變能密度增量。
在ANSYS Workbench 實(shí)際操作過程中,軟件中所提取的是焊點(diǎn)每個(gè)單元的應(yīng)變能而非應(yīng)變能密度,因此在實(shí)際進(jìn)行數(shù)據(jù)處理時(shí)將公式(1)修改為:
在熱應(yīng)力加載的進(jìn)程中,隨著循環(huán)周期數(shù)的不斷增加,最終在幾個(gè)循環(huán)后得到穩(wěn)定的體積加權(quán)平均應(yīng)變能增量,并將該值應(yīng)用于后續(xù)的模型中進(jìn)行計(jì)算。將圖6(c)中危險(xiǎn)焊點(diǎn)各單元的應(yīng)變能和體積代入式(3)中,可得出危險(xiǎn)焊點(diǎn)ΔWave的值為6.52×104Pa。
Darveaux 模型完整的計(jì)算公式為:
式中:K1、K2、K3、K4為與失效機(jī)理有關(guān)的裂紋擴(kuò)展相關(guān)系數(shù),如表2 所示;Nf為故障發(fā)生時(shí)的循環(huán)次數(shù);N0為裂紋出現(xiàn)時(shí)的周期數(shù);a為斷裂臨界長度(即焊點(diǎn)直徑);da/dN為裂紋擴(kuò)展速度。
表2 Darveaux 裂紋擴(kuò)展相關(guān)系數(shù)Tab.2 Correlation coefficient of Darveaux crack propagation
通過單位轉(zhuǎn)換,將體積加權(quán)平均應(yīng)變能密度增量和斷裂臨界長度(即焊點(diǎn)直徑)轉(zhuǎn)換為英制單位,并代入式(4)~(6),最終計(jì)算得到故障發(fā)生時(shí)的循環(huán)周期數(shù)為4081.167157。根據(jù)前文設(shè)定的溫度循環(huán)的周期,每個(gè)周期的時(shí)長為42 min,最終得到焊點(diǎn)的熱疲勞壽命為:Nf=2856.81701 h。
與2.1 節(jié)中所描述的固定約束相同,將單板上七個(gè)安裝孔的內(nèi)壁設(shè)置為固定約束。隨后,在ANSYS Workbench 中進(jìn)行模態(tài)分析,得到的GP101 單板的前六階固有頻率如表3 所示。
表3 GP101 單板前六階固有頻率Tab.3 The first six natural frequencies of GP101 board
FBGA 封裝主要受到一階的彎曲變形作用,根據(jù)圖7 的一階振型圖,可以看出GP101 單板整體在一階頻率下的振動(dòng)情況,振幅最大的地方為單板的中下部邊界位置,并向周圍逐漸衰減。
圖7 GP101 單板第一階振型圖Fig.7 The first mode shape of GP101 board
完成模態(tài)分析后,對其進(jìn)行隨機(jī)振動(dòng)仿真分析。通過向GP101 單板的固定約束端施加Z向(即重力方向)加速度PSD 譜的方式來施加隨機(jī)振動(dòng)載荷,進(jìn)而完成GP101 芯片焊點(diǎn)的可靠性評估。
本研究采用GJB150A.16-2009 振動(dòng)試驗(yàn)中噴氣式飛機(jī)隨機(jī)振動(dòng)的加速度PSD 譜,其頻率曲線如圖8 所示。
圖8 GJB150A.16-2009 中的加速度PSD 譜Fig.8 PSD spectrum of acceleration in GJB150A.16-2009
隨機(jī)振動(dòng)加載結(jié)束后,得到圖9 所示在隨機(jī)振動(dòng)加載條件下GP101 單板的1σ等效應(yīng)力云圖,其中圖9(a)為整體的1σ等效應(yīng)力云圖,圖9(b)為GP101 芯片的焊點(diǎn)的1σ等效應(yīng)力云圖,圖9(c)為危險(xiǎn)焊點(diǎn)的1σ等效應(yīng)力云圖。
圖9 GP101 單板的1σ 等效應(yīng)力云圖Fig.9 The 1σ equivalent stress diagram of GP101 board
通過圖像可以分析得出,GP101 芯片上焊點(diǎn)的等效應(yīng)力大體呈現(xiàn)為從圖9(b)的左上角方向向右下角方向遞增的趨勢。結(jié)合圖9(b)中GP101 芯片焊點(diǎn)的等效應(yīng)力分布以及圖7 的一階振型圖,可以看出在一階頻率下振幅較大的地方焊點(diǎn)受到的等效應(yīng)力也較大。同時(shí),臨近單板上其他器件的邊緣部分焊點(diǎn)的應(yīng)力也會呈現(xiàn)出小范圍的增幅,但增量有限。
基于有限元分析的隨機(jī)振動(dòng)加載下的振動(dòng)疲勞壽命預(yù)測方法主要分為兩步:第一步是通過S-N應(yīng)力壽命曲線來表示焊點(diǎn)所用材料的疲勞特性;第二步是通過結(jié)合Miner 線性累計(jì)損傷理論和Steinberg 模型得到焊點(diǎn)在多級應(yīng)力下的總體的累計(jì)損傷度[12],最終得到失效時(shí)間。
與熱循環(huán)加載下的熱疲勞壽命預(yù)測方法類似,通過Steinberg 模型對焊點(diǎn)進(jìn)行振動(dòng)疲勞壽命預(yù)測,首先需要通過ANSYS Workbench 提取危險(xiǎn)焊點(diǎn)的等效應(yīng)力。
為抵消網(wǎng)格劃分對所得計(jì)算結(jié)果的影響,采用體積加權(quán)平均法來計(jì)算焊點(diǎn)的平均應(yīng)力[13],焊點(diǎn)的體積加權(quán)等效應(yīng)力可以通過以下方法計(jì)算:
式中:σ為焊點(diǎn)的體積加權(quán)等效應(yīng)力;σi為焊點(diǎn)上對應(yīng)單元部分的應(yīng)力。
63Sn37Pb 焊料的Basquin 冪律方程為:
結(jié)合Miner 線性累計(jì)損傷法則,可以得到在三個(gè)應(yīng)力水平下構(gòu)件的累積損傷度為:
式中:ni為在i倍應(yīng)力水平下對應(yīng)的實(shí)際累積循環(huán)數(shù);Ni為在i倍應(yīng)力水平失效時(shí)所對應(yīng)的破壞循環(huán)數(shù);D為器件上破壞的總損傷。
N1、N2、N3的值可以通過式(8)求得,n1、n2、n3的值可以通過式(10)求得:
式中:f為一階模態(tài)的共振頻率值。
通常將D=1 時(shí),認(rèn)定器件發(fā)生了振動(dòng)疲勞失效。最終得到失效時(shí)間T的表達(dá)式如下:
通過式(7),求得危險(xiǎn)焊點(diǎn)對應(yīng)的體積加權(quán)等效應(yīng)力σ=1.12×107Pa。分別將對應(yīng)的i倍應(yīng)力值代入式(8),得到1σ、2σ、3σ對應(yīng)的焊點(diǎn)失效時(shí)的破壞循環(huán)數(shù)分別為N1=88164、N2=5069 和N3=954。由式(10)及一階模態(tài)時(shí)的共振頻率值f,計(jì)算得到實(shí)際循環(huán)數(shù)分別為n1=238、n2=95 和n3=15。
最終得到累計(jì)總損傷度為D=0.037107268 h-1,發(fā)生故障的失效時(shí)間為T=26.94889856 h。
通過建立GP101 單板的板級模型,分別分析了GP101 芯片上焊點(diǎn)在兩種載荷下的壽命情況,并得出以下結(jié)論:
在熱循環(huán)加載下,焊點(diǎn)應(yīng)變能較高的位置集中在GP101 芯片與MT41J128M16JT-093 相鄰近的位置。且越靠近MT41J128M16JT-093 的位置,焊點(diǎn)的應(yīng)變能越高。
在隨機(jī)振動(dòng)加載下,GP101 芯片上焊點(diǎn)的等效應(yīng)力分布與整板在一階振型下的振幅情況基本吻合。單板上的其他器件對于臨近的部分芯片邊界上的焊點(diǎn)的應(yīng)力有加成作用,但影響作用有限,并未改變大體趨勢。
因此,在進(jìn)行可靠性評估時(shí),需要著重關(guān)注這些危險(xiǎn)位置下焊點(diǎn)的應(yīng)力應(yīng)變及失效情況,從而提高整板的環(huán)境適應(yīng)能力、減少潛在缺陷,促進(jìn)GP101 單板的安全可靠應(yīng)用。