支 越,孫大鵬,王之哲,羅宏偉
(工業(yè)和信息化部電子第五研究所,廣東 廣州 510610)
隨著電子系統(tǒng)的快速增長,半導(dǎo)體器件失效機理和模型選取依據(jù)成為電子行業(yè)的迫切需求。目前電子設(shè)備發(fā)展迅速,電子產(chǎn)品容量越來越大,生命周期越來越短,封裝形式也在不斷變化。相同的封裝可以包封類型和容量完全不同的器件,同一個器件也包括幾種不同的外形。不同供應(yīng)商的半導(dǎo)體器件形式、材料、結(jié)構(gòu)種類繁多,其對應(yīng)的失效隱患也多樣,包括點遷移、腐蝕、與時間相關(guān)的介質(zhì)層擊穿、熱載流子注入、軟誤差等。
在進行電子產(chǎn)品可靠性評價與物理模型應(yīng)用時,需要先了解電子產(chǎn)品和產(chǎn)品經(jīng)歷的任務(wù),即內(nèi)因不確定性和外因不確定性。內(nèi)因不確定性是指在由于工藝誤差等因素導(dǎo)致的產(chǎn)品參數(shù)波動,包括尺寸、材料和特性參數(shù)。外因不確定性是指同一批次電子產(chǎn)品在使用過程中由于完成的任務(wù)不同,使用的地區(qū)、季節(jié)不同,用戶使用方式不同而導(dǎo)致產(chǎn)品經(jīng)歷的環(huán)境應(yīng)力具有不確定性。根據(jù)電子產(chǎn)品業(yè)界的要求,迫切需要基于以上信息對產(chǎn)品的失效機理與失效模型進行限定。
本文首先以電子產(chǎn)品的故障為出發(fā)點,從集成電路-封裝、集成電路-芯片、電路板(或線路板)、電子元件、系統(tǒng)和多系統(tǒng)的角度論述了不同任務(wù)環(huán)境下電子器件的故障機理特點;然后,系統(tǒng)論述了故障模式、影響及危害性分析(FMECA)和故障模式、機理與影響分析(FMMEA)等故障機理分析方法;最后,對故障物理元模型進行梳理和探討,為電子產(chǎn)品可靠性評價及失效物理評估模型的選取提供了依據(jù)。
集成電路-封裝相關(guān)的故障機理主要關(guān)注封裝中相關(guān)基本互連、密封、載體構(gòu)件的故障問題。因此國內(nèi)外開展了大量的研究。Men等[1]提出了一種用于球柵陣列封裝焊點熱疲勞壽命預(yù)測的疲勞裂紋擴展模型。陳穎等[2]建立了球柵陣列封裝焊點的三維有限元模型,通過分析焊點應(yīng)力分布和預(yù)測焊點熱疲勞模型,實現(xiàn)焊點壽命的快速工程估算。
整體看來,故障機理主要分為以下幾類:
1) 引線鍵合互連主要為拉伸疲勞、剪切疲勞、金屬間化合物、柯肯達爾效應(yīng)、SDDV、應(yīng)力遷移、腐蝕等熱疲勞。
2) 焊球互連主要為熱疲勞、蠕變、振動疲勞、電遷移、金屬間化合物、柯肯達爾效應(yīng)。
3) 塑封料主要為腐蝕、爆米花效應(yīng)、熱膨脹系數(shù)不匹配及α射線軟誤差等。
4) 硅芯片主要為芯片疲勞脆斷、鋁電極腐蝕等。
5) 芯片粘結(jié)膠主要為粘結(jié)層疲勞斷裂等。
集成電路-芯片相關(guān)的故障機理主要關(guān)注芯片內(nèi)部的故障問題。陳穎等[3]研究了芯片粘接層材料、粘結(jié)層厚度、粘結(jié)層空洞的面積、空洞的位置對芯片溫度分布以及芯片最高溫度造成的影響??傮w看來,芯片相關(guān)故障主要包括熱載流子注入、TDDB、NBTI、界面效果、電遷移、金屬件化合物、柯肯達爾效應(yīng)、ESD擊穿及二次擊穿等。故障機理如表1所示。
表1 集成電路-芯片相關(guān)的故障機理
電路板(或線路板)的故障機理主要關(guān)注板級的故障問題。Chen等[4]介紹了在單板機上實現(xiàn)可靠性增強試驗的過程,包括應(yīng)力分析、測試程序的設(shè)計、監(jiān)測參數(shù)的確定、數(shù)據(jù)的采集和分析。陳穎等[5-8]分析了PBGA 焊點設(shè)計及環(huán)境溫度參數(shù)對其可靠性的影響;對目前制造過程鍍通孔(多層印刷線路板各層提供電導(dǎo)通的結(jié)構(gòu))失效的機理與物理模型的研究現(xiàn)狀進行總結(jié);以某實驗板為例進行了實例分析,并對剩余壽命進行了預(yù)測;基于鍍通孔應(yīng)力分布模型,定量地研究了鍍通孔線路板厚度與鍍通孔直徑之比(高徑比)、鍍通孔半徑與鍍層厚度之比、線路板有效作用半徑與鍍通孔半徑之比等幾何設(shè)計參數(shù)以及線路板玻璃化溫度對鍍通孔鍍層應(yīng)變及壽命的影響。通過引入等效溫度載荷,給出了不同玻璃化溫度下的應(yīng)力分布模型。
總體來看,板級故障主要表現(xiàn)為鍍通孔熱疲勞,導(dǎo)電陽極細絲,晶枝生長,錫須,銀遷移,腐蝕等。
電子產(chǎn)品中應(yīng)用到了大量的電子元件,包括電阻器、電連接器、電解電容器、陶瓷電容器、貼片電阻、固態(tài)鉭電容器等。在評估電子產(chǎn)品的可靠性時,電子元件的故障機理不容忽視。Wang等[9]采用考慮傳遞率因子的Steinberg振動疲勞模型預(yù)測電子元件的剩余壽命。Chen等[10]提出在一個元件先失效的情況下,隨著時間的推移,主備用元件和熱備用元件的瞬態(tài)失效概率和累積失效概率均會發(fā)生變化。
總體看來,電子元件的故障機理主要表現(xiàn)為電阻值退化、固態(tài)鉭電容退化、電解液干涸、介質(zhì)擊穿、接觸退化、介質(zhì)氧化膜晶化、熱膨脹系數(shù)不匹配、銀離子遷移、電化學(xué)腐蝕等。
系統(tǒng)和多系統(tǒng)的故障機理涉及到多種故障機理的競爭、累加、促進、抑制等關(guān)系。對于此類故障機理的處理方法多樣,由于側(cè)重點不同,也各有利弊。Chen等[10-11]提出了兩種失效機制的累積規(guī)律,同時還提出了一種改進的基于層次二元決策圖的MS-PMS可靠性建模與分析方法,以及一種改進的二元決策圖和多狀態(tài)多值決策圖(MMDD)模型相結(jié)合的方法,用于多狀態(tài)系統(tǒng)的狀態(tài)概率評估和可靠性分析。Cao等[12]從失效機理的特點出發(fā),研究了失效機理相關(guān)性的分類,推導(dǎo)了各單一失效機理相關(guān)性的可靠性數(shù)學(xué)模型,研究了基于可靠性框圖的考慮失效機理相關(guān)性的電子產(chǎn)品系統(tǒng)可靠性建模方法。Yu等[13]介紹了將相似產(chǎn)品法與試驗法相結(jié)合進行貯存可靠性評估的方法。Chen等[14]采用一種考慮功能相關(guān)元件失效機理行為的可靠性評估方法。
故障機理分析方法包括FMECA和FMMEA,國內(nèi)外對兩種分析方法開展了大量研究。Chen等[15-16]對現(xiàn)有的故障模式數(shù)據(jù)庫進行了綜述,然后提出了一種基于知識的故障模式管理方法,以便對故障模式進行有效利用;闡述了FMECA研究與工程應(yīng)用現(xiàn)狀,同時提出了一種新研航空電子產(chǎn)品硬件綜合FMECA方法。Zhang等[17]提出了一種新的仿真輔助FMEA方法,并給出了具體步驟。Chen等[18]引入FMMEA來得到失效模式、失效機理和失效物理模型,可計算可靠性參數(shù)(如故障率和MTBF)。任占勇等[19]對產(chǎn)品進行FMMEA,得到所有潛在故障點的故障模式、機理與對應(yīng)的物理模型。利用產(chǎn)品材料、結(jié)構(gòu)、工藝、應(yīng)力等參數(shù)建立產(chǎn)品的仿真數(shù)字模型,并進行應(yīng)力分析;利用概率故障物理(PPoF)模型進行損傷分析,得到各潛在故障的壽命分布;最后利用時間競爭的原理對其進行數(shù)據(jù)融合,得到產(chǎn)品故障率、平均故障間隔時間(MTBF)等可靠性指標。陳穎等[20-22]根據(jù)各階段應(yīng)力和環(huán)境條件對系統(tǒng)及所有元器件進行FMMEA分析,確定系統(tǒng)各元器件在各階段的主要故障機理及其相關(guān)關(guān)系;同時,提供一種基于SBDD模型的冷儲備系統(tǒng)故障行為建模方法;另外,提供了一種基于貝葉斯網(wǎng)絡(luò)和深度學(xué)習(xí)算法的故障機理智能分析方法。
FMMEA是一種系統(tǒng)的分析方法,它是FMECA向故障機理層的延伸,通過分析故障的內(nèi)因和外因,確定產(chǎn)品故障機理并量化其風險的方法。FMMEA分析基于電子元器件故障機理對應(yīng)的數(shù)據(jù)庫,提煉推斷邏輯關(guān)系規(guī)則,建立信息不完整情況下的故障推理過程,經(jīng)算法訓(xùn)練集的深度學(xué)習(xí),可以提供條件概率表、聯(lián)合樹推理引擎、貝頁斯網(wǎng)絡(luò)拓撲,最終給出故障機理的智能推理結(jié)果。
從失效機理的特點出發(fā),對單機理、多機理相關(guān)性的可靠性數(shù)學(xué)模型進行分類,常用模型如下。
3.1.1 焊球/焊柱/引腳/芯片粘接層等熱疲勞
(1)
3.1.2 金-鋁鍵合熱疲勞
(2)
引線振動疲勞/焊柱/鍵合點振動疲勞:
(3)
式中:L(V)為產(chǎn)品壽命;V為加速度均方根值;n=3.2;M為材料相關(guān)的常數(shù)。
根據(jù)疲勞理論,疲勞壽命可以認為是疲勞裂紋形成壽命和疲勞裂紋傳播壽命的和。Darveaux模型是一個包含4個參數(shù),描述失效時的循環(huán)次數(shù)和每次循環(huán)積累的平均應(yīng)變能密度之間關(guān)系的模型。Darveaux本構(gòu)模型一般用于材料屬性為時間無關(guān)塑性和時間相關(guān)蠕變的情況,所以,最終選用該模型來預(yù)測焊點的疲勞壽命。
Darveaux模型可寫成如下形式:
(4)
式中:αw為特征壽命;a為焊點直徑(即最終裂紋的長度);N0為出現(xiàn)裂紋時的循環(huán)次數(shù);da/dN為裂紋的傳播速度。與裂紋擴展相關(guān)的數(shù)據(jù)包括:
裂紋萌生:
(5)
裂紋擴展:
(6)
式中:ΔWave為平均應(yīng)變能密度;K1、K2、K3、K4為4個參數(shù)。
Arrhenius模型是與溫度相關(guān)的壽命模型,一般只用于評估當溫度為主要老化因素時的情形。該模型的反應(yīng)速率方程:
(7)
式中:L為平均壽命;P為待定模型參數(shù);Ea為激活能;K為玻爾茲曼常數(shù);T為絕對溫度值。
缺陷相關(guān)擊穿模型,該模型適用于硅器件。 TDDB是通過電介質(zhì)中的局部缺陷形成低電阻介電路徑,如MOS器件中的熱生長氧化物或其他氧化物。由于加工不良或氧化物生長不均勻,故障通常發(fā)生在氧化物層的薄弱處。
(8)
式中:τ為TDDB效應(yīng)的壽命時間;Q為比例常數(shù);γ為電壓加速因子;Eox為氧化層電場強度。
本文系統(tǒng)地對電子產(chǎn)品可靠性評價與物理模型應(yīng)用進行了探討,為電子產(chǎn)品可靠性評價及失效物理評估模型的選取提供了依據(jù)。其主要工作如下:
1) 以電子產(chǎn)品的故障為出發(fā)點,從集成電路-封裝、集成電路-芯片、電路板(或線路板)、電子元件、系統(tǒng)和多系統(tǒng)的角度論述了不同任務(wù)環(huán)境下電子器件的故障機理特點。
2) 系統(tǒng)論述了FMECA和FMMEA等故障機理的分析方法。
3) 結(jié)合低周疲勞、高周疲勞、裂紋萌生、反應(yīng)論模型、芯片失效等失效機理對故障物理元模型進行梳理和探討。