康京山
(中國(guó)電子科技集團(tuán)公司第五十四研究所,河北 石家莊 050081)
為實(shí)現(xiàn)產(chǎn)品可靠性,需在全壽命周期開(kāi)展可靠性工作[1]。但在新產(chǎn)品研發(fā)中不可避免地會(huì)引入一些影響可靠性的錯(cuò)誤、問(wèn)題或薄弱環(huán)節(jié),如元器件的原材料選型、邏輯或時(shí)序設(shè)計(jì)和各個(gè)部分之間的有效協(xié)同,以及抗干擾工序的工藝設(shè)計(jì)等多方面的問(wèn)題。
發(fā)現(xiàn)這類問(wèn)題的方法有兩種:一種是分析方法,另一種是試驗(yàn)方法。經(jīng)驗(yàn)表明,約有70%左右的設(shè)計(jì)缺陷要靠對(duì)樣件進(jìn)行試驗(yàn)來(lái)找出[2]。從國(guó)內(nèi)工程實(shí)踐看,由于缺乏嚴(yán)謹(jǐn)有效的分析方法,并且在必要的數(shù)據(jù)、知識(shí)和經(jīng)驗(yàn)的積累和運(yùn)用方面的機(jī)制不夠健全,造成在文檔圖紙資料審查或評(píng)審中發(fā)現(xiàn)可靠性設(shè)計(jì)問(wèn)題能力不足。因此,相關(guān)問(wèn)題在很大程度上需要依賴可靠性試驗(yàn)的方法去發(fā)現(xiàn)。
然而,傳統(tǒng)的可靠性試驗(yàn)方法采用模擬產(chǎn)品預(yù)期使用應(yīng)力環(huán)境方法,需要的試驗(yàn)樣本數(shù)量大,耗時(shí)長(zhǎng),成本高,難以在多個(gè)產(chǎn)品層次、不同的技術(shù)狀態(tài)下充分地開(kāi)展。而在項(xiàng)目后期通過(guò)試驗(yàn)發(fā)現(xiàn)可靠性方面的設(shè)計(jì)問(wèn)題時(shí),所采取的解決方案不可避免地會(huì)受到進(jìn)度、成本和技術(shù)狀態(tài)控制等諸多因素的制約,難以實(shí)現(xiàn)最優(yōu)化。
為了縮短可靠性試驗(yàn)周期,美國(guó)G K Hobbs博士在20世紀(jì)80年代末90年代初提出了高加速壽命試驗(yàn)(HALT:Highly Accelerated Life Testing)方法[3-5]。該方法認(rèn)為,與其費(fèi)力地測(cè)量或評(píng)價(jià)產(chǎn)品的可靠性指標(biāo)(如平均無(wú)故障時(shí)間(MTBF:Mean Time Between Failure)),還不如通過(guò)試驗(yàn)快速地發(fā)現(xiàn)產(chǎn)品可能存在的缺陷并加以改進(jìn)來(lái)提高可靠性水平。而為了保證“快速”,采用在樣品上施加遠(yuǎn)超出產(chǎn)品規(guī)范極限的應(yīng)力并逐步地增大應(yīng)力量值的方法,以換取試驗(yàn)時(shí)間的縮短,就不失為一種值得提倡的方法。
隨著支持快速溫變和六自由度隨機(jī)振動(dòng)試驗(yàn)設(shè)施的普及,這項(xiàng)技術(shù)在航空電子、通信產(chǎn)品和消費(fèi)電子產(chǎn)品等許多領(lǐng)域中得到了成功的應(yīng)用[6-10]。例如:文獻(xiàn)[7]報(bào)道了在電信設(shè)備領(lǐng)域中的應(yīng)用情況,在試驗(yàn)時(shí)間方面,傳統(tǒng)的可靠性試驗(yàn)方法所需的時(shí)間大多在4~6個(gè)月之間,而HALT方法僅需幾周時(shí)間;在提高可靠性效果方面,有案例將12 250個(gè)經(jīng)HALT改進(jìn)后的點(diǎn)對(duì)多點(diǎn)單元在交付1年后統(tǒng)計(jì)現(xiàn)場(chǎng)可靠性,與此前交付試運(yùn)行1.5年的2 715個(gè)未經(jīng)HALT試驗(yàn)的單元進(jìn)行對(duì)比,發(fā)現(xiàn)現(xiàn)場(chǎng)可靠性提高了將近5倍。
但是,關(guān)于HALT,存在以下問(wèn)題:
1)人們對(duì)其概念、原理、方法和應(yīng)用等還存在模糊的認(rèn)識(shí)甚至誤區(qū),不利于這項(xiàng)技術(shù)的正確運(yùn)用;
2)產(chǎn)品研發(fā)人員往往認(rèn)為HALT所發(fā)現(xiàn)的故障模式是由過(guò)應(yīng)力造成的,將來(lái)在規(guī)定的使用條件下不可能實(shí)際發(fā)生,因此,對(duì)于設(shè)計(jì)改進(jìn)的積極性不高;
3)由于缺乏對(duì)HALT技術(shù)全面而深入的理解,試驗(yàn)人員往往只施加常規(guī)的、通用的環(huán)境應(yīng)力,簡(jiǎn)單地逐步增大應(yīng)力量值,容易出現(xiàn)既大量激發(fā)現(xiàn)場(chǎng)不可能發(fā)生的故障,又遺漏應(yīng)該得到激發(fā)的故障的現(xiàn)象,損害試驗(yàn)結(jié)果的價(jià)值。
因此,迫切地需要對(duì)HALT的技術(shù)原理及應(yīng)用進(jìn)行進(jìn)一步的研究,使試驗(yàn)人員正確地運(yùn)用這項(xiàng)技術(shù)取得對(duì)于提高產(chǎn)品的可靠性真正有價(jià)值的試驗(yàn)結(jié)果,使產(chǎn)品各個(gè)相關(guān)方全面地了解這項(xiàng)技術(shù),恰當(dāng)?shù)亟庾x試驗(yàn)結(jié)果,最終使得這項(xiàng)技術(shù)得以在更大范圍內(nèi)推廣應(yīng)用。
為了對(duì)HALT技術(shù)及其應(yīng)用進(jìn)行全面分析,采用結(jié)構(gòu)化分析方法,按照某種模型將分析對(duì)象分解為一系列相互獨(dú)立的方面或者子問(wèn)題分別分析。這樣的模型有多種,結(jié)合HALT的特點(diǎn),本文選擇5W2H模型。
經(jīng)歷了長(zhǎng)期發(fā)展的演進(jìn),業(yè)界關(guān)于HALT有了一定的共識(shí),但是,在不同的應(yīng)用領(lǐng)域或不同的發(fā)展時(shí)期,其概念含義存在一定的差異甚至完成不同。
Hobbs博士給出的描述是“為了發(fā)現(xiàn)設(shè)計(jì)和制造工藝的缺陷環(huán)節(jié),所使用的每個(gè)可能的激勵(lì)值均需在加速試驗(yàn)條件下施加[3]?!?/p>
GB/T 29309的定義是“通過(guò)逐步增強(qiáng)施加在試驗(yàn)樣品上的試驗(yàn)應(yīng)力(如溫度、振動(dòng)快速溫變和振動(dòng)綜合應(yīng)力等),確定產(chǎn)品的耐受應(yīng)力極限的試驗(yàn)[11]?!?/p>
GB/Z 31477(等同采用IEC/TS 62500)并未定義HALT,而是定義了高加速試驗(yàn):“對(duì)產(chǎn)品或產(chǎn)品的某些部件以步進(jìn)方式施加環(huán)境應(yīng)力和(或)工作應(yīng)力,并逐步地提高到遠(yuǎn)超過(guò)規(guī)范規(guī)定的應(yīng)力水平,直到其達(dá)到工作和(或)破壞極限為止的試驗(yàn)[12-13]?!?/p>
GB/T 34986認(rèn)為,作為非指標(biāo)考核性的加速試驗(yàn),HALT不能得到產(chǎn)品的壽命信息,但可以得到產(chǎn)品設(shè)計(jì)應(yīng)力極限值信息,為了避免引起誤解,它定義了高加速極限試驗(yàn),縮寫(xiě)同樣為HALT。順便指出,其定義為“在規(guī)定的環(huán)境應(yīng)力下,用于找出產(chǎn)品最有可能出現(xiàn)的失效模式的試驗(yàn)或試驗(yàn)序列[14]?!边@容易使人困惑:不是要超出規(guī)定的環(huán)境應(yīng)力以壓縮試驗(yàn)時(shí)間嗎?筆者查其等同采用的IEC 62506,發(fā)現(xiàn)該標(biāo)準(zhǔn)中給出的HALT的定義為“用于發(fā)現(xiàn)產(chǎn)品在規(guī)定應(yīng)力環(huán)境下最有可能出現(xiàn)的失效模式的試驗(yàn)或試驗(yàn)序列[15]?!睂?duì)比兩個(gè)定義發(fā)現(xiàn),后者強(qiáng)調(diào)要找出的是產(chǎn)品暴露在規(guī)定應(yīng)力下也就是實(shí)際的使用現(xiàn)場(chǎng)環(huán)境下的失效模式(也被稱為故障模式),而不是限定在規(guī)定的環(huán)境應(yīng)力下進(jìn)行試驗(yàn)。因此,我們認(rèn)為后者的表述更準(zhǔn)確。
GJB 451A[16]將HALT翻譯為高加速應(yīng)力試驗(yàn),其定義是“在產(chǎn)品研制階段,通過(guò)步進(jìn)的方法向產(chǎn)品施加高于技術(shù)條件規(guī)定的應(yīng)力,不斷地找出設(shè)計(jì)和工藝缺陷加以改進(jìn),逐步地提高產(chǎn)品的耐環(huán)境能力,并找出產(chǎn)品承受環(huán)境應(yīng)力的工作極限和破壞極限的過(guò)程。”它規(guī)定了HALT的時(shí)機(jī)、采用的方法、要達(dá)到的目的,定義全面而準(zhǔn)確。同時(shí),該標(biāo)準(zhǔn)還定義了與HALT類似的概念可靠性強(qiáng)化試驗(yàn)(RET),定義為:“通過(guò)系統(tǒng)地施加逐步增大的環(huán)境應(yīng)力和工作應(yīng)力,激發(fā)和暴露產(chǎn)品設(shè)計(jì)中的薄弱環(huán)節(jié),以便改進(jìn)設(shè)計(jì)和工藝,提高產(chǎn)品可靠性的試驗(yàn)。它是一種可靠性研制試驗(yàn)?!盧ET應(yīng)用和研究也很廣泛,如文獻(xiàn)[17-19]所示。
通過(guò)以上分析可知,HALT、高加速極限試驗(yàn)、高加速試驗(yàn)、高加速應(yīng)力試驗(yàn)和可靠性強(qiáng)化試驗(yàn),雖然各個(gè)概念強(qiáng)調(diào)的重點(diǎn)有所不同,但其實(shí)質(zhì)是相同的,體現(xiàn)了HALT的本質(zhì):采用步進(jìn)應(yīng)力試驗(yàn)的方法,激發(fā)設(shè)計(jì)和工藝缺陷,探測(cè)應(yīng)力極限或裕度,通過(guò)改進(jìn)設(shè)計(jì)和工藝來(lái)提高產(chǎn)品的可靠性而不是測(cè)量產(chǎn)品的可靠性指標(biāo)。因此,可認(rèn)為這些概念在許多語(yǔ)境下是通用的。
HALT的基本理念是提升可靠性常用方法之一的“試驗(yàn)-分析-改進(jìn)(TAAF)循環(huán)”,因此,HALT技術(shù)的內(nèi)容或范疇,不僅包括對(duì)受試品進(jìn)行試驗(yàn)的過(guò)程,還包括分析和改進(jìn),不斷地循環(huán)迭代,直到把產(chǎn)品可靠性提高到可以接受的水平為止的全過(guò)程。
具體包括以下3個(gè)方面的動(dòng)機(jī)。
1.2.1 發(fā)現(xiàn)設(shè)計(jì)缺陷或故障模式
制約可靠性水平的是產(chǎn)品存在缺陷或設(shè)計(jì)方面的薄弱環(huán)節(jié)。這些問(wèn)題用常規(guī)檢測(cè)或監(jiān)測(cè)手段難以發(fā)現(xiàn),但當(dāng)產(chǎn)品在使用中長(zhǎng)期暴露在應(yīng)力環(huán)境下時(shí),隨著損傷的累積可能造成故障。HALT通過(guò)施加逐漸增大的應(yīng)力將薄弱環(huán)節(jié)激發(fā)為明顯的缺陷,表現(xiàn)為可檢測(cè)故障,從而使薄弱環(huán)節(jié)得到改進(jìn)。在TAAF循環(huán)中,故障或者缺陷是受歡迎的,因?yàn)樗鼈優(yōu)楦倪M(jìn)提供了契機(jī)。
1.2.2 獲得應(yīng)力極限值或裕度
產(chǎn)品在壽命周期貯存、運(yùn)輸、使用和維護(hù)等各種狀態(tài)下,受到環(huán)境和業(yè)務(wù)負(fù)載各種應(yīng)力的作用。對(duì)于每一種應(yīng)力,產(chǎn)品實(shí)際具有的能力即強(qiáng)度會(huì)隨著應(yīng)力的積累作用而遞減。當(dāng)產(chǎn)品具有的強(qiáng)度低于實(shí)際暴露的應(yīng)力時(shí),就會(huì)發(fā)生故障。因此強(qiáng)度與應(yīng)力之間的關(guān)系,決定著產(chǎn)品的可靠性。
通過(guò)HALT可測(cè)得產(chǎn)品面對(duì)各種應(yīng)力的工作極限和破壞極限,與規(guī)范極限的差值被稱為設(shè)計(jì)裕度,可用于以下情形。
a)為是否繼續(xù)對(duì)產(chǎn)品進(jìn)行改進(jìn)提供決策依據(jù),設(shè)計(jì)裕度越大,則應(yīng)力超出產(chǎn)品強(qiáng)度的概率就越小,產(chǎn)品的可靠性就越高;但是,設(shè)計(jì)裕度越大,意味著成本或其他開(kāi)銷(如電路復(fù)雜性)增大,需權(quán)衡決策。
b)在生產(chǎn)階段,可據(jù)此合理地提高應(yīng)力施加水平從而提高環(huán)境應(yīng)力篩選的效率和有效性。傳統(tǒng)的環(huán)境應(yīng)力篩選(ESS)[20]所施加的環(huán)境應(yīng)力不能超出產(chǎn)品規(guī)范的規(guī)定范圍,在很短的試驗(yàn)周期內(nèi),難以有效地剔除存在瑕疵的產(chǎn)品,高可靠產(chǎn)品尤為如此。利用HALT得到的裕度,可用高加速應(yīng)力篩選(HASS)[3,21]代替ESS,將應(yīng)力量值提高到既能有效地激發(fā)潛在的缺陷而又不會(huì)對(duì)產(chǎn)品造成損壞的恰當(dāng)水平,改進(jìn)生產(chǎn)批產(chǎn)品可靠性。
1.2.3 顯著地縮短可靠性試驗(yàn)時(shí)間
基于失效物理的加速損傷理論,提高施加應(yīng)力的水平,可在短時(shí)間內(nèi)產(chǎn)生與現(xiàn)場(chǎng)使用等效的損傷效果,此即為加速試驗(yàn)。通過(guò)施加遠(yuǎn)高于現(xiàn)場(chǎng)應(yīng)力水平,HALT可將試驗(yàn)周期從傳統(tǒng)可靠性試驗(yàn)的幾個(gè)月,加速壽命試驗(yàn)(ALT)[22]的幾十天,縮短到幾天的時(shí)間,從而使得TAAF循環(huán)可以快速地迭代。試驗(yàn)時(shí)間大幅縮短是這項(xiàng)技術(shù)的根本優(yōu)勢(shì)。
順便指出,無(wú)論以故障模式還是以設(shè)計(jì)裕度為關(guān)注中心,本質(zhì)上是相同的。當(dāng)應(yīng)力達(dá)到某個(gè)量值時(shí)會(huì)觸發(fā)一種或多種故障模式,則此時(shí)的應(yīng)力量值就是應(yīng)力極限。因此,提高極限的方法,或者采取措施將該故障模式排除;或者退而求其次,延緩該故障模式的發(fā)生。
另外,可以從浴盆曲線看HALT對(duì)于產(chǎn)品可靠性的作用。如圖1所示,故障率浴盆曲線可以分為3段:早期故障、外部誘發(fā)故障和損耗故障。首先,HALT提高了設(shè)計(jì)裕度,因而外部應(yīng)力超出產(chǎn)品強(qiáng)度的可能性減小,降低外部誘發(fā)故障率。其次,由于HALT在產(chǎn)品研發(fā)階段識(shí)別那些損耗故障發(fā)生較早的設(shè)計(jì)、元器件、材料和工藝并予以改進(jìn),推遲產(chǎn)品損耗故障階段的到來(lái)直至將其推出產(chǎn)品的有效壽命周期之外,即推遲損耗故障段的到來(lái)。關(guān)于早期故障段,主要是通過(guò)批量生產(chǎn)時(shí)進(jìn)行HASS以有效地剔除潛在的缺陷,顯著地降低故障率并縮短早期故障階段的時(shí)間跨度。HALT將為HASS提供必不可少的極限數(shù)據(jù),發(fā)揮間接作用。
圖1 HALT對(duì)降低故障率的作用
主要在以下幾個(gè)時(shí)機(jī)進(jìn)行HALT。
a)HALT最主要的應(yīng)用場(chǎng)合為產(chǎn)品研發(fā)早期的可靠性研制試驗(yàn)(RDT:Reliability Development Test)。RDT的目的是,通過(guò)對(duì)產(chǎn)品(或產(chǎn)品組成部分)施加適當(dāng)?shù)沫h(huán)境應(yīng)力、工作載荷,尋找設(shè)計(jì)缺陷,以改進(jìn)設(shè)計(jì)來(lái)提高產(chǎn)品的固有可靠性水平[1]。
b)在批生產(chǎn)階段進(jìn)行HASS試驗(yàn)之前,進(jìn)行HALT,評(píng)價(jià)設(shè)計(jì)和工藝改進(jìn)等技術(shù)狀態(tài)的更改是否導(dǎo)致了應(yīng)力極限值的變化,為開(kāi)展HASS提供應(yīng)力參數(shù)選擇依據(jù)。
c)其他場(chǎng)合,例如:產(chǎn)品故障排查時(shí)復(fù)現(xiàn)故障或者改進(jìn)后驗(yàn)證措施的有效性所需的時(shí)間特別長(zhǎng),可考慮采用HALT。
關(guān)于HALT是否適用于可靠性增長(zhǎng)試驗(yàn)(RGT:Reliability Growth Test)需要討論。我們發(fā)現(xiàn)不同的文獻(xiàn)中有關(guān)概念存在差異。按照GJB 450A,RGT與RDT雖然都是暴露薄弱環(huán)節(jié)加以改進(jìn),但二者存在根本不同:1)在激發(fā)故障的手段方面,RGT強(qiáng)調(diào)“施加模擬實(shí)際環(huán)境的綜合環(huán)境應(yīng)力及工作應(yīng)力”;2)在試驗(yàn)?zāi)繕?biāo)方面,RGT強(qiáng)調(diào)“使產(chǎn)品的可靠性達(dá)到規(guī)定要求[1]”。HALT不滿足這些要求,因此不適用于RGT。
按照另外一些可靠性試驗(yàn)分類方法,例如:GB/T 2900.99(等同采用IEC 60050-192),不單獨(dú)定義RDT,而將RGT定義為“通過(guò)試驗(yàn)直至失效、失效分析、執(zhí)行糾正措施和進(jìn)一步試驗(yàn),以提高可靠性的迭代過(guò)程”[23],覆蓋了GJB 450A的RDT和RGT兩個(gè)概念范疇。在此語(yǔ)境下,HALT適用于RGT。
HALT屬于室內(nèi)試驗(yàn),關(guān)于測(cè)試實(shí)驗(yàn)室,需注意以下幾個(gè)方面。
a)最好選擇研制單位內(nèi)部或當(dāng)?shù)亻L(zhǎng)期合作的可靠性實(shí)驗(yàn)室。這是因?yàn)?,一方面HALT具有不確定性,試驗(yàn)前難以確定TAAF迭代次數(shù)和排查故障所需的時(shí)間;另一方面對(duì)于HALT發(fā)現(xiàn)的故障進(jìn)行分析和改進(jìn)時(shí),通常不得不借助產(chǎn)品研發(fā)調(diào)試環(huán)境。
b)實(shí)驗(yàn)室應(yīng)具有施加所需環(huán)境應(yīng)力和業(yè)務(wù)應(yīng)力的能力。有研究表明[24-25],在沒(méi)有專門(mén)的HALT設(shè)施的情況下,用傳統(tǒng)的環(huán)境試驗(yàn)設(shè)施也可實(shí)施HALT中的低溫步進(jìn)、高溫步進(jìn)、溫度循環(huán)和振動(dòng)步進(jìn)試驗(yàn)項(xiàng)目,無(wú)法進(jìn)行溫度循環(huán)與振動(dòng)綜合試驗(yàn),與完整的HALT相比,大約只損失20%的發(fā)現(xiàn)故障機(jī)會(huì)。但是,對(duì)于高可靠產(chǎn)品,為了充分地發(fā)現(xiàn)薄弱環(huán)節(jié),一般認(rèn)為具有專門(mén)的HALT/HASS試驗(yàn)箱,是開(kāi)展HALT的必要條件。
c)具有面向具體產(chǎn)品的測(cè)試環(huán)境。一般情況下,對(duì)受試品進(jìn)行功能性能測(cè)試,需要有輸入信號(hào)作為激勵(lì),測(cè)量相應(yīng)的輸出信號(hào),持續(xù)地監(jiān)視受試品的運(yùn)行狀態(tài)或性能指標(biāo),與預(yù)期結(jié)果進(jìn)行比較從而判定受試品是否出現(xiàn)故障。
需要指出的是,測(cè)試環(huán)境的構(gòu)建往往成為工程實(shí)踐中的難點(diǎn),也是影響HALT效果的關(guān)鍵點(diǎn)。具體分析如下所述。
a)HALT的受試品主要是產(chǎn)品中的模塊、組件和板卡等,通常與其余部分交互密切(如時(shí)鐘、控制和數(shù)據(jù)等多種信號(hào)的輸入輸出),因此測(cè)試環(huán)境較為復(fù)雜。與常溫下調(diào)試所需的環(huán)境不同,HALT時(shí)受試品和測(cè)試環(huán)境通常分處試驗(yàn)箱內(nèi)外,受信號(hào)時(shí)序、信號(hào)驅(qū)動(dòng)能力和抗干擾等諸多因素的限制,構(gòu)建甚至專門(mén)開(kāi)發(fā)測(cè)試環(huán)境的難度大、工作量大。
b)如果在開(kāi)發(fā)測(cè)試環(huán)境時(shí)對(duì)信號(hào)及其邏輯關(guān)系、時(shí)序關(guān)系等過(guò)度簡(jiǎn)化,將不能充分地模擬受試品的實(shí)際工作場(chǎng)景,導(dǎo)致受試品的許多物理或邏輯組成部分在試驗(yàn)中未得到充分的、有效的測(cè)試。另外,故障發(fā)生后若測(cè)試環(huán)境不能及時(shí)地檢測(cè)和隔離故障,可能造成某些瞬態(tài)故障、間歇故障被遺漏,或者等到故障影響擴(kuò)大甚至誘發(fā)其他故障而被檢測(cè)到時(shí),則將加大故障根因分析的難度。不僅如此,由于HALT采用步進(jìn)應(yīng)力方式,故障檢測(cè)的滯后將造成測(cè)得的應(yīng)力極限值偏高,對(duì)于是否采取改進(jìn)措施的決策,以及HASS的應(yīng)力量值的選取都會(huì)造成誤導(dǎo)。
c)在研發(fā)階段的早期,可能出現(xiàn)某種板卡具備試驗(yàn)條件后,其余部分尚未具備條件無(wú)法構(gòu)成測(cè)試環(huán)境的情況,導(dǎo)致試驗(yàn)不能及時(shí)地開(kāi)展。
HALT的性質(zhì)決定了需要參加試驗(yàn)的人員及其職責(zé),如下所述。
a)作為研制試驗(yàn),通常由研制方自行開(kāi)展,產(chǎn)品訂購(gòu)方不需加以控制,即HALT的主體是產(chǎn)品研制方。研制方不應(yīng)認(rèn)為只有在訂購(gòu)方有要求時(shí)才進(jìn)行HALT,而應(yīng)積極地尋求使用該技術(shù)盡早地發(fā)現(xiàn)設(shè)計(jì)薄弱環(huán)節(jié)的機(jī)會(huì)。對(duì)于復(fù)雜系統(tǒng)產(chǎn)品,為降低后續(xù)各個(gè)階段的風(fēng)險(xiǎn),訂購(gòu)方或總體單位應(yīng)引導(dǎo)各個(gè)具體的研制方開(kāi)展HALT。
b)需要組織一個(gè)由產(chǎn)品研發(fā)、試驗(yàn)、質(zhì)量、工藝和技術(shù)等人員組成的試驗(yàn)團(tuán)隊(duì),而不是像其他試驗(yàn)?zāi)菢咏挥稍囼?yàn)人員完成即可。
團(tuán)隊(duì)中研發(fā)人員起主導(dǎo)作用,負(fù)責(zé)確認(rèn)產(chǎn)品技術(shù)狀態(tài),分析需施加的應(yīng)力類型,構(gòu)建測(cè)試環(huán)境,對(duì)于試驗(yàn)中得到的裕度或故障進(jìn)行分析決策,必要時(shí)組織改進(jìn)。試驗(yàn)人員利用長(zhǎng)期積累的經(jīng)驗(yàn),對(duì)試驗(yàn)參數(shù)的選取和故障模式分析提出建議。質(zhì)量、工藝和技術(shù)專家等,提供咨詢和技術(shù)支持。
故障分析需要從故障現(xiàn)象中推理出故障根因和機(jī)理,確定處置措施,因此需要利用所積累的數(shù)據(jù)和經(jīng)驗(yàn),難度大。進(jìn)一步地,由于HALT激發(fā)的故障并不一定都是預(yù)期在現(xiàn)場(chǎng)將會(huì)出現(xiàn)的關(guān)聯(lián)故障,也可能伴隨有非關(guān)聯(lián)故障,只有通過(guò)分析才能區(qū)分。但是,有的相關(guān)方在沒(méi)有確定為關(guān)聯(lián)故障之前,認(rèn)為故障不是自己產(chǎn)品或技術(shù)造成的,因而不愿意配合分析,這將進(jìn)一步地加大故障分析的難度。如果不能及時(shí)地分析處置,不僅無(wú)法實(shí)現(xiàn)TAAF循環(huán),還可能導(dǎo)致試驗(yàn)停滯。因此,故障分析與處置是HALT的一項(xiàng)關(guān)鍵技術(shù)。
HALT本質(zhì)上是一個(gè)TAAF循環(huán)迭代過(guò)程,如圖2所示,從頂層視角給出了其流程。
圖2 HALT的試驗(yàn)、分析、改進(jìn)流程圖
a)試驗(yàn)需求的確定和應(yīng)力選擇
根據(jù)需要來(lái)確定對(duì)哪些產(chǎn)品或組成部分進(jìn)行試驗(yàn),分析選擇施加的應(yīng)力類型,估計(jì)基本極限。
b)試驗(yàn)準(zhǔn)備
準(zhǔn)備受試品、測(cè)試環(huán)境、判決準(zhǔn)則、試驗(yàn)裝置和夾具等。
c)HALT的實(shí)施及應(yīng)力極限的測(cè)定
受篇幅所限,見(jiàn)相關(guān)標(biāo)準(zhǔn)或文獻(xiàn)[11-12]。
d)故障分析及處置
進(jìn)行故障模式分析,確定并實(shí)施改進(jìn)措施,提高產(chǎn)品裕度。故障發(fā)生后,若經(jīng)分析做出不再改進(jìn)的決策,若試驗(yàn)尚未全部完成,則應(yīng)對(duì)發(fā)生故障的受試品采取臨時(shí)修理或替換措施,保障后續(xù)試驗(yàn)的進(jìn)行。
眾所周知,在產(chǎn)品壽命期內(nèi),錯(cuò)誤或缺陷發(fā)現(xiàn)得越早,造成的損失就越小。特別是對(duì)于復(fù)雜或者重要用途的產(chǎn)品,可靠性的提高將降低運(yùn)行維護(hù)和保障費(fèi)用,還可以改善用戶體驗(yàn)甚至避免造成嚴(yán)重的后果。HALT能夠在研發(fā)階段的早期,針對(duì)較低裝配層級(jí)產(chǎn)品(如模塊、板卡等),在很短的試驗(yàn)周期內(nèi),發(fā)現(xiàn)產(chǎn)品設(shè)計(jì)和工藝設(shè)計(jì)存在的薄弱環(huán)節(jié),及時(shí)地組織改進(jìn),成本可控,經(jīng)濟(jì)效益顯著。對(duì)于研制周期短、樣機(jī)數(shù)量少和可靠性要求高的新產(chǎn)品研制,HALT作用尤為明顯。
在此討論以下幾個(gè)問(wèn)題。.
施加應(yīng)力的目的在于激發(fā)潛在的缺陷,因此,選擇什么應(yīng)力應(yīng)以激發(fā)缺陷的能力來(lái)衡量。應(yīng)力,既包括環(huán)境應(yīng)力,也包括業(yè)務(wù)載荷應(yīng)力,以及電應(yīng)力等。正如Hobbs博士所指出的那樣,“用于HALT和HASS的應(yīng)力,包括但不限于全軸向同時(shí)施加的振動(dòng),高速率、寬范圍的溫度循環(huán),通電循環(huán),電壓和頻率變化,濕度,以及可以暴露設(shè)計(jì)和工藝問(wèn)題的其他任何應(yīng)力[3]?!敝劣趹?yīng)力類型的具體選擇方法,可結(jié)合受試品的風(fēng)險(xiǎn)分析以及FMEA/FMECA[26-27]來(lái)識(shí)別敏感點(diǎn),列出可能的應(yīng)力,以矩陣形式分析各種應(yīng)力對(duì)各個(gè)敏感點(diǎn)的激發(fā)能力,選出具有“高激發(fā)率”的應(yīng)力,經(jīng)適當(dāng)歸納合并后最終確定需施加的應(yīng)力。
之所以會(huì)出現(xiàn)HALT施加的一定是環(huán)境應(yīng)力的誤區(qū),可能有兩個(gè)方面的原因:1)環(huán)境應(yīng)力適用于絕大多數(shù)產(chǎn)品特別是電子產(chǎn)品、機(jī)電產(chǎn)品,而其他應(yīng)力往往只適用于特定的敏感點(diǎn),通用性不強(qiáng),因此,在介紹HALT時(shí),往往只提及環(huán)境應(yīng)力;2)在引入HALT技術(shù)時(shí),有些文獻(xiàn)將“stress environment”譯為“環(huán)境應(yīng)力”,容易對(duì)讀者造成誤導(dǎo)。根據(jù)上下文分析,其本義是指產(chǎn)品面臨的各種應(yīng)力環(huán)境,而不是單指氣候、力學(xué)等狹義的環(huán)境應(yīng)力。
HALT采用步進(jìn)方式逐步地增大應(yīng)力量值,可按以下方式來(lái)確定試驗(yàn)應(yīng)該繼續(xù)還是停止。
a)若實(shí)測(cè)極限值低于規(guī)范的規(guī)定水平,說(shuō)明設(shè)計(jì)不滿足要求,必須改進(jìn)。
b)基于企業(yè)類似產(chǎn)品的典型值或經(jīng)驗(yàn)值,考慮產(chǎn)品設(shè)計(jì)及生產(chǎn)過(guò)程中各類參數(shù)的離散性對(duì)裕度統(tǒng)計(jì)特性的影響(如文獻(xiàn)[12]的附錄A),判定極限實(shí)測(cè)值是否可接受。
1)若不可接受,則須改進(jìn)并繼續(xù)試驗(yàn)。
2)若可接受,若技術(shù)可行并且成本、周期及其他約束條件允許,則仍應(yīng)繼續(xù)試驗(yàn),提高裕度;若已達(dá)到或接近元器件、原材料和工藝等的極限,只有從技術(shù)上進(jìn)行根本性更改才能提高裕度,則停止試驗(yàn)。
c)若已達(dá)到試驗(yàn)設(shè)施能力的極限,則停止試驗(yàn)。
在一些文獻(xiàn)中,HALT被簡(jiǎn)單化了,就是采用步進(jìn)方式逐步地提高應(yīng)力量值,要么激發(fā)而產(chǎn)生故障,交由研發(fā)人員進(jìn)行故障分析;要么到達(dá)基本極限或試驗(yàn)設(shè)施能力的極限為止。而許多企業(yè)或產(chǎn)品,由于缺乏支撐數(shù)據(jù)和經(jīng)驗(yàn)的積累,往往難以確定貼切的基本極限,僅以試驗(yàn)箱的能力極限作為終止條件。
實(shí)際上,HALT希望發(fā)現(xiàn)的是在規(guī)定的使用環(huán)境下長(zhǎng)期使用時(shí)預(yù)期會(huì)出現(xiàn)的故障模式,而不希望出現(xiàn)在現(xiàn)場(chǎng)條件下不會(huì)出現(xiàn)的故障模式。如果簡(jiǎn)單地增大施加的應(yīng)力量值,存在幾個(gè)方面的問(wèn)題。
a)產(chǎn)生大量的非關(guān)聯(lián)故障,增大故障模式分析與處置工作的難度和工作量,導(dǎo)致HALT總周期大幅度地延長(zhǎng)。
b)由于分析甄別關(guān)聯(lián)與非關(guān)聯(lián)故障的難度大,如果全部采取改進(jìn)措施的話,將會(huì)造成成本的增大,甚至帶來(lái)產(chǎn)品體積、重量和功耗的增大。
c)可能頻繁地造成受試品損壞,由于研發(fā)階段的樣品數(shù)量少,這將影響后續(xù)試驗(yàn)的進(jìn)行,甚至影響其他研制工作的開(kāi)展。
HALT雖然不能定量地評(píng)價(jià)但確實(shí)可以提高產(chǎn)品的可靠性指標(biāo)。為推動(dòng)其普及應(yīng)用,至少有以下工作迫切地需要開(kāi)展:1)使各個(gè)相關(guān)方了解該技術(shù)并消除認(rèn)識(shí)誤區(qū);2)研究和突破敏感應(yīng)力類型識(shí)別、試驗(yàn)參數(shù)選取、故障模式分析與處置等關(guān)鍵技術(shù),減少試驗(yàn)的盲目性,提高有效性;3)選擇典型產(chǎn)品來(lái)實(shí)際開(kāi)展HALT,并且長(zhǎng)期跟蹤產(chǎn)品后續(xù)階段的質(zhì)量表現(xiàn),對(duì)HALT的效果進(jìn)行評(píng)價(jià)并積累數(shù)據(jù);4)形成典型案例,吸引更多的研發(fā)團(tuán)隊(duì)把HALT作為其提高可靠性水平的得力工具。