国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高性能計(jì)算機(jī)可靠性現(xiàn)狀與發(fā)展趨勢(shì)研究

2016-12-31 10:17黃鑫
中國(guó)管理信息化 2016年3期
關(guān)鍵詞:發(fā)展趨勢(shì)可靠性

黃鑫

(福建師范大學(xué)協(xié)和學(xué)院 管理系,福州 350000)

?

高性能計(jì)算機(jī)可靠性現(xiàn)狀與發(fā)展趨勢(shì)研究

黃鑫

(福建師范大學(xué)協(xié)和學(xué)院管理系,福州350000)

[摘要]隨著我國(guó)高性能計(jì)算機(jī)系統(tǒng)性能的不斷提升,如何更好的保障高性能計(jì)算機(jī)系統(tǒng)運(yùn)行的精確性成為當(dāng)前研究的重要問題,尤其體現(xiàn)在現(xiàn)行計(jì)算機(jī)研制過程中。為此,研究探討高性能計(jì)算機(jī)可靠性現(xiàn)狀與發(fā)展趨勢(shì)相關(guān)問題,首先從高性能計(jì)算機(jī)可靠性現(xiàn)狀分析出發(fā),包括避錯(cuò)技術(shù)、靜態(tài)冗余、動(dòng)態(tài)冗余以及在線替換,然后對(duì)高性能計(jì)算機(jī)未來發(fā)展趨勢(shì)從多核處理器的可靠性設(shè)計(jì)、增強(qiáng)的全方位內(nèi)存防護(hù)技術(shù)以及刀片式架構(gòu)的發(fā)展三個(gè)方面進(jìn)行了深入的分析。其寫作的主要目的在于為今后高性能計(jì)算機(jī)更好的發(fā)展奠定一個(gè)具有參考價(jià)值的文獻(xiàn)基礎(chǔ)。

[關(guān)鍵詞]高性能計(jì)算機(jī);可靠性;發(fā)展趨勢(shì)

1 高性能計(jì)算機(jī)可靠性現(xiàn)狀分析

1.1避錯(cuò)技術(shù)

避錯(cuò)技術(shù)是指通過正確的設(shè)計(jì)及人為質(zhì)量控制的方式最大程度上避免系統(tǒng)性故障和減輕計(jì)算機(jī)系統(tǒng)器件失效的問題。其中,計(jì)算機(jī)系統(tǒng)器件主要和計(jì)算機(jī)質(zhì)量等級(jí)、使用的周邊環(huán)境及溫度、電路規(guī)模、封裝復(fù)雜度等等因素有著密切的聯(lián)系[1]。通過實(shí)踐經(jīng)驗(yàn)及查閱相關(guān)的文獻(xiàn)發(fā)現(xiàn),避錯(cuò)技術(shù)主要可以通過耐環(huán)境設(shè)計(jì)、熱設(shè)計(jì)、降額設(shè)計(jì)、元器件控制等等方面實(shí)現(xiàn)。另外,需要特別注意的是,高性能計(jì)算機(jī)的可靠性設(shè)計(jì)需要盡可能的選取一些可靠的器件,例如高集成度的器件,并減少器件的數(shù)量[2]。

1.2靜態(tài)冗余

靜態(tài)冗余也稱為故障屏蔽技術(shù),主要是在計(jì)算機(jī)系統(tǒng)故障的前提之下,通過硬件冗余以及信息冗余的方式在系統(tǒng)故障發(fā)揮效應(yīng)之前消除其不良影響。在當(dāng)前高性能計(jì)算機(jī)的可靠性設(shè)計(jì)中,故障屏蔽技術(shù)被廣泛的運(yùn)用其中。一般而言,靜態(tài)冗余主要包括了[3]部件冗余、數(shù)據(jù)通路冗余、信息冗余。其中,數(shù)據(jù)通路冗余在一定意義上也是一種部件冗余。信息冗余主要是通過在數(shù)據(jù)中附加冗余的信息,從而實(shí)現(xiàn)故障檢測(cè)的目的。

1.3動(dòng)態(tài)冗余

動(dòng)態(tài)冗余是一種采取標(biāo)準(zhǔn)模塊完成相關(guān)的配置工作,一旦檢測(cè)及診斷出故障發(fā)生的位置,計(jì)算機(jī)系統(tǒng)就可以很好的對(duì)其進(jìn)行重組或者是完成恢復(fù)工作,保障計(jì)算機(jī)正常的運(yùn)行。動(dòng)態(tài)冗余主要包括了故障檢測(cè)與診斷、重組技術(shù)、恢復(fù)技術(shù)。其中,故障檢測(cè)與診斷的作用是為了確保計(jì)算機(jī)系統(tǒng)是否存在故障,不但可以脫機(jī)運(yùn)行,也可以聯(lián)機(jī)運(yùn)行。聯(lián)機(jī)運(yùn)行檢測(cè)與診斷可以盡可能的提升計(jì)算機(jī)系統(tǒng)的可靠度,激活動(dòng)態(tài)冗余。重組技術(shù)作為動(dòng)態(tài)冗余的重要實(shí)現(xiàn)步驟,可以有效的防止計(jì)算機(jī)系統(tǒng)失效而產(chǎn)生的各種負(fù)面影響。例如,當(dāng)檢測(cè)出不可恢復(fù)性的系統(tǒng)故障時(shí),借助于系統(tǒng)備用的部件來代替故障的部件,就可以消除系統(tǒng)性故障導(dǎo)致計(jì)算機(jī)運(yùn)行中斷的問題。恢復(fù)技術(shù)主要解決瞬態(tài)故障,是檢測(cè)到瞬態(tài)可恢復(fù)故障時(shí),采用針對(duì)性的措施實(shí)現(xiàn)計(jì)算機(jī)系統(tǒng)運(yùn)行的重要環(huán)節(jié)。

2 未來發(fā)展趨勢(shì)分析

2.1多核處理器的可靠性設(shè)計(jì)

隨著計(jì)算機(jī)處理器集成度的提升、半導(dǎo)體硅尺寸逐漸縮小的進(jìn)程中,由于計(jì)算機(jī)處理器而產(chǎn)生的故障越來越多,大體上包括硬錯(cuò)和軟錯(cuò)兩個(gè)大的方面。另外,由于多核處理器具有多核間共享部件的問題,一個(gè)核的軟錯(cuò)誤往往會(huì)傳遞到其他核中,為此多核處理器的軟錯(cuò)誤更為嚴(yán)重。針對(duì)這種現(xiàn)象,迫切需要加強(qiáng)多核處理器的可靠性設(shè)計(jì),基本的方向包括雙核鎖步執(zhí)行、微回卷、冗余執(zhí)行、芯片級(jí)冗余多線程技術(shù)等等。另外,高性能計(jì)算機(jī)中多核處理器的運(yùn)用,在可靠性方面的挑戰(zhàn)與機(jī)遇是并存的,后期需要加強(qiáng)高性能計(jì)算機(jī)硬件容錯(cuò)技術(shù)的研發(fā)工作,保障高性能計(jì)算機(jī)系統(tǒng)正常的運(yùn)行。

2.2全方位增強(qiáng)內(nèi)存防護(hù)技術(shù)

就目前來看,內(nèi)存故障在高性能計(jì)算機(jī)系統(tǒng)故障中占據(jù)的比例較高,需要加強(qiáng)內(nèi)存方面的故障防護(hù)技術(shù)研發(fā)工作。針對(duì)內(nèi)存的軟錯(cuò)及硬錯(cuò),可以綜合參考各種存儲(chǔ)器容錯(cuò)技術(shù)來提升內(nèi)存的可靠性,例如通過加固存儲(chǔ)器的連接來實(shí)現(xiàn)電氣和機(jī)械的可靠性。此外,部分高性能計(jì)算機(jī)設(shè)計(jì)的過程中,還可以借助于內(nèi)存清洗、內(nèi)存?zhèn)浼约皟?nèi)存鏡像等等方式完成處理器的可靠性設(shè)計(jì)技術(shù)。

2.3刀片式架構(gòu)的發(fā)展

刀片式服務(wù)器泛指在標(biāo)準(zhǔn)高度的架勢(shì)機(jī)箱內(nèi)插裝多個(gè)卡式的服務(wù)器單元板,是基于實(shí)現(xiàn)高可靠和高密度的高性能服務(wù)器。在刀片式架構(gòu)中,通常采用的是模塊化的冗余結(jié)構(gòu),實(shí)現(xiàn)風(fēng)扇、電源、網(wǎng)絡(luò)、背板等等關(guān)鍵性系統(tǒng)部件的冗余,進(jìn)而消除單點(diǎn)故障,保障高性能計(jì)算機(jī)系統(tǒng)的正常運(yùn)行。

3 結(jié)語

隨著我國(guó)高性能計(jì)算機(jī)系統(tǒng)性能的不斷提升,如何更好的保障高性能計(jì)算機(jī)系統(tǒng)精確的運(yùn)行成為了當(dāng)前研究的重要問題,尤其體現(xiàn)在現(xiàn)行計(jì)算機(jī)研制過程中。一旦發(fā)生故障而使系統(tǒng)無法工作,將會(huì)造成重大經(jīng)濟(jì)或軍事?lián)p失。為此,本文研究探討高性能計(jì)算機(jī)可靠性現(xiàn)狀與發(fā)展趨勢(shì)相關(guān)問題,首先從高性能計(jì)算機(jī)可靠性現(xiàn)狀分析出發(fā),然后對(duì)高性能計(jì)算機(jī)未來發(fā)展趨勢(shì)進(jìn)行了深入的分析。其寫作的主要目的在于為今后高性能計(jì)算機(jī)更好的發(fā)展奠定一個(gè)具有參考價(jià)值的文獻(xiàn)基礎(chǔ)。

主要參考文獻(xiàn)

[1]王俊超,彭濤,馮光柳.曙光高性能計(jì)算機(jī)在數(shù)值預(yù)報(bào)模式中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2014(10):178-181.

[2]梁瑞虹.探討高性能計(jì)算機(jī)的可靠性技術(shù)與發(fā)展趨勢(shì)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(10):187-189.

[3]張軍華,臧勝濤,單聯(lián)瑜,等.高性能計(jì)算的發(fā)展現(xiàn)狀及趨勢(shì)[J].石油地球物理勘探,2010(6):918-925.

doi:10.3969/j.issn.1673 - 0194.2016.03.102

[中圖分類號(hào)]TP302

[文獻(xiàn)標(biāo)識(shí)碼]A

[文章編號(hào)]1673-0194(2016)03-0193-01

[收稿日期]2015-11-16

猜你喜歡
發(fā)展趨勢(shì)可靠性
MAXIMO系統(tǒng)在數(shù)控設(shè)備可靠性維護(hù)中的應(yīng)用
可靠性管理體系創(chuàng)建與實(shí)踐
電子制作(2017年2期)2017-05-17
分析我國(guó)品牌營(yíng)銷的管理及發(fā)展問題
基于可靠性跟蹤的薄弱環(huán)節(jié)辨識(shí)方法在省級(jí)電網(wǎng)可靠性改善中的應(yīng)用研究
“數(shù)控機(jī)床可靠性技術(shù)”專題(十六) 可靠性管理體系
可靠性比一次采購(gòu)成本更重要