国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

計算機系統(tǒng)容錯技術(shù)研究

2016-03-07 14:35:00彭嘉輝
無線互聯(lián)科技 2015年7期
關(guān)鍵詞:冗余硬件軟件

彭嘉輝

摘要:在現(xiàn)代計算機快速發(fā)展并且對人們的工作和生活影響越來越大的前提下,人們對于計算機系統(tǒng)容錯的需求就越來越強烈,要求計算機系統(tǒng)有良好的容錯性能,進而保障計算機系統(tǒng)的正常運行。因此,需要對計算機系統(tǒng)軟硬件的容錯方法進行分析,進而探索出幾種較為實用的計算機容錯系統(tǒng)的體系結(jié)構(gòu),希望能夠促進計算機系統(tǒng)容錯性能的大幅提升。

關(guān)鍵詞:計算機容錯系統(tǒng);容錯技術(shù);硬件;軟件;冗余

計算機容錯系統(tǒng)是由若干臺計算機按照一定的容錯原則通過資源冗余,配置構(gòu)成冗余結(jié)構(gòu)的計算機系統(tǒng),當系統(tǒng)出現(xiàn)一定的運行性故障時,能夠依賴系統(tǒng)內(nèi)駐的容錯能力保證系統(tǒng)連續(xù)正確地執(zhí)行其程序并輸出正確的結(jié)果。對于計算機系統(tǒng)來講,其軟硬件都有著不同的容錯方法,因此,我們需要對軟硬件的容錯方法進行分別的研究,進而促使計算機在實際的運行過程當中實現(xiàn)其軟硬件系統(tǒng)容錯性能的提高。

1硬件錯誤的容錯方法

計算機可能出現(xiàn)的硬件錯誤有永久性錯誤、間歇性錯誤和瞬態(tài)錯誤。永久性錯誤是指由于計算機硬件老化、電路元件短路等現(xiàn)象而產(chǎn)生的故障,一旦出現(xiàn)則影響系統(tǒng)原有功能,需通過更換元器件來恢復系統(tǒng)正常工作;瞬態(tài)錯誤的發(fā)生率是非常頻繁的,在所有系統(tǒng)錯誤中所占的比例也是最大的,對整個系統(tǒng)可靠性和安全性的影響也是最大的;間歇性錯誤介于以上兩種錯誤之間,針對系統(tǒng)的可靠性設(shè)定了一定的閾值,當瞬態(tài)錯誤的發(fā)生頻率超過該閾值時表現(xiàn)為間歇性錯誤。

計算機容錯系統(tǒng)為了更好地容錯性能,必須是冗余的。不同形式的冗余資源可分為不同的冗余方法,主要包括硬件冗余、信息冗余、時間冗余、線程冗余等集中冗余類型。

1.1硬件冗余

根據(jù)冗余程度的不同,硬件冗余還可分為部分冗余和完全冗余。完全冗余可分為冷備、溫備、熱備以及雙工這四種工作方式。以雙系統(tǒng)為例,可分為雙系統(tǒng)冷備、雙系統(tǒng)溫備、雙系統(tǒng)熱備和雙系統(tǒng)雙工。其中,在對故障導向?qū)崟r性和安全性要求較高的系統(tǒng)中首選方式是應用雙系統(tǒng)雙工,而其他三種方式可以應用在一般性系統(tǒng)中,即對故障診斷時間和切換時間沒有過高要求的情況。此外,三模、四模的冗余技術(shù)的應用也非常廣泛。

目前,基于動態(tài)可重構(gòu)現(xiàn)場可編程門陣列(FPGAs)在硬件冗余技術(shù)中是研究關(guān)注度較高的。這種方法可根據(jù)抽象層次分為2層:硬件層(DL)和配置層(CL)。

目前,學界在計算機系統(tǒng)容錯技術(shù)研究中,對硬件冗余方法的研究最多,花費也相對較大,但是其在提升計算機系統(tǒng)的可靠性和安全性方面的效果也非常良好,技術(shù)相對比較成熟,并在很多場合都已實踐運用。因此,我們在計算機系統(tǒng)容錯中,一般首選硬件冗余。

1.2信息冗余

信息冗余是指通過在原始數(shù)據(jù)中添加若干冗余位以實現(xiàn)故障檢測或故障恢復,這種容錯技術(shù)包括檢錯編碼和糾錯編碼。檢錯編碼可以檢測出錯誤,糾錯編碼可以檢測錯誤,也可以糾正錯誤。編碼技術(shù)通常應用于傳輸、儲存、處理信息環(huán)節(jié)中。比較典型的信息冗余技術(shù)有奇偶校驗碼、循環(huán)冗余校驗碼、海明碼及其擴展編碼方式等。

相對其他冗余方法,信息冗余技術(shù)的優(yōu)點有:速度快,對冗余信息的處理與原始數(shù)據(jù)在同一時間段內(nèi),無需額外占用時間成本,在數(shù)據(jù)處理時檢錯、糾錯并行完成,從而避免由于錯誤恢復操作引發(fā)的遲延;代價較小,僅需支付少許額外的編碼電路或字節(jié)和計算開銷,與其他硬件冗余相比開銷要小得多,因此,在實際進行計算機系統(tǒng)性能提升的過程中,可以根據(jù)實際的需要來選擇采用硬件冗余技術(shù)還是信息冗余技術(shù)。

常見的信息冗余技術(shù)有ABFT、RED-FECMechanism、check-sum EDAC。

1.3時間冗余

在對實時性要求不高,且沒有實施硬件冗余的系統(tǒng)中,可以采用時間冗余的方法來保證系統(tǒng)可靠性,實現(xiàn)容錯機制。在具體應用過程中,時間冗余技術(shù)體現(xiàn)為1種方式,分別為:Re-execution of the task on the Same Hardware(RSHW),指同一硬件基礎(chǔ)上的同一數(shù)據(jù)在不同的時間片內(nèi)執(zhí)行相同的指令集;利用表決電路和數(shù)據(jù)延遲單元,把這兩者結(jié)合處理后的數(shù)據(jù)根據(jù)延遲的多少拷貝出對應的版本,并傳送到表決器驚醒表決判斷,通過對比得出最佳結(jié)果。

時間冗余技術(shù)的關(guān)鍵點在延遲時間的大小,也就是說若延遲時間過小可能會導致表決器的輸入內(nèi)容出現(xiàn)錯誤,無法實現(xiàn)系統(tǒng)容錯;若延遲時間過大,會導致時間成本增大,那么容錯機制就是去了原本減小延遲的意義。因此,在時間冗余技術(shù)的應用中,一定要對系統(tǒng)的時間要求進行合理的判斷,進而設(shè)置合理的時間冗余,以實現(xiàn)計算機系統(tǒng)容錯性能的提高。

1.4硬件線程冗余

硬件線程冗余是指在多線程處理器中使用容錯手段實現(xiàn)線程級容錯,具體方法是在多線程系統(tǒng)中把主線程拷貝成多個同樣的線程并行處理數(shù)據(jù),然后通過比較處理結(jié)果來實現(xiàn)容錯。目前常見的線程冗余技術(shù)有基于CMP的容錯即芯片級冗余多線程、冗余多線程RMT、基于微線程的粗粒度超標量容錯MTB等。

目前在硬件多線程冗余中研究最多的是主副線程通信方式,通過對中間結(jié)果隊列的共享使線程的執(zhí)行速度加快,并實現(xiàn)容錯。線程冗余技術(shù)對硬件成本的要求不高,而且容錯效果好,時間開銷小,實時性較高,因此硬件線程冗余技術(shù)是一種高效可行的硬件容錯方法。

2軟件錯誤的容錯方法

關(guān)于計算機系統(tǒng)的可靠性的評價與分析,需將其軟件的可靠性因素考慮進去,但是對這方面的研究卻不太成熟,因此相比硬件容錯方法效率較低,導致在評估系統(tǒng)的可靠性是忽略軟件的失誤率。人為設(shè)計引發(fā)的軟件錯誤一直存在,在一定的輸入刺激下產(chǎn)生各種故障,尚無法用統(tǒng)一數(shù)學模型進行描述。軟件錯誤的容錯方法通常有恢復快方法、軟件多樣性方法、防衛(wèi)式程序設(shè)計方法。也可以通過改善軟件工程、計算機平臺環(huán)境和構(gòu)造異常處理模塊等方面來提高容錯水平。

計算機系統(tǒng)出現(xiàn)故障后恢復的策略通??煞譃榍跋蚧謴秃秃笙蚧謴汀G跋蚧謴褪侵甘瓜到y(tǒng)繼續(xù)向前運行,采取措施是系統(tǒng)連貫,彌補故障造成的不連貫,繼續(xù)計算;后向恢復是指將系統(tǒng)還原到之前的正確階段,再重新運行計算。

2.1N-version programming方法

N版本軟件容錯技術(shù)是將軟件的各個版本交由不一樣的開發(fā)團隊進行開發(fā),用不同的開發(fā)語言和方法,獨立的設(shè)計工具和環(huán)境,以減少不同版本之間出現(xiàn)相關(guān)錯誤的幾率。此時各個版本的軟件設(shè)計開發(fā)不能違背以下幾個原則:總體設(shè)計目標要一致,避免錯誤恢復;各個模塊之間要有統(tǒng)一的標準接口;軟件設(shè)計過程中模塊內(nèi)部對外透明,要進行封裝;各個版本的軟件開發(fā)必須獨立。

2.2恢復塊方法

恢復塊方法的具體過程是配置有主塊和后備塊,其功能是相同的,首先是主塊開始運行,計算結(jié)果,若出現(xiàn)故障,則運行一后備塊,再計算結(jié)果進行測試,未通過則再運行一后備塊,直到測試通過,若測試—直未通過,則說明產(chǎn)生了不可恢復的故障。在設(shè)計開發(fā)過程中應盡量保證主塊與各后備塊之間的獨立性,以降低它們之間的錯誤的相關(guān)性。此外,測試計算結(jié)果的程序有著至關(guān)重要的地位,必須毫無錯誤。

2.3防衛(wèi)式程序設(shè)計方法

防衛(wèi)式程序設(shè)計方法是一種保守的容錯機制,它不利用任何傳統(tǒng)的容錯方法就能實現(xiàn)系統(tǒng)容錯。它的具體過程是這樣的:若程序在運行過程中出現(xiàn)錯誤,就會調(diào)用程序自帶的檢測代碼和恢復代碼進行處理,將系統(tǒng)返回到上一個正確的狀態(tài),如此,就實現(xiàn)了對程序中出現(xiàn)的錯誤的檢測,錯誤類型以及影響范圍的估計,并且最終實現(xiàn)錯誤恢復。

3結(jié)語

隨著極端及系統(tǒng)的規(guī)模不斷擴大,越來越多的應用部署在計算機系統(tǒng)中,對系統(tǒng)可靠性的要求也越來越高,因此需要更加完善的容錯技術(shù)來保障系統(tǒng)的可靠性和安全性。目前的硬件冗余容錯方法成本較高,耗能較多,物理空間占用較大;信息冗余容錯方法中針對瞬態(tài)錯誤的容錯技術(shù)還有待深入研究;時間冗余容錯方法不僅使延遲增大,對永久性錯誤沒有好的容錯機制;并行線程冗余容錯方法在合理分配線程資源方面沒有完善的解決方案;軟件冗余技術(shù)相對硬件更加落后;恢復塊方法中必須保證測試程序的準確性;防衛(wèi)式程序設(shè)計方法尚缺乏完整的理論依據(jù)。因此無論哪種容錯技術(shù),雖然已經(jīng)取得了很多研究成果,但是還有不足,仍有許多問題值得進一步探索。

猜你喜歡
冗余硬件軟件
禪宗軟件
英語文摘(2021年10期)2021-11-22 08:02:26
軟件對對碰
云計算平臺的計算機硬件遠程實驗室實現(xiàn)研究
二胡演奏的“硬件”和“軟件”
淺談Windows XP優(yōu)化設(shè)置
單機容錯與雙機熱備份技術(shù)淺析
核電站核島電氣隔離準則研究
科技視界(2016年23期)2016-11-04 13:13:20
并行硬件簡介
數(shù)據(jù)中心供配電系統(tǒng)設(shè)計要點簡析
淺敘國產(chǎn)存儲技術(shù)之發(fā)展
虞城县| 新兴县| 马公市| 长阳| 鹤山市| 兴隆县| 远安县| 长治市| 赤壁市| 巴青县| 交口县| 浦县| 衡阳市| 永昌县| 阜城县| 仙居县| 临潭县| 东平县| 胶南市| 桂东县| 广宁县| 蒙城县| 扎兰屯市| 建湖县| 林甸县| 镶黄旗| 定边县| 松潘县| 黄梅县| 和顺县| 巴塘县| 湖州市| 华亭县| 日照市| 蓝田县| 襄垣县| 随州市| 盐边县| 合阳县| 泽普县| 延川县|