陸偉宙 蔡向峰 王 暉
廣東省電信規(guī)劃設(shè)計(jì)院有限公司 廣州 510630
近年來,云計(jì)算一直是商業(yè)和科研機(jī)構(gòu)關(guān)注的熱點(diǎn),同時(shí),也在IT界得到廣泛的應(yīng)用,云計(jì)算成為業(yè)務(wù)系統(tǒng)部署的主要方式之一。云計(jì)算通過虛擬化等技術(shù),構(gòu)建統(tǒng)一的資源池,屏蔽底層資源細(xì)節(jié),向用戶提供服務(wù),從而達(dá)到提高設(shè)備利用率、節(jié)能減排、快速部署業(yè)務(wù)等目的。由于云計(jì)算引入了虛擬化、多租戶等技術(shù),對(duì)底層的物理資源進(jìn)行了屏蔽,因此,無法采用傳統(tǒng)的可用性分析方法分析云計(jì)算系統(tǒng)的可用性,從而造成了云服務(wù)使用者的困惑,也給云服務(wù)的服務(wù)等級(jí)協(xié)議(Service-Level Agreement, SLA)制定帶來了困擾。本文對(duì)云計(jì)算系統(tǒng),主要是IaaS(Infrastructure as a Service,基礎(chǔ)設(shè)施即服務(wù))云計(jì)算系統(tǒng)進(jìn)行分析,探討其可用性的計(jì)算方法。
系統(tǒng)的可用性[1-3]是指假設(shè)系統(tǒng)在所需的外部資源都已提供的情況下,準(zhǔn)備好以一個(gè)狀態(tài)及時(shí)在給定時(shí)間段內(nèi)或給定時(shí)間間隔內(nèi)的任何時(shí)間段提供所需要的功能。在實(shí)際的環(huán)境中,往往使用正常使用時(shí)間和總運(yùn)行時(shí)間的比值來刻畫。即
而IT基礎(chǔ)設(shè)施庫(ITIL)[2]提出使用協(xié)議服務(wù)時(shí)間取代總運(yùn)行時(shí)間,強(qiáng)調(diào)系統(tǒng)可以停機(jī)進(jìn)行維護(hù),協(xié)議服務(wù)時(shí)間不包括計(jì)劃內(nèi)停機(jī)時(shí)間,停機(jī)時(shí)間僅包括故障停機(jī),因此,上面的公式可以改寫如下:
如果用平均故障間隔時(shí)間(Mean Time Before Fail,MTBF)和平均修復(fù)時(shí)間(Mean Time To Repair,MTTR)對(duì)可用性A進(jìn)行估算,則有公式(1):
一般而言,單個(gè)系統(tǒng)組件,例如物理服務(wù)器等的平均故障間隔時(shí)間可以通過現(xiàn)網(wǎng)測(cè)試、壓力測(cè)試等方式進(jìn)行評(píng)估,平均修復(fù)時(shí)間則可根據(jù)運(yùn)維能力進(jìn)行估算。整個(gè)系統(tǒng)的可用性與系統(tǒng)的構(gòu)成方式有關(guān),并不等于組件的可用性簡(jiǎn)單疊加。
服務(wù)可靠性與服務(wù)可用性在概念上有一定的重疊。廣義的服務(wù)可靠性包括了服務(wù)可用性,例如微軟對(duì)可靠性的定義是在成本效益方面,確保服務(wù)能力、服務(wù)可用性、服務(wù)連續(xù)性、數(shù)據(jù)完整性和保密性等復(fù)合業(yè)務(wù)需求[4]。而狹義的可靠性的定義是指一個(gè)項(xiàng)目在規(guī)定條件和時(shí)間內(nèi)完成規(guī)定功能的能力[2-3]。狹義的服務(wù)可靠性以最大可接受的服務(wù)時(shí)延內(nèi)得到成功響應(yīng)的數(shù)量與總請(qǐng)求數(shù)的比例進(jìn)行計(jì)算。例如一個(gè)Web系統(tǒng),由于服務(wù)器故障或者擁塞導(dǎo)致響應(yīng)時(shí)間大于可接受服務(wù)時(shí)延都會(huì)產(chǎn)生不成功的響應(yīng),都可以視作服務(wù)可靠性降低。當(dāng)多個(gè)服務(wù)器持續(xù)故障則可導(dǎo)致整個(gè)系統(tǒng)不可用。本文主要關(guān)注系統(tǒng)可用性。
常見的系統(tǒng)可用性評(píng)估方法可以分為基于組合的方法和基于狀態(tài)的方法兩大類[3-4]?;诮M合的方法是針對(duì)系統(tǒng)和組件之間的邏輯關(guān)系的一種分析方法,主要的方法有可靠性框圖法(Reliability Block Diagram,RBD)[1-2,5]、可靠圖法(Reliability Graph,RG)[1-2,5]和故障數(shù)樹分析(Fault Tree,F(xiàn)T)[1,5]等。可靠性框圖法[1-2,5]是典型的基于組合的方法,它利用串并聯(lián)的方式表示組件與系統(tǒng)的邏輯關(guān)系,串聯(lián)的組件中只要有一個(gè)組件失效系統(tǒng)就會(huì)發(fā)生故障,并聯(lián)組件中只要還有一個(gè)組件可以正常工作系統(tǒng)就正常,如圖1(a)、圖1(b)所示。
圖1 串聯(lián)結(jié)構(gòu)與并聯(lián)結(jié)構(gòu)
假設(shè)一個(gè)n組件的系統(tǒng)可用性為A,各組件的可用性為Ai,串聯(lián)結(jié)構(gòu)和并聯(lián)結(jié)構(gòu)的可用性可用公式(2)表示:
基于狀態(tài)的可用性評(píng)估方法[1-2,5]根據(jù)狀態(tài)與狀態(tài)之間的變化關(guān)系確定系統(tǒng)的可用性,一般利用隨機(jī)理論分析,主要方法包括基于Markov過程的方法[1-2]和基于Perti網(wǎng)的方法[1]。典型方法基于Markov過程的方法定義了狀態(tài)和狀態(tài)跳轉(zhuǎn)兩類要素,并使用這兩類要素描述系統(tǒng)所處的狀態(tài)和動(dòng)態(tài)行為。圖2顯示了一個(gè)三組件串聯(lián)的系統(tǒng)對(duì)應(yīng)的Markov模型,其中狀態(tài)0表示正常,狀態(tài)1表示異常,λ和μ分別表示組件的失效率和維修率,從圖中可以看出僅有狀態(tài)000是正常的狀態(tài),其余狀態(tài)系統(tǒng)都不可用?;贛arkov模型的可用性分析通過計(jì)算穩(wěn)態(tài)下正常狀態(tài)的概率,確定系統(tǒng)的可用性。基于Markov模型的可用性分析隱含假設(shè)是系統(tǒng)在每個(gè)狀態(tài)的時(shí)間都服從指數(shù)分布,而在實(shí)際器件或產(chǎn)品在它的正常生命期內(nèi)的可靠性函數(shù)是服從指數(shù)分布的,因此,基于Markov模型的可用性分析得到廣泛的應(yīng)用。近年來,Kwon和Chuob等人[6-7]在離散Markov模型基礎(chǔ)上,引入了得分值的概念,即對(duì)正常工作狀態(tài)賦值為1,異常工作狀態(tài)賦值為0,通過計(jì)算穩(wěn)態(tài)過程的對(duì)應(yīng)狀態(tài)分布概率,再計(jì)算總得分得到可用性。這類模型稱為Markov Reward Model,并已應(yīng)用到軟件可用性評(píng)估中。
圖2 三組件串聯(lián)系統(tǒng)對(duì)應(yīng)的Markov模型
基于組合的可用性分析方法相對(duì)簡(jiǎn)單,模型表達(dá)清晰易于理解,但其描述能力較弱,且需要組件彼此獨(dú)立;基于狀態(tài)的分析方法比較復(fù)雜,模型表達(dá)能力強(qiáng),沒有組件獨(dú)立的要求,但需要狀態(tài)持續(xù)時(shí)間服從指數(shù)分布。
云計(jì)算系統(tǒng)的架構(gòu)如圖3所示,通常包括管理節(jié)點(diǎn)、網(wǎng)絡(luò)資源、計(jì)算資源、存儲(chǔ)資源四個(gè)組件。其中,管理節(jié)點(diǎn)包括管理服務(wù)器,它對(duì)所有資源進(jìn)行統(tǒng)一的管理;網(wǎng)絡(luò)資源包括核心交換機(jī)、接入交換機(jī)、防火墻、負(fù)載均衡器等網(wǎng)絡(luò)設(shè)備;計(jì)算資源由多臺(tái)服務(wù)器組成,若干臺(tái)服務(wù)器構(gòu)成集群;存儲(chǔ)資源包括FC SAN存儲(chǔ)和IP SAN存儲(chǔ)等。由于云計(jì)算系統(tǒng)部署在機(jī)房物理環(huán)境中,電源、空調(diào)等機(jī)房基礎(chǔ)設(shè)施的故障會(huì)影響云計(jì)算系統(tǒng)的使用,因此,在考慮云計(jì)算系統(tǒng)可用性的時(shí)候除考慮上述四個(gè)組件的可用性外,還需要考慮機(jī)房基礎(chǔ)設(shè)施的可用性。
云計(jì)算系統(tǒng)由于引入了虛擬化層,虛擬化帶來資源調(diào)配的靈活性,提升了系統(tǒng)的可用性。在云管理平臺(tái)的調(diào)度下,云計(jì)算系統(tǒng)的一個(gè)組件失效后將被另一個(gè)組件迅速取代,對(duì)上層應(yīng)用完全透明。例如,VMware的高可用功能(High availability, HA)使得承載虛擬機(jī)的物理主機(jī)出現(xiàn)故障后在HA集群中的另一臺(tái)物理主機(jī)上重新啟動(dòng)對(duì)應(yīng)的虛擬機(jī),實(shí)際上提供了溫備的功能;容錯(cuò)功能(Fault Tolerance)使得虛擬機(jī)1:1熱備等。溫備、熱備等功能的大量使用使得可用性評(píng)估更為復(fù)雜,傳統(tǒng)的可用性評(píng)估方法需要進(jìn)行改進(jìn)才能用于云計(jì)算系統(tǒng)的可用性測(cè)算。
圖3 云計(jì)算系統(tǒng)典型架構(gòu)
近幾年,學(xué)術(shù)界和業(yè)界對(duì)云計(jì)算系統(tǒng)的可用性評(píng)估進(jìn)行探討,主要基于RBD和Markov Model并結(jié)合云計(jì)算特點(diǎn)進(jìn)行優(yōu)化。Bauer和Adams探討了云計(jì)算系統(tǒng)和服務(wù)可靠性和可用性的設(shè)計(jì)、計(jì)算、評(píng)估和優(yōu)化方法[2],認(rèn)為云計(jì)算系統(tǒng)的可用性和可靠性風(fēng)險(xiǎn)來自于云計(jì)算系統(tǒng)的基本特征,如按需自助服務(wù)、網(wǎng)絡(luò)接入、資源池化等;在可用性評(píng)估方面,采用RBD方法對(duì)端到端的云服務(wù)進(jìn)行了可用性評(píng)估。Wang[8]等人提出基于可用性和調(diào)度成本分析的資源調(diào)度方法,對(duì)虛擬機(jī)的可用性進(jìn)行評(píng)估,其方法主要是計(jì)算虛擬機(jī)所在的主機(jī)的可用性,并沒有分析整個(gè)云系統(tǒng)的可用性。Dantas、Matos等針對(duì)Eucalyptus云計(jì)算平臺(tái)進(jìn)行可用性分析[9],對(duì)Eucalyptus云計(jì)算平臺(tái)組件的不同組合方法進(jìn)行可用性分析,其方法主要基于RBD。Chuob、Pokharel等人[7]提出分層的模型,在集群層面和節(jié)點(diǎn)層面采用改進(jìn)的Markov模型對(duì)系統(tǒng)的可用性進(jìn)行分析。陳懷臨[10]在更高層面提出一種定量分析云計(jì)算系統(tǒng)可用性的方法,提出采用單獨(dú)可用性(Standalone Availability,SA)和部署可用性(Deployment Availability,DA)的概念分別表示構(gòu)成系統(tǒng)組件完全可用和非完全可用情況下系統(tǒng)的可用性,對(duì)不同層面的SA和DA的關(guān)系進(jìn)行了分析,并具體分析了不同承接關(guān)系下的IaaS、PaaS、SaaS系統(tǒng)的可用性計(jì)算方法。
從圖3可以看出,云計(jì)算系統(tǒng)邏輯架構(gòu)上可以分為管理節(jié)點(diǎn)、網(wǎng)絡(luò)資源、計(jì)算資源和存儲(chǔ)資源四大部分。由于這四大部分資源由不同的硬件構(gòu)成,如果單獨(dú)考慮機(jī)房基礎(chǔ)設(shè)施故障,可以認(rèn)為云計(jì)算系統(tǒng)四大部分彼此獨(dú)立。采用可靠性框圖法RBD對(duì)云計(jì)算系統(tǒng)進(jìn)行分解,如圖4所示。
圖4 云計(jì)算系統(tǒng)的RBD圖
云計(jì)算系統(tǒng)的可用性可以用公式(3)表示:
其中Acloud表示整個(gè)云計(jì)算系統(tǒng)的可用性,Ainfrastructure表示機(jī)房基礎(chǔ)環(huán)境的可用性,Amanagement表示云計(jì)算系統(tǒng)管理節(jié)點(diǎn)的可用性,Anetwork表示云計(jì)算系統(tǒng)網(wǎng)絡(luò)的可用性,Acompute表示云計(jì)算系統(tǒng)計(jì)算資源的可用性,Astorage表示云計(jì)算系統(tǒng)存儲(chǔ)資源的可用性。由于各個(gè)組件都能對(duì)整個(gè)系統(tǒng)的可用性造成影響,因此,整個(gè)系統(tǒng)的可用性是各組件可用性的乘積。對(duì)于每個(gè)組件,可采用RBD分解方法拆分成多個(gè)更細(xì)的資源模塊,可以拆分到能映射物理設(shè)備的模塊為止。例如計(jì)算資源拆分成集群,集群可以繼續(xù)拆分成服務(wù)器資源等(如圖5所示)。
在RBD分解后,每個(gè)模塊的可用性和設(shè)備可用性跟設(shè)備部署方式有關(guān)。設(shè)備可用性可以通過對(duì)設(shè)備進(jìn)行測(cè)量或者通過生產(chǎn)商提供的參數(shù)獲得。設(shè)備的部署方式可以分為三大類。第一類是通過單機(jī)部署,或者可以看成單機(jī)部署的;第二類是采用雙機(jī)部署,包括熱備雙機(jī)、溫備雙機(jī)兩大類,云計(jì)算系統(tǒng)中很少使用冷備雙機(jī);第三類是采用多節(jié)點(diǎn)部署,一般所有節(jié)點(diǎn)都可以對(duì)外提供服務(wù)。通過分析計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源、管理節(jié)點(diǎn)和機(jī)房基礎(chǔ)設(shè)施中各模塊的設(shè)備部署方式,即可計(jì)算其可用性,進(jìn)而分析整個(gè)云計(jì)算系統(tǒng)的可用性。
圖5 計(jì)算資源的RBD分解
第一類資源構(gòu)建方式是單點(diǎn)部署。通過設(shè)備自身的冗余來提高可用性,典型的例子是作為共享存儲(chǔ)的磁盤陣列,通常是單點(diǎn)部署,通過設(shè)備的雙引擎、雙通道來提高其可用性,因此,其高可用性等同于設(shè)備自身的高可用性。另外一個(gè)可以看作單點(diǎn)部署的是機(jī)房基礎(chǔ)設(shè)施。機(jī)房基礎(chǔ)設(shè)施的可用性是指機(jī)房的電源、空調(diào)、機(jī)柜等基礎(chǔ)設(shè)施的可用性,這類基礎(chǔ)設(shè)施往往通過冗余來實(shí)現(xiàn),比如電源的雙路接入、油機(jī)系統(tǒng)等,且與是否提供給云計(jì)算系統(tǒng)無關(guān)。從整體上看,其可用性可以認(rèn)為等同于傳統(tǒng)環(huán)境下的機(jī)房基礎(chǔ)設(shè)施可用性,其測(cè)試和計(jì)算方法與傳統(tǒng)環(huán)境一致。
第二類資源構(gòu)建方式是雙機(jī)部署。通常以熱備或溫備的方式部署,例如采用雙機(jī)形式部署的云管理節(jié)點(diǎn)、接入交換機(jī)、匯聚交換機(jī)等。在云計(jì)算系統(tǒng)中,資源部署基本上不采用冷備的方式。對(duì)于熱備雙機(jī),實(shí)際上構(gòu)成雙機(jī)的設(shè)備都對(duì)外提供服務(wù),因此,對(duì)于外界來說熱備雙機(jī)等同一個(gè)并聯(lián)的兩組件系統(tǒng),如果兩個(gè)組件的可用性分別為A1和A2,其可用性可通過下列公式計(jì)算:
對(duì)于溫備系統(tǒng),即一個(gè)設(shè)備正常提供服務(wù),另外一個(gè)設(shè)備處于待機(jī)狀態(tài),當(dāng)主設(shè)備發(fā)生故障,待機(jī)狀態(tài)的設(shè)備需要一定的激活時(shí)間才能接管主設(shè)備的工作。由于溫備雙機(jī)需要切換,存在一定的停機(jī)時(shí)間,但遠(yuǎn)少于單機(jī)維護(hù)的時(shí)間;同時(shí),備機(jī)日常處于待機(jī)狀態(tài);因此,能節(jié)約一定的待機(jī)成本,也能有效縮減停機(jī)時(shí)間。對(duì)于溫備雙機(jī),采用文獻(xiàn)[9]中的Markov Reward Model(MRM)方法計(jì)算其可用度?;趦膳_(tái)設(shè)備所處的狀態(tài),可以分為正常-待機(jī)(Up-Wait,UW)、正常-故障(Up-Fail,UF)、故障-故障(Fail-Fail,F(xiàn)F)、故障-正常(Fail-Up,F(xiàn)U)和故障-等待(Fail-Wait,F(xiàn)W),如圖6所示。其中,λ_s1和λ_s2指兩臺(tái)設(shè)備工作狀態(tài)下的故障率,其數(shù)值等于這兩臺(tái)設(shè)備的MTBF(記為m)的倒數(shù);μ_s1和μ_s2指兩臺(tái)設(shè)備的維修率,其數(shù)值等于這兩臺(tái)設(shè)備的MTTR(記為n)的倒數(shù);λi_s2指?jìng)錂C(jī)在等待狀態(tài)下的故障率,文獻(xiàn)[5]認(rèn)為其比λ_s2小20%,對(duì)應(yīng)MTBF為mi;sa_s2為系統(tǒng)發(fā)現(xiàn)主機(jī)失效激活備機(jī)時(shí)間sa的倒數(shù)。對(duì)于MRM模型,指定正常工作狀態(tài)的UW、UF、FU的得分值為1,無法工作的狀態(tài)FF、FW的得分值為0,通過計(jì)算該Markov模型的穩(wěn)定狀態(tài),得到在穩(wěn)定狀態(tài)下UW、UF、FU這三個(gè)狀態(tài)的概率,對(duì)應(yīng)概率和得分值的乘積之和就是溫備雙機(jī)的可用性。
圖6 溫備雙機(jī)的MRM模型
根據(jù)上述假設(shè),文獻(xiàn)[9]給出溫備雙機(jī)的可用性計(jì)算如下:
第三類資源構(gòu)建方式是多機(jī)部署。主要采用這種方法部署的是服務(wù)器,多臺(tái)服務(wù)器構(gòu)成一個(gè)集群,多個(gè)集群構(gòu)成云計(jì)算系統(tǒng)。假設(shè)共有N×K臺(tái)服務(wù)器,分為N個(gè)集群,集群所有的服務(wù)器均為同一種服務(wù)器,其可用性一致。第i個(gè)集群的服務(wù)器數(shù)量為Ki,第i個(gè)集群的服務(wù)器的可用性為Ai,其中 。那么第i個(gè)集群的可用性可以計(jì)算如下:
第一種情況,假設(shè)所有服務(wù)器同構(gòu),其可用性均為A,整個(gè)計(jì)算資源的可用性可以計(jì)算如下:
從公式(7)可以看出,在服務(wù)器完全同構(gòu)的情況下,計(jì)算資源的可用性僅與單服務(wù)器的可用性A和服務(wù)器總數(shù)N×K有關(guān),與集群數(shù)目N和每個(gè)集群的服務(wù)器Ki無關(guān),可見在服務(wù)器同構(gòu)的情況下,集群構(gòu)成對(duì)計(jì)算資源的總可用性無影響。
第二種情況,假設(shè)每個(gè)集群的服務(wù)器存在差異,由公式(6)可知,由于Ai在(0,1)區(qū)間,易知Ai和Ki越大,整個(gè)集群Aclusteri的可用性也越大。假設(shè)可用性最大的集群的可用性為Aclustermax,那么整個(gè)計(jì)算資源的可用性落在以下區(qū)間:
由公式(8)可以簡(jiǎn)單地推算計(jì)算資源的可用性上下限,為服務(wù)等級(jí)協(xié)議SLA的指定提供參考。
綜上所述,在區(qū)分幾大組件之后,整個(gè)云計(jì)算系統(tǒng)的評(píng)估可以采用以下流程。
步驟1:對(duì)云計(jì)算系統(tǒng)進(jìn)行邏輯拆分,將其分成彼此無關(guān)的組件;
步驟2:對(duì)各個(gè)組件進(jìn)行RBD法拆分,直到每個(gè)資源模塊能映射到單機(jī)、雙機(jī)、多主機(jī)部署方式;
步驟3:根據(jù)模塊內(nèi)部設(shè)備的部署方式,計(jì)算各模塊的高可用性。由此推算整個(gè)組件的可用性;
步驟4:根據(jù)公式(3)計(jì)算整個(gè)云計(jì)算系統(tǒng)的可用性。
云計(jì)算系統(tǒng)的可用性評(píng)估方法主要有提高可用性設(shè)計(jì)和制定SLA兩類應(yīng)用場(chǎng)景。
第一類應(yīng)用場(chǎng)景是在云計(jì)算系統(tǒng)的構(gòu)建過程中根據(jù)可用性要求對(duì)組件進(jìn)行可用性分配和改進(jìn)設(shè)計(jì)。根據(jù)系統(tǒng)的業(yè)務(wù)需求確定可用性的要求,根據(jù)總體可用性要求對(duì)計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源和管理節(jié)點(diǎn)、機(jī)房基礎(chǔ)設(shè)施各個(gè)組件可用性要求進(jìn)行分配。由于部分組件的可用性提升的幅度不大,例如機(jī)房的基礎(chǔ)設(shè)施,可靠性分配應(yīng)有所側(cè)重。在分配各組件的可用性后,在滿足其他要求的前提下,結(jié)合單一設(shè)備的可用性、設(shè)備部署方式和RBD方法計(jì)算現(xiàn)有組件的可用性,若組件可用性不滿足要求,增加并行設(shè)備數(shù)量直到滿足要求為止。此外,在單節(jié)點(diǎn)無法滿足高可用性的SLA要求的情況下,可以考慮采用多節(jié)點(diǎn)的方式進(jìn)一步提高可用性。
第二類應(yīng)用場(chǎng)景是在云計(jì)算系統(tǒng)構(gòu)建完畢,采用云計(jì)算系統(tǒng)各個(gè)組件的可用性評(píng)估方法,計(jì)算現(xiàn)有云計(jì)算系統(tǒng)的可用性。由于云計(jì)算系統(tǒng)的可用性是SLA的重要組成部分,因此,可用性評(píng)估方法有助于云計(jì)算系統(tǒng)對(duì)外服務(wù)前制定SLA。
本文針對(duì)云計(jì)算系統(tǒng)的架構(gòu)特點(diǎn)提出了一種云計(jì)算系統(tǒng)可用性評(píng)估方法。該方法分析了云計(jì)算系統(tǒng)組件的構(gòu)成方式,給出了單機(jī)部署、雙機(jī)部署、多機(jī)部署三種不同形式的組件的可用性估算方法和可用性區(qū)間,進(jìn)而提出了云計(jì)算系統(tǒng)的總體可用性的評(píng)估方法。該方法有助于構(gòu)建高可用性的云計(jì)算系統(tǒng)及制定云計(jì)算系統(tǒng)SLA。
參考文獻(xiàn)
[1]李海泉,李剛.系統(tǒng)可靠性分析與設(shè)計(jì)[M].北京:科學(xué)出版社,2003
[2]BAUER E,ADAMS R.Reliability and availability of cloud computing[M].USA:John Wiley & Sons Ltd,2012
[3]Quality Excellence for Suppliers of Telecommunications Forum——Resource Handbook for Business Improvement[EB/OL].(2010-08-03)[2015-01-19].http://doc.mbalib.com/view/14f748b10727523acdc6bb6b32 8c4129.html
[4]Microsoft Reliability Overview[EB/OL].[2015-01-19].https://msdn.microsoft.com/en-us/library/aa292168(v=vs.71).aspx,2008
[5]蔣樂天.系統(tǒng)可靠性分析方法及軟件可靠性技術(shù)研究[D].上海交通大學(xué)博士學(xué)位論文,2003
[6]KWON Y,AGHA G.A Markov Reward Model for Software Reliability[C]//International Parallel and Distributed Processing Symposium,IEEE,2007
[7]CHUOB S,POKHAREL M,PARK J.Modeling and Analysis of Cloud Computing Availability based on Eucalyptus Platform for E-government Data Center[C]//2011 Fifth International Conference on Innovative Mobile and Internet Services in Ubiquitous Computing,2011
[8]WANG W,CHEN H,CHEN X. An Availability-aware Virtual Machine Placement Approach for Dynamic Scaling of Cloud Applications[C]//2012 9th International Conference on Ubiquitous Intelligence and Computing and 9th International Conference on Autonomic and Trusted Computing,2012
[9]DANTAS J,MATOS R,ARAUJO J,et al.Models for Dependability Analysis of Cloud Computing Architectures for Eucalyptus Platform[J].International Transactions on Systems Science and Applications,2012,8:13-25
[10]陳懷臨.關(guān)于云計(jì)算可用性的定性與定量研究[EB/OL].[2015-01-19].http://www.valleytalk.org/wp-content/uploads/2013/12/