王 輝,洪 波,唐俊勇
(西安工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,西安 710021)
伴隨物聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,智能移動(dòng)終端為人們提供了更為便捷的信息交互、購物以及娛樂的方式。然而傳統(tǒng)的云存儲(chǔ)系統(tǒng)有很多問題,比如存儲(chǔ)密度低,存儲(chǔ)效率不高,導(dǎo)致傳統(tǒng)云存儲(chǔ)方式不能廣泛應(yīng)用在各種不同的環(huán)境中[1-3]。其不能保證云數(shù)據(jù)的完整性和機(jī)密性,云存儲(chǔ)服務(wù)商既不能向移動(dòng)用戶確保其數(shù)據(jù)和操作不被惡意或非惡意地丟失、破壞、泄漏或非法利用,也不可能消除潛在的內(nèi)部攻擊,若將數(shù)據(jù)直接存儲(chǔ)在云上,會(huì)導(dǎo)致非常嚴(yán)重的后果[4],安全優(yōu)化方案的重要性取決于該存儲(chǔ)方案失效后對(duì)系統(tǒng)可靠性的影響程度?,F(xiàn)有的研究多采用簡單的加密技術(shù)[5],但存在密鑰管理等問題,并且在查詢、并行修改、細(xì)粒度授權(quán)等復(fù)雜情況下束手無策[6-7]。
考慮到數(shù)據(jù)量很大時(shí),基于屬性加密技術(shù)(Attribute-Based Encryption,ABE)的效率較低,云存儲(chǔ)中海量敏感數(shù)據(jù)的機(jī)密性以對(duì)稱密碼體制實(shí)現(xiàn),ABE僅用于保護(hù)數(shù)據(jù)量較小的對(duì)稱密鑰[8-10]。文獻(xiàn)[11]提出了一種動(dòng)態(tài)多副本可證明數(shù)據(jù)擁有方案。文獻(xiàn)[12]提出一種基于云存儲(chǔ)的密文全文檢索模型,給出基于可搜索加密技術(shù)的密文全文索引構(gòu)建和檢索策略,并對(duì)方案的安全性進(jìn)行分析。文獻(xiàn)[13] 將馬爾科夫理論和服務(wù)質(zhì)量結(jié)合,在定義了基于業(yè)務(wù)開銷最小的服務(wù)能力匹配度的基礎(chǔ)上構(gòu)建了網(wǎng)絡(luò)可用性評(píng)價(jià)模型。這些研究不同于以往對(duì)云數(shù)據(jù)服務(wù)的研究,僅用單一加密方式實(shí)現(xiàn)安全性,缺乏云數(shù)據(jù)隨機(jī)性特點(diǎn)。因此,文中擬將馬爾科夫鏈[14-15]的轉(zhuǎn)移概率引入到安全云存儲(chǔ)優(yōu)化算法中,提出具有馬爾科夫特性的云存儲(chǔ)改進(jìn)優(yōu)化算法,在分析計(jì)算各節(jié)點(diǎn)存儲(chǔ)代價(jià)的基礎(chǔ)上,采用再加密技術(shù)及優(yōu)化技術(shù),構(gòu)建移動(dòng)端云存儲(chǔ)系統(tǒng)的安全優(yōu)化模型。
基于馬爾科夫鏈的安全云存儲(chǔ)優(yōu)化算法由3部分組成{S,R,P}。其中S為云系統(tǒng)的狀態(tài)空間,R為狀態(tài)分布,P為狀態(tài)轉(zhuǎn)換概率。將云存儲(chǔ)系統(tǒng)中存儲(chǔ)節(jié)點(diǎn)(服務(wù)器)可存儲(chǔ)的數(shù)據(jù)按大小分為4類,分別為小密度文件、中密度文件、高密度文件及大密度文件。不超過10 MB的文件定義為小密度文件,存儲(chǔ)文件超過1 000 MB時(shí)稱之為大密度文件,介于10 MB和100 MB之間的文件被定義成中密度文件,介于100 MB和1 000 MB之間的文件被定義成高密度文件。云系統(tǒng)中節(jié)點(diǎn)的硬件性能、網(wǎng)絡(luò)帶寬及延遲等均不同,存儲(chǔ)節(jié)點(diǎn)在完成大、高、中、小4種不同密度的數(shù)據(jù)訪問所耗費(fèi)的代價(jià)也會(huì)不同,此外,考慮云數(shù)據(jù)的安全性,采用不同的加密技術(shù)耗費(fèi)的時(shí)間也不同。在云系統(tǒng)中,根據(jù)存儲(chǔ)數(shù)據(jù)文件大小的不同,每個(gè)節(jié)點(diǎn)存儲(chǔ)大、高、中、小4種文件耗費(fèi)的存儲(chǔ)代價(jià)也就不同,選擇代價(jià)最小的節(jié)點(diǎn)實(shí)現(xiàn)存儲(chǔ)。
根據(jù)上述分析,存儲(chǔ)節(jié)點(diǎn)存儲(chǔ)4類不同大小密度文件的存儲(chǔ)過程可以近似成離散的狀態(tài)空間S,存儲(chǔ)節(jié)點(diǎn)的選取僅和節(jié)點(diǎn)的存儲(chǔ)代價(jià)有關(guān),云系統(tǒng)的這一存儲(chǔ)特點(diǎn)符合馬爾科夫鏈的特征。本文將云存儲(chǔ)系統(tǒng)的狀態(tài)空間表示為S,不同大小的密度文件分別表示不同的狀態(tài),因此,4種密度文件對(duì)應(yīng)4種狀態(tài)。例如,小密度文件狀態(tài)表示在實(shí)現(xiàn)云存儲(chǔ)時(shí)會(huì)選擇存儲(chǔ)小密度文件的最優(yōu)存儲(chǔ)節(jié)點(diǎn)。
基于馬爾科夫鏈的云存儲(chǔ)的狀態(tài)空間采取如下定義:
S={s1,s2,s3,s4}
式中:s1為機(jī)群中各個(gè)存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)小密度文件存儲(chǔ)的的存儲(chǔ)代價(jià);s2為機(jī)群中各個(gè)存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)中密度文件存儲(chǔ)的存儲(chǔ)代價(jià);s3為機(jī)群中各個(gè)存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)高密度文件存儲(chǔ)的存儲(chǔ)代價(jià);s4為機(jī)群中各個(gè)存儲(chǔ)節(jié)點(diǎn)實(shí)現(xiàn)大密度文件存儲(chǔ)的存儲(chǔ)代價(jià)。
在移動(dòng)端云存儲(chǔ)系統(tǒng)中,存儲(chǔ)狀態(tài)劃分越細(xì),在云存儲(chǔ)策略中執(zhí)行算法所需的開銷越大,系統(tǒng)收斂穩(wěn)定的時(shí)間也越長;反之,當(dāng)存儲(chǔ)狀態(tài)劃分非常簡單時(shí),可以減少系統(tǒng)的計(jì)算開銷及收斂時(shí)間,有利于從現(xiàn)實(shí)系統(tǒng)中抽象出模型狀態(tài)進(jìn)行分析。因此,根據(jù)云存儲(chǔ)的實(shí)際需要,在本文提出的云存儲(chǔ)模型中采取折中做法,將系統(tǒng)存儲(chǔ)狀態(tài)定義為4種。存儲(chǔ)方案的硬件設(shè)備的冗余性及其配置使存儲(chǔ)策略算法分析變得更加復(fù)雜,同時(shí)也降低了移動(dòng)端云存儲(chǔ)系統(tǒng)的存儲(chǔ)速率。所以,云存儲(chǔ)優(yōu)化算法中存儲(chǔ)狀態(tài)要?jiǎng)澐诌m度。本文定義云存儲(chǔ)的大密度文件、高密度文件、中密度文件、小密度文件4種狀態(tài),在云系統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)或存儲(chǔ)分析實(shí)際應(yīng)用中,這4種狀態(tài)均能滿足云系統(tǒng)對(duì)數(shù)據(jù)存儲(chǔ)的要求。
存儲(chǔ)組機(jī)群采用不規(guī)則連接網(wǎng)絡(luò)的方式,用R表示狀態(tài)分布,指某節(jié)點(diǎn)實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)所需耗費(fèi)的存儲(chǔ)代價(jià),根據(jù)存儲(chǔ)節(jié)點(diǎn)在大、高、中、小4種不同狀態(tài)的存儲(chǔ)代價(jià),得到ti時(shí)刻的狀態(tài)分布矩陣R(i),將R(i)表示為
(1)
其中si為云系統(tǒng)在ti時(shí)刻某節(jié)點(diǎn)所耗費(fèi)的存儲(chǔ)代價(jià),且si∈[0,1],根據(jù)ti時(shí)刻節(jié)點(diǎn)的各項(xiàng)硬件指標(biāo)進(jìn)行歸一化求得。
假設(shè)一個(gè)狀態(tài)空間由n個(gè)狀態(tài)構(gòu)成,其狀態(tài)之間的轉(zhuǎn)移概率可以用狀態(tài)轉(zhuǎn)移概率矩陣P表示,狀態(tài)轉(zhuǎn)移概率矩陣P始終保持不變。P為n階方陣,若t1,t2,…,tn的時(shí)間間隔均相同,根據(jù)齊次性,其表達(dá)式為
(2)
顯然,轉(zhuǎn)移概率矩陣有如下兩個(gè)性質(zhì),表達(dá)式為
(3)
式中:pij為從狀態(tài)si向狀態(tài)sj轉(zhuǎn)移的概率,Δt為時(shí)間間隔。狀態(tài)轉(zhuǎn)移概率矩陣P的每行元素的和均為1,指從第si轉(zhuǎn)移到其余所有sj的概率總和為1。
由前述可得,云系統(tǒng)中存儲(chǔ)節(jié)點(diǎn)可以存儲(chǔ)4種不同密度的文件,對(duì)應(yīng)4種不同的存儲(chǔ)代價(jià)。選擇某節(jié)點(diǎn)作為數(shù)據(jù)存儲(chǔ)的判斷依據(jù)是其存儲(chǔ)不同大小文件的存儲(chǔ)代價(jià),若存儲(chǔ)代價(jià)最小,則優(yōu)先選擇完成數(shù)據(jù)存儲(chǔ),否則,存儲(chǔ)代價(jià)越大,利用該節(jié)點(diǎn)完成數(shù)據(jù)存儲(chǔ)的概率越小。因此,云系統(tǒng)狀態(tài)空間S={s1,s2,s3,s4}的狀態(tài)轉(zhuǎn)移如圖1所示。
圖1 存儲(chǔ)狀態(tài)轉(zhuǎn)移圖Fig.1 Storage status transition diagram
由存儲(chǔ)節(jié)點(diǎn)在不同狀態(tài)下轉(zhuǎn)換的概率值,可得云系統(tǒng)優(yōu)化模型的狀態(tài)轉(zhuǎn)移概率矩陣為
(4)
移動(dòng)終端接入網(wǎng)絡(luò)時(shí)會(huì)選擇存儲(chǔ)組機(jī)群中存儲(chǔ)代價(jià)最低的設(shè)備完成數(shù)據(jù)存儲(chǔ)。為了提高移動(dòng)端云存儲(chǔ)的可靠性,在云存儲(chǔ)系統(tǒng)中引入了多副本機(jī)制,且該機(jī)制能夠提高移動(dòng)端云存儲(chǔ)系統(tǒng)的存儲(chǔ)效率。當(dāng)移動(dòng)終端發(fā)出存儲(chǔ)請(qǐng)求時(shí)會(huì)選擇距離最近的副本,也即存儲(chǔ)代價(jià)最低的節(jié)點(diǎn)。此外,傳統(tǒng)的云存儲(chǔ)系統(tǒng)僅當(dāng)主副本錯(cuò)誤時(shí)才會(huì)向備用副本發(fā)出請(qǐng)求,從而降低存儲(chǔ)速度。因此,文中利用馬爾科夫的相關(guān)理論,根據(jù)節(jié)點(diǎn)的硬件性能、網(wǎng)絡(luò)帶寬及延遲等指標(biāo)計(jì)算節(jié)點(diǎn)所需存儲(chǔ)代價(jià),通過狀態(tài)轉(zhuǎn)移概率矩陣求得一步轉(zhuǎn)移狀態(tài)矩陣,進(jìn)而求得多步轉(zhuǎn)移矩陣來計(jì)算并預(yù)測(cè)云系統(tǒng)中某節(jié)點(diǎn)的存儲(chǔ)概率,以此達(dá)到選擇最小代價(jià)節(jié)點(diǎn)完成存儲(chǔ)的目的。
云存儲(chǔ)優(yōu)化算法(Cloud Storage Optimization Algorithm,CSOA)的思路包括如下幾點(diǎn):首先,構(gòu)建云存儲(chǔ)系統(tǒng)狀態(tài)劃分的準(zhǔn)則依據(jù);其次,根據(jù)該準(zhǔn)則對(duì)云系統(tǒng)劃分狀態(tài)并建立存儲(chǔ)系統(tǒng)的狀態(tài)空間;此后,由系統(tǒng)提供的歷史數(shù)據(jù)計(jì)算得到云存儲(chǔ)系統(tǒng)的馬爾科夫狀態(tài)轉(zhuǎn)移概率矩陣;最后,利用上一步的狀態(tài)轉(zhuǎn)移概率矩陣及當(dāng)前時(shí)刻的存儲(chǔ)狀態(tài)矩陣,計(jì)算并預(yù)測(cè)下一時(shí)刻的存儲(chǔ)概率,實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)及可靠性指標(biāo)。
基于馬爾科夫鏈的云存儲(chǔ)策略算法步驟如下:
1)獲取云存儲(chǔ)系統(tǒng)初始t0時(shí)刻的存儲(chǔ)狀態(tài)分布矩陣R(0);
2)根據(jù)t0時(shí)刻存儲(chǔ)的狀態(tài)分布矩陣,以及狀態(tài)轉(zhuǎn)移概率矩陣P,得到Δt時(shí)間后,下一時(shí)刻云存儲(chǔ)系統(tǒng)的一步狀態(tài)分布矩陣R(1)表達(dá)式為
R(1)=R(0)P
(5)
3)Δt時(shí)間后,移動(dòng)端云存儲(chǔ)系統(tǒng)存儲(chǔ)狀態(tài)變?yōu)?/p>
R(2)=R(1)P=R(0)P2
(6)
同理,經(jīng)過m個(gè)Δt后的云系統(tǒng)存儲(chǔ)狀態(tài)分布為
R(m)=R(m-1)P=R(0)Pm
(7)
當(dāng)R(0)及P均已知時(shí),就能快速預(yù)測(cè)未來每隔Δt時(shí)刻后云存儲(chǔ)系統(tǒng)的狀態(tài)分布的穩(wěn)態(tài)值。
云存儲(chǔ)系統(tǒng)的狀態(tài)分布矩陣在式(1)中給出,該矩陣是根據(jù)系統(tǒng)中不同節(jié)點(diǎn)實(shí)現(xiàn)存儲(chǔ)所耗費(fèi)的存儲(chǔ)代價(jià)計(jì)算得到,計(jì)算過程如下。
存儲(chǔ)代價(jià)s與長度q、延遲d和丟包率l有關(guān),其表達(dá)式為
s=λqsq+λdsd+λlsl
(8)
(9)
屬性q由存儲(chǔ)數(shù)據(jù)塊長度表示,在初始時(shí)刻,根據(jù)數(shù)據(jù)延遲d和丟包率l,計(jì)算該節(jié)點(diǎn)的存儲(chǔ)代價(jià),綜合分析各節(jié)點(diǎn)耗費(fèi)的代價(jià),評(píng)估其存儲(chǔ)質(zhì)量,最終更新獲取各階段的存儲(chǔ)狀態(tài)分布矩陣。
很明顯,在基于Markov的云存儲(chǔ)優(yōu)化算法中,利用云系統(tǒng)初始時(shí)刻的狀態(tài)分布矩陣R(0)及狀態(tài)轉(zhuǎn)移概率矩陣P,可以得到下一時(shí)刻狀態(tài)分布,并通過矩陣運(yùn)算實(shí)現(xiàn)云存儲(chǔ)方案的選擇。
存儲(chǔ)優(yōu)化問題可以表示為
(10)
制約條件為:
ρ≥ρl,ro≤rin≤r3max,0≤rout≤ro
式中:wk為存儲(chǔ)代價(jià)Ck的權(quán)重;ρ為網(wǎng)絡(luò)實(shí)際的丟包率;ρl為丟包率的閥值;rin為文件輸入速率;ro為瓶頸帶寬;r3max為鏈路最大帶寬;rout為文件輸出速率。每個(gè)節(jié)點(diǎn)的存儲(chǔ)代價(jià)權(quán)重可用于相應(yīng)地調(diào)整其算法性能,如性能評(píng)估部分,可以針對(duì)存儲(chǔ)算法設(shè)計(jì)參數(shù)求解的確定性程序。通常,由于駐留分布和存儲(chǔ)代價(jià)分布的非線性,所得到的程序在設(shè)計(jì)參數(shù)中是非線性的。因此,該問題被歸類為具有邊界約束的非線性優(yōu)化程序,使用不同的數(shù)值技術(shù)來實(shí)現(xiàn)非線性程序的解決方案。采用的優(yōu)化技術(shù)應(yīng)當(dāng)簡單,易于實(shí)現(xiàn),并且可以無限制地應(yīng)用于任何模型。
在優(yōu)化周期的開始,存儲(chǔ)算法的參數(shù)包括帶寬利用率ρb,輸入速率rin和輸出速率rout,可用所有涉及的隨機(jī)參數(shù)(不同區(qū)域中的停留時(shí)間)來估計(jì)。顯然,在優(yōu)化周期的第一階段結(jié)束時(shí),通過改進(jìn)優(yōu)化算法的執(zhí)行降低系統(tǒng)的緩存需求,并在此基礎(chǔ)上根據(jù)展開的信息來實(shí)現(xiàn)預(yù)組估計(jì)。與之前的分析類似,可以根據(jù)此階段開始時(shí)的緩沖級(jí)別來估計(jì)更新。因此,可以通過求解下式來優(yōu)化存儲(chǔ)代價(jià),即:
(11)
制約條件為:0≤rout≤ro
式中:μout為節(jié)點(diǎn)設(shè)備內(nèi)存占用量;πn為速率影響因子;Fout為存儲(chǔ)文件時(shí)節(jié)點(diǎn)設(shè)備的CPU占用率;τd為文件大小。
在前文所述思想、模型的基礎(chǔ)上,采用python語言實(shí)現(xiàn)本文所提算法,并通過算例來驗(yàn)證云存儲(chǔ)策略的Markov特性。
使用蒙特卡羅法連續(xù)模擬8 000次,模擬的間隔時(shí)間為300 ms,分析這些模擬獲取的存儲(chǔ)狀態(tài)數(shù)據(jù)以及不同間隔后它們的改變,得到云系統(tǒng)的狀態(tài)轉(zhuǎn)移概率矩陣P為
(12)
狀態(tài)轉(zhuǎn)移概率矩陣P中數(shù)據(jù)元素的含義為,假設(shè)云存儲(chǔ)系統(tǒng)當(dāng)前在大密度文件狀態(tài),下一時(shí)刻轉(zhuǎn)移到小密度文件狀態(tài)、中密度文件狀態(tài)和高密度文件狀態(tài)概率分別為0.866,0.013和0.085,而維持大密度文件狀態(tài)概率為0.016。
由于云系統(tǒng)中存儲(chǔ)節(jié)點(diǎn)的硬件性能、網(wǎng)絡(luò)帶寬及延遲等均不同,節(jié)點(diǎn)完成數(shù)據(jù)訪問所耗費(fèi)的代價(jià)也不同。假設(shè)初始t0時(shí)刻,大、高、中和小4種存儲(chǔ)狀態(tài)的存儲(chǔ)代價(jià)分別用s1,s2,s3和s4表示。由式(1)可得到云存儲(chǔ)系統(tǒng)t0時(shí)刻的存儲(chǔ)狀態(tài)分布矩陣R(0)為
(13)
將式(12)和式(13)代入式(5),得到一步存儲(chǔ)狀態(tài)分布矩陣R(1),經(jīng)過多步轉(zhuǎn)移,可快速預(yù)測(cè)某時(shí)刻ti的存儲(chǔ)狀態(tài)分布矩陣R(i)為
(14)
通過存儲(chǔ)狀態(tài)分布矩陣R(i),可快速選出存儲(chǔ)成本最低的結(jié)點(diǎn)進(jìn)行實(shí)時(shí)存儲(chǔ)。針對(duì)數(shù)據(jù)存儲(chǔ),云存儲(chǔ)優(yōu)化算法測(cè)試了不同大小密度文件在云系統(tǒng)數(shù)據(jù)移動(dòng)和復(fù)制過程中所需的響應(yīng)時(shí)間,并對(duì)算法的存儲(chǔ)效率進(jìn)行了比較。通過仿真實(shí)驗(yàn)驗(yàn)證了云系統(tǒng)中各存儲(chǔ)業(yè)務(wù)均能在規(guī)定的時(shí)間內(nèi)及時(shí)響應(yīng),且業(yè)務(wù)響應(yīng)時(shí)間的對(duì)比數(shù)據(jù)如圖2所示。
從該業(yè)務(wù)響應(yīng)時(shí)間對(duì)比圖中得到業(yè)務(wù)平均響應(yīng)時(shí)間,盡管某個(gè)業(yè)務(wù)的響應(yīng)時(shí)間較長,但其他大部分業(yè)務(wù)的響應(yīng)時(shí)間較快,由此可見,本文提出的云存儲(chǔ)優(yōu)化算法的性能較好。移動(dòng)端上傳下載數(shù)據(jù)的測(cè)試結(jié)果見表1~2。
CPU占用率與上傳速度的比率見表1,移動(dòng)端數(shù)據(jù)分別在加密前和加密后進(jìn)行測(cè)試。CPU占用率與下載速度的比率見表2,其中移動(dòng)端數(shù)據(jù)分別在解密之前和解密之后進(jìn)行測(cè)試。
從表1和表2可知,如果加密和解密機(jī)制用于移動(dòng)端數(shù)據(jù)傳輸,那么CPU利用率將平均增加22%~25%,整體文件傳輸速率將降低 30%~35%。當(dāng)使用加密和解密機(jī)制時(shí),移動(dòng)端可能導(dǎo)致性能損失3倍以上。
圖2 業(yè)務(wù)響應(yīng)時(shí)間對(duì)比圖Fig.2 The comparison of the response times for the business
表1 移動(dòng)端上傳數(shù)據(jù)性能比較Tab.1 The performance of the mobile end uploading the data
表2 移動(dòng)端下載數(shù)據(jù)性能比較Tab.2 The performance of the mobile end downloading the data
考慮測(cè)試數(shù)據(jù)選取500個(gè)用戶,可用節(jié)點(diǎn)從500到5 000不等。云服務(wù)器存儲(chǔ)空間獲得超過100個(gè)字節(jié),并使用數(shù)據(jù)庫進(jìn)行存儲(chǔ)。需考慮2個(gè)問題:① 加密和解密對(duì)文件速度的影響;② 加密和解密對(duì)客戶端主機(jī)性能的影響。表3列出了加密解密時(shí)間實(shí)驗(yàn)數(shù)據(jù),其中包括加密不同大小或不同類型文件所花費(fèi)的時(shí)間以及在HDFS中傳輸文件所花費(fèi)的時(shí)間。
針對(duì)論文提出的云存儲(chǔ)算法,結(jié)合表3中對(duì)同等大小的文件,采用不同的加解密算法進(jìn)行可靠性分析。在本文所述思想、模型、存儲(chǔ)策略的基礎(chǔ)上,仿真實(shí)驗(yàn)中采用不同的高級(jí)加密標(biāo)準(zhǔn)(Advanced Encrytion Standard,AES),公鑰加密(Rivest Shamir Adleman,RSA)以及RSA+AES算法對(duì)本文所述的云存儲(chǔ)策略的安全性予以驗(yàn)證。通過一系列的仿真實(shí)驗(yàn)驗(yàn)證了本文提出的云存儲(chǔ)優(yōu)化算法能夠根據(jù)存儲(chǔ)狀態(tài)矩陣和狀態(tài)轉(zhuǎn)移概率矩陣實(shí)現(xiàn)云系統(tǒng)中存儲(chǔ)狀態(tài)的預(yù)測(cè),優(yōu)先選擇存儲(chǔ)代價(jià)最低的存儲(chǔ)節(jié)點(diǎn),實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)。此外,云存儲(chǔ)優(yōu)化算法還可以有效節(jié)省時(shí)間,減小在文件大小不同、存儲(chǔ)方法相同情況下存儲(chǔ)效率降低的影響。
表3 加密解密時(shí)間對(duì)比Tab.3 Comparison of encryption and decryption times
本文提出將馬爾科夫理論應(yīng)用于云系統(tǒng)以解決數(shù)據(jù)存儲(chǔ)問題,存儲(chǔ)優(yōu)化算法能夠準(zhǔn)確預(yù)測(cè)并實(shí)現(xiàn)數(shù)據(jù)的安全存儲(chǔ)。將云存儲(chǔ)的狀態(tài)劃分為4種狀態(tài),并獲得節(jié)點(diǎn)的硬件指標(biāo);利用馬爾科夫理論存儲(chǔ)大、高、中、小文件,由各節(jié)點(diǎn)實(shí)現(xiàn)存儲(chǔ)所需的存儲(chǔ)代價(jià)得到當(dāng)前存儲(chǔ)狀態(tài)矩陣,通過大量的樣本數(shù)據(jù)統(tǒng)計(jì)得到狀態(tài)轉(zhuǎn)移概率矩陣,根據(jù)狀態(tài)矩陣和轉(zhuǎn)移矩陣預(yù)測(cè)出下一時(shí)刻云存儲(chǔ)的狀態(tài)概率,實(shí)現(xiàn)最優(yōu)節(jié)點(diǎn)的選擇及優(yōu)化。仿真數(shù)據(jù)表明安全存儲(chǔ)優(yōu)化算法可以根據(jù)文件大小變化,預(yù)測(cè)并選擇存儲(chǔ)代價(jià)最低的節(jié)點(diǎn)實(shí)現(xiàn)存儲(chǔ),有效減小了在文件大小不同、存儲(chǔ)方法相同情況下存儲(chǔ)效率降低的影響。通過仿真實(shí)驗(yàn)驗(yàn)證了移動(dòng)端云系統(tǒng)狀態(tài)轉(zhuǎn)移的馬爾科夫特性,表明了基于馬爾科夫鏈的安全云存儲(chǔ)優(yōu)化算法的高可靠性。
此外,云存儲(chǔ)系統(tǒng)具有較高安全性,依據(jù)輸入輸出及完整性校驗(yàn)的特點(diǎn),可以在移動(dòng)端使用AES算法加密用戶上傳的數(shù)據(jù),確保移動(dòng)端數(shù)據(jù)的機(jī)密性;同時(shí)使用RSA算法確保AES密鑰的安全性,并能解決AES單鑰密碼的分發(fā)和管理;通過基于Markov的云存儲(chǔ)算法研究,設(shè)計(jì)3種存儲(chǔ)狀態(tài)從而實(shí)現(xiàn)移動(dòng)端的數(shù)據(jù)存儲(chǔ),減少副本數(shù),提高移動(dòng)端云存儲(chǔ)系統(tǒng)的存儲(chǔ)效率。