伍貴富 陳光喜 劉宇鵬
摘要:醫(yī)療云服務(wù)在實(shí)施的過程中,人們更加關(guān)注數(shù)據(jù)的安全、以及系統(tǒng)的負(fù)載均衡等問題。而解決這些問題的關(guān)鍵技術(shù)之一就是醫(yī)療云存儲(chǔ)部署規(guī)劃的優(yōu)化策略。文章通過系統(tǒng)建模,將醫(yī)療云存儲(chǔ)所涉及的相關(guān)技術(shù)抽象為多目標(biāo)優(yōu)化問題后,通過離散PSO算法進(jìn)行求解。并引入新的粒子位置更新算法,以提高標(biāo)準(zhǔn)離散PSO算法的收斂速度,通過重優(yōu)化機(jī)制來更新粒子狀態(tài),防止算法陷入局部最優(yōu)而早熟,最終得到適合于求解醫(yī)療云存儲(chǔ)部署優(yōu)化問題的IDPSO算法。仿真實(shí)驗(yàn)表明該算法有效。
關(guān)鍵詞:離散PSO;云存儲(chǔ);負(fù)載均衡
1引言
隨著國(guó)際醫(yī)學(xué)信息標(biāo)準(zhǔn)化、電子化進(jìn)程的快速發(fā)展,使得區(qū)域醫(yī)療信息化平臺(tái)逐漸成為各地區(qū)醫(yī)院的基本設(shè)施,HIS、DACS等應(yīng)用系統(tǒng)也逐漸成為醫(yī)院信息技術(shù)的核心。由于這些應(yīng)用系統(tǒng)中的數(shù)據(jù)越來越多,比如:一個(gè)標(biāo)準(zhǔn)的病理圖則可能接近5GB,使得系統(tǒng)數(shù)據(jù)價(jià)值越來越大。顯然這些重要數(shù)據(jù)丟失的風(fēng)險(xiǎn)或系統(tǒng)停機(jī)造成的損失是用戶難以承受的。因此如何有效保障并構(gòu)建最有效率的醫(yī)院信息系統(tǒng)體系,成為各醫(yī)院信息中心主管人員所關(guān)注的重中之重。
目前云存儲(chǔ)系統(tǒng)由多個(gè)部分組成,可收集、存儲(chǔ)及處理底層數(shù)據(jù),并在此基礎(chǔ)之上提供其它服務(wù)功能。由于現(xiàn)有的網(wǎng)絡(luò)存儲(chǔ)技術(shù)無法很好地滿足醫(yī)療云存儲(chǔ)服務(wù)的核心需求,因此一種基于對(duì)象的存儲(chǔ)(OBS)方法,被提出并引入到云存儲(chǔ)解決方案中。而OBS方法在實(shí)現(xiàn)的過程中,既要考慮系統(tǒng)存儲(chǔ)負(fù)載的均衡性,又要考慮優(yōu)化動(dòng)態(tài)環(huán)境中的部署效率問題。因此,許多基于啟發(fā)式群集智能算法(如粒子群算法或遺傳算法等)的解決方案被引入到該問題中。但這些方案,在求解的效率以及解空間的質(zhì)量上,還存在著一定的局限性。因此文章提出基于對(duì)象存儲(chǔ)的醫(yī)療云存儲(chǔ)系統(tǒng)模型,并在此基礎(chǔ)之上,利用改進(jìn)的離散粒子群(IDPSO)優(yōu)化算法,對(duì)醫(yī)療數(shù)據(jù)的部署方案進(jìn)行優(yōu)化求解。
2醫(yī)療云存儲(chǔ)系統(tǒng)模型定義
醫(yī)療云存儲(chǔ)系統(tǒng)實(shí)現(xiàn)的主要目標(biāo)是將需要保存的文件,按合理的副本數(shù)量,分配到云平臺(tái)的各數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)中去,從而既滿足用戶對(duì)數(shù)據(jù)安全的要求,又能使云服務(wù)系統(tǒng)中任務(wù)得以快速執(zhí)行以及系統(tǒng)的負(fù)載達(dá)到相對(duì)均衡。在不失一般性的情況在文章做如下假設(shè):1)由于醫(yī)療云系統(tǒng)中對(duì)文件的操作幾乎都是順序讀,因此文章主要針對(duì)這種文件操作進(jìn)行討論。2)作為醫(yī)療云服務(wù)平臺(tái),我們所面對(duì)的大部分?jǐn)?shù)據(jù),如電子病歷、CT圖像等文件都具有“一次寫入多次讀取”的特性,因此文章的存儲(chǔ)策略沒有考慮數(shù)據(jù)一致性機(jī)制。因此文章所討論的醫(yī)療云存儲(chǔ)部署問題就轉(zhuǎn)化為一個(gè)多目標(biāo)優(yōu)化問題,即將n個(gè)文件部署到m個(gè)數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)上并使系統(tǒng)中相關(guān)性能達(dá)到優(yōu)化的目的。
在云存儲(chǔ)優(yōu)化的過程中,我們主要考慮如下幾個(gè)方面的性能參數(shù)。(1)平均延遲:最小化系統(tǒng)延遲對(duì)于任何云存儲(chǔ)平臺(tái)來說都是非常重要的,因此文章主要考慮文件讀操作的延遲。由于每個(gè)文件可能有多個(gè)副本,將文件fn的平均延遲Dn表示如下:
其中R(i)表示文件i的請(qǐng)求數(shù)。當(dāng)系統(tǒng)中存儲(chǔ)節(jié)點(diǎn)的負(fù)載與Vavg的差值接近0時(shí),系統(tǒng)負(fù)載接近均衡。
3基于IDPSO的云存儲(chǔ)策略的設(shè)計(jì)
針對(duì)離散空間的多目標(biāo)優(yōu)化問題,提出了基于二進(jìn)制編碼的離散PSO算法。而這種標(biāo)準(zhǔn)的離散PSO算法應(yīng)用到云存儲(chǔ)策略中,首先需要解決的問題是如何建立起解空間與粒子之間的映射,因此,文章將通過引入整數(shù)編碼的矩陣來對(duì)應(yīng)解空間,矩陣的每項(xiàng)為(fn,z,Dm),其中f1.1表示文件f1的一個(gè)副本,Dm表示存儲(chǔ)節(jié)點(diǎn)的編號(hào)。
3.1適應(yīng)度函數(shù)的設(shè)計(jì)
考慮到云存儲(chǔ)部署建模中的多重優(yōu)化目標(biāo),文章采用較快捷的衡量方法,即引入權(quán)重因子,構(gòu)造適應(yīng)度評(píng)價(jià)函數(shù),實(shí)現(xiàn)多目標(biāo)優(yōu)化。結(jié)合公式(1)-(3)文章將適應(yīng)值函數(shù)轉(zhuǎn)化為如下形式:
3.2粒子速度和位置的更新方法
離散PSO算法的實(shí)質(zhì)是粒子根據(jù)與個(gè)體極值和全局極值之間的距離信息,來調(diào)整自身運(yùn)動(dòng)的方向和速度,并以此改變下一步的迭代位置。文章借鑒文獻(xiàn)中速度和位置的計(jì)算公式,并引入遺傳算法中的交叉操作的思想,設(shè)計(jì)了對(duì)粒子種群的基本操作方式:1)粒子交換操作:對(duì)粒子位置變換的操作定義為ch(a11,a22),表示粒子a11與a22發(fā)生位置交換,而多個(gè)粒子交換操作所組成的序列被稱為交換序列,即CH=(ch1,ch2∧chm)。2)基本交換序列集:由于矩陣A變換到矩陣A′的過程中存在著許多種不同的交換順序,因此文章將變換次數(shù)最少的交換序列的集合稱為基本交換序列集。
根據(jù)上述基本變換規(guī)則,文章對(duì)PSO算法中粒子的速度公式進(jìn)行如下改進(jìn):
由于標(biāo)準(zhǔn)離散PSO算法較容易早熟,因此文章采用了一種重優(yōu)化更新機(jī)制,來防止算法陷入局部最優(yōu),即算法在執(zhí)行過程中,如果改變粒子速度的基本交換序列的元素個(gè)數(shù)少于閾值μ,而解集的優(yōu)化條件尚未滿足時(shí),解空間將進(jìn)行重新優(yōu)化操作。
4性能評(píng)估
文章的模擬實(shí)驗(yàn)在CloudSim環(huán)境中進(jìn)行的,主要模擬了在新的存儲(chǔ)策略影響下,對(duì)醫(yī)療云存儲(chǔ)的服務(wù)延遲、費(fèi)用成本和負(fù)載均衡3個(gè)性能指標(biāo)的改善程度,并與遺傳算法(GA)進(jìn)行對(duì)比。
在用改進(jìn)離散PSO算法搜索存儲(chǔ)調(diào)度的最優(yōu)可行解時(shí),文章設(shè)定種群規(guī)模為50個(gè)粒子,最大迭代次數(shù)為300次,其它參數(shù)將根據(jù)文獻(xiàn)進(jìn)行設(shè)置。在實(shí)驗(yàn)過程中將重復(fù)進(jìn)行10次獨(dú)立實(shí)驗(yàn)并取平均值作為最后的評(píng)價(jià)數(shù)據(jù)。
如圖1所示,文件總數(shù)來表示系統(tǒng)的負(fù)載,一般而言文件數(shù)量越多,表示系統(tǒng)的負(fù)載越重。IDPSO算法相比于HDFS和GA能減少系統(tǒng)的平均服務(wù)時(shí)間。IDPSO算法在不同的文件總數(shù)的情況下都能獲得較好的結(jié)果。
如圖2所示,基本的HDFS文件系統(tǒng)中各節(jié)點(diǎn)的負(fù)載情況存在一定差異,而通過算法優(yōu)化后的系統(tǒng)負(fù)載情況將趨于穩(wěn)定,并逐漸趨于某個(gè)穩(wěn)定水平。從圖中我們還可以發(fā)現(xiàn),由于系統(tǒng)中其它因素的影響,各節(jié)點(diǎn)的負(fù)載值不可能完全相等,但已趨于平衡,因此說明系統(tǒng)的負(fù)載已得到優(yōu)化。
5結(jié)語
醫(yī)療云服務(wù)在實(shí)施的過程中,人們會(huì)更關(guān)注數(shù)據(jù)的安全、以及系統(tǒng)的負(fù)載均衡等特性。文章針對(duì)這一問題,提出了云存儲(chǔ)的部署優(yōu)化算法,通過調(diào)整數(shù)據(jù)文件在存儲(chǔ)節(jié)點(diǎn)的分布,來提高系統(tǒng)的負(fù)載均衡行,使得整個(gè)醫(yī)療云服務(wù)的性能和利用率得到提升。文章將云存儲(chǔ)部署抽象為多目標(biāo)優(yōu)化問題后,針對(duì)標(biāo)準(zhǔn)離散PSO算法的一些不足,引入新的粒子位置更新算法,以提高算法的收斂速度;并通過重優(yōu)化機(jī)制,來防止算法陷入局部最后,最終得到適合于求解醫(yī)療云存儲(chǔ)部署優(yōu)化問題的IDPSO算法。在CloudSim上進(jìn)行的仿真實(shí)驗(yàn)表明該方法有效。