鄭 健
(哈爾濱醫(yī)科大學(xué)附屬第一醫(yī)院 信息中心,哈爾濱 150000)
基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)的設(shè)計(jì)
鄭 健
(哈爾濱醫(yī)科大學(xué)附屬第一醫(yī)院 信息中心,哈爾濱 150000)
為了提高醫(yī)療技術(shù)水平,加快醫(yī)務(wù)人員對(duì)醫(yī)療信息數(shù)據(jù)的分析,使醫(yī)療信息數(shù)據(jù)運(yùn)行更加順暢,減少數(shù)據(jù)存儲(chǔ)所占空間,需要對(duì)醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)進(jìn)行設(shè)計(jì);當(dāng)前的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),利用FPGA構(gòu)建系統(tǒng)硬件,以硬件為基礎(chǔ)將醫(yī)療信息數(shù)據(jù)存儲(chǔ),但在存儲(chǔ)過程中,沒有將冗余數(shù)據(jù)清除,導(dǎo)致存儲(chǔ)空間易滿,容量變小,存在正常醫(yī)療信息數(shù)據(jù)無處安放的問題;為此,提出一種基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法;該方法首先對(duì)醫(yī)療信息數(shù)據(jù)的來源進(jìn)行統(tǒng)計(jì),根據(jù)數(shù)據(jù)來源實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的硬件構(gòu)造,然后利用醫(yī)療信息數(shù)據(jù)中特征相似數(shù)據(jù)間的中介點(diǎn)實(shí)現(xiàn)數(shù)據(jù)聚類,完成對(duì)醫(yī)療信息數(shù)據(jù)的聚類存儲(chǔ),最后采用高斯混合模型對(duì)冗余醫(yī)療數(shù)據(jù)進(jìn)行特征分析,以分析結(jié)果為基礎(chǔ),利用分?jǐn)?shù)階Fourier變換對(duì)冗余醫(yī)療信息數(shù)據(jù)進(jìn)行刪除操作,由此完成了基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ);實(shí)驗(yàn)結(jié)果證明,所提方法增加數(shù)據(jù)存儲(chǔ)空間容量,減少對(duì)冗余數(shù)據(jù)的存儲(chǔ),加快醫(yī)療信息數(shù)據(jù)的存儲(chǔ)速度,提高數(shù)據(jù)存儲(chǔ)精度,為該領(lǐng)域研究發(fā)展提供強(qiáng)有力的依據(jù)。
模糊處理;醫(yī)療信息數(shù)據(jù);存儲(chǔ)系統(tǒng)設(shè)計(jì)
目前,隨著互聯(lián)網(wǎng)水平和科學(xué)技術(shù)的發(fā)展,醫(yī)療信息數(shù)據(jù)在醫(yī)療屆的應(yīng)用范圍廣泛,例如對(duì)醫(yī)院門診、骨科、內(nèi)科、眼科等部門都有良好的輔助作用[1]。醫(yī)療信息數(shù)據(jù)不僅從側(cè)面提高醫(yī)院醫(yī)療水平,而且便于醫(yī)務(wù)人員從中發(fā)現(xiàn)醫(yī)療方面的不足和漏洞,并及時(shí)改正。隨著當(dāng)前醫(yī)療信息數(shù)據(jù)逐漸增加,醫(yī)療信息數(shù)據(jù)的存儲(chǔ)受到了社會(huì)各界的高度重視和廣泛研究[2-3]。因?yàn)獒t(yī)療信息數(shù)據(jù)具有復(fù)雜性較強(qiáng)、靈活度較高、數(shù)量較大,讀取時(shí)間較長(zhǎng)等特性,所以需要對(duì)其存儲(chǔ)系統(tǒng)進(jìn)行設(shè)計(jì)[4]。大多數(shù)的數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),無法對(duì)其進(jìn)行低損耗、低誤差、高精度、高效率地存儲(chǔ),導(dǎo)致醫(yī)療信息數(shù)據(jù)存儲(chǔ)過程中,經(jīng)常出現(xiàn)惡意數(shù)據(jù)泛濫、醫(yī)療數(shù)據(jù)來路不明、存儲(chǔ)用時(shí)較長(zhǎng)的問題[5]。在這種情況下,如何提高醫(yī)療信息數(shù)據(jù)存儲(chǔ)速度,增加數(shù)據(jù)存儲(chǔ)的穩(wěn)定性成為了當(dāng)前急需解決的問題?;谀:幚淼尼t(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法,對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行安全可靠地存儲(chǔ),是解決上述問題的有效途徑[6]。此問題受到了醫(yī)療數(shù)據(jù)存儲(chǔ)系統(tǒng)研究人員的鉆研,同時(shí)也研究出了很多優(yōu)秀的方法[7]。
文獻(xiàn)[8]提出了一種基于FPGA的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法。該方法首先利用Hadoop平臺(tái),將醫(yī)療信息數(shù)據(jù)分割成大小相同的數(shù)據(jù)塊,然后通過多副本的形式將數(shù)據(jù)塊分布存儲(chǔ)在不同存儲(chǔ)系統(tǒng)位置,最后采用FPGA實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)系統(tǒng)更好的容錯(cuò)機(jī)制,從而完成醫(yī)療信息數(shù)據(jù)持久化存儲(chǔ)。該方法下的醫(yī)療信息數(shù)據(jù)存儲(chǔ)更為持久,但是存在存儲(chǔ)時(shí)間較長(zhǎng)的問題。文獻(xiàn)[9]提出了一種基于CC2530的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法。該方法首先利用數(shù)據(jù)采集模塊對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行大規(guī)模的采集,然后將采集的數(shù)據(jù)經(jīng)過濾波放大后,采用CC2530單機(jī)片實(shí)現(xiàn)數(shù)據(jù)傳輸,最后依據(jù)MicroSD卡的植入完成對(duì)醫(yī)療信息數(shù)據(jù)的存儲(chǔ)。該方法雖然用時(shí)較短,但是存在存儲(chǔ)效率偏差大的問題。文獻(xiàn)[10]提出了一種基于C51的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法。該方法首先利用FPGA作為存儲(chǔ)系統(tǒng)的控制芯片,然后以數(shù)據(jù)存儲(chǔ)芯片NANDFlash作為醫(yī)療信息數(shù)據(jù)的存儲(chǔ)媒介,采用A/D芯片對(duì)各種醫(yī)療信息數(shù)據(jù)進(jìn)行轉(zhuǎn)換,最后將所有被轉(zhuǎn)換的醫(yī)療信息數(shù)據(jù)統(tǒng)一存儲(chǔ)至數(shù)據(jù)庫(kù)中。該方法下的數(shù)據(jù)存儲(chǔ)精度較高,但是過程過于繁瑣。
針對(duì)上述產(chǎn)生的問題,提出一種基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法。該方法首先對(duì)醫(yī)療信息數(shù)據(jù)的來源做出了分析,以分析的結(jié)果為依據(jù)對(duì)醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)的硬件進(jìn)行構(gòu)造,然后以硬件構(gòu)造為基礎(chǔ),利用MPI對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行聚類,聚類過程中采用相似數(shù)據(jù)間的中介點(diǎn)將相似數(shù)據(jù)連接,從而實(shí)現(xiàn)數(shù)據(jù)的聚類存儲(chǔ),最后依據(jù)對(duì)冗余醫(yī)療信息數(shù)據(jù)特征的分析,將冗余醫(yī)療信息數(shù)據(jù)刪除,實(shí)現(xiàn)了醫(yī)療信息數(shù)據(jù)的有序存儲(chǔ),完成本文所提方法下的數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)。仿真實(shí)驗(yàn)證明,所提方法可以低成本、高精度地對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ)。
1.1 醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)
由于醫(yī)療信息數(shù)據(jù)中本身存在惡意數(shù)據(jù),而在醫(yī)療信息數(shù)據(jù)存儲(chǔ)過程中,惡意數(shù)據(jù)的來源很模糊,所以需要利用醫(yī)療信息數(shù)據(jù)來源模塊對(duì)其進(jìn)行具體化的分類,分類操作有利于醫(yī)療信息數(shù)據(jù)的高效存儲(chǔ)。圖1為醫(yī)療信息數(shù)據(jù)來源結(jié)構(gòu)示意圖。
圖1 醫(yī)療信息數(shù)據(jù)來源結(jié)構(gòu)
通過圖1可以看出,醫(yī)療信息數(shù)據(jù)來源大致分為六塊:骨科信息數(shù)據(jù)、眼科信息數(shù)據(jù)、口腔科信息數(shù)據(jù)、內(nèi)科信息數(shù)據(jù)、外科信息數(shù)據(jù)及其他醫(yī)療信息數(shù)據(jù)。當(dāng)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),如果出現(xiàn)惡意數(shù)據(jù),醫(yī)務(wù)人員通過數(shù)據(jù)來源模塊可以清晰地分辨出惡意數(shù)據(jù)來源,并及時(shí)做出處理。圖2是醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)的構(gòu)造。
圖2 醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)
圖2中醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)分為醫(yī)療信息數(shù)據(jù)聚類存儲(chǔ)和醫(yī)療冗余信息數(shù)據(jù)查詢,也就是按照冗余信息數(shù)據(jù)的特征辨別冗余數(shù)據(jù)存在,如若發(fā)現(xiàn)冗余數(shù)據(jù)便對(duì)其進(jìn)行刪除操作,有利于節(jié)省醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)的存儲(chǔ)空間。
1.2 醫(yī)療信息數(shù)據(jù)聚類存儲(chǔ)
以2.1中的各項(xiàng)信息數(shù)據(jù)為基礎(chǔ),利用MPI對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行聚類存儲(chǔ),聚類存儲(chǔ)過程中依據(jù)醫(yī)療信息數(shù)據(jù)中特征相似數(shù)據(jù)間的中介點(diǎn)實(shí)現(xiàn)數(shù)據(jù)聚類,由此完成對(duì)醫(yī)療信息數(shù)據(jù)的聚類存儲(chǔ)。
假設(shè),醫(yī)療信息數(shù)據(jù)網(wǎng)是M={E,K},式中,E代表醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)集合,K代表數(shù)據(jù)節(jié)點(diǎn)之間邊的集合。醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)代表數(shù)據(jù)存儲(chǔ)系統(tǒng)中的元素,數(shù)據(jù)節(jié)點(diǎn)之間的邊代表元素間的聯(lián)系。若將整個(gè)醫(yī)療信息數(shù)據(jù)庫(kù)當(dāng)作由若干個(gè)社團(tuán)構(gòu)成,也就是由若干個(gè)特征相同的數(shù)據(jù)類構(gòu)成,則社團(tuán)內(nèi)部的數(shù)據(jù)節(jié)點(diǎn)連接的比較緊湊,社團(tuán)之間數(shù)據(jù)節(jié)點(diǎn)的連接較為稀疏。
假設(shè)x和y分別代表醫(yī)療信息數(shù)據(jù)網(wǎng)M中的兩個(gè)頂點(diǎn),βx代表頂點(diǎn)的結(jié)構(gòu),F(xiàn)是E中的一個(gè)子集,且該子集不為空,α和δ分別代表醫(yī)療信息數(shù)據(jù)中的聚類對(duì)象,O代表滿足α和δ聚類的條件。則醫(yī)療信息數(shù)據(jù)網(wǎng)M中的頂點(diǎn)結(jié)構(gòu)相似度為:
(1)
其中,κ(x,y)代表頂點(diǎn)x和頂點(diǎn)y間的相似度。如果醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)與該數(shù)據(jù)鄰居的頂點(diǎn)結(jié)構(gòu)相似,則得到兩者的關(guān)系式為:
(2)
其中,Gα(x)代表與頂點(diǎn)x相似度大于等于α的鄰居數(shù)據(jù)集合。假設(shè)一個(gè)醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)有很多相似度大于等于α的鄰居數(shù)據(jù)節(jié)點(diǎn),則該數(shù)據(jù)節(jié)點(diǎn)是社團(tuán)核心節(jié)點(diǎn),則核心節(jié)點(diǎn)的表達(dá)方式為:
(3)
其中,COREα,δ(x)代表醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)是數(shù)據(jù)對(duì)象α和δ核心節(jié)點(diǎn)的值。通過核心節(jié)點(diǎn)值對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行聚類,聚類過程中利用特征相似數(shù)據(jù)間的中介點(diǎn)實(shí)現(xiàn)數(shù)據(jù)聚類,其公式可表示為:
HUBα,δ(x)?
(4)
其中,HUBα,δ(x)代表醫(yī)療信息數(shù)據(jù)中特征相似數(shù)據(jù)間的中介點(diǎn)值,式中,x不屬于任何團(tuán)體,假設(shè)E中的醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)至少分布在兩個(gè)或者兩個(gè)以上的團(tuán)體時(shí),HUBα,δ(x)可以當(dāng)做醫(yī)療信息數(shù)據(jù)聚類的中介點(diǎn),本文不對(duì)醫(yī)療信息數(shù)據(jù)節(jié)點(diǎn)分布在兩個(gè)以下團(tuán)體的情況做研究。由該中介點(diǎn)完成對(duì)醫(yī)療信息數(shù)據(jù)的聚類,將聚類后的數(shù)據(jù)有序的存儲(chǔ)至醫(yī)療信息數(shù)據(jù)庫(kù)中。
1.3 冗余醫(yī)療信息數(shù)據(jù)的查詢與刪除
要完成冗余醫(yī)療信息數(shù)據(jù)刪除,首先要對(duì)其進(jìn)行查詢,冗余信息數(shù)據(jù)的特征分析可以使查詢效果更佳。本文利用高斯混合模型對(duì)冗余醫(yī)療數(shù)據(jù)進(jìn)行特征分析,具體過程如下。
假設(shè),將冗余醫(yī)療信息數(shù)據(jù)特征區(qū)間定義為:
lg(i,j,f)={D(i,j)/(216/f)}
(5)
其中,i代表冗余醫(yī)療信息數(shù)據(jù)特征數(shù)目,j代表冗余醫(yī)療信息數(shù)據(jù)特征區(qū)間數(shù)目,f代表對(duì)冗余醫(yī)療信息數(shù)據(jù)進(jìn)行查詢時(shí)的控制參數(shù),單位為h,實(shí)驗(yàn)證明當(dāng)此參數(shù)控制在0.07~0.08時(shí),數(shù)據(jù)存儲(chǔ)效率最高。D代表刪除冗余醫(yī)療數(shù)據(jù)中一常數(shù)單位。
為了使冗余數(shù)據(jù)查詢結(jié)果更清晰,根據(jù)冗余醫(yī)療信息數(shù)據(jù)的特征區(qū)間,對(duì)冗余醫(yī)療信息數(shù)據(jù)特征集進(jìn)行計(jì)算:
lgvv(i,j)=lgv(i,j)*sσf
(6)
其中,lgvv代表冗余醫(yī)療信息數(shù)據(jù)特征集閾值,lgv代表冗余醫(yī)療信息數(shù)據(jù)特征子集,s代表基于模糊處理存儲(chǔ)的濾波函數(shù),sσf代表冗余醫(yī)療信息數(shù)據(jù)的特征核,由上式得到冗余醫(yī)療信息數(shù)據(jù)的特征配置為:
pi(f)=qi(f)+ki(f)
(7)
其中,p代表冗余醫(yī)療信息數(shù)據(jù)的特征配置,q代表冗余數(shù)據(jù)查詢質(zhì)量,k代表冗余醫(yī)療信息數(shù)據(jù)的特征配置系數(shù),以冗余醫(yī)療信息數(shù)據(jù)特征配置為基礎(chǔ),假設(shè)冗余數(shù)據(jù)刪除過程中,刪除干擾值z(mì)(f)為0時(shí),則以此配置為中心,得到冗余數(shù)據(jù)特征的展開結(jié)果:
(8)
其中,a代表冗余數(shù)據(jù)特征的展開值,由式(8)可知冗余醫(yī)療信息數(shù)據(jù)特征展開結(jié)果為驗(yàn)證醫(yī)療信息數(shù)據(jù)庫(kù)內(nèi)的醫(yī)療信息數(shù)據(jù),是否為冗余數(shù)據(jù)的驗(yàn)證指標(biāo),通過對(duì)醫(yī)療信息數(shù)據(jù)特征展開結(jié)果的壓縮處理,獲得冗余數(shù)據(jù)壓縮特征編碼。為了避免習(xí)慣性對(duì)冗余醫(yī)療信息數(shù)據(jù)刪除的影響,對(duì)該特征編碼進(jìn)行量化分解,其計(jì)算方式為:
(9)
其中,Rn代表數(shù)據(jù)特征編碼量化分解值,利用量化分解的結(jié)果完成對(duì)冗余醫(yī)療信息數(shù)據(jù)的分析,當(dāng)Rn≥1時(shí),則正在進(jìn)行驗(yàn)證的醫(yī)療信息數(shù)據(jù)為冗余數(shù)據(jù),直接刪除;當(dāng)Rn<1時(shí),則正在進(jìn)行驗(yàn)證的醫(yī)療信息數(shù)據(jù)不是冗余數(shù)據(jù),可直接進(jìn)行存儲(chǔ),由冗余醫(yī)療信息數(shù)據(jù)的特征分析過程完成冗余數(shù)據(jù)的查詢。
以上述結(jié)果為依據(jù),采用分?jǐn)?shù)階Fourier變換對(duì)冗余醫(yī)療信息數(shù)據(jù)進(jìn)行刪除操作。具體過程如下。
設(shè)置冗余醫(yī)療信息數(shù)據(jù)的訓(xùn)練樣本集S=[S1,S2,…,Si,…,SC]Y,在基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)環(huán)境中,為了保障醫(yī)療信息數(shù)據(jù)正常存儲(chǔ)的可靠性,必須得到存儲(chǔ)系統(tǒng)中冗余醫(yī)療信息數(shù)據(jù)流的離散分?jǐn)?shù)階Fourier逆變換值,該值的表示方式為:
b=N-φ×S
(10)
(11)
其中,ι代表醫(yī)院客戶端點(diǎn)的醫(yī)療信息數(shù)據(jù)寬帶,η代表冗余醫(yī)療信息數(shù)據(jù)重構(gòu)時(shí)延,以上述結(jié)果為依據(jù),利用分?jǐn)?shù)階Fourier變換法得到冗余醫(yī)療信息數(shù)據(jù)流刪除函數(shù):
Uk=[uk1,uk2,…,ukj,…uki]
(12)
其中,Uk代表冗余醫(yī)療信息數(shù)據(jù)流刪除函數(shù),u代表冗余醫(yī)療信息數(shù)據(jù)流刪除函數(shù)中的函數(shù)子集,綜上分析,采用3階累積量切片,將醫(yī)療信息數(shù)據(jù)劃分為若干個(gè)塊,根據(jù)冗余醫(yī)療信息數(shù)據(jù)特征的分析,對(duì)每個(gè)數(shù)據(jù)塊中的冗余數(shù)據(jù)進(jìn)行徹底刪除。
為了證明基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法的可實(shí)踐性,需要進(jìn)行一次仿真實(shí)驗(yàn)。在Linux的環(huán)境下搭建醫(yī)療信息數(shù)據(jù)存儲(chǔ)實(shí)驗(yàn)仿真平臺(tái)。實(shí)驗(yàn)數(shù)據(jù)取自于北京解放軍醫(yī)院總部的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng),利用本文所提方法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行存儲(chǔ),由此觀察其整體有效性。表1為在數(shù)量相同的醫(yī)療信息數(shù)據(jù)下,文獻(xiàn)[8]所提方法、文獻(xiàn)[9]所提方法和文獻(xiàn)[10]所提方法與本文所提方法,醫(yī)療信息數(shù)據(jù)存儲(chǔ)時(shí)間(s)的對(duì)比。
表1 不同方法下數(shù)據(jù)存儲(chǔ)時(shí)間的對(duì)比
通過對(duì)表1的分析,文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]所提方法與本文所提方法,在醫(yī)療信息數(shù)據(jù)量相同的情況下,本文所提方法存儲(chǔ)所用時(shí)間遠(yuǎn)遠(yuǎn)低于文獻(xiàn)所提方法,相比較之下,文獻(xiàn)[10]所提方法與本文所提方法存儲(chǔ)時(shí)間相差最大,這主要是因?yàn)槔帽疚姆椒ㄟM(jìn)行數(shù)據(jù)存儲(chǔ)時(shí),對(duì)冗余醫(yī)療信息數(shù)據(jù)進(jìn)行了刪除操作,節(jié)省了存儲(chǔ)時(shí)間,提高了存儲(chǔ)精度,證明了本文所提方法的可行性較強(qiáng)。表2是文獻(xiàn)[8]所提方法與本文所提方法,冗余醫(yī)療信息數(shù)據(jù)刪除時(shí)間(s)的對(duì)比。
分析表2可知,本文所提方法在冗余醫(yī)療信息數(shù)據(jù)刪除方面明顯優(yōu)于文獻(xiàn)[8]所提方法,冗余醫(yī)療信息數(shù)據(jù)的刪除,直接影響到數(shù)據(jù)的存儲(chǔ)效率和時(shí)間,刪除的越快,表示存儲(chǔ)系統(tǒng)的整體性能越好,本文所提方法在刪除冗余醫(yī)療信息數(shù)據(jù)時(shí),先利用高斯混合模型對(duì)冗余數(shù)據(jù)特征進(jìn)行了透徹的分析,然后采用分?jǐn)?shù)階Fourier變換對(duì)冗余醫(yī)療信息數(shù)據(jù)進(jìn)行刪除,此步驟加快了數(shù)據(jù)存儲(chǔ)速度。圖3為冗余醫(yī)療信息數(shù)據(jù)查詢的控制參數(shù)f取值范圍對(duì)數(shù)據(jù)存儲(chǔ)效率(%)的影響。
表2 不同方法下冗余醫(yī)療信息數(shù)據(jù)刪除時(shí)間對(duì)比
圖3 冗余數(shù)據(jù)查詢的控制參數(shù)對(duì)存儲(chǔ)效率的影響
從圖3中可以看出,冗余醫(yī)療信息數(shù)據(jù)查詢的控制參數(shù)f取值范圍對(duì)醫(yī)療信息數(shù)據(jù)的存儲(chǔ)效率有很大影響,當(dāng)冗余數(shù)據(jù)查詢控制參數(shù)在0.05~0.06時(shí),醫(yī)療信息數(shù)據(jù)存儲(chǔ)效率曲線雖然比較平穩(wěn),但存儲(chǔ)效率并不高,在80%以下,與之相比當(dāng)冗余數(shù)據(jù)查詢控制參數(shù)在0.07~0.08時(shí),數(shù)據(jù)存儲(chǔ)效率明顯升高,基本處于97%~98%,該數(shù)據(jù)進(jìn)一步證明了本文所提方法具有良好的可行性和可靠性。圖4是文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]所提方法與本文所提方法數(shù)據(jù)聚類時(shí)間(s)對(duì)比。
圖4 不同方法下數(shù)據(jù)聚類時(shí)間對(duì)比
由圖4可知,文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]所提方法與本文所提方法在數(shù)據(jù)聚類時(shí)間上,都是隨著數(shù)據(jù)量的增加而持續(xù)增長(zhǎng)的,在相同數(shù)據(jù)量聚類時(shí),本文所提方法所用時(shí)間明顯較短,因?yàn)榛谀:幚淼尼t(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法中,利用了MPI對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行聚類存儲(chǔ),節(jié)省了數(shù)據(jù)聚類時(shí)間,提高了醫(yī)療信息數(shù)據(jù)存儲(chǔ)精度,為數(shù)據(jù)存儲(chǔ)領(lǐng)域的后續(xù)發(fā)展指明了方向。
仿真實(shí)驗(yàn)證明,所提方法可以安全可靠地對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ),減少了醫(yī)療信息數(shù)據(jù)存儲(chǔ)時(shí)間,提高了醫(yī)務(wù)人員對(duì)醫(yī)療信息數(shù)據(jù)漏洞的分析能力,降低冗余數(shù)據(jù)對(duì)醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)的干擾,為醫(yī)療界的發(fā)展提供可靠依據(jù),對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)領(lǐng)域有重要的借鑒意義。
采用當(dāng)前方法對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),無法對(duì)其進(jìn)行高精度、低誤差、穩(wěn)定可靠地存儲(chǔ),存在數(shù)據(jù)存儲(chǔ)空間易滿,存儲(chǔ)系統(tǒng)運(yùn)行有延遲,數(shù)據(jù)存儲(chǔ)效率低等問題。本文提出一種基于模糊處理的醫(yī)療信息數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)方法。并通過實(shí)驗(yàn)仿真證明,所提方法可以高效率地對(duì)醫(yī)療信息數(shù)據(jù)進(jìn)行存儲(chǔ),可行性較強(qiáng),對(duì)醫(yī)務(wù)人員醫(yī)術(shù)的提高起到了輔助作用,為該領(lǐng)域的深造鉆研提供支撐,成為該領(lǐng)域發(fā)展的重要旗幟。
[1]張 琳,譚 軍,白明澤.基于MongoDB的蛋白質(zhì)組學(xué)大數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用,2016,36(S1):232-236.
[2]陳亭玉,錢 慧.嵌入無損編碼的海量視頻數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)[J].電視技術(shù),2016,40(4):52-55.
[3]姜 德,馬游春,王悅凱,等.高速數(shù)據(jù)同步存儲(chǔ)系統(tǒng)設(shè)計(jì)[J].電子器件,2016,39(6):1421-1424.
[4]姜學(xué)東,孫海民.大數(shù)據(jù)存儲(chǔ)中的優(yōu)化架構(gòu)結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2016,39(24):66-70.
[5]王善明,嚴(yán)迎建,郭朋飛,等.基于國(guó)產(chǎn)SOC的數(shù)據(jù)加密存儲(chǔ)系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2015,41(11):34-37.
[6]任瑩暉,紀(jì)會(huì)敏,杜 勇,等.切削刀具綜合管理系統(tǒng)的數(shù)據(jù)采集和存儲(chǔ)設(shè)計(jì)研究[J].計(jì)算機(jī)應(yīng)用研究,2016,33(10):3031-3035.
[7]劉博偉,黃瑞章.基于HBase的金融時(shí)序數(shù)據(jù)存儲(chǔ)系統(tǒng)[J].中國(guó)科技論文,2016,11(20):2387-2392.
[8]雷德龍,郭殿升,陳崇成,等.基于MongoDB的矢量空間數(shù)據(jù)云存儲(chǔ)與處理系統(tǒng)[J].地球信息科學(xué)學(xué)報(bào),2014,16(4):507-516.
[9]李金猛.基于FPGA的數(shù)據(jù)采集存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電子設(shè)計(jì)工程,2016,24(13):85-87.
[10]胡曉峰,張亮紅,劉文怡,等.VC多線程流水線在數(shù)據(jù)存儲(chǔ)系統(tǒng)中的設(shè)計(jì)與實(shí)現(xiàn)[J].電子器件,2016,39(4):964-967.
Based on Fuzzy Processing of Medical Information Data Storage System Design
Zheng Jian
(First Affiliated Hospital of Harbin Medical University Information Centre,Harbin 150000,China)
In order to improve the level of medical technology, speed up the medical staff of medical information data analysis, the medical information data run more smoothly, reduce the data storage of space, need for medical information data storage system design. The current medical information data storage system of medical information data for storage, use FPGA to build the system hardware, on the basis of the hardware to medical information data storage, but in the process of storage, there is no clear the redundant data, leading to storage space is full, smaller capacity, has the problem of the normal medical information data is placed. For this, put forward a kind of medical information data storage system based on fuzzy processing design method. This method first source of health information data statistics, according to the data source to realize the hardware structure of medical data, then use mediation between the characteristics of medical information data in the similar data points for data clustering, clustering of medical information data storage, and finally by using the gaussian mixture model to analyzing characteristics of medical data redundancy, on the basis of the analysis results, using fractional Fourier transform to delete redundant medical information data, thus complete the medical information data storage based on fuzzy processing. The experimental results show that the proposed method increases the data storage capacity, reduces the redundant data storage, to speed up the medical information data storage, improved the precision of data storage, the research in the field development provides a strong basis.
blurred; medical information data; storage system design;
2017-04-11;
2017-04-21。
鄭 健(1988-),男,黑龍江哈爾濱人,初級(jí)工程師,主要從事網(wǎng)絡(luò)安全方向的研究。
1671-4598(2017)07-0298-04
10.16526/j.cnki.11-4762/tp.2017.07.074
TP333
A