劉志先
摘? 要: 針對(duì)原有診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)運(yùn)行效率低下的問題,提出基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)研究,優(yōu)化系統(tǒng)硬件,增加擴(kuò)展功能板,設(shè)置二級(jí)轉(zhuǎn)換,保證電壓的穩(wěn)定輸出?;谥悄茚t(yī)療,搭建診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)框架,判斷數(shù)據(jù)可信度,利用數(shù)據(jù)質(zhì)量評(píng)估算法,完成基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)設(shè)計(jì)。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)系統(tǒng)與原有系統(tǒng)相比,運(yùn)行時(shí)長縮短了56%左右,其運(yùn)行效率得到大幅度提升,為患者與醫(yī)護(hù)人員提供更好的服務(wù)。
關(guān)鍵詞: 診斷大數(shù)據(jù); 自動(dòng)分析系統(tǒng); 智能醫(yī)療; 系統(tǒng)設(shè)計(jì); 數(shù)據(jù)處理; 性能測(cè)試
中圖分類號(hào): TN919?34; TP311.13? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)10?0184?03
Research on diagnosis big data automatic analysis system based on intelligent medicine
LIU Zhixian
(School of Electronic and Information Engineering, Beibu Gulf University, Qinzhou 535011, China)
Abstract: In allusion to the low operating efficiency of the original diagnosis big data automatic analysis system, a research of diagnosis big data automatic analysis system based on intelligent medicine is proposed. The system′hardware is optimized, extended function board is added, and the secondary transformation is set, so as to ensure the stable output of voltage. The framework of automatic analysis system for diagnosis big data is built based on intelligent medicine to judge the data reliability, and the design of diagnosis big data automatic analysis system based on intelligent medicine is completed by means of the data quality evaluation algorithm. The experimental results show that, in comparison with the original system, the running time of the designed system is reduced by 56%, and its running efficiency is greatly improved, which provides better services for patients and medical workers.
Keywords: diagnosis data analysis; automatic analysis system; intelligent medicine; system design; data process; performance test
0? 引? 言
隨著信息通信技術(shù)的發(fā)展,以及信息感知方式的變化,傳統(tǒng)的醫(yī)療模式與健康服務(wù)模式已經(jīng)發(fā)生改變,將患者的情況轉(zhuǎn)化成數(shù)據(jù)信息成為發(fā)展趨勢(shì)[1]。將醫(yī)學(xué)建立在數(shù)據(jù)分析的基礎(chǔ)上,利用科技手段作為輔助,通過患者的電子病歷以及健康檔案,及時(shí)準(zhǔn)確地了解患者的情況。巨大的醫(yī)療數(shù)據(jù)平臺(tái)將成為疾病診治最好的助手[2?3]。因原有診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)運(yùn)行效率低下,提出基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)研究。
1? 硬件設(shè)計(jì)
為了滿足當(dāng)前智能醫(yī)療系統(tǒng)對(duì)于診斷大數(shù)據(jù)自動(dòng)分析領(lǐng)域的硬件需求,在原有硬件設(shè)施的基礎(chǔ)上,優(yōu)化存儲(chǔ)模塊電路,使存儲(chǔ)模塊能夠在處理復(fù)雜數(shù)據(jù)的情況下保持正常運(yùn)行。
1.1? 系統(tǒng)硬件總體結(jié)構(gòu)
診斷大數(shù)據(jù)的自動(dòng)分析系統(tǒng)是在核心控制板上擴(kuò)展設(shè)計(jì)的,核心控制板與擴(kuò)展功能板通過FMC接口連接,其中核心控制板上主要包括FPGA時(shí)鐘以及相關(guān)電路[4?5],在擴(kuò)展板上完成對(duì)其原有硬件的優(yōu)化設(shè)計(jì)。系統(tǒng)硬件總體結(jié)構(gòu)如圖1所示。
1.2? 存儲(chǔ)模塊電路設(shè)計(jì)
由于處理的數(shù)據(jù)較為復(fù)雜,整個(gè)數(shù)據(jù)存儲(chǔ)模塊需要多種供電電壓[6?7]。主控芯片所需要的核電壓為1.2 V,輔助電壓為1.5 V,對(duì)外輸入所需要的電壓為28 V,數(shù)據(jù)接口電路所需要的電壓為3.3 V。為此將存儲(chǔ)模塊的電壓轉(zhuǎn)換處理,由于大多電源轉(zhuǎn)換芯片所允許輸入的電壓值小于28 V,無法在一次轉(zhuǎn)換內(nèi)全部完成,為此設(shè)置二級(jí)轉(zhuǎn)換。首先將28 V高電壓轉(zhuǎn)換成較為穩(wěn)定的5 V電壓,再將5 V電壓轉(zhuǎn)換成其他所需要的電壓值[8?9]。在轉(zhuǎn)換器模塊前端,設(shè)置濾波模塊,隔離噪聲,使電壓輸出更加穩(wěn)定。
2? 軟件設(shè)計(jì)
在系統(tǒng)硬件平臺(tái)搭建完成后,在其基礎(chǔ)上設(shè)計(jì)基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)軟件部分。
2.1? 數(shù)據(jù)可信度判斷
對(duì)于診斷大數(shù)據(jù)自動(dòng)分析而言,數(shù)據(jù)的可信度評(píng)估是必不可少的。判斷數(shù)據(jù)的真實(shí)性以及可信程度,利用層次分析法將評(píng)估結(jié)果綜合化,保證大數(shù)據(jù)自動(dòng)分析所得結(jié)果準(zhǔn)確[10]。
首先將所收集到的信息數(shù)據(jù)導(dǎo)入至數(shù)據(jù)庫,篩選數(shù)據(jù)庫中的數(shù)據(jù)信息,將其中的數(shù)據(jù)質(zhì)量劃分為5個(gè)維度。針對(duì)每個(gè)不同的維度數(shù)據(jù),設(shè)置不同的評(píng)估規(guī)則,分析數(shù)據(jù)庫中的哪些數(shù)據(jù)將會(huì)對(duì)數(shù)據(jù)的整體質(zhì)量產(chǎn)生影響,并優(yōu)先評(píng)估對(duì)其質(zhì)量影響比重較大的數(shù)據(jù)信息[11?12]。完成初步評(píng)估后,將可信度較低的數(shù)據(jù)從數(shù)據(jù)庫中移除,確定數(shù)據(jù)質(zhì)量的5個(gè)維度及其相應(yīng)占比,并結(jié)合實(shí)際情況,合理設(shè)置5個(gè)維度的評(píng)估規(guī)則。以此為基準(zhǔn),評(píng)估數(shù)據(jù)質(zhì)量,綜合每個(gè)維度的評(píng)估結(jié)果,得到最終的可信度評(píng)估結(jié)果。
利用定性預(yù)測(cè)類方法,確定所得結(jié)果的準(zhǔn)確性,將所得結(jié)果分為4類,分別為:將正類預(yù)測(cè)為正類數(shù);將正類預(yù)測(cè)為負(fù)類數(shù);將負(fù)類預(yù)測(cè)為正類數(shù);將負(fù)類預(yù)測(cè)為負(fù)類數(shù)。其準(zhǔn)確率如下:
[P=TPTP+FP]? ? (1)
式中:[TP]為將正類預(yù)測(cè)為正類數(shù);[FP]為將負(fù)類預(yù)測(cè)為正類數(shù)。則不可信數(shù)據(jù)的召回率如下:
[R=TPTP+FN]? ? (2)
式中,[FN]為將正類預(yù)測(cè)為負(fù)類數(shù)。根據(jù)式(1)與式(2)能夠得到準(zhǔn)確率和召回率的調(diào)和平均值為:
[F=2TP2TP+FP+FN]? ? (3)
根據(jù)上述計(jì)算分析其可信度,得到可信數(shù)據(jù)集,計(jì)算不同維度指標(biāo)的數(shù)據(jù)質(zhì)量,其數(shù)據(jù)質(zhì)量評(píng)估算法的部分代碼如下:
int addition();
{
Trust_analyse(S);? ? ? ? ? ? ? ? ? ? ? ? ? ?//分析數(shù)據(jù)集可信度
END FOR
Delete_untrust(S);? ? ? ? ? ? ? ? ? ? ? ? ? ? ?//移除不可信數(shù)據(jù)
Return;
}
至此得到數(shù)據(jù)可信度的評(píng)估結(jié)果,并在此基礎(chǔ)上,利用Hadoop分布式基礎(chǔ)架構(gòu),構(gòu)建基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析模型。
2.2? 基于智能醫(yī)療的診斷大數(shù)據(jù)處理模式轉(zhuǎn)換
大規(guī)模數(shù)據(jù)分析系統(tǒng)的數(shù)據(jù)處理需要借助Hadoop分布式系統(tǒng)基礎(chǔ)架構(gòu),采用主從式結(jié)構(gòu),由命名節(jié)點(diǎn)管理文件系統(tǒng),維護(hù)信息列表,由數(shù)據(jù)節(jié)點(diǎn)負(fù)責(zé)信息的存儲(chǔ)以及用戶讀/寫請(qǐng)求的響應(yīng)。其具體情況如圖2所示。
根據(jù)圖2運(yùn)行過程,生成基于智能醫(yī)療的大數(shù)據(jù)自動(dòng)分析模板,對(duì)采集到的大規(guī)模數(shù)據(jù)查詢與分析。至此,完成基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)研究,為驗(yàn)證該系統(tǒng)性能,設(shè)計(jì)仿真實(shí)驗(yàn)。
3? 系統(tǒng)性能測(cè)試
為了驗(yàn)證基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)的有效性,對(duì)比原有的系統(tǒng),進(jìn)行對(duì)照實(shí)驗(yàn)。
3.1? 性能測(cè)試過程
該性能測(cè)試實(shí)驗(yàn)選擇在某知名醫(yī)科大學(xué)的附屬醫(yī)院網(wǎng)絡(luò)中心內(nèi)部完成。由于該實(shí)驗(yàn)過程所需的數(shù)據(jù)傳輸工作量較大,為此需要利用磁盤陣列存儲(chǔ)平臺(tái),實(shí)現(xiàn)醫(yī)療服務(wù)器的存儲(chǔ)擴(kuò)容,并利用光纖交換機(jī),完成各實(shí)驗(yàn)設(shè)備間的數(shù)據(jù)交換,其拓?fù)浣Y(jié)構(gòu)如圖3所示。
實(shí)驗(yàn)采用100萬條某慢性病的臨床處方數(shù)據(jù),同時(shí)運(yùn)行所設(shè)計(jì)的分析系統(tǒng)與原有系統(tǒng),對(duì)比兩者在數(shù)據(jù)關(guān)聯(lián)分析時(shí)的所用時(shí)長,得出對(duì)比結(jié)果。
3.2? 測(cè)試結(jié)果分析
原有系統(tǒng)與所設(shè)計(jì)系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn),得到具體對(duì)比結(jié)果如圖4所示。
從圖4中能夠看出,所設(shè)計(jì)系統(tǒng)的運(yùn)行時(shí)長與原有系統(tǒng)相比,明顯縮短,具體運(yùn)行效率差異如表1所示。
由表1中的數(shù)據(jù)能夠得到,在測(cè)試樣本數(shù)相同的情況下,原有系統(tǒng)的運(yùn)行時(shí)長在30~36 s的范圍之間,其運(yùn)行速度較為緩慢,不能在短時(shí)間內(nèi)完成大數(shù)據(jù)的自動(dòng)分析,不可精準(zhǔn)查到所需要的信息數(shù)據(jù),無法滿足醫(yī)護(hù)人員以及患者的需求;所設(shè)計(jì)的系統(tǒng)運(yùn)行時(shí)長穩(wěn)定在12~18 s的范圍內(nèi),與原有系統(tǒng)相比,運(yùn)行時(shí)長縮短了56%左右,其運(yùn)行效率得到穩(wěn)定提升。由此可見,所設(shè)計(jì)的系統(tǒng)能夠準(zhǔn)確快速地完成診斷大數(shù)據(jù)的自動(dòng)分析,優(yōu)化了用戶的使用體驗(yàn)。
4? 結(jié)? 語
結(jié)合目前各大醫(yī)院的實(shí)際情況,設(shè)計(jì)基于智能醫(yī)療的診斷大數(shù)據(jù)自動(dòng)分析系統(tǒng)。該系統(tǒng)實(shí)施成本低,數(shù)據(jù)分析準(zhǔn)確,可擴(kuò)展性能強(qiáng),優(yōu)化了原有系統(tǒng)的一系列問題,希望能夠?yàn)獒t(yī)護(hù)人員在臨床診斷中提供支持,促進(jìn)各大醫(yī)院的智能信息化建設(shè)發(fā)展,為相關(guān)領(lǐng)域的研究提供理論依據(jù)。
參考文獻(xiàn)
[1] 俞思偉,范昊,王菲,等.基于知識(shí)圖譜的智能醫(yī)療研究[J].醫(yī)療衛(wèi)生裝備,2017,38(3):109?111.
[2] 高奇琦,呂俊延.智能醫(yī)療:人工智能時(shí)代對(duì)公共衛(wèi)生的機(jī)遇與挑戰(zhàn)[J].電子政務(wù),2017,12(11):11?19.
[3] 曹艷林,王將軍,陳璞,等.人工智能對(duì)醫(yī)療服務(wù)的機(jī)遇與挑戰(zhàn)[J].中國醫(yī)院,2018,22(6):33?36.
[4] 韋哲,薛翔,王能才.人工智能在糖尿病診斷中的應(yīng)用[J].中國醫(yī)學(xué)裝備,2017,14(12):142?145.
[5] 翁銘,鄭博,吳茂念,等.基于深度學(xué)習(xí)的DR篩查智能診斷系統(tǒng)的初步研究[J].國際眼科雜志,2018,18(3):568?571.
[6] 趙一鳴,左秀然.PACS與人工智能輔助診斷的集成應(yīng)用[J].中國數(shù)字醫(yī)學(xué),2018,13(4):20?22.
[7] 張濤,郝曉玲,張玥杰,等.基于BP?AsymBoost的醫(yī)療診斷模型[J].系統(tǒng)工程理論與實(shí)踐,2017,37(6):1654?1664.
[8] 王博超,張新峰.基于人工智能和臨床診斷的上肢康復(fù)評(píng)估方法研究進(jìn)展[J].北京生物醫(yī)學(xué)工程,2018,37(1):103?108.
[9] 冷喜武,陳國平,白靜潔,等.智能電網(wǎng)監(jiān)控運(yùn)行大數(shù)據(jù)分析系統(tǒng)總體設(shè)計(jì)[J].電力系統(tǒng)自動(dòng)化,2018(12):166?172.
[10] 李云婷,嚴(yán)京海,孫峰,等.基于大數(shù)據(jù)分析與認(rèn)知技術(shù)的空氣質(zhì)量預(yù)報(bào)預(yù)警平臺(tái)[J].中國環(huán)境管理,2017,9(2):31?36.
[11] 余英,郭镥,鄧琨,等.用電采集數(shù)據(jù)分析和智能監(jiān)測(cè)系統(tǒng)中大數(shù)據(jù)分析的設(shè)計(jì)研究[J].自動(dòng)化與儀器儀表,2017,19(5):162?163.
[12] 廖亮,虞宏霄.基于Hadoop的醫(yī)療大數(shù)據(jù)分析系統(tǒng)的研究與設(shè)計(jì)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(4):49?53.