国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于醫(yī)藥健康的大數(shù)據(jù)可視化探究

2019-09-10 07:22孟彥霖王祖維葉力銘王嘉雯劉天華夏輝
電子商務(wù) 2019年2期
關(guān)鍵詞:生物醫(yī)藥聚類(lèi)分析大數(shù)據(jù)

孟彥霖 王祖維 葉力銘 王嘉雯 劉天華 夏輝

摘要:從大數(shù)據(jù)和醫(yī)藥健康問(wèn)題出發(fā),首先闡述了大數(shù)據(jù)對(duì)醫(yī)藥健康行業(yè)的促進(jìn)作用,介紹了相應(yīng)的背景知識(shí)。據(jù)此設(shè)計(jì)出一個(gè)基于大數(shù)據(jù)的醫(yī)藥健康平臺(tái),導(dǎo)入了2017-2018年度部分藥品銷(xiāo)售數(shù)據(jù)進(jìn)行分析及展示了系統(tǒng)效果。最后對(duì)醫(yī)藥健康大數(shù)據(jù)目前存在的問(wèn)題進(jìn)行了分析總結(jié)。

關(guān)鍵詞:大數(shù)據(jù);生物醫(yī)藥;健康和醫(yī)療;聚類(lèi)分析

隨著移動(dòng)互聯(lián)網(wǎng)的普及、各種智能數(shù)據(jù)采集和數(shù)據(jù)存儲(chǔ)技術(shù)的進(jìn)步,人類(lèi)活動(dòng)產(chǎn)生的數(shù)據(jù)正以驚人的速度增長(zhǎng),這些數(shù)據(jù)往往難以被傳統(tǒng)的管理系統(tǒng)有效的整理,而能在各種各樣類(lèi)型的數(shù)據(jù)中,能夠快速獲得有價(jià)值信息的大數(shù)據(jù)技術(shù)被人們所熟知起來(lái)。大數(shù)據(jù)是一種以PB為單位的數(shù)據(jù)集,能夠有效且經(jīng)濟(jì)地存儲(chǔ)、管理、處理的復(fù)雜的數(shù)據(jù)。如今,大數(shù)據(jù)已經(jīng)滲透到人們生活與社會(huì)發(fā)展的各個(gè)方面,

隨著互聯(lián)網(wǎng)技術(shù)的日新月異,數(shù)據(jù)采集變得方便,數(shù)據(jù)分析也變得尤為重要。大數(shù)據(jù)在生活,工業(yè),醫(yī)藥,體育等眾多領(lǐng)域都得到廣泛應(yīng)用。在生物醫(yī)藥領(lǐng)域,大數(shù)據(jù)發(fā)揮的作用也愈發(fā)關(guān)鍵。由于我國(guó)老齡化人口數(shù)量不斷增加和慢性病患者數(shù)量龐大,導(dǎo)致醫(yī)藥數(shù)據(jù)量大,類(lèi)型復(fù)雜。醫(yī)藥大數(shù)據(jù)可提高服務(wù)效率.例如歷史用藥信息可提高醫(yī)生診療速度和準(zhǔn)確性。醫(yī)藥大數(shù)據(jù)也可以減少醫(yī)療資源浪費(fèi),提高其利用率。例如藥品監(jiān)管可減少藥品浪費(fèi),減少無(wú)效診療,醫(yī)保欺詐。大數(shù)據(jù)還能夠幫助醫(yī)生更好的了解病人;快速根據(jù)病情進(jìn)行個(gè)性化治療,通過(guò)數(shù)據(jù)預(yù)測(cè)疾病爆發(fā)等等。

1、醫(yī)藥健康大數(shù)據(jù)平臺(tái)

為了能夠更好的處理醫(yī)藥健康問(wèn)題,我們根據(jù)醫(yī)藥大數(shù)據(jù)的特點(diǎn)提出了醫(yī)藥健康大數(shù)據(jù)平臺(tái)。首先,醫(yī)院治療并錄入患者的信息,并將數(shù)據(jù)以安全的信道傳輸?shù)焦芾砥脚_(tái),管理者及時(shí)反饋并收集用戶(hù)的信息,由數(shù)據(jù)分析師進(jìn)行評(píng)估,再傳遞給私人醫(yī)生,社區(qū)醫(yī)生等,給患者合理的建議。主要的平臺(tái)流程如下圖所示。

1.1 k-means聚類(lèi)分析算法

數(shù)據(jù)采集是數(shù)據(jù)分析中必不可少的,在本文中,我們采用K-means聚類(lèi)分析來(lái)采集數(shù)據(jù),k-meons算法由MacQueen在1967年提出,屬于基于距離的聚類(lèi)方法中的一種基本的劃分方法,其函數(shù)定義為:

其中,uj是類(lèi)Wj中數(shù)據(jù)對(duì)象的均值,uj是C個(gè)聚類(lèi)中心,分別代表C個(gè)類(lèi)。K- Means算法首先初始化C個(gè)類(lèi)簇中心,然后計(jì)算各個(gè)數(shù)據(jù)對(duì)象到聚類(lèi)中心的距離,并對(duì)其分類(lèi),把數(shù)據(jù)對(duì)象劃分至距離其最近的聚類(lèi)中心所在類(lèi)簇中,接著根據(jù)所得類(lèi)簇,繼續(xù)更新類(lèi)簇中心,一直迭代到最大次數(shù)?;蛘邇纱蔚鶭c的差值小于某一閾值時(shí),迭代終止,得到最終的聚類(lèi)結(jié)果。由于K-Means算法易于描述,工作效率高。在文本聚類(lèi)領(lǐng)域,K-Meons算法已經(jīng)成為基本的算法。

1.2 設(shè)計(jì)流程

首先,通過(guò)sporkstreaming實(shí)時(shí)從flume獲取數(shù)據(jù)并將數(shù)據(jù)導(dǎo)人數(shù)據(jù)庫(kù),在ideo集成開(kāi)發(fā)環(huán)境下編寫(xiě)spark程序,將程序通過(guò)maven打包成jar包提交到spark集群,然后在spark環(huán)境下運(yùn)行jar包來(lái)分析數(shù)據(jù)存人數(shù)據(jù)庫(kù),再通過(guò)JavaWeb進(jìn)行前端布局與連接數(shù)據(jù)庫(kù)操作,最后通過(guò)echarts的web項(xiàng)目從數(shù)據(jù)庫(kù)提取數(shù)據(jù),將分析得到的數(shù)據(jù)以更加直觀,科學(xué)的形式呈現(xiàn)在系統(tǒng)管理者面前。

1.3 平臺(tái)效果

由數(shù)據(jù)提供方提供的‘2017-2018年藥品銷(xiāo)售數(shù)據(jù)’截取5000條藥品銷(xiāo)售情況,進(jìn)行數(shù)值分析并導(dǎo)人平臺(tái),在管理者模塊中,分析得出的結(jié)果以六大板塊展示出來(lái)分別為:患者購(gòu)藥行為對(duì)比、購(gòu)買(mǎi)某類(lèi)藥物的患者的性別對(duì)比、購(gòu)買(mǎi)某類(lèi)藥物的患者痊愈后回饋某類(lèi)藥物的評(píng)分對(duì)比各省份的某類(lèi)藥物的銷(xiāo)量對(duì)比另女患者各個(gè)年齡段對(duì)比、針對(duì)某病癥的各類(lèi)藥物銷(xiāo)量對(duì)比、各省份的某類(lèi)藥物的銷(xiāo)量對(duì)比和患者痊愈后回饋藥物評(píng)分對(duì)比。由于數(shù)據(jù)提供方表示不能在作品中出現(xiàn)真實(shí)名稱(chēng),所以我們用某類(lèi)代替。具體數(shù)據(jù)如圖所示。

2、問(wèn)題與挑戰(zhàn)

通過(guò)可視化數(shù)據(jù)分析,系統(tǒng)管理者能較為直觀,清晰的分析數(shù)據(jù)。盡管如此.在實(shí)際應(yīng)用中還面臨許多問(wèn)題和挑戰(zhàn)。

2.1 數(shù)據(jù)處理

對(duì)小數(shù)據(jù)而言,最基本就是要減少錯(cuò)誤,保證質(zhì)量,但是對(duì)于大數(shù)據(jù)來(lái)講,允許個(gè)別不精確的出現(xiàn)是其基本的特征,而非缺點(diǎn)。由于分散在醫(yī)療藥物信息共享平臺(tái)下各類(lèi)醫(yī)療機(jī)構(gòu)中的大量異常數(shù)據(jù),將這些數(shù)據(jù)進(jìn)行采集,整合十分困難。對(duì)個(gè)人信息來(lái)講,對(duì)每一次的歷史診療都必須準(zhǔn)確無(wú)誤,但是只看重這些高質(zhì)量精確數(shù)據(jù),而忽視那些不精確數(shù)據(jù)的利用將無(wú)法適應(yīng)大數(shù)據(jù)時(shí)代,所以對(duì)數(shù)據(jù)的處理就顯得尤為重要。

2.2 醫(yī)藥數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,難于共享

雖然醫(yī)藥大數(shù)據(jù)已經(jīng)研發(fā)十幾年,我國(guó)也擁有海量的大數(shù)據(jù)資源,但現(xiàn)在各大醫(yī)院的大量信息還沒(méi)有互通起來(lái),同時(shí)缺少有效分類(lèi)。其中數(shù)據(jù)信息標(biāo)準(zhǔn)不統(tǒng)一是最大的問(wèn)題,各家醫(yī)院的信息標(biāo)準(zhǔn),接口都不盡相同。有些數(shù)據(jù)是視頻,音頻等。非傳統(tǒng)結(jié)構(gòu)化的文本,導(dǎo)致難于導(dǎo)入程序中,使醫(yī)藥數(shù)據(jù)利用率低,難于共享。

2.3 安全隱私缺少保障

數(shù)據(jù)的安全與隱私缺少保障;同時(shí)醫(yī)藥大數(shù)據(jù)相關(guān)領(lǐng)域的法律體系不太完善,醫(yī)院等醫(yī)療機(jī)構(gòu)服務(wù)器存人大量個(gè)人私密信息,一旦被敵手獲取,對(duì)個(gè)人安全造成嚴(yán)重威脅。

3、結(jié)束語(yǔ)

通過(guò)我們的大數(shù)據(jù)平臺(tái),管理者和分析師能更為直觀的整理分析醫(yī)藥數(shù)據(jù)。目前大數(shù)據(jù)在醫(yī)藥方面還處于探索階段,但是已經(jīng)展現(xiàn)了顛覆醫(yī)藥行業(yè)的潛力。我們要積極解決目前存在的數(shù)據(jù)處理,標(biāo)準(zhǔn)不統(tǒng)一等有關(guān)問(wèn)題,不斷完善數(shù)據(jù)平臺(tái)。相信隨著大數(shù)據(jù)的發(fā)展,生物醫(yī)藥大數(shù)據(jù)技術(shù)會(huì)更加改變?nèi)祟?lèi)的生活。

參考文獻(xiàn)

[1]馬家奇,公共衛(wèi)生大數(shù)據(jù)應(yīng)用叨.中國(guó)衛(wèi)生信息管理雜志,2014.

[2]俞國(guó)培,包小源,黃新霆等,醫(yī)療健康大數(shù)據(jù)的種類(lèi)、性質(zhì)及有關(guān)問(wèn)題[J].醫(yī)學(xué)信息學(xué)雜志,2014, 35(6): 9-12.

[3]張巍,大數(shù)據(jù)以及火數(shù)據(jù)處理技術(shù)在醫(yī)院信息化建設(shè)中的應(yīng)用,《科技風(fēng)》,2018(1):58-58

[4]程方慧,泥瑾,大數(shù)據(jù)處理技術(shù)在醫(yī)院信息化中的應(yīng)用,《網(wǎng)絡(luò)安全技術(shù)與應(yīng)用》,2017(10J:67-67

[5] Carolinas heahhcare system[EB/OL]. http://www.ehoose carolinasheahheare. ore,/, 2015.

[6] Sharma S,Mangat V.Technology and trends to handlebig data: survey. Proceedings of the 5th InternationalConference on Advanced Computing&CommunicationTechnologies(ACCT),Haryana, India, 2015: 266~271

[7] Kelly J. Big data vendor revenue and market forecast.http://www.kdnuggets. com/2014/04/big-data-vendor-analysis-clusters.html, 2014

猜你喜歡
生物醫(yī)藥聚類(lèi)分析大數(shù)據(jù)
農(nóng)村居民家庭人均生活消費(fèi)支出分析
新三板生物醫(yī)藥企業(yè)價(jià)值評(píng)估問(wèn)題研究
基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
基于聚類(lèi)分析的互聯(lián)網(wǎng)廣告投放研究
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
“縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
京津冀跨域生物醫(yī)藥創(chuàng)新網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)研究
衢州市| 乌恰县| 孟州市| 九寨沟县| 汝阳县| 平舆县| 会昌县| 奇台县| 沅江市| 正蓝旗| 仁化县| 绥中县| 烟台市| 淳化县| 内丘县| 嘉鱼县| 贞丰县| 沙田区| 临江市| 上高县| 会同县| 桑植县| 咸宁市| 兴宁市| 衡阳县| 虞城县| 长岛县| 海林市| 阿拉善右旗| 佳木斯市| 富裕县| 阿克| 佛山市| 北安市| 清新县| 怀仁县| 衡东县| 达州市| 天等县| 丹棱县| 吴川市|