国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代必知

2018-11-28 02:43:12應(yīng)斌武
檢驗(yàn)醫(yī)學(xué)與臨床 2018年22期
關(guān)鍵詞:結(jié)構(gòu)化醫(yī)療信息

廖 玍,應(yīng)斌武,關(guān) 明,張 本

(1.四川大學(xué)華西口腔醫(yī)院/華西口腔醫(yī)學(xué)院信息中心,成都 610041;2.四川大學(xué)華西醫(yī)院實(shí)驗(yàn)醫(yī)學(xué)科/四川大學(xué)華西臨床醫(yī)學(xué)院醫(yī)學(xué)檢驗(yàn)系,成都 610041;3.復(fù)旦大學(xué)附屬華山醫(yī)院中心實(shí)驗(yàn)室,上海 200040;4.中國(guó)人民解放軍陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院流行病學(xué)中心,重慶 400038)

近年來(lái),隨著計(jì)算機(jī)及信息技術(shù)的飛速發(fā)展和行業(yè)普及應(yīng)用,行業(yè)應(yīng)用系統(tǒng)規(guī)模迅速增大,行業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)呈爆炸式增長(zhǎng)。西方發(fā)達(dá)國(guó)家已經(jīng)從科技戰(zhàn)略層面上提出一系列的大數(shù)據(jù)研究計(jì)劃來(lái)推動(dòng)大數(shù)據(jù)技術(shù)的探索、研究及應(yīng)用。大數(shù)據(jù)帶來(lái)巨大挑戰(zhàn)的同時(shí)也帶來(lái)了巨大的商業(yè)機(jī)遇,不斷產(chǎn)生的海量大數(shù)據(jù)包含很多小數(shù)據(jù)不具備的潛在深度價(jià)值,數(shù)據(jù)分析挖掘能夠?qū)π袠I(yè)、企業(yè)帶來(lái)巨大的商業(yè)價(jià)值,對(duì)實(shí)現(xiàn)各種高附加值的服務(wù)打下堅(jiān)實(shí)的理論基礎(chǔ)及創(chuàng)新應(yīng)用方法,能夠進(jìn)一步提升行業(yè)、企業(yè)的經(jīng)濟(jì)效益及社會(huì)效益。

來(lái)源于各個(gè)不同領(lǐng)域的大數(shù)據(jù)盡管代表著不同的事物,隱含著不同的信息,但是都具備4個(gè)重要特征,簡(jiǎn)稱(chēng)4V特征,即大容量(volume)、快速更新(velocity)、多類(lèi)型(variety)和高價(jià)值(value)。所謂大容量,雖然沒(méi)有一個(gè)絕對(duì)的標(biāo)準(zhǔn),但與傳統(tǒng)數(shù)據(jù)量相對(duì)一般都在TB級(jí)別以上。Velocity是指數(shù)據(jù)產(chǎn)生和更新的速度非???。Variety是指數(shù)據(jù)種類(lèi)繁多,除了文字信息以外,還包括各種圖像、圖形、視頻及聲音等多媒體數(shù)據(jù)。Value是指大數(shù)據(jù)中隱藏了極高價(jià)值的信息,這些信息需要通過(guò)機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘才能轉(zhuǎn)化為人類(lèi)所能理解的知識(shí)。

大數(shù)據(jù)在醫(yī)療行業(yè)的應(yīng)用能夠顯著提高醫(yī)療效率和醫(yī)療效果,能夠更加合理調(diào)配醫(yī)療資源。醫(yī)院在建立大數(shù)據(jù)倉(cāng)庫(kù)及云計(jì)算服務(wù)的平臺(tái)上,通過(guò)對(duì)現(xiàn)有模型的優(yōu)化及開(kāi)發(fā)新模型,能夠使自身優(yōu)勢(shì)更加充分發(fā)揮,使各種資源進(jìn)行統(tǒng)一協(xié)調(diào),提高效率,有效減少寶貴的醫(yī)療資源浪費(fèi)。在大數(shù)據(jù)的支撐下,一些新型數(shù)據(jù)分析模型的運(yùn)用,如:Hadoop、機(jī)器學(xué)習(xí)(machine learning,ML)、自然語(yǔ)言處理(natural language processing,NLP)等將對(duì)醫(yī)療行業(yè)帶來(lái)質(zhì)的飛躍,從而引導(dǎo)醫(yī)療行業(yè)在諸多方面發(fā)生深刻變革。大數(shù)據(jù)已經(jīng)逐漸深入人類(lèi)的日常生活,醫(yī)療行業(yè)的從業(yè)者有必要掌握大數(shù)據(jù)的知識(shí)及方法,并加以合理運(yùn)用,方能將其作用發(fā)揮出來(lái),持續(xù)改進(jìn)醫(yī)療的研究及實(shí)踐,提升人類(lèi)健康水平。

筆者在此邀請(qǐng)了另外3位專(zhuān)家從不同角度對(duì)大數(shù)據(jù)關(guān)鍵問(wèn)題進(jìn)行解讀。

廖 玍

1 如何看待大數(shù)據(jù)(big data)時(shí)代到來(lái)

廖玍:技術(shù)日新月異的今天,人們看到7 nm芯片已經(jīng)誕生,5G通訊[1]觸手可及,隨著數(shù)據(jù)爆炸式增長(zhǎng),人類(lèi)科學(xué)已經(jīng)突破了試驗(yàn)歸納、模型推演、仿真模擬,隨之演進(jìn)到科學(xué)第四范式(paradigm),即數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(data-intensive scientific discovery),也就是常說(shuō)的“大數(shù)據(jù)”[2]。從根本上說(shuō),大數(shù)據(jù)使我們能夠收集和分析我們正在產(chǎn)生的大量數(shù)據(jù)。 大數(shù)據(jù)背后的理念是我們?cè)诨ヂ?lián)網(wǎng)上做的每件事都留下了數(shù)字足跡。 這種分析不斷增長(zhǎng)的數(shù)據(jù)量的能力正在徹底改變?nèi)藗兝斫馐澜缂捌渲械囊磺蟹绞健?有了這么多信息,大數(shù)據(jù)的整合在人們的日常生活中是不可避免的。 大數(shù)據(jù)是如此之大,它會(huì)時(shí)刻影響我們的工作、鍛煉和購(gòu)物方式,而這僅僅是個(gè)開(kāi)始。

應(yīng)斌武

應(yīng)斌武:大數(shù)據(jù)可能看不見(jiàn),摸不著,卻在潛移默化地改變?nèi)祟?lèi)的生產(chǎn)、生活。隨著人們對(duì)數(shù)據(jù)的不斷積累,對(duì)數(shù)據(jù)的分析,將無(wú)數(shù)雜亂的數(shù)據(jù)精確分類(lèi)后使其服務(wù)于個(gè)體,大幅度提高了人們交流和工作效率,發(fā)揮著重大的商業(yè)效能。數(shù)據(jù)顯示,1990-2000年,《大英百科全書(shū)》(Encyclopedia Britannica)用戶(hù)數(shù)量流失十分巨大。與之相反的是“維基百科”(Wikipedia)用戶(hù)數(shù)量在2000-2010年迅猛增長(zhǎng)。雖然《大英百科全書(shū)》與“維基百科”提供的服務(wù)相差無(wú)幾,但維基百科對(duì)大數(shù)據(jù)進(jìn)行分析后能夠?qū)?nèi)容精準(zhǔn)地推送給用戶(hù),使得“維基百科”在與《大英百科全書(shū)》的競(jìng)爭(zhēng)中占盡先機(jī)。同樣,科學(xué)家試圖通過(guò)對(duì)海量的基因信息進(jìn)行分析解讀人類(lèi)生命所有的秘密。隨著人類(lèi)基因組計(jì)劃(human genome project)的順利完成,二代測(cè)序成本大幅度降低,并且在可以預(yù)見(jiàn)的將來(lái),基因測(cè)序的費(fèi)用還會(huì)有很大的下降空間,測(cè)序及分析技術(shù)的發(fā)明、發(fā)展及成本的快速降低,在人類(lèi)歷史上第一次給這一期望提供了可行的工具[3]。

關(guān) 明

關(guān)明:大數(shù)據(jù)不僅僅記錄了人們的日常行蹤,更包括了駕車(chē)習(xí)慣、閱讀習(xí)慣、閱讀愛(ài)好、購(gòu)物喜好等。試想當(dāng)人從一出生,每天的狀態(tài)就以數(shù)字的形式記錄下來(lái),這就十分利于以后對(duì)他進(jìn)行全方位的分析、教育及診治。商業(yè)可以通過(guò)這些數(shù)據(jù)分析出他的喜好,當(dāng)他進(jìn)行購(gòu)物時(shí),銷(xiāo)售就能更精確地向他推薦谷歌或者蘋(píng)果的產(chǎn)品,商店也可以分析出他愿意購(gòu)買(mǎi)電腦還是手機(jī)。十幾年前蘋(píng)果手機(jī)的出現(xiàn)使得人們的日常生活漸漸被數(shù)據(jù)化。到今天,智能手機(jī)的普及使得大數(shù)據(jù)的搜集成為現(xiàn)實(shí)?,F(xiàn)在收集數(shù)據(jù)不僅僅是將用戶(hù)的數(shù)據(jù)傳輸?shù)椒?wù)器上,還能夠及時(shí)通過(guò)大數(shù)據(jù)得出的結(jié)果反饋給用戶(hù)。即使是一塊小小的智能手表,能采集的人體數(shù)據(jù)也是海量的,并能與用戶(hù)實(shí)時(shí)交互。大數(shù)據(jù)給人們帶來(lái)的便利正在逐漸顯現(xiàn),大數(shù)據(jù)可以勾勒出人的全方位輪廓,甚至可以預(yù)測(cè)出未來(lái)會(huì)發(fā)生的事情。

張 本

張本:大數(shù)據(jù)應(yīng)用是人類(lèi)社會(huì)信息化發(fā)展的一個(gè)重要階段,其應(yīng)用給經(jīng)濟(jì)和社會(huì)生活帶來(lái)了一系列變化。隨著大數(shù)據(jù)與各行各業(yè)融合發(fā)展,智能化的綜合網(wǎng)絡(luò)將遍布社會(huì)各個(gè)角落,信息技術(shù)也將改變?nèi)藗兊膶W(xué)習(xí)方式、工作方式和娛樂(lè)方式。一大批新的就業(yè)形態(tài)和就業(yè)方式將被催生,商業(yè)交易方式、政府管理模式、社會(huì)管理結(jié)構(gòu)也會(huì)發(fā)生深刻變化。同時(shí),大數(shù)據(jù)也讓人們對(duì)于未來(lái)充滿(mǎn)無(wú)限期待。

2 如何看待結(jié)構(gòu)化數(shù)據(jù)(structured data)和非結(jié)構(gòu)化數(shù)據(jù)(unstructured data)的價(jià)值

廖玍:一提到數(shù)據(jù),大部分人會(huì)聯(lián)想到具有行列格式的結(jié)構(gòu)化數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)則是數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整,沒(méi)有預(yù)定義的數(shù)據(jù)模型,不方便用二維邏輯來(lái)表現(xiàn)的數(shù)據(jù),因此通常不適合主流關(guān)系數(shù)據(jù)庫(kù),通常包括報(bào)表、影像、掃描文檔、Web頁(yè)面及多媒體音頻和視頻信息等諸多在醫(yī)療行業(yè)大量存在的數(shù)據(jù)格式。近年來(lái),由于用于存儲(chǔ)和管理此類(lèi)數(shù)據(jù)的新平臺(tái)的出現(xiàn),它在信息系統(tǒng)中越來(lái)越普遍,并且能夠被各種商業(yè)智能和分析應(yīng)用程序組織使用。使用傳統(tǒng)的分析技術(shù)難以發(fā)掘非結(jié)構(gòu)化數(shù)據(jù)中的信息和知識(shí),但非結(jié)構(gòu)化數(shù)據(jù)卻蘊(yùn)藏著更大的寶藏。

應(yīng)斌武:縱觀全球,95%的信息都是非結(jié)構(gòu)化的,就算是人們?cè)噲D將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,結(jié)構(gòu)化的數(shù)據(jù)也不會(huì)超過(guò)10%。非結(jié)構(gòu)化數(shù)據(jù)幾乎是結(jié)構(gòu)化數(shù)據(jù)的10倍之多[4]。過(guò)去的世界信息是不對(duì)等的,但是現(xiàn)在,世界各處所能獲取的信息都是平等的。當(dāng)你傳遞一個(gè)信息時(shí),會(huì)同時(shí)產(chǎn)生大量的非結(jié)構(gòu)化數(shù)據(jù)。此前,人們難以開(kāi)發(fā)一個(gè)能準(zhǔn)確翻譯出一篇文章的軟件,而谷歌在整合了大量的非結(jié)構(gòu)化數(shù)據(jù)后,能夠根據(jù)語(yǔ)言、語(yǔ)境等數(shù)據(jù)準(zhǔn)確地將文章翻譯成不同的語(yǔ)言。Facebook也將眾多無(wú)組織的信息整合到一起,使人們不用再為處理眾多雜亂的信息而抓狂。現(xiàn)在的手機(jī)軟件,他們不需要時(shí)時(shí)刻刻監(jiān)控你的位置,只需要收集你在什么地點(diǎn)的使用次數(shù)多就可以為你制訂特別的服務(wù)。在大數(shù)據(jù)時(shí)代,廉價(jià)的非結(jié)構(gòu)化數(shù)據(jù)對(duì)于人們來(lái)說(shuō)是提升生產(chǎn)力的巨大機(jī)會(huì)。

關(guān)明:在醫(yī)療行業(yè),約80%的醫(yī)療數(shù)據(jù)是自由文本構(gòu)成的非結(jié)構(gòu)化數(shù)據(jù),其中不僅包括大量的描述性文本,也包括包含非統(tǒng)一文字的表格字段。必須通過(guò)醫(yī)學(xué)自然語(yǔ)言處理技術(shù),將非結(jié)構(gòu)化醫(yī)療數(shù)據(jù)轉(zhuǎn)化為適合計(jì)算機(jī)分析的結(jié)構(gòu)化數(shù)據(jù)是醫(yī)療大數(shù)據(jù)分析的基礎(chǔ),對(duì)醫(yī)療非結(jié)構(gòu)化數(shù)據(jù)的深究必將極大促進(jìn)醫(yī)療行業(yè)的發(fā)展。

張本:隨著越來(lái)越多的非結(jié)構(gòu)化溝通渠道和來(lái)源(電子郵件、社交等),人類(lèi)的溝通方式發(fā)生了巨大變化。需要處理所有這些非結(jié)構(gòu)化通信以及由此產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)和信息。各類(lèi)機(jī)構(gòu)需要知道如何將這些信息收集在一起并根據(jù)其中蘊(yùn)含的知識(shí)進(jìn)行發(fā)展。此外,在這些非結(jié)構(gòu)化數(shù)據(jù)中隱藏著大量其他的重要信息。 人工智能消除了對(duì)規(guī)則的需求,只有人工智能可以處理這些數(shù)據(jù),因?yàn)榉墙Y(jié)構(gòu)化數(shù)據(jù)根本無(wú)法通過(guò)傳統(tǒng)方法進(jìn)行處理。人工智能利用其“智能”超越信息本身,能夠?qū)崿F(xiàn)信息自動(dòng)處置,學(xué)習(xí)人類(lèi)行為,還可以進(jìn)行預(yù)測(cè)。

3 大數(shù)據(jù)如何在精準(zhǔn)醫(yī)療(precision medicine)領(lǐng)域發(fā)揮作用

廖玍:25%的美國(guó)人都會(huì)服用名叫舒喘靈(albuterol)的藥物。但是在服用這種藥物時(shí),傳統(tǒng)醫(yī)療并沒(méi)有考慮到患者的年齡、生活環(huán)境、呼吸空氣的情況、家里是否有寵物。不同患者都以同樣的方式服用藥物,使我們并不能知道這是否對(duì)緩解患者的病情及時(shí)、有效。同樣,在治療糖尿病、癌癥和其他疾病時(shí)也會(huì)面臨同樣的情況。傳統(tǒng)醫(yī)療的邏輯是依靠患者的癥狀、化驗(yàn)結(jié)果做出診療決策。精準(zhǔn)醫(yī)療是醫(yī)生利用患者全方位各種維度的健康及診療信息為患者制訂獨(dú)一無(wú)二的治療方案,并且因?yàn)榛蛟谌藗€(gè)體之間所具有的相似性,為一個(gè)患者所制訂的精準(zhǔn)治療方案也可以運(yùn)用于成千上萬(wàn)符合相同數(shù)據(jù)模型的患者。通過(guò)對(duì)患者基因的分析,可以發(fā)掘癌癥的發(fā)生、發(fā)展過(guò)程,并制造出新的藥物,一個(gè)很好的例子就是格列衛(wèi)(gleevec)[5]。美國(guó)哥倫比亞大學(xué)的科學(xué)家也運(yùn)用大數(shù)據(jù),對(duì)美國(guó)食品藥品監(jiān)督管理局的藥物反應(yīng)數(shù)據(jù),同時(shí)結(jié)合了一組來(lái)自30萬(wàn)患者、160萬(wàn)的心電圖數(shù)據(jù),發(fā)現(xiàn)了8組藥物混合服用可能與長(zhǎng)期性的心律異常相關(guān)[6]。其中最顯著的羅氏芬(rocephi)和蘭索拉唑(prevacid),分別單獨(dú)服用并未發(fā)現(xiàn)風(fēng)險(xiǎn),但是當(dāng)這兩種藥物同時(shí)服用時(shí),服用者會(huì)出現(xiàn)心律異常,嚴(yán)重時(shí)甚至?xí)?dǎo)致服用者死亡??茖W(xué)家們希望通過(guò)數(shù)據(jù)發(fā)掘和大數(shù)據(jù)分析,盡可能全面研究不同藥物組合可能帶來(lái)的用藥不良反應(yīng)。十年前,人們對(duì)自己的所有DNA序列進(jìn)行測(cè)序需要1億美元,五年前這個(gè)費(fèi)用需要10 000美元,而現(xiàn)在只需要1 500美元。隨著人們對(duì)自己身體健康的重視程度不斷地增強(qiáng),對(duì)醫(yī)療健康的投入在不斷地增加,而精準(zhǔn)醫(yī)療的作用就是提高有限醫(yī)療資源的運(yùn)轉(zhuǎn)效率,提高醫(yī)療質(zhì)量,降低個(gè)體及社會(huì)醫(yī)療成本。

應(yīng)斌武:精準(zhǔn)醫(yī)療依靠對(duì)患者眾多數(shù)據(jù)的收集、聯(lián)通、分析。通過(guò)對(duì)患者的數(shù)據(jù)分析、樣本化驗(yàn)、身體檢查、進(jìn)食情況的了解、常用藥的調(diào)查、基因分析,制訂精確的治療計(jì)劃,將每個(gè)患者作為特殊的個(gè)體對(duì)待,能夠使患者在最短的時(shí)間獲得最顯著的治療效果。作為朝陽(yáng)產(chǎn)業(yè)的精準(zhǔn)醫(yī)療,目前處于產(chǎn)業(yè)生長(zhǎng)的萌芽期,其發(fā)展壯大需要經(jīng)歷基礎(chǔ)科學(xué)技術(shù)創(chuàng)新、科技成果轉(zhuǎn)化,以及醫(yī)學(xué)臨床應(yīng)用,完成產(chǎn)業(yè)裂變,從而逐步構(gòu)建起融合研發(fā)、生產(chǎn)、治療的精準(zhǔn)醫(yī)療的完整產(chǎn)業(yè)鏈。

關(guān)明:在醫(yī)學(xué)史中,疾病預(yù)防和治療都是基于“標(biāo)準(zhǔn)化患者”的預(yù)期結(jié)果。傳統(tǒng)做法是將同類(lèi)疾病的患者的數(shù)據(jù)匯集在一起用于統(tǒng)計(jì)分析,匯總其結(jié)果形成臨床指南并告知數(shù)十億患者的健康和疾病管理。這種方法在特定的歷史時(shí)期,在一定程度上促進(jìn)了醫(yī)學(xué)發(fā)展,但它忽略了重要的個(gè)體差異,這可能導(dǎo)致預(yù)后不確定性的發(fā)生。精準(zhǔn)醫(yī)學(xué)旨在為個(gè)體患者量身定制臨床治療計(jì)劃,目標(biāo)是在正確的時(shí)間向正確的患者提供正確的診療。組學(xué)技術(shù)的最新進(jìn)展為臨床醫(yī)生提供了更全面的患者信息。測(cè)序和相關(guān)數(shù)據(jù)存儲(chǔ)成本的降低,以及有效數(shù)據(jù)分析方法的開(kāi)發(fā),使得大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)分析研究成為前所未有的可能。這些進(jìn)步可以提高復(fù)雜疾病診斷的準(zhǔn)確性,患者可以從靶向治療中受益,使疾病的診治關(guān)口提前。盡管如此,大數(shù)據(jù)在精準(zhǔn)醫(yī)療中的應(yīng)用仍然存在許多挑戰(zhàn)。 用于數(shù)據(jù)存儲(chǔ),數(shù)據(jù)庫(kù)管理和計(jì)算分析的傳統(tǒng)方法不足以滿(mǎn)足每年生成的數(shù)PB(1 PB等于1 000 TB,等于1 000 000 GB)的生物醫(yī)學(xué)數(shù)據(jù)。 此外,隨著數(shù)據(jù)集變得更大和更多樣化,需要先進(jìn)的分布式文件存儲(chǔ)和計(jì)算方法來(lái)處理數(shù)據(jù)。

張本:腫瘤的高度復(fù)雜性意味著使用大數(shù)據(jù)的方法與用于某些其他類(lèi)型疾病的方法明顯不同。每位腫瘤患者可以有數(shù)千個(gè)維度參數(shù),但只有少數(shù)相似的患者能夠被匯總研究,因?yàn)槟[瘤都是獨(dú)一無(wú)二的。目前,科學(xué)家主要在使用這些數(shù)據(jù)在3個(gè)層面上分析研究腫瘤:(1)細(xì)胞層面,尋找個(gè)體腫瘤細(xì)胞數(shù)據(jù)的模式,以發(fā)現(xiàn)相關(guān)遺傳標(biāo)志物。尋找共同特征可以幫助我們更好地預(yù)測(cè)個(gè)體腫瘤如何發(fā)生、發(fā)展,以及哪種藥物治療可能最有效;(2)患者層面,患者的病史和DNA數(shù)據(jù)可用于根據(jù)腫瘤、基因以及治療對(duì)類(lèi)似疾病模式和遺傳學(xué)患者的影響,輔助確定最佳治療組合;(3)人口層面,可以分析更廣泛的人口數(shù)據(jù),根據(jù)患者不同的生活方式、地理位置和癌癥類(lèi)型為其提供治療策略。這些不同方法的最終目標(biāo)是讓腫瘤學(xué)家能夠?yàn)槊课换颊咛峁┨囟ò┘?xì)胞的定制藥物進(jìn)行治療,并限制嚴(yán)重不良反應(yīng)的風(fēng)險(xiǎn)。

4 大數(shù)據(jù)應(yīng)用中需要特別注意的問(wèn)題

廖玍:采用所有數(shù)據(jù)而不是樣本數(shù)據(jù),能夠大幅度提高大數(shù)據(jù)解決問(wèn)題的能力。大數(shù)據(jù)已經(jīng)能夠在一定程度上輔助醫(yī)生利用全方位的患者健康及疾病數(shù)據(jù)做決策,在經(jīng)驗(yàn)的基礎(chǔ)上產(chǎn)生新的發(fā)現(xiàn),新的治療計(jì)劃,這樣對(duì)于病情的診斷、治療及預(yù)后判斷會(huì)更加準(zhǔn)確和及時(shí),且數(shù)據(jù)的可用性帶來(lái)了對(duì)未知的健康問(wèn)題相關(guān)因素的關(guān)注。大數(shù)據(jù)不能替代抽樣調(diào)查。目前的大數(shù)據(jù)技術(shù)遠(yuǎn)不能達(dá)到“普查”,即不能簡(jiǎn)單地將目前的大數(shù)據(jù)做“總體”來(lái)使用。絕大多數(shù)的大數(shù)據(jù)與傳統(tǒng)的經(jīng)過(guò)科學(xué)實(shí)驗(yàn)統(tǒng)計(jì)得到的真實(shí)數(shù)據(jù)是不一樣的。諸多情況下,經(jīng)過(guò)簡(jiǎn)單計(jì)算的大數(shù)據(jù)并不如經(jīng)過(guò)精心設(shè)計(jì)、復(fù)雜計(jì)算的實(shí)驗(yàn)而取得的小數(shù)據(jù)可靠,尤其對(duì)于那些概念相對(duì)復(fù)雜、涉及面較為廣泛的不易聚類(lèi)的命題,比如在某個(gè)時(shí)間段很多人搜索“流行感冒”,可能只是上映了一場(chǎng)關(guān)于流行感冒的電影,不一定是流感突然爆發(fā)。

應(yīng)斌武:由于數(shù)據(jù)量大幅增加,不同行業(yè)系統(tǒng)根據(jù)不同時(shí)代需求所建設(shè)的系統(tǒng)的采集手段、數(shù)據(jù)標(biāo)準(zhǔn)多種多樣,在每個(gè)時(shí)間平面上難免會(huì)出現(xiàn)一些不準(zhǔn)確的數(shù)據(jù)混入大數(shù)據(jù)庫(kù),且因數(shù)據(jù)的流動(dòng)性難免需要相互融合、交叉變異,形成新的數(shù)據(jù)結(jié)構(gòu),充斥噪聲的大數(shù)據(jù)難以滿(mǎn)足精準(zhǔn)應(yīng)用要求,數(shù)據(jù)的質(zhì)量亟待提高。

關(guān)明:由于目前大數(shù)據(jù)理論過(guò)于依靠數(shù)據(jù)的大量匯集,那么一旦數(shù)據(jù)本身出現(xiàn)問(wèn)題,在只問(wèn)有什么,不問(wèn)為什么的模式下,就很可能出現(xiàn)頗具危險(xiǎn)性的或者不合時(shí)宜的大數(shù)據(jù),即因?yàn)閿?shù)據(jù)本身攜帶的問(wèn)題,而導(dǎo)致不該出現(xiàn)的錯(cuò)誤預(yù)測(cè)和決策。況且,醫(yī)學(xué)處于隨時(shí)變化的環(huán)境,只看其果,不究其因,著實(shí)危險(xiǎn)。

張本:大數(shù)據(jù)時(shí)代,隱私的泄露極易發(fā)生,且不同于一般行業(yè)的數(shù)據(jù),醫(yī)療數(shù)據(jù)具有其特殊的敏感性和重要性。醫(yī)療數(shù)據(jù)的來(lái)源和范圍具有多樣性的特征,包括病歷信息、醫(yī)療保險(xiǎn)信息、健康日志、基因遺傳、醫(yī)學(xué)實(shí)驗(yàn)、科研數(shù)據(jù)等。個(gè)人的醫(yī)療數(shù)據(jù)關(guān)系到個(gè)人的隱私保護(hù),醫(yī)療實(shí)驗(yàn)數(shù)據(jù)、科研數(shù)據(jù)不僅關(guān)系到數(shù)據(jù)主體的隱私、行業(yè)的發(fā)展,甚至關(guān)系到國(guó)家安全。

猜你喜歡
結(jié)構(gòu)化醫(yī)療信息
促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
京張醫(yī)療聯(lián)合的成功之路
我們?cè)鯓永斫忉t(yī)療創(chuàng)新
醫(yī)療扶貧至關(guān)重要
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
展會(huì)信息
什么是醫(yī)療告知
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
聂拉木县| 青州市| 蛟河市| 东源县| 新密市| 滦平县| 井冈山市| 木兰县| 西畴县| 广平县| 湖南省| 阜宁县| 信宜市| 镇远县| 新绛县| 扶沟县| 宁德市| 泰州市| 砀山县| 鄢陵县| 定安县| 民勤县| 昌宁县| 隆回县| 明光市| 井陉县| 西畴县| 焦作市| 台中市| 两当县| 上杭县| 丹凤县| 永善县| 泰和县| 汉沽区| 定远县| 洛扎县| 襄汾县| 平乡县| 华坪县| 桂林市|