盛明,張勇,李超,邢春曉(清華大學(xué)信息技術(shù)研究院 計(jì)算機(jī)系,清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室,北京 100084)
?
一種基于大數(shù)據(jù)分析的移動(dòng)健康服務(wù)平臺(tái)
盛明,張勇,李超,邢春曉
(清華大學(xué)信息技術(shù)研究院 計(jì)算機(jī)系,清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室,北京 100084)
摘要:本文提出一種基于可穿戴傳感器、移動(dòng)互聯(lián)網(wǎng)以及大數(shù)據(jù)分析的健康服務(wù)平臺(tái)-飛活健康網(wǎng)平臺(tái)。該健康服務(wù)平臺(tái)整合可穿戴設(shè)備、一體機(jī)設(shè)備、智能手機(jī)應(yīng)用和相關(guān)大數(shù)據(jù)處理技術(shù),便于展示、管理與比較長(zhǎng)期的基本健康數(shù)據(jù)和環(huán)境數(shù)據(jù);并通過(guò)智能分類(lèi)、深度學(xué)習(xí)等后臺(tái)數(shù)據(jù)分析,實(shí)現(xiàn)提醒、建議與警告等健康增值服務(wù)。
關(guān)鍵詞:大數(shù)據(jù);可穿戴設(shè)備;數(shù)據(jù)分析;智慧健康
近些年隨著物聯(lián)網(wǎng)的和移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,可穿戴設(shè)備、移動(dòng)健康服務(wù)也越來(lái)越成為研究和工業(yè)界熱點(diǎn)[1-3]。可穿戴設(shè)備和移動(dòng)互聯(lián)網(wǎng)在健康監(jiān)測(cè)領(lǐng)域有著天然的優(yōu)勢(shì),可以隨時(shí)隨地的監(jiān)控使用者的身體與運(yùn)動(dòng)狀態(tài),并提供相關(guān)服務(wù)[5-7]。隨著中國(guó)社會(huì)老齡化的進(jìn)程加快,人群中亞健康人群比例的增加,整個(gè)社會(huì)對(duì)可穿戴的健康監(jiān)控的需求也會(huì)隨之加大[8-9],產(chǎn)生的健康方面的數(shù)據(jù)也會(huì)激增[10-12],因此更好的管理以及分析大量的健康相關(guān)的數(shù)據(jù)并提供相關(guān)的增值服務(wù)顯得尤為重要,基于上述背景,我們提出了一種基于可穿戴傳感器、移動(dòng)互聯(lián)網(wǎng)與大數(shù)據(jù)分析的健康服務(wù)平臺(tái)——飛活健康網(wǎng)平臺(tái)。
飛活健康網(wǎng)平臺(tái)為用戶(hù)提供全方位、多渠道、實(shí)時(shí)且便捷的健康監(jiān)控。健康數(shù)據(jù)的收集主要基于可穿戴設(shè)備、一體機(jī)以及智能手機(jī)?;趯?duì)相關(guān)健康數(shù)據(jù)的采集、組織、管理以及分析,平臺(tái)能夠?yàn)槁圆∪巳阂约皝喗】禒顟B(tài)的人群提供健康增值服務(wù)。與此同時(shí),基于云平臺(tái)和物聯(lián)網(wǎng),飛活健康網(wǎng)能夠提供面向智慧健康的增值服務(wù)。飛活健康網(wǎng)平臺(tái)能夠展示、對(duì)比、分析長(zhǎng)期的健康相關(guān)的數(shù)據(jù),這些數(shù)據(jù)都是從可穿戴設(shè)備、一體機(jī)設(shè)備、智能手機(jī)采集而來(lái)的。與此同時(shí),本平臺(tái)還能夠提供面向健康的增值服務(wù)比如早期預(yù)警和健康建議等。而上述服務(wù)的實(shí)現(xiàn)是基于智能分類(lèi)、深度學(xué)習(xí)以及相關(guān)的數(shù)據(jù)挖掘算法。
本文的組織方式如下:第二部分主要介紹相關(guān)方式方法。第三部分主要介紹數(shù)據(jù)分析和增值服務(wù)。第四部分對(duì)結(jié)果進(jìn)行展示。第五部分是總結(jié)。
2.1服務(wù)方式
2.1.1數(shù)據(jù)采集
平臺(tái)針對(duì)個(gè)人、家庭和社區(qū)構(gòu)建了健康監(jiān)控網(wǎng)絡(luò),可以隨時(shí)隨地的記錄用戶(hù)的健康狀態(tài)。
●基于藍(lán)牙的便攜式可穿戴設(shè)備:主要包括計(jì)步器和腕帶。利用這些設(shè)備可以收集個(gè)人的健康相關(guān)的數(shù)據(jù)比如步數(shù)、距離、體溫、心率、環(huán)境溫度、環(huán)境濕度等。
●面向社區(qū)的健康一體機(jī)設(shè)備:此一體機(jī)集成了監(jiān)測(cè)體重、體溫、血壓、脈搏和血氧血糖數(shù)據(jù)的功能。
●基于IEEE Continua標(biāo)準(zhǔn)的第三方健康數(shù)據(jù)采集設(shè)備:包括歐姆龍等廠(chǎng)家生產(chǎn)的血壓、血氧、血糖以及心跳監(jiān)測(cè)儀等。
2.1.2數(shù)據(jù)上傳
●基于藍(lán)牙的匯總方式:通過(guò)手機(jī)藍(lán)牙,將通過(guò)上述途徑采集到的數(shù)據(jù)進(jìn)行匯總。
●基于JSON的健康檢測(cè)數(shù)據(jù)的統(tǒng)一結(jié)構(gòu)化,將來(lái)自上述多個(gè)途徑的不同格式的健康數(shù)據(jù)以JSON的方式進(jìn)行統(tǒng)一的結(jié)構(gòu)化并在手機(jī)端進(jìn)行匯總與存儲(chǔ)。
●手機(jī)端將最終整理好的健康數(shù)據(jù)通過(guò)手機(jī)網(wǎng)絡(luò)上傳至后臺(tái)服務(wù)器,實(shí)現(xiàn)長(zhǎng)期的健康數(shù)據(jù)跟蹤與分析。并為后期的健康增值服務(wù)提供數(shù)據(jù)基礎(chǔ)。
2.1.3數(shù)據(jù)分析
將健康數(shù)據(jù)以JSON的形式存儲(chǔ),為后續(xù)的海量數(shù)據(jù)挖掘、分析、推薦等功能提供基礎(chǔ)。
●基于健康數(shù)據(jù)的運(yùn)動(dòng)人群:根據(jù)上述采集到的海量數(shù)據(jù),通過(guò)對(duì)每一個(gè)數(shù)據(jù)對(duì)象中的年齡、性別、營(yíng)養(yǎng)攝入量習(xí)慣、運(yùn)動(dòng)習(xí)慣、體重、血壓、血糖等維度分析、比對(duì),本系統(tǒng)可以按照健康運(yùn)動(dòng)的標(biāo)準(zhǔn)將每一個(gè)對(duì)象劃分至不同的群組。從健康運(yùn)動(dòng)的角度而言,同一人群有著相同的身體狀況以及飲食和運(yùn)動(dòng)習(xí)慣。
●基于健康數(shù)據(jù)的慢性病人群:同樣根據(jù)采集到的健康數(shù)據(jù),本系統(tǒng)可以按慢性病的分類(lèi)(高血壓、糖尿?。┮约捌渌幍牟煌A段為標(biāo)準(zhǔn)將每一個(gè)對(duì)象劃分至不同的群組。從健慢性病角度而言,同一人群有著相同的身體狀況以及飲食和運(yùn)動(dòng)習(xí)慣。
●為特定人群提供早期預(yù)警健康指導(dǎo)以及相關(guān)增值服務(wù):本平臺(tái)將不斷學(xué)習(xí)并優(yōu)化面向特定人群的最優(yōu)的飲食、運(yùn)動(dòng)、治療推薦流程與計(jì)劃。通過(guò)智能手機(jī)應(yīng)用發(fā)布相關(guān)提示和預(yù)警。
2.2系統(tǒng)架構(gòu)
本平臺(tái)主要包括兩個(gè)部分(圖1):數(shù)據(jù)采集和大數(shù)據(jù)處理。數(shù)據(jù)采集主要包括對(duì)健康相關(guān)數(shù)據(jù)的采集、集成、儲(chǔ)存和上傳。大數(shù)據(jù)處理部分主要分析健康相關(guān)的數(shù)據(jù)以及健康增值服務(wù)的推送。
圖1 飛活健康網(wǎng)平臺(tái)架構(gòu)
2.3服務(wù)模式的實(shí)現(xiàn)
2.3.1健康數(shù)據(jù)采集
本平臺(tái)采用了多種數(shù)據(jù)采集方式:針對(duì)個(gè)人的采用可穿戴設(shè)備和智能手機(jī);針對(duì)家庭的采用基于IEEE Continua標(biāo)準(zhǔn)的健康檢測(cè)設(shè)備;針對(duì)社區(qū)的采用高度集成化的一體機(jī)。
a)針對(duì)個(gè)人的可穿戴設(shè)備
計(jì)步器:基于藍(lán)牙連接,主要采集個(gè)人的運(yùn)動(dòng)數(shù)據(jù)。該計(jì)步器可以高效過(guò)濾噪聲,提高計(jì)步算法的精度;并且通過(guò)藍(lán)牙和智能手機(jī)的連接,隨時(shí)隨地管理運(yùn)動(dòng)數(shù)據(jù)。與此同時(shí),該計(jì)步器還支持24小時(shí)的全天監(jiān)控,包括白天的計(jì)步以及夜間的睡眠監(jiān)測(cè)。
健康腕帶:一種基于藍(lán)牙連接的可穿戴設(shè)備。是一種健康體征采集設(shè)備,可隨時(shí)隨地記錄體溫、脈率、環(huán)境溫度、環(huán)境濕度、大氣壓等信息。通過(guò)藍(lán)牙將相關(guān)信息傳送至手機(jī)端。
b)面向健康數(shù)據(jù)采集的智能手機(jī)應(yīng)用
智能手機(jī)集成了諸多傳感器。其中,加速度傳感器可以采集計(jì)步相關(guān)的運(yùn)動(dòng)數(shù)據(jù);手機(jī)攝像頭可以采集指尖血氧濃度;內(nèi)置的GPS傳感器可以記錄用戶(hù)的行動(dòng)軌跡。
同時(shí),智能手機(jī)也提供飲食數(shù)據(jù)的采集。通過(guò)用戶(hù)的選擇,智能手機(jī)應(yīng)用可以計(jì)算出用戶(hù)飲食的主要能量。首先應(yīng)用將食物分為主食、肉類(lèi)、蔬菜等種類(lèi),接下來(lái)根據(jù)對(duì)相應(yīng)種類(lèi)重量的選擇計(jì)算出每餐所攝入的蛋白質(zhì)、脂肪、糖分和熱量含量。
c)面向家庭的支持IEEE Continua標(biāo)準(zhǔn)的健康設(shè)備
IEEE Continua健康聯(lián)盟制定了一整套包括基于藍(lán)牙通訊的健康數(shù)據(jù)采集與傳輸標(biāo)準(zhǔn)。從家庭方面而言,飛活健康網(wǎng)平臺(tái)支持所有符合IEEE Continua標(biāo)準(zhǔn)的數(shù)據(jù)采集設(shè)備的接入,比如溫度計(jì)、血壓計(jì)、血糖儀等等。因此本平臺(tái)可以采集更廣泛的來(lái)自于第三方設(shè)備的健康數(shù)據(jù)。
d)面向社區(qū)的一體機(jī)設(shè)備
面對(duì)社區(qū)人群,平臺(tái)提供了集成多種檢測(cè)和采集功能的一體機(jī),該一體機(jī)集成了諸如身高體重、體溫、血壓、心率、心電圖、血氧、血糖等功能。社區(qū)使用者可以直接通過(guò)身份證來(lái)使用,監(jiān)控多種生理指標(biāo)。采集后的健康數(shù)據(jù)將通過(guò)互聯(lián)網(wǎng)直接上傳至平臺(tái)服務(wù)器。
2.3.2基于智能手機(jī)的健康數(shù)據(jù)的管理和上傳
智能手機(jī)應(yīng)用可以接收來(lái)自于可穿戴設(shè)備、第三方設(shè)備、一體機(jī)設(shè)備的健康數(shù)據(jù)。這些數(shù)據(jù)以JSON的形式結(jié)構(gòu)化并存儲(chǔ)。下圖展示的是計(jì)步數(shù)據(jù)的存儲(chǔ)方式,見(jiàn)圖2:
智能手機(jī)應(yīng)用可以管理本地的健康數(shù)據(jù),并且提供歷史數(shù)據(jù)瀏覽、數(shù)據(jù)對(duì)比以及其它功能。因此,用戶(hù)可以隨時(shí)隨地管理并且瀏覽其自身的健康相關(guān)的數(shù)據(jù)。
智能手機(jī)應(yīng)用通過(guò)無(wú)線(xiàn)網(wǎng)絡(luò)將數(shù)據(jù)直接上傳至服務(wù)器,為長(zhǎng)期的數(shù)據(jù)管理和分析做準(zhǔn)備。健康數(shù)據(jù)根據(jù)采集時(shí)間、種類(lèi)等維度進(jìn)行分類(lèi)。每一個(gè)數(shù)據(jù)文件存儲(chǔ)了一天內(nèi)產(chǎn)生的所有健康數(shù)據(jù)。智能手機(jī)應(yīng)用可以存儲(chǔ)并上傳相關(guān)健康數(shù)據(jù)。在默認(rèn)的配置情況下,用戶(hù)每次退出智能手機(jī)應(yīng)用都會(huì)觸發(fā)一次上傳過(guò)程。與此同時(shí)智能手機(jī)將以時(shí)間戳的方式標(biāo)記最近一次成功上傳時(shí)間從而避免重復(fù)上傳的發(fā)生。
圖2 JSON 數(shù)據(jù)組織方式
數(shù)據(jù)分析和增值服務(wù)主要面向兩類(lèi)人群。第一類(lèi)是運(yùn)動(dòng)人群;第二類(lèi)是慢性病人群,主要包括高血壓和糖尿病人群。對(duì)于健康相關(guān)數(shù)據(jù)的分析主要包括分類(lèi)和最佳生活模式提取。在服務(wù)器端,健康數(shù)據(jù)以JSON形式被存放在Mongodb中,并為之后的挖掘、分析、推薦以及其他功能提供服務(wù)。
3.1運(yùn)動(dòng)人群
分析模型定義9個(gè)維度,分別是:年齡/100、睡眠時(shí)間/24小時(shí)、散步時(shí)間/24小時(shí)、跑步時(shí)間/24小時(shí)、日消耗熱量/體重、熱量攝入量/食物總攝入量、糖/食物總攝入量、脂肪/食物總攝入量、蛋白質(zhì)/食物總攝入量。因此可以用9維向量來(lái)描述個(gè)體的相關(guān)體征,比如:a={0.3,0.33,0.083,0.096,0.23,0.121,0.211,0.321,0.312}。
這里我們用余弦相似度[13]來(lái)評(píng)估兩個(gè)對(duì)象的相似程度:
進(jìn)一步可以得出a與b兩個(gè)向量所代表對(duì)象的運(yùn)動(dòng)生活習(xí)慣的相似程度。因此智能分類(lèi)機(jī)制就可以根據(jù)對(duì)象之間的相似度進(jìn)行人群的智能劃分、形成相似人群的群組,保證每個(gè)群組內(nèi)部對(duì)象兩兩之間相似度的值大于算法所設(shè)定的閥值。
在對(duì)象按照年齡、睡眠、運(yùn)動(dòng)、飲食習(xí)慣被劃分至不同群組之后,依照該群組的人群的上述特點(diǎn),系統(tǒng)將會(huì)自動(dòng)學(xué)習(xí)并提取出屬于該群組內(nèi)部的推薦運(yùn)動(dòng)生活方式,該生活方式同樣是按照上述9維向量進(jìn)行表示的。該運(yùn)動(dòng)生活方式將會(huì)作為推薦的運(yùn)動(dòng)生活方式推薦給同群組的其他對(duì)象,并依照上述推薦生活方式作為模板對(duì)群組內(nèi)的運(yùn)動(dòng)生活方式進(jìn)行預(yù)警與建議,例如:減少糖量的攝入,增加睡眠時(shí)間、增加跑步時(shí)間等。
3.2慢性病人群(高血壓、糖尿病)
對(duì)于慢性病人群,除了采集到的健康數(shù)據(jù)如血壓、血氧、血糖等,系統(tǒng)還會(huì)對(duì)用戶(hù)在博客、論壇、討論中發(fā)布的相關(guān)文本進(jìn)行分析。
分析模型加入了對(duì)健康數(shù)據(jù)如血壓、血氧、血糖的分析,系統(tǒng)同時(shí)會(huì)追蹤并記錄用戶(hù)產(chǎn)生的文本信息并對(duì)其分析。分析模型定義了年齡、血壓、血氧、血糖、睡眠、運(yùn)動(dòng)、飲食等若干維度。與前文所述相同,系統(tǒng)仍然用N維向量來(lái)表示對(duì)象的特征,基于對(duì)象之間的相似度值的大小將對(duì)象劃分至不同的群組。對(duì)于文本的分析與分類(lèi),目前主要采取兩種方法。
第一種方法基于文檔的相關(guān)屬性,比如關(guān)鍵詞、作者、文本長(zhǎng)度、發(fā)布時(shí)間等。第二種方式是基于文本的內(nèi)部相似度,比如采用的自組織映射方法將文本劃分為不同的類(lèi)別[14]。
基于上述對(duì)用戶(hù)產(chǎn)生的健康體征數(shù)據(jù)以及文本數(shù)據(jù)的分析,每一個(gè)用戶(hù)可以更加精確的被劃分至不同的類(lèi)別。系統(tǒng)會(huì)動(dòng)態(tài)的自學(xué)習(xí)并在不同類(lèi)別的內(nèi)部根據(jù)其人群特點(diǎn)推薦飲食習(xí)慣。
與運(yùn)動(dòng)人群不同,針對(duì)慢性病人群(主要指糖尿?。┫到y(tǒng)提供了預(yù)警功能,主要包括對(duì)血氧、血糖、糖分?jǐn)z入、睡眠不足等事件或生活方式的預(yù)警。因此慢性病人群(主要指糖尿病)的飲食睡眠等生活質(zhì)量將被改善。系統(tǒng)分析方法的流程如圖3所示。平臺(tái)的目的就是通過(guò)對(duì)健康相關(guān)數(shù)據(jù)的采集、整合、分析、建模,最終提供面向健康的增值服務(wù)。
圖3 分析過(guò)程
4.1意義
醫(yī)療機(jī)構(gòu)可以利用本平臺(tái)提高照護(hù)的效果與效率,增加用戶(hù)的滿(mǎn)意度,并為醫(yī)學(xué)相關(guān)的研究提供服務(wù)。平臺(tái)的多種應(yīng)用也可使用戶(hù)采集并管理、瀏覽自己的健康相關(guān)的數(shù)據(jù),同時(shí)提供基于分析的健康增值服務(wù),為醫(yī)療機(jī)構(gòu)和廣大人群提供服務(wù)。
4.2設(shè)計(jì)和開(kāi)發(fā)
圖1展示了平臺(tái)架構(gòu)。飛活健康網(wǎng)平臺(tái)是基于A(yíng)ndroid SDK、PHP 和Java開(kāi)發(fā);并且通過(guò)藍(lán)牙、無(wú)線(xiàn)、互聯(lián)網(wǎng)技術(shù)進(jìn)行數(shù)據(jù)的采集和傳輸。圖4展示了網(wǎng)頁(yè)端的用戶(hù)界面。圖5展示了智能手機(jī)端的用戶(hù)界面。
圖4 飛活健康網(wǎng)平臺(tái)網(wǎng)頁(yè)端界面
圖5 飛活健康網(wǎng)平臺(tái)智能手機(jī)端界面
4.3實(shí)際用例
本平臺(tái)目前已經(jīng)被部署至www.fihuo.com,并且有228,499注冊(cè)用戶(hù)。
本文提出了一種基于大數(shù)據(jù)分析的移動(dòng)健康服務(wù)平臺(tái)。結(jié)合可穿戴設(shè)備、智能手機(jī)應(yīng)用和后臺(tái)大數(shù)據(jù)分析的平臺(tái),給用戶(hù)展示長(zhǎng)期的基本健康數(shù)據(jù)和環(huán)境數(shù)據(jù),并基于深度學(xué)習(xí)等分析方法用于比較、分析和分類(lèi),進(jìn)而提供諸如提醒、建議、預(yù)警等健康增值服務(wù)。
致謝
本工作得到了國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)No.2011CB302302,國(guó)家高技術(shù)研究發(fā)展計(jì)劃No.SS2015AA020102,以及清華大學(xué)自主科研項(xiàng)目的支持。
參考文獻(xiàn)
[1]S.Warren,R.Craft,B.Bosma,“Designing smart health care technology into the home of the future,” Workshops on Future Medical Devices.1999,2:667.
[2]A.Lymberis,“Smart wearable systems for personalised health management:current R&D and future challenges,” Engineering in Medicine and Biology Society,2003.Proceedings of the 25th Annual International Conference of the IEEE,2003,4:3716-3719.
[3]S.Fox,L.Rainie,“Vital Decisions:How Internet Users Decide what Information to Trust when They Or Their Loved Ones are Sick:Plus a Guide from the Medical Library Association about Smart Health-search Strategies and Good Web Sites ,” Pew Internet & American Life Project,2002.
[4]M.Clancy,“Getting to ‘smart'health care,” Health Affairs,2006,25(6):w589-w592.
[5]A.Lymberis,“ Research and development of smart wearable health applications:the challenge ahead ,” Stud Health Technol Inform,2004,108:155-161.
[6]L. Irwig,“Smart health choices,” Judy Irwig,2007.
[7]H.Kao,Y.Cheng,Y.Chien,“ Develop and Evaluate the Mobile-Based Self-Management Application for Tele-Healthcare Service,”IEA/AIE,2014:460-469
[8]K.Elgazzar,M.AboElFotoh,P.Martin,H.S.Hassanein,“ Ubiquitous Health Monitoring Using Mobile Web Services,” ANT/Mobi-WIS,2012:332-339
[9]P.García-Sánchez,J.González,A.Miguel Mora,A.Prieto,“Deploying intelligent e-health services in a mobile gateway,” Expert Syst,2013,40(4):1231-1239
[10]Z.Deng,X.Mo,S.Liu,“ Comparison of the middle-aged and older users' adoption of mobile smart health services in China,” I.J.Medical Informatics,2014,83(3):210-224
[11]K.Kang,Q.Wang,J.Hur,K.Park,L.Sha ,“Medical-Grade Quality of Service for Real-Time Mobile Healthcare,” IEEE Computer,2015,48(2):41-49
[12]V.Ghini,S.Ferretti,F(xiàn).M-Hippocrates,“Enabling Reliable and Interactive Mobile smart health services,”IT Professional,2012,14(3):29-35
[13]G.Salton,M.McGill,“Introduction to Modern Information Retrieval,”1986
[14]T.Kohonen,“The self-organizing map,” Proceedings of the IEEE,1990,78(9):1464-1480.
A Moblie Health Service Platform Based on Big Data Analysis
SHENG Ming,ZHANG Yong,LI Chao,XING Chun-xiao
(RIIT,Tsinghua University,Beijing 100084)
Abstract:This paper proposes a mobile smart health service platform based on big data analysis - Fihuo,which integrates wearable devices,all-in-one machines,smartphone applications and related big data processing technologies.It can present,manage and compare long-term health-related data and ambient data.Through background data analysis such as intelligent classification and deep learning,F(xiàn)ihuo provides value-added services such as reminders,advices and alarms.
Keywords:Big data; Wearable device; Data analysis; Smart health