王丹寧,曾科學(xué),簡獻(xiàn)哲
(1.廣州中醫(yī)藥大學(xué) 第五臨床醫(yī)學(xué)院,廣東 廣州 510095;2.廣東省第二中醫(yī)院(廣東省中醫(yī)藥工程技術(shù)研究院),廣東 廣州 510095;3.階梯健康(深圳)科技有限公司,廣東 深圳 518131)
1.1.1 “大數(shù)據(jù)”的概念
“大數(shù)據(jù)”(big data)的概念由Buxton 等人在2008年第一次提出。大數(shù)據(jù),是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)[1]。麥肯錫全球研究所給出了大數(shù)據(jù)的四大特征:(1)海量的數(shù)據(jù)規(guī)模。大數(shù)據(jù)的計(jì)量單位是以P(1000T)起的,最大可為Z(10 億個(gè)T)。(2)快速的數(shù)據(jù)流轉(zhuǎn)。大數(shù)據(jù)時(shí)代,對(duì)數(shù)據(jù)的處理要求更高,產(chǎn)生和處理等更加迅速,加上云平臺(tái)和云計(jì)算的加持,數(shù)據(jù)的處理流轉(zhuǎn)更快一步。(3)多樣的數(shù)據(jù)類型。大數(shù)據(jù)中包含視頻、文字、圖片、位置信息等各種各樣的數(shù)據(jù)類型。(4)價(jià)值密度低。通過合理運(yùn)用大數(shù)據(jù),可以以低成本創(chuàng)造高價(jià)值。
1.1.2 大數(shù)據(jù)的處理——云平臺(tái)
對(duì)于大數(shù)據(jù)的處理,最重要的技術(shù)就是云計(jì)算平臺(tái)。從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系密不可分,云計(jì)算通過分布式處理、分布式數(shù)據(jù)庫和云存儲(chǔ)、虛擬化技術(shù)對(duì)大數(shù)據(jù)進(jìn)行挖掘處理。Hadoop,是由Apache 軟件基金會(huì)開發(fā)的開源分布式系統(tǒng)基礎(chǔ)架構(gòu),能夠?qū)Υ髷?shù)據(jù)進(jìn)行分布式處理,是云計(jì)算技術(shù)中重要的組成部分,也是大數(shù)據(jù)的關(guān)鍵技術(shù),起源于Google 的三大理論(論文)GFS:分布式文件系統(tǒng)[2]、MapReduce:開源分布式并行計(jì)算框架[3]和BigTable:一個(gè)大型的分布式數(shù)據(jù)庫[4]。Hadoop 作為新的分布式基礎(chǔ)框架,能夠部署在廉價(jià)的機(jī)器上,具備高擴(kuò)展性、高效性、高容錯(cuò)性和高可靠性四大特點(diǎn),使其在短時(shí)間內(nèi)就得到了廣泛應(yīng)用。Hadoop 的核心技術(shù)是HDFS(Hadoop Distributed File System)分布式文件系統(tǒng)和MapReduce 并行計(jì)算框架。
人體有十二經(jīng)脈及奇經(jīng)八脈,在外聯(lián)絡(luò)肢體,在內(nèi)聯(lián)絡(luò)臟腑,掌握十二經(jīng)脈病證的特征,我們可以辨別疾病發(fā)生的病因病機(jī)。經(jīng)絡(luò)分析辨證主要是以《靈樞·經(jīng)脈》所載十二經(jīng)脈的病證,及《難經(jīng)·二十九難》所載奇經(jīng)八脈的病證為基礎(chǔ)并加以概括而成[5]。由于經(jīng)絡(luò)病證??慑e(cuò)雜于臟腑、氣血病證之中,所以彼此之間可以相互參照。在疾病發(fā)生時(shí),我們可以通過分析主要癥狀、伴隨癥狀以及分析癥狀出現(xiàn)的先后次序,再對(duì)照經(jīng)絡(luò)之間的關(guān)系,把握經(jīng)絡(luò)與臟腑之間的屬絡(luò)關(guān)系,掌握癥狀所屬,幫助我們推求病因病機(jī),從而進(jìn)行具體的、有針對(duì)性的治療措施。
隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)的應(yīng)用已是大勢(shì)所趨。云計(jì)算與大數(shù)據(jù)的出現(xiàn),有效解決了中醫(yī)藥數(shù)據(jù)參數(shù)難以獲取、數(shù)據(jù)量過大、處理分析緩慢等問題,為中醫(yī)藥相關(guān)領(lǐng)域的大數(shù)據(jù)挖掘發(fā)展工作提供支持,各種云平臺(tái)迅速發(fā)展。將大數(shù)據(jù)應(yīng)用到中醫(yī)經(jīng)絡(luò)分析辯證中,并根據(jù)分析結(jié)果提供針對(duì)疾病防治的個(gè)性化建議,更大程度上滿足病人需求。但就現(xiàn)有的研究資料來看,涉及經(jīng)絡(luò)分析相關(guān)的云平臺(tái)系統(tǒng)較為少見,所涉及的方面也比較狹窄和單一?,F(xiàn)有的網(wǎng)絡(luò)問診平臺(tái)大部分是依靠病人輸入癥狀特點(diǎn)從而進(jìn)行分析,存在片面診斷的風(fēng)險(xiǎn),隨之提供的醫(yī)學(xué)建議也可能出現(xiàn)誤差,同時(shí)還存在誠信問題[6-7]。目前市面上的經(jīng)絡(luò)檢測儀器較少,并存在檢測誤差率較大,重復(fù)多次測量數(shù)據(jù)偏差較大等問題。
因此,本研究計(jì)劃開發(fā)一個(gè)云平臺(tái),建立一個(gè)中醫(yī)理論知識(shí)基礎(chǔ)的數(shù)據(jù)庫,同時(shí)結(jié)合一個(gè)經(jīng)絡(luò)檢測儀器,根據(jù)患者的一些自身癥狀去校正分析檢測儀數(shù)據(jù)的精確度,從而給出一個(gè)更為準(zhǔn)確的疾病防治意見或者就診意見。
基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)設(shè)計(jì)思路如圖1 所示。
圖1 基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)設(shè)計(jì)思路
基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)主要由經(jīng)絡(luò)分析云平臺(tái)APP(Mobile)、經(jīng)絡(luò)分析云平臺(tái)Clinical System、經(jīng)絡(luò)分析云平臺(tái)Web 三大系統(tǒng)構(gòu)成,三大系統(tǒng)均包括客戶端(配有“小階智能脈診儀”)和服務(wù)器端兩部分。
客戶端負(fù)責(zé)提供操作界面、發(fā)送操作請(qǐng)求以及顯示操作結(jié)果;服務(wù)器端負(fù)責(zé)管理客戶管理、存儲(chǔ)數(shù)據(jù)與建立數(shù)據(jù)庫、數(shù)據(jù)處理和算法分析。
客戶端通過SDK(Software Department Kit 軟件開發(fā)工具包)連接到內(nèi)部云平臺(tái)的服務(wù)器端,服務(wù)器端主要包括第三方程序(Third Party Protocol)、數(shù)據(jù)庫(DB)、動(dòng)態(tài)決策分析工具BI(Business Intelligence)。第三方程序能夠串聯(lián)各種第三方信息,為云平臺(tái)系統(tǒng)數(shù)據(jù)庫提供大量的服務(wù)與數(shù)據(jù)儲(chǔ)備;Log DB 采用關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(MySQL),統(tǒng)計(jì)Member DB 和Clinical DB,可以降低數(shù)據(jù)的重復(fù)性以及系統(tǒng)消耗效能,提高數(shù)據(jù)管理的靈活性和效率;動(dòng)態(tài)決策分析工具BI(Business Intelligence)整合數(shù)據(jù)庫中的數(shù)據(jù)資源并加以分析,提供用戶服務(wù)平臺(tái)并協(xié)助分析與預(yù)測,最終將用戶操作結(jié)果呈現(xiàn)在客戶端,以供決策所需。如圖2所示。
圖2 基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)架構(gòu)
一是通過客戶端采集用戶所處地理位置、季節(jié)、發(fā)病氣候特點(diǎn)等致病外因與用戶自身癥狀、飲食習(xí)慣等內(nèi)因,在王唯工教授的氣血共振論基礎(chǔ)上,結(jié)合“小階智能脈診儀”量測所得的手指動(dòng)脈波形訊號(hào),建立相關(guān)的個(gè)人生理病理指標(biāo),經(jīng)過初次測量和追蹤測量(初次測量一段固定時(shí)間之后)得到醫(yī)護(hù)人員評(píng)估反饋所獲得相關(guān)數(shù)據(jù)。二是第三方程序的應(yīng)用,通過平臺(tái)信息資源對(duì)接方式采集各中醫(yī)相關(guān)平臺(tái)的數(shù)據(jù)信息以及較為完善的病歷來作為數(shù)據(jù)儲(chǔ)備。
數(shù)據(jù)的存儲(chǔ)由數(shù)據(jù)庫來負(fù)責(zé),經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)數(shù)據(jù)庫(Log DB)采用關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(MySQL),統(tǒng)計(jì)Member DB 和Clinical DB。通過客戶端和第三方程序取得量測數(shù)據(jù)與臨床相關(guān)數(shù)據(jù)后,云平臺(tái)系統(tǒng)服務(wù)器便會(huì)進(jìn)行數(shù)據(jù)整理與數(shù)據(jù)整合,繼而進(jìn)行數(shù)據(jù)正規(guī)化處理,包括數(shù)據(jù)選取與數(shù)據(jù)轉(zhuǎn)換。原始數(shù)據(jù)在轉(zhuǎn)化為正規(guī)化數(shù)據(jù)之后分別存儲(chǔ)于Member DB 和Clinical DB 中,經(jīng)過Log DB 的降重,使得數(shù)據(jù)存儲(chǔ)與管理的靈活性和效率大大提高。Log DB 中的正規(guī)數(shù)據(jù)通過各種人工智能演算方法進(jìn)行數(shù)據(jù)挖掘、模型評(píng)估,從而找到量測數(shù)據(jù)、脈診特征與臨床數(shù)據(jù)、疾病的關(guān)聯(lián),得出相關(guān)風(fēng)險(xiǎn)指標(biāo),最終使用這些指標(biāo)描述并預(yù)測健康或者疾病的情況。數(shù)據(jù)庫建立的過程如圖3 所示。
圖3 基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)數(shù)據(jù)庫建立
經(jīng)絡(luò)分析云平臺(tái)系統(tǒng)將采集到相關(guān)的內(nèi)外致病因素結(jié)合云端中醫(yī)智能算法集群(ModTCMAI-Cluster)進(jìn)行UVE/CARS 和PLS/SVM 等多種變量篩選和回歸分析算法運(yùn)算,分析經(jīng)絡(luò)問題,并結(jié)合基于光體積描述技術(shù)(PPG)的“小階智能脈診儀”GSR+DSI 傳感器量測動(dòng)態(tài)手指動(dòng)脈波形,光學(xué)傳感器于手指取得因心臟搏動(dòng)周期,血管容積周期性變化的訊號(hào),并以數(shù)據(jù)圖譜的形式呈現(xiàn),經(jīng)由諧波分析獲得用戶相關(guān)生理病理參數(shù)進(jìn)行經(jīng)絡(luò)情況檢測。
截取一段量測波形如圖4 所示,可切割成數(shù)個(gè)脈波如圖5 所示,通過動(dòng)脈系統(tǒng)共振理論特有的算法,將時(shí)域周期的血壓波形進(jìn)行傅立葉變換至頻域數(shù)值,再將此頻域數(shù)值正規(guī)化后取得動(dòng)脈諧頻特征(Cn)。定義如下列方程式,其中SN(x)代表一個(gè)有周期性的血壓波型,可轉(zhuǎn)換為N 個(gè)正弦波型的組合,A0代表一個(gè)脈波的平均值,An是橈動(dòng)脈血液壓力波經(jīng)過傅立葉級(jí)數(shù)轉(zhuǎn)換的第n 個(gè)系數(shù),見計(jì)算公式(1),計(jì)算結(jié)果見表1。得到各動(dòng)脈諧頻指標(biāo)后,再比對(duì)大量臨床數(shù)據(jù),即可得到各種疾病風(fēng)險(xiǎn)指標(biāo)。
圖4 一段量測波形
圖5 切割后的脈波
表1 計(jì)算結(jié)果
客戶端主要面向普通用戶和醫(yī)護(hù)人員。普通用戶根據(jù)自身的癥狀特征以及“小階智能脈診儀”經(jīng)絡(luò)量測數(shù)據(jù),通過客戶端(APP 或者Web)即時(shí)上傳至云平臺(tái),服務(wù)器端對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行分析,并與大數(shù)據(jù)資料庫對(duì)比分析,提供相關(guān)疾病的風(fēng)險(xiǎn)指標(biāo),并將結(jié)果即時(shí)傳送給醫(yī)護(hù)人員,醫(yī)護(hù)人員結(jié)合專業(yè)知識(shí)給出相關(guān)疾病的風(fēng)險(xiǎn)評(píng)估以及治療指導(dǎo),并通過客戶端(Clinical System 或者Web)反饋給普通用戶。
通過經(jīng)絡(luò)分析云平臺(tái)APP,結(jié)合“小階智能脈診儀”,根據(jù)身體現(xiàn)時(shí)狀態(tài),針對(duì)九大中醫(yī)體質(zhì)(平和質(zhì)、氣虛質(zhì)、陽虛質(zhì)、陰虛質(zhì)、痰濕質(zhì)、濕熱質(zhì)、瘀血質(zhì)、氣郁質(zhì),特稟質(zhì)),八大主要經(jīng)絡(luò)(手厥陰心包經(jīng)、足厥陰肝經(jīng)、足少陰腎經(jīng)、足太陰脾經(jīng)、手太陰肺經(jīng)、足陽明胃經(jīng)、足少陽膽經(jīng)、足太陽膀胱經(jīng))和十八項(xiàng)風(fēng)險(xiǎn)進(jìn)行全面評(píng)估,隨時(shí)隨地監(jiān)測身體的變化,并依據(jù)評(píng)估結(jié)果提供科學(xué)、健康、合理的調(diào)理指導(dǎo)建議,提前降低身體慢病的風(fēng)險(xiǎn)。
目前為止,經(jīng)絡(luò)分析云平臺(tái)收集了20~60 歲年齡段人群的相關(guān)數(shù)據(jù),并比較均勻分布在各年齡段的人群檢測數(shù)據(jù),發(fā)現(xiàn)人群在壓力、疲勞、睡眠質(zhì)量上風(fēng)險(xiǎn)較高,同時(shí)存在心腦血管、血糖、血脂等慢性病風(fēng)險(xiǎn),針對(duì)辯證體質(zhì)分布分析見表2(目前人群數(shù)據(jù)主要以華南地區(qū)為主,由于受地域等的影響,數(shù)據(jù)可能會(huì)有一些差異)。
表2 經(jīng)絡(luò)辯證體質(zhì)分布分析表
基于大數(shù)據(jù)采集的經(jīng)絡(luò)分析云平臺(tái)系統(tǒng),從患者方角度,能夠促進(jìn)廣大群眾對(duì)中醫(yī)基礎(chǔ)的認(rèn)識(shí)了解,足不出戶也能在中醫(yī)理論的指導(dǎo)下進(jìn)行日常保健,發(fā)揮中醫(yī)“辨證論治”及“治未病”的理念。從人與自然合一的整體觀出發(fā),用現(xiàn)代化信息技術(shù)推廣中醫(yī),讓大眾真正用得上。從醫(yī)生角度考慮,平臺(tái)開發(fā)后可以讓醫(yī)生更詳細(xì)地了解患者疾病發(fā)生發(fā)展的過程,臨床實(shí)際中,不少患者對(duì)自己癥狀發(fā)生、病情發(fā)展變化記憶并不清晰,這對(duì)醫(yī)生采取治療方案及判斷預(yù)后均有一定影響,若有了云平臺(tái)的日常健康管理記錄,這種情況能夠得到改善。本項(xiàng)目將致力于應(yīng)用大數(shù)據(jù)技術(shù)推動(dòng)中醫(yī)經(jīng)絡(luò)分析理論的普及,促進(jìn)中醫(yī)健康管理的發(fā)展。