謝永康 丁夢(mèng)清 徐嘯 黃燕 王珍 佘侃侃
摘 要:目的:基于MLP神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建超重和肥胖人群的中醫(yī)肥胖體質(zhì)分類模型,以輔助中醫(yī)肥胖干預(yù)及診療。方法:從2016—2018年江蘇某省級(jí)綜合性醫(yī)院體質(zhì)調(diào)理門診數(shù)據(jù)庫(kù)中,篩選出2 911個(gè)樣本數(shù)據(jù)作為數(shù)據(jù)集,利用MLP神經(jīng)網(wǎng)絡(luò)算法建立中醫(yī)肥胖體質(zhì)分類模型,并驗(yàn)證模型的準(zhǔn)確率。結(jié)果:根據(jù)超重肥胖人群的體檢指標(biāo),對(duì)肥胖的類型進(jìn)行中醫(yī)體質(zhì)分類,建立的中醫(yī)肥胖體質(zhì)分類模型,分類準(zhǔn)確率達(dá)到90%以上。結(jié)論:MLP神經(jīng)網(wǎng)絡(luò)算法建立的中醫(yī)肥胖體質(zhì)分類模型,可為肥胖癥的中醫(yī)藥防治提供輔助診斷和治療。
關(guān)鍵詞:肥胖;中醫(yī)體質(zhì)分類;MLP神經(jīng)網(wǎng)絡(luò)算法
0? ? 引言
肥胖是由環(huán)境、遺傳等多種因素引起的脂肪堆積過多或分布異常的慢性代謝疾病,是糖尿病、高血壓等多種疾病的危險(xiǎn)因素[1]。中醫(yī)藥在調(diào)節(jié)人體體質(zhì)、平衡代謝方面具有獨(dú)特的優(yōu)勢(shì),在肥胖的防治中起到了重要作用。中醫(yī)認(rèn)為,肥胖與人的體質(zhì)類型具有一定的相關(guān)性。在臨床實(shí)踐中,可以運(yùn)用BMI指數(shù)判定人是否肥胖,再結(jié)合中醫(yī)體質(zhì)分類學(xué)說來辨識(shí)肥胖患者體質(zhì)類型,并采用相應(yīng)的中醫(yī)干預(yù)方案來防治肥胖。虞曉含等[2]對(duì)21 948例中醫(yī)體質(zhì)與健康狀況調(diào)查數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與分析,發(fā)現(xiàn)BMI指數(shù)與中醫(yī)體質(zhì)類型之間存在關(guān)聯(lián)性,不同BMI指數(shù)人群的中醫(yī)體質(zhì)類型分布特點(diǎn)不同,氣虛質(zhì)、痰濕質(zhì)與超重肥胖的相關(guān)性較高。岳子敬等[3]針對(duì)不同中醫(yī)體質(zhì)的超重肥胖人群,給予相應(yīng)的中醫(yī)調(diào)體方案,發(fā)現(xiàn)中醫(yī)方案在減重、改善肥胖人群體質(zhì)方面具有良好的干預(yù)效果。中醫(yī)體質(zhì)分類理論在輔助肥胖診斷和治療的應(yīng)用中取得了一些成果,然而對(duì)于肥胖人群如何劃分中醫(yī)體質(zhì)類型,醫(yī)師通常依靠個(gè)人經(jīng)驗(yàn)進(jìn)行判斷,缺乏全面和客觀的判定手段[4]。應(yīng)用MLP神經(jīng)網(wǎng)絡(luò)算法建立中醫(yī)肥胖體質(zhì)分類模型,輸入超重肥胖人群的相關(guān)指標(biāo)可以判定其中醫(yī)體質(zhì)類型,為中醫(yī)方法輔助治療肥胖癥提供了新思路和新方法。
1? ? 數(shù)據(jù)集來源與分類標(biāo)準(zhǔn)
數(shù)據(jù)集來源于2016—2018年江蘇某省級(jí)綜合性醫(yī)院體質(zhì)調(diào)理門診數(shù)據(jù)庫(kù)。根據(jù)《中醫(yī)內(nèi)科學(xué)》[5]教材的肥胖分型方法,將超重肥胖人群的中醫(yī)體質(zhì)類型分為胃熱滯脾、痰濕內(nèi)盛、脾虛濕盛、脾腎陽(yáng)虛4種類型。超重?肥胖的分類是根據(jù)衛(wèi)生部《中國(guó)成人超重和肥胖癥預(yù)防控制指南》[6]推薦的標(biāo)準(zhǔn),以體質(zhì)量指數(shù)(Body Mass Index,BMI)<18.5為體重過輕,18.5≤BMI<24為體重正常,24≤BMI<28為超重,BMI≥28為肥胖,其中BMI=體重(kg)/身高2(m2)。
2? ? MLP神經(jīng)網(wǎng)絡(luò)模型研究
多層感知器模型(MultiLayer Perceptron,MLP)是人工神經(jīng)網(wǎng)絡(luò)模型中的一種,能夠描述一組輸入變量到輸出變量之間復(fù)雜的映射。肥胖的指標(biāo)體系BMI指數(shù)、舌苔厚膩等變量之間存在著復(fù)雜的非線性關(guān)系,并且輸出的結(jié)果是多分類的變量,采用傳統(tǒng)的決策樹算法或者單層感知器算法均無(wú)法解決此類問題[7]。MLP模型引入了隱含層來擬合輸入數(shù)據(jù)和輸出數(shù)據(jù)間的復(fù)雜關(guān)系,適用于解決這種非線性可分?jǐn)?shù)據(jù)的多分類問題。
2.1? ? MLP模型的構(gòu)建過程
MLP模型通常是由一個(gè)輸入層,一個(gè)或多個(gè)隱含層,一個(gè)輸出層組成。MLP模型構(gòu)建的完整流程可分為前向傳播和反向傳播過程。前向傳播通過網(wǎng)絡(luò)結(jié)構(gòu)和前一次迭代的權(quán)值與閾值,計(jì)算出神經(jīng)元的輸出。反向傳播用于參數(shù)的訓(xùn)練,是從輸出層向前計(jì)算出各權(quán)值和閾值對(duì)總誤差的影響,然后調(diào)整權(quán)值和閾值,并使誤差達(dá)到最小的過程[8]。
在前向傳播中,設(shè)輸入層的特征向量為xij,輸入層到輸出層的權(quán)重和閾值分別用wij和θij表示,隱含層節(jié)點(diǎn)的輸出值aj(公式1),f表示激活函數(shù),一般使用Sigmoid函數(shù)(公式2)表示:
在反向傳播學(xué)習(xí)中,tk是神經(jīng)網(wǎng)絡(luò)訓(xùn)練的期望的輸出信號(hào),yk是神經(jīng)網(wǎng)絡(luò)實(shí)際的輸出信號(hào)。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目的就是使yk和tk之間的誤差降低到給定的精度,常用的誤差函數(shù)E是均方差函數(shù),它可以表示為:
2.2? MLP模型的參數(shù)設(shè)計(jì)
MLP神經(jīng)神經(jīng)網(wǎng)絡(luò)模型是由多層神經(jīng)元節(jié)點(diǎn)互聯(lián)而成的復(fù)雜網(wǎng)絡(luò)。每個(gè)神經(jīng)元都通過與其他神經(jīng)元相互連接來傳遞訓(xùn)練過程中的信息,不同的參數(shù)設(shè)計(jì)產(chǎn)生不同的拓?fù)浣Y(jié)構(gòu),也決定了信息在網(wǎng)絡(luò)中的傳遞方式,從而對(duì)網(wǎng)絡(luò)的訓(xùn)練過程和結(jié)果產(chǎn)生決定性的影響[9]。文中MLP模型的參數(shù)設(shè)計(jì)是指隱含層個(gè)數(shù)的設(shè)計(jì)與各層神經(jīng)元數(shù)目的確定。
(1)隱含層個(gè)數(shù)的設(shè)計(jì)。
在理論上,只有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)只要包含足夠多的神經(jīng)元就可以逼近任意連續(xù)函數(shù)。隱含層個(gè)數(shù)的增加一方面可能引起網(wǎng)絡(luò)計(jì)算時(shí)間的增加,另一方面也容易產(chǎn)生過擬合問題,從而影響預(yù)測(cè)的表現(xiàn)[10]。因此,Kaastra等[11]建議在應(yīng)用神經(jīng)網(wǎng)絡(luò)建模時(shí),網(wǎng)絡(luò)隱藏層數(shù)最好為1層或至多為? ? ? 2層。在后面建立中醫(yī)肥胖分類模型的實(shí)驗(yàn)中,使用的是只包含一個(gè)隱含層的MLP神經(jīng)網(wǎng)絡(luò)模型。
(2)輸入層、輸出層、隱含層神經(jīng)元數(shù)目的設(shè)計(jì)。
在MLP模型中,輸入神經(jīng)元和輸出神經(jīng)元的個(gè)數(shù)按照一般慣例進(jìn)行設(shè)置,即輸入層神經(jīng)元數(shù)目為輸入變量的個(gè)數(shù),輸出層神經(jīng)元的個(gè)數(shù)為輸出變量的個(gè)數(shù)。而對(duì)于隱含層節(jié)點(diǎn)個(gè)數(shù),目前學(xué)術(shù)界還沒有統(tǒng)一的看法。在建立中醫(yī)肥胖分類模型的實(shí)驗(yàn)中是采用試驗(yàn)的方法來確定隱含層節(jié)點(diǎn)個(gè)數(shù)的,即節(jié)點(diǎn)值從1開始逐個(gè)增加,當(dāng)增加到MLP神經(jīng)網(wǎng)絡(luò)模型的精確度不能再提升時(shí),此時(shí)的節(jié)點(diǎn)值即為隱含層節(jié)點(diǎn)個(gè)數(shù)。
2.3 中醫(yī)肥胖分類模型建模流程
在中醫(yī)肥胖分類模型建模中,首先需要對(duì)讀入的數(shù)據(jù)集進(jìn)行清洗和歸一化處理,預(yù)處理完成后,還需要將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集。將訓(xùn)練集導(dǎo)入,確定MLP模型各層節(jié)點(diǎn)的個(gè)數(shù),利用上文的相關(guān)公式對(duì)模型進(jìn)行計(jì)算和訓(xùn)練,當(dāng)滿足條件之后,就將模型輸出。最后,輸入測(cè)試集數(shù)據(jù),驗(yàn)證模型的準(zhǔn)確率。中醫(yī)肥胖分類模型建模的流程如圖1所示。
3? ? 中醫(yī)肥胖分類模型建立
3.1 數(shù)據(jù)讀入與預(yù)處理
將數(shù)據(jù)集導(dǎo)入Microsoft Office Excel 2016軟件中,剔除無(wú)效數(shù)據(jù)以及信息記錄不全者,并根據(jù)BMI公式篩選出超重與肥胖人群的樣本,得到2 911例有效樣本的數(shù)據(jù)集。最后根據(jù)離差標(biāo)準(zhǔn)化公式(其中max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值)對(duì)數(shù)據(jù)進(jìn)行歸一化處理。預(yù)處理后,樣本數(shù)據(jù)情況如表1所示。
3.2? 中醫(yī)肥胖分類模型建立
對(duì)預(yù)處理后的數(shù)據(jù)集進(jìn)行隨機(jī)抽樣,將其中60%作為訓(xùn)練集,其中40%作為測(cè)試集。讀入訓(xùn)練集數(shù)據(jù),將BMI指數(shù)、肌易浮腫等14個(gè)指標(biāo)作為輸入變量,分類類別作為輸出變量。按照上文的方法進(jìn)行MLP神經(jīng)網(wǎng)絡(luò)各層節(jié)點(diǎn)的參數(shù)設(shè)計(jì)。輸入變量有14個(gè),因此輸入層神經(jīng)元個(gè)數(shù)為14個(gè);輸出變量個(gè)數(shù)為4個(gè),故輸出層神經(jīng)元個(gè)數(shù)為4個(gè);隱含層神經(jīng)元節(jié)點(diǎn)的個(gè)數(shù)按照試驗(yàn)的方式確定,個(gè)數(shù)為6個(gè)。該網(wǎng)絡(luò)的神經(jīng)結(jié)構(gòu)如圖2所示。然后按照上文的方法對(duì)中醫(yī)肥胖分類模型進(jìn)行計(jì)算和訓(xùn)練,最后輸出訓(xùn)練好的分類模型。
4? ? 模型驗(yàn)證與結(jié)果分析
4.1? 分類模型的準(zhǔn)確率
訓(xùn)練完成后,將測(cè)試集數(shù)據(jù)輸入至MLP神經(jīng)網(wǎng)絡(luò)模型,分別計(jì)算訓(xùn)練集和測(cè)試集的預(yù)測(cè)正確的樣本占總樣本的比例,得到模型預(yù)測(cè)的準(zhǔn)確率。結(jié)果顯示訓(xùn)練集的準(zhǔn)確率為92.04%,測(cè)試集的準(zhǔn)確率為90.12%。
4.2? 結(jié)果分析
MLP肥胖分類模型分類結(jié)果如表3顯示,在2 911例超重肥胖人群樣本中,中醫(yī)體質(zhì)類型為痰濕內(nèi)盛型、胃熱滯脾型的樣本最多。
MLP中醫(yī)肥胖分類模型的變量重要性如表4所示。結(jié)果顯示,肌易浮腫、胃部腹脹、BMI指數(shù)、舌苔厚膩是對(duì)分類結(jié)果影響最大的4項(xiàng)指標(biāo)。醫(yī)生可重點(diǎn)考慮這幾項(xiàng)指標(biāo),在一定程度上輔助臨床決策,優(yōu)化診斷和治療肥胖癥。
5? ? 結(jié)語(yǔ)
在國(guó)內(nèi)臨床實(shí)踐中,往往以傳統(tǒng)中醫(yī)學(xué)的望聞問切方法對(duì)超重肥胖人群進(jìn)行中醫(yī)體質(zhì)的判定,受個(gè)人主觀因素影響很大,不具有普遍性。文中研究了MLP建模方法與流程,并將其應(yīng)用于肥胖的中醫(yī)體質(zhì)分類,建立了中醫(yī)肥胖分類模型。從訓(xùn)練集和測(cè)試集的準(zhǔn)確率來看,中醫(yī)肥胖分類模型的精確度達(dá)到了90%以上,具有較強(qiáng)的實(shí)用意義,為中醫(yī)防治肥胖癥提供了一條新的路徑。對(duì)變量進(jìn)行重要性分析,得出肌易浮腫、胃部腹脹、BMI指數(shù)、舌苔厚膩等指標(biāo)重要性最高。在臨床實(shí)踐中,應(yīng)該對(duì)具有相關(guān)異常指標(biāo)的超重和肥胖人群進(jìn)行重點(diǎn)預(yù)防及篩查,及早對(duì)其進(jìn)行生活方式和藥物的干預(yù),糾正其偏頗體質(zhì),提高中醫(yī)臨床療效。
[參考文獻(xiàn)]
[1]王志遠(yuǎn).中醫(yī)對(duì)肥胖的認(rèn)識(shí)及其防治優(yōu)勢(shì)[J].光明中醫(yī),2012(9):1728-1730.
[2]虞曉含,朱燕波,王琦,等.體重指數(shù)與中醫(yī)體質(zhì)類型的對(duì)應(yīng)分析[J].中醫(yī)雜志,2015(2):105-107.
[3]岳子敬,楊宜婷,林曉亮,等.對(duì)超重/肥胖人群采用中式體質(zhì)量管理方案早期干預(yù)效果的臨床觀察[J].中華中醫(yī)藥雜志,2016(9):3838-3842.
[4]羅輝.中醫(yī)體質(zhì)學(xué)體病相關(guān)臨床研究的系統(tǒng)評(píng)價(jià)和方法學(xué)研究[D].北京:北京中醫(yī)藥大學(xué),2019.
[5]張伯禮,崔博瑜.中醫(yī)內(nèi)科學(xué)[M].北京:人民衛(wèi)生出版社,2012.
[6]中華人民共和國(guó)衛(wèi)生部疾病控制司.中國(guó)成人超重和肥胖癥預(yù)防控制指南[M].北京:人民衛(wèi)生出版社,2006.
[7]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017(6):1229-1251.
[8]黃立威,江碧濤,呂守業(yè),等.基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2018(7):1619-1647.
[9]丁暉.基于神經(jīng)網(wǎng)絡(luò)模型的人民幣匯率預(yù)測(cè)研究[D].長(zhǎng)沙:湖南大學(xué),2008.
[10]林楊.基于深度學(xué)習(xí)的刀具磨損狀態(tài)監(jiān)測(cè)技術(shù)的研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2017.
[11]KAASTRA I,BOYD M.Designing a neural network for forecasting financial and economic time series[J].Neurocomputing,1996(3):66-68.
(編輯 何 琳)