魏小弟
摘要:隨著我國經(jīng)濟(jì)水平的快速發(fā)展和人民生活水平的不斷提高,特別是新時期健康衛(wèi)生工作方針由“以治病為中心”向“以健康為中心”轉(zhuǎn)變的背景下,人們對生活質(zhì)量、衛(wèi)生服務(wù)和身心健康提出了更高的要求。本文基于大健康學(xué)科前沿成果,分析了“失配性”現(xiàn)象的形成機(jī)理并將飲食、生活、工作、醫(yī)療、環(huán)境作為輸入層,社會公共衛(wèi)生和居民個體作為輸出層,構(gòu)造基于隨機(jī)森林(Random Forest, RF)算法的社會公共衛(wèi)生與環(huán)境和居民個體評估模型;然后采用模糊等級劃分法設(shè)定五種評估等級,并使用指派法建立隸屬度函數(shù)來確定五個因素對五種評估等級的影響;最后通過比較模型輸出值和隸屬度函數(shù)空間值的大小,及時發(fā)現(xiàn)存在的問題,并提出解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題的可行方案。
關(guān)鍵詞:居民健康; 隨機(jī)森林; 模糊等級劃分法; 隸屬度函數(shù)
中圖分類號: TP391? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)16-0033-03
隨著經(jīng)濟(jì)的快速發(fā)展,人們對衣、食、住、行等方面提出了更高的要求,如醫(yī)療模式從傳統(tǒng)的單一救治模式逐漸向“防、治、養(yǎng)”的大健康模式轉(zhuǎn)變[1-5]。但健康問題受到飲食習(xí)慣、生活方式、工作壓力和醫(yī)療保障等多方面的影響,且患慢性病、老年病、肥胖病以及亞健康等問題的人數(shù)逐年遞增,給國民健康帶來了非常大的困擾[6-8]。為此建立一種能夠支持健康水平動態(tài)測控的居民健康評估模型迫在眉睫。
1 算法設(shè)計與分析
1.1 隨機(jī)森林模型
根據(jù)大健康學(xué)科前沿研究成果,通過分析“失配性”現(xiàn)象的形成機(jī)理[9],將飲食、生活、工作、醫(yī)療、環(huán)境作為輸入層,社會公共衛(wèi)生和居民個體作為輸出層,構(gòu)造基于隨機(jī)森林算法的居民健康評估模型。隨機(jī)森林構(gòu)造過程如圖1所示。
隨機(jī)森林是由一組決策分類器[{h(x,?t),t=1,2,...,T}]組成的集成分類器,其中[?t]是服從獨(dú)立分布的隨機(jī)變量,T表示隨機(jī)森林中決策樹的個數(shù),每個決策樹分類器通過投票的方式來決定最優(yōu)的分類結(jié)果[10]。具體計算如公式(1)所示。
上述過程實現(xiàn)了隨機(jī)森林模型的構(gòu)造,但模型的訓(xùn)練需要多個城市不同狀況下居民的健康數(shù)據(jù),本文選擇北京、上海、西藏、蘭州和成都等地的居民健康數(shù)據(jù)進(jìn)行模型的訓(xùn)練。
考慮到模型輸入時各因素數(shù)據(jù)不統(tǒng)一的問題,采用以下五種計算方式實現(xiàn)數(shù)據(jù)的歸一化處理。
(1)飲食方面采用攝入能量與體重之間的關(guān)系進(jìn)行計算,體質(zhì)指數(shù)(Body Mass Index, BMI)如公式(5)所示。
[BMI=BWST2]? ? ? ? ? ? ? ? ? ? ?(5)
(2)生活方面采用國民幸福指數(shù)(National Happiness Index, NHI)進(jìn)行計算,如公式(6)所示。
[NHI=IIGE×UR×IN]? ? ? ? ? ? ? ? (6)
(3)工作方面采用失業(yè)率表示,如公式(7)所示。
[UR=UYNB+UY]? ? ? ? ? ? ? ? ? (7)
(4)醫(yī)療方面采用醫(yī)保普及率表示。
(5)環(huán)境方面主要考慮到空氣質(zhì)量,等標(biāo)排放量Pi(m3/h)計算如公式(8)所示。
[Pi=Qi/Coi×109]? ? ? ? ? ? ? ? (8)
其中,BW表示身高,ST表示體重;II表示居民收入的遞增,GE表示基尼系數(shù),UR表示失業(yè)率,IN表示通貨膨脹;UY表示失業(yè)人數(shù),NB表示在業(yè)人數(shù);[Qi]表示第i類污染物在單位時間內(nèi)的排放量,[Coi]表示第i類污染物空氣排放質(zhì)量標(biāo)準(zhǔn)。
1.2 隨機(jī)森林算法描述
隨機(jī)森林算法作為基于機(jī)器學(xué)習(xí)的一種集成分類算法,結(jié)合了多個決策樹的分類效果,最終通過“投票”方式選擇出票數(shù)最多的類別作為最終的分類[11]。每一棵樹構(gòu)造流程如算法1所示。
[算法1:隨機(jī)森林算法 Step1 用N表示訓(xùn)練樣本個數(shù),M表示特征數(shù)目; Step2 輸入特征數(shù)目[m(m 3 實驗與分析 3.1 實驗環(huán)境 實驗環(huán)境如表1所示。 3.2 實驗結(jié)果與分析 為驗證本文算法的性能,從國家衛(wèi)生部和國家統(tǒng)計局等網(wǎng)站收集與整理120000條數(shù)據(jù)作為隨機(jī)森林模型的訓(xùn)練與測試數(shù)據(jù),設(shè)置模型的最大訓(xùn)練次數(shù)epochs=120,learning rate=0.01,具體訓(xùn)練過程如圖2(a)和(b)所示。 通過圖2(a)可知,在訓(xùn)練與測試初期,模型的準(zhǔn)確率隨著訓(xùn)練步數(shù)的增加而快速上升,且訓(xùn)練準(zhǔn)確率高于測試準(zhǔn)確率;由圖2(b)可知,在訓(xùn)練初期模型的loss值隨著訓(xùn)練步數(shù)的增加快速下降,且訓(xùn)練loss值低于測試loss值,表明該模型具有較好的訓(xùn)練與測試效果。 圖3給出了隨機(jī)森林模型的回歸檢驗,其中紅色表示訓(xùn)練值,黃色表示驗證值,藍(lán)色表示測試值,當(dāng)R=0.9943、0.9952和0.9935時符合回歸檢驗,如圖3(a)、(b)和(c)所示。通過觀察圖3(d),當(dāng)R=0.9958時,模型在訓(xùn)練、測試和驗證集上取得最好的吻合效果,表明本文模型具有可行性。 用于模型輸入的五個指標(biāo)存在動態(tài)變化的特點,本題針對這一問題采用指派法,通過建立梯形函數(shù)和三角函數(shù)相結(jié)合的隸屬度函數(shù),求解出劃定評價社會公共衛(wèi)生與環(huán)境和居民個體的五個等級。隸屬度函數(shù)關(guān)系如圖4所示。 3.3 依據(jù)評估模型提出可行性方案 為評估本文提出模型的有效性,現(xiàn)以西安市為例。將五個指標(biāo)作為模型的輸入,社會公共衛(wèi)生和居民個體作為模型的輸出,分別計算得到社會公共衛(wèi)生和居民個體的評價為0.58和0.76。 根據(jù)表2評價等級與區(qū)間范圍對應(yīng)關(guān)系,可得公共衛(wèi)生為中等,說明西安市需要在環(huán)境和醫(yī)療等方面進(jìn)行調(diào)控。在環(huán)境方面可以通過控制水質(zhì)因子,利用工業(yè)污染物排序指標(biāo)ISE控制廢物排放量,有效降低患有癌癥、糖尿病和高血壓、高血脂等疾病的人數(shù)。 根據(jù)表2評價等級與區(qū)間范圍對應(yīng)關(guān)系,可得居民自身評價良好,說明西安市居民對當(dāng)?shù)仫嬍场⒐ぷ骱蜕畹确矫娴陌芽啬芰^好。若想提升評價等級指數(shù),在飲食方面可以通過計算標(biāo)準(zhǔn)體重與身高對應(yīng)能量攝入量,在工作方面可以通過運(yùn)動等方式解壓,全面提升居民幸福指數(shù)。 通過計算隨機(jī)森林模型輸出值與隸屬度對應(yīng)的區(qū)間范圍,及時發(fā)現(xiàn)問題,并就當(dāng)前問題提出合理的解決方案,為“健康行動計劃”提供有力支持,此外,根據(jù)建立的模型和經(jīng)驗有效提出解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題的可行方案。 4 結(jié)語 近年來,利用機(jī)器學(xué)習(xí)算法預(yù)測居民健康指數(shù)成為研究熱點,本文在先驗知識的基礎(chǔ)上,提出了一種基于隨機(jī)森林的居民健康評估模型,為解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題提供一種新的研究思路。 參考文獻(xiàn): [1] 桑祎瑩,黃仕鑫,易靜,等.基于隨機(jī)森林和誤差反向傳播神經(jīng)網(wǎng)絡(luò)的糖尿病性周圍神經(jīng)病變患病風(fēng)險研究[J].解放軍醫(yī)學(xué)雜志,2018,43(10):877-881. [2] 俞竣瀚. 基于極限學(xué)習(xí)機(jī)馬爾科夫模型的結(jié)果健康狀態(tài)預(yù)測研究[D]. 西安: 長安大學(xué), 2016. [3] 彭炎亮, 李旺根, 劉嬌. 基于動態(tài)權(quán)重和模糊綜合評價法的健康評估模型[J]. 計算機(jī)系統(tǒng)應(yīng)用, 2017, 12(1):37-43. [4] 朱鳳梅. 基于模糊綜合評價方法的醫(yī)療衛(wèi)生體制改革評價研究[J]. 中國衛(wèi)生統(tǒng)計, 2016, 33(2):267-270. [5] 雷順群. 論大健康理念形成的立論基礎(chǔ)和根據(jù)[J]. 中醫(yī)雜志, 2016, 57(15):1261-1265. [6] 李欣海. 隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 應(yīng)用昆蟲學(xué)報(昆蟲知識), 2016, 50(04):1190-1197. [7] 明勇, 王華軍. 模糊隸屬度融合多層前饋神經(jīng)網(wǎng)絡(luò)的CBIR方法[J]. 計算機(jī)測量與控制, 2015, 23(3):903-906. [8] 任鵬飛, 秦貴和. 具有交通規(guī)則約束的改進(jìn)Dijkstra算法[J]. 計算機(jī)應(yīng)用, 2015, 35(9):2503-2507. [9] 常振波, 盧文喜, 辛欣. 基于靈敏度分析和替代模型的地下水污染風(fēng)險評價方法[J]. 中國環(huán)境科學(xué), 2017, 37(1):167-173. [10] 李莉瓊, 劉漳輝, 郭昆. 基于灰關(guān)聯(lián)分析的模糊C均值算法[J]. 福州大學(xué)學(xué)報:自然科學(xué)版, 2016, 44(2):170-175. [11] 王小強(qiáng). 基于隨機(jī)森林的亞健康狀態(tài)預(yù)測與特征選擇方法研究[J]. 計算機(jī)應(yīng)用與軟件, 2014, 31(1):296-298, 307. 【通聯(lián)編輯:唐一東】