国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的居民健康評估模型

2020-09-28 07:05:41魏小弟
電腦知識與技術(shù) 2020年16期
關(guān)鍵詞:隨機(jī)森林

魏小弟

摘要:隨著我國經(jīng)濟(jì)水平的快速發(fā)展和人民生活水平的不斷提高,特別是新時期健康衛(wèi)生工作方針由“以治病為中心”向“以健康為中心”轉(zhuǎn)變的背景下,人們對生活質(zhì)量、衛(wèi)生服務(wù)和身心健康提出了更高的要求。本文基于大健康學(xué)科前沿成果,分析了“失配性”現(xiàn)象的形成機(jī)理并將飲食、生活、工作、醫(yī)療、環(huán)境作為輸入層,社會公共衛(wèi)生和居民個體作為輸出層,構(gòu)造基于隨機(jī)森林(Random Forest, RF)算法的社會公共衛(wèi)生與環(huán)境和居民個體評估模型;然后采用模糊等級劃分法設(shè)定五種評估等級,并使用指派法建立隸屬度函數(shù)來確定五個因素對五種評估等級的影響;最后通過比較模型輸出值和隸屬度函數(shù)空間值的大小,及時發(fā)現(xiàn)存在的問題,并提出解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題的可行方案。

關(guān)鍵詞:居民健康; 隨機(jī)森林; 模糊等級劃分法; 隸屬度函數(shù)

中圖分類號: TP391? ? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2020)16-0033-03

隨著經(jīng)濟(jì)的快速發(fā)展,人們對衣、食、住、行等方面提出了更高的要求,如醫(yī)療模式從傳統(tǒng)的單一救治模式逐漸向“防、治、養(yǎng)”的大健康模式轉(zhuǎn)變[1-5]。但健康問題受到飲食習(xí)慣、生活方式、工作壓力和醫(yī)療保障等多方面的影響,且患慢性病、老年病、肥胖病以及亞健康等問題的人數(shù)逐年遞增,給國民健康帶來了非常大的困擾[6-8]。為此建立一種能夠支持健康水平動態(tài)測控的居民健康評估模型迫在眉睫。

1 算法設(shè)計與分析

1.1 隨機(jī)森林模型

根據(jù)大健康學(xué)科前沿研究成果,通過分析“失配性”現(xiàn)象的形成機(jī)理[9],將飲食、生活、工作、醫(yī)療、環(huán)境作為輸入層,社會公共衛(wèi)生和居民個體作為輸出層,構(gòu)造基于隨機(jī)森林算法的居民健康評估模型。隨機(jī)森林構(gòu)造過程如圖1所示。

隨機(jī)森林是由一組決策分類器[{h(x,?t),t=1,2,...,T}]組成的集成分類器,其中[?t]是服從獨(dú)立分布的隨機(jī)變量,T表示隨機(jī)森林中決策樹的個數(shù),每個決策樹分類器通過投票的方式來決定最優(yōu)的分類結(jié)果[10]。具體計算如公式(1)所示。

上述過程實現(xiàn)了隨機(jī)森林模型的構(gòu)造,但模型的訓(xùn)練需要多個城市不同狀況下居民的健康數(shù)據(jù),本文選擇北京、上海、西藏、蘭州和成都等地的居民健康數(shù)據(jù)進(jìn)行模型的訓(xùn)練。

考慮到模型輸入時各因素數(shù)據(jù)不統(tǒng)一的問題,采用以下五種計算方式實現(xiàn)數(shù)據(jù)的歸一化處理。

(1)飲食方面采用攝入能量與體重之間的關(guān)系進(jìn)行計算,體質(zhì)指數(shù)(Body Mass Index, BMI)如公式(5)所示。

[BMI=BWST2]? ? ? ? ? ? ? ? ? ? ?(5)

(2)生活方面采用國民幸福指數(shù)(National Happiness Index, NHI)進(jìn)行計算,如公式(6)所示。

[NHI=IIGE×UR×IN]? ? ? ? ? ? ? ? (6)

(3)工作方面采用失業(yè)率表示,如公式(7)所示。

[UR=UYNB+UY]? ? ? ? ? ? ? ? ? (7)

(4)醫(yī)療方面采用醫(yī)保普及率表示。

(5)環(huán)境方面主要考慮到空氣質(zhì)量,等標(biāo)排放量Pi(m3/h)計算如公式(8)所示。

[Pi=Qi/Coi×109]? ? ? ? ? ? ? ? (8)

其中,BW表示身高,ST表示體重;II表示居民收入的遞增,GE表示基尼系數(shù),UR表示失業(yè)率,IN表示通貨膨脹;UY表示失業(yè)人數(shù),NB表示在業(yè)人數(shù);[Qi]表示第i類污染物在單位時間內(nèi)的排放量,[Coi]表示第i類污染物空氣排放質(zhì)量標(biāo)準(zhǔn)。

1.2 隨機(jī)森林算法描述

隨機(jī)森林算法作為基于機(jī)器學(xué)習(xí)的一種集成分類算法,結(jié)合了多個決策樹的分類效果,最終通過“投票”方式選擇出票數(shù)最多的類別作為最終的分類[11]。每一棵樹構(gòu)造流程如算法1所示。

[算法1:隨機(jī)森林算法 Step1 用N表示訓(xùn)練樣本個數(shù),M表示特征數(shù)目; Step2 輸入特征數(shù)目[m(m

3 實驗與分析

3.1 實驗環(huán)境

實驗環(huán)境如表1所示。

3.2 實驗結(jié)果與分析

為驗證本文算法的性能,從國家衛(wèi)生部和國家統(tǒng)計局等網(wǎng)站收集與整理120000條數(shù)據(jù)作為隨機(jī)森林模型的訓(xùn)練與測試數(shù)據(jù),設(shè)置模型的最大訓(xùn)練次數(shù)epochs=120,learning rate=0.01,具體訓(xùn)練過程如圖2(a)和(b)所示。

通過圖2(a)可知,在訓(xùn)練與測試初期,模型的準(zhǔn)確率隨著訓(xùn)練步數(shù)的增加而快速上升,且訓(xùn)練準(zhǔn)確率高于測試準(zhǔn)確率;由圖2(b)可知,在訓(xùn)練初期模型的loss值隨著訓(xùn)練步數(shù)的增加快速下降,且訓(xùn)練loss值低于測試loss值,表明該模型具有較好的訓(xùn)練與測試效果。

圖3給出了隨機(jī)森林模型的回歸檢驗,其中紅色表示訓(xùn)練值,黃色表示驗證值,藍(lán)色表示測試值,當(dāng)R=0.9943、0.9952和0.9935時符合回歸檢驗,如圖3(a)、(b)和(c)所示。通過觀察圖3(d),當(dāng)R=0.9958時,模型在訓(xùn)練、測試和驗證集上取得最好的吻合效果,表明本文模型具有可行性。

用于模型輸入的五個指標(biāo)存在動態(tài)變化的特點,本題針對這一問題采用指派法,通過建立梯形函數(shù)和三角函數(shù)相結(jié)合的隸屬度函數(shù),求解出劃定評價社會公共衛(wèi)生與環(huán)境和居民個體的五個等級。隸屬度函數(shù)關(guān)系如圖4所示。

3.3 依據(jù)評估模型提出可行性方案

為評估本文提出模型的有效性,現(xiàn)以西安市為例。將五個指標(biāo)作為模型的輸入,社會公共衛(wèi)生和居民個體作為模型的輸出,分別計算得到社會公共衛(wèi)生和居民個體的評價為0.58和0.76。

根據(jù)表2評價等級與區(qū)間范圍對應(yīng)關(guān)系,可得公共衛(wèi)生為中等,說明西安市需要在環(huán)境和醫(yī)療等方面進(jìn)行調(diào)控。在環(huán)境方面可以通過控制水質(zhì)因子,利用工業(yè)污染物排序指標(biāo)ISE控制廢物排放量,有效降低患有癌癥、糖尿病和高血壓、高血脂等疾病的人數(shù)。

根據(jù)表2評價等級與區(qū)間范圍對應(yīng)關(guān)系,可得居民自身評價良好,說明西安市居民對當(dāng)?shù)仫嬍场⒐ぷ骱蜕畹确矫娴陌芽啬芰^好。若想提升評價等級指數(shù),在飲食方面可以通過計算標(biāo)準(zhǔn)體重與身高對應(yīng)能量攝入量,在工作方面可以通過運(yùn)動等方式解壓,全面提升居民幸福指數(shù)。

通過計算隨機(jī)森林模型輸出值與隸屬度對應(yīng)的區(qū)間范圍,及時發(fā)現(xiàn)問題,并就當(dāng)前問題提出合理的解決方案,為“健康行動計劃”提供有力支持,此外,根據(jù)建立的模型和經(jīng)驗有效提出解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題的可行方案。

4 結(jié)語

近年來,利用機(jī)器學(xué)習(xí)算法預(yù)測居民健康指數(shù)成為研究熱點,本文在先驗知識的基礎(chǔ)上,提出了一種基于隨機(jī)森林的居民健康評估模型,為解決類似“失配性”慢性非傳染疾病以及環(huán)境污染等問題提供一種新的研究思路。

參考文獻(xiàn):

[1] 桑祎瑩,黃仕鑫,易靜,等.基于隨機(jī)森林和誤差反向傳播神經(jīng)網(wǎng)絡(luò)的糖尿病性周圍神經(jīng)病變患病風(fēng)險研究[J].解放軍醫(yī)學(xué)雜志,2018,43(10):877-881.

[2] 俞竣瀚. 基于極限學(xué)習(xí)機(jī)馬爾科夫模型的結(jié)果健康狀態(tài)預(yù)測研究[D]. 西安: 長安大學(xué), 2016.

[3] 彭炎亮, 李旺根, 劉嬌. 基于動態(tài)權(quán)重和模糊綜合評價法的健康評估模型[J]. 計算機(jī)系統(tǒng)應(yīng)用, 2017, 12(1):37-43.

[4] 朱鳳梅. 基于模糊綜合評價方法的醫(yī)療衛(wèi)生體制改革評價研究[J]. 中國衛(wèi)生統(tǒng)計, 2016, 33(2):267-270.

[5] 雷順群. 論大健康理念形成的立論基礎(chǔ)和根據(jù)[J]. 中醫(yī)雜志, 2016, 57(15):1261-1265.

[6] 李欣海. 隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 應(yīng)用昆蟲學(xué)報(昆蟲知識), 2016, 50(04):1190-1197.

[7] 明勇, 王華軍. 模糊隸屬度融合多層前饋神經(jīng)網(wǎng)絡(luò)的CBIR方法[J]. 計算機(jī)測量與控制, 2015, 23(3):903-906.

[8] 任鵬飛, 秦貴和. 具有交通規(guī)則約束的改進(jìn)Dijkstra算法[J]. 計算機(jī)應(yīng)用, 2015, 35(9):2503-2507.

[9] 常振波, 盧文喜, 辛欣. 基于靈敏度分析和替代模型的地下水污染風(fēng)險評價方法[J]. 中國環(huán)境科學(xué), 2017, 37(1):167-173.

[10] 李莉瓊, 劉漳輝, 郭昆. 基于灰關(guān)聯(lián)分析的模糊C均值算法[J]. 福州大學(xué)學(xué)報:自然科學(xué)版, 2016, 44(2):170-175.

[11] 王小強(qiáng). 基于隨機(jī)森林的亞健康狀態(tài)預(yù)測與特征選擇方法研究[J]. 計算機(jī)應(yīng)用與軟件, 2014, 31(1):296-298, 307.

【通聯(lián)編輯:唐一東】

猜你喜歡
隨機(jī)森林
隨機(jī)森林算法在中藥指紋圖譜中的應(yīng)用:以不同品牌夏桑菊顆粒指紋圖譜分析為例
基于隨機(jī)森林的登革熱時空擴(kuò)散影響因子等級體系挖掘
基于隨機(jī)森林的HTTP異常檢測
個人信用評分模型比較數(shù)據(jù)挖掘分析
時代金融(2017年6期)2017-03-25 22:21:13
隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
軟件(2016年7期)2017-02-07 15:54:01
拱壩變形監(jiān)測預(yù)報的隨機(jī)森林模型及應(yīng)用
基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
基于奇異熵和隨機(jī)森林的人臉識別
軟件(2016年2期)2016-04-08 02:06:21
基于隨機(jī)森林算法的B2B客戶分級系統(tǒng)的設(shè)計
白山市| 三穗县| 蒙城县| 南投市| 安吉县| 青岛市| 建始县| 淮安市| 太湖县| 延边| 蓬溪县| 搜索| 双柏县| 安新县| 淮阳县| 泸水县| 琼结县| 昭通市| 三原县| 乐山市| 梅州市| 宜兰市| 贡山| 米林县| 禄丰县| 云阳县| 台山市| 南陵县| 民和| 登封市| 忻城县| 讷河市| 黔南| 远安县| 读书| 汨罗市| 密云县| 兴城市| 沾化县| 大安市| 白银市|