国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于灰色模型的全國肺結(jié)核疫情預(yù)測及分析

2019-07-11 06:45:30薛亞妮張梅李存龍
中國防癆雜志 2019年7期
關(guān)鍵詞:直轄市自治區(qū)灰色

薛亞妮 張梅 李存龍

結(jié)核病是一種慢性傳染病,若能及時發(fā)現(xiàn)并進(jìn)行合理治療,大多數(shù)患者可獲得臨床治愈[1-3]。2016年中國疾病預(yù)防控制中心共報告法定傳染病發(fā)病6 944 240例,死亡18 237例,其中肺結(jié)核發(fā)病836 200例,較上一年減少27 779例[4-8]。但由于傳染病具有潛伏期和可能產(chǎn)生大面積人群感染的特性,我國肺結(jié)核防治工作仍然面臨嚴(yán)峻形勢,提前預(yù)測肺結(jié)核的發(fā)病數(shù)對肺結(jié)核的防治工作將大有助益。本研究利用灰色預(yù)測的方法,對未來幾年全國肺結(jié)核疫情相關(guān)數(shù)據(jù)進(jìn)行預(yù)測,并進(jìn)一步利用自組織映射(self organizing maps,SOM)神經(jīng)網(wǎng)絡(luò)方法依據(jù)發(fā)病率將全國及31個省(自治區(qū)、直轄市;不包含我國臺灣、香港和澳門地區(qū),下同)聚類成4個不同層次,為肺結(jié)核防治工作提供相關(guān)數(shù)據(jù)支持。

資料和方法

一、資料來源

選取2008—2015年全國和各省(自治區(qū)、直轄市)的肺結(jié)核疫情相關(guān)數(shù)據(jù)。數(shù)據(jù)來源于《中國疾病預(yù)防控制信息系統(tǒng)》。結(jié)果見表1、2。

表1 全國及各省(自治區(qū)、直轄市)2008—2015年肺結(jié)核報告發(fā)病情況(例)

表2 全國及各省(自治區(qū)、直轄市)2008—2015年肺結(jié)核報告發(fā)病率(/10萬)

續(xù)表2

二、實驗方法

(一)灰色預(yù)測

灰色預(yù)測是用灰色模型GM(1,1)來進(jìn)行定量分析的,GM(1,1)模型適合具有較強(qiáng)的指數(shù)規(guī)律的數(shù)列,可有效描述單調(diào)的變化過程[9-11]。已知元素序列數(shù)據(jù):

X(0)=x(0)(1),x(0)(2),…,x(0)(n)

(1)

其中,X(0)為初始元素序列數(shù)據(jù),x(0)(k), (k=1,…,n)代表初始序列中的數(shù)據(jù),k代表數(shù)據(jù)序號,n為數(shù)據(jù)總個數(shù)。

做一次累加生成運(yùn)算得到如下序列:

X(1)=x(1)(1),x(1)(2),…,x(1)(n)

(2)

X(1)為一次累加生成后的元素序列數(shù)據(jù),x(1)(k),(k=1,…,n)代表一次累加生成后序列中的數(shù)據(jù),其中,

(3)

令Z(1)為X(1)的緊鄰均值生成序列,z為Z序列中的變量:

Z(1)=z(1)(2),z(1)(3),…,z(1)(n)

(4)

其中,

z(1)(k)=0.5x(1)(k)+0.5x(1)(k-1)

(5)

建立GM(1,1)的灰微分方程模型為:

x(0)(k)+az(1)(k)=b

(6)

(7)

其中,

(8)

再建立灰色微分方程的白化方程(也叫影子方程):

(9)

白化方程的解(也叫時間響應(yīng)函數(shù))為:

(10)

那么相應(yīng)的GM(1,1)灰色微分方程的時間響應(yīng)序列為:

(11)

取x(1)(0)=x(0)(1),則:

(12)

即為預(yù)測方程。

(二)SOM神經(jīng)網(wǎng)絡(luò)

SOM神經(jīng)網(wǎng)絡(luò)是聚類分析的一種經(jīng)典方法,可以通過將任意維度的輸入向量映射到一維或二維空間中,將相似的樣本映射到同一個二維輸出節(jié)點(diǎn)上。通常SOM神經(jīng)網(wǎng)絡(luò)的具體實現(xiàn)過程可概括如下[12]:

首先進(jìn)行網(wǎng)絡(luò)初始化。用較小的隨機(jī)數(shù)初始化輸入層和競爭層之間的連接權(quán)值,且設(shè)定競爭層的神經(jīng)元個數(shù)H。訓(xùn)練時間計數(shù)為t=0。

然后給定輸入向量X=(x1,x2,…,xn),m表示樣本的維度是m維。

接著計算輸入向量X和所有競爭層神經(jīng)元所連的權(quán)向量的距離(歐氏距離)。其中公式(12)是計算X和第j個競爭層神經(jīng)元所連的權(quán)向量的歐氏距離。

(13)

wij為輸入層i神經(jīng)元和競爭層j神經(jīng)元之間的連接權(quán)值。所有距離中最小的距離競爭層神經(jīng)元獲勝。分別調(diào)節(jié)獲勝神經(jīng)元和獲勝神經(jīng)周圍神經(jīng)元與輸入層的連接權(quán)值。公式(14)給出權(quán)值更新:

Δwij=η(t)(xi(t)-wij)

(14)

η(t)為t時刻的權(quán)重調(diào)整的學(xué)習(xí)率,一般可以設(shè)置η=1/t。如果樣本沒有訓(xùn)練完畢,則重復(fù)輸入向量循環(huán)。若樣本訓(xùn)練完畢,則SOM網(wǎng)絡(luò)建立成功。

結(jié) 果

一、模型參數(shù)

利用表1和表2中的數(shù)據(jù)及Python編寫算法,分別得出全國和其他31個省(自治區(qū)、直轄市)的發(fā)病數(shù)和發(fā)病率的灰色預(yù)測模型參數(shù)(注:因地區(qū)過多,此處僅列出全國的預(yù)測模型,其他地區(qū)預(yù)測模型通過參數(shù)方式列出,如表3所示):

發(fā)病數(shù)(例):

發(fā)病率(/10萬):

表3 全國及各省(自治區(qū)、直轄市)預(yù)測模型參數(shù)表

續(xù)表3

注a和b為通過歷史數(shù)據(jù)擬合得到的灰色預(yù)測模型參數(shù),其中a為發(fā)展系數(shù),b為灰色作用量,如公式(6)所述

二、精度檢驗

采用后驗差檢驗的方法對得到的灰色預(yù)測模型進(jìn)行精度檢驗。后驗差檢驗是按照精度檢驗c(后驗差)和p(小概率誤差)兩個指標(biāo)進(jìn)行檢驗。記原始數(shù)列及殘差數(shù)列的方差分別是S12和S22,然后用下式計算后驗差c及小概率誤差p。

(13)

根據(jù)表4判定模型的精度[7]。

經(jīng)過模型擬合計算后驗差c為0.0713,小概率誤差p為1,根據(jù)表中判定標(biāo)準(zhǔn),模型的擬合效果為好,隨后進(jìn)行外推預(yù)測。

表4 灰色預(yù)測模型精度表

三、外推預(yù)測

利用GM(1,1)模型,以2008—2015年共8年的數(shù)據(jù)作為已知數(shù)據(jù)序列,預(yù)測2016—2021年共6年的全國肺結(jié)核發(fā)病數(shù)和發(fā)病率。如表5和表6所示。

四、聚類分析

通過預(yù)測2016—2021年全國及31個省(自治區(qū)、直轄市)的肺結(jié)核發(fā)病率時間軌跡序列,并將預(yù)測的發(fā)病率時間軌跡序列輸入到SOM聚類模型中,設(shè)置聚類的類別數(shù)為4,SOM聚類模型將自動地組織特征進(jìn)行訓(xùn)練并將32個時間軌跡序列聚為4類。分別計算4類的類中心序列(類中心序列表示計算一個類所包含的所有序列的平均序列)。通過比較4類的類中心序列的差異,判斷SOM聚類的表現(xiàn)力。表7分別記錄了由SOM聚類出的第1~4類中包含的地區(qū)編號和地區(qū)名。由表7可知,通過SOM方法將全國及31個省(自治區(qū)、直轄市)的肺結(jié)核發(fā)病率時間軌跡聚為4類,用類中心來分析4類的聚類效果和類與類之間的差異(圖1)。

在所有的4類中,第1類類中心序列均高于其他3類,包含青海、西藏和新疆,其發(fā)病率軌跡具有很強(qiáng)的相似性,且這3個地區(qū)的發(fā)病率軌跡值普遍高于其他3類。第2類類中心序列低于第1類,位居第二高的水平,且與其他3類類中心有一定差異性,包括黑龍江、湖南、廣西、海南和貴州等省(自治區(qū))。第3類類中心序列異于其他3類,包括遼寧、安徽、江西、河南、湖北、廣東、重慶、四川、云南和陜西等,類中心序列略低于第2類。第4類類中心序列普遍低于50/10萬,但也異于其他3類,包括北京、天津、河北、山西、內(nèi)蒙古、吉林、上海、江蘇、浙江、福建、山東、甘肅和寧夏等省(自治區(qū)、直轄市)。

表6 全國及各省(自治區(qū)、直轄市)2016—2021年肺結(jié)核發(fā)病率預(yù)測結(jié)果(/10萬)

表7 全國各省(自治區(qū)、直轄市)聚類分類

各個點(diǎn)表示各類地區(qū)發(fā)病率的均值;本圖根據(jù)表6、7數(shù)據(jù)和內(nèi)容繪制圖1 全國各省(自治區(qū)、直轄市)聚類分析第1~4類類中心序列發(fā)病率軌跡

討 論

2008—2016年期間,全國的肺結(jié)核發(fā)病情況呈現(xiàn)出在波動中緩慢下降的趨勢,其趨勢與各省(自治區(qū)、直轄市)的預(yù)測趨勢大致相同[13-17],2009—2010年處于死亡數(shù)和死亡率的高峰期,隨后緩慢下降,但2009—2010年的發(fā)病率相較于2008年是下降的,整個肺結(jié)核疫情的情況處于較為平穩(wěn)的態(tài)勢。根據(jù)灰色預(yù)測結(jié)果,未來幾年內(nèi)肺結(jié)核的發(fā)病情況處于緩慢下降的態(tài)勢,這與逐漸發(fā)展的醫(yī)學(xué)技術(shù)和人們健康意識的提高有關(guān),也與人口的流動性有很大的關(guān)系。隨著社會的發(fā)展,未來人口的流動性會日趨升高,這也給肺結(jié)核的防治工作提出了新的挑戰(zhàn)。

通過聚類分析結(jié)果顯示,在所有的4類中,第1類類中心序列均高于其他三類,且趨勢異于其他3類中心序列,這意味著第1類包含的青海、西藏和新疆的發(fā)病率軌跡具有很強(qiáng)的相似性,并且這3個地區(qū)的發(fā)病率軌跡值普遍高于其他3類,所以這3個地區(qū)應(yīng)該給予重點(diǎn)對待。第2類類中心序列低于第1類,位居第二高的水平,且與其他3類類中心有明顯的差異性,說明第2類包含的地區(qū)(黑龍江、湖南、廣西、海南和貴州)具有相似的發(fā)病率時間軌跡,并應(yīng)該給予足夠的相同水平的防治重視和衛(wèi)生資源。第3類類中心序列略低于第2類,因此可以給予第3類地區(qū)(遼寧、安徽、江西、河南、湖北、廣東、重慶、四川、云南和陜西)略低于第2類地區(qū)的防治重視和衛(wèi)生資源。第4類類中心序列普遍低于50/10萬,以此可知第4類包含的地區(qū)(北京、天津、河北、山西、內(nèi)蒙古、吉林、上海、江蘇、浙江、福建、山東、甘肅和寧夏)發(fā)病率時間軌跡具有較高的相似性,可以制訂一般性防治措施。

灰色預(yù)測方法作為一種數(shù)據(jù)處理的預(yù)測方法,不需要大量樣本,樣本不需要有規(guī)律性分布,計算工作量小,可以充分利用最少的信息來進(jìn)行預(yù)測,但由于數(shù)據(jù)的局限性,影響肺結(jié)核疫情的數(shù)據(jù)肯定是多樣和復(fù)雜的。因此,基于單一的病情數(shù)據(jù)和歷史數(shù)據(jù)對病情的預(yù)測,也必然存在局限性,所以,在數(shù)據(jù)和其他條件允許的情況下,盡可能綜合考慮其他因素,如氣候條件、人口流動性、醫(yī)療條件等,運(yùn)用多種組合方法[18],更加準(zhǔn)確地預(yù)測肺結(jié)核疫情的變化情況,為國家對疫情的防治提供有效決策和數(shù)據(jù)支撐。

志謝延安大學(xué)醫(yī)學(xué)院王興寧老師對本研究數(shù)據(jù)統(tǒng)計方面進(jìn)行了悉心指導(dǎo)和幫助。

猜你喜歡
直轄市自治區(qū)灰色
來稿統(tǒng)計
前進(jìn)(2023年12期)2023-12-20 08:52:22
淺灰色的小豬
走進(jìn)神奇的漢特-曼西自治區(qū)
伙伴(2019年7期)2019-08-13 06:40:49
2017年各省、自治區(qū)、直轄市財政收入完成預(yù)算情況
2017年各省、自治區(qū)、直轄市財政支出完成預(yù)算情況
關(guān)于召開第18屆24省(市、自治區(qū))4市鑄造學(xué)術(shù)會議的(第一輪)通知
灰色時代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色時髦觀
Coco薇(2017年2期)2017-04-25 17:57:49
2015年各省、自治區(qū)、直轄市財政支出完成預(yù)算情況
感覺
五峰| 大丰市| 会同县| 桑植县| 潢川县| 西城区| 集贤县| 拜城县| 霞浦县| 仲巴县| 阿拉善右旗| 弥勒县| 黑龙江省| 曲靖市| 宁夏| 漳浦县| 大姚县| 乌什县| 天水市| 阿尔山市| 曲阜市| 焦作市| 大悟县| 厦门市| 临海市| 读书| 纳雍县| 丽江市| 凤阳县| 彝良县| 喀喇沁旗| 蒙自县| 长治县| 定陶县| 安龙县| 沧州市| 永和县| 项城市| 永康市| 汾阳市| 安平县|