国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

適應(yīng)性回歸分析(Ⅲ)構(gòu)建具有混合結(jié)構(gòu)的回歸模型
——

2019-06-18 02:44:58羅艷虹胡良平
四川精神衛(wèi)生 2019年2期
關(guān)鍵詞:因變量樣條計(jì)算結(jié)果

羅艷虹,胡良平

(1.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室,山西 太原 030001;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029;3.軍事科學(xué)院研究生院,北京 100850

1 基于多個回歸模型采用ADAPTIVEREG過程實(shí)現(xiàn)一次性擬合

1.1 問題與模型

【實(shí)例1】假定在自變量的定義域內(nèi),可以構(gòu)造出三個回歸模型,它們分別為指數(shù)回歸模型、對數(shù)回歸模型和直線回歸模型[1-2]。這三個回歸模型的表達(dá)式見式(1)。

(1)

是否可以通過一個SAS過程步來一次性擬合出上述三個回歸模型?

1.2 利用ADAPTIVEREG過程實(shí)現(xiàn)上述要求

1.2.1 所需要的SAS程序

data Mixture;

drop i;

do i=1 to 1000;

X=ranuni(1);

C=int(3*ranuni(1));

if C=0 then Y=exp(5*(X-0.3)**2)+rannor(1);

else if C=1 then Y=log(X*(1-X))+rannor(1);

else Y=7*X+rannor(1);

output;

end;

run;

ods graphics on;

proc adaptivereg data=Mixture plots=fit;

class c;

model y=c x;

run;

1.2.2 SAS數(shù)據(jù)步程序說明

在SAS數(shù)據(jù)步程序中,擬產(chǎn)生1 000個觀測(即樣本含量N=1 000);將自變量X設(shè)置為在“0~1”區(qū)間上變化且服從均勻分布的隨機(jī)變量;首先將分類變量C設(shè)置為在“0~1”區(qū)間上變化且服從均勻分布的隨機(jī)變量,然后將變量C乘以3,最后再將其取整(這樣做的目的是使“C”成為隨機(jī)變量,而不是一般變量,也就是說,它在數(shù)據(jù)集中的取值仍為0~2,但不是按確定性的順序出現(xiàn)的,而是隨機(jī)出現(xiàn)的);接下來按式(1)進(jìn)行計(jì)算,得出C在取不同值條件下的因變量y的數(shù)值。應(yīng)注意:在因變量y的每個數(shù)值上,還加上了一個服從N(0,1)分布的隨機(jī)變量的數(shù)值,其意義在于:因變量y也是一個隨機(jī)變量,而不是一個一般變量。

1.2.3 SAS過程步程序說明

調(diào)用“ADAPTIVEREG過程”,在過程步語句中,要求繪制圖形;使用“CLASS語句”,指定分類變量為“C”;在“MODEL語句”中,包含了兩個自變量,一個為變量C、另一個為變量X。

1.2.4 SAS主要輸出結(jié)果及解釋

擬合統(tǒng)計(jì)量GCV1.08046GCV R-Square0.90279Effective Degrees of Freedom25R-Square0.90740Adjusted R-Square0.90628Mean Square Error1.04064Average Square Error1.02711

以上為擬合統(tǒng)計(jì)量的計(jì)算結(jié)果,R2和調(diào)整R2分別為0.90740和0.90628,說明模型對資料的擬合效果比較好。

向后選擇后的回歸樣條模型名稱系數(shù)父級變量結(jié)點(diǎn)水平Basis05.3829InterceptBasis1-4.3871Basis0C10Basis332.7761Basis0C1Basis520.2859Basis4X0.7665Basis7-11.4183Basis2X0.7665Basis8-7.0758Basis2X0.7665Basis958.4911Basis3X0.5531Basis10-71.6388Basis3X0.5531Basis11-69.0764Basis3X0.04580Basis13-119.71Basis3X0.9526Basis1566.5733Basis1X0.9499Basis176.6681Basis1X0.5143Basis19-185.21Basis1X0.9890

以上為“向后選擇后的回歸樣條模型”中“各基函數(shù)”及其回歸系數(shù),以“基函數(shù)”為新“自變量”的適應(yīng)性回歸模型比式(1)更復(fù)雜。

ANOVA分解功能性成分基數(shù)DF變化量(若忽略)失擬GCVC241112.501.1519C X10203773.943.7690

以上為“方差分析分解”的計(jì)算結(jié)果,對因變量y影響較大的是“C”與“X”之間的交互作用項(xiàng),其次是變量C。

變量重要性 變量基數(shù)重要性C12100.00X1050.68

以上為兩個變量“C”與“X”對因變量y的重要性的計(jì)算結(jié)果,可以看出:變量C對因變量y的影響最大,其次是變量X。

擬合結(jié)果用圖示法呈現(xiàn),見圖1。

圖1 ADAPTIVEREG過程按式(1)擬合的結(jié)果

由圖1可知:自上而下有三條線,第1條為“直線”,對應(yīng)式(1)中第3式;第2條為“指數(shù)曲線”,對應(yīng)式(1)中第1式;第3條為“對數(shù)曲線”,對應(yīng)式(1)中第2式。

2 基于具有混合結(jié)構(gòu)的數(shù)據(jù)集采用ADAPTIVEREG過程實(shí)現(xiàn)一次性擬合

2.1 問題與數(shù)據(jù)結(jié)構(gòu)

【實(shí)例2】假定有一個具有混合結(jié)構(gòu)的數(shù)據(jù)集。見表1。

在此次研究中,觀察組患者的腹脹幾率是5.46%,對照組的腹脹幾率是21.82%,兩組結(jié)果對比存在統(tǒng)計(jì)學(xué)差異性(P<0.05)。觀察組患者的胃腸蠕動時間、腸鳴音、肛門排氣時間等均比對照組短,兩組結(jié)果存在統(tǒng)計(jì)學(xué)差異性(P<0.05)。觀察組臨床護(hù)理滿意度是94.54%,對照組是76.37%,結(jié)果存在統(tǒng)計(jì)學(xué)差異性(P<0.05)。

表1 一個具有三類(C=1、2、3)結(jié)構(gòu)不同的混合型數(shù)據(jù)集

注:在C=1、2、3類的數(shù)據(jù)集中,x的取值均為1~12,但y的取值是不同的

【問題】試在每一類中,構(gòu)建y依賴x變化而變化的回歸模型。

2.2 試采用ADAPTIVEREG過程直接擬合該數(shù)據(jù)集

2.2.1 創(chuàng)建SAS數(shù)據(jù)集

所需要的SAS數(shù)據(jù)步程序如下:

Data a1;

INPUT x y c @@;

CARDS;

此處輸入表1中12行6列數(shù)據(jù);

;

RUN;

所需要的SAS過程步程序如下:

ods graphics on;

proc adaptivereg data=a1 plots=fit;

class c;

model y=c x;

run;

2.2.3 顯示SAS主要分析結(jié)果

擬合統(tǒng)計(jì)量GCV132.61471GCV R-Square0.97285Effective Degrees of Freedom21 R-Square0.99501 Adjusted R-Square0.99302 Mean Square Error33.15368 Average Square Error23.02339

以上為“擬合統(tǒng)計(jì)量”的計(jì)算結(jié)果。由R2和調(diào)整R2的計(jì)算結(jié)果可知,模型對資料的擬合效果比較好。

向后選擇后的回歸樣條模型名稱系數(shù)父級變量結(jié)點(diǎn)水平Basis087.2987InterceptBasis4-11.0742Basis1x10.0000Basis6-39.7160Basis2x6.0000Basis7-107.33Basis0c2Basis944.6297Basis7x10.0000Basis109.5651Basis7x10.0000Basis11-22.0541Basis2x9.0000Basis1315.7856Basis8x6.0000Basis15-25.0254Basis2x3.0000Basis1749.1853Basis7x11.0000Basis19-13.9451Basis8x8.0000

以上為“向后選擇后的回歸樣條模型”的計(jì)算結(jié)果,需要用到19個“基函數(shù)”。

ANOVA分解功能性成分基數(shù)DF變化量(若忽略)失擬GCVC12128071565.97C X9181633895296.08

以上為“方差分析分解”的計(jì)算結(jié)果,說明變量C和“C”與“X”的交互作用項(xiàng)對因變量y的影響很大。

變量重要性變量基數(shù)重要性C9100.00X1093.90

以上是對兩個變量的重要性所做的評價,兩個變量對于因變量y的影響都很大。

由于模型的表達(dá)式非常復(fù)雜且不直觀,SAS采用圖形方式呈現(xiàn)模型擬合結(jié)果。見圖2。

圖2 采用ADAPTIVEREG過程擬合表1資料的結(jié)果以圖形呈現(xiàn)

在圖2中,可以比較清楚地看出:在“C=1”類中,y與x之間呈現(xiàn)“Logistic曲線”關(guān)系;在“C=2”類中,y與x之間呈現(xiàn)“拋物線”關(guān)系;在“C=3”類中,y與x之間呈現(xiàn)“指數(shù)曲線”關(guān)系。

2.3 數(shù)據(jù)結(jié)構(gòu)的揭秘

在表1的“C=1”類中,(x,y)的兩列數(shù)據(jù)來自文獻(xiàn)[3],該資料描述的是“某縣瘧疾發(fā)病的季節(jié)性特點(diǎn)”,即某縣1961年-1996年瘧疾的月累計(jì)發(fā)病率(x代表1月-12月,y代表“累計(jì)發(fā)病率”,單位為“1/10萬”)。繪制該資料的散布圖,呈現(xiàn)“Logistic曲線”變化趨勢,適合擬合“Logistic曲線回歸模型”。

在表1的“C=2”類中,(x,y)的兩列數(shù)據(jù)中的“x”保持不變,而“y”列數(shù)據(jù)是采用如下的式(2)計(jì)算出來的:

y=-5×(x-6)2+10

(2)

式(2)表達(dá)的是一個y關(guān)于x 的“二次拋物線模型”。

在表1的“C=3”類中,(x,y)的兩列數(shù)據(jù)中的“x”保持不變,而“y”列數(shù)據(jù)是采用如下的式(3)計(jì)算出來的:

y=e(x-7)-30

(3)

式(3)表達(dá)的是一個y關(guān)于x 的“指數(shù)曲線模型”。

結(jié)合上面圖1中呈現(xiàn)的“三條曲線”及其解釋,不難發(fā)現(xiàn):適應(yīng)性回歸樣條算法給出的結(jié)果與數(shù)據(jù)所代表的真實(shí)模型是基本吻合的。

3 討論與結(jié)論

3.1 討論

“實(shí)例1”與“實(shí)例2”看起來有所不同,前者似乎是從“模型”出發(fā),產(chǎn)生“數(shù)據(jù)”,再用“ADAPTIVEREG過程”去擬合數(shù)據(jù);而后者似乎是從“數(shù)據(jù)”出發(fā),采用“ADAPTIVEREG過程”去擬合數(shù)據(jù),再交代各類數(shù)據(jù)所代表的“模型”。其實(shí),二者在本質(zhì)上是完全一樣的。對于“ADAPTIVEREG過程”而言,它并不知曉正在擬合的“數(shù)據(jù)”究竟包含了“哪幾種模型”或存在“哪些客觀規(guī)律”,只是基于“特定類中兩變量之間的數(shù)量關(guān)系”并依據(jù)“適應(yīng)性回歸樣條算法”去逐一構(gòu)造“基函數(shù)”,在“失擬(LOF)”和“廣義交叉驗(yàn)證(GCV)”等的“擬合優(yōu)度評價指標(biāo)”的“監(jiān)控”之下,找到“基函數(shù)”及其組合。

3.2 結(jié)論

適應(yīng)性回歸樣條算法(由ADAPTIVEREG過程實(shí)現(xiàn))確實(shí)具有一定的揭示“混雜結(jié)構(gòu)數(shù)據(jù)集”中隱藏的數(shù)據(jù)規(guī)律的“能力”;然而,它給出的基于“基函數(shù)”的“回歸模型”過于復(fù)雜且很不直觀;通過“圖形方式”呈現(xiàn)的結(jié)果雖然很直觀,但很不“精確”,不同的分析者可能會給出不同的“解讀結(jié)果”。但是,圖形呈現(xiàn)的結(jié)果確實(shí)可以給分析者提供一些有價值的“分析線索”或“積極暗示”,有利于分析者縮小“探索性研究的空間”[4]。

猜你喜歡
因變量樣條計(jì)算結(jié)果
一元五次B樣條擬插值研究
調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
中國藥房(2022年7期)2022-04-14 00:34:30
不等高軟橫跨橫向承力索計(jì)算及計(jì)算結(jié)果判斷研究
甘肅科技(2020年20期)2020-04-13 00:30:40
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
三次參數(shù)樣條在機(jī)床高速高精加工中的應(yīng)用
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測
軟件(2017年6期)2017-09-23 20:56:27
偏最小二乘回歸方法
基于樣條函數(shù)的高精度電子秤設(shè)計(jì)
超壓測試方法對炸藥TNT當(dāng)量計(jì)算結(jié)果的影響
噪聲對介質(zhì)損耗角正切計(jì)算結(jié)果的影響
大方县| 南开区| 易门县| 普格县| 沛县| 基隆市| 芦溪县| 通海县| 张北县| 霞浦县| 济源市| 昂仁县| 寻甸| 正定县| 苍南县| 将乐县| 黄山市| 高安市| 淄博市| 平邑县| 宣恩县| 岱山县| 苗栗市| 柳江县| 南雄市| 嘉祥县| 金寨县| 淳安县| 娄烦县| 清新县| 奈曼旗| 温泉县| 诸城市| 塔城市| 龙南县| 澜沧| 招远市| 衡山县| 临澧县| 惠东县| 郯城县|