宋榮榮,范亞茹
(西南民族大學(xué)數(shù)學(xué)學(xué)院,四川 成都 610041)
在眾多應(yīng)用中,因變量與自變量的關(guān)系是非常復(fù)雜的.研究多個(gè)自變量與因變量之間的關(guān)系,就不得不考慮自變量之間的交互作用,因?yàn)榻换プ饔脮?huì)嚴(yán)重影響自變量與因變量的關(guān)系[1-5].不排除交互作用的干擾,會(huì)出現(xiàn)什么問(wèn)題呢? 交互作用會(huì)造成因變量和自變量之間相關(guān)關(guān)系的偏倚,導(dǎo)致因變量與自變量之間的任何一種相關(guān)程度增大或減少[6-8].特別是當(dāng)因變量和自變量不相關(guān)時(shí),由于交互作用還會(huì)導(dǎo)致它們之間存在假的相關(guān)性[9].如何排除交互作用研究多自變量與因變量間的關(guān)系,是當(dāng)前大學(xué)生在學(xué)習(xí)過(guò)程中亟待解決的問(wèn)題. 在參加數(shù)學(xué)建模競(jìng)賽時(shí),大多數(shù)學(xué)生并不清楚如何排除交互作用,再研究多個(gè)自變量對(duì)因變量的影響[10-11].因此,教會(huì)學(xué)生如何排除交互作用的干擾,研究多個(gè)自變量對(duì)因變量的影響是至關(guān)重要的[12].
目前,排除交互作用的主要方法是多因素調(diào)整分析法[13].當(dāng)問(wèn)題中交互作用較多,且交互作用復(fù)雜時(shí),可采用多因素調(diào)整分析法[14]. 在該方法中,根據(jù)因變量的類(lèi)型,可選擇三種回歸模型:多重線性回歸、logistic 回歸及Cox 回歸.其中多重線性回歸的因變量是連續(xù)變量,logistic 回歸的因變量是分類(lèi)變量,而Cox 回歸的因變量是時(shí)間變量.本文以2022 年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽C 題為例,研究玻璃文物風(fēng)化與紋飾、顏色及類(lèi)型之間的關(guān)系.因?yàn)轱L(fēng)化是分類(lèi)因變量,所以選用logistic 回歸排除交互作用的干擾,并研究多自變量與因變量的關(guān)系.
本文將基于SPSS 軟件建立logistic 回歸模型,為學(xué)生提供一種層層遞進(jìn)的探究方法,讓學(xué)生掌握如何排除交互作用的干擾研究多個(gè)自變量與因變量之間的關(guān)系,如何利用軟件探究自變量之間的交互作用,如何深入地分析交互作用對(duì)變量間相關(guān)關(guān)系的影響.
以2022 年高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽C題為例,探究古代玻璃制品的成分分析與鑒別. 由于古代玻璃很容易因?yàn)槁癫丨h(huán)境的影響而導(dǎo)致風(fēng)化,而且在風(fēng)化過(guò)程中,外部環(huán)境元素與玻璃內(nèi)部元素進(jìn)行化學(xué)反應(yīng)而大量地交換,導(dǎo)致玻璃的成分比例發(fā)生改變,繼而影響對(duì)玻璃類(lèi)別的正確判斷. 現(xiàn)有一批我國(guó)古代玻璃制品的相關(guān)數(shù)據(jù),需要分析玻璃文物表面風(fēng)化和顏色、玻璃類(lèi)型以及紋飾的關(guān)系.
這個(gè)題目包括54 件古代玻璃文物,每件玻璃文物都有具體的分類(lèi)信息,原始數(shù)據(jù)如表1 所示.
表1 54 件玻璃文物的分類(lèi)信息Table 1 Classification information of 54 glass cultural relics
為更好的進(jìn)行相關(guān)性分析,本文分別對(duì)表1 中“顏色”和“表面風(fēng)化”兩個(gè)變量進(jìn)行數(shù)據(jù)化處理,處理結(jié)果如表2 所示. 我們用1 到9 分別表示淺藍(lán)、藍(lán)綠、深綠、紫、淺綠、黑、深藍(lán)、綠色.用1 表示玻璃文物被風(fēng)化,0 表示未風(fēng)化.
表2 變量數(shù)據(jù)表Table 2 The table of variable data
為了研究文物樣品表面風(fēng)化與顏色、玻璃類(lèi)型以及紋飾間的關(guān)系. 首先,我們對(duì)所有變量進(jìn)行相關(guān)性分析;其次,運(yùn)用統(tǒng)計(jì)軟件SPSS27.0,建立了7 種logistic 模型,得到顯著性結(jié)果并進(jìn)行分析;最后,根據(jù)顯著性的結(jié)果,排除交互作用的影響,給出風(fēng)化與顏色、玻璃類(lèi)型以及紋飾間的變量關(guān)系.
假設(shè)1:文物相互獨(dú)立;
假設(shè)2:文物的風(fēng)化情況服從二項(xiàng)分布;
2.3 子宮內(nèi)膜組織實(shí)時(shí)熒光定量PCR檢測(cè)兩組患者ER、PR 的表達(dá)水平比較 與對(duì)照組比較,宮腔粘連組患者ER 、PR蛋白表達(dá)水平均較高,兩組比較差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)表4。
假設(shè)3:π(xi)與xi有關(guān),表示第i個(gè)文物發(fā)生風(fēng)化的概率,簡(jiǎn)記為πi.
定義為:
logistic 回歸不假設(shè)自變量與因變量之間存在直接的線性關(guān)系,而是通過(guò)鏈接函數(shù)建立線性關(guān)系,如
假設(shè)4:假設(shè)文物形狀對(duì)結(jié)果沒(méi)有顯著性影響;
假設(shè)5:假設(shè)只有顏色、紋飾和類(lèi)別對(duì)風(fēng)化有影響,不考慮其他因素對(duì)風(fēng)化有重要影響.
設(shè)風(fēng)化的情況記為Y(Y =1 表示文物已風(fēng)化,Y=0 表示文物未風(fēng)化),每件文物由若干指標(biāo)表示其特征,記為X,如X1是類(lèi)型,X2是顏色,X3是紋飾.xi表示第i個(gè)文物的特征觀測(cè)值,xi1表示第i個(gè)文物的類(lèi)型值,xi2表示第i個(gè)文物的顏色值,xi3表示第i個(gè)文物的紋飾值,yi表示第i個(gè)文物的風(fēng)化結(jié)果(i =1,2,…,54) ,β0是常數(shù)項(xiàng),β1,β2,β3是logistic 模型回歸系數(shù),π(xi)的取值范圍是[0,1] .
我們層層遞進(jìn),深入分析了三個(gè)自變量類(lèi)型、顏色、紋飾對(duì)因變量風(fēng)化的關(guān)系.首先,不排除三個(gè)自變量的交互作用,探究每個(gè)自變量對(duì)因變量的影響;其次,排除任意兩個(gè)自變量之間的交互作用,探究每個(gè)自變量對(duì)因變量的影響;最后,排除三個(gè)自變量之間的交互作用,探究三個(gè)自變量對(duì)因變量的影響. 本文總共建立了7 個(gè)logistic 模型[15],如下所示.
1)不排除交互作用,建立每個(gè)自變量對(duì)因變量的影響模型.
模型一:不排除紋飾和顏色的交互作用,建立類(lèi)型對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =X1,則在第i個(gè)文物X =xi =xi1的條件下,風(fēng)化(yi =1 )的條件概率為:
模型二:不排除類(lèi)型和紋飾的交互作用,建立顏色對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =X2,則在第i個(gè)文物X =xi =xi2的條件下,風(fēng)化(yi =1 )的條件概率為:
模型三:不排除類(lèi)型和顏色的交互作用,建立紋飾對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =X3,則在第i個(gè)文物X =xi =xi3的條件下,風(fēng)化(yi =1 )的條件概率為:
2)排除任意兩個(gè)自變量之間的交互作用,探究剩余自變量對(duì)因變量的影響.
模型四:排除顏色和類(lèi)型的交互作用,建立類(lèi)型對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =(X1,X2) ,則在第i個(gè)文物X =xi =(xi1,xi2)的條件下,風(fēng)化(yi =1 )的條件概率為:
模型五:排除紋飾和類(lèi)型的交互作用,建立類(lèi)型對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =(X1,X3) ,則在第i個(gè)文物X =xi =(xi1,xi3)的條件下,風(fēng)化(yi =1 )的條件概率為:
模型六:排除紋飾和顏色的交互作用,建立顏色對(duì)風(fēng)化的影響模型和紋飾對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =(X2,X3) ,則在第i個(gè)文物X =xi =(xi2,xi3)的條件下,風(fēng)化(yi =1 )的條件概率為:
3)排除三個(gè)自變量之間的交互作用,建立三個(gè)自變量對(duì)風(fēng)化的影響模型.
模型七:排除紋飾和顏色的交互作用,建立類(lèi)型對(duì)風(fēng)化、紋飾對(duì)風(fēng)化和顏色對(duì)風(fēng)化的影響模型.
設(shè)風(fēng)化情況為Y,每件文物的特征為X =(X1,X2,X3) ,則在第i個(gè)文物X =xi =(xi1,xi2,xi3)的條件下,風(fēng)化(yi =1 )的條件概率為:
其中,logistic 回歸模型主要采用極大似然法估計(jì)4 個(gè)未知參數(shù)β0,β1,β2,β3.
利用表2 的數(shù)據(jù),運(yùn)用SPSS27.0 軟件,得到logistic 模型中的參數(shù)的最大似然估計(jì)值,模型一的結(jié)果如表3 所示.
表3 不排除紋飾和顏色的交互作用下類(lèi)型對(duì)風(fēng)化的模型結(jié)果(模型一)Table 3 Model results of the type on the weathering with the interaction of texture and color (Model I)
由表3 知,類(lèi)型的顯著性值為0.024,小于置信水平0.05,所以在紋飾和顏色的交互作用下,類(lèi)型對(duì)風(fēng)化在統(tǒng)計(jì)學(xué)意義上有顯著性影響;Odds Ration (OR)值為0.250,表明高鉀發(fā)生風(fēng)化的可能性與鉛鋇發(fā)生風(fēng)化可能性之比是0.25,鉛鋇更容易發(fā)生風(fēng)化.在紋飾和顏色的交互作用下,類(lèi)型對(duì)風(fēng)化的影響模型為:
lnπ(xi)=β0+β1xi1=0.693-1.386xi1.
從模型二到模型七的顯著性結(jié)果如表4 到表9所示.當(dāng)顯著性值大于置信水平0.05 時(shí),表明該變量對(duì)因變量的影響不顯著;反之,顯著性值小于置信水平0.05 時(shí),表明該變量對(duì)因變量的影響顯著,且顯著性值越小表明影響越顯著.
表4 不排除類(lèi)型和紋飾的交互作用下顏色對(duì)風(fēng)化的模型結(jié)果(模型二)Table 4 Model results of the color on the weathering with the interaction of type and decoration (Model II)
由表4 到表9 知,模型二到模型七的顯著性結(jié)果都大于置信水平0.05,說(shuō)明從模型二到模型七,模型的自變量對(duì)因變量在統(tǒng)計(jì)學(xué)意義上沒(méi)有顯著性影響.
另外,由表9 中每個(gè)自變量的參數(shù)估計(jì)值的絕對(duì)值大小知,對(duì)風(fēng)化影響最重要的前三種特征是:黑色(62.034),藍(lán)綠色(59.352)和高鉀( -56.391),其中黑色和藍(lán)綠色對(duì)風(fēng)化是正相關(guān)影響,高鉀對(duì)風(fēng)化是負(fù)相關(guān)影響.由表3 中的顯著性結(jié)果(0.024)知,考慮其他自變量交互作用時(shí),類(lèi)型對(duì)風(fēng)化有顯著性影響;由表6 ~表9 中的顯著性結(jié)果知,不考慮其他自變量交互作用時(shí),類(lèi)型對(duì)風(fēng)化沒(méi)有顯著性影響.由表4、表5、表8 和表9 中的顯著性結(jié)果知,考慮和不考慮其他自變量交互作用時(shí),顏色和紋飾對(duì)風(fēng)化都沒(méi)有顯著性影響.
表5 不排除類(lèi)型和顏色的交互作用下紋飾對(duì)風(fēng)化的模型結(jié)果(模型三)Table 5 Model results of the decoration on the weathering with the interaction of type and color (Model III)
表6 排除顏色和類(lèi)型的交互作用下類(lèi)型對(duì)風(fēng)化的模型結(jié)果(模型四)Table 6 Model results of the type on the weathering without the interaction of color and type (Model IV)
表7 排除紋飾和類(lèi)型的交互作用下類(lèi)型對(duì)風(fēng)化的模型結(jié)果(模型五)Table 7 Model results of the type on the weathering without the interaction of decoration and type (Model V)
表8 排除任意兩個(gè)自變量的交互作用下自變量對(duì)風(fēng)化的模型結(jié)果(模型六)Table 8 Model results of the independent variables on the weathering without the interaction of any two independent variables (Model VI)
表9 排除三個(gè)自變量的交互作用下自變量對(duì)風(fēng)化的模型結(jié)果(模型七)Table 9 Model results of the independent variables on the weathering without the interaction of three independent variables (Model VII)
綜上所述,通過(guò)討論自變量間的交互作用,本文探究了多個(gè)自變量對(duì)因變量的影響,獲得了7 個(gè)自變量和因變量的關(guān)系模型. 從7 個(gè)關(guān)系模型中,發(fā)現(xiàn)模型一是最能表示3 個(gè)自變量和因變量之間的關(guān)系.
本文以數(shù)學(xué)建模題目為例,詳細(xì)闡述了如何分析多個(gè)自變量與因變量間的關(guān)系.通過(guò)深入考慮多個(gè)自變量之間的交互作用,建立多個(gè)Logistic 回歸模型,層層遞進(jìn)地研究了多個(gè)自變量對(duì)因變量的影響,得出最能表示自變量與因變量之間的關(guān)系模型.
因變量是定性變量的回歸分析,作為一種有效的數(shù)據(jù)處理方法,已被廣泛應(yīng)用于醫(yī)學(xué)、考古學(xué)、社會(huì)調(diào)查、生物信息處理等領(lǐng)域. 教會(huì)大學(xué)生如何分析多個(gè)自變量與因變量的關(guān)系,建立準(zhǔn)確的關(guān)系模型,不論在競(jìng)賽中還是在學(xué)習(xí)過(guò)程中都非常重要.
西南民族大學(xué)學(xué)報(bào)(自然科學(xué)版)2023年3期