国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MATLAB的復合因子方差分析與主成分分析算法設計

2022-04-15 02:00:08薛亞宏程喜林
安陽工學院學報 2022年2期
關鍵詞:降維矩陣因子

薛亞宏,王 嘉,程喜林

(1.甘肅工業(yè)職業(yè)技術(shù)學院 經(jīng)管學院,甘肅 天水 7410252;2.蘭州大學 信息科學與工程學院,蘭州 7300003;3.西北大學 城市與環(huán)境學院,西安 741069)

方差分析(Analysis of variance,ANOVA)是英國統(tǒng)計學家兼遺傳學家Gitbert提出的一種分析方法,在林業(yè)遺傳、科學試驗、醫(yī)學研究等眾多領域有極其廣泛的應用[1]。方差是統(tǒng)計量分析中的一類,是假設檢驗與區(qū)間估計的推廣和延伸,由于試驗樣本的成因方式不同,一般采用的分法方法也有所差異,在統(tǒng)計學界,通常用單因子(one-way)、復因子(double-way)或多因子(N-way)方法。

主成分分析是根據(jù)已有數(shù)據(jù)推斷假設數(shù)據(jù)受某主要因素影響程度的一種分析方法,其本質(zhì)仍為假設檢驗[2]。通常需要提供理論樣本結(jié)果和實測樣本結(jié)果,兩者通過矩陣排列得到回歸模型,最終得到影響總體數(shù)據(jù)分布的主要因素及數(shù)值,一般要采用二維或三維曲線進行二次以上模擬,在誤差允許范圍內(nèi)滿足達到精度即終止計算。

1 復合因子方差分析

復因子分析即有兩個影響因子。通常應用于醫(yī)學療效的驗證,其一般的分析步驟為:首先將病人隨機(一般、等距、整群)分為k組,每組有x人,將每位病人的療效監(jiān)測指標記為tm,n,其中下標m、n分別表示第m組,(i=1,2,…,k),n表示某組內(nèi)病人的診療編號,(n=1,2,…,w),則第m組的第n個病人的監(jiān)測指標即為tm,n。按照MATLAB特有的表達式記號,記第k組所有病人的所有監(jiān)測指標為tm,或各組的第w位病人的監(jiān)測標為tn,則這樣計算出向量,這涉及算術(shù)平均數(shù)的范籌,如此則構(gòu)造出標準方差分析表,并根據(jù)所給出的監(jiān)測數(shù)據(jù)找出效果分析數(shù)據(jù)。

以上所采用藥物作為分組的依據(jù),稱為復因子(Complex factor),它們的差異均值稱為復水平。其中m值與p值較為關鍵,直接影響概率值p<a的置信度及拒絕假設目標H0,否則假設不成立,療效分析驗證為假。

在MATLAB中,anoval0、anova2可分別進行單因子、復因子分析,并有效地給出較為精確的結(jié)果,其基本格式為[p,Tab,Stats]=anova1(Q)[3],其中,Q為需要分析的數(shù)據(jù),該數(shù)據(jù)是一個k×w矩陣,其行對應于分組號,運算結(jié)果會返回檢驗值s,以及檢測數(shù)據(jù)表Tab;該函數(shù)還將打開兩個主程序窗口viewer和power,分別以表式、盒式結(jié)構(gòu)呈現(xiàn)。

1.1 單因子分析(療效分析方向)

案例1:以非嗎啡類中樞型鎮(zhèn)痛藥物鹽酸曲馬多(Tramadol)為例[4],現(xiàn)將40個病人(醫(yī)學低于30為小樣本)樣本分為6組,每組5人,患者(patient)使用同一藥物(假定無其他輔助藥物),記錄從用藥到痊愈時間(h),觀測所用藥物的療效是否存在顯著差異,觀測數(shù)據(jù)如表1所示。

表1 痊愈時間觀測數(shù)據(jù)表

算法設計:

基于以上監(jiān)測數(shù)據(jù),現(xiàn)構(gòu)造出一個5×6型矩陣,命名為矩陣Q,對各組數(shù)據(jù)采用復因子方差分析,得出以下分析結(jié)果:

在程序運行過程中,anoval()會自動呈現(xiàn)兩個窗口,分別是盒式圖、分析表,同時顯示概率值p,其中a=0.03或0.04,表示置信水平,顯然從結(jié)果來看應拒絕假設,即藥物對痊愈時間有顯著影響。

1.2 雙因子分析(植物培育方向)

案例2:以巖松、油松、赤松3種松樹樹種在甘肅省天水市小隴山林區(qū)黨川、利橋、草川、草灘4地(林場)的生長情況為例,每地每類樹種選擇6株,測量其胸徑,并進行雙因子方差分析,觀測數(shù)據(jù)如表2所示:

表2 甘肅省小隴山林區(qū)巖松等3類松樹生長觀測數(shù)據(jù)

Q算法設計:

基于以上監(jiān)測數(shù)據(jù),現(xiàn)調(diào)用anoval2()函數(shù),命名為矩陣H,對各組數(shù)據(jù)采用雙因子方差分析,anoval2()命令及矩陣列排列如下:

從結(jié)果來看,由于PA=0.01393,所以應該拒絕H1假設。可以初步推斷,列數(shù)據(jù)對監(jiān)測結(jié)果有顯著影響,即小隴山林區(qū)下轄黨川等4地3類松樹樹種對其胸徑有顯著影響。

以下計算均值,以反映不同樹種在同一林場生長差異:

根據(jù)結(jié)果分析,赤松胸徑明顯大于巖松和油松。PH與PHQ的差距較大,從而判斷假設為真,故接受假設[5]。即黨川等4地各自對3類松樹樹種的胸徑有輕微影響,不同區(qū)域(林場)對不同松樹樹種胸徑成長無顯著影響。

2 主成分分析

主成分分析是一種常見的多因素分析方法,在信息模擬、疾病預防、地理信息采集、工程造價測算、農(nóng)作物產(chǎn)量分析等領域有著廣泛應用[6]。通常采用SPSS、R等平臺進行分析,但由于原數(shù)據(jù)類型的多樣性,輸出圖形特征的兩極分化(異端非同步)現(xiàn)象較為普遍,經(jīng)與實際監(jiān)測比對出現(xiàn)較大偏差,結(jié)論不穩(wěn)定,因此不具有代表性。在這種情況下,利用MATLAB在數(shù)據(jù)降維處理方面的精度、效度以及在圖象表現(xiàn)上的多維仿真優(yōu)勢,通過調(diào)用Corr()函數(shù),建立協(xié)方差矩陣及特征向量、主成分貢獻率及累計貢獻率、建立變量指標方程組對數(shù)據(jù)進行降維處理,實現(xiàn)源數(shù)據(jù)分析從多維到低維的轉(zhuǎn)化。

2.1 基于MATLAB的主成分分析算法原理

首先建立協(xié)方差矩陣

再根據(jù)R計算出特征向量ei及特征值,做反序處理;

最后,通過轉(zhuǎn)換變量(降維),構(gòu)建平面坐標方程zi=azi+bzi+Ri,獲取主體變量影響因素間的關系構(gòu)成,即主成分分析的基本表達式。

2.2 三元主成分分析(高程測量方向)

案例3:以甘肅省天水市李子園鉛鋅礦第四紀淺層地貌特征分析為例,某測量點三維坐標參數(shù)分別為 x=ωcos2ω, y=ωsin2ω, z=0.887x+3.463y,現(xiàn)通過MATLAB生成一維數(shù)組,并輸出以2個測量數(shù)位為基本單位矢量模擬表達式。

算法設計如下:

顯然,基于對降維矢量輸出原理的分析,進一步利用空間坐標變換,對三維原數(shù)據(jù)做放樣投影,得到二維數(shù)組[7]。

執(zhí)行以上命令,輸出結(jié)果為:

值得注意的是,結(jié)果中的σ向量、e向量非測量高程測序排列,要通過fliplr()函數(shù)和real()函數(shù)執(zhí)行反序和翻轉(zhuǎn)輸出,目地是使特征值按常規(guī)測序呈現(xiàn),為RNSS測繪系統(tǒng)數(shù)據(jù)導入做必要的前期配置。

具體語句如下:

轉(zhuǎn)換后的3×3矩陣提供二維數(shù)據(jù)(z列為0)如下:

故新坐標系可表示為:

該坐標方程實現(xiàn)了對三維高程測量數(shù)組的降維(縱向投影),通過坐標轉(zhuǎn)化使RNSS源數(shù)據(jù)壓縮于二維平面上,一方面能準確表現(xiàn)該區(qū)域第四紀地貌分布特征,另一方面在同類型礦區(qū)主要作業(yè)區(qū)域地形圖繪制(表層、淺層)中提供了滿足繪制精度要求的一種新的計算途徑,其誤差范圍與多基點均勻采樣在同一水平[8],但其在數(shù)據(jù)生成原理、仿真形式以及中間變量轉(zhuǎn)換等多個方面集成了ArcGIS、C++的優(yōu)勢,有效降低了測圖成本。

3 結(jié)語

基于MATLAB的復合因子方差分析與主成分分析計算原理清晰,算法邏輯性強,語法調(diào)用靈活。在實踐中,以應用統(tǒng)計學基本計算理論為基礎,結(jié)合矩陣運算、坐標變換等數(shù)學手段,最終通過MATLAB實現(xiàn)對樣本數(shù)據(jù)的終端處理,有效彌補了SPSS、R等分析工具在圖像擬合優(yōu)度與坐標維度無法兼顧的不足,特別是三維數(shù)字測圖、工程概預算、造價分析等領域內(nèi)能大大地降低數(shù)據(jù)交叉,有效降低項目成本,有較強的實用意義。

猜你喜歡
降維矩陣因子
混動成為降維打擊的實力 東風風神皓極
車主之友(2022年4期)2022-08-27 00:57:12
因子von Neumann代數(shù)上的非線性ξ-Jordan*-三重可導映射
一些關于無窮多個素因子的問題
降維打擊
海峽姐妹(2019年12期)2020-01-14 03:24:40
影響因子
影響因子
初等行變換與初等列變換并用求逆矩陣
矩陣
南都周刊(2015年1期)2015-09-10 07:22:44
矩陣
南都周刊(2015年3期)2015-09-10 07:22:44
矩陣
南都周刊(2015年4期)2015-09-10 07:22:44
蓝山县| 观塘区| 黄山市| 凤阳县| 涿州市| 资中县| 西乌| 京山县| 阿鲁科尔沁旗| 赞皇县| 贵阳市| 高阳县| 辽阳县| 龙山县| 台南县| 故城县| 灵寿县| 天水市| 贡山| 乃东县| 阜新| 金阳县| 汝城县| 阿拉善盟| 屏东县| 巨野县| 山东| 咸宁市| 长宁县| 平遥县| 三台县| 长治县| 茌平县| 鲜城| 滨海县| 重庆市| 台湾省| 泽库县| 鄯善县| 碌曲县| 甘泉县|