蒲倩
【摘要】函數(shù)性數(shù)據(jù)分析(FDA)是一種新型數(shù)據(jù)分析方法,該種分析方法是建立在函數(shù)角度基礎(chǔ)上,強(qiáng)調(diào)將函數(shù)數(shù)據(jù)作為整體進(jìn)行分析,函數(shù)性數(shù)據(jù)有效豐富了數(shù)據(jù)分析領(lǐng)域,為解決數(shù)據(jù)問題提供了強(qiáng)有力的支撐,該種技術(shù)屬于探索性技術(shù),對(duì)函數(shù)通特征描述與特征提取到起到了理想的成效,數(shù)性數(shù)據(jù)分析有著很大的優(yōu)越性,能夠通過微分曲線與導(dǎo)數(shù)曲線來處理信息,本文主要討論函數(shù)性數(shù)據(jù)分析中的主成分分析.
【關(guān)鍵詞】函數(shù)性數(shù)據(jù)分析;主成分分析;討論
在人們的日常生活中,常常需要處理各種各樣的數(shù)據(jù),其中很多數(shù)據(jù)是有函數(shù)特征的,如氣象數(shù)據(jù)、證券交易數(shù)據(jù)等等,函數(shù)性數(shù)據(jù)分析(FDA)是一種新型數(shù)據(jù)分析方法,該種分析方法是建立在函數(shù)角度基礎(chǔ)上,強(qiáng)調(diào)將函數(shù)數(shù)據(jù)作為整體進(jìn)行分析.
與傳統(tǒng)數(shù)據(jù)分析方法相比而言,函數(shù)性數(shù)據(jù)分析有著很大的優(yōu)越性,能夠通過微分曲線與導(dǎo)數(shù)曲線來處理信息,截至目前為止,各界的專家學(xué)者已經(jīng)針對(duì)函數(shù)性數(shù)據(jù)進(jìn)行了深入的分析,下面就針對(duì)函數(shù)性數(shù)據(jù)分析的主成分進(jìn)行相應(yīng)的介紹.
一、傳統(tǒng)主成分分析
主成分分析在1901年開始在正交回歸分析中得到了應(yīng)用,在1933年,主成分分析法得到了一定的發(fā)展,該種分析方式能夠?qū)⒏呔S空間問題變成低維空間問題,這樣即可將問題直觀化、簡(jiǎn)單化,雖然該種分析法會(huì)損失部分?jǐn)?shù)據(jù),但是卻抓住了主要問題,對(duì)問題的分析十分有益.在技術(shù)水平的發(fā)展之下,主分析法十分的重要,從幾何角度進(jìn)行分析,該種分析方式能夠?qū)⒃甲兞拷M合成新坐標(biāo),新指標(biāo)伸縮情況主要由樣本協(xié)方差矩陣進(jìn)行表示,新變量之間并無密切的關(guān)系,可以看出,使用主成分分析法能夠很好地避免多重共線問題的發(fā)生.
從本質(zhì)上而言,主成分分析是線性映射法,該種方法是不適宜應(yīng)用在非線性問題處理中的,在這一背景下,一些學(xué)者提出主曲線方法、核主成分分析法、主曲面方法、多層感知器方法等多種主成分分析法,該種這些數(shù)據(jù)分析法的應(yīng)用還存在一些弊端,因此,就需要使用新型主成分分析法,函數(shù)性數(shù)據(jù)分析法正是在這一基礎(chǔ)上產(chǎn)生.
二、函數(shù)性數(shù)據(jù)主成分分析
1.函數(shù)性數(shù)據(jù)的特征
顧名思義,函數(shù)性數(shù)據(jù)就是一種采用函數(shù)來表現(xiàn)的數(shù)據(jù),具有函數(shù)性的特征,在分析數(shù)據(jù)時(shí),若觀測(cè)點(diǎn)過于密集,那么數(shù)據(jù)則會(huì)表現(xiàn)出函數(shù)性特征,采用該種分析法時(shí),需要將數(shù)據(jù)作為獨(dú)立項(xiàng)進(jìn)行分析,不能將其看作數(shù)據(jù)點(diǎn)序列.該種分析方式最早由一位加拿大學(xué)者提出,在提出伊始,強(qiáng)調(diào)采用現(xiàn)代緊密數(shù)據(jù)系統(tǒng)來獲取數(shù)據(jù),在獲取數(shù)據(jù)時(shí),需要將其作為動(dòng)態(tài)概念,并不能將其作為靜態(tài)概念,如果采用傳統(tǒng)分析法就難以提升分析的準(zhǔn)確性,因此,就需要進(jìn)一步來擴(kuò)展分析方法.近年來,很多學(xué)者開始對(duì)函數(shù)性數(shù)據(jù)進(jìn)行了深入的分析,但是,這一技術(shù)依然處在初級(jí)發(fā)展階段,還需要進(jìn)行深入的研究.
關(guān)于函數(shù)性數(shù)據(jù)x函數(shù)形式,需要將數(shù)據(jù)假定為是一種連續(xù)產(chǎn)生的過程,但是在實(shí)際觀測(cè)過程中,很難得到離散性數(shù)據(jù),實(shí)際觀測(cè)的數(shù)據(jù)也常常含有噪聲,因此,在接收到觀測(cè)數(shù)據(jù)之后,需要對(duì)樣本開展函數(shù)擬合,這種擬合方式是多種多樣的,常用的有插值法與平滑法.若接收到的觀測(cè)數(shù)據(jù)沒有誤差,即可使用插值法進(jìn)行擬合;如果接收的數(shù)據(jù)存在誤差,就需要使用平滑法進(jìn)行擬合.
2.函數(shù)性數(shù)據(jù)主成分分析
在實(shí)際應(yīng)用過程中,觀測(cè)數(shù)據(jù)常常存在著比樣本量大的情況,如果未進(jìn)行處理就直接分析,那么是無法得出理想的分析解決的.為了解決這一問題,可以使用兩種方法,即將觀測(cè)時(shí)間區(qū)域減少或者偏最小二乘,如果變量多重共線性嚴(yán)重,使用該種分析法雖然能夠有效解決問題,但是卻存在很多噪聲.在遇到該種情況時(shí),即可使用偏最小二乘法來進(jìn)行回歸建模.
函數(shù)性數(shù)據(jù)樣本協(xié)方差矩陣是一種函數(shù)模式,常常會(huì)產(chǎn)生高維協(xié)方差矩陣,該種矩陣表示對(duì)變量實(shí)施了重復(fù)性檢測(cè),且每次得到的數(shù)據(jù)都生成了函數(shù)數(shù)據(jù).在特征方程上,可以使用如下的表達(dá)方式:
三、函數(shù)性共同主成分
共同主成分已經(jīng)在形態(tài)進(jìn)化工作中得到了廣泛的應(yīng)用,分析共同主成分能夠有效解決共同主成分結(jié)構(gòu)與協(xié)方差矩陣比例等問題,一般情況下,在建立好矩陣之后需要使用KL展開式進(jìn)行分析,為了得到函數(shù)結(jié)構(gòu)與動(dòng)態(tài)特征,可以使用函數(shù)主成分與因子荷載分布來進(jìn)行確定.在應(yīng)用KL展開式時(shí),需要應(yīng)用到相互正交函數(shù),KL展開式有著理想的收斂性,在展開其他類型時(shí),也可以得出很好的效果.采用該種方法之后,即可將問題簡(jiǎn)單化,但是由于因子載荷之間存在一定的差異,就需要對(duì)函數(shù)性數(shù)據(jù)主成分進(jìn)行相應(yīng)的驗(yàn)證.
四、結(jié) 語(yǔ)
綜上所述,函數(shù)性數(shù)據(jù)有效豐富了數(shù)據(jù)分析領(lǐng)域,為解決數(shù)據(jù)問題提供了強(qiáng)有力的支撐.該種技術(shù)屬于探索性技術(shù),對(duì)函數(shù)通特征描述與特征提取到起到了理想的成效,但是,由于各種因素的影響,函數(shù)性數(shù)據(jù)主成分分析只能夠解決單樣本問題,難以解決兩樣本以上的問題,因此,在使用該種問題進(jìn)行分析時(shí),還需要綜合各類因素解決推斷與檢驗(yàn)的難題.