国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于R藤的Copula模型選擇及應(yīng)用

2020-09-29 07:51:13劉春婷
電腦知識(shí)與技術(shù) 2020年17期
關(guān)鍵詞:相關(guān)關(guān)系

劉春婷

摘要:在實(shí)際生活中,高維數(shù)據(jù)的情形較多,常用的研究數(shù)據(jù)間相關(guān)關(guān)系的方法大多為傳統(tǒng)的線性回歸模型以及Logistic回歸等,處理高維數(shù)據(jù)的方法涉及較少。基于上述分析,本文考慮采用Copula建模方法對(duì)高維數(shù)據(jù)進(jìn)行分析,在Copula建模中較為重要的一點(diǎn)是對(duì)模型進(jìn)行選擇。因此本文考慮采用Copula模型中的R藤結(jié)構(gòu)進(jìn)行研究,通過(guò)選用貪婪算法來(lái)對(duì)R藤的模型結(jié)構(gòu)進(jìn)行選擇,即對(duì)節(jié)點(diǎn)和Copula對(duì)函數(shù)類型進(jìn)行確定。為了驗(yàn)證這一方法的可行性及適用性,通過(guò)陜西省城鎮(zhèn)居民的消費(fèi)數(shù)據(jù)進(jìn)行實(shí)證研究,并得出相關(guān)結(jié)論。

關(guān)鍵詞:高維數(shù)據(jù);Copula函數(shù);模型選擇;相關(guān)關(guān)系

中圖分類號(hào):TP18 ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2020)17-0222-03

隨著時(shí)代的發(fā)展,越來(lái)越多的數(shù)據(jù)信息所產(chǎn)生,選擇有效的方法對(duì)數(shù)據(jù)進(jìn)行分析是至關(guān)重要的。Copula函數(shù)主要是用于刻畫多個(gè)變量間的相關(guān)關(guān)系的,它不僅可以刻畫協(xié)變量對(duì)響應(yīng)變量的影響,還能夠刻畫協(xié)變量間的相關(guān)關(guān)系,克服了傳統(tǒng)方法模型單一對(duì)數(shù)據(jù)中的信息挖掘不到位的缺點(diǎn)。Copula建模方法主要是選用不同的連接方式進(jìn)行建模,常見(jiàn)的有C藤、D藤以及R藤,其中相比C藤和D藤而言R藤具有較高的靈活性,能夠更加準(zhǔn)確地描述變量間的相關(guān)關(guān)系,但是其涉及的連接種類多,計(jì)算量大成為了這一模型的難點(diǎn)。為了克服這一難點(diǎn),本文考慮采用貪婪算法對(duì)R藤的結(jié)構(gòu)進(jìn)行選擇。關(guān)鍵包含兩個(gè)方面,一方面是對(duì)節(jié)點(diǎn)進(jìn)行選擇,即變量的位置關(guān)系進(jìn)行選擇,另一方面是對(duì)每?jī)蓚€(gè)節(jié)點(diǎn)間的Copula函數(shù)類型進(jìn)行確定。

在Copula理論的發(fā)展過(guò)程中,它被廣泛地應(yīng)用到金融保險(xiǎn)、投資組合以及風(fēng)險(xiǎn)預(yù)測(cè)等各個(gè)領(lǐng)域中,Rockinger和Jondeau(2001)[1]建立了Copula-GARCH模型對(duì)金融數(shù)據(jù)進(jìn)行分析;杜子平(2009)[2]等將動(dòng)態(tài)Copula和高維Vine Copula進(jìn)行結(jié)合從而對(duì)不同國(guó)家證券市場(chǎng)間的關(guān)系進(jìn)行分析。本文利用貪婪算法對(duì)Copula建模方法中R藤的模型結(jié)構(gòu)進(jìn)行選擇,能夠較快地得出R藤的具體模型結(jié)構(gòu),有效地降低了R藤模型算法的計(jì)算復(fù)雜度。

消費(fèi)結(jié)構(gòu)反映了一個(gè)地區(qū)的消費(fèi)水平,也決定了當(dāng)?shù)厝嗣竦纳钏剑哂休^大的研究意義。近幾年來(lái),陜西省的綜合實(shí)力不斷上升,居民的消費(fèi)水平也在發(fā)生著重要的變化,消費(fèi)結(jié)構(gòu)由較多的變量組成,為了更好地看出消費(fèi)的各項(xiàng)指標(biāo)間的相關(guān)關(guān)系,本文擬考慮采用刻畫變量間相關(guān)關(guān)系具有極大優(yōu)勢(shì)的Copula建模方法進(jìn)行研究,R藤的高度靈活性正好適用于這一實(shí)際問(wèn)題。本文基于Copula建模方法采用R藤的方式進(jìn)行建模,并對(duì)陜西省2009年至2018年的城鎮(zhèn)居民消費(fèi)數(shù)據(jù)進(jìn)行研究。

1 相關(guān)理論基礎(chǔ)

Copula函數(shù)是Sklar[3]在1959年提出的,他提出可以將一個(gè)多維的聯(lián)合分布函數(shù)分解成多個(gè)邊緣分布函數(shù)和一個(gè)連接函數(shù),Copula函數(shù)就稱為這個(gè)連接函數(shù),通過(guò)該連接函數(shù)作為橋梁把邊緣分布函數(shù)和聯(lián)合分布函數(shù)進(jìn)行連接。

結(jié)合上述分析,將Copula函數(shù)進(jìn)行分類,主要包含橢圓族Copula函數(shù)和阿基米德Copula函數(shù)兩大類,它們用于刻畫不同的數(shù)據(jù)特征,其中橢圓族Copula函數(shù)具有尾部對(duì)稱的特點(diǎn),其對(duì)應(yīng)的輪廓圖如下圖1所示。

阿基米德族Copula函數(shù)尾部具有非對(duì)稱性的特點(diǎn),其對(duì)應(yīng)的輪廓圖如下圖2所示。

因此對(duì)于不同的數(shù)據(jù)特征,要選用恰當(dāng)?shù)腃opula函數(shù)類型進(jìn)行刻畫,這是R藤的模型建立過(guò)程中的一個(gè)難點(diǎn)。

Bedford & Cooke[4]于1999年提出,可以采用樹(shù)的結(jié)構(gòu)方式來(lái)直觀的描述變量間的連接形式。其中用節(jié)點(diǎn)來(lái)表示變量,兩個(gè)節(jié)點(diǎn)間的連線表示的是所選擇的Copula函數(shù)類型。不同的連接方式得到不同結(jié)構(gòu)的樹(shù),把這些樹(shù)叫作規(guī)則藤,即R藤。R藤表現(xiàn)形式不按照一定的規(guī)則對(duì)節(jié)點(diǎn)間的位置關(guān)系進(jìn)行排序,為了更加直觀的進(jìn)行說(shuō)明,以一個(gè)4維變量為例,給出其中一種類型的R藤的表現(xiàn)形式。

對(duì)上式中的參數(shù)進(jìn)行估計(jì),主要采用分兩步極大似然估計(jì)的方法,首先,對(duì)邊緣分布函數(shù)中的參數(shù)進(jìn)行極大似然估計(jì),其次將邊緣分布的參數(shù)估計(jì)結(jié)果帶回,再利用極大似然估計(jì)對(duì)聯(lián)合分布函數(shù)中的參數(shù)進(jìn)行估計(jì)。

2 基于貪婪算法的模型選擇

2013年,Dissman等人提出了一類處理高維離散型數(shù)據(jù)的貪婪算法[5]的方法,受該方法的啟發(fā),將該方法應(yīng)用到數(shù)據(jù)為連續(xù)型的形勢(shì)下,該算法的基本步驟如下。

1)估計(jì)邊緣分布函數(shù)的參數(shù)

2) 從低階節(jié)點(diǎn)出發(fā),分別計(jì)算低階節(jié)點(diǎn)涉及的所有的Copula對(duì)類型及參數(shù)值,進(jìn)而以修正的赤池信息準(zhǔn)則mAIC(modify Akaike Information Criterion)為判別標(biāo)準(zhǔn),進(jìn)一步篩選出節(jié)點(diǎn)間所有可能的結(jié)合方式當(dāng)中最優(yōu)的模型,再以上述最優(yōu)模型的節(jié)點(diǎn)連接方式所得到的兩兩Copula對(duì)為下一步的起點(diǎn)。

3) 重復(fù)上述過(guò)程,直至將第[n-1]棵樹(shù)的相關(guān)節(jié)點(diǎn)間的結(jié)合方式及每條邊對(duì)應(yīng)的Copula對(duì)類型確定。

3 實(shí)例分析

通過(guò)上述分析可知,Copula函數(shù)主要是用于對(duì)高維數(shù)據(jù)進(jìn)行分析的,當(dāng)數(shù)據(jù)的個(gè)數(shù)較多時(shí),單一的考慮每個(gè)指標(biāo)的變化規(guī)律不能夠很好的刻畫實(shí)際問(wèn)題,因此可以通過(guò)Copula函數(shù)來(lái)考慮不同指標(biāo)間的相關(guān)關(guān)系。陜西省城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu)由8個(gè)指標(biāo)組成,那么除了單一的研究每年指標(biāo)的變化規(guī)律外,觀察不同指標(biāo)間的相關(guān)關(guān)系是十分具有價(jià)值的。因此本文選取陜西省2009年至2018年的城鎮(zhèn)居民消費(fèi)數(shù)據(jù),其中包含如下8個(gè)指標(biāo)。

各個(gè)指標(biāo)是如何發(fā)展的,通過(guò)如下變化趨勢(shì)圖能夠直觀的得出結(jié)果。

從圖4只能大致看出各項(xiàng)指標(biāo)的發(fā)展趨勢(shì)以及發(fā)展趨勢(shì)的強(qiáng)度,但是具體不同指標(biāo)之間是否有相關(guān)關(guān)系,值得進(jìn)一步研究。通過(guò)對(duì)數(shù)據(jù)觀察不難發(fā)現(xiàn),指標(biāo)的個(gè)數(shù)較多,且數(shù)據(jù)大多呈現(xiàn)出不對(duì)稱的特征,因此采用本文所建立的處理高維數(shù)據(jù)的Copula函數(shù)模型是極具優(yōu)勢(shì)的。為了更加全面的分析各指標(biāo)間的相關(guān)關(guān)系,將年份也作為一個(gè)變量進(jìn)行研究,同時(shí)對(duì)9個(gè)變量進(jìn)行分析,通過(guò)貪婪算法對(duì)R藤的模型結(jié)構(gòu)進(jìn)行選擇,所得到的結(jié)果如下圖5所示。

圖5為通過(guò)貪婪算法對(duì)Copula建模方法下的R藤的選擇結(jié)果,本文主要研究第一層樹(shù),即對(duì)不同變量間的關(guān)系進(jìn)行刻畫。其中圖的左下方描述的是所選用的Copula函數(shù)擬合出的輪廓圖,從圖上可以看出,指標(biāo)衣著與醫(yī)療保健、交通通訊與文教娛樂(lè)與通訊等指標(biāo)對(duì)之間呈現(xiàn)出較強(qiáng)的尾部對(duì)稱性,并且從輪廓圖的形狀上來(lái)看,越扁的說(shuō)明兩個(gè)指標(biāo)的相關(guān)性越強(qiáng)。圖的右上方這些數(shù)字刻畫了每?jī)蓚€(gè)變量間的相關(guān)性強(qiáng)弱,相關(guān)性越強(qiáng)這個(gè)紅色的字體越大并且對(duì)應(yīng)的數(shù)的絕對(duì)值越接近于1,相關(guān)性越弱,對(duì)應(yīng)的數(shù)的絕對(duì)值越接近于0。為了更加直觀的得出不同指標(biāo)間的相關(guān)關(guān)系,給出具體數(shù)值見(jiàn)表2。

表2 詳細(xì)地給出了每?jī)蓚€(gè)變量間的相關(guān)關(guān)系結(jié)果,由表中數(shù)據(jù)易得,(1)變量1年份與任意指標(biāo)之間都具有較高的相關(guān)性,尤其是與食品和衣著這兩個(gè)變量,呈現(xiàn)出較高的正相關(guān)性,說(shuō)明人們的生活水平在不斷提高,大家對(duì)衣著和食品方面的支出越來(lái)越大。(2)食品與家庭設(shè)備及服務(wù)這兩項(xiàng)指標(biāo)之間呈現(xiàn)出負(fù)相關(guān)性,且kendall [τ]值為-0.63,說(shuō)明相關(guān)程度較高;并且衣著與家庭設(shè)備及服務(wù)這兩項(xiàng)指標(biāo)也呈現(xiàn)出負(fù)相關(guān)性,說(shuō)明家庭設(shè)備及服務(wù)該指標(biāo)的增長(zhǎng)速度與它們之間是呈現(xiàn)負(fù)相關(guān)關(guān)系的。(3)醫(yī)療保健和交通通訊、文化娛樂(lè)及服務(wù)以及雜項(xiàng)商品及服務(wù)、醫(yī)療保健與文教娛樂(lè)及服務(wù)等等,它們之間都呈現(xiàn)出較高的正相關(guān)性,相關(guān)性都較強(qiáng)。(4)觀察不難發(fā)現(xiàn),居住這項(xiàng)指標(biāo)與各指標(biāo)間的關(guān)系均不是太強(qiáng),但是它的增長(zhǎng)幅度從數(shù)據(jù)中可以看出,具有較大的增長(zhǎng)幅度,說(shuō)明該項(xiàng)指標(biāo)不受其他因素的影響,自身的漲幅較大,說(shuō)明大家對(duì)居住越來(lái)越重視。

參考文獻(xiàn):

[1] Coutant S,Jondeau E,Rockinger M.Reading PIBOR futures options smiles:The 1997 snap election[J].Journal of Banking & Finance,2001,25(11):1957-1987.

[2] 杜子平,閆鵬,張勇.基于“藤”結(jié)構(gòu)的高維動(dòng)態(tài)Copula的構(gòu)建[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009,39(10):96-102.

[3] Genest C,MacKay J.The joy of copulas:bivariate distributions with uniform marginals[J].The American Statistician, 1986,40(4):280.

[4] St?ber J,Joe H,Czado C.Simplified pair copula constructions—Limitations and extensions[J].Journal of Multivariate Analysis, 2013,119:101-118.

[5] 常友渠,肖貴元,曾敏.貪心算法的探討與研究[J].重慶電力高等??茖W(xué)校學(xué)報(bào),2008,13(3):40-42,47.

【通聯(lián)編輯:唐一東】

猜你喜歡
相關(guān)關(guān)系
地區(qū)公路投資與經(jīng)濟(jì)增長(zhǎng)關(guān)系探究
學(xué)生各科學(xué)習(xí)成績(jī)指標(biāo)的模糊識(shí)別
基于學(xué)生體育過(guò)程性考核測(cè)評(píng)指標(biāo)的相關(guān)關(guān)系分析
以數(shù)據(jù)新聞獲獎(jiǎng)作品探析數(shù)據(jù)新聞特征
今傳媒(2016年8期)2016-10-17 00:02:50
南京市土地利用變化與社會(huì)經(jīng)濟(jì)發(fā)展指標(biāo)耦合研究
商(2016年22期)2016-07-08 22:16:02
上市公司經(jīng)營(yíng)狀況與信息披露透明度相關(guān)性分析
商(2016年19期)2016-06-27 14:04:00
呼吸道疾病與氣象因子的相關(guān)分析
恩格爾系數(shù)與消費(fèi)者支出模式變動(dòng)的關(guān)系
商(2016年6期)2016-04-20 18:59:54
大學(xué)生復(fù)原力與負(fù)性生活事件、心理健康之間的關(guān)系
科技視界(2016年8期)2016-04-05 09:04:27
羅平煙區(qū)不同類型植煙土壤速效鉀與煙葉鉀關(guān)系分析
三门峡市| 灌南县| 芮城县| 天等县| 同心县| 乌审旗| 西充县| 衡阳县| 张北县| 铜陵市| 渝中区| 化隆| 廊坊市| 罗源县| 延寿县| 炉霍县| 吉木萨尔县| 云浮市| 潜江市| 监利县| 云霄县| 巨野县| 扶余县| 洪洞县| 阿瓦提县| 新和县| 那坡县| 桂阳县| 安图县| 广南县| 专栏| 娄底市| 扶风县| 如东县| 义乌市| 翁源县| 扎囊县| 治多县| 邵阳县| 连江县| 岱山县|