祝 嘉,向長(zhǎng)城
(湖北民族大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 恩施 445000)
金融領(lǐng)域通常被認(rèn)為是一個(gè)典型的復(fù)雜系統(tǒng),股票市場(chǎng)作為金融領(lǐng)域的重要組成部分,上市公司的股票價(jià)格波動(dòng)便是其中的一個(gè)典型代表.股票價(jià)格波動(dòng)不僅對(duì)投資者、實(shí)體經(jīng)濟(jì)產(chǎn)生巨大影響,也給監(jiān)管當(dāng)局帶來(lái)嚴(yán)峻挑戰(zhàn),所以對(duì)股市的結(jié)構(gòu)特征進(jìn)行研究是有必要的[1].
時(shí)間序列研究主要囊括了幾個(gè)方面:時(shí)序數(shù)據(jù)的變換、數(shù)據(jù)可視化、時(shí)序模型建立等[2-7].時(shí)間序列中的分析方法主要有自回歸(AR)和移動(dòng)平均理論模型(MA)、自回歸條件異方差模型(ARCH)、廣義自回歸條件異方差模型(GARCH)等[8-13].Lacasa等[14]提出可視圖理論,將每個(gè)數(shù)據(jù)點(diǎn)定義為節(jié)點(diǎn),數(shù)據(jù)點(diǎn)對(duì)之間滿(mǎn)足可視性準(zhǔn)則記作連邊,直觀的轉(zhuǎn)化成復(fù)雜網(wǎng)絡(luò);周婷婷等[15]在可視圖基礎(chǔ)上定義了有限穿越視距,引入了有限穿越可視圖理論,一定程度上克服了可視圖的局限性,具有更強(qiáng)的抗噪聲能力.再利用復(fù)雜網(wǎng)絡(luò)中已有的一些理論對(duì)時(shí)間序列進(jìn)行研究,如Renyi以及Erdos建立的ER隨機(jī)模型[16],Strogataz和Watts構(gòu)造的小世界(small world)復(fù)雜網(wǎng)絡(luò)[17];Barabasi和Albert發(fā)現(xiàn)節(jié)點(diǎn)的度分布服從冪律分布,即BA無(wú)標(biāo)度網(wǎng)絡(luò)特性[18].由此使得,通過(guò)可視圖理論轉(zhuǎn)化成復(fù)雜網(wǎng)絡(luò)的方法對(duì)于挖掘時(shí)間序列中隱含信息具有十分重要的指導(dǎo)意義[19-20].
股票數(shù)據(jù)是典型的時(shí)間序列數(shù)據(jù).目前有很多基于股票數(shù)據(jù)的研究,主要分為三類(lèi):第一類(lèi)是從股票波動(dòng)的角度研究其結(jié)構(gòu)及動(dòng)力學(xué)特征[21-23];第二類(lèi)是建立股票模型及預(yù)測(cè)方法,如最小生成樹(shù)(MST)、平面最大過(guò)濾圖(PMFG)等[24-25];第三類(lèi)是在重大事件下研究股票內(nèi)部及外部成員間的相互作用和影響[26-28].本文利用有限穿越可視圖理論將股票數(shù)據(jù)以網(wǎng)絡(luò)形式呈現(xiàn),借助網(wǎng)絡(luò)的分析方法來(lái)計(jì)算度分布、聚類(lèi)系數(shù)以及介數(shù)來(lái)分析時(shí)間序列特征.研究發(fā)現(xiàn),股票數(shù)據(jù)轉(zhuǎn)換后的復(fù)雜網(wǎng)絡(luò)度分布也滿(mǎn)足冪律特征和小世界特性.同時(shí)本文還通過(guò)有限穿越可視圖對(duì)相關(guān)數(shù)據(jù)進(jìn)行了較為準(zhǔn)確的預(yù)測(cè).
給定單變量時(shí)間序列{yi|i=1,2,3,…,N},其中yi是時(shí)間i的觀測(cè)值,每個(gè)柱形的高度與時(shí)間i的數(shù)據(jù)值yi相對(duì)應(yīng),如圖1(a)所示.如果ya和yb在時(shí)間序列中彼此可見(jiàn),那么任意一個(gè)點(diǎn)yj,滿(mǎn)足可視性準(zhǔn)則:
圖1 有限穿越可視圖Fig.1 The limited penetrable visibility graph
(1)
將時(shí)間i定義為節(jié)點(diǎn),數(shù)據(jù)點(diǎn)對(duì)之間滿(mǎn)足可視性準(zhǔn)則的連線(xiàn)定義為邊,從而構(gòu)成復(fù)雜網(wǎng)絡(luò).可視圖方法生成的網(wǎng)絡(luò)具有以下性質(zhì):
1) 每個(gè)節(jié)點(diǎn)至少和它的相鄰節(jié)點(diǎn)依次連接;
2) 節(jié)點(diǎn)連接之間沒(méi)有方向性;
3) 橫縱坐標(biāo)經(jīng)過(guò)仿射變換后,對(duì)應(yīng)的可視圖不會(huì)改變.
可視圖理論“繼承”了時(shí)間序列的一些特征,即不同的時(shí)間序列轉(zhuǎn)為不同類(lèi)型的網(wǎng)絡(luò);周期性時(shí)間序列轉(zhuǎn)化為規(guī)則網(wǎng)絡(luò)、隨機(jī)時(shí)間序列轉(zhuǎn)化為隨機(jī)網(wǎng)絡(luò)、分形時(shí)間序列轉(zhuǎn)化為無(wú)標(biāo)度網(wǎng)絡(luò)[29].
基于可視圖理論,周婷婷[15]考慮了在可視范圍內(nèi)的穿越概念,提出了有限穿越可視圖模型.該方法仍基于可視性準(zhǔn)則,其原理是定義了有限穿越視距N,網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)可視,當(dāng)且僅當(dāng)與兩節(jié)點(diǎn)對(duì)應(yīng)的直方條被位于其兩者之間的其他直方條截?cái)嗟拇螖?shù)n≤N.如圖1為一個(gè)有限穿越可視圖(有限穿越視距N=1)建網(wǎng)例子.
圖1(a)中實(shí)線(xiàn)表示基于可視性準(zhǔn)則的連線(xiàn),虛線(xiàn)表示基于有限穿越視距N=1的新增連線(xiàn).圖1(a)中的七個(gè)時(shí)間點(diǎn)的柱形記作7個(gè)節(jié)點(diǎn),滿(mǎn)足可視性準(zhǔn)則和在有限穿越視距N=1范圍內(nèi)各點(diǎn)間的相互連接關(guān)系構(gòu)建復(fù)雜網(wǎng)絡(luò)圖,如圖1(b)所示,圖1(b)中節(jié)點(diǎn)編號(hào)上方為新增連線(xiàn),下方為基于可視性準(zhǔn)則的連線(xiàn).有限穿越可視圖仍然具有連通性、無(wú)向性、仿射不變性等特點(diǎn),有限穿越可視圖模型具有更大的連接性,抗噪聲干擾能力比可視圖更強(qiáng).
2股票數(shù)據(jù)有限穿越可視圖分析
實(shí)驗(yàn)數(shù)據(jù)來(lái)自于大智慧交易軟件,選取2017-01-03—2018-12-31時(shí)段(節(jié)假日除外,股票市場(chǎng)不進(jìn)行交易)標(biāo)普&500指數(shù)(美國(guó))、富時(shí)馬拉西亞指數(shù)(馬來(lái)西亞)、瑞士SMI指數(shù)(瑞士)、比利時(shí)20指數(shù)(比利時(shí))、中國(guó)上證指數(shù)(中國(guó))、意大利富時(shí)指數(shù)(意大利)6個(gè)國(guó)家的股票每日收盤(pán)價(jià),分別建立6個(gè)國(guó)家的股票數(shù)據(jù)有限穿越可視圖(有限穿越視距N=1),如圖2所示.
度用來(lái)描述網(wǎng)絡(luò)中節(jié)點(diǎn)的特性,節(jié)點(diǎn)i連接的所有邊數(shù)稱(chēng)為該節(jié)點(diǎn)的度,用ki表示:
(2)
其中n是節(jié)點(diǎn)總數(shù),dij=1表示節(jié)點(diǎn)i和節(jié)點(diǎn)j相連,若兩節(jié)點(diǎn)不相連則dij=0.
在網(wǎng)絡(luò)中隨機(jī)抽取到度為k的節(jié)點(diǎn)的概率為pk,Nk是度為k的節(jié)點(diǎn)數(shù),
(3)
(4)
圖2中6個(gè)網(wǎng)絡(luò)度分布如圖3所示,6個(gè)網(wǎng)絡(luò)其他相關(guān)指標(biāo)如表1所示.
圖2 6個(gè)國(guó)家股票數(shù)據(jù)有限穿越可視圖(2017-01-03—2018-12-31)Fig.2 Limited penetrable visibility graph of stock data for six countries (from Jan.3,2017 to Dec.31,2018)
圖3 度分布概率圖Fig.3 Probability map of degree distribution
從圖3可以看出,6個(gè)網(wǎng)絡(luò)中度值較小的點(diǎn)概率比較大,度值較大的點(diǎn)比較少,都呈現(xiàn)冪律特性.結(jié)合圖3、表1可知,美國(guó)股票網(wǎng)絡(luò)的最大度值高達(dá)131,其余5個(gè)網(wǎng)絡(luò)最大度值在50~80之間,由股票數(shù)據(jù)可知,美國(guó)股票每日收盤(pán)價(jià)在2018-09-20日達(dá)到最高值2 930.75,這促使了大度節(jié)點(diǎn)的出現(xiàn).方差與標(biāo)準(zhǔn)差可以反映數(shù)據(jù)的離散程度,取值越大,說(shuō)明這個(gè)時(shí)間序列越不穩(wěn)定,而從中可看出美國(guó)股票網(wǎng)絡(luò)的標(biāo)準(zhǔn)差和方差取值較大.觀察實(shí)際數(shù)據(jù)發(fā)現(xiàn),美國(guó)股價(jià)從2017-01-03日2 257.83到2018-02-05日為2 648.93,再到2018-09-20日增至2 930.75,而2018-12-24日下跌至2 351.1,呈現(xiàn)時(shí)間短且變化快的特點(diǎn),使得該網(wǎng)絡(luò)度分布波動(dòng)較大.據(jù)搜狐2018年12月28日發(fā)布的《每日經(jīng)濟(jì)新聞》分析美股下跌這其中可能的原因是美聯(lián)儲(chǔ)官員們的講話(huà)引發(fā)了投資者對(duì)美聯(lián)儲(chǔ)加息節(jié)奏的猜測(cè),引發(fā)了市場(chǎng)恐慌情緒,同時(shí)市場(chǎng)對(duì)美股企業(yè)盈利的擔(dān)憂(yōu)、美國(guó)疲弱的房屋銷(xiāo)售數(shù)據(jù)等因素也導(dǎo)致了大跌.
表1 網(wǎng)絡(luò)相關(guān)指標(biāo)比較Tab.1 Comparison of network related indicators
如果一個(gè)網(wǎng)絡(luò)比同規(guī)模的隨機(jī)網(wǎng)絡(luò)表現(xiàn)出了較大的聚類(lèi)系數(shù)和較小的平均路徑長(zhǎng)度,就稱(chēng)該網(wǎng)絡(luò)具有小世界特性[14].對(duì)于給定的節(jié)點(diǎn)i,其聚類(lèi)系數(shù)Ci表示為:
(5)
與節(jié)點(diǎn)i連接的ki條邊,ki個(gè)節(jié)點(diǎn)最多有ki(ki-1)/2條邊,Ei表示ki個(gè)節(jié)點(diǎn)實(shí)際存在的邊數(shù).網(wǎng)絡(luò)的平均聚類(lèi)系數(shù)C定義如下:
(6)
在連通節(jié)點(diǎn)i和節(jié)點(diǎn)j的所有通路中,途經(jīng)其他頂點(diǎn)數(shù)目最少的路徑稱(chēng)為dij,平均路徑長(zhǎng)度L定義為任意兩節(jié)點(diǎn)之間最短路徑的平均值:
(7)
股票數(shù)據(jù)構(gòu)造的6個(gè)有限穿越可視圖網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)的聚類(lèi)系數(shù)分布情況,如圖4所示(橫線(xiàn)表示網(wǎng)絡(luò)平均聚類(lèi)系數(shù)所在直線(xiàn)).平均聚類(lèi)系數(shù)、平均路徑長(zhǎng)度、最短路徑最大值三項(xiàng)小世界特征指標(biāo),如表2所示.
圖4 聚類(lèi)系數(shù)分布情況(橫線(xiàn)為網(wǎng)絡(luò)平均聚類(lèi)系數(shù)值)Fig.4 Distribution of clustering coefficient (The horizontal line is the C of the network)
表2 小世界特征指標(biāo)Tab.2 Small world characteristic index
從圖4可知6個(gè)網(wǎng)絡(luò)中Ci為1的節(jié)點(diǎn)較多,Ci的值偏大.由表2可知,6個(gè)網(wǎng)絡(luò)的平均聚類(lèi)系數(shù)C集中在0.7~0.8之間,平均路徑長(zhǎng)度集中在3~4之間.用Pajek實(shí)驗(yàn)10次生成同等規(guī)模的502個(gè)節(jié)點(diǎn)構(gòu)成的隨機(jī)網(wǎng)絡(luò),得到平均路徑長(zhǎng)度為11.19,平均聚類(lèi)系數(shù)為0.33,比較可知6個(gè)網(wǎng)絡(luò)的平均路徑長(zhǎng)度明顯小于隨機(jī)網(wǎng)絡(luò),而聚類(lèi)系數(shù)均高于隨機(jī)網(wǎng)絡(luò),6個(gè)網(wǎng)絡(luò)都是典型的小世界網(wǎng)絡(luò).
介數(shù)是網(wǎng)絡(luò)中一種重要的全局幾何量,反映了節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)中的影響力.如果節(jié)點(diǎn)i被其他許多最短路徑經(jīng)過(guò),則表示該節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性,介數(shù)Bi表示為:
(8)
Njk表示節(jié)點(diǎn)j和節(jié)點(diǎn)k之間的最短路徑條數(shù),Njk(i)表示節(jié)點(diǎn)j和節(jié)點(diǎn)k之間的最短路徑經(jīng)過(guò)節(jié)點(diǎn)i的條數(shù).6個(gè)網(wǎng)絡(luò)的最大介數(shù)、平均介數(shù)如表3所示.
表3 介數(shù)指標(biāo)Tab.3 Betweenness index
由表3可知6個(gè)網(wǎng)絡(luò)的最大介數(shù)在0.4~0.5之間,平均介數(shù)在0.005~0.007之間,而用Pajek實(shí)驗(yàn)10次生成同等規(guī)模的502個(gè)節(jié)點(diǎn)構(gòu)成的隨機(jī)網(wǎng)絡(luò)得到的最大介數(shù)為0.081 9,平均介數(shù)為0.013 5,比較發(fā)現(xiàn)6個(gè)網(wǎng)絡(luò)的介數(shù)值與隨機(jī)網(wǎng)絡(luò)差別較大,出現(xiàn)這種情況的可能原因是6個(gè)網(wǎng)絡(luò)中都有大量hub節(jié)點(diǎn)的出現(xiàn),這反映該時(shí)段股票均存在異常高值現(xiàn)象.
當(dāng)預(yù)測(cè)時(shí)間序列中某節(jié)點(diǎn)的值時(shí),如果估算出該節(jié)點(diǎn)的度值,便可以通過(guò)計(jì)算任意一對(duì)數(shù)據(jù)點(diǎn)之間的斜率來(lái)推算該節(jié)點(diǎn)所處的區(qū)間[18].為了直觀的說(shuō)明有限穿越可視圖在股票價(jià)格預(yù)測(cè)中的應(yīng)用,選取中國(guó)上證指數(shù)2018-12-10—2018-12-14股票每日收盤(pán)價(jià)格,這5天股票每日收盤(pán)價(jià)格柱形圖如圖5所示,再將股票數(shù)據(jù)轉(zhuǎn)化為有限穿越可視圖(有限穿越視距N=1),如圖6所示.
圖5 中國(guó)5日股價(jià)柱形圖Fig.5 Column chart of China’s 5-day stock price
圖6 中國(guó)5日股價(jià)有限穿越可視圖Fig.6 China’s 5-day stock price of limited penetrable visibility graph
如果預(yù)測(cè)第六個(gè)節(jié)點(diǎn)(2018-12-17,星期一)的股票收盤(pán)價(jià)格,分以下幾種情況討論:①如果估算第六個(gè)節(jié)點(diǎn)的度值為1,顯然只有第六個(gè)節(jié)點(diǎn)與第五個(gè)節(jié)點(diǎn)(2 594)相連.按可視化準(zhǔn)則計(jì)算第六個(gè)節(jié)點(diǎn)被第四個(gè)節(jié)點(diǎn)(2 634)看見(jiàn),則預(yù)測(cè)值要大于2 554,如果預(yù)測(cè)值小于2 554時(shí),則根據(jù)有限穿越可視圖(有限穿越視距為1)理論,第六個(gè)節(jié)點(diǎn)可以被第四個(gè)節(jié)點(diǎn)看見(jiàn),此時(shí)第六個(gè)節(jié)點(diǎn)度值為2,故第六個(gè)節(jié)點(diǎn)度不可能為1.②如果估算出第六個(gè)節(jié)點(diǎn)的度值為2,因?yàn)榈诹鶄€(gè)節(jié)點(diǎn)與第五個(gè)節(jié)點(diǎn)肯定相連,從圖6知第五個(gè)節(jié)點(diǎn)的度值為2,分別與第四個(gè)節(jié)點(diǎn)、第三個(gè)節(jié)點(diǎn)(2 602)相連,第四個(gè)節(jié)點(diǎn)的度值為4且數(shù)據(jù)值最大,所以第六個(gè)節(jié)點(diǎn)最有可能與第四個(gè)節(jié)點(diǎn)相連,故第六個(gè)節(jié)點(diǎn)的預(yù)測(cè)值必然在第五個(gè)節(jié)點(diǎn)和第四個(gè)節(jié)點(diǎn)之間的斜率之上,即大于2 554;若第六個(gè)節(jié)點(diǎn)的值高于第四個(gè)節(jié)點(diǎn),則會(huì)被第三個(gè)節(jié)點(diǎn)在有限穿越視距范圍內(nèi)看見(jiàn),故第六個(gè)節(jié)點(diǎn)度為2時(shí),預(yù)測(cè)值范圍為[2 554,2 634].③如果估算出第六個(gè)節(jié)點(diǎn)的度值為3,則第六個(gè)節(jié)點(diǎn)可能與第五個(gè)節(jié)點(diǎn)、第四個(gè)節(jié)點(diǎn)、第三個(gè)節(jié)點(diǎn)相連,第六個(gè)節(jié)點(diǎn)的預(yù)測(cè)值所處區(qū)間為[2 554,2 698].④如果估算出第六個(gè)節(jié)點(diǎn)的度值為4,則第六個(gè)節(jié)點(diǎn)可能與第二個(gè)節(jié)點(diǎn)(2 595)、第三個(gè)節(jié)點(diǎn)、第四個(gè)節(jié)點(diǎn)、第五個(gè)節(jié)點(diǎn)相連,則第六個(gè)節(jié)點(diǎn)的預(yù)測(cè)值所處區(qū)間為[2 554,2 673].⑤如果估算出第六個(gè)節(jié)點(diǎn)的度值為5,則第六個(gè)節(jié)點(diǎn)可能與第一個(gè)節(jié)點(diǎn)(2 585)、第二個(gè)節(jié)點(diǎn)、第三個(gè)節(jié)點(diǎn)、第四個(gè)節(jié)點(diǎn)、第五個(gè)節(jié)點(diǎn)相連,則第六個(gè)節(jié)點(diǎn)的預(yù)測(cè)值所處區(qū)間為[2 554,2 667].
綜上所述,預(yù)測(cè)值為區(qū)間[2 554,2 634]、[2 554,2 698]、[2 554,2 673]、[2 554,2 667]的交集,故第六個(gè)節(jié)點(diǎn)的預(yù)測(cè)區(qū)間為[2 554,2 634],而實(shí)際值為2 598,滿(mǎn)足條件.
如果預(yù)測(cè)第七個(gè)節(jié)點(diǎn)(2018-12-18,星期二)的股票收盤(pán)價(jià)格,則把第六個(gè)節(jié)點(diǎn)(2018-12-17,2 598)當(dāng)成已知數(shù)據(jù),重復(fù)以上步驟,分以下幾種情況討論:①如果估算第七個(gè)節(jié)點(diǎn)的度值為1,顯然只有第七個(gè)節(jié)點(diǎn)與第六個(gè)節(jié)點(diǎn)(2 598)相連.按可視化準(zhǔn)則計(jì)算第七個(gè)節(jié)點(diǎn)被第四個(gè)節(jié)點(diǎn)(2 634)看見(jiàn),則預(yù)測(cè)值要大于2 580,如果預(yù)測(cè)值小于2 580時(shí),則根據(jù)有限穿越可視圖(有限穿越視距為1)理論,第七個(gè)節(jié)點(diǎn)可以被第四個(gè)節(jié)點(diǎn)看見(jiàn),此時(shí)第七個(gè)節(jié)點(diǎn)度值為2,故第七個(gè)節(jié)點(diǎn)度不可能為1.②如果估算出第七個(gè)節(jié)點(diǎn)的度值為2,計(jì)算出預(yù)測(cè)值區(qū)間為[2 580,2 634].③如果估算出第七個(gè)節(jié)點(diǎn)的度值為3,此時(shí)預(yù)測(cè)值區(qū)間為[2 580,2 602].④如果估算出第七個(gè)節(jié)點(diǎn)的度值為4,預(yù)測(cè)值所處區(qū)間為[2 580,2 597].⑤如果估算出第七個(gè)節(jié)點(diǎn)的度值為5,預(yù)測(cè)值區(qū)間為[2 580,2 599].⑥如果估算出第七個(gè)節(jié)點(diǎn)的度值為6,預(yù)測(cè)值范圍為[2 580,2 600].
綜上所述,預(yù)測(cè)值為區(qū)間[2 580,2 634]、[2 580,2 602]、[2 580,2 597]、[2 580,2 599]、[2 580,2 600]的交集,故第七個(gè)節(jié)點(diǎn)所處預(yù)測(cè)區(qū)間為[2 580,2 597],而實(shí)際值為2 590,滿(mǎn)足條件.
根據(jù)以上兩個(gè)例子可知,能準(zhǔn)確估算出要預(yù)測(cè)的時(shí)間節(jié)點(diǎn)的度值,便可以確定該節(jié)點(diǎn)所處的區(qū)間,所以要預(yù)測(cè)的節(jié)點(diǎn)實(shí)際數(shù)值與其度值緊密聯(lián)系.
本文基于股票數(shù)據(jù)這一主題,通過(guò)有限穿越可視圖理論將時(shí)間序列轉(zhuǎn)化為復(fù)雜網(wǎng)絡(luò)并分析其網(wǎng)絡(luò)拓?fù)涮卣?結(jié)果表明股票有限穿越可視圖網(wǎng)絡(luò)具有小世界特性、度分布服從冪律分布等特點(diǎn),也揭示了股票的部分特征.文中將股票時(shí)間序列數(shù)據(jù)轉(zhuǎn)為有限穿越可視圖網(wǎng)絡(luò)研究并進(jìn)行了較為準(zhǔn)確的預(yù)測(cè),試圖為監(jiān)管當(dāng)局、經(jīng)濟(jì)市場(chǎng)提供一定的理論支持和實(shí)踐基礎(chǔ).