張紅梅,王 沁,汪 玲,董 鑫
(西南交通大學(xué)數(shù)學(xué)學(xué)院,成都 611756)
一直以來,有效市場假說(EMH)作為金融學(xué)的研究基石,是分析金融市場的理論前提.然而,國內(nèi)外學(xué)者[1-4]對金融市場的研究表明,由于受到眾多復(fù)雜因素的影響,金融市場并不符合有效市場假說,而是表現(xiàn)出非常復(fù)雜的非線性特征.多重分形作為一種重要的非線性方法,能解釋眾多傳統(tǒng)有效市場假說無法解釋的現(xiàn)實經(jīng)濟現(xiàn)象,因此常常被用來研究金融市場的特征.聚類是數(shù)據(jù)挖掘和時間序列分析中一類重要的方法,所謂聚類就是將數(shù)據(jù)劃分成多個有意義的簇,使得簇中的數(shù)據(jù)盡可能相似,而簇與簇之間的數(shù)據(jù)具有明顯的差別.目前,時間序列聚類分析被廣泛用于能源系統(tǒng)[5]、自然災(zāi)害[6]、公共交通[7]、醫(yī)學(xué)[8]和航天[9]等多個領(lǐng)域.針對金融領(lǐng)域,由于金融時間序列具有高維度和高動態(tài)的非線性特點,因此常常結(jié)合多重分形來對其進(jìn)行聚類分析,這有助于分析金融市場的板塊效應(yīng)和聯(lián)動機制,對制定最優(yōu)投資組合,降低投資風(fēng)險有重要的意義.
隨著分形理論的不斷發(fā)展和完善,越來越多的學(xué)者使用多重分形消除趨勢波動分析法(MF-DFA)[10]和多重分形消除趨勢交叉相關(guān)分析法(MF-DCCA)[11]來探討金融市場的動態(tài)規(guī)律.He和Chen[12]用MF-DFA法研究國際石油市場價格的多重分形特征,結(jié)果表明Brent和WTI石油市場均存在多重分形結(jié)構(gòu);Dewandaru等[13]用MF-DFA法探討市場的分形特征并制定了有效的投資策略;Yin和Shang[14]利用修正的MF-DCCA法分別研究了美國和中國股票價格的自相關(guān)性和交叉相關(guān)性,實證結(jié)果表明,中美股票市場均存在多重分形特征,且分形強度不同;Cao等[15]用MF-DFA法研究中國股票市場的對稱性,實證結(jié)果表明上漲趨勢下,股票的多重分形強度更強,波動越大不對稱性越明顯.
近年來,越來越多的學(xué)者將分形理論和其他算法結(jié)合,常見的是與聚類分析相結(jié)合.鐘維年等[16]基于分形維和多重分形譜,對上海股票市場進(jìn)行分類,結(jié)果發(fā)現(xiàn)同一類型的股票在走勢、流通性等方面高度一致,而不同類型的股票存在較大差異;黃超等[17]基于分形理論,使用聚類分析法研究全球證券市場24個主要指數(shù)的特征;袁銘[18]基于標(biāo)度曲線對股票市場的金融時間序列進(jìn)行聚類,發(fā)現(xiàn)該方法能很好地揭示股市的行業(yè)聚集性和板塊間的關(guān)聯(lián)性;張鑫等[19]將分形和K均值聚類分析結(jié)合,應(yīng)用到軸承故障診斷,發(fā)現(xiàn)該方法能很好地識別軸承的故障.
從上述文獻(xiàn)可以看到,股市、期貨和外匯市場的金融時間序列均存在多重分形特征.本文充分考慮金融時間序列的復(fù)雜性特征,從分形的角度來分析股票市場的規(guī)律,將廣義Hurst指數(shù)分布和多重分形譜的兩個特殊值作為反應(yīng)股票波動特征的指標(biāo),其中Hurst指數(shù)分布選取的指標(biāo)為均值、標(biāo)準(zhǔn)差、偏度和峰度,多重分形譜的兩個指標(biāo)分別為多重分形譜寬度Δα和反應(yīng)最大、最小概率分形維差的Δf,并以歐氏距離函數(shù)作為測度函數(shù),使用層次聚類法對股票進(jìn)行歸類,深入分析每一類中股票的特征,為構(gòu)建投資組合提供了合理的建議.與傳統(tǒng)多重分形消除趨勢波動分析法不同的是,本文在消除序列趨勢時,采用的是經(jīng)驗?zāi)B(tài)分解法(EMD)[20],該方法能更好地消除序列趨勢.
多重分形消除趨勢波動分析法(MF-DFA)是由Kantelhardt[10]提出的,主要用來研究金融時間序列的多重分形特征.其思想大致如下:
1)重排列序列.設(shè)x(t)為任意的收益率時間序列,t=1,2,…,N.其中N是時間序列的長度,對收益率序列x(t)進(jìn)行累計離差和處理,得到重排列序列x(i),i=1,2,…,N.
式中:
2)等間距分割區(qū)間.將累積離差和序列x(i)分割成Ns=[N/s]個不重疊的子區(qū)間,每個子區(qū)間的長度為s,s的取值范圍為10~N/5.由于時間序列的長度N通常不是s的整數(shù)倍,為了充分利用序列涵蓋的信息,從序列尾部向前反向劃分區(qū)間,由此可以得到2Ns個區(qū)間.
3)EMD法消除趨勢.使用經(jīng)驗?zāi)B(tài)分解法(EMD)分解每一個子區(qū)間序列,并提取趨勢項x?m(k),其中:m=1,2,…,2Ns;k=1,2,…,s.
4)q階矩波動函數(shù).計算消除趨勢后的波動函數(shù):
再由波動函數(shù)推導(dǎo)出相應(yīng)的q階矩波動函數(shù):
5)多重分形指數(shù)(廣義Hurst指數(shù)).q矩階波動函數(shù)Fx(q,s)依賴于區(qū)間長度s和矩的階數(shù)q,且與多重分形指數(shù)存在冪律關(guān)系:
利用雙對數(shù)坐標(biāo)線性擬合來估計h(q),h(q)通常稱為多重分形指數(shù).若h(q)不隨q變化,則為單分形;若h(q)隨著q非線性變化,則為多重分形.h(q)>0.5時,序列存在長記憶性特征;h(q)<0.5時,序列存在反持續(xù)性特征.
6)多重分形譜.若收益率序列x(t)存在多重分形特征,則用多重分形譜分析法[21],求得其質(zhì)量指數(shù)t(q):
相應(yīng)的奇異標(biāo)度指數(shù)α和重分形譜f(α)為:
奇異標(biāo)度指數(shù)α用來刻畫序列局部的分形特征,在多重分形譜中,常常關(guān)注兩個特殊值Δα=αmax-αmin和Δf=f(αmin)-f(αmax),Δα稱為多重分形譜寬度,Δα越大表示分形越顯著;參數(shù)Δf用來表征最大、最小概率分形維差,若Δf>0,說明股票有更大的概率在高收益波動;若Δf<0,說明股票有更大的概率在低收益波動.
行業(yè)分析是股市基本面分析的重要內(nèi)容,行業(yè)股票的分類便于對股票進(jìn)行分析研究.目前,行業(yè)板塊已逐漸成為投資選股的重要依據(jù),因此本文從不同行業(yè)板塊中選取股票來研究股票市場的特征.把能源、釀酒、家用電器和房地產(chǎn)4個板塊作為研究對象,分別從每個板塊中隨機選取5只股票,獲取股票的日收盤價,數(shù)據(jù)來源于“通達(dá)信”客戶端,具體時間窗為2010年1月4日至2020年3月19日,由于各種原因使股票停牌,導(dǎo)致在時間窗內(nèi)每只股票的樣本容量不同,具體樣本及其容量如表1.
表1 股票名稱與樣本容量Tab.1 Stock names and sample sizes
在獲得日收盤價后,根據(jù)公式rt=lnpt-lnpt-1計算股票日對數(shù)收益率,使用日對數(shù)收益率分析股票波動的特征,由于篇幅有限,表2只給出了部分股票的描述性統(tǒng)計和正態(tài)性檢驗結(jié)果.由表2可以看出,4只股票收益率序列的偏度都小于0,樣本均值幾乎為0,峰度都大于0,整體呈現(xiàn)出“尖峰厚尾”的特征,從K-S檢驗結(jié)果也可以看到,股票收益率序列均不服從正態(tài)分布.同樣的,剩下的16只股票也具有相同的特征,說明所選股票收益率序列不符合有效市場假說,而是呈現(xiàn)出復(fù)雜的非線性特征.
使用重復(fù)劃分區(qū)間的MF-DFA法,檢驗股票收益率序列多重分形特征的存在性.區(qū)間長度s的取值范圍為30~100,波動函數(shù)的階數(shù)q在-10到10之間變化.同樣,由于篇幅的限制,圖1只給出了部分股票收益率序列的廣義Hurst指數(shù)圖和多重分形譜圖.
圖1 收益率序列的廣義Hurst指數(shù)圖和多重分形譜圖Fig.1 Generalized Hurst index diagram and multifractal spectrum diagram of the return series
從Hurst指數(shù)圖(圖1a)可以看到,4只股票收益率序列的廣義Hurst指數(shù)均隨著q值呈非線性變化,說明股票收益率序列均存在多重分形特征;4只股票收益率序列的Hurst指數(shù)變化趨勢相似,均隨著q值的增大而減小,且在q=0時出現(xiàn)拐點.建投能源、瀘州老窖、格力電器的Hurst指數(shù)十分接近,尤其是q值接近0時,說明這3只股票收益率序列的多重分形強度接近;綠地控股的Hurst指數(shù)整體比其他3只的大,說明綠地控股的多重分形強度更強,其股票收益波動也更劇烈,與另外3只股票存在較大差異,說明用Hurst指數(shù)分布聚類是合理的.
從多重分形譜圖(圖1 b)可以看到,序列的多重分形譜既存在差異性也存在相似性.相似性主要體現(xiàn)在多重分形譜的走勢上,均呈“倒鉤”形,差異性主要體現(xiàn)在“倒鉤”形的形態(tài)和多重分形譜的寬度上,建投能源、瀘州老窖、格力電器的多重分形譜呈“左偏”狀態(tài),而綠地控股的多重分形譜呈“右偏”狀態(tài),綠地控股的多重分形譜寬度明顯寬于其他股票,這也說明使用多重分形譜進(jìn)行聚類是合理的.用同樣的方法分析其他未展示的16只股票可以得到類似的結(jié)論.
廣義Hurst指數(shù)僅能從整體上刻畫序列的波動特征,而多重分形譜的兩個特殊值Δα和Δf能刻畫序列波動的均勻性和波動幅度的相似性,因此將廣義Hurst指數(shù)分布和多重分形譜的兩個特殊值作為衡量金融時間序列相似性的指標(biāo).其中廣義Hurst指數(shù)分布的指標(biāo)是廣義Hurst指數(shù)的均值、標(biāo)準(zhǔn)差、偏度和峰度,多重分形譜的指標(biāo)為Δα和Δf.將傳統(tǒng)歐式距離函數(shù)作為測度函數(shù),使用層次聚類法對股票序列進(jìn)行分類,當(dāng)目標(biāo)分為3個類別時,聚類結(jié)果如表3所示.
表3 股票聚類結(jié)果Tab.3 Stock clustering results
根據(jù)表3的聚類結(jié)果,分析每一類股票的波動特征.使用R軟件對每一類股票的廣義Hurst指數(shù)進(jìn)行描述性統(tǒng)計分析,表4給出了相應(yīng)的結(jié)果.
表4 股票波動分析結(jié)果Tab.4 Results of stock fluctuation analysis
分析表4,可得到如下結(jié)果:
1)觀察目標(biāo)分類1的多重分形譜和廣義Hurst指數(shù)分布,從表中可以看出,該類中廣義Hurst指數(shù)的標(biāo)準(zhǔn)差、偏度的絕對值均是最小的,表明該類的廣義Hurst指數(shù)集中在均值附近波動,整體的波動幅度較??;從Δα值也可以看到,類別1的多重分形譜寬度是最小的,說明該類別中股票序列的多重分形強度最弱,股票價格的波動最穩(wěn)定.再看廣義Hurst指數(shù)均值和Δf值,Hurst指數(shù)均值為0.548 7,大于0.5,說明該類別中的股票存在長記憶性特征;Δf值大于0,說明該類別中股票有較大的概率在高收益波動.由于長記憶性的存在,使得這種趨勢會持續(xù)一段時間,股票在未來一段時間內(nèi)仍然會在高收益波動,因此,將此類股票稱為“績優(yōu)股”.
2)觀察目標(biāo)分類2,該類別中廣義Hurst指數(shù)的標(biāo)準(zhǔn)差和峰度的絕對值都是最大的,偏度的絕對值居中,廣義Hurst指數(shù)波動較大.從Δα值也可以看到,此類的多重分形譜寬度最大,說明該類別中股票序列的多重分形強度最強,股票價格的波動最劇烈.再看Hurst指數(shù)均值和Δf,Hurst指數(shù)均值大于0.5,說明該類別的股票存在長記憶性特征;Δf值小于0,股票序列有更大的概率在低收益波動.由于長記憶性的存在,在未來的一段時間內(nèi),股票將持續(xù)在低收益波動,因此,將此類股票稱為“垃圾股”.
3)分析目標(biāo)分類3的特征,觀察廣義Hurst指數(shù)的分布,可以看出,廣義Hurst指數(shù)的標(biāo)準(zhǔn)差處于居中位置,峰度的絕對值最小,偏度小于0且絕對值最大,表明Hurst指數(shù)大部分位于均值左邊,且有更大的概率處在小波動;多重分形譜的寬度Δα居中,說明該類別中股票序列的多重分形強度居中.再觀察廣義Hurst指數(shù)均值和Δf,可以看到Hurst指數(shù)均值小于0.5,表明該類股票存在反持續(xù)性的特征;Δf值小于0,說明股票有更高的概率在低收益波動.由于反持續(xù)性特征的存在,股票收益有回升的趨勢,因此,將該類別的股票稱為“潛力股”.
本文以4個行業(yè)板塊的股票日收益率數(shù)據(jù)為基礎(chǔ),使用重復(fù)劃分區(qū)間下的MF-DFA法,分析了股票的多重分形特征,并基于廣義Hurst指數(shù)分布和多重分形譜的兩個特殊值,使用層次聚類法比較行業(yè)板塊股票間的多重分形特征,得到如下結(jié)論:
1)多重分形指數(shù)分析結(jié)果表明,本文所選股票均存在多重分形結(jié)構(gòu),且每只股票的多重分形強度不同.
2)從聚類分析結(jié)果來看,將股票市場分為績優(yōu)股、垃圾股、潛力股3類比較合理.
3)研究結(jié)果能為構(gòu)建投資組合提供合理的建議.當(dāng)投資者在投資股票時,可以從績優(yōu)股和潛力股中選取股票來構(gòu)建投資組合,從而有效地降低投資風(fēng)險,并且實現(xiàn)收益最大化.