国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

上證A股收益率分布特征的挖掘分析①

2018-03-02 06:16:10劉宇欣
計算機系統(tǒng)應(yīng)用 2018年2期
關(guān)鍵詞:概率密度正態(tài)分布刻度

劉宇欣,范 宏

(東華大學 旭日工商管理學院,上海 200051)

我國股票市場是一個年輕且成長迅猛的市場.據(jù)統(tǒng)計,到2016年4月底,上交所股票個數(shù)高達1140只,股票市價總值高達249 670.56億元,中國股市已經(jīng)成為中國金融體系中越來越重要的一份子.中國股市在飛速發(fā)展的過程中伴隨著多樣的波動性特征,對股票的統(tǒng)計特征規(guī)律進行全面的挖掘研究為風險管理及投資管理提供了堅實的理論基礎(chǔ).

國外對股票波動規(guī)律的研究起步較早,目前已有的經(jīng)典理論有如:投資組合理論、資本資產(chǎn)定價模型、有效市場理論、期權(quán)定價模型等.但上述經(jīng)典理論中,學者們通常認為股票收益率是一個服從高斯分布,且標準差為某常數(shù)的獨立序列.然而20世紀60年代后,有學者提出股票收益率不服從正態(tài)分布,卻具有“尖峰厚尾”的特征[1].于是,國外學者開始考慮不同時間范圍、股票指數(shù)、個股市值下的股票收益率不同的分布特征.如 Dro?d?等[2](2007)收集了 S&P、DAX和WIG200股票市場從2004年至2006年的股票收益率,并將時間刻度從高頻的4 min逐漸調(diào)整到120 min,發(fā)現(xiàn)標準化后的股票收益的累計分布大致從q-正態(tài)分布.Lillo等[3](2000)研究了紐約交易市場中個股流通市值對個股的收益率分布特征的影響,發(fā)現(xiàn)流通市值越高,股票收益率越收斂于正態(tài)分布.另外,國外學者們也開始利用各種模型針對股票的聚類性、持續(xù)性以及“肥尾”的特點對收益率進行擬合,如Yanhui Xi等[4](2015)通過建立基于學生t分布的市場微觀模型來擬合金融時間序列,并發(fā)現(xiàn)這種模型優(yōu)于帶學生t分布的SV-t模型.Horváth等[5](2016)采用帶有學生t分布和正態(tài)分布的GARCH模型對S&P 500股票市場的尾部進行了估計.國內(nèi)方面,較早的有陶亞民,蔡明超等[6](1999)通過非參數(shù)的擬合檢驗和收益率的統(tǒng)計參數(shù)考察上海股票市場的收益率,發(fā)現(xiàn)股票收益率不服從正態(tài)分布,而且與股票持有期有關(guān).后來王志誠、鄧召明[7](2001)采用滬深A(yù)股1995年至2000年的市場交易數(shù)據(jù),研究了每只股票和每個時間這兩個截面的數(shù)據(jù),并發(fā)現(xiàn)收益計算周期的延長,會導(dǎo)致資產(chǎn)收益的峰度逐漸消失.近年來,國內(nèi)學者主要采用GARCH族模型和SV模型對收益率進行擬合,如劉玄和馮彩[8](2009)、吳鑫育等[9](2014).縱觀國內(nèi)外文獻,我們可以發(fā)現(xiàn)國內(nèi)外學者大多利用某固定的時間范圍和時間刻度的股票數(shù)據(jù),并通常選擇某股票指數(shù)如上證指數(shù)、滬深300指來研究股市的總體變化.然而這不僅不能靈活調(diào)控時間范圍和時間刻度,而且沒有很好地反映個股之間具體屬性的差異(如流通市值和所屬行業(yè))對股票收益率帶來的影響.因此,本文旨在研究多時間范圍、多時間刻度下的單只股票或不同股票行業(yè)的收益率統(tǒng)計特征,而如果手工搜集不同范圍的股票數(shù)據(jù)且利用相同方法進行研究,這無疑工作量巨大且效率低下.為此,本文基于上證A股的每日、周、月行情數(shù)據(jù)建立數(shù)據(jù)庫系統(tǒng),同時建立Matlab GUI界面以便于查詢相應(yīng)數(shù)據(jù)和挖掘研究.

本篇論文的結(jié)構(gòu)如下.第1部分介紹了數(shù)據(jù)選取及建立的數(shù)據(jù)庫系統(tǒng).第2部分的研究對象是單只股票截面下的收益率,探究了收益率的概率密度分布特征受個股流通市值的影響,結(jié)果表明個股的流通市值越大,收益率的概率密度分布越為尖峰.同時,本文還通過改變研究的時間刻度和股票行業(yè)類別來分析分布特征的變化情況.第3部分的研究對象是單位時間截面下股票集合的收益率,并討論了收益率的統(tǒng)計特征,包括均值的概率密度分布、股票之間與時間之間的相關(guān)性、波動率及其自相關(guān)性.最后為結(jié)論.

1 數(shù)據(jù)選取及數(shù)據(jù)庫建立

1.1 數(shù)據(jù)選取

本文選取上證A股(共765只)的歷史行情數(shù)據(jù),時間刻度是日/周/月,時間范圍為2006年1月4日到2015年12月31日共10年,除去周末及節(jié)假日,共有2429個交易日,513周,120個月.經(jīng)統(tǒng)計,日股票綜合數(shù)據(jù)量約為175萬,周股票綜合數(shù)據(jù)量約為36.2萬,月股票綜合數(shù)據(jù)量約為8.5萬.

股票數(shù)據(jù)具體介紹:本文中的日/周/月股票數(shù)據(jù)來自于RESSET金融研究數(shù)據(jù)庫.由于上交所成立時間為1990年12月19日,因此選擇上市日期在1990年12月19日至2005年12月31日,當前狀態(tài)為“正常上市”的所有A股股票,共765只.因此對于這個上市時間區(qū)間內(nèi)的所有股票都擁有完整的近十年數(shù)據(jù).此時,對于所選擇的上市日期區(qū)間內(nèi)的股票,當前狀態(tài)共有5種可能:正常上市、ST、*ST、暫停上市、退市及三板市場,本文只選擇正常上市的股票.

1.2 數(shù)據(jù)庫建立

利用股票的收盤價數(shù)據(jù),本文首先根據(jù)公式(1)計算股票收益率Ri(t),然后將股票收益率數(shù)據(jù)存入數(shù)據(jù)庫SQL SERVER中.

上式中,i=1,2,3,…,n;τ=1 日/周/月;Yi(t)是單位時間t下第i只股票的收盤價.Ri(t)則代表第i只股票t時刻下的股票收益率.

建立股票收益率數(shù)據(jù)庫后,將Matlab通過ODBC與數(shù)據(jù)庫連接,達到在Matlab GUI端調(diào)控時間范圍、時間刻度和股票行業(yè)的目的,進而靈活地挖掘多個時間子區(qū)域、多種時間刻度以及不同股票行業(yè)下股票收益率的統(tǒng)計特征.

2 單只股票截面統(tǒng)計特征

2.1 研究方法

不同上市公司具有不同的公司規(guī)模,本文用流通市值代表公司規(guī)模.為了研究公司規(guī)模、時間刻度以及股票行業(yè)對股票收益率分布特征的影響,下面具體按照五個步驟進行研究:

步驟1.對每只股票的收益率按公式[Ri(t)-μi]/σi進行標準化處理,其中μi和σi是單只股票截面Ri(t)中的均值和標準差,分別見公式(2)和(3).

步驟2.按2015年12月31日的流通市值大小對所選股票由大到小排序,并重新編號.

步驟3.按流通市值大小順序同步繪制單只股票收益率的概率密度分布圖,其反映在坐標系中是以股票的經(jīng)驗概率密度分布曲線為X-Z面,以個股流通市值排序后的序號為Y軸的三維圖,從而在三維圖中可直觀判斷單只股票收益率分布的形狀及其與流通市值的關(guān)系.其中,Z軸采用自然對數(shù)坐標.

步驟4.步驟3是通過直接觀察分布圖定性地概括分布特征與流通市值的關(guān)系.而為了更定量地得出結(jié)論,在此采用Lillo[3]文中檢驗正態(tài)分布的方法,度量單只股票收益率的經(jīng)驗概率密度分布與正態(tài)分布的差距,并分析這種差距與流通市值的關(guān)系.

下面是具體的檢驗正態(tài)分布的量化方法,即1)-3):

1)對每一組數(shù)據(jù)按照公式(4)計算h值.公式中,〈···〉代表其平均值.

2)利用正態(tài)分布的函數(shù)表達式得出hG的計算公式,見公式(5):

由公式(5)可知參數(shù)hG是比率μG/σG的函數(shù),取值范圍從最低的(當μG/σG=0的時候)變化到無窮大.

3)比較h和hG的距離,來量化經(jīng)驗概率密度分布正態(tài)分布的差距.與此同時,本文通過繪制個股h值隨流通市值變化的散點圖反映收益率分布特征與流通市值的關(guān)系.

步驟5.改變所研究股票的行業(yè)類別和時間刻度,按公式(4)計算相應(yīng)的h值,對比分析后得出更多結(jié)論.

2.2 實證研究與分析

由于文章篇幅限制,本節(jié)只改變時間刻度和股票行業(yè)的取值,而時間范圍則均為全部十年.因此分為三塊進行挖掘研究:(1)時間刻度為日,股票行業(yè)為全部行業(yè);(2)時間刻度為月和周,其他不變;(3)股票行業(yè)為各個子行業(yè),其他不變.

(1)時間刻度為日,股票行業(yè)為全部行業(yè).1)由步驟3系統(tǒng)可以得出圖1、圖2.

圖1 由每只股票收益率的概率密度分布與其流通市值繪制而成的三維圖

圖2 圖1的X-Z視圖

圖1展示了每只股票收益率的經(jīng)驗概率密度分布,按個股流通市值的大小依次排列形成的三維圖.由圖1我們可以觀察到每只股票的形狀大多數(shù)都是相似的,為鈴鐺形狀,只有個別股票更加尖峰.但由于曲線較為密集,我們很難看出不同股票的分布特征與其流通市值的關(guān)系,因此下面對圖1的X-Z視圖(圖2)進一步分析.

為便于觀察,在仿真中,本文將不同流通市值的股票用深淺不同的顏色表示,即流通市值越大,顏色越淺.圖2表示所有股票的收益率概率密度分布的X-Z視圖.從圖2中我們可以觀察到圖形的中部顏色較深,因此,流通市值高的股票的密度分布比流通市值少的股票的密度分布更具高狹峰.

2)由步驟4,系統(tǒng)可以得出圖3.

圖3 正態(tài)分布檢驗圖

圖3 中每個點的縱坐標表示單只股票收益率分布的h值,橫坐標表示該股票流通市值的常用對數(shù)值.最上方的虛線表示,該值是收益率分布為正態(tài)分布時hG的最小值.

由圖3我們可以觀察到基本上所有股票都滿足h

(2)時間刻度為月和周,其他不變.

為研究收益率的分布規(guī)律與時間刻度的關(guān)系,下面按公式(4)計算時間刻度為周和月的h值:hm和hw,它們的均值分別是:0.7023和0.7108.對比hd、hw和hm的均值可知:當時間刻度增加時,h值向移動.即,隨著研究的時間刻度由日依次轉(zhuǎn)變?yōu)橹堋⒃聲r,股票收益率的經(jīng)驗概率密度分 布更加收斂于正態(tài)分布.

(3)股票行業(yè)為各個子行業(yè),其他不變.

股票行業(yè)種類不同,相應(yīng)的分布特征亦不同.對該規(guī)律的探索可以加強投資者對行業(yè)動態(tài)的關(guān)注.本文采用的股票行業(yè)分類標準是證監(jiān)會行業(yè)分類2012版,共19個一類分類.

表1即為不同股票行業(yè)種類的h值由大到小排序后的結(jié)果.居民服務(wù)、修理和其他服務(wù)業(yè)種類的股票數(shù)量為0,未列入表中.

表1 不同行業(yè)的h值

對比表1中各行業(yè)的h值,我們可以發(fā)現(xiàn)金融業(yè)的h值最低,約為0.6550;科學研究和技術(shù)服務(wù)業(yè)的h值最高,約為0.7740.經(jīng)計算,h均值為0.69989,而制造業(yè)與h均值的差值最小,因此,制造業(yè)反映了所有股票行業(yè)分布特征的一個平均狀況,投資者需要更加關(guān)注制造業(yè)的發(fā)展動態(tài).

3 時間截面下股票集合的統(tǒng)計特征

第3部分研究的是單只股票截面下股票收益率的統(tǒng)計特征,而對每個交易日來講,所有股票形成一個股票集合.此部分則研究單位時間股票集合的統(tǒng)計特征,包括均值的概率密度分布、股票兩兩之間與時間兩兩之間的相關(guān)性、波動率及其自相關(guān)性(本節(jié)均利用日股票收益率數(shù)據(jù)).

3.1 股票集合的收益率均值

3.1.1 均值的概率密度分布

為研究2013.01-2015.12這三年所有股票的收益率均值的分布特征,系統(tǒng)首先利用公式(2)和公式(6)分別計算相應(yīng)時間范圍內(nèi)的μ(t)和μi,即每日股票集合的收益率均值和每只股票的收益率均值,然后分別繪制兩個變量的概率密度分布圖,最后可得出圖4.

圖4采用對數(shù)-對數(shù)坐標系,圖(a)表示μ(t)的密度分布,圖(b)表示μi的密度分布.直觀來看,變量μ(t)和μi的統(tǒng)計特征明顯不同:μ(t)的概率密度分布圖像比μi的更寬,具體原因?qū)⒃?.1.2中討論.

圖4μ(t)和μi的概率密度分布對比圖

3.1.2 股票之間與時間序列之間的相關(guān)性

為探究μ(t)和μi的概率密度分布特征不同的原因,下面先假設(shè)市場中共T個交易日,N只股票.那么,我們可得到公式(7).

雖然μi和μ(t)的均值相同,但它們的方差一般是不相同的.接下來按公式(8)表示μ(t)的方差,公式(10)表示μi的方差.

經(jīng)推導(dǎo)后得到公式(12)[3]:

因此,相關(guān)強度的大小則可以轉(zhuǎn)化為兩個均值的方差大小.從圖4中我們可以發(fā)現(xiàn),并且系統(tǒng)計算出,也證明了這一點.這表明股票之間的相關(guān)性強于兩個不同交易日的相關(guān)性,也解釋了圖4中兩個變量的密度分布圖形寬度不同的原因.

3.2 波動率及其自相關(guān)函數(shù)

3.2.1 波動率

本文通過計算單位時間股票集合的收益率標準差σ(t),來測定股票集合的波動性,見公式(13).

其中,nt代表單位時間t下的股票總數(shù).標準差σ(t)是股票集合收益率密度分布的寬度,它反映了單位時間下不同公司收益率的差距.因此,標準差也被稱為股票的波動率.

3.2.2 波動率的自相關(guān)性

關(guān)于波動率的一個重要的統(tǒng)計特征是它們的自相關(guān)性.為研究波動率σ(t)關(guān)于自身的相關(guān)性,本文利用公式(14)所示的自相關(guān)函數(shù):

在公式(14)中,設(shè)置τ的最大值為100日,通過改變時間間距τ的大小(從1逐一變化到100),可以計算出標準差σ(t)的一組的自相關(guān)函數(shù)值,共100個;然后系統(tǒng)對得出的自相關(guān)函數(shù)值進行冪律函數(shù)(見公式(15))擬合,得到具體的函數(shù)表達式.具體擬合結(jié)果見圖5.

由圖5可知波動率σ(t)的自相關(guān)函數(shù)服從冪律分布,得到擬合系數(shù)-7.006,即δ=7.006,并且擬合誤差很小,這表明變量σ(t)在市場中具有長期記憶性.

圖5 自相關(guān)函數(shù)值的冪律函數(shù)擬合圖

4 結(jié)語

本文從單只股票截面和單位時間截面的兩個角度出發(fā),建立股票收益率挖掘系統(tǒng)對上證A股近十年的收益率數(shù)據(jù)進行挖掘.在系統(tǒng)上適當改變時間范圍、股票行業(yè)和時間刻度的基礎(chǔ)上,本文得出以下結(jié)論:(1)個股收益率的分布特征與其流通市值確實有關(guān)系,從整體趨勢上來看,流通市值越大,收益率的概率密度分布越尖峰.(2)當股票收益率的時間刻度由小到大發(fā)生變化時,h會變大,即收益率更加收斂于正態(tài)分布.(3)股票收益率的分布特征與行業(yè)種類密切相關(guān),金融業(yè)更加尖峰,而制造業(yè)則反映了所有行業(yè)的平均水平.(4)時間截面上股票集合收益率均值的概率密度分布的寬度明顯大于個股收益率均值的相應(yīng)寬度,這是因為股票兩兩之間的相關(guān)性強度遠大于時間之間的相關(guān)性.(5)股票波動率的自相關(guān)函數(shù)符合冪律函數(shù),這說明股票波動率具有長期記憶性.

本文為挖掘股票收益率的統(tǒng)計特征提供了簡便靈活的仿真過程.如今股市發(fā)展迅速,數(shù)據(jù)亦爆發(fā)式增長,而通過對股市數(shù)據(jù)的統(tǒng)計特征的觀察可以讓人們更加清楚金融市場更本質(zhì)的運行特征和規(guī)律.因此如何處理好股票大數(shù)據(jù)與適合中國國情的多種統(tǒng)計模型之間的快捷交互是未來的研究重點.

1Mandelbrot B.The variation of certain speculative prices.The Journal of Business,1963,36(4):394-419.[doi:10.1086/jb.1963.36.issue-4]

2Dro?d? S,Forczek M,Kwapień J,et al.Stock market return distributions:From past to present.Physica A:Statistical Mechanics and Its Applications,2007,383(1):59-64.[doi:10.1016/j.physa.2007.04.130]

3Lillo F,Mantegna RN.Variety and volatility in financial markets.Physical Review.E,Statistical Physics,Plasmas,Fluids,and Related Interdisciplinary Topics,2000,62:6126-6134.

4Xi YH,Peng H,Qin YM,et al.Bayesian analysis of heavytailed market microstructure model and its application in stock markets.Mathematics and Computers in Simulation,2015,117:141-153.[doi:10.1016/j.matcom.2015.06.006]

5Horváth R,?opov B.GARCH models,tail indexes and error distributions:An empirical investigation.The North American Journal of Economics and Finance,2015,37:1-15.

6陶亞民,蔡明超,楊朝軍.上海股票市場收益率分布特征的研究.預(yù)測,1999,(2):57-58,78.

7王志誠,鄧召明.中國A股股票收益率的統(tǒng)計特征.經(jīng)濟問題,2001,(12):46-47,53.[doi:10.3969/j.issn.1004-972X.2001.12.020]

8劉玄,馮彩.中國股市波動特征及非對稱效應(yīng)研究——以股改以來上證綜指為例.財會通訊,2010,(1):76-78.

9吳鑫育,馬超群,汪壽陽.隨機波動率模型的參數(shù)估計及對中國股市的實證.系統(tǒng)工程理論與實踐,2014,34(1):35-44.[doi:10.12011/1000-6788(2014)1-35]

猜你喜歡
概率密度正態(tài)分布刻度
連續(xù)型隨機變量函數(shù)的概率密度公式
歐姆表的刻度真的不均勻嗎?
——一個解釋歐姆表刻度不均勻的好方法
被吃掉刻度的尺子
基于對數(shù)正態(tài)分布的出行時長可靠性計算
誰大誰小
正態(tài)分布及其應(yīng)用
測量三字歌
正態(tài)分布題型剖析
χ2分布、t 分布、F 分布與正態(tài)分布間的關(guān)系
Hunt過程在Girsanov變換下的轉(zhuǎn)移概率密度的表示公式
铜梁县| 拉萨市| 吴江市| 衡阳县| 天长市| 武强县| 湄潭县| 皋兰县| 马鞍山市| 平泉县| 金寨县| 永春县| 洛宁县| 咸宁市| 冷水江市| 盐津县| 陇川县| 江油市| 遂溪县| 安阳县| 孟津县| 肇东市| 太谷县| 观塘区| 印江| 双峰县| 东辽县| 裕民县| 民权县| 贡山| 长葛市| 芷江| 崇明县| 太康县| 镇康县| 林西县| 平江县| 缙云县| 巴林右旗| 吴江市| 张家港市|