国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于R語(yǔ)言的金融數(shù)據(jù)分析
——以新浪股票數(shù)據(jù)為例

2020-04-28 08:21:48楊曉偉楊鴻鮮劉相國(guó)劉倩倩
關(guān)鍵詞:正態(tài)線(xiàn)圖新浪

楊曉偉,楊鴻鮮,劉相國(guó),劉倩倩

(巢湖學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 合肥 23800)

隨著我國(guó)國(guó)民經(jīng)濟(jì)的發(fā)展及科學(xué)技術(shù)水平的提升,金融領(lǐng)域的發(fā)展受到社會(huì)各界的高度重視。然而,金融行業(yè)的數(shù)據(jù)分析是一個(gè)極為復(fù)雜的體系,有眾多不同的分支。因此大數(shù)據(jù)分析技術(shù)在這個(gè)新經(jīng)濟(jì)時(shí)代意義重大。近年來(lái),數(shù)據(jù)分析軟件層出不窮,如R、SPSS、Eviews、Matlab等數(shù)據(jù)分析軟件。其中R語(yǔ)言以其獨(dú)特的優(yōu)勢(shì)活躍于各個(gè)領(lǐng)域數(shù)據(jù)分析之中。R具備可拓展能力,且擁有豐富的功能選項(xiàng),可幫助相關(guān)領(lǐng)域工作人員開(kāi)展數(shù)據(jù)分析與研究活動(dòng)。

金融數(shù)據(jù)分析離不開(kāi)切實(shí)可靠的數(shù)據(jù),數(shù)據(jù)是經(jīng)濟(jì)分析的基礎(chǔ),嚴(yán)謹(jǐn)?shù)慕?jīng)濟(jì)理論和經(jīng)濟(jì)形勢(shì)預(yù)判均需真實(shí)有效的數(shù)據(jù)作為依據(jù)。由于R軟件包涉及的領(lǐng)域極廣,包含社交網(wǎng)絡(luò)分析、統(tǒng)計(jì)、繪圖、自然語(yǔ)言處理、生物信息統(tǒng)計(jì)等,并且它們擁有共同的一套R(shí)語(yǔ)言語(yǔ)法和語(yǔ)義規(guī)則,操作靈活簡(jiǎn)便。本文主要運(yùn)用R的quantmod包和fBasics包從雅虎網(wǎng)的財(cái)經(jīng)板塊抓取新浪股票數(shù)據(jù),為股票的市場(chǎng)走勢(shì)分析打下基礎(chǔ)。

在如今這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析成為生活和工作中必不可少的項(xiàng)目。而數(shù)據(jù)分析就是采用恰當(dāng)?shù)慕y(tǒng)計(jì)分析技術(shù)對(duì)收集來(lái)的龐大的數(shù)據(jù)體系進(jìn)行分析整理,提取有價(jià)值信息,形成一般規(guī)律或結(jié)論,并給出詳細(xì)的概述[1]。例如經(jīng)典的營(yíng)銷(xiāo)案例如沃爾瑪啤酒與尿布;Suncorp-Metway使用數(shù)據(jù)分析實(shí)現(xiàn)智慧營(yíng)銷(xiāo);還有辛辛那提動(dòng)物園使用數(shù)據(jù)分析提高客戶(hù)滿(mǎn)意度等經(jīng)典數(shù)據(jù)分析案例,深刻反映出數(shù)據(jù)分析的實(shí)用性遍布日常生活和工作過(guò)程中,幫助人們做出判斷,利于人們采取適當(dāng)行動(dòng)[2]。而本文主要是運(yùn)用R軟件,實(shí)現(xiàn)對(duì)新浪股票數(shù)據(jù)的基礎(chǔ)分析,這具有一定的現(xiàn)實(shí)指導(dǎo)意義。

1 R語(yǔ)言概述

從R的起源史來(lái)看,R工具的開(kāi)發(fā)其實(shí)是用來(lái)替代昂貴的SPSS工具和SAS工具[3]。1992年開(kāi)始,由兩位新西蘭奧克蘭大學(xué)的統(tǒng)計(jì)學(xué)家為了方便講授初等統(tǒng)計(jì)課程,而發(fā)明的以他們名字的首字母R為名稱(chēng)的編程語(yǔ)言,可認(rèn)為R是S語(yǔ)言分支的一種實(shí)現(xiàn)[4]。R是目前使用最廣泛的數(shù)據(jù)挖掘和分析工具,已成為一款極具特色且擁有廣闊前景的應(yīng)用軟件。尤其在金融行業(yè),金融數(shù)據(jù)的分析更是離不開(kāi)R的。如人們可通過(guò)R對(duì)股票數(shù)據(jù)進(jìn)行抓取,對(duì)獲取的數(shù)據(jù)進(jìn)行挖掘,得出分析結(jié)果,對(duì)金融行業(yè)及股票市場(chǎng)進(jìn)行合理預(yù)判,以便對(duì)企業(yè)發(fā)展有更好的評(píng)估[5]。

1.1 R包的介紹

簡(jiǎn)而言之,R是一個(gè)關(guān)于包的集合,而包是關(guān)于函數(shù)、數(shù)據(jù)集、編譯器等的集合。編譯R程序的過(guò)程是通過(guò)創(chuàng)建R對(duì)象來(lái)組織數(shù)據(jù),并通過(guò)調(diào)用系統(tǒng)函數(shù)或創(chuàng)建和調(diào)用自定義函數(shù)來(lái)逐步完成每個(gè)數(shù)據(jù)挖掘各階段的任務(wù)。包作為R的核心思想可劃分為基礎(chǔ)包和共享包兩大內(nèi)容?;A(chǔ)包是R默認(rèn)下載和安裝的包,它支持各類(lèi)數(shù)據(jù)基本統(tǒng)計(jì)情況的分析和基礎(chǔ)制圖等,其中還包括一些共享數(shù)據(jù)集供用戶(hù)使用。而共享包是由R的全球性研究型社區(qū)和第三方提供的各種包的集合,涵蓋了各類(lèi)現(xiàn)代統(tǒng)計(jì)和數(shù)據(jù)挖掘方法,涉及的應(yīng)用領(lǐng)域較多。使用者可根據(jù)自身的研究目的,有選擇地自行指定下載、安裝和加載。

1.2 R的基本函數(shù)

表1的函數(shù)主要用來(lái)對(duì)數(shù)據(jù)統(tǒng)計(jì)性質(zhì)進(jìn)行分析,利用R軟件編程來(lái)呈現(xiàn)數(shù)據(jù)結(jié)果。

表1 基本統(tǒng)計(jì)函數(shù)介紹

表2是本文用來(lái)抓取股票數(shù)據(jù)并調(diào)用相關(guān)算法進(jìn)行技術(shù)分析的R函數(shù)命令。

表2 主要調(diào)用R函數(shù)介紹

①library() 函數(shù)用來(lái)加載各種R包,其相當(dāng)于一個(gè)大型“圖書(shū)館”,用來(lái)查找資料的。

②getSymbols() 函數(shù)是用來(lái)訪(fǎng)問(wèn)和下載作用對(duì)象的數(shù)據(jù),如用來(lái)抓取新浪股票數(shù)據(jù)。

③chartSeries() 函數(shù)主要是用來(lái)繪制數(shù)據(jù)的K線(xiàn)圖。

2 金融數(shù)據(jù)分析的理論介紹

金融行業(yè)數(shù)據(jù)信息量大且更新速度極快,因此應(yīng)及時(shí)、準(zhǔn)確、清晰的掌握金融數(shù)據(jù),并對(duì)其進(jìn)行精準(zhǔn)的分析,以此判別金融市場(chǎng)走向,從而規(guī)避風(fēng)險(xiǎn),作出正確抉擇[6]。

2.1 金融數(shù)據(jù)分析的“統(tǒng)計(jì)常識(shí)”

金融數(shù)據(jù)分析需要一些基本的統(tǒng)計(jì)指標(biāo),如均值、方差、偏度、峰度等[7]。

所謂均值(mean)表示一組數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)指標(biāo),是指一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個(gè)數(shù),其公式為:

對(duì)于方差(variance),它是度量隨機(jī)變量或一組數(shù)據(jù)離散程度的指標(biāo),在很多實(shí)際問(wèn)題中,方差的研究具有重要意義。其公式為:

標(biāo)準(zhǔn)差是樣本中各個(gè)樣本點(diǎn)到均值的距離之平均。簡(jiǎn)而言之,標(biāo)準(zhǔn)差描述的就是數(shù)據(jù)的“散布度”,其公式為:

偏度和峰度是數(shù)據(jù)分布情況的度量,數(shù)據(jù)在比較集中的地方會(huì)呈現(xiàn)出一個(gè)高峰,這個(gè)高峰可能偏左也可能偏右,因此引進(jìn)了這兩個(gè)指標(biāo),即偏度和峰度。偏度(skewness)是統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和程度的度量,也是統(tǒng)計(jì)數(shù)據(jù)分布非對(duì)稱(chēng)程度的數(shù)字特征,它是度量關(guān)于其均值的對(duì)稱(chēng)性。峰度(kurtosis)又稱(chēng)峰態(tài)系數(shù),它反映了概率密度曲線(xiàn)在平均值處峰值高低的特征數(shù)[8]。

表3是對(duì)本文金融數(shù)據(jù)處理中一些描述性統(tǒng)計(jì)量的簡(jiǎn)單介紹。

表3 描述性統(tǒng)計(jì)量介紹

2.2 正態(tài)性檢驗(yàn)原理

正態(tài)性檢驗(yàn)方法多樣,本文主要用到的方法是JB正態(tài)性檢驗(yàn)。所謂JB正態(tài)性檢驗(yàn),是Jarque和Bera兩個(gè)人將單獨(dú)的偏度t檢驗(yàn)和峰度t檢驗(yàn)融合在一起而建立的正態(tài)性檢驗(yàn)原理。其公式為:

其中,n表示樣本容量,S表示偏度,K代表峰度。若在規(guī)定的顯著性水平下(通常為5%),則拒絕原假設(shè),不滿(mǎn)足正態(tài)分布;反之接受原假設(shè),滿(mǎn)足正態(tài)分布。

2.3 股票基礎(chǔ)知識(shí)

股票是一種有價(jià)證券,它是由股份有限公司簽發(fā)的證明,股東所持股份的憑證[9]。股票具有收益性、風(fēng)險(xiǎn)性、流動(dòng)性、永久性、參與性五個(gè)特點(diǎn)。了解掌握和分析股票數(shù)據(jù),必須了解股票數(shù)據(jù)的K線(xiàn)圖、成交量、股票收益率等技術(shù)分析指標(biāo)。

3 實(shí)例分析

在本文的主要目標(biāo)是判斷新浪股票數(shù)據(jù)是否服從正態(tài)分布并實(shí)現(xiàn)基礎(chǔ)分析。若假設(shè)所研究時(shí)間段的新浪股票數(shù)據(jù)服從正態(tài)分布,收集數(shù)據(jù)后將使用適當(dāng)?shù)姆椒ㄟM(jìn)行檢驗(yàn)。

3.1 收集數(shù)據(jù)

3.1.1 加載R軟件包

在金融數(shù)據(jù)分析中不可避免要運(yùn)用R包來(lái)調(diào)用所需的分析方法或模型,本文主要調(diào)用“quantmod”和“fBasics”兩種R包進(jìn)行數(shù)據(jù)分析。

“quantmod”包是金融數(shù)據(jù)分析中抓取數(shù)據(jù)主要的R包之一,調(diào)用“quantmod”包可從一些相關(guān)的網(wǎng)站訪(fǎng)問(wèn)下載所需數(shù)據(jù),如可利用此包直接從Yahoo、Google、MySQL、FRED等網(wǎng)站的財(cái)經(jīng)板塊下載所需的股票數(shù)據(jù),本文主要從雅虎上訪(fǎng)問(wèn)下載相關(guān)數(shù)據(jù)。加載“quantmod”包需用到R軟件中l(wèi)ibrary() 函數(shù)。其中,如圖1所示,在加載過(guò)程中需載入三個(gè)依賴(lài)的包。同樣地,fBasics包的加載操作也是如此。

圖1 加載quantmod包的操作過(guò)程

3.1.2 抓取股票數(shù)據(jù)

訪(fǎng)問(wèn)下載股票數(shù)據(jù)需要用到getSymbols()函數(shù),以此命令來(lái)訪(fǎng)問(wèn)雅虎網(wǎng)上財(cái)經(jīng)板塊的數(shù)據(jù),直接從網(wǎng)站下載股票數(shù)據(jù)。其中主要調(diào)用的股票代碼為“SINA”,假如要讀取某股票數(shù)據(jù),首先要查詢(xún)相應(yīng)股票的代碼,“SINA”正是本文所需的新浪股票代碼。本文主要訪(fǎng)問(wèn)下載的是2018年3月到2019年2月的新浪股票數(shù)據(jù),具體操作如圖2。

圖2 下載股票數(shù)據(jù)的指令

由于從雅虎網(wǎng)上抓取的新浪股票數(shù)據(jù)量巨大,查看完整數(shù)據(jù)非常不方便。因此本文僅查看已下載數(shù)據(jù)的前六行和后六行,調(diào)用命令head() 和tail()即可。圖3表示已下載的前六行和后六行數(shù)據(jù)。

圖3 查看指定行列數(shù)據(jù)

從圖3中可看出,所訪(fǎng)問(wèn)的新浪股票數(shù)據(jù)的6個(gè)指標(biāo),包含每天的開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)、收盤(pán)價(jià)、成交量和調(diào)整后的收盤(pán)價(jià)。這是研究股票收益率的重要依據(jù)。

3.1.3 數(shù)據(jù)預(yù)處理

一般常見(jiàn)的數(shù)據(jù)預(yù)處理就是判斷是否有缺失值[10],基于R識(shí)別數(shù)據(jù)中是否存在缺失值NA一般調(diào)用函數(shù)is.na()或complete.cases(),但二者在判斷的表達(dá)上有明顯差異。

is.na()作用于對(duì)象之后,如果對(duì)應(yīng)的數(shù)值為缺失值則返回TURE,否則為FALSE,使用求和函數(shù)sum()可計(jì)算出缺失值總數(shù);

complete.cases()識(shí)別缺失值與is.na()剛好相反,缺失值為FALSE,正常數(shù)據(jù)為T(mén)URE。

從圖4和圖5的結(jié)果可看出兩種方法呈現(xiàn)的結(jié)果是一致的,在抓取數(shù)據(jù)中并沒(méi)有顯示缺失值存在,因此判斷該數(shù)據(jù)中無(wú)缺失值NA。

圖4 is.na判斷缺失值

圖5 complete.cases判斷缺失值

3.2 股票數(shù)據(jù)的圖形繪制

3.2.1 股票數(shù)據(jù)的K線(xiàn)圖

對(duì)于金融行業(yè)股票數(shù)據(jù)分析,要對(duì)股票數(shù)據(jù)做一個(gè)直觀的了解,需要繪制股票數(shù)據(jù)的K線(xiàn)圖[11]。K線(xiàn)圖是記錄某種股票一天的價(jià)格變動(dòng)的范圍。利用R繪制K線(xiàn)圖直接調(diào)用chartSeries函數(shù)即可,這是繪制K線(xiàn)圖的常用方法。

圖6 新浪股票數(shù)據(jù)K線(xiàn)圖(紅漲綠跌)

圖6的K線(xiàn)圖表示新浪股票日收盤(pán)價(jià)和成交量變化趨勢(shì)。從圖中很直觀地反映了2018年3月初到2019年2月底,新浪股票數(shù)據(jù)的收盤(pán)價(jià)最高點(diǎn)在2018年3月中旬,而成交量最高點(diǎn)在2018年5月中旬。

3.2.2 增加參數(shù)指標(biāo)

本文主要通過(guò)應(yīng)用R軟件,對(duì)新浪股票數(shù)據(jù)進(jìn)行典型圖形繪制,主要增加了布林線(xiàn)(BBands)指標(biāo)和趨向指標(biāo)(ADX)等及技術(shù)分析指標(biāo),為什么要增加布林線(xiàn)指標(biāo)和平均趨向指標(biāo)呢?首先,根據(jù)其原理,一般來(lái)說(shuō)股價(jià)一般是圍繞如均線(xiàn)、成本線(xiàn)等價(jià)值中樞在一定的范圍內(nèi)波動(dòng),布林線(xiàn)指標(biāo)在這一基礎(chǔ)上認(rèn)為股價(jià)信道的寬窄會(huì)隨著股價(jià)的變化而變化,自動(dòng)加之調(diào)整,具有變異性。所以這一指標(biāo)以直觀、靈活的特點(diǎn)逐步成為市場(chǎng)投資人關(guān)注的重點(diǎn)指標(biāo)。其次,平均趨向指標(biāo)雖然在呈現(xiàn)趨勢(shì)的發(fā)展方向上有所欠缺,但是,如果存在一定的趨勢(shì),ADX(趨向指標(biāo))就可以用來(lái)衡量趨勢(shì)的強(qiáng)度[12]。ADX的讀數(shù)上升,說(shuō)明趨勢(shì)變強(qiáng);反之,趨勢(shì)變?nèi)酢R虼瞬剂志€(xiàn)指標(biāo)和平均趨勢(shì)指標(biāo)具有重要參考意義。

根據(jù)圖7的布林線(xiàn)趨勢(shì)圖看出,2018年3月到5月,上、中、下軌線(xiàn)同時(shí)向下運(yùn)行,說(shuō)明市場(chǎng)弱勢(shì)特征明顯,這一時(shí)期內(nèi)呈下跌趨勢(shì),股價(jià)一路下跌。之后的時(shí)間里,新浪股票的股價(jià)大致出現(xiàn)下跌,這可能是市場(chǎng)外部因素所致。

圖7 增加布林線(xiàn)指標(biāo)的線(xiàn)圖

從圖8的趨向指標(biāo)圖可看出,ADX值在高位由升轉(zhuǎn)跌,預(yù)示行情即將反轉(zhuǎn),股票市場(chǎng)的行情屬于不穩(wěn)定階段。

圖8 增加ADX指標(biāo)后的線(xiàn)圖

3.3 股票收益率及典型圖形

在股票市場(chǎng)中,研究股票收益率每天變化情況是非常重要的。除去周末,市場(chǎng)計(jì)算每天的收益率既可用開(kāi)盤(pán)價(jià),也可用收盤(pán)價(jià)。但是,通常來(lái)說(shuō)以收盤(pán)價(jià)為基準(zhǔn)計(jì)算收益率。在收益率的計(jì)算中,可以分為簡(jiǎn)單收益率和對(duì)數(shù)收益率,但基本上使用的是對(duì)數(shù)收益率,因?yàn)閷?duì)數(shù)收益率具有嚴(yán)謹(jǐn)?shù)摹皩?duì)稱(chēng)性”,同時(shí)也更容易體現(xiàn)統(tǒng)計(jì)特征。

由于R的功能強(qiáng)大,可利用R計(jì)算出對(duì)數(shù)收益率來(lái)分析新浪股票日收益率。此時(shí)需要載入PerformanceAnalytics安裝包,然后載入程輯包,且計(jì)算對(duì)數(shù)收益率時(shí)需調(diào)用periodReturn函數(shù)來(lái)計(jì)算不同階段的收益率,類(lèi)型選擇對(duì)數(shù)類(lèi)型即可。

因?yàn)橛^察每天的對(duì)數(shù)收益率是一個(gè)龐大的數(shù)據(jù),因此僅查看了2018年3月份6天的對(duì)數(shù)收益率,以及2019年最后6天的對(duì)數(shù)收益率,操作結(jié)果如圖9所示。

圖9 對(duì)數(shù)收益率的處理

根據(jù)對(duì)數(shù)收益率計(jì)算結(jié)果,繪制新浪股票收益率的K線(xiàn)圖,如圖10。從圖中可看出股票收益率的波動(dòng)情況。其中,股票價(jià)格使用的是調(diào)整后的收盤(pán)價(jià)。

圖10 股票收益率的K線(xiàn)圖

繪制密度函數(shù)圖之前需下載fBasics軟件包,在R中編寫(xiě)代碼載入相關(guān)程緝包,獲取密度函數(shù),查看數(shù)據(jù)的取值范圍,根據(jù)這一范圍,繪制密度函數(shù)即可。圖11、圖12加載了作密度函數(shù)圖所需的R包,圖13求出了該收益率密度函數(shù)的取值范圍值。

圖11 加載fBasics包

圖12 求收益率的取值范圍

圖14是收益率密度函數(shù)圖,可看出新浪股票數(shù)據(jù)的密度函數(shù)有明顯的高峰厚尾現(xiàn)象,與正態(tài)分布差別很明顯。

圖14 股票收益率的密度函數(shù)圖

3.4 股票收益率的正態(tài)性檢驗(yàn)

在上文基礎(chǔ)上,通過(guò)繪制新浪股票收益率的密度函數(shù)圖與正態(tài)分布差異顯著,因此需進(jìn)一步利用正態(tài)性檢驗(yàn)來(lái)驗(yàn)證。

3.4.1 股票收益率的基本統(tǒng)計(jì)量

調(diào)用basicStats()函數(shù)可獲得新浪股票收益率,從圖15中的計(jì)算結(jié)果來(lái)看,調(diào)整后的新浪收益率數(shù)據(jù)中,均值等于-0.002123,非常接近于0,表示新浪股票收益率有顯著向0集中的趨勢(shì);方差等0.000704,接近于0,表示這段時(shí)期內(nèi)新浪股票收益率的離散程度比較小,也可說(shuō)是不分散的;偏度為-0.270431,明顯不等于0,說(shuō)明新浪股票收益率分布具有非對(duì)稱(chēng)性;峰度(Kurtosis)等于1.737217,明顯小于3,說(shuō)明了新浪股票收益率存在明顯的高峰厚尾現(xiàn)象。這與之前繪制的密度函數(shù)相吻合,但仍需進(jìn)一步進(jìn)行正態(tài)性檢驗(yàn)。

圖15 新浪股票收益率的基本統(tǒng)計(jì)量

3.4.2 股票收益率的正態(tài)性檢驗(yàn)

由于利用R計(jì)算JB統(tǒng)計(jì)量十分便捷,故本文主要運(yùn)用JB檢驗(yàn)。調(diào)用normalTest()函數(shù),方法設(shè)置改為JB即可。根據(jù)圖16的JB值為35.9158,且P=1.589e-8<0.05,表明在5%的顯著性水平下應(yīng)拒絕原假設(shè),說(shuō)明新浪股票收益率不服從正態(tài)分布。

圖16 JB正態(tài)性檢驗(yàn)結(jié)果

3.5 成交量分析

由于股市成交量是股票買(mǎi)賣(mài)雙方完成交易的數(shù)量,這也是技術(shù)分析中經(jīng)常使用的重要指標(biāo)。應(yīng)用R計(jì)算某時(shí)間段股票總成交量是十分簡(jiǎn)便的,只需輸入函數(shù)命令getSymbols,并分別調(diào)用chartSeries()、summary()和sum()三個(gè)函數(shù)便可得到股票成交量K線(xiàn)圖和成交量數(shù)據(jù)匯總結(jié)果,如圖17。從圖中可看出新浪股票成交量在2018年4月、4月中旬、5月、8月中旬這幾個(gè)時(shí)間點(diǎn)出現(xiàn)了“暴漲暴跌”的走勢(shì),之后從2019年初以后大致呈現(xiàn)上升趨勢(shì)。

圖17 股票成交量K線(xiàn)圖

從圖18的股票成交量匯總數(shù)據(jù)圖可看出:2018年3月至2019年2月這一期間新浪股票的6個(gè)指標(biāo)的最大值、最小值、均值等。結(jié)果顯示該期間內(nèi),開(kāi)盤(pán)價(jià)最大值為2019年2月28日的123.16,最小值為2018年3月1日的52.76;同理,剩下五個(gè)指標(biāo)的值也一目了然。并且新浪股票在此期間內(nèi)的總成交量為210832200(million)。

圖18 成交量匯總數(shù)據(jù)圖

4 結(jié)論

本文借助R語(yǔ)言中抓取股票數(shù)據(jù)常用的兩個(gè)軟件包對(duì)新浪股票的各項(xiàng)內(nèi)容展開(kāi)分析。通過(guò)上述數(shù)據(jù)分析結(jié)果,從新浪股票K線(xiàn)圖可看出:從2018年3月下旬開(kāi)始,股票走勢(shì)整體出現(xiàn)下滑,直到2019年1月開(kāi)始股票走勢(shì)大致呈上升的趨勢(shì)。從收益率的密度函數(shù)圖來(lái)看,雖然圖象基本運(yùn)動(dòng)符合近似正態(tài)分布形式,不是非常嚴(yán)格的周期到周期的循環(huán)往復(fù),但它的基本運(yùn)動(dòng)形態(tài)是基于絕對(duì)價(jià)格的,而投資回報(bào)即股票收益率是基于相對(duì)價(jià)格的。所以理論上,在價(jià)格變化趨勢(shì)明顯的條件下,投資回報(bào)顯然不是完全隨機(jī)的,即股票收益率不服從正態(tài)分布。新浪股票數(shù)據(jù)這一期間所形成的密度函數(shù)圖象中明顯存在高峰厚尾現(xiàn)象,可預(yù)判收益率不服從正態(tài)分布。從JB檢驗(yàn)結(jié)果可看出,首先隨機(jī)誤差趨近于0,說(shuō)明樣本數(shù)據(jù)的隨機(jī)誤差影響較小,方差也趨近于0。JB值為35.9158,且P值遠(yuǎn)小于0.05,進(jìn)一步驗(yàn)證了收益率不服從正態(tài)分布這一結(jié)論。對(duì)新浪股票數(shù)據(jù)的成交量分析可知,2018年總成交量非常不穩(wěn)定,在幾個(gè)時(shí)間段出現(xiàn)“暴漲暴跌”的情況,但是自2019年開(kāi)始,股票成交量逐步趨于平緩,但研究的大多時(shí)間段呈下降趨勢(shì)。

本文基于R語(yǔ)言編程,實(shí)現(xiàn)了新浪股票的K線(xiàn)圖、收益率等技術(shù)分析,避免了復(fù)雜大量的計(jì)算過(guò)程,縮小了計(jì)算誤差,更清晰、準(zhǔn)確地反映新浪股票的大致走勢(shì),為股票市場(chǎng)的預(yù)判和風(fēng)險(xiǎn)評(píng)估提供了參考依據(jù)。但金融數(shù)據(jù)的分析不僅需要借助大數(shù)據(jù)分析軟件的技術(shù)支持,還要有對(duì)其他因素認(rèn)真觀察的能力,如需做大量的行業(yè)分析、公司分析等基本面分析。數(shù)據(jù)分析并不是一件容易的事,影響數(shù)據(jù)結(jié)果的因素有很多,一個(gè)好的數(shù)據(jù)分析師更應(yīng)從國(guó)家政策、市場(chǎng)結(jié)構(gòu)各項(xiàng)內(nèi)容上提高關(guān)注,這也是本人以后工作應(yīng)關(guān)注的地方。

猜你喜歡
正態(tài)線(xiàn)圖新浪
個(gè)體化預(yù)測(cè)結(jié)腸癌術(shù)后發(fā)生并發(fā)癥風(fēng)險(xiǎn)列線(xiàn)圖模型的建立
猴子雖小
讀者(2021年20期)2021-09-25 20:30:35
基于箱線(xiàn)圖的出廠水和管網(wǎng)水水質(zhì)分析
雙冪變換下正態(tài)線(xiàn)性回歸模型參數(shù)的假設(shè)檢驗(yàn)
新浪讀書(shū)排行榜
東山頭遺址采集石器線(xiàn)圖
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
基于正態(tài)變換的貸款組合定價(jià)模型構(gòu)建及實(shí)證
有關(guān)線(xiàn)圖兩個(gè)性質(zhì)的討論
达拉特旗| 九龙坡区| 武乡县| 灵寿县| 万山特区| 汝州市| 徐闻县| 拉萨市| 南通市| 威远县| 千阳县| 天镇县| 青岛市| 龙里县| 黔江区| 礼泉县| 天水市| 丰镇市| 安义县| 太仆寺旗| 遂平县| 新田县| 桦川县| 长白| 华容县| 南阳市| 广平县| 文山县| 肇东市| 应城市| 环江| 商丘市| 玛沁县| 莱州市| 惠水县| 镇巴县| 旬阳县| 墨竹工卡县| 永清县| 应用必备| 忻州市|