国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類分析的股票價(jià)格狀態(tài)和變化探究

2018-07-12 09:20陳金林
時(shí)代金融 2018年35期
關(guān)鍵詞:股票價(jià)格相似性聚類

陳金林 楊 林

(廣東外語(yǔ)外貿(mào)大學(xué)南國(guó)商學(xué)院,廣東 廣州 510545)

一、股票價(jià)格序列和聚類分析

股票價(jià)格序列是股票價(jià)格時(shí)間序列的簡(jiǎn)稱,指將股票在不同時(shí)間上的交易價(jià)格數(shù)值,按時(shí)間先后順序排列而形成的序列。構(gòu)成要素:時(shí)間,股票價(jià)格數(shù)值。

根據(jù)實(shí)際的股票交易價(jià)格成交技術(shù)和計(jì)時(shí)技術(shù),在股票交易時(shí)間內(nèi)可以找到一個(gè)股票交易價(jià)格形成所需要的最小的時(shí)間單位,這個(gè)最小的時(shí)間單位稱為單元時(shí)間,任意有限時(shí)間是單元時(shí)間的整數(shù)倍。為了更好地分析股票價(jià)格序列,結(jié)合股票價(jià)格和時(shí)間的聯(lián)合分布,即任意給出由較多的單元時(shí)間組成的時(shí)點(diǎn)的集合,考慮股票價(jià)格序列的聯(lián)合分布。該分布為有限維數(shù)聯(lián)合分布。

利用大數(shù)據(jù)挖掘技術(shù)的聚類分析對(duì)股票價(jià)格序列分析時(shí),必須對(duì)聚類分析做適當(dāng)?shù)男拚员悴捎镁垲惙治?。通常來講,聚類分析是按照某種相似程度度量方法將數(shù)據(jù)分成互不相同的分組(集合),每一個(gè)分組中的數(shù)據(jù)相近,不同分組之間的數(shù)據(jù)差異較大。即通過聚類后,每一聚類內(nèi)部的相似性很高,而各聚類之間的相似性很低。

由于股票價(jià)格序列是時(shí)間序列,在進(jìn)行聚類分析時(shí)只能按照時(shí)間先后順序進(jìn)行聚類。從聚類分析的角度看,把價(jià)格序列分成了四類各不相同的小組。每個(gè)小組由若干個(gè)單位時(shí)間內(nèi)的價(jià)格數(shù)據(jù)組成,這些數(shù)據(jù)的相似性很高,相鄰小組之間的價(jià)格數(shù)據(jù)相似性很低。

二、股票價(jià)格狀態(tài)和變化理論探討

本文在分析數(shù)據(jù)時(shí),沒有使用非結(jié)構(gòu)化數(shù)據(jù),運(yùn)用的算法力求適應(yīng)結(jié)構(gòu)化數(shù)據(jù),因此計(jì)算后得到的數(shù)據(jù)均為標(biāo)稱數(shù)據(jù)。

對(duì)股票價(jià)格流數(shù)據(jù)采用流計(jì)算的方法實(shí)時(shí)地進(jìn)行處理。滬深交易所的計(jì)算機(jī)對(duì)買賣雙方的報(bào)單進(jìn)行撮合,每次成交的價(jià)格等數(shù)據(jù)以流的方式進(jìn)入計(jì)算機(jī)中的集群,集群中的處理單元對(duì)實(shí)時(shí)股票成交價(jià)格等數(shù)據(jù)進(jìn)行提取、過濾和分析等操作,最后得到每次成交的價(jià)格等數(shù)據(jù),供使用者聚集、利用。

通常股票價(jià)格序列不具備明確的狀態(tài)和變化的屬性,可能是由于數(shù)據(jù)非常大,可能是股票價(jià)格的隨機(jī)性,也可能是實(shí)時(shí)成交價(jià)格沒有參照,需要使用動(dòng)態(tài)模型對(duì)實(shí)時(shí)數(shù)據(jù)的數(shù)量歸約,同時(shí)對(duì)歷史數(shù)據(jù)也進(jìn)行數(shù)量歸約。再對(duì)數(shù)量歸約后的數(shù)據(jù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)被變換成統(tǒng)一適合研究的形式。數(shù)量歸約和數(shù)據(jù)轉(zhuǎn)換沒有前后順序要求,視投資業(yè)務(wù)實(shí)際需要的具體情況而定??捎锰娲?、較小的數(shù)據(jù)表示形式替換原數(shù)據(jù),但是要接近于保持原數(shù)據(jù)的完整性。

對(duì)股票價(jià)格序列按照單位時(shí)間分組,每一組為五個(gè)觀測(cè)值,經(jīng)數(shù)量歸約和數(shù)據(jù)轉(zhuǎn)換后,五個(gè)屬性可以在數(shù)據(jù)矩陣和相似矩陣上進(jìn)行研究。之所以選擇相似性矩陣,與我們度量數(shù)據(jù)相似性和相異性的鄰近度的方法有關(guān),多個(gè)對(duì)象兩兩之間的相似度的算法結(jié)束后,所有的相似度通常用一個(gè)對(duì)稱矩陣表示。一般而言,價(jià)格序列矩陣是一個(gè)非負(fù)的數(shù)值,對(duì)象之間彼此高度相近或者“接近”時(shí),其值接近1。特別當(dāng)?shù)扔?時(shí),即一個(gè)對(duì)象與自己的相似度非常大,完全相同,差別為0。對(duì)象越不同,該值越小,其值接近0,說明對(duì)象彼此相異,差別非常大。

數(shù)據(jù)矩陣由兩種實(shí)體組成,即:行代表單位時(shí)間的價(jià)格這一對(duì)象,列代表這一對(duì)象的屬性。相似矩陣,只包含一類實(shí)體,表示多個(gè)單位時(shí)間里同一只股票的若干個(gè)價(jià)格兩兩的相似性度量。一般把數(shù)據(jù)矩陣轉(zhuǎn)化為相似矩陣,分析將在相似矩陣上運(yùn)行。

三、股票價(jià)格狀態(tài)和變化實(shí)證分析

(一)股票價(jià)格狀態(tài)實(shí)證分析

1.股票價(jià)格狀態(tài)的內(nèi)涵。股票價(jià)格狀態(tài),是指股票的價(jià)格通過聚類算法來度量,相似度在相對(duì)較長(zhǎng)時(shí)間內(nèi)持續(xù)保持較高的近似不變的狀況,稱之為價(jià)格狀態(tài)相似,相似度在一定值以下,稱之為價(jià)格狀態(tài)相異。

像這樣同一只股票連續(xù)較長(zhǎng)時(shí)間內(nèi),價(jià)格相似性高的時(shí)間序列價(jià)格數(shù)據(jù)排列在一起時(shí),表明價(jià)格狀態(tài)相似,股票價(jià)格具有狀態(tài)的性質(zhì)。

2.股票價(jià)格狀態(tài)的實(shí)證分析。以上交所某股票為例,選取2018年7月24日——10月26日62個(gè)交易日的一組股票價(jià)格量:開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)和擾動(dòng)項(xiàng)做該股票的價(jià)格狀態(tài)實(shí)證分析。

先對(duì)股票價(jià)格量進(jìn)行數(shù)據(jù)規(guī)約和轉(zhuǎn)換,然后進(jìn)行相似度計(jì)算。實(shí)證發(fā)現(xiàn):

7月24日-8月8日、8月28日-9月12日、9月27日-10月16日在這三個(gè)時(shí)間段,相似度較高;8月9日-8月27日、9月13日-9月26日、10月17日-10月26日,這三個(gè)時(shí)間段的股價(jià)的相似較高。

但是,7月24日-8月8日和8月9日-8月27日這兩個(gè)連續(xù)時(shí)間段內(nèi)的相似度雖然較高,但是有一個(gè)由大變小再變大的過程。相同現(xiàn)象的時(shí)間段還有8月28日-9月12日和9月13日-9月26日、9月27日-10月16日和10月17日-10月26日。

說明股價(jià)有保持狀態(tài)不變的性質(zhì),也有變化的特點(diǎn)。

(二)股票價(jià)格變化實(shí)證分析

1.股票價(jià)格變化的內(nèi)涵。股票價(jià)格變化,是指股票價(jià)格通過聚類算法來度量,相似度在相對(duì)較短時(shí)間內(nèi)由較高值變成較低值,然后又變成較高值的情形。這種由較高相似度變成較低相似度或者由較低相似度變成較高相似度的過程,稱之為股票價(jià)格變化相異。

2.股票價(jià)格變化的實(shí)證分析。利用相同的數(shù)據(jù),先對(duì)價(jià)格量進(jìn)行數(shù)據(jù)規(guī)約和轉(zhuǎn)換,然后進(jìn)行相似度計(jì)算。

在7月24日-8月8日和8月9日-8月27在這兩個(gè)連續(xù)的時(shí)間段內(nèi),價(jià)格相似度由高變低,然后又變高,表明價(jià)格狀態(tài)被破壞,說明價(jià)格發(fā)生了變化,和股票市場(chǎng)的實(shí)際情況相吻合。

股價(jià)開始處于狀態(tài)相似中,但是在緊接下來的單位時(shí)間里,相似度由較高變小,表明此時(shí)的價(jià)格數(shù)據(jù)與先前狀態(tài)中的數(shù)據(jù)相異,即認(rèn)為股票價(jià)格變化相異,股票價(jià)格具有變化的性質(zhì)。

緊接著,相似度又變大,表明股市行情將發(fā)生改變,價(jià)格將往新的狀態(tài)發(fā)展。價(jià)格發(fā)生短暫變化后,股市行情將持續(xù),價(jià)格將保持具有狀態(tài)的性質(zhì)。股價(jià)新狀態(tài)的出現(xiàn)是以相似度相異的出現(xiàn)為前提,以價(jià)格的變化為結(jié)果。

四、結(jié)論

(一)價(jià)格狀態(tài)和變化的異同

從上面的分析中,可以得知股票價(jià)格既有狀態(tài)的性質(zhì),又有變化的性質(zhì)。價(jià)格狀態(tài)和價(jià)格變化既是統(tǒng)一的,又是對(duì)立的。價(jià)格序列之間的狀態(tài)既可能相似,又可能相異;它們的變化既可能相似,也可能相異。實(shí)踐證明,如果價(jià)格狀態(tài)相似,價(jià)格變化將受到價(jià)格狀態(tài)的約束,但是并不能保證價(jià)格變化相似。如果價(jià)格狀態(tài)相異,價(jià)格變化既可能相異,也可能相似。

(二)待解決的問題

本文在分析時(shí)采用大數(shù)據(jù)聚類算法的技術(shù),根據(jù)相似性,對(duì)價(jià)格序列聚類,確定價(jià)格的狀態(tài);根據(jù)鄰近的相似度,確定價(jià)格的變化。實(shí)際操作中,如何確定股票價(jià)格狀態(tài)和變化的情況遠(yuǎn)比理論分析要復(fù)雜得多。如數(shù)量歸約采用回歸技術(shù)的話,就會(huì)涉及傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)嚴(yán)格的條件限制,雖然推理和計(jì)算嚴(yán)謹(jǐn),但是也會(huì)使原始數(shù)據(jù)丟失很多有用的信息。度量數(shù)據(jù)的相似性和相異性時(shí),相似度計(jì)算方法非常多。由于數(shù)據(jù)的平均值是動(dòng)態(tài)的,計(jì)算出來的相似度如果大于臨界值,相似的效果很明顯。當(dāng)相異度用相似度的函數(shù)表示時(shí),度量相異度的效果不理想??偟膩碇v,在技術(shù)和方法上需要解決的問題很多。

猜你喜歡
股票價(jià)格相似性聚類
一類上三角算子矩陣的相似性與酉相似性
基于GARCH族模型的重慶啤酒股票價(jià)格波動(dòng)研究
淺析當(dāng)代中西方繪畫的相似性
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
低滲透黏土中氯離子彌散作用離心模擬相似性
論股票價(jià)格準(zhǔn)確性的社會(huì)效益
我國(guó)股票價(jià)格指數(shù)與“克強(qiáng)指數(shù)”的關(guān)系研究
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
基于多元回歸與技術(shù)分析的組合股票價(jià)格預(yù)測(cè)