国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代下 對(duì)沖基金的數(shù)據(jù)挖掘技術(shù)探析

2016-11-09 18:12王彥博楊璇劉曦子
銀行家 2016年9期
關(guān)鍵詞:對(duì)沖神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘

王彥博 楊璇 劉曦子

2015年全球?qū)_基金表現(xiàn)

2015年,全球范圍內(nèi)對(duì)沖基金經(jīng)歷了2008年以來(lái)的第二次業(yè)績(jī)寒冬。根據(jù)對(duì)沖基金研究機(jī)構(gòu)HFR(Hedge Fund Research Inc.)公布的資料顯示,2015年四季度全球新成立對(duì)沖基金183家,較第三季度的269家下降32%,是2009年以來(lái)新增數(shù)量最少的季度。2015年全年累計(jì)新成立對(duì)沖基金968家,較上一年度下降7%。此外,諸多對(duì)沖基金在慘淡的業(yè)績(jī)面前紛紛清盤。數(shù)據(jù)顯示,2015年累計(jì)979家對(duì)沖基金清盤,較2014年864家的數(shù)據(jù)上漲13.3%,是自2009年1023家對(duì)沖基金清盤以來(lái)的又一波高峰。這波浪潮中,諸多國(guó)際大型對(duì)沖基金也未能幸免:全球20大對(duì)沖基金之一貝萊德宣布關(guān)閉旗下一個(gè)10億美元規(guī)模的宏觀對(duì)沖基金;文藝復(fù)興科技投資公司宣布清盤旗下一只量化對(duì)沖策略基金 ——復(fù)興機(jī)構(gòu)期貨基金(RIFF)。

然而,對(duì)沖基金數(shù)量的減少并沒有影響其總體規(guī)模沖上新高。根據(jù)HFR統(tǒng)計(jì)數(shù)據(jù)顯示,截至2015年底,全球?qū)_基金管理資產(chǎn)規(guī)模達(dá)2.9萬(wàn)億美元,較2014年增長(zhǎng)約1千億美元。

機(jī)構(gòu)數(shù)量的減少和資產(chǎn)管理規(guī)模的增長(zhǎng)再次印證了全球?qū)_基金行業(yè)“強(qiáng)者恒強(qiáng)”的現(xiàn)狀。雖然近年投資者逐漸增加了對(duì)中小型對(duì)沖基金的投入,但行業(yè)集中度居高不下的局面并未得到改善。2015年研究機(jī)構(gòu)Preqin在其發(fā)布的報(bào)告中將7617家對(duì)沖基金公司中管理資產(chǎn)規(guī)模在10億美元以上的統(tǒng)一劃入“10億美元俱樂部”。報(bào)告顯示,盡管“10億美元俱樂部”包含570只對(duì)沖基金,卻管理了對(duì)沖基金中92%的資產(chǎn)規(guī)模。而其余大部分的對(duì)沖基金合計(jì)管理規(guī)模只占8%。這意味著對(duì)沖基金行業(yè)中大多數(shù)資金集中在少數(shù)公司手中。

從投資策略來(lái)看,復(fù)合策略、股票多空策略、宏觀策略是2015年業(yè)績(jī)表現(xiàn)最好的三個(gè)策略,全年累計(jì)收益分別為3.62%、3.57%、2.27%。2014年表現(xiàn)“一枝獨(dú)秀”的CTA受累于大宗商品的暴跌,2015年累計(jì)收益僅1.28%,遠(yuǎn)低于去年同期的16.42%??赊D(zhuǎn)換套利和股票市場(chǎng)中性策略收益高于2014年,分別取得全年累計(jì)收益1.6%和0.09%,其余子策略的收益表現(xiàn)均低于2014年。

回顧2015年,造成全球?qū)_基金業(yè)績(jī)欠佳的主要原因包括以下幾點(diǎn),第一,市場(chǎng)因素:黃金、石油等大宗商品的暴跌拖累投資大宗商品的對(duì)沖基金和投資能源行業(yè)的對(duì)沖基金;希臘債務(wù)危機(jī)陰云不散,投資歐洲市場(chǎng)的對(duì)沖基金業(yè)績(jī)受到波及;中國(guó)股災(zāi)影響包括歐美股市、新興市場(chǎng)股市等在內(nèi)的全球股市。第二,客戶因素:HFR主席Kenneth Heinz指出,隨著客戶風(fēng)險(xiǎn)厭惡傾向不斷加強(qiáng),客戶對(duì)其資產(chǎn)波動(dòng)性的容忍程度也相應(yīng)下降,業(yè)績(jī)表現(xiàn)不佳的對(duì)沖基金面臨著強(qiáng)大的客戶贖回壓力。

基于數(shù)據(jù)挖掘的量化投資技術(shù)

作為對(duì)沖基金的重要手段,量化投資技術(shù)一直被大量應(yīng)用并不斷深化。1971年,電子工程師約翰·麥奎恩利用美國(guó)富國(guó)銀行的信托投資平臺(tái)建立起全球第一個(gè)定量投資系統(tǒng)。隨后,量化投資界的傳奇人物詹姆斯·西蒙斯創(chuàng)立了文藝復(fù)興科技公司,并運(yùn)用量化模型在公司成立后的20多年中為基金賺取了平均每年35.6%的收益率。然而,隨著計(jì)算機(jī)科學(xué)的進(jìn)步和大數(shù)據(jù)時(shí)代的到來(lái),全球數(shù)據(jù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),傳統(tǒng)的公司財(cái)務(wù)數(shù)據(jù)和市場(chǎng)行情數(shù)據(jù)已難以全面描繪市場(chǎng)狀況;同時(shí),數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)字、符號(hào)信息等結(jié)構(gòu)化數(shù)據(jù)形式逐漸向文本、圖像、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)形式轉(zhuǎn)變。因此,市場(chǎng)亟需更先進(jìn)的模型和算法來(lái)滿足對(duì)更大量級(jí)、更多類型的數(shù)據(jù)進(jìn)行處理,基于大數(shù)據(jù)量化策略的研究已然成為量化投資新的研究方向和熱門研究領(lǐng)域。

文本挖掘在量化投資中的應(yīng)用

主題投資作為股票市場(chǎng)上一種重要的投資策略,反映了投資者對(duì)市場(chǎng)上發(fā)生的熱點(diǎn)事件的解讀,也反映了不同市場(chǎng)參與者的心理博弈過程。傳統(tǒng)的量化分析對(duì)主題的把握主要依賴個(gè)股的財(cái)務(wù)數(shù)據(jù)(如EPS、PE、收盤價(jià)、開盤價(jià)、成交量等)和行業(yè)數(shù)據(jù)(如行業(yè)指數(shù)漲跌幅等)。然而,這些結(jié)構(gòu)化數(shù)據(jù)中所隱含的投資信息大部分已被挖掘,投資者亟需從更廣闊的非結(jié)構(gòu)化數(shù)據(jù)中探求市場(chǎng)規(guī)律。

文本挖掘是指從文本數(shù)據(jù)中抽取有價(jià)值的信息和知識(shí)的計(jì)算機(jī)處理技術(shù),是數(shù)據(jù)挖掘的一個(gè)分支。將文本挖掘應(yīng)用于量化投資的核心邏輯在于:第一,文本數(shù)據(jù)研究與相對(duì)成熟的數(shù)值型數(shù)據(jù)研究相比,更容易在新數(shù)據(jù)源中獲得超額收益;第二,財(cái)經(jīng)相關(guān)的網(wǎng)絡(luò)文本信息某種程度上反映了投資者的情緒和投資意向;第三,爆發(fā)式增長(zhǎng)的網(wǎng)絡(luò)文本數(shù)據(jù)在數(shù)量和時(shí)間維度上足夠構(gòu)建較為成熟的量化模型;第四,一個(gè)主題的異動(dòng)往往會(huì)帶來(lái)關(guān)于該主題大量持續(xù)的報(bào)道,甚至在該主題還未在市場(chǎng)上有所表現(xiàn)的時(shí)候,就已經(jīng)有大量的新聞報(bào)道產(chǎn)生,從而使與該熱點(diǎn)相關(guān)的新聞數(shù)量在某一時(shí)間段達(dá)到一個(gè)突發(fā)的高峰。通過對(duì)相關(guān)文本信息進(jìn)行分析挖掘,可以有效預(yù)測(cè)市場(chǎng)熱點(diǎn)和動(dòng)向,發(fā)掘主題投資機(jī)會(huì)。

互聯(lián)網(wǎng)財(cái)經(jīng)選股策略是基于文本挖掘技術(shù)的量化選股方式之一。通過爬取主流財(cái)經(jīng)媒體報(bào)道文章的文本信息,利用文本挖掘技術(shù)對(duì)熱點(diǎn)事件進(jìn)行深度挖掘,進(jìn)而完成對(duì)投資主題的預(yù)測(cè)?;ヂ?lián)網(wǎng)財(cái)經(jīng)選股策略總體框架分為“數(shù)據(jù)獲取”、“數(shù)據(jù)處理”以及“策略構(gòu)建”三部分:

數(shù)據(jù)獲取。引入“網(wǎng)絡(luò)爬蟲技術(shù)”,首先分析待批量爬取的主流財(cái)經(jīng)媒體網(wǎng)頁(yè)結(jié)構(gòu),主要關(guān)注網(wǎng)頁(yè)中需要特定爬取的相關(guān)結(jié)構(gòu)和內(nèi)容;其次,發(fā)現(xiàn)財(cái)經(jīng)媒體網(wǎng)站上待爬取信息的網(wǎng)頁(yè)URL相關(guān)規(guī)律,通過網(wǎng)絡(luò)爬蟲程序遍歷并提取所有待爬取財(cái)經(jīng)網(wǎng)頁(yè)中的薦股欄目信息,獲得各網(wǎng)站薦股數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,單機(jī)爬取的速度往往難以滿足大規(guī)模數(shù)據(jù)爬取需求,可以考慮引入Hadoop平臺(tái)技術(shù),實(shí)現(xiàn)分布式存儲(chǔ)與并行信息爬取策略。

數(shù)據(jù)處理。包括數(shù)據(jù)清洗和數(shù)據(jù)挖掘兩部分。數(shù)據(jù)清洗是篩選出所有網(wǎng)頁(yè)訪問正常且內(nèi)容完整有效的數(shù)據(jù)信息;數(shù)據(jù)挖掘是指針對(duì)處理后的文本信息,通過分析各網(wǎng)站的文本結(jié)構(gòu),并利用文本分詞、文本分類、文本聚類等技術(shù)進(jìn)行主題關(guān)鍵詞的挖掘和分析。

策略構(gòu)建。分析數(shù)據(jù)挖掘得到的規(guī)律,并制定相應(yīng)的交易策略。單個(gè)財(cái)經(jīng)頻道選股策略為:在每個(gè)交易日,根據(jù)文本挖掘的薦股信息,在推薦后的第一個(gè)交易日以開盤價(jià)買進(jìn)該個(gè)股;如果該股停牌,則不買入;持有期到期后以收盤價(jià)賣出該個(gè)股,如果個(gè)股在持有期末停牌則延遲賣出,直至可以賣出。多財(cái)經(jīng)頻道智能選股策略是在單財(cái)經(jīng)頻道的基礎(chǔ)上拓展了數(shù)據(jù)范圍,考慮了各個(gè)網(wǎng)站在過去一段時(shí)間內(nèi)單個(gè)策略下的表現(xiàn),優(yōu)先選取過去一段時(shí)間內(nèi)收益率超過某設(shè)定標(biāo)準(zhǔn)(如對(duì)比上證指數(shù))的前若干個(gè)網(wǎng)站,結(jié)合當(dāng)前交易日推薦個(gè)股構(gòu)成超配組合。

神經(jīng)網(wǎng)絡(luò)算法在量化投資中的應(yīng)用

神經(jīng)網(wǎng)絡(luò)算法是數(shù)據(jù)挖掘中的重要模型,它的產(chǎn)生得益于生理學(xué)和醫(yī)學(xué)對(duì)人腦的探索成果??茖W(xué)證實(shí):腦神經(jīng)系統(tǒng)具有豐富的層次結(jié)構(gòu),“神經(jīng)-中樞-大腦”的工作過程是一個(gè)不斷迭代、不斷抽象的過程。人工神經(jīng)網(wǎng)絡(luò)正是一種應(yīng)用類似于大腦神經(jīng)突觸連接結(jié)構(gòu)進(jìn)行信息處理的數(shù)據(jù)挖掘模型。

神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)(或稱神經(jīng)元)相互連接構(gòu)成,每個(gè)節(jié)點(diǎn)代表一種特定輸出函數(shù),也稱為激勵(lì)函數(shù),每?jī)蓚€(gè)節(jié)點(diǎn)間的連接代表一個(gè)對(duì)于通過該連接信號(hào)的加權(quán)值,即權(quán)重。神經(jīng)網(wǎng)絡(luò)的輸出則根據(jù)網(wǎng)絡(luò)的連接方式、權(quán)重值和激勵(lì)函數(shù)的不同而有所差異。常見的神經(jīng)網(wǎng)絡(luò)模型通常將節(jié)點(diǎn)分成三個(gè)層次:輸入層,輸出層和隱含層。輸入層即給定的模型輸入,輸出層即神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的結(jié)果,隱含層是神經(jīng)網(wǎng)絡(luò)內(nèi)部自動(dòng)運(yùn)算過程。

將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于量化投資分析的基本假設(shè)在于:市場(chǎng)存在著人類無(wú)法直接判斷但是計(jì)算機(jī)可以挖掘產(chǎn)生的規(guī)律和邏輯。與基于傳統(tǒng)統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)的方法論不同,神經(jīng)網(wǎng)絡(luò)作為一種數(shù)據(jù)挖掘模型技術(shù),并不需要投資者事先對(duì)邏輯進(jìn)行完整的預(yù)判,而是依賴于計(jì)算機(jī)通過輸入?yún)?shù)對(duì)輸出結(jié)果進(jìn)行學(xué)習(xí)。因此可以有機(jī)會(huì)打破人類固有的思維局限,從更高量級(jí)的數(shù)據(jù)中發(fā)掘隱藏規(guī)律。結(jié)合西蒙斯的“壁虎式”投資理論可知,投資時(shí)在短線內(nèi)是可以進(jìn)行方向性預(yù)測(cè)并捕捉到短期套利機(jī)會(huì)的。因此,基于神經(jīng)網(wǎng)絡(luò)的交易策略正是借助于該原理對(duì)大量的歷史交易數(shù)據(jù)進(jìn)行學(xué)習(xí),建立預(yù)測(cè)模型,從而在實(shí)際交易中捕捉到短期的交易機(jī)會(huì)。

以基于神經(jīng)網(wǎng)絡(luò)的高頻股價(jià)預(yù)測(cè)模型為例,其核心邏輯在于:市場(chǎng)上買賣雙方的交易行為決定了股票價(jià)格的形成和波動(dòng),通過基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)預(yù)測(cè)模型對(duì)高頻市場(chǎng)行情數(shù)據(jù)進(jìn)行分析和挖掘,對(duì)短期內(nèi)股指期貨的漲跌進(jìn)行預(yù)測(cè),然后根據(jù)預(yù)測(cè)結(jié)果確定股指期貨的買賣信號(hào)。預(yù)測(cè)模型的輸入是短期內(nèi)的股票價(jià)格數(shù)據(jù)、價(jià)格的變化范圍信息、買賣盤價(jià)格和委賣委買量數(shù)據(jù)等,預(yù)測(cè)模型的輸出是未來(lái)短期內(nèi)的漲跌方向。從實(shí)證結(jié)果來(lái)看,該模型將大量期貨歷史交易數(shù)據(jù)作為學(xué)習(xí)集,通過大量訓(xùn)練,對(duì)一秒鐘高頻下的股指期貨漲跌進(jìn)行預(yù)測(cè),并能在預(yù)測(cè)模型樣本外的測(cè)試數(shù)據(jù)樣本中達(dá)到73%的準(zhǔn)確率。據(jù)廣發(fā)證券應(yīng)用該模型后披露的數(shù)據(jù)顯示,自2013年初至2014年7月,累計(jì)收益率達(dá)到99.6%,年化收益率為77.6%,最大回撤為-5.86%。

值得一提的是,近年“深度學(xué)習(xí)”在人工智能上所取得的技術(shù)突破迅速引起金融行業(yè)的極大關(guān)注。目前已經(jīng)有行業(yè)研究者開始嘗試將深度學(xué)習(xí)應(yīng)用于量化投資以獲取超越傳統(tǒng)神經(jīng)網(wǎng)絡(luò)量化模型的收益。深度學(xué)習(xí)并不特指某一個(gè)算法,而是Sparse Coding、RBM、深信度網(wǎng)絡(luò)等技術(shù)方法的總稱。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型2~3層隱含層不同,深度學(xué)習(xí)模型的隱含層數(shù)可達(dá)8~9層,甚至更高。因此當(dāng)該思想被提出之初,海量的訓(xùn)練數(shù)據(jù)和很高的計(jì)算復(fù)雜度超出了當(dāng)時(shí)硬件的承受能力,但由于近年計(jì)算機(jī)硬件性能的提升,深度學(xué)習(xí)算法在準(zhǔn)確率方面的優(yōu)勢(shì)迅速凸顯,這也使得深度學(xué)習(xí)在量化投資領(lǐng)域的應(yīng)用前景越來(lái)越廣闊。

對(duì)沖基金資產(chǎn)配置建議

2015年,全球?qū)_基金行業(yè)陷入業(yè)績(jī)低谷,盡管管理資產(chǎn)規(guī)模仍呈上升趨勢(shì),但行業(yè)整體業(yè)績(jī)慘淡,諸多對(duì)沖基金面臨清盤。除了2015年大宗商品表現(xiàn)不佳、希臘債務(wù)危機(jī)反復(fù)、中國(guó)股災(zāi)波及全球等市場(chǎng)因素外,投資者風(fēng)險(xiǎn)厭惡傾向上升,對(duì)沖基金還面臨著巨大的贖回壓力。這些都給對(duì)沖基金的發(fā)展提出了嚴(yán)峻的挑戰(zhàn)。

然而,隨著量化技術(shù)的不斷發(fā)展,特別是大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)的迅猛發(fā)展,使得對(duì)沖基金用以研究、跟蹤市場(chǎng)的工具愈發(fā)強(qiáng)大。數(shù)據(jù)挖掘攜手對(duì)沖基金,將在大數(shù)據(jù)時(shí)代為量化投資帶來(lái)不斷創(chuàng)新能力。

對(duì)銀行投資顧問而言,建議在深化對(duì)市場(chǎng)把握的過程中,更多關(guān)注基金模型的底層基本原理,特別是數(shù)據(jù)挖掘的基本邏輯,更好地為客戶提供專業(yè)意見。從銀行資產(chǎn)配置工作實(shí)際來(lái)看,目前市場(chǎng)上已經(jīng)出現(xiàn)了多支公募基金與互聯(lián)網(wǎng)公司合作的大數(shù)據(jù)基金產(chǎn)品,如:廣發(fā)基金與百度合作的“中證百度百發(fā)策略100指數(shù)型基金”、南方基金與新浪合作的“大數(shù)據(jù)100指數(shù)型基金”等。該類產(chǎn)品類型涵蓋了指數(shù)型、股票型和混合型基金以及集合資產(chǎn)管理計(jì)劃。銀行應(yīng)進(jìn)一步拓寬視野,加強(qiáng)對(duì)國(guó)內(nèi)各大基金與互聯(lián)網(wǎng)公司合作推出的“大數(shù)據(jù)基金產(chǎn)品”予以關(guān)注,并考慮引進(jìn)其中優(yōu)秀產(chǎn)品,以期為客戶提供更為優(yōu)質(zhì)的資產(chǎn)配置服務(wù)。

(作者單位:中國(guó)民生銀行,對(duì)外經(jīng)貿(mào)大學(xué)信息學(xué)院)

猜你喜歡
對(duì)沖神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘
基于人工智能LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績(jī)預(yù)測(cè)
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)穩(wěn)定性預(yù)測(cè)
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測(cè)
數(shù)據(jù)挖掘綜述
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
一本面向中高級(jí)讀者的數(shù)據(jù)挖掘好書
阿拉善左旗| 陕西省| 屯昌县| 海淀区| 安龙县| 太康县| 澳门| 龙胜| 景宁| 金山区| 望城县| 玉溪市| 腾冲县| 威信县| 冷水江市| 那曲县| 阳西县| 平顶山市| 苍溪县| 西华县| 怀安县| 平武县| 宁化县| 武功县| 郧西县| 房产| 太康县| 西乌珠穆沁旗| 彰化市| 江门市| 新绛县| 嘉禾县| 门源| 涡阳县| 阿坝县| 承德县| 宝山区| 沂源县| 临汾市| 南郑县| 花垣县|