吳俊傳 唐振鵬 杜曉旭 陳凱杰
(福州大學(xué)經(jīng)濟(jì)與管理學(xué)院,福州 350108)
基于金融物理學(xué)中著名的對數(shù)周期冪律模型(log-periodic power law model,LPPL)來預(yù)警2015年6月份中國上證綜合指數(shù)、創(chuàng)業(yè)板指數(shù)的崩盤.鑒于已有采用LPPL模型預(yù)警市場崩盤的研究均只考慮市場歷史交易數(shù)據(jù).本文將投資者情緒因素納入到LPPL模型建模過程,以改進(jìn)LPPL模型的預(yù)警效果.采用文本挖掘技術(shù)結(jié)合語義分析方法對抓取的財經(jīng)媒體的股評報道進(jìn)行詞頻統(tǒng)計,以構(gòu)建媒體情緒指數(shù).進(jìn)一步修改LPPL模型中的崩潰概率函數(shù)表達(dá)式,將其表示為關(guān)于歷史交易數(shù)據(jù)及媒體情緒的函數(shù),構(gòu)建LPPL-MS組合模型預(yù)警股市崩盤.實(shí)證結(jié)果表明,本文所構(gòu)建的LPPL-MS組合模型相比LPPL模型具有更高的預(yù)警精度,其預(yù)測的大盤見頂?shù)呐R界時點(diǎn)與上證指數(shù)、創(chuàng)業(yè)板指數(shù)真實(shí)的見頂時點(diǎn)更為接近,并且其擬合結(jié)果通過了相關(guān)檢驗(yàn).
資本市場中投資者之間的擁擠交易行為極易促成資產(chǎn)價格泡沫的形成,并且其泡沫迅速膨脹過程當(dāng)中呈現(xiàn)出高度的非線性、自組織等復(fù)雜特性.Sornette等[1]物理學(xué)家提出對數(shù)周期冪律模型(log-periodic power law model,LPPL)來刻畫資本市場處于泡沫階段的運(yùn)行規(guī)律,將地震預(yù)測模型成功地運(yùn)用到資本市場泡沫崩潰的預(yù)測.股市崩盤使市場參與者蒙受巨額損失,將風(fēng)險輸出到相應(yīng)上市公司.此外,股市崩潰往往伴隨著系統(tǒng)性風(fēng)險,股市系統(tǒng)性風(fēng)險的頻繁爆發(fā)極大地危害資本市場的平穩(wěn)運(yùn)行,弱化資本市場的吸引力及競爭力,降低各類投資主體,尤其是境外投資者的入市積極性,嚴(yán)重削弱資本市場的融資及資源優(yōu)化配置等功能的進(jìn)一步發(fā)揮,并最終擾亂市場經(jīng)濟(jì)秩序,對中國經(jīng)濟(jì)發(fā)展的危害不言而喻.股票市場作為資本市場最重要的組成部分之一,對一國經(jīng)濟(jì)發(fā)展的重要性十分明顯,提前預(yù)警并及時管控其系統(tǒng)性風(fēng)險,對維護(hù)中國經(jīng)濟(jì)、金融穩(wěn)定發(fā)展大局具有十分重要的意義.
長期以來,諸如隨機(jī)漫步 (random walk)[2]、有效市場假說(efficient markets hypothesis,EMH)[3]等理論均認(rèn)為股票價格序列之間不存在長記憶效應(yīng),未來的股價無法提前預(yù)測.然而,大量研究表明股票價格序列并非滿足隨機(jī)游走的假設(shè),股票價格劇烈波動的背后存在可預(yù)測成分[4].股市瘋狂暴漲、形成泡沫,并伴隨泡沫破裂的現(xiàn)象時有發(fā)生[5].自 Sornette等[1]學(xué)者以來,越來越多的研究借鑒統(tǒng)計物理學(xué)的方法,利用對數(shù)周期修正的臨界點(diǎn)來識別股市泡沫.該方法后來被稱為JLS(Johansen-Ledoit-Sornette)模型或?qū)?shù)周期冪律奇異性模型(LPPL).該模型認(rèn)為泡沫可以從市場的自然運(yùn)作中本質(zhì)上產(chǎn)生,類似于其他統(tǒng)計物理復(fù)雜系統(tǒng),金融資產(chǎn)也具備自組織臨界特性,自組織即指復(fù)雜系統(tǒng)[6]某一狀態(tài)的形成主要由系統(tǒng)內(nèi)部不同組成部分互相作用所驅(qū)使,而并非由其他外界因素主導(dǎo);臨界性是指復(fù)雜系統(tǒng)當(dāng)前處于極其敏感的特殊狀態(tài),某一微小的局部變化即可引致整個系統(tǒng)的突變.自組織臨界性可以解釋諸如日輝耀斑、地震、泥石流、山體滑坡、雪崩、物種滅絕及金融市場中的資產(chǎn)價格崩潰現(xiàn)象[7,8].LPPL模型認(rèn)為由于市場上交易者同一時間段互相模仿,并通過正反饋機(jī)制不斷強(qiáng)化,致使資產(chǎn)價格在市場的自然運(yùn)作過程當(dāng)中逐漸產(chǎn)生泡沫,并最終崩潰.潘娜等[9]和周煒星[10]認(rèn)為LPPL模型具備兩個顯著特征:一是對數(shù)周期性振蕩,在線性尺度下,越接近臨界點(diǎn),振蕩頻率越快,而在對數(shù)尺度下,振蕩頻率為常數(shù);二是冪律增長,即價格的增長率并非常數(shù),而是單調(diào)遞增.
金融資產(chǎn)價格泡沫在趨近崩潰邊緣時,呈現(xiàn)出對數(shù)周期冪律振蕩特性.因此,采用LPPL模型可有效識別金融市場是否處于泡沫狀態(tài),并對大盤見頂,泡沫崩潰時點(diǎn)進(jìn)行提前預(yù)警.Sornette和Johansen[11]使用了20世紀(jì)兩次最大的歷史崩潰,即1929年10月和1987年10月的崩潰,并表明該方法通過分析泡沫發(fā)生前8年間隔內(nèi)的股指走勢可有效識別這兩次崩潰.Sornette和Johansen[12]提出了一個簡單的股票市場交易員等級模型,其研究結(jié)果表明,不管是模型中處于最高等級的國家層面,還是處于次高級的國家內(nèi)部的銀行等金融機(jī)構(gòu),其交易行為均表現(xiàn)出明顯的羊群效應(yīng),這種不同層級的相互模仿足以使股票價格產(chǎn)生對數(shù)周期冪律振蕩,并最終引發(fā)市場的崩潰.Sornette和Zhou[13]提出了一個系統(tǒng)的算法預(yù)先檢測到道瓊斯工業(yè)平均指數(shù)(DJIA)和香港恒生綜合指數(shù)(HSI)泡沫的崩潰.Sornette等[14]利用LPPL方法分析了 2006—2008 年石油價格的上漲情況,并證明了石油價格的演變過程也呈現(xiàn)出類似泡沫的狀態(tài).Kyriazis等[15]采用LPPL方法成功的預(yù)測到比特幣、以太坊等加密貨幣2013年、2017年的泡沫崩潰.Omer[16]詳細(xì)梳理了LPPL模型用于預(yù)警金融市場崩潰的成功案例.Sirca和Omladic[17]成功地運(yùn)用LPPL模型用于預(yù)測全球33個主流股票市場泡沫的崩潰.Filimonov和Sornette[18]提出了一種改進(jìn)的 LPPL公式,將其從 3 個線性參數(shù)和 4 個非線性參數(shù)的函數(shù)轉(zhuǎn)化為 4 個線性參數(shù)和 3 個非線性參數(shù),實(shí)證結(jié)果表明,這種轉(zhuǎn)換顯著降低了擬合過程的復(fù)雜性,并提高了其穩(wěn)定性.國內(nèi)學(xué)者在這方面亦展開了廣泛的研究.Jiang等[19]利用LPPL模型檢測了2005年5月至2009年7月期間中國股市2個重要指數(shù)—上證綜合指數(shù)和深證成分指數(shù)的2個泡沫和隨后的市場崩潰,并成功地預(yù)測了2個指數(shù)的崩潰.Yan等[20]利用 LPPL模型,開發(fā)了一種基于先進(jìn)模式識別方法的預(yù)警指數(shù)用于探測市場泡沫,并對市場崩潰和反彈進(jìn)行預(yù)測.在 10 個主要的全球股票市場上取得了較好的效果.李東[21]針對LPPL模型提出了基于網(wǎng)格的Nelder-Mead Simplex預(yù)搜索方法優(yōu)化LPPL模型的估計參數(shù),并對恒生指數(shù)的泡沫崩潰進(jìn)行提前預(yù)警,取得了較好的效果.周偉和何建敏[22]采用LPPL模型成功識別到后金融危機(jī)時代不同類型的金屬期貨價格的集體泡沫,做出了歸因分析,并驗(yàn)證了其結(jié)論.李斯嘉等[23]借鑒金融物理學(xué)方法,分析上證綜指和深證成指的崩盤前后動力學(xué)特征,采用LPPL模型分別預(yù)測2007年、2015年上證綜指、深證成指的崩盤,發(fā)現(xiàn)股市崩盤的特征符合G-R規(guī)律與Omori定律.李倫一和張翔[24]使用LPPL模型對中國房地產(chǎn)市場交易價格泡沫進(jìn)行測度.文章基于2010年6月至2017年11月中國100個主要城市的房地產(chǎn)交易數(shù)據(jù)對各城市房地產(chǎn)價格泡沫進(jìn)行識別.研究結(jié)果表明,LPPL模型能夠有效甄別各城市房地產(chǎn)價格正向泡沫、反向泡沫.陳衛(wèi)華和蔡文靖[25]運(yùn)用改進(jìn)的LPPL參數(shù)估計方法預(yù)測2015年上證和創(chuàng)業(yè)板指數(shù)的崩盤,并對其進(jìn)行Lomb譜分析和O-U過程檢驗(yàn),取得了穩(wěn)健的效果.趙磊和劉慶[26]采用LPPL模型擬合比特幣價格,結(jié)果發(fā)現(xiàn),比特幣價格呈現(xiàn)出LPPL模型中所隱含的超指數(shù)膨脹、對數(shù)周期冪律振蕩特性,并預(yù)測比特幣價格可能在2020年下半年出現(xiàn)泡沫.
縱觀已有文獻(xiàn),LPPL模型在預(yù)警金融資產(chǎn)泡沫方面已經(jīng)取得了豐碩的研究成果,然而,該模型并未將金融資產(chǎn)交易價格以外的因素,諸如金融資產(chǎn)價格基本面、政策層面及市場情緒等因素納入建模過程.為此,本文嘗試將市場情緒層面的因素納入LPPL模型建模過程,對改進(jìn)LPPL模型的泡沫預(yù)警效果.
隨著20世紀(jì)八九十年代金融市場上一系列金融異象,如股票溢價之謎、股價過度波動之謎、股價長期反轉(zhuǎn)效應(yīng)等,被逐漸揭示.行為金融理論(behavioral finance)借助行為科學(xué)、心理學(xué)的研究成果,能有效解釋這類金融異象.行為金融理論認(rèn)為市場上交易者并非完全理性,其交易決策會受到各類心里因素,如投資者情緒等非市場因素影響[27].國內(nèi)外大量實(shí)證研究表明,投資者情緒在股票價格的決定中起著重要的作用.Baker和Wurgler[28,29]將投資者情緒定義為對未來現(xiàn)金流和投資風(fēng)險的信念,而這些信念并不是由基本面決定的.他們的研究結(jié)果表明,投資者情緒會影響股票市場的回報,即積極情緒對股價具有正面影響,消極情緒對股價具有負(fù)面影響,并且隨著投資者意識到情緒與基本面的偏離時,這種影響在接下來的交易日會發(fā)生逆轉(zhuǎn).García[30]的研究表明,投資者情緒對道瓊斯工業(yè)平均指數(shù)的短期走勢的影響符合上述發(fā)現(xiàn).新聞媒體作為投資者獲取重要信息的窗口,其對股票市場信息的報道對投資者指定交易決策具有重要影響.媒體報道通過對股票市場的表現(xiàn)狀況做出評判及預(yù)測,會直接誘導(dǎo)投資者未來預(yù)期,影響投資者情緒,進(jìn)而影響市場未來走勢[31,32].Solomon[33]的研究發(fā)現(xiàn),比起負(fù)面報道,媒體更熱衷于正面報道,即新聞媒體的報道內(nèi)容往往摻雜著媒體商主觀意見,并非完全基于市場上已有的客觀事實(shí).Nardo等[34]通過綜合采用文本挖掘、情感分析及機(jī)器學(xué)習(xí)技術(shù)基于大量互聯(lián)網(wǎng)新聞報道預(yù)測未來股票市場走勢,發(fā)現(xiàn)互聯(lián)網(wǎng)新聞報道有助于預(yù)測市場未來走勢,然而其實(shí)際回報很少超過5%.Fisher和Statman[35]的研究顯示個人投資者的情緒受新聞媒體撰稿人的情緒影響較為顯著,二者相關(guān)性較強(qiáng),并且投資者的情緒與未來股市收益率負(fù)相關(guān).國內(nèi)學(xué)者方面,武佳薇等[36]基于前景理論框架,考慮投資者非理行預(yù)期因素,構(gòu)建投資組合決策模型,其采用某券商2007年至2009年近177萬個人股票賬戶交易數(shù)據(jù)進(jìn)行實(shí)證分析,實(shí)證結(jié)果表明,投資者情緒與處置效用具有負(fù)相關(guān)關(guān)系.李合龍和馮春娥[37]采用EEMD分解技術(shù)提取投資者情緒及股指價格在不同時間尺度下的波動特征,研究結(jié)果發(fā)現(xiàn),投資者情緒與股指價格序列在不同時間尺度下呈現(xiàn)出不同的波動關(guān)系.由于中國股票市場中,散戶投資者占據(jù)了絕大部分比例,其活躍程度遠(yuǎn)超機(jī)構(gòu)投資者,截止2020年8月底,中國股市中,自然人投資者數(shù)目達(dá)到1.72億,而非自然人投資者數(shù)目僅為40.28萬(數(shù)據(jù)來源于中國證券登記結(jié)算有限責(zé)任公司).相比機(jī)構(gòu)等專業(yè)投資者,廣大散戶,尤其是剛?cè)胧械男鹿擅?其專業(yè)知識及實(shí)操經(jīng)驗(yàn)較為缺乏,其對市場運(yùn)行狀況的評價較依賴于各類新聞媒體的股評觀點(diǎn).隨著近些年,互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)步入 Web 3.0 時代,諸如微博、論壇等各種新興媒體的崛起,投資者可輕而易舉地從互聯(lián)網(wǎng)上獲取各類海量并充斥著強(qiáng)烈情感色彩的股評文本信息.游家興和吳靜[38]通過選取2004年至2010年間國內(nèi)8家財經(jīng)報紙新聞,運(yùn)用文本分析方法綜合報道基調(diào)、曝光程度及關(guān)注水平三個維度信息構(gòu)建媒體情緒指數(shù),發(fā)現(xiàn)新聞媒體情緒能夠顯著引致股價波動.Wu等[39]從新浪財經(jīng)網(wǎng)站抓取股評短文,采用SVM訓(xùn)練媒體情緒,實(shí)證結(jié)果表明,媒體股評情緒與股價未來走勢具有顯著相關(guān)關(guān)系,并且其在成長股中表現(xiàn)尤為明顯.戴德寶等[40]通過抓取東方財富網(wǎng)絡(luò)論壇文本結(jié)合情感詞典分析方法生成投資者情緒序列數(shù)據(jù),并采用SVM學(xué)習(xí)機(jī)將生成的情緒指數(shù)納入訓(xùn)練過程,其實(shí)證結(jié)果表明,相比基準(zhǔn)模型,考慮情緒指數(shù)的SVM學(xué)習(xí)器具有更高的預(yù)測精度.由于每日均有海量的新聞報道產(chǎn)生,投資者受限個人有限的注意力,無法逐一對每日新聞報道內(nèi)容進(jìn)行細(xì)致閱讀[41],作為新聞報道內(nèi)容的凝練與總結(jié),新聞標(biāo)題可迅速吸引讀者的注意力,甚至有媒體為了博取投資者的關(guān)注,故意為媒體報道冠上夸張的標(biāo)題[42].Huang等[43]研究發(fā)現(xiàn)企業(yè)管理層可以充分利用投資者的有限注意力,在新聞標(biāo)題中嵌入更多積極信息,以煽動投資者的樂觀情緒.由上可得,采用文本挖掘技術(shù)剖析新聞媒體評論稿標(biāo)題可提取媒體情緒,進(jìn)而為下文分析媒體情緒對股市未來走勢的影響作鋪墊.
綜上,關(guān)于LPPL模型用于預(yù)警股市崩盤方面已經(jīng)取得了豐碩成果,然而已有研究未將交易歷史數(shù)據(jù)以外的因素納入建模過程.此外,現(xiàn)有研究均表明投資者情緒可在一定程度上解釋未來股價走勢的變動.本文嘗試將投資者情緒納入LPPL建模過程.以改進(jìn)LPPL模型股市崩潰預(yù)警效果.本文將從以下幾個方面開展研究工作:首先,采用文本挖掘技術(shù)結(jié)合情感詞典構(gòu)建媒體情緒指數(shù);其次,對現(xiàn)有LPPL模型進(jìn)行改進(jìn),將媒體情緒指數(shù)納入建模過程;最后,通過實(shí)證數(shù)據(jù)檢驗(yàn)改進(jìn)模型與 基準(zhǔn)模型的預(yù)測效果.
2.1.1 中文金融情感詞典介紹
本文主要基于Sentiment等[44]構(gòu)建的中文金融詞典對獲取的媒體評論文本進(jìn)行情感標(biāo)注:首先,采用知網(wǎng)HOWNET、大連理工大學(xué)DLUTSD及臺灣大學(xué)NTUSD作為基礎(chǔ)詞典;然后,使用在線路演紀(jì)要,業(yè)績說明電話會議紀(jì)要,IPO招股說明書及公司年報構(gòu)建基礎(chǔ)語料庫;最后,基于算法和人工刪選,使用多階段剔除法來構(gòu)建中文金融情感詞典CFSD.具體步驟如下.
步驟1 通過合并HOWNET,DLUTSD和NTUSD中的肯定和否定術(shù)語并刪除重復(fù)項(xiàng),創(chuàng)建基礎(chǔ)情感詞典.
步驟2 收集1411個在線路演紀(jì)要,7138個電話會議紀(jì)要,2043個IPO招股說明書和29737份年度財務(wù)報告.運(yùn)用 jieba分詞包(Python分詞工具)用于分割這些文檔以創(chuàng)建基本語料庫.
步驟3 根據(jù)步驟1中創(chuàng)建的基礎(chǔ)情感詞典,計算基本語料庫中每個積極詞和消極詞的詞頻.排除頻率為零的詞.在創(chuàng)建基本的中國金融情感詞典(CFSD0.0)之前,將與財務(wù)文檔無關(guān)的術(shù)語手動排除.
步驟4 CFSD 0.0中的所有術(shù)語均來自HOWNET,DLUTSD和NTUSD.由于這3個詞典在財務(wù)中不包括一些常用的否定詞和肯定詞,因此手動添加了100個常用的財務(wù)否定詞和100個肯定詞以生成字典CFSD 0.1.
步驟5 Gensim(Python軟件包)用于將基本語料庫轉(zhuǎn)換為單詞向量模型.單詞向量模型用于找出CFSD 0.1中每個術(shù)語的前50個同義詞.在手動刪除與財務(wù)、金融無關(guān)的所有同義詞之后,創(chuàng)建CFSD 0.2.
步驟6 將CFSD 0.0,CFSD 0.1和CFSD 0.2合并以刪除重復(fù)項(xiàng)以獲得CFSD.CFSD中有1488個否定詞和1107個肯定詞.
2.1.2 媒體情緒指數(shù)構(gòu)建
利用前述構(gòu)建的CFSD詞典對媒體評論進(jìn)行情感標(biāo)注,在情感標(biāo)注過程中,對詞匯所表達(dá)的情感強(qiáng)度不作進(jìn)一步區(qū)分,僅通過統(tǒng)計詞匯出現(xiàn)的次數(shù)的高低來描述情感得分.每一自然日出現(xiàn)積極、消極情緒得分的表達(dá)式如(1)式所示:
式中,kPos,Neg分別表示積極、負(fù)面情緒,Sentit,k為第t個自然日的媒體股評文章標(biāo)題中情緒類型k的得分,mk為隸屬于情緒類型k的詞匯出現(xiàn)的次數(shù),nt,j為第t個自然日股評文章標(biāo)題中第j個詞匯出現(xiàn)的次數(shù).
由于每一天的股評標(biāo)題里可能同時包含積極詞匯、消極詞匯,為了綜合評價某一天的情緒值,本文參考王曉丹等[45]的處理方法,得到綜合的媒體情緒指數(shù),其表達(dá)式為
式中,post表示第t天的積極情感得分,negt表示第t天的消極情感得分.當(dāng)積極情感得分大于消極情感得分時,判定相互抵消后的綜合情緒值大于0,表明情緒偏樂觀;反之,當(dāng)積極情感得分小于消極情感得分時,綜合情緒值小于0,表明情緒偏悲觀.
2.2.1 LPPL模型介紹
Sornette等[1]認(rèn)為金融市場具有典型的復(fù)雜系統(tǒng)的特性.發(fā)生在復(fù)雜系統(tǒng)中的極端事件往往是由于系統(tǒng)內(nèi)部相互作用、自組織等自然演化的結(jié)果,并非由外部沖擊驅(qū)使.Johansen 和Sornette[2]認(rèn)為金融市場上由于投資者之間的羊群效應(yīng)及正反饋機(jī)制造成的資產(chǎn)價格泡沫的膨脹與破裂可由LPPL模型進(jìn)行刻畫.LPPL模型具有如下特性:
1)投資者之間相互模仿,呈現(xiàn)集體追漲的交易局面,造成對數(shù)資產(chǎn)價格呈超指數(shù)暴漲;
2)隨著資產(chǎn)價格泡沫破裂的風(fēng)險逐漸擴(kuò)大,市場需要更高的回報作為補(bǔ)償;
3)資產(chǎn)價格泡沫在臨界點(diǎn)tc具有最大的崩盤概率;
4)越接近臨界點(diǎn)tc,資產(chǎn)價格對數(shù)周期性振蕩頻率越高.
在LPPL模型中,股票價格在泡沫階段的演化過程如(3)式所示:
式中p是股票價格;μ(t) 為趨勢項(xiàng);W為滿足均值為0,方差為1的維納過程;dj為非連續(xù)的跳躍,泡沫崩潰以前,dj0,崩潰之后 dj1 .與發(fā)生崩潰對應(yīng)的價格損失幅度由參數(shù)κ確定.假定h(t) 為崩潰發(fā)生的概率,則有:Et[dj]1×h(t)dt+0×(1?h(t))dth(t)dt.
在LPPL模型中,假設(shè)股價崩盤的概率h(t)如(4)式所示[2]:
式中B′,C′均大于0;tc為金融資產(chǎn)價格見頂?shù)臅r刻,也稱為崩潰臨界點(diǎn);m為冪增長指數(shù),代表股價增長的加速度,m越小,股價增長的加速度越快,其臨近泡沫的可能性也越大.ω為振蕩的角頻率,φ為振蕩的初始相位.
由Et[dj]h(t)dt,Et[dW]0 及滿足市場不存在無風(fēng)險套利條件,即Et[dp]0,對(3)式兩端取期望,可得μ(t)κh(t),進(jìn)一步,假定股價崩盤已經(jīng)產(chǎn)生,(3)式簡化為
進(jìn)一步,對(5)式兩端取期望,得
傳統(tǒng)上,中國人的確并沒有意識到“老糊涂”是一種病。近年來,“老年癡呆癥”這個病名被人們越來越熟悉,它比阿爾茨海默病聽起來更“通俗”。事實(shí)上,無論是在中國內(nèi)地還是香港地區(qū),調(diào)查數(shù)據(jù)顯示,阿爾茨海默病的患病率并不比其他地區(qū)低——內(nèi)地的發(fā)病率與世界平均水平持平,為6%左右;而香港的發(fā)病率則接近10%。
(6)式取積分結(jié)合(4)式即得LPPL方程[2]:
式中A>0,為股票在臨界點(diǎn)的價格,也即股票見頂時的價格;并且,B(tc?t)m反映了股價由正反饋機(jī)制驅(qū)使而出現(xiàn)的冪律增長特性,C(tc?t)mcos(ωln(tc?t)?φ)刻畫了股價在臨近見頂并崩盤時呈對數(shù)周期性振蕩,是對股價冪律增長行為的修正.圖1以中國上證指數(shù)2015年泡沫期間走勢為例,展示了LPPL模型中呈現(xiàn)的對數(shù)周期冪律振蕩現(xiàn)象.
如圖1所示,在線性尺度下,越接近崩盤的臨界點(diǎn),其振蕩的頻率越快,其表現(xiàn)為圖中指數(shù)振蕩的間隔周期越來越短,如圖1中振蕩的周期依次為116(由余弦函數(shù)的波峰或波谷數(shù)值相減可得,如第一個周期為200減去84為116個交易日,以此類推),67,38,22,13個交易日.而在對數(shù)尺度下,其振蕩頻率為常數(shù),如圖1中所示,分別對線性尺度下的振蕩周期取對數(shù),則其周期為ln(116)–ln(67)=ln(67)–ln(38)=ln(38)–ln(22)=ln(22)–ln(13)=0.54.并且股價越是接近臨界點(diǎn),股價增長速度越快,即股價增長率呈現(xiàn)單調(diào)遞增的特點(diǎn).
圖1 上證指數(shù)2015年泡沫期間LPPL擬合圖Fig.1.LPPL fitting diagram of the Shanghai stock exchange (SSE) index during the 2015 bubble.
2.2.2 LPPL-MS模型的構(gòu)建
基礎(chǔ)的LPPL模型未將投資者情緒因素納入到建模過程當(dāng)中,本文創(chuàng)新性地對LPPL模型中的崩潰概率公式h(t) 進(jìn)行修改,以刻畫媒體情緒因素對崩潰風(fēng)險的影響.如前文所述,已有研究均已表明,投資者情緒對股價具有顯著的影響,因此,本文假定在股市泡沫階段,媒體積極評論將進(jìn)一步助推市場情緒的高漲,加速羊群效應(yīng),放大市場正反饋機(jī)制,驅(qū)使股價加速膨脹,導(dǎo)致其崩盤概率增大.反之,媒體負(fù)面評論則可能平抑過熱的市場情緒,延緩羊群效應(yīng),抑制市場正反饋機(jī)制,延緩崩盤時刻的到來.考慮媒體情緒(mediasentiment,MS)影響后的股價崩潰函數(shù)h(t) 如(8)式表示:
式中 sentimentt?1為t?1時刻媒體情緒值;λ>0,則表明積極情緒會放大正反饋效應(yīng),消極情緒會抑制正反饋效應(yīng),否則不成立.同上,與2.2.1節(jié)中情形類似,可得到考慮媒體情緒后的LPPL方程的表達(dá)式:
Johansen等[46]提到,LPPL模型刻畫的股市崩盤具有典型的3個特征:1)股價達(dá)到明顯的峰值;2)股價至少在6個月內(nèi)維持上漲的態(tài)勢;3)股價達(dá)到峰值后在短期內(nèi)便迅速下降.由于自2014年1月1日起,新聞來源眾多,而2013年及之前的網(wǎng)站來源少、新聞數(shù)據(jù)量少,結(jié)合LPPL模型所滿足的3個特征,本文選擇上證指數(shù)2014年1月2日至2015年5月29日、創(chuàng)業(yè)板指數(shù)2014年1月2日至2015年5月20日收盤價數(shù)據(jù)及對應(yīng)新聞媒體評論數(shù)據(jù)作為樣本進(jìn)行擬合.所有樣本數(shù)據(jù)均來源于東方財富旗下Choice金融終端,通過在Choice金融終端抓取關(guān)鍵詞“A股”、“大盤”相關(guān)的各類媒體評論,匯總每一自然日新聞財經(jīng)媒體對當(dāng)下股票市場整體運(yùn)行狀況的評價及未來走勢預(yù)判.其數(shù)據(jù)覆蓋面較為全面,其數(shù)據(jù)均來源于諸如,滬深交易所、中國基金報、券商中國、澎湃新聞、21世紀(jì)經(jīng)濟(jì)報道、中證網(wǎng)、中金網(wǎng)等國內(nèi)主流媒體.部分媒體評論稿標(biāo)題信息如圖2所示.
圖2 部分財經(jīng)媒體評論稿標(biāo)題信息樣本Fig.2.Some financial media commentary title information samples.
采用2.1節(jié)中構(gòu)建的情感詞典掃描每一條評論的標(biāo)題,統(tǒng)計每條評論對應(yīng)的積極詞匯、消極詞匯出現(xiàn)的次數(shù),再結(jié)合(2)式,便得到每一天的情緒值.本文所參照的CFSD金融情感詞典部分內(nèi)容如表1所示.
表1 CFSD詞典部分積極、消極詞匯Table 1.Some positive and negative words in CFSD dictionary.
媒體情緒指數(shù)描述性統(tǒng)計分析如表2所示.從表2中可看出,本文所選取的媒體情緒樣本中積極情緒指數(shù)明顯高于消極情緒指數(shù),表明各類財經(jīng)媒體的評論具有明顯的傾向性,其傾向于對市場做出積極正面的評論.受央行多次降準(zhǔn)降息,市場無風(fēng)險利率不斷下探,疊加國家實(shí)施積極財政政策及國企改革等一系列“利好”因素的推動下,2015年上半年A股市場節(jié)節(jié)攀升,上證指數(shù)在2015年6月12日最高上漲到5178.19點(diǎn),創(chuàng)業(yè)板指數(shù)在2015年6月5日最高上漲到4037.96點(diǎn),隨后隨著市場泡沫的破裂,僅兩個月時間,上證指數(shù)從高位滑落至2850.71點(diǎn),創(chuàng)業(yè)板則滑落至1779.18點(diǎn).上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫前后的走勢如圖3所示.
圖3 上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫前后走勢Fig.3.Trend of SSE index and growth enterprise market(GEM) index before and after bubble.
表2(MS)序列描述性統(tǒng)計分析Table 2.Descriptive statistical analysis of media sentiment(MS) sequence.
為了得到模型的參數(shù)估計結(jié)果,本文采用遺傳算法(genetic algorithm,GA)來獲取LPPL、LPPLMS參數(shù)估計值.其中,上證指數(shù)的擬合樣本區(qū)間為2014年1月2日至2015年5月29日;創(chuàng)業(yè)板指數(shù)的擬合樣本區(qū)間為2014年1月2日至2015年5月20日.GA算法的適應(yīng)度函數(shù)為擬合值與實(shí)際值的均方誤差,其種群規(guī)模設(shè)為20,交叉概率設(shè)為0.5,變異率設(shè)為0.05,迭代次數(shù)設(shè)為100次,為了使預(yù)測結(jié)果更加穩(wěn)健,選取適應(yīng)度最佳的3組擬合結(jié)果進(jìn)行分析.LPPL及LPPL-MS模型的GA算法估計結(jié)果如表3、表4所示.
表3、表4中MSE指標(biāo)為LPPL,LPPL-MS模型擬合值與實(shí)際值的均方誤差,其余各參數(shù)的意義同2.2節(jié)中的介紹.所有模型擬合得到的冪增長指數(shù)m介于0到1之間,表明市場崩潰的概率h(t)具有不斷加速的特征,滿足產(chǎn)生崩盤的條件.此外,LPPL-MS模型中,λ均大于0,表明媒體情緒對正反饋效應(yīng)具有顯著影響,即積極情緒會放大正反饋效應(yīng),消極情緒會抑制正反饋效應(yīng).若N≤tc 表3 上證指數(shù)LPPL,LPPL-MS參數(shù)估計結(jié)果Table 3.Parameter estimation results of SSE index LPPL and LPPL-MS. 表4 創(chuàng)業(yè)板指數(shù)LPPL、LPPL-MS參數(shù)估計結(jié)果Table 4.Estimation results of LPPL and LPPL-MS parameters of gem index. 從表5中可看出,LPPL-MS無論是在上證指數(shù)還是創(chuàng)業(yè)板指數(shù)情形下,其預(yù)測的見頂時點(diǎn)均更接近真實(shí)值,其預(yù)測的崩潰臨界時點(diǎn)與真實(shí)見頂時點(diǎn)的最低絕對誤差、最高絕對誤差、平均絕對誤差均小于LPPL模型.圖4直觀展示了不同模型的預(yù)測表現(xiàn). 表5 上證指數(shù)、創(chuàng)業(yè)板指數(shù)預(yù)警誤差比較分析Table 5.Comparative analysis of early warning errors between SSE index and GEM index. 圖4中,不同顏色的線條分別對應(yīng)不同的擬合情形,所有圖中上證指數(shù)、創(chuàng)業(yè)板指數(shù)實(shí)際的見頂時點(diǎn)所在的時刻均用“^”符號標(biāo)出.“*,+,<”分別對應(yīng)情形1,2,3下預(yù)測得到的見頂時點(diǎn).其中,上證指數(shù)對應(yīng)的大盤見頂時點(diǎn)為353,對應(yīng)的交易日期為2015年6月12日,創(chuàng)業(yè)板指數(shù)對應(yīng)的大盤見頂時點(diǎn)為346,對應(yīng)的交易日期為2015年6月3日.上證指數(shù)LPPL三種擬合情形預(yù)測的大盤見頂時點(diǎn)分別370,380,362,即分別比實(shí)際的見頂時點(diǎn)晚17,27,9個交易日.上證指數(shù)LPPL-MS模型三種擬合情形預(yù)測的大盤見頂時點(diǎn)分別為363,366,361,即分別比實(shí)際的見頂時點(diǎn)晚10,13,8個交易日.從圖中也可看出,上證指數(shù)LPPL-MS模型預(yù)測的大盤見頂時點(diǎn)相比較LPPL模型更為接近真實(shí)值.同理,創(chuàng)業(yè)板指數(shù)LPPL三種擬合情形預(yù)測的大盤見頂時點(diǎn)分別為336,342,341,其分別比實(shí)際的見頂時點(diǎn)提前10,4,5個交易日.創(chuàng)業(yè)板指數(shù)LPPL-MS三種擬合情形預(yù)測的大盤見頂時點(diǎn)分別為345,353,354,其分別比實(shí)際見頂時點(diǎn)提前1個交易日、遲延7個交易日、延遲8個交易日,其相比LPPL模型預(yù)測的見頂時點(diǎn)更為接近真實(shí)值.圖4的直觀展示結(jié)果亦表明LPPL-MS組合模型預(yù)警效果優(yōu)于LPPL模型. 圖4 上證指數(shù)、創(chuàng)業(yè)板指數(shù)不同模型預(yù)測表現(xiàn)比較分析Fig.4.Comparative analysis of forecasting performance of different models of Shanghai Stock Exchange Index and Growth Enterprise Market Index. 為了進(jìn)一步驗(yàn)證LPPL,LPPL-MS擬合結(jié)果的穩(wěn)健性,對其擬合殘差進(jìn)行Ornstein-Uhlenbeck(O-U)過程檢驗(yàn).Lin等[48]指出,如果股票市場在泡沫期間的對數(shù)收盤價可以用LPPL模型進(jìn)行有效解釋,則其擬合的殘差應(yīng)該滿足 O-U過程.其擬合的殘差若滿足平穩(wěn)性,則表明其符合O-U過程.表6列出了上述模型不同擬合情形下殘差的單位根檢驗(yàn)結(jié)果. 表6 上證指數(shù)、創(chuàng)業(yè)板指數(shù)不同擬合情形下殘差平穩(wěn)性檢驗(yàn)Table 6.Residual stationarity test of SSE index and GEM index under different fitting conditions. 表6中的數(shù)值為LPPL,LPPL-MS不同擬合情形下殘差Dickey-Fuller檢驗(yàn)的P值.從表6可看出,上述LPPL,LPPL-MS模型不同擬合情形下殘差均通過了平穩(wěn)性檢驗(yàn),表明其擬合殘差滿足O-U過程,且LPPL-MS模型相比LPPL模型具有更小的P值,其擬合結(jié)果更為穩(wěn)健.本文所采用的LPPL、LPPL-MS模型可有效解釋2015年上證指數(shù)、創(chuàng)業(yè)板指數(shù)泡沫期間的運(yùn)行情況. 本文采用文本挖掘技術(shù)生成財經(jīng)媒體情緒指數(shù)MS,通過將MS指數(shù)納入傳統(tǒng)的LPPL模型,構(gòu)建LPPL-MS組合模型對中國上證指數(shù)、創(chuàng)業(yè)板指數(shù)2015年6月份的崩盤進(jìn)行預(yù)警.實(shí)證分析得出以下結(jié)論. 1)通過文本挖掘技術(shù)結(jié)合大數(shù)據(jù)分析,抓取財經(jīng)媒體對A股的評論信息,通過分析其評論措辭的情感傾向可有效衡量媒體情緒.并且,財經(jīng)媒體傾向于對市場做出樂觀的評價,以煽動其他投資者的情緒.由于中國股市中個人投資者基數(shù)龐大,尤其是其中的新進(jìn)投資者,其缺乏交易經(jīng)驗(yàn),往往容易受財經(jīng)媒體具有煽動性報道內(nèi)容的影響.以致于媒體情緒一定程度上能影響股票市場的表現(xiàn). 2)中國A股市場在2015年上半年開啟單邊暴漲模式,并出現(xiàn)嚴(yán)重的泡沫,其泡沫階段的運(yùn)行情況符合LPPL模型中描述的超指數(shù)膨脹及對數(shù)周期冪律加速振蕩特征.采用LPPL模型可有效預(yù)警2015年6月份上證指數(shù)、創(chuàng)業(yè)板指數(shù)的崩潰. 3)在股票市場泡沫期間,媒體頻繁的帶有煽動性正向情感傾向的股評報道可引起市場的極度亢奮情緒,使市場的崩盤概率進(jìn)一步加速.通過在傳統(tǒng)的LPPL模型中納入媒體情緒指標(biāo)MS,構(gòu)建LPPL-MS組合模型預(yù)警上證指數(shù)、創(chuàng)業(yè)板指數(shù)2015年6月份的崩盤,具有更高的預(yù)測精度,其預(yù)測大盤見頂?shù)呐R界點(diǎn)相比LPPL模型更接近真實(shí)值.并且其擬合殘差單位根檢驗(yàn)的P值小于LPPL模型,其模型擬合結(jié)果更為穩(wěn)健. 本文的研究結(jié)果有助于政府相關(guān)監(jiān)管當(dāng)局提前預(yù)警股市系統(tǒng)性風(fēng)險,為其提前制定風(fēng)險管控政策做鋪墊.同時,投資者也借助該模型提前優(yōu)化交易策略,及時規(guī)避系統(tǒng)性風(fēng)險,減少投資損失.本文將投資者情緒因素納入到LPPL模型,以改進(jìn)LPPL模型預(yù)警效果,然而,股票市場本身作為一個復(fù)雜系統(tǒng),其市場運(yùn)行規(guī)律受內(nèi)外部多維復(fù)雜因素影響,其不僅僅受市場情緒影響,還受到諸如市場基本面因素、市場技術(shù)面特征、外圍市場沖擊等因素影響,未來的研究可將上述因素納入到模型當(dāng)中,以進(jìn)一步優(yōu)化模型預(yù)警效果.3.3 LPPL,LPPL-MS擬合結(jié)果O-U過程檢驗(yàn)
4 結(jié)論