張虎,胡淑蘭
(中南財經(jīng)政法大學(xué)信息學(xué)院統(tǒng)計系,武漢430073)
馬爾可夫轉(zhuǎn)換模型的極大似然估計的算法
張虎,胡淑蘭
(中南財經(jīng)政法大學(xué)信息學(xué)院統(tǒng)計系,武漢430073)
由金融和經(jīng)濟(jì)時間序列,文章引入了馬爾可夫轉(zhuǎn)換模型并詳細(xì)給出其原理——隱藏馬爾可夫模型,以及在條件高斯下的極大似然估計方法。通過引入新的模型——擴(kuò)張隱藏馬爾可夫模型,對多種狀態(tài)轉(zhuǎn)移的情形下的極大似然估計量的算法進(jìn)行了改進(jìn)。
馬爾可夫轉(zhuǎn)換模型;隱藏馬爾可夫模型;極大似然估計
在金融和經(jīng)濟(jì)時間序列中,通常存在一些時間段,其時間序列的行為與前期相比,有很大的變化。序列隨時間的變動,體現(xiàn)在均值、方差或現(xiàn)值與前期值的相關(guān)程度等方面。若序列的行為模式發(fā)生一次性根本變化,則稱之為序列“結(jié)構(gòu)性變動”(structural break);若序列的行為模式在變動發(fā)生持續(xù)一段時間后恢復(fù)其原有狀態(tài),甚至轉(zhuǎn)換為其他行為類型,則后者通常稱為“機(jī)制更迭”(regime shift)或“機(jī)制轉(zhuǎn)換”(regime switch)。如果觀察宏觀經(jīng)濟(jì)或金融時間序列足夠長的時間,則可以看到很多變量有許多戲劇性的變化。這種明顯的變化可能源于戰(zhàn)爭、金融恐慌、或政府政策的顯著變化。如果變量的歷史數(shù)據(jù)已經(jīng)給出,我們可以根據(jù)顯著變化的次數(shù)將時間序列劃分成不同階段,然后分別建模。但是變量的顯著變化沒有理由不再發(fā)生,機(jī)制的變化肯定不能完全視作完全可預(yù)見的、確定性事件,此時,用歷史數(shù)據(jù)分別擬合的模型來進(jìn)行預(yù)測就不恰當(dāng)了。在計量經(jīng)濟(jì)學(xué)文獻(xiàn)中提出了許多更為復(fù)雜的非線性門限模型去解決這類序列問題,而實際上在金融領(lǐng)域中產(chǎn)生顯著影響的卻只有兩類,其中之一就是Hamilton(1989,1994)提出的馬爾可夫轉(zhuǎn)換模型(Markov Switching Model,簡稱為MSM)。馬爾可夫轉(zhuǎn)換模型在金融領(lǐng)域的應(yīng)用十分廣泛,當(dāng)認(rèn)為序列在兩種行為間來回轉(zhuǎn)換,而造成機(jī)制轉(zhuǎn)換的“策動變量”不可觀測的時候,可采用馬爾可夫轉(zhuǎn)換方法。在總體的分布函數(shù)或概率函數(shù)的數(shù)學(xué)表達(dá)式已知的情況下,通過對樣本的實際觀察取得樣本數(shù)據(jù),并在此基礎(chǔ)上通過對樣本統(tǒng)計量的計算,得到總體待估參數(shù)的估計值來替代其真實過程。極大似然估計法(Maximum likelihood estimate,簡稱為MLE)是很重要的參數(shù)估計方法之一,因為其原理更本質(zhì)地揭示了通過樣本估計母體參數(shù)的內(nèi)在機(jī)理。計量經(jīng)濟(jì)學(xué)理論的發(fā)展更多的是以極大似然估計原理為基礎(chǔ)的,對于一些特殊的計量經(jīng)濟(jì)學(xué)模型,只有極大似然方法才是很有效的估計方法。
馬爾可夫轉(zhuǎn)換模型的原理是隱藏馬爾可夫模型(Hidden Markov Model,簡稱為HMM),HMM由Baum和Petrie(1966)將其作為由馬爾可夫鏈的概率函數(shù)的推廣形式提出來。從本質(zhì)上看,HMM是一個雙重隨機(jī)過程,由兩個部分組成:
(1)隱藏部分(或稱為不可觀察狀態(tài))是馬爾可夫鏈:描述各個狀態(tài)之間的轉(zhuǎn)移,用狀態(tài)轉(zhuǎn)移的概率來描述;
(2)可觀察部分是一般隨機(jī)過程:描述狀態(tài)與觀察序列間的關(guān)系,用觀察值的概率分布來描述。
隱藏馬爾可夫模型的狀態(tài)是不確定的或不可見的,也就是說馬爾可夫模型的“機(jī)制”(regime),只有通過觀察值序列的隨機(jī)過程才能表現(xiàn)出來。觀察到的事件與狀態(tài)并不是一一對應(yīng)的,而是通過一組概率分布相聯(lián)系。隱藏馬爾可夫模型起初的應(yīng)用是在統(tǒng)計和信息的理論領(lǐng)域中,之后再廣泛地應(yīng)用到生物信息學(xué)、遺傳學(xué)、語音識別以及金融資產(chǎn)定價、計算計量經(jīng)濟(jì)學(xué)等很多領(lǐng)域。目前,在國際上,隱藏馬爾可夫模型在各個領(lǐng)域的應(yīng)用已經(jīng)得到廣泛地認(rèn)可和拓展,其理論部分的研究卻屬于起步的階段,因為理論的研究具有很大的挑戰(zhàn)性和難度。在國內(nèi)這方面的研究還比較少。
隱藏馬爾可夫模型是定義在某概率空間上的雙重隨機(jī)過程(xt,yt),隱藏的轉(zhuǎn)移狀態(tài)st定義在{1,…,M}的隨機(jī)變量,服從一階馬爾可夫鏈,滿足馬爾可夫性。當(dāng)st=1時,稱此時間序列處于最低的機(jī)制;相應(yīng)地,當(dāng)st=M時,稱此時間序列處于最高的機(jī)制。
定義各狀態(tài)之間轉(zhuǎn)移的概率轉(zhuǎn)移矩陣P為:
如果是僅為兩個狀態(tài)的轉(zhuǎn)移(例如擴(kuò)張和收縮,正增長與負(fù)增長),概率轉(zhuǎn)移矩陣就可以寫成
隱藏馬爾可夫模型的另一組成部分,行向量yt=(y1,t,…,yp,t),是可以通過觀察得到的時間序列,在信息理論中,yt就是釋放出來的信息量,能夠被直接或間接觀測得到。我們將在t-1時間內(nèi)所觀察到的信息序列集合表示為It-1=(yt-1,…,y1),根據(jù)狀態(tài)轉(zhuǎn)移的馬爾可夫性質(zhì)有:
觀察值yt是一般的隨機(jī)過程,服從于關(guān)于轉(zhuǎn)移狀態(tài)條件獨(dú)立的某種概率分布規(guī)律。比如:yt是服從于st的期望為μ、方差為σ2的條件高斯分布,即yt|st~N(μ,σ2)。當(dāng)然在復(fù)雜的模型下,也會出現(xiàn)一些更一般化或更抽象的分布。
在以上的隱藏馬爾可夫模型的基礎(chǔ)上,下面我們建立一般化的自回歸模型,即馬爾可夫轉(zhuǎn)換高斯模型:
其中yt是觀察值序列,xt=(x1,t,…,xn,t)表示受轉(zhuǎn)換機(jī)制支配的外生回歸向量,zt=(z1,t,…,zr,t)表示不受轉(zhuǎn)換機(jī)制支配的外生回歸向量,表示為與機(jī)制相關(guān)的n×r回歸系數(shù)矩陣,δ=(δ1,…,δp)表示為與機(jī)制無關(guān)的r×p回歸系數(shù)矩陣。這里:
由Hamilton(1994)的方法,引入投影隨機(jī)變量ξt是M×1的向量,滿足,即
我們可以將Σst和βst表示為
那么在給定狀態(tài)st=j時,馬爾可夫轉(zhuǎn)換模型可簡化成:
尋求極大似然估計的解析方法,只能在概率密度函數(shù)有明確的解析表達(dá)式時使用。最常用的迭代優(yōu)化算法是從某個初始設(shè)定的參數(shù)值出發(fā),以得到更好的參數(shù)值。這個過程一直重復(fù)進(jìn)行,不斷得到比前一次更好的參數(shù)值,直到目標(biāo)函數(shù)在迭代過程中不再優(yōu)化為止。區(qū)分不同算法的主要標(biāo)準(zhǔn)就是它們找到最大值的速度的快慢。
對所有的狀態(tài)求和后,有
根據(jù)一般極大似然估計的基本原理,可以得到對數(shù)似然函數(shù):
那么如何改進(jìn)計算方法才能使迭代速度更快呢?顯然,對數(shù)函數(shù)內(nèi)的求和符號是使迭代速度慢的根本原因,因此對數(shù)似然函數(shù)形式上的簡化問題歸結(jié)于如何轉(zhuǎn)移對數(shù)內(nèi)的函數(shù)求和符號。
我們采用的解決方案是引入第三個變量qt,構(gòu)成新的模型——擴(kuò)張隱藏馬爾可夫模型(extended HMM)。在這個模型中,極大似然估計中的似然函數(shù)能夠通過第三個變量qt的定義和在聯(lián)合概率密度函數(shù)的計算中的整合能將對數(shù)內(nèi)的函數(shù)求和符號成功地轉(zhuǎn)移到對數(shù)符號外面,有效得簡化了迭代公式,加快了迭代速度,從而目標(biāo)函數(shù)在迭代過程中盡可能最優(yōu)化。
在隱藏馬爾可夫模型中,引入第三個變量qt,構(gòu)成新的模型——擴(kuò)張隱藏馬爾可夫模型(st,yt,qt)。qt定義為給定觀察
序列yt后狀態(tài)st的條件概率分布,即:由 Le Gland和Mevel(2000),我們知道,qt會滿足Baum向前方程,qt的表達(dá)式是由初始分布,觀察序列yt和參數(shù)Θ確定的函數(shù)g表示:qt+1=g(yt,qt)。具體表達(dá)式見Le Gland和Mevel(2000)。由于觀察序列與初始狀態(tài)的相互依賴性,可以進(jìn)一步得到:qt+1=g(yt,…,y1,q1)。
在擴(kuò)張隱藏馬爾可夫模型下,聯(lián)合概率密度函數(shù)的對數(shù)似然函數(shù)為:
在計算機(jī)上實現(xiàn)隱藏馬爾可夫模型或馬爾可夫轉(zhuǎn)換模型的在各領(lǐng)域的實際模型中的模擬和應(yīng)用,一般使用GAUSS軟件,我們可以通過以上方法改進(jìn)GAUSS中的MLE模塊程序來加快計算速度。
[1]Baum,Petrie.Statistical Inference for Probabilistic Functions of Finite Markov Chains[J].Ann.Math.Statist,1966,37.
[2]J.Hamilton.A New Approach to the Economic Analysis of Non-Stationary Time Series and the Business Cycle[J].Econometrica,1989,57(2).
[3]J.Hamilton.Time Series Analysis[M].New Jersey:Princeton University Press,1994.
[4]Le Gland,Mevel.Exponential Forgetting and Geometric Ergodicity in Hidden Markov Models[J].Math.Contr.Signals Syst,2000,(13).
(責(zé)任編輯/亦民)
F22
A
1002-6487(2011)06-0026-02
中南財經(jīng)政法大學(xué)振興工程科研基金資助項目
張虎(1963-),男,湖北隨州人,博士,教授,研究方向:數(shù)量經(jīng)濟(jì)。