張明月
【摘要】估計模型的參數(shù)值最常用到的方法就是最小二乘法(OLS),但是這種方法的假設(shè)眾多(比如:同方差,不存在自相關(guān)等),當(dāng)這些假設(shè)條件并不能滿足的時候要研究估計量或者統(tǒng)計量的有限樣本分布特征的時候最常用的方法之一就是蒙特卡洛模擬。
本文將主要討論應(yīng)用蒙塔卡洛模擬來估計任意函數(shù)的期望值的置信區(qū)間的基本原理,并應(yīng)用R語言來計算一個具體的函數(shù)的期望的置信區(qū)間,并對得到的結(jié)果進(jìn)行簡要的分析。
【關(guān)鍵詞】蒙特卡洛模擬 R語言 期望值 置信區(qū)間
一、基本原理
(一)定義
蒙特卡洛(Monte Carlo)模擬是一種通過設(shè)定隨機(jī)過程(數(shù)據(jù)生成系統(tǒng)),反復(fù)生成隨機(jī)序列并計算參數(shù)估計量和統(tǒng)計量,進(jìn)而研究其分布特征的方法。
在應(yīng)用蒙特卡洛模擬的過程中重復(fù)生成隨機(jī)序列的過程越多,估計出來的參數(shù)統(tǒng)計量和估計量就越接近真實(shí)值,所以蒙特卡洛模擬得到的是一個最優(yōu)解的近似值而不是最優(yōu)解。
(二)運(yùn)用蒙特卡洛模擬估計期望和標(biāo)準(zhǔn)差的基本原理
假設(shè)我們給出一個隨機(jī)變量X,我們想求解任意的函數(shù)g(·)的期望Eg(X)。如果我們能得到n個偽隨機(jī)數(shù)(通過計算機(jī)聲稱的隨機(jī)數(shù)成為偽隨機(jī)數(shù))X1,X2,…Xn從分布X中,我們可以考慮用g(xi)的樣本均值來近似估計期望Eg(X):
二、簡單應(yīng)用
下面用一個簡單的例子來通過R語言實(shí)現(xiàn)運(yùn)用蒙特卡洛模擬估計一個函數(shù)的期望Eg(X)。令Y=g(X)=eβX,其中,假設(shè)X~N(0,1),β=5。
三、結(jié)果分析
由上面的結(jié)果可以看出來通過蒙特卡洛模擬估計出來的期望Eg(X)的置信區(qū)間過大,因此是沒有意義的。
造成這個結(jié)果的原因主要有兩個:第一個是因為g(X)本身存在的巨大的波動性,如果Y=g(X)本身的波動性很大,那么通過蒙特卡洛模擬來估計其參數(shù)就無法提供有效的信息。第二個是因為樣本的波動性使得估計出來的參數(shù)值的可靠性降低了。基于以上兩個原因,在重復(fù)了n=1000000之后并沒有達(dá)到漸進(jìn)正態(tài)性,所以標(biāo)準(zhǔn)誤差的估計值并不是無偏的,自然我們估計出來的置信區(qū)間就是沒有太大意義的。
如果我們將重復(fù)的次數(shù)n的值擴(kuò)大10倍,即令n=10000000重新運(yùn)行代碼那么得到的置信區(qū)間為:
并且可以得到圖3.1,從圖形中可以看出在擴(kuò)大了重復(fù)的次數(shù)之后置信區(qū)間明顯縮小了,并且目標(biāo)真實(shí)的參數(shù)值和通過蒙特卡洛模擬估計出來的參數(shù)值之間的差距明顯縮小。但是置信區(qū)間依然很大,這是因為蒙特卡洛估計向波動性很大的目標(biāo)真值收斂是非常緩慢的,所以擴(kuò)大重復(fù)的次數(shù)雖然起到了一定的縮小置信區(qū)間的作用,但是得到的置信區(qū)間依然意義不大。
參考文獻(xiàn)
[1]SM lacus:Simulation and Inference or stochastic Differential Equations [M].Springer,2008.
[2]張曉峒:蒙特卡洛模擬[Z].2012.