董珊,曾衛(wèi)明,石玉虎
(上海海事大學(xué)信息工程學(xué)院,上海 201306)
最近,Eklund等人研究發(fā)現(xiàn),過去最常用的fMRI軟件SPM、FSL和AFNI存在重大瑕疵,導(dǎo)致誤報率高達(dá)70%,可能造成約有4萬份論文的研究成果存在疑慮[1]。這其實涉及到一直存在于統(tǒng)計學(xué)中的問題,即顯著性檢驗中多重校正問題[2]。假設(shè)全腦由10萬個體素組成,為了得到與某個認(rèn)知功能相關(guān)的腦區(qū)定位,通常要對每一個體素進(jìn)行一次統(tǒng)計分析,按p=0.05計算,但這可能會得到5000個假陽性的體素,從而出現(xiàn)統(tǒng)計學(xué)上的多重校正問題。
在以往的研究中,一般使用參數(shù)統(tǒng)計方法,例如Bonferroni校正[3]、FDR校正[4]以及隨機(jī)場理論。例如SPM基于高斯隨機(jī)場理論,假設(shè)數(shù)據(jù)在空間變異上有著確定的模式,統(tǒng)計量的分布可以用平滑后的隨機(jī)場來模擬[5]。通過計算真實的統(tǒng)計圖的平滑度,估計腦內(nèi)體素(或團(tuán)塊)在特定的統(tǒng)計水平下隨機(jī)產(chǎn)生的可能性。而Eklund等研究表明,如果數(shù)據(jù)不符合高斯隨機(jī)場理論的潛在假設(shè),即fMRI信號的空間平滑在大腦中一致,或者空間自相關(guān)函數(shù)符合特定曲線(二次指數(shù)),則非參數(shù)檢驗方法比傳統(tǒng)的參數(shù)檢驗方法更可靠[1]。這意味著非參數(shù)檢驗方法在fMRI上關(guān)于減少假陽性率方面具有重要的研究意義。
由Nochols Holmes等提出的一種非參數(shù)檢驗方法——置換檢驗[6],可以較為有效地控制假陽性錯誤率。該方法主要優(yōu)點(diǎn)是檢驗對數(shù)據(jù)本身的特征并不需要前提假設(shè)。置換檢驗對設(shè)計矩陣中的變量進(jìn)行多次隨機(jī)分配,例如將某個刺激條件和控制條件對調(diào),對照分組之間進(jìn)行對調(diào)。每次都將得到一張全腦偽彩色圖,該圖中存在一個最強(qiáng)點(diǎn)值(每個體素的顯著性不同,顏色代表強(qiáng)弱)。再提取每次隨機(jī)分配后得到的最強(qiáng)點(diǎn)值,得到一個分布直方圖,稱之為Pmax。通過Pmax即可判斷真實情況下每個體素的顯著性。若某體素的統(tǒng)計值不低于其余95%體素的值,則認(rèn)為它經(jīng)過校正體現(xiàn)為激活狀態(tài)。
Bootstrap檢驗也是比較流行的一種非參數(shù)檢驗方法,但在fMRI領(lǐng)域中研究較少。在統(tǒng)計學(xué)中,Bootstrap檢驗是從給定訓(xùn)練集中有放回的均勻抽樣。每當(dāng)選中一個樣本,它等可能地被再次選中并被添加到訓(xùn)練集中。在以往的研究中,如利用Bootstrap處理fMRI數(shù)據(jù)GLM模型中參數(shù)假設(shè)錯誤[7],cluster水平顯著性檢測[8],fMRI組分析腦圖敏感性分析[9]等均是利用Bootstrap本身的特點(diǎn),以此來解決fMRI上出現(xiàn)的統(tǒng)計學(xué)問題。但遺憾的是,并沒有研究利用Bootstrap提出一種新的非參數(shù)方法應(yīng)用于fMRI研究。本文將基于Bootstrap檢驗提出一種新的非參數(shù)體素激活檢測方法,研究表明,該方法能盡可能地減少體素假陽性率。
本文采用Geraint Rees實驗室采集的聽覺數(shù)據(jù)[10],為Block Design任務(wù)態(tài)數(shù)據(jù),block為6次掃描,共由16組block組成。實驗條件從休息狀態(tài)開始,采用休息和聽覺刺激連續(xù)交替,每分鐘呈現(xiàn)60次雙音節(jié)。功能數(shù)據(jù)從圖像4開始采集,且由于T1效應(yīng),將丟棄前幾次掃描這些全腦BOLD/EPI圖像是在修改后的2T西門子MAGNETOM視覺系統(tǒng)上采集的。每次采集由64個連續(xù)切片組成,掃描分辨率為64×64,片內(nèi)分辨率為3mm×3mm。采集時間為6.05s,掃描重復(fù)時間(RT)為7s。
fMRI數(shù)據(jù)具有一定的時間相關(guān)性,因此實驗將參考數(shù)據(jù)掃描間隔時間設(shè)定為7秒,以6次掃描為一個block,以此來確定抽樣時間間隔,并分為聽覺刺激態(tài)和休息態(tài)。對一個體素而言,刺激態(tài)和休息態(tài)體素值存在差異(如圖1),該差異將于最后的激活圖中顯現(xiàn)。
圖1 單個體素BODL信號圖,包括休息(A),激活(B)
根據(jù)單個體素激活圖像特征,刺激態(tài)和根據(jù)單個體素激活圖特征,刺激態(tài)和休息態(tài)有明顯的BODL信號差異。理論上來說,一個體素存在3種情況:(1)該體素在所有抽樣樣本均體現(xiàn)激活狀態(tài);(2)該體素在部分樣本出現(xiàn)激活狀態(tài)(3)該體素在所有抽樣樣本均不體現(xiàn)激活狀態(tài)。設(shè)定閾值,若某一體素出現(xiàn)激活狀態(tài)的頻率大于閾值,則認(rèn)為該體素處于激活狀態(tài),從而減少假陽性發(fā)生率。將閾值設(shè)為(1-p)即某體素激活狀態(tài)頻率超過(1-p),則認(rèn)為該體素處于激活狀態(tài)。實驗步驟如下:
(1)將休息態(tài)和刺激態(tài)進(jìn)行分組 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法隨機(jī)抽樣,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},組成 m 個新的樣本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一個數(shù)據(jù)抽樣頻率均小于50%;
(3)每次統(tǒng)計出體素值大于2的體素,得到一張激活圖;
(4)設(shè)置p值,統(tǒng)計激活頻率大于(1-p)的體素,即至少在(1-p)*m張激活圖中呈現(xiàn)激活的體素。
本實驗方法使用Python實現(xiàn)抽樣、調(diào)用MATLAB預(yù)處理腳本(包括頭動校正、配準(zhǔn)、分割、標(biāo)準(zhǔn)化、平滑)以及頻率統(tǒng)計等功能。在Mac OS系統(tǒng)下運(yùn)行,處理一個抽樣數(shù)據(jù)需要花費(fèi)5分鐘,運(yùn)行完一個樣本1000次抽樣需要大約3天時間。本實驗使用MRIcron軟件中的ch2better模板,得到圖2結(jié)果。從圖2可以看出,與聽覺有關(guān)的腦激活區(qū)域較集中,其他區(qū)域基本沒有小團(tuán)激活體素,實驗結(jié)果理想。
圖2 SPM激活圖像(a)與Bootstrap檢驗激活圖像(b)的比較激活圖
上述方法在Mac OS系統(tǒng)下運(yùn)行,處理一個抽樣數(shù)據(jù)需要花費(fèi)5分鐘,運(yùn)行完一個樣本1000次抽樣需要大約3天時間。本方法將在上述基礎(chǔ)上進(jìn)行改進(jìn),以減少計算量。通過Bootstrap抽樣組成20個樣本,可以將這些樣本看成獨(dú)立的個體。又因為這20個樣本都是從同一個樣本抽樣而來,消除了由于不同個體對實驗刺激的敏感性不同而帶來的差異問題。這種情況下,根據(jù)以往效應(yīng)回歸模型研究結(jié)果[11],可假設(shè)研究樣本都擁有共同的真實效應(yīng)量,即可以排除由于每個研究個體的背景、年齡、教育程度、心理因素等不同而導(dǎo)致的各個真實效應(yīng)量不同,適用于固定效應(yīng)模型。具體實驗步驟如下:
(1)將休息態(tài)和刺激態(tài)進(jìn)行分組 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法隨機(jī)抽樣,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},組成 20個新的樣本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一個數(shù)據(jù)抽樣頻率均小于50%;
(3)結(jié)合 SPM 軟件,使用固定效應(yīng)(Fixed Effect)模型對于這20個樣本進(jìn)行組分析。
由于1000個抽樣樣本過于龐大,過多樣本進(jìn)行組分析仍會造成運(yùn)行時間過長,過程過于復(fù)雜等情況。且本研究發(fā)現(xiàn)單樣本組分析過程中,20個抽樣樣本已可以得到較好的研究結(jié)果。圖3為SPM與Bootstrap test單樣本組分析結(jié)果的腦激活圖像比較。
圖3 SPM激活圖像(a)與Bootstrap檢驗組分析圖(b)的比較
通過圖3對比,可以看出,改善后的方法在激活體素上有一定程度上減少,但體素個數(shù)減少不明顯。
以下將對于實驗結(jié)果比較做定量分析。表1為SPM、Bootstrap檢驗和Bootstrap檢驗組分析對聽覺數(shù)據(jù)處理得到的腦激活體素情況,其中p=0.001,抽樣總數(shù)m=1000。
從表1中可以看出,Bootstrap檢驗沒有明顯的校正閾值。這是因為在不同的抽樣樣本中經(jīng)過處理后,每個體素校驗值都不同,無法得到一個確定的閾值,但可以用閾值大于2和頻率大于99.9%相結(jié)合方法來得到校正閾值。此外,為了驗證參考信號的有效性和正確性,本文統(tǒng)計了SPM和Bootstrap檢驗兩種方法增加和較少的體素點(diǎn)與實驗設(shè)計block塊之間的皮爾森相關(guān)系數(shù)分布直方圖,實驗結(jié)果如圖4所示。增加的體素點(diǎn)與block相關(guān)性較低,減少的體素點(diǎn)與block相關(guān)性較高。其中SPM和Bootstrap檢驗兩種方法相同的體素個數(shù)為649,后者增加的體素個數(shù)為91,減少的體素個數(shù)為166。
表1 三種方法結(jié)果比較
圖4 SPM和Bootstrap檢驗比較增加和減少體素點(diǎn)的相關(guān)系數(shù)的分布直方圖
本文針對fMRI研究上的假陽性率問題,基于Bootstrap檢驗提出一種新的非參數(shù)多重校正方法。研究結(jié)果分析表示,與SPM相比,基于Bootstrap檢驗單樣本和單樣本組分析能得到更好的體素激活結(jié)果,一定程度上減少假陽性率。同時,也解決了fMRI某些實驗采集樣本過少,數(shù)據(jù)不符合假設(shè)分布而使得研究結(jié)果不理想的問題。當(dāng)然,研究也存在很多不足之處。首先,本研究發(fā)現(xiàn),不同的實驗步驟會造成部分激活體素的差異,例如先進(jìn)行Bootstrap抽樣再進(jìn)行預(yù)處理和先預(yù)處理再進(jìn)行Bootstrap抽樣相比,就實驗結(jié)果來看,后者實驗結(jié)果明顯好于前者。這給我們帶來一個新的研究思路,預(yù)處理對實驗數(shù)據(jù)的影響究竟有哪些,實驗數(shù)據(jù)是否進(jìn)行預(yù)處理等問題都需要進(jìn)一步研究。其次,在進(jìn)行Bootstrap抽樣時,若取得同一個數(shù)據(jù)頻率越高,實驗結(jié)果往往更差,其中的原因值得令人思考。