羅文相,萬 麗,劉 慧
(1.廣州軟件學(xué)院,廣東廣州510990;2.廣州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,廣東廣州510006)
熵是系統(tǒng)復(fù)雜度的一種度量,可用于時間序列動力學(xué)狀態(tài)識別。在信息論建立后,關(guān)于熵的理論和應(yīng)用得到了迅速的發(fā)展。近年來,在信息熵的基礎(chǔ)上,提出了新的熵,如:近似熵、排列熵、樣本熵等[1-3]。加權(quán)排列熵[4](weighted permutation entropy,WPE)是Fadlallah在2013年針對排列熵在計算過程中沒有考慮時間序列中的幅值信息而提出的一種改進(jìn)方法,具有較好地抗噪抗干擾能力,其算法簡單、可操作性強(qiáng),能有效放大時間序列的微小變化,廣泛應(yīng)用于信號突變檢測、隨機(jī)信號分析等方面,并在機(jī)械故障診斷、醫(yī)學(xué)等領(lǐng)域取得良好的應(yīng)用效果[5-7]。
成礦系統(tǒng)是地球物質(zhì)系統(tǒng)的一個重要組成部分,成礦系統(tǒng)及其動力學(xué)是地球科學(xué)前沿研究的熱點之一。礦床的形成往往經(jīng)歷了多種地質(zhì)作用疊加、多期次演化和漫長的復(fù)雜過程,因此是一個時間域和空間域跨度都非常大的非線性復(fù)雜地質(zhì)巨系統(tǒng)[8]。成礦系統(tǒng)的演化是時間發(fā)展、空間展布和成礦作用的相互作用,在時間和空間上不可分割。由于時間演化的不可再現(xiàn)性和長期性,可以依據(jù)時空演化的相關(guān)性,通過對空間系列數(shù)據(jù)的研究,獲得時間上動力學(xué)過程的演化規(guī)律。但在地質(zhì)實際中,常常不能確定成礦系統(tǒng)的動力學(xué)方程,只是得到實際的觀測數(shù)據(jù),如成礦元素含量序列[9]。因此,需要引入新的非線性動力學(xué)指標(biāo)來刻畫成礦元素含量序列的特征。
本文將檢驗加權(quán)排列熵對不同動力學(xué)的識別的有效性,并將其引入到成礦元素含量序列的非線性特征的分析中,探討成礦元素含量序列的復(fù)雜性與礦化強(qiáng)度的關(guān)系,為揭示隱藏在成礦元素含量序列背后的動力學(xué)特征提供新方法。
設(shè)長度為N的時間序列X={x(n),n=1,2,… ,N},對時間序列X進(jìn)行相空間重構(gòu),得到N-(m-1)τ行,m列的矩陣XK:
其中,K=N-(m-1)τ,m是嵌入維,τ是延遲時間。矩陣XK中的每一行為一個重構(gòu)分量,共有K個。將第i個重構(gòu)分量Xi=(x(i),x(i+τ),… ,x(i+(m-1)τ)按照升序重新排列,得到:
其中i=1,2,…,K,j1(i),j2(i),…,jm(i)表示元素所在重構(gòu)分量中列的索引。若元素相等,則按照元素索引的大小進(jìn)行排列。因此,矩陣XK中的每個重構(gòu)分量重新按照升序排列,得到一個K行m列的符號序列矩陣。記πi=(j1(i),j2(i),…,jm(i)),i=1,2,…,K,πi為(1,2,…,m)的某一種排列,顯然,m個元素最多有m!種不同排列,記為Π。以時間序列{7,6,5,8,6}為例,當(dāng)m=3,τ=1時,得到的第一個重構(gòu)分量為(7,6,5),由于xt+2 記πr為πi中某種排列,其中0 其中,wr是重構(gòu)分量Xj的權(quán)值,由Xj的方差表示: WPE是排列熵的一種改進(jìn)算法,它考慮了包含在時間序列中的幅值信息,表達(dá)式定義為: 其中,log 表示為以2 為底的對數(shù)。若對WPE(m)進(jìn)行歸一化處理,可得: 加權(quán)排列熵在計算某種排列的概率時考慮了與其相對應(yīng)的重構(gòu)分量的幅值信息,能充分反映時間序列的細(xì)致特征。 為檢測加權(quán)排列熵對不同動力學(xué)結(jié)構(gòu)的指示作用,構(gòu)造理想時間序列IS,該序列由Logistic 映射[11]產(chǎn)生,長度為3000,其迭代方程如下: 其中λ∈ [0,4],表示生長率。取初始值x1=0.7,理想時間序列IS 的前1000 個數(shù)據(jù)的參數(shù)為λ=3.5,處于四周期狀態(tài),中間1000 個數(shù)據(jù)的參數(shù)為λ=3.6 和后1000 個數(shù)據(jù)的參數(shù)為λ=3.7,兩者均處于混沌狀態(tài),其演化曲線由圖1 給出。從IS 的構(gòu)造可知,在n=1001時,系統(tǒng)的演化由四周期變?yōu)榛煦鐮顟B(tài),變化幅度比較大;在n=2001時,系統(tǒng)的演化由較低的生長率3.6變成較高的生長率3.7。IS 序列前部分的復(fù)雜度比中間部分的復(fù)雜度低,中間部分的復(fù)雜度比后部分的復(fù)雜度低,且前部分與中間部分的復(fù)雜度差距會明顯大于中間部分與后部分的復(fù)雜度差距。 圖1 理想時間序列IS 圖2 IS序列的WPE值 取滑動窗口為150,滑動步長為1,嵌入維m=3,延遲時間τ=2,對時間序列IS進(jìn)行加權(quán)排列熵檢測,結(jié)果由圖 2 給出。在n=1000 和n=2000 前后,WPE 值分別呈現(xiàn)出三種不同的穩(wěn)定狀態(tài)。前部分的WPE 值處于較低水平,后部分的WPE 值處于較高水平,而中間部分的WPE值處于兩者之間,由熵的物理意義可知前部分?jǐn)?shù)據(jù)的復(fù)雜度比中間部分的復(fù)雜度低,中間部分?jǐn)?shù)據(jù)的復(fù)雜度比后部分的復(fù)雜度低,與理想時間序列IS的構(gòu)造基本一致,說明加權(quán)排列熵的改變和大小的差異可以用來指示時間序列的動力學(xué)行為。 選取研究區(qū)為膠東大尹格莊金礦,該金礦是典型蝕變巖型礦床,位于招(遠(yuǎn))—平(度)斷裂帶的中段。圍巖蝕變主要包括鉀長石化、硅化、絹云母化、綠泥石化、(黃鐵)絹英巖化、碳酸鹽化等,其中黃鐵絹英巖化是礦區(qū)最發(fā)育的一種中溫?zé)嵋何g變,也是金礦化關(guān)系最密切的蝕變作用。主要開采-500~-140m之間的工業(yè)礦石,礦床地球化學(xué)研究證實,成礦流體多期活動,具有幔源、巖漿熱液與大氣降水等多種來源途徑[12-13]。 本文選取大尹格莊金礦-175m、-210m 和-290m中段共20條勘探線(其中-175m中段7條,-210m中段8條,-290m中段5條)中的Au元素刻槽含量數(shù)據(jù)序列作為研究對象,分別記為CMi(i 為樣本序號)。對這20條勘探線中的Au 元素含量數(shù)據(jù)序列進(jìn)行基本的統(tǒng)計描述和采用雅克—貝拉檢測(Jarque-Bera Test,JB 檢測)進(jìn)行正態(tài)性檢驗,統(tǒng)計結(jié)果見表1。 表1 Au元素含量數(shù)據(jù)的統(tǒng)計描述和正態(tài)檢驗 在95%的置信度下,統(tǒng)計結(jié)果顯示Au元素含量數(shù)據(jù)分布為明顯的尖峰、右偏分布,JB統(tǒng)計值所對應(yīng)的概率均小于0.05,表明這20條勘探線的Au元素含量序列顯著呈非正態(tài)分布。因此,那些基于正態(tài)分布假設(shè)前提的傳統(tǒng)方法難以準(zhǔn)確地描述其非線性的特征。 使用加權(quán)排列熵刻畫Au元素含量序列的復(fù)雜度,取嵌入維m=3,延遲時間τ=1,分別計算大尹格莊金礦20條勘探線Au元素含量序列的加權(quán)排列熵值。同時,根據(jù)Au元素含量值,將勘探線所對應(yīng)的礦化強(qiáng)度由強(qiáng)到弱分為4個不同的礦化等級[14]。大尹格莊金礦Au元素的工業(yè)品位是2g/t(2×10-6),統(tǒng)計勘探線元素含量大于邊界品位的個數(shù),得出元素含量大于邊界品位的個數(shù)在該勘探線的比例p,記4種不同的礦化等級為:(Ⅰ)強(qiáng)礦化區(qū),比例p大于33%,礦體部分連續(xù);(Ⅱ)中等礦化區(qū),比例p為20%~33%,礦體區(qū)域間斷出現(xiàn),變化幅度大;(Ⅲ)弱礦化區(qū),比例p為10%~20%,難以圈定礦體區(qū)域,或為礦體尖滅末端;(Ⅳ)無礦化區(qū),比例p小于10%。大尹格莊金礦20條勘探線所對應(yīng)的加權(quán)排列熵值與礦化等級如表2所示。 表2 Au元素的加權(quán)排列熵值與礦化等級 由表2 可知,屬于強(qiáng)礦化區(qū)的勘探線有-175m 中段的CM1、CM5,-210m中段的CM7,和-290m中段的CM3,共4條勘探線,其Au元素含量序列的WPE值分別為0.8123、0.9103、08871、0.9272。中等礦化區(qū)的勘探線有-175m中段的CM2、CM4、CM6,-210m中段的CM4、CM6 和 CM8,共 6 條勘探線。弱礦化區(qū)的勘探線有-175m 中段的CM3,-210m 中段的CM5,-290m中段的CM1和CM2,共4條勘探線。無礦化區(qū)的勘探線有-175m 中段的 CM7,-210m 中段的 CM1、CM2、CM3,-290m中段的CM4和CM5,共6條勘探線。 根據(jù)Au 勘探線礦化等級與加權(quán)排列熵值進(jìn)行對比分析,其結(jié)果如圖3所示。 圖3 Au元素礦化等級與加權(quán)排列熵值 圖中顯示,得到的WPE值的大小與不同礦化等級之間存在一定的關(guān)聯(lián),其WPE 值由大到小依次為:中等礦化>強(qiáng)礦化>弱礦化>無礦化,且強(qiáng)礦化、中等礦化和弱礦化之間的相鄰差距是大致相近的,而無礦化和弱礦化之間的差距明顯大于前者。表明在無礦化區(qū)Au 元素含量絕大部分集中在低含量值(低于Au 元素的邊界品位2g/t),沒有或幾乎沒有發(fā)生金礦化,Au元素含量相對有序,復(fù)雜性較低,其對應(yīng)的WPE 值較小。隨著礦化強(qiáng)度的增加,Au元素含量序列的復(fù)雜度發(fā)生不同的改變。在弱礦化區(qū),Au元素的含量以低含量值為主,但有小部分(10%~20%)含量值是超過邊界品位的,因此復(fù)雜性相對無礦化區(qū)有所增強(qiáng),WPE 值也有所增大。在中等礦化區(qū),礦區(qū)區(qū)域間斷出現(xiàn),Au元素含量序列發(fā)生間斷性混沌,而加權(quán)排列熵考慮了時間序列的幅值信息,放大了這種間斷性特征,因此復(fù)雜性最強(qiáng),WPE 值最大。在強(qiáng)礦化區(qū),Au元素含量序列的高含量值占比最高,序列趨向于高品位的局部聚集,其復(fù)雜性相對于中等礦化有所減弱,WPE 值也有一定的減小。Au元素含量礦化等級與WPE的對比結(jié)果與用其他非線性指標(biāo)對Au 元素含量序列復(fù)雜性的研究結(jié)論基本一致[15]。 (1)通過Logistic模型檢驗了加權(quán)排列熵是識別不同動力學(xué)狀態(tài)的有效指標(biāo)之一,能有效放大時間序列的微小變化,為進(jìn)一步地質(zhì)數(shù)據(jù)的應(yīng)用提供了理論依據(jù); (2)通過對大尹格莊多中段共20條勘探線的Au元素含量序列的加權(quán)排列熵分析和比較,發(fā)現(xiàn)不同礦化強(qiáng)度的元素含量序列的加權(quán)排列熵值存在差異,說明不同礦化強(qiáng)度的元素含量序列具有不同的復(fù)雜度,這種差異性可用于礦化識別,為進(jìn)一步定量刻畫礦床富集程度和圈定有利成礦靶區(qū)提供參考。1.2 加權(quán)排列熵的動力學(xué)識別檢驗
2 加權(quán)排列熵在礦化識別中的應(yīng)用
2.1 樣本來源與基本統(tǒng)計
2.2 計算過程與討論
3 結(jié)論