劉 斌 郭 思 魏友華 詹澤東
(1.成都理工大學(xué)地球物理學(xué)院,四川 成都 610059;2.數(shù)學(xué)地質(zhì)四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610059)
FastICA算法在土壤地球化學(xué)異常檢測中的應(yīng)用
劉 斌1,2郭 思1,2魏友華1,2詹澤東1,2
(1.成都理工大學(xué)地球物理學(xué)院,四川 成都 610059;2.數(shù)學(xué)地質(zhì)四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610059)
將FastICA算法應(yīng)用于青海省大柴旦鎮(zhèn)某地區(qū)1∶10 000土壤地球化學(xué)數(shù)據(jù)處理中,借鑒相關(guān)系數(shù)來解決FastICA算法分離后順序不確定性的局限,使用累積頻率法解決分離后數(shù)據(jù)幅度不確定性問題,進(jìn)而劃分元素異常分帶序列,選取85%、95%和98%作為異常分級(jí)??梢园l(fā)現(xiàn),相比直接用傳統(tǒng)累積頻率法圈定異常,F(xiàn)astICA算法充分考慮了數(shù)據(jù)的高階統(tǒng)計(jì)特性,經(jīng)過FastICA算法處理后的數(shù)據(jù)更能體現(xiàn)元素的空間分布特征。經(jīng)后期工程驗(yàn)證,F(xiàn)astICA算法處理后的元素異常分布與實(shí)際的礦(化)體吻合度很高,能起到還原真實(shí)信息的目的,對指導(dǎo)下一步找礦具有現(xiàn)實(shí)意義,從而說明將FastICA算法應(yīng)用于地球化學(xué)數(shù)據(jù)處理中是有效的。
FastICA 異常檢查 累積頻率 地球化學(xué)異常
地球化學(xué)數(shù)據(jù)作為礦產(chǎn)資源定量預(yù)測的重要信息源,關(guān)鍵就是從中提取礦產(chǎn)資源信息,圈定找礦范圍,提供預(yù)測靶區(qū)[1]。由于地球化學(xué)的元素?cái)?shù)據(jù)是經(jīng)過采樣和分析得來的,在這一過程中就會(huì)產(chǎn)生相應(yīng)的干擾,為了抑制這種干擾,突出元素的空間分布特征,提取其中的異常信息顯得尤為重要[2]。傳統(tǒng)的數(shù)據(jù)分析方法(如均值方差法、累積頻率法、直方圖解法等)沒有考慮數(shù)據(jù)的高階統(tǒng)計(jì)特性[3],再加上地學(xué)信息的復(fù)雜性,異常提取效果并不是十分理想。為了進(jìn)一步挖掘化探數(shù)據(jù)的深層次地學(xué)信息,很多學(xué)者研究了元素的空間分布特征和出露地質(zhì)體的物理、化學(xué)性質(zhì)[4]。同時(shí),各種各樣的定量地球化學(xué)方法得到快速發(fā)展,比如空間統(tǒng)計(jì)、分形、判別分析和模糊聚類[5-6]。這些方法都與元素濃度值頻數(shù)分布相關(guān),并且都建立在認(rèn)為跟礦化有關(guān)的認(rèn)知上,可能導(dǎo)致與礦化無關(guān)的假異常[7]??陀^來說,化探數(shù)據(jù)處理方法應(yīng)該只考慮數(shù)據(jù)基數(shù)[8],比如獨(dú)立成分分析方法(ICA)是一種考慮了數(shù)據(jù)的高階統(tǒng)計(jì)特性的方法,可以用來挖掘有用的隱含信息,為后續(xù)分析提供支持。在先期的研究中,獨(dú)立分量分析(ICA)在地球化學(xué)中的應(yīng)用尚處于起步階段[9]。
1.1 獨(dú)立成分分析
獨(dú)立成分分析(ICA)是一種滿足統(tǒng)計(jì)獨(dú)立假設(shè)下的從高階統(tǒng)計(jì)相關(guān)角度來分析數(shù)據(jù)的技術(shù)[10]。通過對混合信號(hào)的“分解”來完成一組隨機(jī)初始量對隱含在混合信號(hào)中獨(dú)立源信號(hào)的逼近,而每個(gè)混合信號(hào)都是多個(gè)原始信號(hào)的線性組合,見圖1。
圖1 信號(hào)混合過程Fig.1 Signal mixing process
因此,獨(dú)立分量分析的基本數(shù)學(xué)模型為
(1)
其中,x為混合信號(hào),
s為源信號(hào),
W為n×n階非奇異混合矩陣,wj為混合矩陣的n維列向量。
由于公式中僅混合信號(hào)x是已知的,那么若要分離出源信號(hào),就必須構(gòu)建一個(gè)n×n階的矩陣A,并使其對混合信號(hào)x滿足
(2)
則y即為對源信號(hào)s的一個(gè)最優(yōu)估計(jì)。
1.2 FastICA算法
FastICA算法原理可簡述為:通過負(fù)熵最大化確
定目標(biāo)函數(shù)和針對目標(biāo)函數(shù)進(jìn)行牛頓迭代求得最優(yōu)值。為使負(fù)熵達(dá)到最大,獲得最優(yōu)的E[G(wTx)],根據(jù)Kuhn-Tuchker條件,在
時(shí),最優(yōu)值必須滿足
(3)
其中,β為常量,且
w0是w的最優(yōu)值;g是G的一階導(dǎo)數(shù)。經(jīng)過進(jìn)一步簡化迭代公式,
(4)
(5)
研究區(qū)位于青海省,東距西寧市700 km,西距大柴旦鎮(zhèn)35 km。地理坐標(biāo)范圍為東經(jīng)95°47′51″~95°58′18″、北緯37°42′44″~37°45′14″。研究區(qū)1∶10 000土壤地球化學(xué)測量面積約6 km2。經(jīng)過1∶10 000地質(zhì)草測工作可知,研究區(qū)大面積出露的地層為志留系、二疊系及第四系,巖石類型有礫巖、蝕變礫巖、砂巖、石英片巖、蝕變石英片巖、長石石英砂巖、巖屑砂巖、長石石英砂巖、板巖、千枚巖,礦化包含硅化、褐鐵礦化、黃鐵礦化、孔雀石化、黃銅礦化。研究區(qū)主要包含Au礦化帶和Cu礦化帶,其中Au礦化帶主要分布于二疊系地層中,Cu礦化帶主要分布于志留系地層中。在研究區(qū)內(nèi)發(fā)現(xiàn)的礦物有方鉛礦、孔雀石和藍(lán)銅礦等。
以青海省大柴旦鎮(zhèn)某地區(qū)1∶10 000土壤地球化學(xué)測量工作為基礎(chǔ),共布施了34條土壤化探剖面線,完成土壤地球化學(xué)測量6 km2,網(wǎng)度為100 m×20 m。采集土壤地球化學(xué)樣品3 307個(gè),Au、Cu、Pb、As、Sb、Zn的土壤地球化學(xué)數(shù)據(jù)的特征見表1。
表1 土壤地球化學(xué)測量元素地球化學(xué)特征參數(shù)Table 1 Parameters of soil geochemical characteristics
注:Au元素含量單位為10-9,其余元素含量單位為10-6。
首先對原始數(shù)據(jù)用Kolmogorov-Smirnov方法作正態(tài)分布檢驗(yàn),得出6種元素的漸近顯著性結(jié)果都小于0.05,均不服從正態(tài)分布,所以FastICA算法可以應(yīng)用于該數(shù)據(jù)。根據(jù)原始地球化學(xué)數(shù)據(jù)相互統(tǒng)計(jì)獨(dú)立等特征和FastICA算法原理,分析得到的6種元素含量值即看作混合信號(hào),應(yīng)用FastICA算法對其進(jìn)行處理,由于FastICA算法是對源信號(hào)的一種拷貝或估計(jì),從分離結(jié)果來說,順序和相位都發(fā)生了變化,借助相關(guān)系數(shù)矩陣,將分離出的6種元素與原始數(shù)據(jù)形成一一對應(yīng)關(guān)系,其相關(guān)系數(shù)見表2。其中,y1、y2、y3、y4、y5、y6獨(dú)立成分對應(yīng)的元素分別為Pb、Sb、As、Au、Cu、Zn,分析結(jié)果既保持了數(shù)據(jù)的基本形態(tài),又能從地球化學(xué)數(shù)據(jù)中提取有效元素信息。
表2 相關(guān)系數(shù)結(jié)果Table 2 The correlation coefficient
由于FastICA算法分離后數(shù)據(jù)的相位跟原始地球化學(xué)數(shù)據(jù)有所不同,是因?yàn)樵撍惴ㄖ皇菍υ磾?shù)據(jù)的一個(gè)拷貝或估計(jì),它體現(xiàn)的是數(shù)據(jù)整體趨勢。在這里,通過累積頻率來確定元素的分布特征,進(jìn)而解決幅度不確定問題,選定分級(jí)頻率85%、95%和98%作為圈定元素異常的外帶、中帶和內(nèi)帶。同樣,對原始數(shù)據(jù)用累積頻率來圈定異常等值線,其原始數(shù)據(jù)和分離后數(shù)據(jù)的三級(jí)累積頻率值見表3,原始數(shù)據(jù)異常分帶和FastICA算法分離后數(shù)據(jù)異常分帶見圖2~圖7。
根據(jù)圈定的異常等值線開展探槽工作,對研究區(qū)范圍內(nèi)成礦元素Au和Cu 2種元素進(jìn)行異常分析,結(jié)合圈定的土壤化探Au和Cu的異常分布圖可以看出,2種方式圈定的Au和Cu異常等值線圖區(qū)別較明顯。在點(diǎn)(749 485,4 182 843)附近,Au元素原始數(shù)據(jù)有明顯的異常顯示,而經(jīng)過FastICA處理過后的數(shù)據(jù)則沒有,與實(shí)際情況相符;在點(diǎn)(748 941,4 181 961)和點(diǎn)(749 739,4 183 184)附近,Cu元素原始數(shù)據(jù)無明顯的異常顯示,而經(jīng)過FastICA處理過后的數(shù)據(jù)則異常明顯,與實(shí)際情況相符。從應(yīng)用結(jié)果來看,直接對原始數(shù)據(jù)圈定的異常找礦指示意義并不明顯,而經(jīng)過FastICA算法處理過后圈定的異常跟真實(shí)情況更為接近,更能反映元素的空間分布特征,提高找礦的有效性。
表3 累積頻率圈定的分帶序列 Teble 3 Zoning sequences delineated by cumulative frequency
注:Au元素含量單位為10-9,其余元素含量單位為10-6。
圖2 Au元素處理前后異常Fig.2 Anomalies of Au before and after processing
圖3 Cu元素處理前后異常Fig.3 Anomalies of Cu before and after processing
圖4 Pb元素處理前后異常Fig.4 Anomalies of Pb before and after processing
圖5 As元素處理前后異常Fig.5 Anomalies of As before and after processing
圖6 Zn元素處理前后異常Fig.6 Anomalies of Zn before and after processing
圖7 Sb元素處理前后異常Fig.7 Anomalies of Sb before and after processing
[1] 王世稱,陳永良.綜合信息礦產(chǎn)資源預(yù)測理論與方法[M].北京:科學(xué)出版社,2002. Wang Shicheng,Chen Yongliang.Theory and Methods of Mineral Resources Prediction Based on Synthetic Information[M].Beijing:Science Press,2002.
[2] Cheng Q,Xu Y,Grunsky E.Integrated spatial and spectrum method for geochemical anomaly separation[J].Natural Resources Research,2000(9):43-52.
[3] Cheng Q M.Mapping singularities with stream sediment geochemical data for prediction of undiscovered mineral deposits in Gejiu,Yunnan province,China[J].Ore Geology Reviews,2007,32(12):314-324.
[4] Wang Wenlei,Zhao Jie,Cheng Qiuming.Analysis and integration of geo-information to identify granitic intrusions as exploration targets in southeastern Yunnan district,China[J].Computers & Geosciences,2011(37):1946-1957.
[5] Ghavami-Riabi R,Seyedrahimi-Niaraq M M,Khalokakaie R,et al.U-spatial statistic data modeled on a probability diagram for investigation of mineralization scalings and exploration of shear zone gold deposits[J].Journal of Geochemical Exploration,2010(104):27-33.
[6] Goncalves M A,Mateus A,Oliveria V.Geochemical anomaly separation by multifractal modeling[J].Journal of Geochemical Exploration,2001(72):91-114.
[7] Parisa R,Ahmad R M,Seyed H T.Objective based geochemical anomaly detection-application of discriminant function analysis in anomaly delineation in the Kuh Panj porphyry Cu mineralization (Iran)[J].Journal of Geochemical Exploration,2013(130):65-73.
[8] Lenca P,Meyer P,Vaillant B,Lallich S.On selecting interestingness measures for association rules:User oriented description and multiple criteria decision aid[J].European Journal of Operational Research,2008(184):610-626.
[9] 余先川,劉立文,胡 丹,等.基于穩(wěn)健有序獨(dú)立成分分析(ROICA)的礦產(chǎn)預(yù)測[J].吉林大學(xué)學(xué)報(bào):地球科學(xué)版,2012,42(3):872-880. Yu Xianchuan,Liu Liwen,Hu Dan,et al.Robust ordinal independent component analysis(ROICA)applied to mineral resources prediction[J].Journal of Jilin University:Earth Science Edition,2012,42(3):872-880.
[10] 張建明,林亞平,吳宏斌,等.獨(dú)立成分分析的研究進(jìn)展[J].系統(tǒng)仿真學(xué)報(bào),2006,18(4):992-1001. Zhang Jianming,Lin Yaping,Wu Hongbin,et al.Advances of research in independent component analysis[J].Journal of System Simulation,2006,18(4):992-1001.
(責(zé)任編輯 鄧永前)
Application of the FastICA Algorithm in Detection of Soil Geochemical Anomaly
Liu Bin1,2Guo Si1,2Wei Youhua1,2Zhan Zedong1,2
(1.CollegeofGeophysics,ChengduUniversityofTechnology,Chengdu610059,China;2.GeomathematicsKeyLaboratoryofSichuanProvince,Chengdu610059,China)
The FastICA algorithm is applied to process the 1∶10 000 soil geochemical data in the area of Dachaidan town in Qinghai province.The correlation coefficients are introduced to overcome the limitation of sequential uncertainty after the separation of FastICA algorithm,and the cumulative frequency method is used to solve the problem of data amplitude uncertainly after separation.The elements anomaly zoning sequences are divided,among which 85%,95% and 98% are selected as the three levels of anomaly in classification.It is clear that the FastICA algorithm takes full consideration of the characteristics of high order statistics,so the data from the algorithm can more clearly reflect the spatial distribution characteristics of elements compared with delineating anomaly by the traditional cumulative frequency method.The late engineering validation confirmed that the elements anomaly distribution acquired by the FastICA algorithm highly matches with the actual ore body (mineralization).So,the FastICA algorithm has the function of restoring the real information and has the significance in guiding the next prospecting work.It is effective to process the geochemical data by applying the FastICA algorithm.
FastICA,Anomaly detection,Cumulative frequency,Geochemical anomaly
2014-01-23
國家自然科學(xué)基金項(xiàng)目(編號(hào):41272363),青海省地質(zhì)勘察基金項(xiàng)目(編號(hào):QGTZXG2012-01),四川省教育廳科研項(xiàng)目(編號(hào):13ZB0063)。
劉 斌(1987—),男,博士研究生。
P628
A
1001-1250(2014)-05-125-05