汪雪元,何劍鋒*,聶逢君,袁兆林,劉 琳
1.東華理工大學(xué)江西省放射性地學(xué)大數(shù)據(jù)技術(shù)工程實(shí)驗(yàn)室,江西 南昌 330013 2.東華理工大學(xué)江西省核地學(xué)數(shù)據(jù)科學(xué)與系統(tǒng)工程技術(shù)研究中心,江西 南昌 330013 3.東華理工大學(xué)軟件學(xué)院,江西 南昌 330013
在復(fù)雜地質(zhì)樣品的X射線(xiàn)熒光分析中,峰位接近的譜峰之間常常會(huì)發(fā)生重疊,嚴(yán)重的重疊譜峰對(duì)于樣品成分定性分析的準(zhǔn)確度和定量分析的精度構(gòu)成較大影響。重疊峰分解一直是光譜分析領(lǐng)域的重點(diǎn)研究課題,遺傳算法和人工神經(jīng)網(wǎng)絡(luò)等智能算法近年來(lái)被廣泛應(yīng)用于光譜重疊峰分解[1-6]。黃洪全等提出了高斯混合模型結(jié)合期望最大化迭代算法進(jìn)行重疊峰分解[7];楊熙等將粒子群算法應(yīng)用于重疊譜峰的解析[1];黃凡等將模擬退火算法應(yīng)用于振動(dòng)光譜成分分析[2];徐喜榮[4]等將神經(jīng)網(wǎng)絡(luò)分析應(yīng)用于重疊峰的分解。智能算法在對(duì)譜峰重疊嚴(yán)重的復(fù)雜地質(zhì)樣品進(jìn)行分析時(shí),往往存在計(jì)算量過(guò)大、弱峰誤差較大、收斂于局部極小值或不收斂等問(wèn)題。
量子遺傳算法具有較好收斂性,本文對(duì)量子遺傳算法進(jìn)行了改進(jìn)。并將改進(jìn)后算法和特征X射線(xiàn)譜的概率統(tǒng)計(jì)模型,應(yīng)用于X射線(xiàn)熒光重疊峰的分解。實(shí)驗(yàn)結(jié)果顯示,新方法提高了重疊峰分解的準(zhǔn)確度。
在X射線(xiàn)熒光能譜分析中,K系和L系特征X射線(xiàn)常分別用于輕元素和重元素的定性定量分析。K系譜線(xiàn)有Kα1,Kα2,Kβ1,Kβ2四條,L系譜線(xiàn)主要有Lα1,Lα2,Lβ1,Lβ2,Lγ1五條。將元素的K系和L系特征X射線(xiàn)應(yīng)用于能譜分析,有助于提高元素定性分析的準(zhǔn)確度和定量分析的精度。因此,提出了一種基于X熒光分析儀分析范圍內(nèi)的所有元素的元素關(guān)聯(lián)高斯混合模型(gaussian mixture model-element related,GMM-ER)
(1)
式(1)中,M為X熒光分析儀能識(shí)別的元素?cái)?shù)量。T(i)為元素i的特征X射線(xiàn)條數(shù),α(i,j)為元素i的第j條分支譜線(xiàn)的權(quán)重,且滿(mǎn)足式(2)。
(2)
式(2)中,u(i,j)和σ(i,j)分別為元素i的第j條分支譜線(xiàn)的均值和標(biāo)準(zhǔn)差。u(i,j)和元素的對(duì)應(yīng)射線(xiàn)能量相關(guān)聯(lián),是線(xiàn)性關(guān)系;并且,σ(i,j)和u(i,j)之間存在線(xiàn)性關(guān)系[1],即有σ(i,j)=u(i,j)σ(1,1)/u(1,1)(i=1,…,M;j=1,…,T(i))。對(duì)于K系特征X射線(xiàn),除少量輕元素外,α(i,1),α(i,2),α(i,3),α(i,4)之間的比值是確定的。GMM-ER模型的參數(shù)可表示為θ=[α(1,1),α(1,2),…,α(1,T(1)),…,α(M,1),α(M,2),…,α(M,T(M)),u(1,1),u(1,2),…,u(1,T(1)),…,u(M,1),u(M,2),…,u(M,T(M)),σ(1,1),σ(1,2),…,σ(1,T(1)),…,σ(M,1),σ(M,2),…,σ(M,T(M))]。
設(shè)樣本數(shù)據(jù)為x(n)(n=1,2,3,…,N),n為道址,x(n)為道址n處的計(jì)數(shù)值??梢圆捎闷谕畲蠡?expectation maximization,EM)的迭代算法由樣本數(shù)據(jù)求得GMM-ER模型的參數(shù)θ值。在實(shí)際求解過(guò)程中,由于GMM-ER模型的參數(shù)太多,θ的求解經(jīng)常難以實(shí)現(xiàn)。本文通過(guò)下面方法實(shí)現(xiàn)對(duì)θ的簡(jiǎn)化。
量子遺傳算法(quantum genetic algorithm,QGA)基于量子計(jì)算原理,對(duì)參數(shù)采用量子比特編碼,利用量子邏輯門(mén)實(shí)現(xiàn)染色體的演化。相對(duì)于常規(guī)遺傳算法,量子遺傳算法常常可以獲得較好的收斂性[8-10]。為減少計(jì)算量和演化迭代次數(shù),本文根據(jù)光譜數(shù)據(jù)特點(diǎn)對(duì)傳統(tǒng)量子遺傳算法進(jìn)行改進(jìn)。
(3)
式(3)中,k為編碼每一位基因的量子比特?cái)?shù),e(d)為第d光譜段待分析元素?cái)?shù)量,且有|αij|2+|βij|2=1。
(4)
(5)
(3)量子旋轉(zhuǎn)門(mén):量子遺傳算法通常采用量子旋轉(zhuǎn)門(mén)實(shí)現(xiàn)演化操作,如式(6)所示,其中θi為旋轉(zhuǎn)角。
(6)
(4)初始化群體:在改進(jìn)量子遺傳算法中,由式(7)得到a(i,1)的初始值,其中,cu(i,1)表示道址u(i,1)處的相對(duì)計(jì)數(shù)值。由a(i,1)確定個(gè)體量子比特編碼初始值。
(7)
用高斯函數(shù)模擬能量色散X熒光譜線(xiàn)特征峰,產(chǎn)生原子序數(shù)25—28元素錳、鐵、鈷和鎳的模擬光譜。這四種元素的主要K系特征X射線(xiàn)能量及比例關(guān)系如表1所示。
表1 錳、鐵、鈷和鎳的主要K系特征X射線(xiàn)Table 1 Main K-series characteristic X-rays of Mn,Fe,Co and Ni
假設(shè)一2 048道的能量色散X熒光分析儀的能量刻度已知,其能量E和道址N的關(guān)系式如式(8)所示
E=0.007 955N+0.134 714 (keV)
(8)
則由式(8)可求得GMM-ER模型中元素錳、鐵、鈷和鎳的u(i,j)的值。設(shè)σu值已知為0.04,則由σ(i,j)=u(i,j)σu可求得σ(i,j)的值,如表2所示
表2 錳、鐵、鈷和鎳的u(i,j)值和σ(i,j)值Table 2 u(i,j)and σ(i,j)values of Mn,Fe,Co and Ni
錳、鐵、鈷和鎳的模擬高斯特征峰(Kα1)的強(qiáng)度(峰面積)分別設(shè)為20 000,30 000,30 000和20 000。則模擬重疊譜如圖1所示。可以看出,譜峰重疊嚴(yán)重。
圖1 錳、鐵、鈷和鎳的模擬重疊譜Fig.1 Simulated overlapping spectra of Mn,Fe,Co and Ni
采用傳統(tǒng)量子遺傳算法和改進(jìn)的量子遺傳算法的群體搜索技術(shù),計(jì)算在統(tǒng)計(jì)意義下形成重疊譜的隨機(jī)數(shù)歸屬于各個(gè)GMM-ER模型的概率,搜索到“全局最大概率”GMM-ER模型,該GMM-ER的參數(shù)就是所求元素Kα1或Lα1特性X射線(xiàn)的強(qiáng)度。
(1)確定GMM-ER模型參數(shù)
(3)重疊峰分解及總體結(jié)果分析
設(shè)置初始種群個(gè)體為100,迭代次數(shù)為100。將傳統(tǒng)量子遺傳算法和改進(jìn)量子遺傳算法分別應(yīng)用于模擬重疊譜的分解。每種算法進(jìn)行10次分解,分解過(guò)程的最優(yōu)適應(yīng)度值如表3所示。最優(yōu)適應(yīng)度值越小表示總體誤差越小,即重疊峰分解效果越好。
表3 重疊譜分解的最優(yōu)適應(yīng)度值Table 3 Optimal fitness values of overlapping spectral decomposition
從表3結(jié)果計(jì)算可得,最優(yōu)適應(yīng)度平均值降了32.1%,改進(jìn)量子遺傳算法的重疊峰分解效果總體優(yōu)于傳統(tǒng)量子遺傳算法。傳統(tǒng)量子遺傳算法第7次實(shí)驗(yàn)的分解效果最佳,最優(yōu)適應(yīng)度值為13 833,改進(jìn)量子遺傳算法第5次實(shí)驗(yàn)的分解效果最佳,最優(yōu)適應(yīng)度值為3 604,最優(yōu)適應(yīng)度值降了73.9%,可以看出,在最佳重疊峰分解效果方面,改進(jìn)量子遺傳算法遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)量子遺傳算法。
(4)最佳分解效果分析
對(duì)兩種遺傳算法的最佳重疊峰分解效果進(jìn)行比較。傳統(tǒng)量子遺傳算法第7次實(shí)驗(yàn)和改進(jìn)量子遺傳算法第5次實(shí)驗(yàn)的重疊譜分解情況如圖2和表4所示。
從圖2可以看出兩種量子遺傳算法均能成功分解重疊譜峰,且GMM-ER重疊峰和原始重疊譜均能較好擬合。但從表4可以看出,除鉻、鐵外,錳、鈷、鎳、銅和鋅的分解相對(duì)誤差,改進(jìn)量子遺傳算法優(yōu)于傳統(tǒng)量子遺傳算法。在應(yīng)用量子遺傳算法對(duì)重疊峰進(jìn)行分解的過(guò)程中,含量比例高的元素對(duì)總體分解精度的影響大于含量比例低的元素。在只有一個(gè)適應(yīng)度值的傳統(tǒng)量子遺傳算法中,含量比例高的元素會(huì)獲得最優(yōu)分解效果,而含量比例較低的元素的分解精度可能較差。而改進(jìn)量子遺傳算法對(duì)每一種待分解元素都設(shè)有一個(gè)適應(yīng)度值,使得不同含量比例的元素的分解精度較為均衡。表4中,傳統(tǒng)量子遺傳算法的分解相對(duì)誤差區(qū)間為[-3.19,2.35],改進(jìn)量子遺傳算法為[-0.815,1.15],縮小了64.5%??梢钥闯?,改進(jìn)量子遺傳算法的分解精度總體上高于傳統(tǒng)量子遺傳算法。
圖2 原始重疊譜、GMM-ER重疊峰和分解峰(a):傳統(tǒng)量子遺傳算法;(b):改進(jìn)量子遺傳算法Fig.2 Original overlapping spectrum,GMM-ER overlapping peak and decomposition peak(a):Traditional quantum genetic algorithm;(b):Improved quantum genetic algorithm
表4 分解前和分解后的特征X射線(xiàn)強(qiáng)度Table 4 Intensity of characteristic X-ray before and after decomposition
圖3為傳統(tǒng)量子遺傳算法和改進(jìn)量子遺傳算法運(yùn)行過(guò)程中全局最優(yōu)個(gè)體的適應(yīng)度值隨迭代次數(shù)變化趨勢(shì)圖??梢?jiàn),改進(jìn)量子遺傳算法的收斂速度快于傳統(tǒng)量子遺傳算法。
圖3 搜索全局最優(yōu)GMM-ER的過(guò)程(a):傳統(tǒng)量子遺傳算法;(b):改進(jìn)量子遺傳算法Fig.3 The process of searching global optimal GMM-ER(a):Traditional quantum genetic algorithm;(b):Improved quantum genetic algorithm
由元素的K系和L系特征X射線(xiàn),從統(tǒng)計(jì)學(xué)角度提出了一種基于X熒光分析儀分析范圍內(nèi)所有元素的元素關(guān)聯(lián)高斯混合模型(GMM-ER)。并基于X射線(xiàn)熒光光譜的物理特性和GMM-ER模型的特點(diǎn),對(duì)傳統(tǒng)量子遺傳算法進(jìn)行了改進(jìn)。用傳統(tǒng)量子遺傳算法和改進(jìn)量子遺傳算法對(duì)模擬重疊譜進(jìn)行重疊峰分解。實(shí)驗(yàn)結(jié)果顯示,改進(jìn)量子遺傳算法的重疊峰分解精度優(yōu)于傳統(tǒng)量子遺傳算法,并且收斂速度快于傳統(tǒng)量子遺傳算法,且相對(duì)誤差曲線(xiàn)更為平滑。通過(guò)對(duì)一鉛黃銅標(biāo)樣(Cu:62.83%,Zn:33.56%,Pb:2.30%,Fe:0.16%,Sn:0.33%,Ni:0.31%,Mn:0.12%)的實(shí)驗(yàn)光譜進(jìn)行分析,采用本文的改進(jìn)量子遺傳算法進(jìn)行重疊峰分解,其效果優(yōu)于傳統(tǒng)量子遺傳算法。綜上所述,本文提出的基于元素關(guān)聯(lián)高斯混合模型和改進(jìn)量子遺傳算法的譜線(xiàn)解析方法,特別適合于嚴(yán)重的重疊譜峰的分解。