韋怡
摘 要: 為了解決質譜儀運行靈敏度故障對環(huán)境監(jiān)測和化學污染監(jiān)測產生的影響,提高監(jiān)測數(shù)據的準確性和可靠性,提出了一種基于半監(jiān)督學習和稀疏表示研究質譜儀運行靈敏度故障檢測算法。根據半監(jiān)督學習的原理對質譜儀的運行數(shù)據進行劃分,在混合數(shù)據中標記運行靈敏度的故障特征。通過對應特征處理原始數(shù)據,在去噪和歸一化特征的基礎上求取靈敏度系數(shù)。采用稀疏表示理論對系數(shù)轉換,以約束范數(shù)關系建立故障監(jiān)測目標函數(shù),檢測質譜儀運行靈敏度故障。結果表明:以3種類型運行靈敏度故障作為測試對象,新算法可以實現(xiàn)較高精度的故障檢測,且不受樣本數(shù)量的限制,具有一定的應用價值。
關鍵詞: 半監(jiān)督學習;稀疏表示;質譜儀;故障檢測
中圖分類號: TP181;TQ110.9
文獻標志碼: A ?文章編號: 1001-5922(2023)08-0142-04
A fault detection algorithm for running sensitivity of mass Spectrometer ?based on semi-supervised learning and sparse representation
WEI Yi
(Jiangxi University of Technology,Nanchang 332020,China)
Abstract: In order to solve the impact of mass spectrometer operating sensitivity failure on environmental monitoring and chemical pollution monitoring,and improve the accuracy and reliability of monitoring data,a fault detection algorithm for mass spectrometer operating sensitivity based on semi supervised learning and sparse representation is proposed.According to the principle of semi supervised learning,the operation data of mass spectrometer was divided,and the fault characteristics of operation sensitivity were marked in the mixed data.By processing the raw data with corresponding features,the sensitivity coefficient was calculated based on denoising and normalization features.Using sparse representation theory to transform coefficients,a fault monitoring objective function was established based on constrained norm relationships to detect sensitivity faults in mass spectrometer operation.The experimental results showed that the new algorithm could achieve high-precision fault detection with three types of sensitivity faults as test objects,and was not limited by the number of samples,which had certain application value.
Key words: semi-supervised learning;sparse representation;mass spectrometer;fault detection
質譜儀運行靈敏度故障會對環(huán)境監(jiān)測和化學污染監(jiān)測造成負面影響,例如檢測精度下降、數(shù)據處理出錯和監(jiān)測范圍縮小等[1-2]。因此,需要及時發(fā)現(xiàn)和解決質譜儀運行靈敏度故障問題,以確保監(jiān)測數(shù)據的準確性和可靠性,為環(huán)境保護和公共安全等領域提供技術支持。。
為實現(xiàn)質譜儀的有效應用,如在文獻[3]中,為排除Isoprime 100穩(wěn)定性同位素比質譜儀檢測過程中的常見故障,結合實際操作對儀器進行全方位分析,并且設計了一個故障排除方法。從儀器應用前以及應用過程進行分析,對漏檢、峰值錯檢以及穩(wěn)定性不達標等問題進行預設,對數(shù)據中的重點信息進行提取和標定,在保證數(shù)據準確性的基礎上判斷質譜儀的運行穩(wěn)定性,以此實現(xiàn)質譜儀的高效應用。隨著電感耦合等離子體質譜儀的廣泛應用在文獻[4]中,主要針對電感耦合等離子體質譜儀進行研究,對質譜儀的使用方法進行設定,并根據影響儀器的參數(shù)設計了故障檢測方法。該檢測方法主要針對質譜儀中自帶的Synigistix Version 1.1軟件,對其常見的問題進行分析,通過舉例說明各相運行故障的解決方法,為故障的及時排查提供了參考依據。無論是哪一種傳統(tǒng)方法,均是對常見故障進行分析,為實現(xiàn)質譜儀的有效應用,采用半監(jiān)督學習和稀疏表示技術,重新設計一個質譜儀運行靈敏度的故障檢測算法,為其穩(wěn)定運行提供技術支持。
1 基于半監(jiān)督學習標記運行靈敏度故障特征
隨著機器學習和識別技術的發(fā)展,半監(jiān)督學習算法能夠同時發(fā)揮有監(jiān)督和無監(jiān)督學習的優(yōu)勢,將其應用在質譜儀運行數(shù)據訓練中,可以同時對海量樣本進行標簽設定,在質譜儀運行產生的不同數(shù)據樣本中對數(shù)據進行無差別訓練。在質譜儀運行過程中會產生大量的數(shù)據,將其作為運行靈敏度故障監(jiān)測的訓練集合,只需要對一部分故障特征進行標簽設定,即可以通過半監(jiān)督學習模型進行數(shù)據求解。不同的故障會產生具有特色的故障特征,為實現(xiàn)不同類型故障特征的劃分,對樣本標簽進行給定[5]。假設隨機樣本為 q ,其真實的故障類型標簽為 w∈e ,且 e= 1,2,…,r ?,則樣本通過半監(jiān)督學習模型生成后的特征成分為:
t q =∑ r y=1 β yt q α y∑ y ????(1)
∑r y=1β y=1 ??(2)
式中: β y 為故障特征的混合系數(shù)[6],且 β y≥0 ; t q α y∑ y ??為給定樣本 q 屬于第 y 類故障特征成分的概率; α y 、 ∑ y 均為參數(shù)。在此基礎上, 設定半監(jiān)督學習模型對樣本 q 的故障特征預設標記為 i q ∈e ,則最大化成分概率為:
i q = arg ??max ?o∈e t w=o q ?= arg ??max ?o∈e ∑ r y=1 t w=o,y= Θ ?q ?= ?arg ??max ?o∈e ∑ r y=1 t w=o y= Θ ,q ?×t y= Θ ?q ??????(3)
式中: ?Θ ∈ 1,2,…,r ?為樣本 q 對應的故障特征混合成分; t w=o y= Θ ,q ??為樣本 q 由第 y 類故障特征成分生成但屬于 o 類型的概率。其中 t w=o q ??可表示為:
t y= Θ ?q ?= β y×t q α y∑ y ??∑ r y=1 β yt q α y∑ y ?????(4)
式中: t y= Θ ?q ??為樣本 q ,由第 y 類特征生成的后驗概率[7]。通過式(3)、式(4)能夠看出,對 t w=o y= Θ ,q ??的估計需要知道樣本的標簽,但 t y= Θ ?q ??不需要樣本標記,因此在半監(jiān)督學習模型中對特征進行標記,需要對質譜儀的運行數(shù)據集進行分析,以此對數(shù)據進行預處理。
2 序列向前特征法求取質譜儀運行靈敏度系數(shù)
質譜儀在運行過程中其信號高度與噪聲信號高度之間存在一定聯(lián)系,一般情況下,噪聲范圍分布在質譜峰值后的0.5 s之后。根據圖中內容可知,對信號噪聲的處理與信號高度及平均噪聲有關,因此采用基線噪聲信噪比處理信號噪聲:
p= a s ???(5)
s= ?∑ d d=1 ?f-f - ?2 d ????(6)
式中: p 為信噪比; s 為噪聲標準差; a 為質譜儀信號高度; f - ?為基線噪聲平均高度; f 為噪聲高度; d 為信號強度。直接對數(shù)據的噪聲進行去除,完畢后對樣本數(shù)據的特征進行歸一化處理,本文以序列向前特征選擇方式構建特征子集。
由于質譜儀在運行過程中,橫縱坐標表示內容具有差異性,其中橫坐標一般表示離子的質量數(shù),縱坐標表示采樣強度,而圖譜的信號峰值強度取決于質譜儀的靈敏度。在參數(shù)固定不變的條件下,物質成分的離子流強度與分壓強度是成正比的,則:
g h∝j+ hg k∝j+ k ?????(7)
在常規(guī)質譜儀檢測中待測的混合化合物會存在多種物質。本次以2組物質 h 、 k 為例,其中 g h 、 g k 表示分壓強; j+ h 、 ?j+ k 為離子流強度[8]。對質譜儀的運行靈敏度計算,需要假定其中某一組物質不變,則求取過程:
l= g′ h/g′ k g h/g k = j′ h/j′ k j h/j k = 1+ ?1 ?x h ?×n h z ?1+ ?1 ?x k ?×n k z ????(8)
式中: l 為靈敏度系數(shù)[9]; g′ h 、 g′ k 、 j′ h ?、 j′ k 分別為物質 h 、 k 提取后的分壓強和離子流強度; x h 、 x k 為 h 、 k 的相對分子質量; z 為空間體積; n h 、 n k 為 h 、 k 的分解系數(shù)[10]。對質譜儀的運行靈敏度系數(shù)進行計算,能夠實現(xiàn)對質譜儀自身應用過程中的性能分析,針對該系數(shù)采用稀疏表示理論進行轉換,在字典轉換矩陣中表示原始運行信號,實現(xiàn)故障檢測。
3 稀疏表示理論檢測質譜儀運行靈敏度故障
稀疏表示被應用于多個工程領域,具有高效的表達方式,將其應用在質譜儀運行靈敏度故障檢測中,主要是將非稀疏的原始信號進行轉換,將其標記為稀疏的系數(shù)。對于上文中求解的靈敏度系數(shù),將其作為檢測的原始信號,則其稀疏表示公式為:
l″=mφ ??(9)
式中: l″ 為靈敏度系數(shù)的稀疏表示,具體為 l″= l″ 0,l″ 0,…,l″ Q ?,其中 Q 為長度[11]。 m 為字典矩陣,表示為 m= m 0,m 1,…,m W ?, m E 為列向量,又被稱作字典原子,滿足 ‖m E‖=1 。 φ 為稀疏解,表示為 φ= φ 0,φ 1,…,φ W ?。綜合各矩陣關系,對 l″ 的表示形式進行展開:
l″=∑ W E=1 φ Em E ??(10)
當字典矩陣的長度為 Q=W 時為完備字典,不能滿足稀疏表示的需求,因此采用稀疏表示時需要保證 Q<W ,即原子數(shù)要大于靈敏度系數(shù)的長度[12]。為此,采用范數(shù)對稀疏表示進行約束:
‖φ‖ R= ∑ W E=1 ?φ E R ?1 R ???(11)
式中: R 為約束范數(shù)。稀疏表示的目的是盡可能的還原靈敏度系數(shù)的原始信號,因此在以稀疏表示作為靈敏度故障檢測時[13],可以直接將檢測結果表示為稀疏表示的目標,則故障檢測的近似目標函數(shù)可表述為:
arg ??max ‖φ‖ R,s.t.φm=l″ ??(12)
R 1= φ ?1+ φ ?2+ φ ?3+…+ φ ?WR 2= φ2 1+φ2 2+…+φ2 W ?????(13)
式中:以最大化約束范數(shù) ?arg ??max [KG-1mm]‖φ‖ R 作為靈敏度檢測目標,在不同情況下采用不同的約束方式,此次選擇 R 1 、 R 2 ?2種范數(shù)形式,當靈敏度系數(shù)的長度與求取距離等價時,采用 R 1 ;當靈敏度系數(shù)長度與其不等價時,采用 R 2 。至此,本文基于半監(jiān)督學習和稀疏表示實現(xiàn)質譜儀運行靈敏度故障檢測算法設計。
4 實驗測試分析
4.1 測試數(shù)據準備
為驗證各組算法對質譜儀運行靈敏度的故障檢測效果,以實際應用的質譜儀作為測試對象,對其正常運行的信號和故障信號進行提取,其中正常信號作為故障信號的對照組,故障信號分為3組類型,分別為離子偏置板運行故障、電子倍增器高壓電源運行故障、磁場分析器運行故障。對不同類型模式進行分析。
(1)離子偏置板運行故障: 該裝置一般用來衡量信號的穩(wěn)定性,常規(guī)運行下其信號輸出為±1.5 V;
(2)電子倍增器高壓電源運行故障:主要對輸出電源進行控制,一般情況下信號需要控制在16位精度,本次設定輸出為±2.0 V;
(3)磁場分析器運行故障:該裝置是控制質譜儀的磁場分析強度,一般會持續(xù)運行,此次設定為±2.5 V。
根據上述設定情況,隨機選擇4組測試數(shù)據,具體情況如圖1所示。
如圖1(a)所示,在正常信號運行中其幅值在 ?-1.5,1.5 ?變動,且沒有出現(xiàn)異常的峰值;在圖1(b)中受離子偏置影響,質譜儀的運行幅值會發(fā)生調轉,整體運行信號超過±1.5;圖1(c)中則是突然出現(xiàn)幅值峰值,超過設定標準;圖1(d)中受磁場波動性影響,在出現(xiàn)故障時其幅值達不到設定標準,且波動性較大。根據不同質譜儀運行靈敏度故障情況,將上述測試數(shù)據連接在MATLAB測試平臺,分別通過3種方法進行檢測。
4.2 測試結果分析
直接對一組數(shù)據樣本檢測無法證明各組方法的應用效果,通過選擇的質譜儀故障類型,以小波技術對故障特征進行提取,并構造出240組測試數(shù)據集合,設定每類故障的數(shù)量相一致,均為80組。為避免單次測試的誤差,對上述每一種故障類型的檢測分別進行8次檢測,以平均精度作為測試指標,計算方式為:
A - = ∑D S/F S S ×100% ??(14)
式中: S 為測試次數(shù); D S 為檢測結果; F S 為實際故障類型。 A - ?為平均精度。本次測試的樣本變量為每一類故障的數(shù)量,當樣本數(shù)量含量不同時得到的故障檢測結果也會不同,一般情況下,樣本數(shù)量越少檢測的精度就越低。根據設定情況以及測試條件,統(tǒng)計不同算法的檢測精度,結果如圖2所示。
由圖2可知,2組傳統(tǒng)算法在樣本數(shù)量較少時檢測精度低于75%,尤其是對磁場分析器運行故障檢測,當樣本數(shù)量達到60組時,2組算法檢測精度仍低于75%,而當全部樣本同時用于診斷時檢測精度勉強達到85%,而研究提出方法基本不受到樣本數(shù)量的影響,檢測精度可達到97%以上,具有應用價值。 ??5 結語
以半監(jiān)督學習和稀疏表示方法設計了一個新的檢測算法,并在實驗論證中對質譜儀的運行靈敏度進行故障檢測,得到了較好的測試結果,具有一定的應用價值。但由于此次時間有限,在研究過程中仍存在少許不足之處,如實驗中沒有針對不同類型的質譜儀進行分析,后續(xù)研究中會針對具體的質譜儀進行檢測算法設計,為實現(xiàn)更高精度的故障檢測提供理論支持。
【參考文獻】
[1] ?劉轉利.基于化學分析儀器計量檢測問題研究[J].粘接,2020,43(8):37-40.
[2] 葉烜榮,潘一葉,程友民,等.10kV線路缺相對系統(tǒng)及配變影響分析[J].粘接,2020,41(1):167-171.
[3] 谷淑波,徐毅,金敏.Isoprime 100穩(wěn)定性同位素比質譜儀故障分析及排除[J].分析測試技術與儀器,2022,28(4):473-479.
[4] 陳金發(fā).NexION 350X電感耦合等離子體質譜儀的使用及故障處理[J].冶金分析,2021,41(1):92-97.
[5] 劉軍坡,吳兆麟,曹玉墀,等.基于卷積神經網絡的智能船舶組合導航系統(tǒng)故障檢測算法[J].艦船科學技術,2023,45(2):155-158.
[5] ?李璽蘭,段繼忠.基于稀疏變換學習的改進靈敏度編碼重建算法[J].北京郵電大學學報,2022,45(5):97-102.
[6] ?余瓊,連危潔,溫毅博,等.輝光放電質譜法測定超高純銅濺射靶材中痕量雜質元素及其相對靈敏度因子的求取[J].理化檢驗-化學分冊,2022,58(9):1049-1055.
[7] 崔瑩瑩,陳卓,王紅霞.基于半監(jiān)督學習模型的協(xié)同過濾推薦算法[J].東北師大學報(自然科學版),2022,54(3):60-66.
[9] ?金向東,桑慶兵.基于半監(jiān)督學習的無參考圖像質量評價算法[J].激光與光電子學進展,2023,60(4):272-279.
[10] ?魏翔,王靖杰,張順利,等.ReLSL:基于可靠標簽選擇與學習的半監(jiān)督學習算法[J].計算機學報,2022,45(6):1147-1160.
[11] 吳濤.基于特征提取和半監(jiān)督學習的圖像分類算法[J].粘接,2021,48(11):92-97.
[12] 張萬旋,張箭,薛薇,等.基于AR/CGARCH模型的液體火箭發(fā)動機自適應閾值故障檢測算法[J].推進技術,2023,44(3):223-228.
[8] 周國華,蔣暉,顧曉清,等.基于半監(jiān)督子空間遷移的稀疏表示遙感圖像場景分類方法[J].浙江大學學報(理學版),2021,48(6):684-693.
[9] 南東亮,王維慶,趙啟,等.基于多維Hausdorff距離算法的站域電流回路故障檢測[J].電網與清潔能源,2021,37(11):63-71.
[10] 孫玉偉,羅林根,陳敬德,等.基于聲音特征與改進稀疏表示分類的斷路器機械故障診斷方法[J].電網技術,2022,46(3):1214-1222.
[11] 張明華,羅紅玲,宋巍,等.基于稀疏表示和學習圖正則的高光譜圖像特征提取[J].光子學報,2021,50(4):249-261.
[12] 張師鵬,李永忠,杜祥通.基于半監(jiān)督學習和三支決策的入侵檢測模型[J].計算機應用,2021,41(9):2602-2608.
[13] 朱廣賀,朱智強,袁逸萍.基于振動傳感器的風力發(fā)電機故障檢測算法[J].傳感技術學報,2023,36(1):108-112.