国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)在橄欖石產(chǎn)地溯源中的應(yīng)用

2024-01-25 12:34:10沈錫田張志清
寶石和寶石學(xué)雜志 2023年6期
關(guān)鍵詞:橄欖石產(chǎn)地準(zhǔn)確率

仲 源,沈錫田,張志清,葉 敏,韓 禹

(1.中國(guó)地質(zhì)大學(xué)(武漢)珠寶學(xué)院,湖北 武漢 430074; 2.湖北省珠寶工程技術(shù)研究中心,湖北 武漢 430074;3.湖北國(guó)土資源職業(yè)學(xué)院,湖北 武漢 430090; 4.張家口地質(zhì)博物館,河北 張家口 075000)

寶玉石的產(chǎn)地溯源常根據(jù)其包裹體特征[1]、譜學(xué)特征[2]和元素含量特征[3-5]等來判定。其中,元素含量特征常采用投圖法,即用不同的元素或元素組合(和、差、比值等)構(gòu)建坐標(biāo)系,將不同產(chǎn)地的寶玉石樣品的元素信息在其中投點(diǎn),體現(xiàn)出差異化的分布。例如,通過Cr2O3/Ga2O3和Fe2O3/TiO2來區(qū)別變質(zhì)型和巖漿型剛玉[3];通過Cs2O+K2O和FeO+MgO兩個(gè)指標(biāo)來區(qū)分不同產(chǎn)地的祖母綠[4];還可通過比較輕重稀土元素變化趨勢(shì)以及異常稀土元素對(duì)出土古玉材料進(jìn)行產(chǎn)地溯源[5]。但是實(shí)際產(chǎn)地判別中投圖法仍存在一些局限性:(1)元素的選擇基于經(jīng)驗(yàn),且判別過程依賴檢測(cè)人員的視覺觀察,存在一定主觀性;(2)隨著需要判別的產(chǎn)地增多,依賴少數(shù)幾種元素構(gòu)建的二維圖像,容易出現(xiàn)不同產(chǎn)地的交叉重疊。例如,Ga-Zn-Li三種元素坐標(biāo)系,阿富汗、贊比亞和巴西藍(lán)寶石在該坐標(biāo)系下的元素分布有部分重疊[4];(3)投圖法依賴原始數(shù)據(jù),復(fù)用性較差。

產(chǎn)地判別本質(zhì)上是一種分類任務(wù),機(jī)器學(xué)習(xí)能夠從多維數(shù)據(jù)中自動(dòng)學(xué)習(xí)規(guī)律、構(gòu)建模型,從而進(jìn)行分類,減少主觀經(jīng)驗(yàn)的介入,且具有較強(qiáng)的復(fù)用性。機(jī)器學(xué)習(xí)已經(jīng)應(yīng)用于很多領(lǐng)域如醫(yī)療影像診斷[6]、農(nóng)作物產(chǎn)地溯源[7]等。其中,線性判別分析(LDA)已經(jīng)在一些寶玉石產(chǎn)地研究中得到應(yīng)用。Shen等[8]對(duì)四個(gè)產(chǎn)地的橄欖石樣品進(jìn)行了產(chǎn)地判別,利用了14種元素建立LDA模型;Giuliani等[9]根據(jù)不同原生礦床中的紅、藍(lán)寶石樣品的成分建立了LDA模型,進(jìn)而對(duì)次生礦床中的紅、藍(lán)寶石進(jìn)行判別,推斷其原生礦床來源;Zhang等[10]對(duì)吉林意氣松和朝鮮的橄欖石樣品進(jìn)行對(duì)比研究,并采用了LDA對(duì)兩個(gè)產(chǎn)地橄欖石樣品進(jìn)行了判別;Homkrajae等[11]基于LA-ICP-MS測(cè)出珍珠樣品中的主微量元素含量,并利用LDA對(duì)三個(gè)產(chǎn)地的淡水珍珠樣品進(jìn)行了判別。其他機(jī)器學(xué)習(xí)算法(如決策樹、隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等)在寶玉石產(chǎn)地判別中的研究相對(duì)較少,且缺少對(duì)元素特征工程和模型優(yōu)化的討論研究。

本文研究以三個(gè)產(chǎn)地(河北大麻坪、吉林意氣松、朝鮮長(zhǎng)淵郡,各產(chǎn)地地理位置如圖1所示)的橄欖石樣品為研究對(duì)象,嘗試在產(chǎn)地判別中應(yīng)用多種機(jī)器學(xué)習(xí)算法,并探索優(yōu)化產(chǎn)地判別模型的路徑。我們通過LA-ICP-MS測(cè)試了河北橄欖石樣品的元素含量,并結(jié)合了Zhang等[10]提供的吉林和朝鮮橄欖石樣品的測(cè)試數(shù)據(jù),使用Python語(yǔ)言和Scikit-learn機(jī)器學(xué)習(xí)庫(kù)等進(jìn)行了數(shù)據(jù)處理、分析和建模,分析了不同產(chǎn)地橄欖石樣品的元素分布情況和各元素相關(guān)性,研究了元素的選擇對(duì)于線性判別分析效果的影響,進(jìn)而篩選合適的元素作為建模特征,同時(shí)采用了六種機(jī)器學(xué)習(xí)算法分別建立產(chǎn)地判別模型,對(duì)比了不同模型的準(zhǔn)確性和泛化能力,從而對(duì)模型進(jìn)行擇優(yōu)。

圖1 河北大麻坪、吉林意氣松和朝鮮長(zhǎng)淵郡橄欖石樣品的產(chǎn)地位置

1 樣品及測(cè)試方法

1.1 樣品情況

表1 三個(gè)產(chǎn)地橄欖石樣品的常規(guī)寶石學(xué)特征

圖2 河北大麻坪雙面拋光后的部分橄欖石樣品

圖3 三個(gè)產(chǎn)地的橄欖石刻面成品(左三:河北大麻坪;中三:吉林意氣松;右三:朝鮮長(zhǎng)淵郡)

1.2 測(cè)試方法

河北大麻坪橄欖石樣品均在武漢上譜分析科技有限責(zé)任公司的激光剝蝕電感耦合等離子體質(zhì)譜(LA-ICP-MS)進(jìn)行微區(qū)原位測(cè)試,儀器型號(hào)為與193 nm準(zhǔn)分子激光剝蝕系統(tǒng)(GeoLasPro)聯(lián)用的Agilent 7700 series ICP-MS。測(cè)試條件:激光器光束直徑44 μm,頻率5 Hz,能量80 J、能量密度為5.5 J/cm2、脈沖數(shù)250。選用美國(guó)地質(zhì)調(diào)查局(USGS)制定的硅酸鹽玻璃--2G、BCR-2G、BIR-1G作為標(biāo)準(zhǔn)樣品。選用美國(guó)國(guó)家標(biāo)準(zhǔn)局 (NIST) 制定的標(biāo)準(zhǔn)參照樣品SRM610校準(zhǔn)時(shí)間漂移,每6個(gè)樣品插入兩個(gè)SRM610標(biāo)樣。為確保結(jié)果的可靠性,每個(gè)樣品隨機(jī)選取一個(gè)測(cè)試點(diǎn)且避開包裹體。此處需要說明的是,晶體本身均一性較好,未發(fā)現(xiàn)環(huán)帶結(jié)構(gòu),且測(cè)試造成的誤差可以看作是圍繞樣品真實(shí)值的隨機(jī)噪聲,而機(jī)器學(xué)習(xí)的建模過程更關(guān)心所有樣品的整體分布情況,每個(gè)樣品的隨機(jī)噪聲互相抵消,應(yīng)對(duì)整體分布的均值影響不大。但模型的判別過程可能會(huì)對(duì)單一樣品的誤差敏感,因此后續(xù)研究和應(yīng)用中可考慮增加單一樣品的測(cè)試點(diǎn)位以提高判別精度。該測(cè)試條件和Zhang等[10]一致。

2 機(jī)器學(xué)習(xí)建模

2.1 編程語(yǔ)言和環(huán)境依賴

在Windows系統(tǒng)中,使用Python語(yǔ)言編程,采用JupyterLab集成開發(fā)環(huán)境,數(shù)據(jù)清洗、分析和建模主要依賴Pandas、NumPy、scikit-learn等庫(kù)。

2.2 不同種類元素組合的線性判別分析

2.3 六種機(jī)器學(xué)習(xí)算法建模

對(duì)上文提及的65 519個(gè)LDA模型分別計(jì)算了準(zhǔn)確率,其中交叉檢驗(yàn)準(zhǔn)確率最高的一個(gè)模型利用10種成分作為建模特征,分別為Mn、Zn、Na、Al、Sc、V、Cr、P、Ti和REE。在這10種成分的基礎(chǔ)上,使用六種不同的機(jī)器學(xué)習(xí)算法建模,分別為L(zhǎng)DA、基于高斯核函數(shù)的支持向量機(jī)(SVC-RBF)、基于拉普拉斯核的支持向量機(jī)(SVC-Laplc)、決策樹(DTC)、隨機(jī)森林(RFC)和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)。各算法及調(diào)用scikit-learn的接口參見表2。

表2 六種機(jī)器學(xué)習(xí)算法調(diào)用的接口和參數(shù)設(shè)置

(1)SVC的主要思想是在特征空間中找到一個(gè)最優(yōu)超平面,將不同類別的實(shí)例盡可能地分開,并且使得離超平面最近的訓(xùn)練樣本(支持向量)到超平面的距離最大化,結(jié)合核函數(shù),能夠處理非線性可分的數(shù)據(jù)[12]。(2)DTC可將樣本分類的過程用樹形結(jié)構(gòu)表示,一棵決策樹由根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)構(gòu)成,其中根節(jié)點(diǎn)和每個(gè)內(nèi)部節(jié)點(diǎn)表示對(duì)一種特征取值的判斷,每個(gè)分支代表判斷的結(jié)果,最后每個(gè)葉節(jié)點(diǎn)代表一種判別結(jié)果[13]。(3)RFC是一種結(jié)合了決策樹和集成學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,使用了集成學(xué)習(xí)中的Bagging算法,基本思想是從訓(xùn)練集中隨機(jī)選擇一定數(shù)量的子集,每個(gè)子集訓(xùn)練一棵決策樹,多棵決策樹投票最多的類別作為最終的輸出[14]。(4)BPNN由三個(gè)部分構(gòu)成:輸入層、隱藏層和輸出層,每層有一定數(shù)量的神經(jīng)元,并按不同的權(quán)重分別與下一層各神經(jīng)元進(jìn)行多對(duì)多連接,就構(gòu)成了網(wǎng)絡(luò)結(jié)構(gòu)。通過設(shè)計(jì)一個(gè)輸出值和真實(shí)結(jié)果之間的誤差函數(shù),采用誤差反向傳播算法和梯度下降等的優(yōu)化算法,不斷調(diào)整神經(jīng)元權(quán)重,迭代模型以縮小誤差,從而找到一個(gè)最優(yōu)化的模型[15]。(5)DTC和RFC模型采用網(wǎng)格搜索(Grid Search)的方式優(yōu)化超參數(shù)。

全數(shù)據(jù)集準(zhǔn)確率是用所有樣品數(shù)據(jù)訓(xùn)練模型并回代入模型所得的預(yù)測(cè)結(jié)果,但是理想的模型不僅要在建模所用的數(shù)據(jù)上表現(xiàn)良好,也應(yīng)該在其他數(shù)據(jù)上表現(xiàn)良好,即模型具有良好的泛化能力,因?yàn)榻5哪康木褪窃谖磥韺?shí)際檢測(cè)中,對(duì)那些未知產(chǎn)地的樣品也能做到有效的判別。因此,在本文,我們將數(shù)據(jù)集按訓(xùn)練集:測(cè)試集=7∶3的比例進(jìn)行劃分,并利用訓(xùn)練集訓(xùn)練模型,再分別代入訓(xùn)練集和測(cè)試集計(jì)算準(zhǔn)確率。

3 結(jié)果和討論

3.1 LA-ICP-MS分析

LA-ICP-MS測(cè)試結(jié)果(表3和表4)顯示,高于檢出限的成分有MgO、FeO、Li、Mn、Co、Ni、Zn、Na、Al、Ca、Sc、V、Cr、P、Ti、REE(Ca、Ti、REE有個(gè)別低于檢出限的樣品,按檢出限/10進(jìn)行了處理)16種。三個(gè)產(chǎn)地橄欖石樣品的鎂值Fo(nMg/nMg+nFe)基本在同一個(gè)范圍內(nèi),屬于高鎂橄欖石。

表3 LA-ICP-MS測(cè)得的三個(gè)產(chǎn)地的橄欖石樣品的主量成分

表4 LA-ICP-MS測(cè)得的三個(gè)產(chǎn)地的橄欖石樣品的微量元素

圖4通過核密度估計(jì)曲線展示了三個(gè)產(chǎn)地橄欖石樣品在16種成分上的分布情況。整體上看,吉林橄欖石和朝鮮橄欖石樣品的分布存在比較明顯的差異,主要體現(xiàn)在Li、Na、Al、Ca、Ti、V、Cr、Mn、FeO、Zn共10個(gè)成分上,呈現(xiàn)出吉林橄欖石的含量偏低和朝鮮橄欖石的含量偏高的趨勢(shì)。綜合來看,吉林橄欖石和朝鮮橄欖石樣品在多數(shù)成分上的差異較明顯,在少數(shù)成分上難以區(qū)別(如Sc、P、REE等)。河北橄欖石與吉林和朝鮮橄欖石樣品在大多數(shù)成分上都有所重疊,僅在個(gè)別成分上有一定的區(qū)別(如Al、Sc等)。

通水,不是簡(jiǎn)單的引水下山、接水入戶,必須思慮周遠(yuǎn),質(zhì)效兼顧。在解決貧困地區(qū)農(nóng)村安全飲水問題上,我省以管理制度改革為重點(diǎn),不斷探索。

圖4 三個(gè)產(chǎn)地橄欖石樣品在16種成分上的高斯核密度估計(jì)

其他元素基本低于檢出限,不列出;表3和表4括號(hào)內(nèi)的值表示所有樣品均值,低于檢出限的樣品按軟件給出的原始數(shù)據(jù)作為其值;REE 表示稀土元素La~Lu的總量,低于檢出限的取檢出限的1/10作為其值;bdl 表示低于檢出限;* 表示存在樣品低于該元素檢出限

3.2 通過線性判別分析優(yōu)化化學(xué)成分組合

圖5 不同數(shù)量的成分組合后建立LDA模型得到的準(zhǔn)確率

從圖6可以看到,從3種成分組合開始,基本所有成分的平均改進(jìn)度均為正值,這是因?yàn)?種成分組合的產(chǎn)地判別能力較差,基本上只要新成分加入,就能提供新的產(chǎn)地差異性特征,從而大幅提高判別準(zhǔn)確率。隨著組合中成分?jǐn)?shù)量的增加,大多數(shù)成分的平均改進(jìn)度呈下降趨勢(shì),甚至有個(gè)別成分(如MgO、FeO、Li、Mn、Ni等)從正值區(qū)間落到了負(fù)值區(qū)間,說明它們的加入降低了模型的準(zhǔn)確率。

圖6 不同數(shù)量成分組合中的平均改進(jìn)度

Sc元素的平均改進(jìn)度雖然呈下降趨勢(shì),但較之其他成分始終維持在較高的水平,說明它在產(chǎn)地判別中起到的作用是無可替代的。從圖6可以發(fā)現(xiàn),Sc元素是唯一可以明顯看出河北和另外兩個(gè)產(chǎn)地分布差異的成分,而其他成分在河北和另外兩個(gè)產(chǎn)地都有大范圍的重疊,所以Sc元素是區(qū)分河北橄欖石樣品的關(guān)鍵。

P和Ca元素的平均改進(jìn)度變化趨勢(shì)比較類似,都是在小幅度的下跌后趨于平穩(wěn),隨后又小幅上升,然后又下降。Ca在5~7、15~16種成分的時(shí)候平均改進(jìn)度都跌到了負(fù)值。

REE的變化趨勢(shì)最為特殊,始終呈上升趨勢(shì),從一開始的平均改進(jìn)度處于一個(gè)平均的水平,到最后超過Sc元素成為平均改進(jìn)度最高的元素。

Co元素的平均改進(jìn)度始終處于負(fù)值區(qū)間,這說明Co大多情況下起到了降低準(zhǔn)確率的作用,從圖4也可以看到Co在三個(gè)產(chǎn)地上的分布沒有明顯的區(qū)分。

為了對(duì)這些成分的平均改進(jìn)度進(jìn)行一個(gè)比較,將各成分從3種到16種成分組合的平均改進(jìn)度分別進(jìn)行加和(圖7),可以看到MgO、Co、Ni平均改進(jìn)度總和均為負(fù)值,說明這3種成分在組合的成分?jǐn)?shù)量變化過程中整體上對(duì)準(zhǔn)確率起負(fù)面影響,之后的模型中將直接剔除這3種成分。FeO、Li、Ca的平均改進(jìn)度總和相較其他成分很低,對(duì)準(zhǔn)確率基本沒有貢獻(xiàn),且從Li和Ca的產(chǎn)地分布上看,它們產(chǎn)地差異性也很小,也可以考慮剔除。剩下10種成分(Mn、Zn、Na、Al、Sc、V、Cr、P、Ti、REE)的平均改進(jìn)度總和都較高,這10種成分組合的模型全數(shù)據(jù)集準(zhǔn)確率為0.908,交叉檢驗(yàn)準(zhǔn)確率為0.889。

圖7 各成分平均改進(jìn)度總和

De Hoog等[17]將橄欖石中的微量元素分為三類,不同的類別具有不同分配規(guī)律和含量特征:(1)I類元素(Li、Mn、Co、Ni、Cu、Zn)中,除了Li和Cu外,其它元素的離子半徑接近于Mg的半徑,且價(jià)態(tài)也是二價(jià),所以容易進(jìn)入晶格,常顯示出與Fo的相關(guān)性。I類元素含量變化小,在地幔橄欖巖中,這些元素主要富集于橄欖石,其含量取決于熔體的總含量,且受橄欖石平衡溫度的影響小。(2)Ⅱ類元素(Cr、Al、V、Sc、Ca、Na)受離子電價(jià)和尺寸的影響,不易進(jìn)入橄欖石晶格中,但更容易進(jìn)入其它共生礦物(如尖晶石、輝石等)中。Ⅱ類元素的含量變化明顯,主要受到平衡熔體溫度及共生礦物相的控制。(3)Ⅲ類元素(Ti、Zr、Nb、Y、P、REE)中,除了P外,其它元素的含量變化很大,主要受熔體總含量影響。在地幔橄欖巖的平衡溫度下,受到離子電荷和尺寸的影響,Ⅲ類元素不易進(jìn)入橄欖石晶格,也不易進(jìn)入其他共生礦物中,因此會(huì)和其他共生礦物顯示相似的含量變化。

改進(jìn)度較高的10種成分中,Mn和Zn屬于I類元素,Na、Sc、V、Cr屬于Ⅱ類元素,P、Ti、REE屬于Ⅲ類元素,說明該模型充分利用到了De Hoog等[17]所說的三類元素,能更全面地反應(yīng)出產(chǎn)地的差異化特征。

綜上所述,成分?jǐn)?shù)量較少的情況下,新增成分一般對(duì)于模型準(zhǔn)確率有很大提升,具體來說就是引入了異類元素。從數(shù)學(xué)的角度上,異類元素相關(guān)性小、產(chǎn)地分布差異大;從地質(zhì)角度上,是因?yàn)楫愵愒財(cái)y帶了不同地質(zhì)環(huán)境種的物理?xiàng)l件和元素豐度的信息。但當(dāng)元素?cái)?shù)量過多時(shí),新增元素很可能導(dǎo)致模型準(zhǔn)確率下降,可能是某些元素在加入時(shí)給模型引入了一些不必要的噪聲,如主量成分MgO、FeO在三個(gè)產(chǎn)地橄欖石間的差異本來就不大,加入它們不能提升模型性能,反而可能讓模型過擬合。

3.3 六種機(jī)器學(xué)習(xí)算法對(duì)比結(jié)果分析

LDA是在高維空間中尋找超平面將不同類別的樣本切分開,但當(dāng)不同類別的樣本在高維空間中的分類邊界不是平面而是曲面時(shí),線性判別的效果就會(huì)差很多,甚至產(chǎn)生大量的誤判。僅以二維空間中的二分類問題為例,如圖8,隨機(jī)生成3種分布形態(tài)的數(shù)據(jù)A、B、C,模擬可能出現(xiàn)的二分類情況。A中兩類樣本大致呈左右對(duì)稱的分布,B中兩類呈月牙形、相互嵌套構(gòu)成彎曲邊界,C中兩類呈同心圓分布。

圖8 二維空間中的二分類問題樣本分布的理想邊界和LDA邊界

圖8-A2/B2/C2表示了理想邊界,即真實(shí)環(huán)境中總體之間的邊界,可能存在一些噪聲(用“x”表示)。通過LDA建模得到了圖8-A3/B3/C3的分類邊界。對(duì)于A中的數(shù)據(jù),LDA表現(xiàn)較好,能將大部分樣本正確地分類,準(zhǔn)確率為0.95。對(duì)于B中的數(shù)據(jù),紅藍(lán)區(qū)域兩類數(shù)據(jù)邊界是彎曲鑲嵌,無法找到一條可以完美分割兩類的直線,LDA劃分出的兩個(gè)區(qū)域中必然會(huì)殘留對(duì)方的樣本,這使得LDA準(zhǔn)確率降低到0.85。對(duì)于C類同心圓型數(shù)據(jù),LDA判別準(zhǔn)確率只有0.48,這樣的判別沒有意義。LDA往往要建立在樣本正態(tài)分布以及協(xié)方差相等的假設(shè)的基礎(chǔ)上??梢?在不知道數(shù)據(jù)分布形態(tài)的情況下,使用LDA不一定能得到準(zhǔn)確率較高的模型,而非線性的算法可能會(huì)更有優(yōu)勢(shì)。

我們基于3.2節(jié)推薦的10種成分(Mn、Zn、Na、Al、Sc、V、Cr、P、Ti、REE),分別應(yīng)用六種機(jī)器學(xué)習(xí)算法建模,并計(jì)算測(cè)試集準(zhǔn)確率和訓(xùn)練集準(zhǔn)確率(圖9)。其中,(1)LDA在訓(xùn)練集上的準(zhǔn)確率比較低,在測(cè)試集上的準(zhǔn)確率最低;(2)SVC(RBF)和SVC(Laplc)的訓(xùn)練集準(zhǔn)確率和測(cè)試集準(zhǔn)確率屬于中等水平;(3)DTC在訓(xùn)練集上的準(zhǔn)確率比LDA還要低一些,說明對(duì)訓(xùn)練集的學(xué)習(xí)非常不足,在測(cè)試集上的準(zhǔn)確率比LDA高一些,訓(xùn)練集和測(cè)試集準(zhǔn)確率差值較低;(4)RFC在訓(xùn)練集上得到了100%的準(zhǔn)確率,但在測(cè)試集上準(zhǔn)確率下降到0.848,說明模型可能對(duì)訓(xùn)練集過擬合的程度比較高;(6)BPNN在訓(xùn)練集上的準(zhǔn)確率是除了RFC之外最高的,且在測(cè)試集上也取得了最高的準(zhǔn)確率,這說明該模型即從訓(xùn)練集中充分學(xué)習(xí)到了訓(xùn)練集的特征,而且也學(xué)習(xí)到了更普遍的產(chǎn)地特征,具有較強(qiáng)的泛化能力,在未知樣本上也有能力進(jìn)行較準(zhǔn)確產(chǎn)地判別。但該算法存在一定隨機(jī)性,每次生成模型的準(zhǔn)確率有所波動(dòng),準(zhǔn)確率是取50次訓(xùn)練結(jié)果的平均值,其中訓(xùn)練集準(zhǔn)確率1個(gè)標(biāo)準(zhǔn)差為 0.01,測(cè)試集準(zhǔn)確率1個(gè)標(biāo)準(zhǔn)差為0.015。

圖9 六種機(jī)器學(xué)習(xí)模型在橄欖石訓(xùn)練集和測(cè)試集上的準(zhǔn)確率

綜上所述,對(duì)于河北、吉林和朝鮮三個(gè)產(chǎn)地橄欖石樣品的判別,大部分非線性算法(除了DTC)相較LDA,準(zhǔn)確率都有了提升,其中BPNN準(zhǔn)確率最高,SVC訓(xùn)練結(jié)果穩(wěn)定且準(zhǔn)確率較高。

4 結(jié)論

本文以河北、吉林和朝鮮三個(gè)產(chǎn)地橄欖石樣品為例,篩選10種化學(xué)成分(Mn、Zn、Na、Al、Sc、V、Cr、P、Ti、REE)作為特征,使用六種機(jī)器學(xué)習(xí)方法進(jìn)行產(chǎn)地判別,得到如下主要結(jié)論。

(1)應(yīng)用支持向量機(jī)等非線性的機(jī)器學(xué)習(xí)算法建??梢缘玫捷^好的判別效果,訓(xùn)練集準(zhǔn)確率可以達(dá)到95%以上,測(cè)試集準(zhǔn)確率可以達(dá)到86%以上,遠(yuǎn)超傳統(tǒng)的基于全部元素的LDA模型。

(2)篩選元素的意義在于提取出了能夠更好表現(xiàn)產(chǎn)地差異化性質(zhì)的信息,剔除了冗余和無關(guān)的噪聲,能提升模型的性能和訓(xùn)練效率。

猜你喜歡
橄欖石產(chǎn)地準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
綠色之星橄欖石
化石(2021年1期)2021-03-16 01:20:50
橄欖石項(xiàng)鏈
警惕“洗產(chǎn)地”暗礁
食物離產(chǎn)地越遠(yuǎn)越好
測(cè)定不同產(chǎn)地寬筋藤中5種重金屬
中成藥(2018年8期)2018-08-29 01:28:16
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
加強(qiáng)產(chǎn)地檢疫實(shí)現(xiàn)以檢促防
门头沟区| 南汇区| 大余县| 锦屏县| 新丰县| 吉林市| 鹿邑县| 衡东县| 阳东县| 绥江县| 明溪县| 永寿县| 枣强县| 盘山县| 四平市| 京山县| 永昌县| 房产| 惠来县| 革吉县| 垫江县| 南充市| 枝江市| 荔波县| 托里县| 百色市| 渭南市| 北碚区| 济宁市| 高唐县| 嵊州市| 保德县| 漯河市| 克什克腾旗| 武强县| 海晏县| 阳新县| 琼海市| 游戏| 顺义区| 西畴县|