国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的圖像識別技術(shù)在選礦中的應(yīng)用進(jìn)展

2024-02-23 07:49:06胡雅祺李宇恒陳天星
礦冶 2024年1期
關(guān)鍵詞:圖像識別選礦結(jié)果表明

胡雅祺 孔 靜 李宇恒 陳天星

(西安建筑科技大學(xué) 資源工程學(xué)院,西安 710055)

礦產(chǎn)資源是一種自然資源,是人類社會(huì)可持續(xù)發(fā)展的重要物質(zhì)基礎(chǔ)[1]。為了實(shí)現(xiàn)礦產(chǎn)資源可持續(xù)發(fā)展的目標(biāo),需要對礦產(chǎn)資源進(jìn)行科學(xué)合理的加工利用。在選礦廠中,由于原礦性質(zhì)的波動(dòng),成熟的選礦工藝仍需進(jìn)行實(shí)時(shí)調(diào)整和優(yōu)化。同時(shí)選礦過程中需實(shí)時(shí)監(jiān)測精礦品位、回收率等選別指標(biāo),但由于取樣和化驗(yàn)過程耗時(shí)較長,導(dǎo)致監(jiān)測結(jié)果存在較大滯后性。此外,操作工人在工藝指標(biāo)的調(diào)整上也存在主觀隨意性,容易受到疲勞度和責(zé)任心的影響,導(dǎo)致不同班組選礦指標(biāo)存在差異[2]。因此,采用機(jī)器視覺檢測設(shè)備,代替人工肉眼從選別過程圖像中實(shí)時(shí)提取各種信息,并基于深度學(xué)習(xí)建立選礦生產(chǎn)智能優(yōu)化模型,對于實(shí)現(xiàn)選礦過程智能控制、保證選別指標(biāo)穩(wěn)定性和提高礦產(chǎn)資源利用率具有重要意義。

圖像識別是一種計(jì)算機(jī)視覺技術(shù),通常利用深度學(xué)習(xí)算法如卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)來訓(xùn)練模型[3],以識別圖像中的特征和模式。隨著深度學(xué)習(xí)在圖像處理中的發(fā)展,圖像識別技術(shù)在如農(nóng)業(yè)、醫(yī)學(xué)、廢品回收等領(lǐng)域也得到廣泛應(yīng)用[4]。與傳統(tǒng)選礦相比,將圖像識別技術(shù)應(yīng)用到選礦工藝中,將有效解決選礦廠生產(chǎn)效率和能源利用效率不高、礦產(chǎn)資源利用水平低等難題,提升選礦智能化水平。本文簡述了圖像識別的相關(guān)技術(shù)及方法,介紹了圖像識別技術(shù)在重選、浮選、磁選中的研究現(xiàn)狀,并對圖像識別技術(shù)在選礦領(lǐng)域中的應(yīng)用進(jìn)行了總結(jié)和展望。

1 圖像識別技術(shù)

圖像識別技術(shù)能夠自動(dòng)識別和分析圖像,為各種應(yīng)用場景中的數(shù)據(jù)分析和決策提供支持,具有高的效率和準(zhǔn)確性。圖像識別技術(shù)的實(shí)現(xiàn)主要包括圖像采集、圖像預(yù)處理、特征提取和選擇、建立深度學(xué)習(xí)模型[5]等幾個(gè)重要環(huán)節(jié)。該技術(shù)采用主流的Pytorch或Tensor Flow深度學(xué)習(xí)框架來實(shí)現(xiàn),編程語言多采用Python,代碼編輯器往往采用交互性能好的PyCharm[6]。

1.1 圖像采集

圖像采集是指使用相機(jī)、掃描儀等設(shè)備對現(xiàn)實(shí)世界中的物體、場景等進(jìn)行數(shù)字化獲取的過程。通常情況下,圖像采集設(shè)備會(huì)將物體、場景等的光學(xué)信息轉(zhuǎn)換成電信號,并通過AD轉(zhuǎn)換器將其轉(zhuǎn)換為數(shù)字信號,然后存儲在計(jì)算機(jī)或其他數(shù)字設(shè)備中。圖像采集的設(shè)備包括數(shù)碼相機(jī)、工業(yè)相機(jī)、掃描儀等,可以應(yīng)用于醫(yī)學(xué)影像、工業(yè)檢測、安防監(jiān)控、虛擬現(xiàn)實(shí)等多種領(lǐng)域。

常見的圖像采集方法包括模擬信號采集和數(shù)字信號采集。目前,在圖像識別技術(shù)中主要采用數(shù)字信號采集技術(shù)。數(shù)字信號采集是指將模擬信號轉(zhuǎn)換為數(shù)字信號的過程,并將數(shù)字信號存儲在計(jì)算機(jī)或其他數(shù)字設(shè)備中進(jìn)行后續(xù)處理和分析。陳燁等[7]設(shè)計(jì)了一種基于圖像識別的采集與檢測系統(tǒng),該系統(tǒng)能夠夾取管材截面的拍攝,將拍攝到的圖像發(fā)送至計(jì)算機(jī)終端,實(shí)現(xiàn)對被測管材管徑與壁厚的快速檢測。李成勇等[8]在設(shè)計(jì)車道偏移識別的汽車輔助駕駛時(shí),選用CMOS型攝像頭作為路面信息的采集提取,通過內(nèi)部編寫的圖像處理程序,實(shí)現(xiàn)了車道線圖像特征的提取,得到了車道線輪廓清晰的圖像。鄧小云[9]提出以ARM為基礎(chǔ)的CMOS數(shù)字圖像傳感器圖像采集系統(tǒng),該系統(tǒng)與傳統(tǒng)的CCD圖像采集系統(tǒng)相比,具有更加豐富的功能、強(qiáng)大的處理能力和靈活的接口等優(yōu)點(diǎn)。

隨著數(shù)字圖像采集技術(shù)的不斷發(fā)展,數(shù)字圖像采集技術(shù)已經(jīng)成為圖像處理和分析的關(guān)鍵技術(shù)之一,為各行各業(yè)提供了高質(zhì)量、高效率的圖像獲取手段,并推動(dòng)了圖像處理和分析領(lǐng)域的快速發(fā)展。

1.2 圖像預(yù)處理

圖像通過工業(yè)相機(jī)獲取后,往往存在噪聲大、邊界模糊等情況,預(yù)處理的主要目的就是消除圖像中的無關(guān)信息,增強(qiáng)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測性、最大限度地簡化數(shù)據(jù),從而改進(jìn)特征提取、圖像分割、匹配和識別的可靠性。圖像的預(yù)處理是圖像分析的第一步,圖像質(zhì)量會(huì)直接影響識別算法的設(shè)計(jì)與效果的精度。一般的預(yù)處理流程為灰度化、幾何變換、圖像降噪和增強(qiáng)。

1.2.1 圖像灰度化處理

圖像灰度化是將一幅彩色圖像轉(zhuǎn)換為灰度化圖像的過程。圖像的灰度變換可以通過有選擇地突出圖像感興趣的特征或者抑制圖像中不需要的特征,從而改善圖像的質(zhì)量,凸顯圖像的細(xì)節(jié),提高圖像的對比度,能有效地改變圖像的直方圖分布,使圖像的像素值分布更為均勻。廖一帆等[10]提出了一種基于輔助變量增強(qiáng)的可逆彩色圖像灰度化方法。該方法通過可逆神經(jīng)網(wǎng)絡(luò)的正向過程實(shí)現(xiàn)彩色圖像灰度化,逆向過程實(shí)現(xiàn)灰度圖像的色彩復(fù)原。將所提方法在數(shù)據(jù)集上進(jìn)行定性和定量比較。結(jié)果表明,無論是在全局還是局部,生成圖像都可以最大程度地保留亮度、顏色對比度和結(jié)構(gòu)相關(guān)性等特征。趙子皓等[11]根據(jù)RGB分量的重要性,利用加權(quán)平均法對番茄葉片病蟲害圖像進(jìn)行灰度化處理,并對圖像進(jìn)行去噪。結(jié)果表明,該方法避免了溫室內(nèi)光照對圖像的干擾,從而加強(qiáng)了圖像特征提取的精度。

1.2.2 圖像變換

圖像變換,即圖像的幾何變換,是指在不改變圖像內(nèi)容的情況下,圖像在空間上進(jìn)行收縮、放大、平移、旋轉(zhuǎn)等,從而得到新的圖像。有時(shí)數(shù)據(jù)收集量不夠,可以采用數(shù)據(jù)增加的方法來獲得額外的訓(xùn)練數(shù)據(jù)。TANG等[12]采用隨機(jī)裁剪和鏡像翻轉(zhuǎn)來增加原始數(shù)據(jù)集。將最初的400張照片放大到9 000張照片,從而達(dá)到訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)量。利用Deeplabv3+網(wǎng)絡(luò),基于深度學(xué)習(xí)理論建立了目標(biāo)礦物識別網(wǎng)絡(luò)模型。該模型能有效自動(dòng)提取偏光顯微鏡下礦石礦物圖像的深層特征信息,并實(shí)現(xiàn)對透明礦物和非透明礦物的智能識別和分類。

1.2.3 圖像降噪和增強(qiáng)

在圖像從獲取、傳輸及存儲的每一個(gè)環(huán)節(jié)都會(huì)造成圖像信息失真和引入噪聲[13],而這些噪聲會(huì)對圖像的質(zhì)量、清晰度和可用性產(chǎn)生負(fù)面影響。因此需要對圖像進(jìn)行降噪處理。常用的圖像降噪方法有均值濾波、高斯濾波和中值濾波等。

陽恩慧等[14]在瀝青路面表面紋理重構(gòu)與構(gòu)造深度預(yù)測中,通過均值濾波對采樣數(shù)據(jù)進(jìn)行降噪處理后,三維重構(gòu)了試樣表面并提取了特征。結(jié)果表明,均值濾波在去除噪聲信號的同時(shí)也比較完整的保留了高程輪廓特征,得到的預(yù)測值與實(shí)測值的決定系數(shù)R2在0.95以上。周牧等[15]在量子成像研究中,對小波系數(shù)中的高頻成分進(jìn)行高斯濾波去噪,并通過小波逆變換得到去噪后的符合計(jì)數(shù)值。與現(xiàn)有的小波變換、高斯濾波和中值濾波去噪方法相比,該方法雖然在某些光子遮擋部分會(huì)出現(xiàn)錯(cuò)誤亮斑,但其成像質(zhì)量在整體上為最優(yōu)。常文帥等[16]利用均值濾波、中值濾波和高斯濾波的算法比較了巖石裂隙圖像處理方法的優(yōu)缺點(diǎn)。結(jié)果表明,在對巖石裂隙圖像處理中,中值濾波優(yōu)于均值濾波和高斯濾波。

在圖像通過降噪處理之后,圖像中的噪點(diǎn)會(huì)消除但同時(shí)會(huì)使圖像變得模糊,這時(shí)就需要對圖像進(jìn)行增強(qiáng)。圖像增強(qiáng)是將不清晰的圖像變清晰或強(qiáng)調(diào)突出圖像中的有用信息,削弱或去除無用的信息,從而改善圖像質(zhì)量,快捷地篩出關(guān)鍵信息[17],滿足某些特殊分析的需要。常用的圖像增強(qiáng)方法有直方圖均衡化、圖像銳化、對比度增強(qiáng)等。

胡新鐘等[18]為了應(yīng)對快速識別大氣環(huán)境下早期鍍層腐蝕形貌特征的需求,開發(fā)了便攜式形貌特征識別裝置。通過對鍍層的腐蝕形貌圖像進(jìn)行降噪后,利用直方圖均衡方法,增強(qiáng)圖像對比度,再通過分割獲取腐蝕圖像的二值化特征。結(jié)果表明,該方法與人為標(biāo)注的腐蝕區(qū)域相似度能達(dá)到0.844 1,處理速度能滿足便攜式裝置的實(shí)時(shí)要求。KUMAR等[19]提出了一種基于模糊C-means 聚類的圖像增強(qiáng)方法,該方法在增強(qiáng)感知不可見圖像的同時(shí),還能保持圖像的色彩和自然度。SUGIMOTO等[20]提出了一種同時(shí)提高亮度、對比度、飽和度的彩色圖像無損處理方法。與以往研究的灰度圖像的無損對比度增強(qiáng)相比,引入了可逆數(shù)據(jù)隱藏的思想。結(jié)果表明,與以往的方法相比,該方法能在保證可逆性的同時(shí)控制亮度、對比度和飽和度。

1.3 特征提取

特征提取是計(jì)算機(jī)視覺和圖像處理的關(guān)鍵步驟,他體現(xiàn)著從圖像數(shù)據(jù)表達(dá)到非圖像數(shù)據(jù)表達(dá)的過渡。特征提取包括特征點(diǎn)檢測和描述子計(jì)算兩個(gè)過程。首先將圖像中的角點(diǎn)檢測為每個(gè)圖像的關(guān)鍵點(diǎn),然后在這些關(guān)鍵點(diǎn)的領(lǐng)域提取局部描述子,得到的結(jié)果可以用作多模式識別和分類技術(shù)的輸入量,用于標(biāo)記、分類、識別圖像或其中目標(biāo)的語義內(nèi)容。

人工提取特征常用的方法主要利用基本統(tǒng)計(jì)特征對圖像進(jìn)行描述,常見的圖像特征包括顏色特征、紋理特征和形狀特征等。顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì)。常用顏色空間模型有RGB、HSV、Lab等。對于每一個(gè)顏色空間模型,通過分多個(gè)區(qū)域取樣求均值及整體均值的方法來獲取每個(gè)通道的特征值[21]。蔣存波等[21]對于珍珠圖像的顏色特征提取及檢測方法研究中,先將珍珠圖像進(jìn)行了預(yù)處理,在Lab顏色空間提出了基于珍珠回音廊效應(yīng)區(qū)域的顏色特征提取,使用了GA-SVM作為珍珠顏色識別方法,并提出了二次顏色檢測策略,通過兩次顏色檢測來確定珍珠顏色類別。通過對比試驗(yàn)結(jié)果發(fā)現(xiàn),珍珠體色色系檢測準(zhǔn)確率達(dá)到100%,珍珠顏色檢測準(zhǔn)確率達(dá)到98.7878%。SHRIVASTAVA等[22]提出了一種僅使用顏色特征的基于圖像的水稻病害分類方法,探索了14種不同的顏色空間,并從每個(gè)顏色通道中提取了4個(gè)特征,從而得到172個(gè)特征。由識別結(jié)果的歸一化混淆矩陣可以看出,矩陣的顏色與礦物識別的準(zhǔn)確率有關(guān),即顏色越深,準(zhǔn)確率越高。SUTOJO等[23]在識別奶牛的類型的研究中,對圖像進(jìn)行顏色和紋理特征提取,計(jì)算每個(gè)顏色分量的顏色強(qiáng)度的平均值和標(biāo)準(zhǔn)差,用顏色和紋理特征作為屬性,利用歐幾里得距離進(jìn)行計(jì)算,從而得到圖像之間的相似度。結(jié)果表明,用該方法進(jìn)行識別,準(zhǔn)確率達(dá)到95%,而精確率和召回率均為100%。

紋理特征可以是全局的特征,也可以是局部的特征,他對研究圖像的對比度、粗糙度等屬性非常重要。常用的紋理特征提取方法有灰度共生矩陣(GLCM)、局部二值模式(LBP)、小波變換等。ZAREEN等[24]將獲取的ISIC圖像數(shù)據(jù)集轉(zhuǎn)化為一階直方圖和GLCM特征相結(jié)合的紋理特征數(shù)據(jù)集。再從這些數(shù)據(jù)集中獲得了137 400(229×3×200)個(gè)紋理特征。然后采用主成分分析聚類方法,基于平均相關(guān)系數(shù)加誤差概率和Fisher兩種不同的統(tǒng)計(jì)特征方法以及相關(guān)性的特征選擇(CFS)方法來對特征數(shù)據(jù)集進(jìn)行降維、提取,優(yōu)化最具區(qū)別性特征。結(jié)果表明,該方法可以提取更多關(guān)于皮膚癌種類特征的信息,減少參數(shù)數(shù)量,提高準(zhǔn)確率。謝躍輝等[25]以災(zāi)損建筑數(shù)據(jù)為研究對象,采用LBP與SegNet深度卷積神經(jīng)網(wǎng)絡(luò)提取了特征,實(shí)現(xiàn)震后災(zāi)損建筑物自動(dòng)分類提取,并與傳統(tǒng)面向?qū)ο筇崛》椒ㄟM(jìn)行對比。結(jié)果表明,LBP紋理特征與SegNet卷積神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,對于震后災(zāi)損建筑物的提取能提高預(yù)測精度,總精度為96.74%。MISHRA等[26]提出了一種從顯微鏡圖像中區(qū)分正常白細(xì)胞和病變細(xì)胞的有效方法。將預(yù)處理后的圖像利用離散正交S變換(DOST)提取紋理特征,并使用線性判別分析對其進(jìn)行降維,將降維的特征提供給隨機(jī)森林算法來進(jìn)行預(yù)測。結(jié)果表明,與現(xiàn)有方案相比,他們提出的方法具有更高的準(zhǔn)確性,準(zhǔn)確率可達(dá)99.66%。

形狀特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征,輪廓特征主要針對物體的外邊界,而區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域的整體屬性。BAKHSHIPOUR等[27]采用了支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)對甜菜地里常見的4種雜草進(jìn)行了研究,形狀特征集包括傅里葉描述子和矩不變特征,結(jié)果表明,人工神經(jīng)網(wǎng)絡(luò)的總體分類正確率為92.92%,其中雜草的正確率為92.50%。使用SVM作為分類器時(shí),總體正確率為95.00%,而雜草的正確率為93.33%。侯晶等[28]利用顏色特征對物料進(jìn)行面積計(jì)算,用形狀特征確定物料的位置,使用層次分析法計(jì)算出顏色和形狀特征的權(quán)重大小,將兩者進(jìn)行融合,實(shí)現(xiàn)物料的識別及抓取順序判斷,結(jié)果表明該算法抓取成功率可提高至99.8%。

1.4 深度學(xué)習(xí)模型

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新的研究方向,是近年來機(jī)器學(xué)習(xí)領(lǐng)域的重大突破和研究熱點(diǎn)之一[29]。他是通過模擬人類的大腦來對所提取的特征進(jìn)行學(xué)習(xí),利用海量的數(shù)據(jù)進(jìn)行訓(xùn)練,使訓(xùn)練結(jié)果無限逼近真實(shí)值,從而最終得到適合模型的參數(shù)[30,31]。隨著深度學(xué)習(xí)的快速發(fā)展,其應(yīng)用領(lǐng)域也變得逐漸廣泛,覆蓋了計(jì)算機(jī)視覺、數(shù)據(jù)挖掘、自然語言處理、無人駕駛等,為我們?nèi)粘I詈凸ぷ鲙砹司薮蟮谋憷?/p>

其中,卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的代表算法之一,他是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),具有局部連接、權(quán)值共享及池化操作的特性[32],可以有效降低網(wǎng)絡(luò)的復(fù)雜度,減少參數(shù)的數(shù)量,并提高所提取特征的精度[33]。典型的卷積神經(jīng)網(wǎng)絡(luò)包括VGG、AlexNet、ResNet,而這些網(wǎng)絡(luò)都是以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為基礎(chǔ)發(fā)展的。如圖1所示,CNN的結(jié)構(gòu)基本上由輸入層、卷積層、池化層、全連接層和SoftMax層這五種結(jié)構(gòu)組成[34]。

圖1 CNN結(jié)構(gòu)[34]Fig.1 CNN structure[34]

1)AlexNet

在2012年,AlexNet由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton所提出,這是第一個(gè)深度學(xué)習(xí)算法在ImageNet圖像識別挑戰(zhàn)賽上拿到冠軍的模型[35]。AlexNet采用了卷積和池化操作,使用局部響應(yīng)歸一化(Local Response Normalization)和隨機(jī)失活(Dropout),從而增強(qiáng)了模型的泛化能力,避免了模型過擬合風(fēng)險(xiǎn)。AlexNet的缺點(diǎn)是神經(jīng)網(wǎng)絡(luò)模型的層數(shù)和參數(shù)量較少。在實(shí)際應(yīng)用中,需要根據(jù)任務(wù)的復(fù)雜度、數(shù)據(jù)規(guī)模等因素,在深度和性能之間進(jìn)行權(quán)衡和選擇。楊秀璋等[36]提出了一種自適應(yīng)圖像增強(qiáng)和AlexNet的水書文字識別算法,通過預(yù)處理來對圖像進(jìn)行降噪、變換等操作,最后構(gòu)建AlexNet神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)水書古文字的自動(dòng)識別。結(jié)果表明,該算法能有效識別復(fù)雜環(huán)境下的水族古文字,其精確率、召回率和F1值分別可達(dá)到0.975 5、0.974 3和0.974 3。何前等[37]在對葡萄葉部黑腐病、埃斯卡病和褐斑病這3種病害圖像及健康葉部圖像進(jìn)行分類識別時(shí),采用在傳統(tǒng)的AlexNet算法基礎(chǔ)上增加池化層層數(shù),壓縮特征量,調(diào)整激活函數(shù),把ReLU函數(shù)換成Leaky ReLU函數(shù),解決了神經(jīng)元“死亡現(xiàn)象”。結(jié)果表明,該算法對葡萄葉部病害的分類準(zhǔn)確率為99.1%,高于傳統(tǒng)AlexNet算法。YABO等[38]針對t型逆變器開路故障特征相似度高等問題,提出了一種基于格拉姆角求和場和改進(jìn)的AlexNet網(wǎng)絡(luò)的端到端故障診斷方法。通過格拉姆角求和場算法將采集的一維時(shí)序信號映射為二維圖像。再利用改進(jìn)的AlexNet進(jìn)行特征提取,最后通過Softmax層輸出故障診斷結(jié)果。結(jié)果表明,該模型的故障診斷率高達(dá)99.72%,不僅可以診斷單個(gè)故障,還可以診斷不同階段的多個(gè)故障。

2)VGG

在2014年,SIMONYAN和ZISSERMAN[39]提出VGG模型,詳細(xì)描述了VGG模型的基本架構(gòu)和關(guān)鍵特性,它的特點(diǎn)是采用了連續(xù)的卷積層,其中提到了使用多個(gè)小的3×3卷積核來替代大的卷積核,以及如何堆疊多個(gè)卷積層和全連接層來提取圖像特征。目前的VGG16 卷積神經(jīng)網(wǎng)絡(luò)模型包括 13個(gè)卷積層、3個(gè)全連接層及5個(gè)池化層。其中,卷積層和全連接層具有權(quán)重系數(shù),因此也稱權(quán)重層(池化層不涉及權(quán)重,因此不屬于權(quán)重層,不被計(jì)數(shù))。VGG的優(yōu)點(diǎn)是具有很好的泛化性能,即可以在盡可能多的數(shù)據(jù)集上進(jìn)行訓(xùn)練。但是,VGG的缺點(diǎn)是網(wǎng)絡(luò)深度較大,需要大量的計(jì)算資源(計(jì)算機(jī)的處理器、顯卡、內(nèi)存等)和時(shí)間來訓(xùn)練。VGG模型引入更多的卷積層以及小卷積核來進(jìn)行細(xì)致的特征提取,解決了網(wǎng)絡(luò)深度對模型表現(xiàn)的限制。然而,隨著網(wǎng)絡(luò)深度的增加,模型出現(xiàn)了“退化”問題,即網(wǎng)絡(luò)的深度加深反而影響了模型的泛化能力。該模型的發(fā)展為圖像識別的任務(wù)提供了重要的基礎(chǔ)和指導(dǎo),許多研究者也提出了一些改進(jìn)的VGG模型來進(jìn)行圖像識別的任務(wù)。金守峰等[40]提出了一種融合改進(jìn)VGG16模型與SVM的抓毛織物的檢測方法,將預(yù)處理后的抓毛織物圖像輸入改進(jìn)的VGG16模型來獲取毛織物樣本的特征,該模型使用MatLab深度學(xué)習(xí)工具箱deepNetworkDesigner構(gòu)建改進(jìn)的VGG16網(wǎng)絡(luò)模型。最后再把獲取的毛織物輸入到支持向量機(jī)中來進(jìn)行分類。結(jié)果表明,該方法在測試集平均識別準(zhǔn)確率為99.96%。翁羽潔等[41]通過比較VGG的3個(gè)模型(VGG-11、VGG-13、VGG-16)對新冠肺炎CT圖像診斷準(zhǔn)確率發(fā)現(xiàn),VGG-13的效果最好。同時(shí)在VGG-13模型的基礎(chǔ)上,通過改進(jìn)閾值的方式使準(zhǔn)確率由86%提高到89%,進(jìn)一步提高了診斷的準(zhǔn)確率。

3)ResNet

在2015年,ResNet模型由Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun所提出,他通過引入殘差塊(Residual Block)解決了深層網(wǎng)絡(luò)訓(xùn)練難以收斂的問題[42]。Residual Block通過將輸入數(shù)據(jù)直接與輸出數(shù)據(jù)相加來形成一個(gè)跨層連接,這種跨層連接減少了網(wǎng)絡(luò)層數(shù)的增加對梯度消失的影響,使得模型能夠更加容易地訓(xùn)練和收斂。ResNet模型引入了殘差結(jié)構(gòu)的思想,在訓(xùn)練時(shí),讓輸出的恒等映射存在于各神經(jīng)層的之中,使訓(xùn)練之后的神經(jīng)網(wǎng)絡(luò)不會(huì)因?yàn)樵黾訉訑?shù)導(dǎo)致性能衰減。ResNet的提出有效地解決了更深層次的神經(jīng)網(wǎng)絡(luò)帶來的性能損失的問題,同時(shí)進(jìn)一步提高了圖像分類和識別的準(zhǔn)確率。這也激發(fā)了許多研究者將此模型應(yīng)用到各個(gè)領(lǐng)域中去。鄭顯潤等[43]提出了一種多尺度特征提取的深度殘差網(wǎng)絡(luò),采用改進(jìn)的殘差結(jié)構(gòu),使用等級制的類殘差連接取代了原本的3×3卷積核,增加了每個(gè)網(wǎng)絡(luò)層的感受野,可以更細(xì)地提取多尺度特征。結(jié)果表明,該方法在識別自然背景下常見22種水稻害蟲上,平均識別準(zhǔn)確率達(dá)到92.023%。SARWINDA等[44]在結(jié)腸腺體圖像上訓(xùn)練ResNet-18和ResNet-50,該模型用于區(qū)分結(jié)直腸癌的良惡性。分別在三種不同的測試數(shù)據(jù)(占整個(gè)數(shù)據(jù)集的20%、25%和40%)上評估了這兩個(gè)模型,結(jié)果表明,在三種測試數(shù)據(jù)中,ResNet-50比ResNet-18的準(zhǔn)確性、靈敏度都要高,并且在20%和25%測試集上性能最佳,分類準(zhǔn)確率在80%以上,靈敏度在87%以上。PAN等[45]利用Inception V3和ResNet-50深度學(xué)習(xí)模型將眼底圖像分為正常、黃斑變性和塊化眼底三大類,來識別和治療眼底疾病。結(jié)果表明,ResNet-50比Inception V3分類的準(zhǔn)確率高,達(dá)到93.81%。

2 圖像識別在選礦中的應(yīng)用

2.1 圖像識別在重選中的應(yīng)用

重選具有作業(yè)成本低、見效快、環(huán)保等優(yōu)點(diǎn),廣泛應(yīng)用于煤、有色金屬、稀有金屬、貴金屬以及一些非金屬礦石的選別中。重選工藝中需要現(xiàn)場工人對設(shè)備及選別指標(biāo)做出相應(yīng)的判斷,從而對重選工藝參數(shù)進(jìn)行調(diào)整,以維持要求的選礦指標(biāo)。利用圖像識別技術(shù)與重選相結(jié)合的方式,能夠提高重選參數(shù)精度,優(yōu)化了重選流程。

劉惠中等[46]針對螺旋選礦機(jī)礦帶分界模糊、識別難度大等難題,提出了一種優(yōu)化的Canny邊緣檢測算法和基于深度學(xué)習(xí)的HED邊緣檢測算法,并分別對螺旋選礦機(jī)礦物分帶圖像進(jìn)行了礦帶分割位置提取試驗(yàn)。對比兩種算法在圖像處理算法中的ODS和OIS評估指標(biāo)發(fā)現(xiàn),基于深度學(xué)習(xí)的HED邊緣檢測算法的檢測效果值比優(yōu)化的Canny邊緣檢測算法的檢測效果值分別高了31.1%和18.6%。趙玉華等[47]將搖床礦帶圖像進(jìn)行預(yù)處理后,作為VGG-16模型的輸入,并使用均方損失和Adam優(yōu)化器進(jìn)行訓(xùn)練,輸出為接礦位置的預(yù)測。該模型在華聯(lián)鋅煙公司新田選礦廠精選段搖床開展了試驗(yàn)研究。結(jié)果表明,驗(yàn)證集中85%的樣本預(yù)測誤差小于19.5 mm,93.7%的預(yù)測誤差小于29.25 mm,該模型為現(xiàn)場生產(chǎn)提供了便利。KESHUN等[48]為了實(shí)現(xiàn)搖床多個(gè)控制參數(shù)的自適應(yīng)優(yōu)化,提出了一種以選礦效率最大化為目標(biāo)的振動(dòng)臺控制參數(shù)自適應(yīng)優(yōu)化方法。結(jié)果表明,采用的深度學(xué)習(xí)視覺算法能夠提取最大維數(shù)的礦帶圖像特征,即使在樣本量有限的情況下也能解決滿足工業(yè)要求的問題。

2.2 圖像識別在浮選中的應(yīng)用

浮選是選礦領(lǐng)域中應(yīng)用最廣泛的分選技術(shù),它是在固-液-氣三相接觸時(shí)進(jìn)行的,利用礦物表面濕潤性的差異,將有價(jià)值的礦物從脈石礦物中分選出來[49]。然而,在實(shí)際的選礦廠中往往需要根據(jù)操作工人的現(xiàn)場經(jīng)驗(yàn),來對浮選參數(shù)進(jìn)行實(shí)時(shí)調(diào)整[50]。隨著深度學(xué)習(xí)在圖像處理中的不斷發(fā)展,利用圖像識別的方法改善浮選工況的控制,進(jìn)一步提高了礦石浮選的效率和精度,實(shí)現(xiàn)了更好的浮選效果,為礦石加工提供了更多的技術(shù)支持。

ZARIE等[51]采用CNN對工業(yè)浮選柱在不同工藝條件下采集的泡沫圖像進(jìn)行分類。通過CNN對不同空氣流速下捕獲的泡沫圖像和不同工況下拍攝的整體圖像進(jìn)行分類。結(jié)果表明,基于CNN的泡沫分類系統(tǒng)在分類精度上總體準(zhǔn)確率達(dá)到93.1%。WEN等[52]提出了一種利用泡沫圖像和卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測煤炭浮選精礦灰分含量的浮選軟測量方案。根據(jù)精礦灰分含量將現(xiàn)場的泡沫圖像劃分為7個(gè)區(qū)間類,并對該數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)。通過卷積神經(jīng)網(wǎng)絡(luò)對不同濃縮物灰分含量區(qū)間的泡沫圖像進(jìn)行分類訓(xùn)練。結(jié)果表明,ResNet_101網(wǎng)絡(luò)經(jīng)過微調(diào)后,分類精度達(dá)到97.1%。孫友森等[53]提出一種CNN-SVM混合模型,對選煤廠煤泥浮選泡沫圖像進(jìn)行分類識別。試驗(yàn)采取山東某選煤廠的20 000張浮選圖像制作數(shù)據(jù)集,根據(jù)灰分不同將圖像分成8個(gè)類別,并針對圖像的噪聲特點(diǎn),對其去除高斯椒鹽噪聲做增強(qiáng)預(yù)處理。通過CNN進(jìn)行特征提取,再將提取到的特征輸入給SVM進(jìn)行預(yù)測分類。結(jié)果表明,在此次煤泥浮選泡沫分類中取得了87.66%的準(zhǔn)確率。

2.3 圖像識別在磁選中的應(yīng)用

磁選是根據(jù)礦物中不同顆粒之間的磁性差異,在非均勻磁場中顆粒受到磁力、機(jī)械力的作用下,磁性不同的礦粒會(huì)沿著不同的路徑運(yùn)動(dòng),進(jìn)而會(huì)使礦粒分離開。將圖像識別技術(shù)引入到磁選過程,通過對分選過程圖像實(shí)時(shí)監(jiān)控實(shí)現(xiàn)工藝參數(shù)調(diào)控,對提高磁選過程智能化具有重要意義。

武琦[54]利用Visual C++6.0設(shè)計(jì)了一個(gè)用于識別磁選柱溢流液面狀態(tài)的數(shù)字圖像處理系統(tǒng)。通過圖像采集、圖像預(yù)處理、圖像分析、數(shù)據(jù)識別建立樣本數(shù)據(jù)庫,識別當(dāng)前溢流液面的圖像數(shù)據(jù)是否符合要求。該系統(tǒng)通過圖像處理技術(shù)監(jiān)控溢流液面跑礦情況,以便及時(shí)調(diào)節(jié)給礦量,能夠有效提高磁選效率。KURSUN等[55]通過長石和脈石礦物之間的顏色差異,采用數(shù)字圖像處理方法來測定樣品中磁性礦物和非磁性礦物的相對含量。結(jié)果表明,與傳統(tǒng)方法相比,數(shù)字圖像處理方法可以作為一種簡單、可靠和可重復(fù)的測定磁選精礦中脈石含量的方法。

3 總結(jié)與展望

隨著深度學(xué)習(xí)技術(shù)的發(fā)展,將選礦工藝與圖像識別技術(shù)相結(jié)合,通過分析和識別選礦過程中的圖像信息,可以實(shí)時(shí)監(jiān)測和控制選礦工況,從而提高選礦效率、降低人工成本、減少資源浪費(fèi)。同時(shí),通過數(shù)據(jù)分析可以實(shí)現(xiàn)選礦工藝優(yōu)化,為選礦行業(yè)的可持續(xù)發(fā)展提供技術(shù)支持。

圖像識別在重選、浮選、磁選等相關(guān)領(lǐng)域研究成果顯著,但也存在一些局限:一是圖像識別技術(shù)需要大量的數(shù)據(jù)樣本進(jìn)行訓(xùn)練,而生產(chǎn)過程中獲取的現(xiàn)場圖像和工藝數(shù)據(jù)誤差較大,導(dǎo)致圖像識別技術(shù)準(zhǔn)確度不高;二是由于選礦流程繁雜,選礦工藝需要對多個(gè)點(diǎn)位進(jìn)行控制監(jiān)測,每個(gè)點(diǎn)位所需要建立的模型也不相同,從而增加了全流程智能化控制的難度。

猜你喜歡
圖像識別選礦結(jié)果表明
AGV機(jī)器人在選礦工藝智能搖床系統(tǒng)的應(yīng)用
常規(guī)選礦法不能有效回收水淬渣中鐵的原因探討
昆鋼科技(2022年2期)2022-07-08 06:35:56
基于Resnet-50的貓狗圖像識別
電子制作(2019年16期)2019-09-27 09:34:50
高速公路圖像識別技術(shù)應(yīng)用探討
圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
電子制作(2018年19期)2018-11-14 02:37:04
圖像識別在水質(zhì)檢測中的應(yīng)用
電子制作(2018年14期)2018-08-21 01:38:16
某燒綠石礦的選礦試驗(yàn)研究
內(nèi)蒙古某紅柱石礦選礦試驗(yàn)
金屬礦山(2013年1期)2013-03-11 16:52:21
體育鍛煉也重要
闊世瑪與世瑪用于不同冬小麥品種的安全性試驗(yàn)
滁州市| 泰和县| 眉山市| 神农架林区| 贡觉县| 稷山县| 乐至县| 永清县| 新密市| 琼海市| 延边| 黄浦区| 长葛市| 桂林市| 紫金县| 株洲县| 南澳县| 镇江市| 阜康市| 察雅县| 新建县| 连城县| 松桃| 绥宁县| 阜平县| 益阳市| 神池县| 东安县| 浪卡子县| 文成县| 珠海市| 姚安县| 抚顺市| 什邡市| 社会| 玉环县| 永川市| 富川| 简阳市| 梁山县| 河北省|