摘 "要:為解決煤礦高粉塵、低照度、高噪聲與堆疊等復(fù)雜環(huán)境因素導(dǎo)致的煤矸識(shí)別精度低、漏檢與誤檢問題,提出一種基于KRB-YOLOv5s算法的煤矸識(shí)別方法。采用K均值聚類(K-means++)算法對數(shù)據(jù)集進(jìn)行重新聚類,以得到更精準(zhǔn)的錨框參數(shù);在YOLOv5s主干網(wǎng)絡(luò)中引入大核卷積結(jié)構(gòu)重參數(shù)(RepLKNet)網(wǎng)絡(luò),通過大核卷積架構(gòu)提取目標(biāo)更高層級(jí)的特征信息;在YOLOv5s頸部引入加權(quán)雙向特征金字塔(BiFPN)網(wǎng)絡(luò),通過雙向跨尺度連接對目標(biāo)多尺度特征進(jìn)行快速捕捉與融合。在煤矸數(shù)據(jù)集上開展實(shí)驗(yàn),結(jié)果表明:與其他YOLO系列檢測算法相比,KRB-YOLOv5s算法在高粉塵、低照度、高噪聲與堆疊工況下的綜合檢測性能最佳,識(shí)別精度均值(mAP)達(dá)94.5%,比YOLOv5s算法提高了3.3個(gè)百分點(diǎn)。研究結(jié)論為煤礦復(fù)雜工況下煤矸智能分選提供參考。
關(guān)鍵詞:煤矸識(shí)別方法;大核卷積架構(gòu);多尺度特征;YOLOv5s算法;煤矸智能分選
中圖分類號(hào):TP391 " " " " " " " " "文獻(xiàn)標(biāo)志碼:A " " " " " " "文章編號(hào):1008-0562(2024)04-0385-08
Recognition method for coal and gangue based on KRB-YOLOv5s
GE Qingnan, CHENG Gang*, ZHAO Dongyang
(State Key Laboratory of Deep Coal Mine Mining Response and Disaster Prevention and Control, Anhui University of Science and Technology, Huainan 232001, China)
Abstract: To solve the problems of low recognition accuracy, missed detection, and 1 detection of coal and gangue caused by complex environmental factors such as high dust, low illumination, and high noise in coal mines, a recognition method for coal and gangue based on KRB-YOLOv5s is proposed. The K-means++ algorithm is used to re-cluster the dataset to obtain more accurate anchor box parameters. The RepLKNet network is introduced into the YOLOv5s backbone network to extract higher-level feature information of the target through a large kernel convolutional architecture. A BiFPN network is introduced into the neck of YOLOv5s to quickly capture and fuse multi-scale features of the target through bidirectional cross scale connections. Experiments are conducted on a dataset of coal and gangue, and the results show that compared with other YOLO series detection algorithms, the KRB-YOLOv5s algorithm has the best comprehensive detection performance under high dust, low illumination, and high noise conditions, with an average recognition precision (mAP) of 94.5%, which is 3.3 percentage points higher than that of YOLOv5s algorithm. The research conclusions provide a reference for intelligent sorting of coal and gangue under complex working conditions in coal mine.
Key words: recognition method for coal and gangue; large kernel convolutional architecture; multi-scale features; YOLOv5s algorithm; intelligent sorting of coal and gangue
0 "引言
煤矸分選是煤矸石處理流程中的重要環(huán)節(jié),其分選方式包括人工選矸法、濕選法、干選法。人工選矸法分揀效率低,濕選法需要大量水資源,而干選法更符合綠色發(fā)展理念,已成為目前煤矸石分選的研究熱點(diǎn)。隨著煤礦智能化發(fā)展,煤矸識(shí)別技術(shù)作為干選法的核心步驟迎來了新的技術(shù)突破,其中基于深度學(xué)習(xí)的煤矸智能識(shí)別算法[1-4]因其靈活度高和可遷移學(xué)習(xí)的特點(diǎn),受到國內(nèi)外學(xué)者的廣泛關(guān)注。
基于深度學(xué)習(xí)的煤矸識(shí)別方法主要分為以區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(RCNN)[5]、快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Faster-RCNN)[6]、實(shí)例分割框架(Mask- RCNN)[7]為代表的兩階段檢測模型和以單次多邊框檢測(SSD)[8]、深度目標(biāo)檢測(YOLO)系列[9-12]為代表的一階段檢測模型。近年來,有關(guān)煤與矸石的視覺識(shí)別研究,大多集中于針對上述檢測算法的改進(jìn)與創(chuàng)新。司壘等[13]針對傳統(tǒng)麻雀搜索算法(SSA)進(jìn)行煤矸快速精準(zhǔn)識(shí)別時(shí)易陷入局部最優(yōu)以及種群多樣性的問題,提出一種基于ISSA- LightGBM的煤矸快速識(shí)別模型,提升了煤矸識(shí)別準(zhǔn)確度。郭永存等[14]針對小樣本數(shù)據(jù)難以構(gòu)建深度學(xué)習(xí)模型以及具體工況下不同尺度煤矸形態(tài)和顏色識(shí)別率低的問題,提出融合遷移思想與結(jié)構(gòu)優(yōu)化煤矸模型的方法,通過雙關(guān)系網(wǎng)絡(luò)(TW-RN)模型改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建Im_AlexNet、Im_VGG16、Im_VGG19、Im_ResNet50煤矸識(shí)別模型來提高煤矸識(shí)別精度與速度。郜亞松等[15]針對在圖像處理中煤矸識(shí)別存在速度、效率低以及精度起伏問題,通過在V3移動(dòng)網(wǎng)絡(luò)模型(MobileNetV3-large)中引入碳邊境調(diào)節(jié)機(jī)制(CBAM)注意力機(jī)制,來增強(qiáng)模型對目標(biāo)復(fù)雜像素信息的特征提取能力,提升了煤矸識(shí)別精度。蔣磊等[16]針對煤矸滾落工況下的煤矸快速準(zhǔn)確識(shí)別問題,提出一種基于梅爾頻率倒譜系數(shù)(MFCC)和方向?qū)?shù)卷積神經(jīng)網(wǎng)絡(luò)(FD-CNN)的煤矸識(shí)別方法,其主要以煤矸滾落到液壓支架尾梁振動(dòng)信號(hào)的MFCC特征參數(shù)為訓(xùn)練與測試樣本,并使用自行搭建的FD-CNN卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了基于煤矸振動(dòng)信號(hào)的在線分類與識(shí)別。張磊等[17]針對傳統(tǒng)煤矸檢測模型檢測精度低且人工提取特征速度慢的問題,提出一種基于YOLOv5s-SDE的帶式輸送機(jī)煤矸目標(biāo)檢測方法,提升了模型收斂速度和小目標(biāo)煤矸的檢測精度。沈科等[18]在YOLOv5s網(wǎng)絡(luò)中引入自校正卷積(SCConv),并將原YOLOv5s的三尺度檢測網(wǎng)絡(luò)簡化為二尺度檢測網(wǎng)絡(luò),提升了模型的檢測精度和速度。上述煤矸識(shí)別方法所應(yīng)用的實(shí)驗(yàn)環(huán)境條件較好且工況簡單,而在面對煤礦高粉塵、低照度、高噪聲與堆疊的復(fù)雜工況環(huán)境時(shí),其檢測的魯棒性與穩(wěn)定性將面臨諸多挑戰(zhàn)。因此,本文提出一種基于KRB-YOLOv5s的煤矸識(shí)別方法,以提升煤礦復(fù)雜背景下的煤矸識(shí)別精度。 1 "KRB-YOLOv5s模型
YOLOv5s模型可分為4個(gè)部分:輸入端(Input)、主干網(wǎng)絡(luò)(BackBone)、頸部(Neck)與頭部(Head)。輸入端主要針對圖像數(shù)據(jù)集進(jìn)行Mosaic數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算和自適應(yīng)縮放操作。主干網(wǎng)絡(luò)由卷積塊聯(lián)合輕量化(CBL)模塊、跨通道和跨層的卷積塊(C3模塊),以及空間金字塔池化(SPP)模塊組成,主要用于目標(biāo)圖像的多層特征提取與傳遞。頸部由特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PAN)組成,主要用于實(shí)現(xiàn)目標(biāo)全局信息的多層級(jí)特征融合。頭部由3個(gè)不同大小的卷積層組成,對目標(biāo)的類別、位置以及置信度進(jìn)行輸出。本文針對YOLOv5s網(wǎng)絡(luò)進(jìn)行改進(jìn),改進(jìn)后的YOLOv5s結(jié)構(gòu)見圖1。
改進(jìn)策略如下:①采用K-means++算法對煤矸數(shù)據(jù)集進(jìn)行重新聚類,以獲得更為精準(zhǔn)的錨框參數(shù),提升聚類精度;②采用RepLKNet網(wǎng)絡(luò)[19-20]分別替換YOLOv5s主干網(wǎng)絡(luò)最后一層與頸部倒數(shù)第二層的C3模塊,并通過大核卷積架構(gòu)逐步提取煤矸圖像更高層級(jí)的特征信息,以提升模型對煤矸關(guān)鍵特征的提取能力;③采用BiFPN替換頸部的PAN,通過自上而下和自下而上的雙向跨尺度信息傳遞策略,實(shí)現(xiàn)模型對煤矸多尺度特征的快速捕捉與融合。
2 "KRB-YOLOv5s算法原理
2.1 "K-means++算法
原YOLOv5s模型的初始錨框參數(shù)是采用K-means算法對coco數(shù)據(jù)集聚類得到的,對本文的煤矸數(shù)據(jù)集適用性較差。因此,本文采用聚類精度更高的K-means++算法對煤矸數(shù)據(jù)集進(jìn)行重新聚類,以生成適用于該數(shù)據(jù)集的新錨框參數(shù)。K-means++算法的流程如下。
步驟1 "數(shù)據(jù)初始化。在數(shù)據(jù)集中隨機(jī)選擇一個(gè)目標(biāo)框的寬高參數(shù)樣本作為第一個(gè)聚類中心A1。
步驟2 "選擇聚類中心。先計(jì)算其余目標(biāo)框與第一個(gè)聚類中心的最短距離d(x),再計(jì)算每個(gè)樣本被選為下一個(gè)聚類中心的概率p,見式(1),并按照輪盤法選擇下一個(gè)聚類中心An。
。 (1)
步驟3 "迭代聚類。在迭代選擇多個(gè)聚類中心過程中,根據(jù)最短距離逐漸將數(shù)據(jù)集樣本分為若干類。
步驟4 "重復(fù)執(zhí)行上述步驟,直到聚類中心位置不再變化,并輸出最終的聚類結(jié)果。
2.2 "RepLKNet網(wǎng)絡(luò)
為解決井下高粉塵、低照度、高噪聲的復(fù)雜環(huán)境因素導(dǎo)致的煤矸關(guān)鍵特征提取能力差的問題,在YOLOv5s主干網(wǎng)絡(luò)中引入RepLKNet網(wǎng)絡(luò),憑借大核卷積的優(yōu)勢來擴(kuò)大模型感受野并獲得更為豐富的煤矸形狀偏差信息,以提升模型在煤礦復(fù)雜背景中對煤矸關(guān)鍵特征的提取能力。
RepLKNet網(wǎng)絡(luò)整體架構(gòu)見圖2,RepLKNet網(wǎng)絡(luò)包括3個(gè)部分:Steam部分、Stage階段和Transition層。Steam部分為開始階段,分別采用3個(gè)3×3卷積(Conv)、2個(gè)3×3的深度可分離卷積(DW)與1個(gè)1×1卷積(Conv)逐步對目標(biāo)圖像進(jìn)行下采樣,從而最大程度獲取輸入圖像的全局信息,以減少特征信息損失。Stage階段作為主干層,主要用于對目標(biāo)圖像信息進(jìn)行漸進(jìn)式特征提取、轉(zhuǎn)換和整合,其主要包括RepLKBlock和ConvFFN兩部分。其中,RepLKBlock由批量歸一層(BN)、1×1卷積(Conv)、3×3深度可分離卷積(DW)以及1×1殘差網(wǎng)絡(luò)組成;ConvFFN由BN層、1×1卷積和1×1殘差網(wǎng)絡(luò)組成。Transition層處于多個(gè)Stage階段之間,其利用一個(gè)1×1卷積與兩個(gè)3×3 DW對特征圖尺寸和通道數(shù)進(jìn)行自適應(yīng)調(diào)整。
2.3 "BiFPN網(wǎng)絡(luò)
為解決煤矸尺寸各異導(dǎo)致的目標(biāo)尺度變化劇烈的問題,在YOLOv5s頸部引入BiFPN,以提升模型對目標(biāo)多尺度特征的融合能力。FPN、PAN、BiFPN結(jié)構(gòu)示意見圖3。
如圖3(a)與圖3(b)所示,在原YOLOv5s中主要采用FPN與PAN進(jìn)行特征融合,二者所采用的單向特征傳遞機(jī)制與固定層級(jí)的特征融合方式,存在信息傳遞方向單一且特征融合靈活性低的問題,導(dǎo)致其難以適應(yīng)目標(biāo)尺度變化劇烈的工況。因此,引入如圖3(c)所示的BiFPN網(wǎng)絡(luò),以消除對融合貢獻(xiàn)較小的單邊輸入節(jié)點(diǎn),并利用該網(wǎng)絡(luò)中各節(jié)點(diǎn)自頂向下、自底向上、跨尺度連接等特點(diǎn),來更好地處理尺度變化和語義信息。
3 "實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)平臺(tái)參數(shù)見表1,實(shí)驗(yàn)平臺(tái)包括采集裝置、機(jī)器視覺裝置、輸送機(jī)和實(shí)驗(yàn)材料,見圖4。先利用傳送帶將煤矸石傳送到機(jī)器視覺裝置區(qū)域,再通過機(jī)器視覺裝置實(shí)時(shí)采集煤矸圖像。
為進(jìn)一步模擬煤礦高粉塵、低照度、高噪聲與堆疊的復(fù)雜工況,采用椒鹽噪聲、亮度變換和霧化的方式對原始圖像進(jìn)行數(shù)據(jù)增強(qiáng),見圖5,最終將數(shù)據(jù)集由415張圖像擴(kuò)充至1 660張圖像,同時(shí)提升了煤矸數(shù)據(jù)集的泛化能力與多樣性。按照8∶1∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集。
4 "實(shí)驗(yàn)及結(jié)果分析
4.1 "實(shí)驗(yàn)配置
基于AutoDL云服務(wù)器開展實(shí)驗(yàn)研究,實(shí)驗(yàn)配置的操作系統(tǒng)為Ubuntu 20.04,CUDA版本為11.3,語言為Python 3.8,CPU為Intel(R) Xeon(R) Platinum 8350C,GPU為NVIDIA GeForce RTX 3090(24 GB)。實(shí)驗(yàn)參數(shù)設(shè)置如下:初始學(xué)習(xí)率為0.01,周期學(xué)習(xí)率為0.01,動(dòng)量為0.937,權(quán)重衰減正則項(xiàng)為0.05,訓(xùn)練樣本數(shù)為32,線程數(shù)為16,訓(xùn)練迭代301次。
4.2 "實(shí)驗(yàn)評價(jià)指標(biāo)
本文所采用實(shí)驗(yàn)評價(jià)指標(biāo)為:識(shí)別精確度P(precision)、召回率R(recall)、識(shí)別精度均值m(mAP)、調(diào)和平均值F1(F1-score)、參數(shù)量(Params)、檢測速度S(frames per second,F(xiàn)PS)。評價(jià)指標(biāo)的計(jì)算式為
, (2)
, (3)
, (4)
, (5)
式(2)~式(5)中:TP為真正例;FN為假反例;FP為假正例;Api為第i次識(shí)別的平均精度;K為所需識(shí)別目標(biāo)(煤或矸石)的數(shù)量。
4.3 "消融實(shí)驗(yàn)
為驗(yàn)證各改進(jìn)模塊的有效性,在煤矸數(shù)據(jù)集上以相同的訓(xùn)練策略進(jìn)行消融實(shí)驗(yàn)。消融實(shí)驗(yàn)設(shè)計(jì)見表2。消融實(shí)驗(yàn)結(jié)果見表3和圖6。
在表2與圖6中,對比模型A和模型B可知,引入K-means++算法,使P下降了0.2個(gè)百分點(diǎn),R提升了2.8個(gè)百分點(diǎn),m提升了1.9個(gè)百分點(diǎn),F(xiàn)1提升了2個(gè)百分點(diǎn)。模型B通過聚類算法,提高了聚類質(zhì)量以及收斂速度。
對比模型A和模型C可知,引入RepLKNet網(wǎng)絡(luò),使P提升了1.8個(gè)百分點(diǎn),R提升了1.7個(gè)百分點(diǎn),m提升了2.2個(gè)百分點(diǎn),F(xiàn)1提升了1個(gè)百分點(diǎn)。模型C利用大核卷積,使目標(biāo)特征提取能力提高,改善了煤矸漏檢與識(shí)別精度低的問題。
對比模型A和模型D可知,引入BiFPN網(wǎng)絡(luò),使P提升了0.3個(gè)百分點(diǎn),R提升了3.7個(gè)百分點(diǎn),m提升了2.5個(gè)百分點(diǎn),F(xiàn)1提升了2個(gè)百分點(diǎn)。模型D利用BiFPN網(wǎng)絡(luò)的雙向跨尺度連接與批量歸一化融合操作,提升了模型對目標(biāo)多尺度特征的融合能力,改善了煤矸誤檢的問題。
對比模型A和模型E可知,在YOLOv5s基礎(chǔ)上添加了K-means++算法、RepLKNet模塊與BiFPN網(wǎng)絡(luò)。三者融合使P提升了2.6個(gè)百分點(diǎn),R提升了3.9個(gè)百分點(diǎn),m提升了3.3個(gè)百分點(diǎn),F(xiàn)1提升了3個(gè)百分點(diǎn)。模型E綜合利用3個(gè)改進(jìn)模塊的優(yōu)勢,極大提升了煤矸檢測精度,可滿足煤礦復(fù)雜工況下的煤矸識(shí)別需求。
4.4 "對比實(shí)驗(yàn)
為客觀評價(jià)改進(jìn)后的模型檢測性能,基于同一數(shù)據(jù)集,保持訓(xùn)練環(huán)境不變,對其他幾種算法進(jìn)行測試。實(shí)驗(yàn)對比了SSD算法、端到端目標(biāo)檢測跟蹤器(DETR)算法、Faster-RCNN算法、YOLOv5n算法、YOLOv5s算法、YOLOv5m算法、YOLOv7-tiny算法、YOLOv8算法,實(shí)驗(yàn)結(jié)果見表4和圖7。
在檢測精度方面,KRB-YOLOv5s算法的mAP曲線在第100輪迭代后逐步攀升并高于其他8種算法,其mAP值為94.5%,說明其對煤矸的識(shí)別效果最佳。SSD算法的召回率最低,僅為79.5%,說明其對煤矸的漏檢率最高,而DETR算法的識(shí)別精確度最低,僅為79.4%,說明其對煤矸的誤檢率最高。
在檢測速度方面,KRB-YOLOv5s算法檢測速度為125 幀/s,低于YOLOv5n算法、YOLOv5s算法和YOLOv7-tiny算法,但參考圖像領(lǐng)域的實(shí)時(shí)檢測標(biāo)準(zhǔn)(檢測速度大于等于60 幀/s),其仍能充分滿足煤矸識(shí)別的實(shí)時(shí)檢測要求。DETR算法與Faster-RCNN算法的參數(shù)量較高,導(dǎo)致模型計(jì)算復(fù)雜性提升,使得二者的檢測速度均低于30 幀/s,難以滿足煤矸的實(shí)時(shí)檢測需求。
4.5 "檢測結(jié)果分析
為驗(yàn)證KRB-YOLOv5s算法的優(yōu)越性,對KRB-YOLOv5s算法、SSD算法、DETR算法、Faster-RCNN算法、YOLOv5s算法、YOLOv7-tiny算法的檢測結(jié)果進(jìn)行可視化呈現(xiàn),見圖8和圖9。檢測結(jié)果中藍(lán)色標(biāo)簽代表矸石(gangue),紅色標(biāo)簽代表煤(coal),綠色圓圈代表漏檢現(xiàn)象,黃色圓圈代表誤檢現(xiàn)象,紫色代表檢測框定位偏差現(xiàn)象。
由圖8和圖9可知,在高噪聲環(huán)境中,SSD算法出現(xiàn)檢測框定位偏差問題,F(xiàn)aster-RCNN算法和YOLOv5s算法均出現(xiàn)誤檢問題。在低照度環(huán)境中,YOLOv5s算法出現(xiàn)預(yù)測框定位偏差問題,而Faster-RCNN算法出現(xiàn)誤檢問題。在高粉塵環(huán)境中,SSD算法、DETR算法、Faster-RCNN算法和YOLOv5s算法均存在漏檢現(xiàn)象。在堆疊環(huán)境中,SSD算法出現(xiàn)預(yù)測框定位偏差問題,YOLOv5s算法與Faster-RCNN算法存在誤檢問題,DETR算法、YOLOv5s算法和YOLOv7-tiny算法的煤矸識(shí)別精度均低于KRB-YOLOv5s算法。在上述4種復(fù)雜工況環(huán)境中,KRB-YOLOv5s算法未出現(xiàn)誤檢、漏檢與檢測框定位偏差問題,并且對煤矸的檢測置信度得分均高于其他4種檢測算法,表明KRB-YOLOv5s算法更適用于煤礦復(fù)雜環(huán)境中的煤矸實(shí)時(shí)檢測任務(wù)。
5 "結(jié)論
(1)提出了一種基于KRB- YOLOv5s算法的煤矸識(shí)別方法,通過在YOLOv5s網(wǎng)絡(luò)中分別引入K-means++算法、RepLKNet模塊和BiFPN網(wǎng)絡(luò),提升了算法對煤矸關(guān)鍵特征的提取能力、多尺度特征融合能力以及識(shí)別精度。
(2)消融實(shí)驗(yàn)結(jié)果表明,各改進(jìn)模塊對YOLOv5s算法的檢測結(jié)果均有提升,尤其是RepLKNet網(wǎng)絡(luò)和BiFPN網(wǎng)絡(luò),分別將識(shí)別精度均
值提升了2.2個(gè)百分點(diǎn)和2.5個(gè)百分點(diǎn),驗(yàn)證了所提出的KRB-YOLOv5s算法中各改進(jìn)模塊的有效性。
(3)對比實(shí)驗(yàn)結(jié)果表明,與SSD算法、DETR算法、Faster-RCNN算法、YOLOv5n算法、YOLOv5s算法、YOLOv5m算法、YOLOv7-tiny算法、YOLOv8算法相比,KRB-YOLOv5s算法的魯棒性和穩(wěn)定性最好,在高粉塵、低照度、高噪聲與堆疊的復(fù)雜背景中對煤矸的識(shí)別精度均值最高(mAP達(dá)94.5%),且未出現(xiàn)誤檢與漏檢現(xiàn)象,從而驗(yàn)證了所提出的KRB-YOLOv5s算法的優(yōu)越性。
參考文獻(xiàn)(References):
[1] 張倩,馬愿,李國麗,等.頻域分解和深度學(xué)習(xí)算法在短期負(fù)荷及光伏功率預(yù)測中的應(yīng)用[J].中國電機(jī)工程學(xué)報(bào),2019,39(8):2221-2230,5.
ZHANG Qian,MA Yuan,LI Guoli,et al.Applications of frequency domain decomposition and deep learning algorithms in short-term load and photovoltaic power forecasting[J].Proceedings of the CSEE,2019, 39(8):2221-2230,5.
[2] 邢海燕,王松弘澤,弋鳴,等.基于IPSO-GRU深度學(xué)習(xí)算法的海底管道缺陷尺寸磁記憶定量反演模型[J].工程科學(xué)學(xué)報(bào),2022,44(5):911-919.
XING Haiyan,WANG Songhongze,YI Ming,et al.Metal magnetic memory quantitative inversion model based on IPSO-GRU algorithm for detecting submarine pipeline defect[J].Chinese Journal of Engineering,2022,44(5):911-919.
[3] 胡明娣,吳怡,宋堯,等.單幅圖像去雨數(shù)據(jù)集和深度學(xué)習(xí)算法的聯(lián)合評估與展望[J].中國圖象圖形學(xué)報(bào),2022,27(5):1359-1391.
HU Mingdi,WU Yi,SONG Yao,et al.The integrated evaluation and review of single image rain removal based datasets and deep learning methods[J].Journal of Image and Graphics,2022,27(5):1359-1391.
[4] 藍(lán)朝楨,盧萬杰,于君明,等.異源遙感影像特征匹配的深度學(xué)習(xí)算法[J].測繪學(xué)報(bào),2021,50(2):189-202.
LAN Chaozhen,LU Wanjie,YU Junming,et al.Deep learning algorithm for feature matching of cross modality remote sensing images[J].Acta Geodaetica et Cartographica Sinica,2021,50(2):189-202.
[5] GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition,June 23-28,2014,Columbus,OH,USA.IEEE,2014:580-587.
[6] 黃繼鵬,史穎歡,高陽.面向小目標(biāo)的多尺度Faster-RCNN檢測算法[J].計(jì)算機(jī)研究與發(fā)展,2019,56(2):319-327.
HUANG Jipeng,SHI Yinghuan,GAO Yang.Multi-scale Faster-RCNN algorithm for small object detection[J].Journal of Computer Research and Development,2019,56(2):319-327.
[7] 楊麗榮,曹沖,劉順.改進(jìn)Mask RCNN算法對礦石分割定位的研究[J].礦業(yè)研究與開發(fā),2023,43(4):209-216.
YANG Lirong,CAO Chong,LIU Shun.Study on improved Mask RCNN algorithm for ore segmentation and localization[J].Mining Research and Development,2023,43(4):209-216.
[8] 田智慧,孫鹽鹽,魏海濤.基于SSD模型的交通標(biāo)志檢測算法[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(12):201-206.
TIAN Zhihui,SUN Yanyan,WEI Haitao.Traffic sign detection algorithm based on SSD model[J].Computer Applications and Software, 2021,38(12):201-206.
[9] 張慶賀,陳晨,袁亮,等.基于DIC和YOLO算法的復(fù)雜裂隙巖石破壞過程動(dòng)態(tài)裂隙早期智能識(shí)別[J].煤炭學(xué)報(bào),2022,47(3):1208-1219.
ZHANG Qinghe,CHEN Chen,YUAN Liang,et al.Early and intelligent recognition of dynamic cracks during damage of complex fractured rock masses based on DIC and YOLO algorithms [J].Journal of China Coal Society,2022,47(3):1208-1219.
[10] JIANG P Y,ERGU D J,Liu F Y,et al.A Review of Yolo algorithm developments[J].Procedia Computer Science,2022,199:1066-1073.
[11] DIWAN T,ANIRUDH G,TEMBHURNE J V.Object detection using YOLO:challenges, architectural successors, datasets and applications [J].Multimedia Tools and Applications,2023,82(6):9243-9275.
[12] 茅智慧,朱佳利,吳鑫,等.基于YOLO的自動(dòng)駕駛目標(biāo)檢測研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2022,58(15):68-77.
MAO Zhihui,ZHU Jiali,WU Xin,et al.Review of YOLO based target detection for autonomous driving[J].Computer Engineering and Applications,2022,58(15):68-77.
[13] 司壘,譚超,朱嘉皓,等.基于X射線圖像和激光點(diǎn)云的煤矸識(shí)別方法[J].儀器儀表學(xué)報(bào),2022,43(9):193-205.
SI Lei,TAN Chao,ZHU Jiahao,et al.A coal gangue recognition method based on X-ray image and laser point cloud[J].Chinese Journal of Scientific Instrument,2022,43(9):193-205.
[14] 郭永存,王希,何磊,等.基于TW-RN優(yōu)化CNN的煤矸識(shí)別方法研究[J].煤炭科學(xué)技術(shù),2022,50(1):228-236.
GUO Yongcun,WANG Xi,HE Lei,et al.Research on coal and gangue recognition method based on TW-RN optimized CNN[J].Coal Science and Technology,2022,50(1):228-236.
[15] 郜亞松,張步勤,郎利影.基于深度學(xué)習(xí)的煤矸石識(shí)別技術(shù)與實(shí)現(xiàn)[J].煤炭科學(xué)技術(shù),2021,49(12):202-208.
GAO Yasong,ZHANG Buqin,LANG Liying.Coal and gangue recognition technology and implementation based on deep learning[J]. Coal Science and Technology,2021,49(12):202-208.
[16] 蔣磊,馬六章,楊克虎,等.基于MFCC和FD-CNN卷積神經(jīng)網(wǎng)絡(luò)的綜放工作面煤矸智能識(shí)別[J].煤炭學(xué)報(bào),2020,45(S2):1109-1117.
JIANG Lei,MA Liuzhang,YANG Kehu,et al.Coal and gangue intelligent separation based on MFCC and FD-CNN convolutional neural network for top coal caving mining[J].Journal of China Coal Society,2020,45(S2):1109-1117.
[17] 張磊,王浩盛,雷偉強(qiáng),等.基于YOLOv5s-SDE的帶式輸送機(jī)煤矸目標(biāo)檢測[J].工礦自動(dòng)化,2023,49(4):106-112.
ZHANG Lei,WANG Haosheng,LEI Weiqiang,et al.Coal gangue target detection of belt conveyor based on YOLOv5s-SDE[J].Journal of Mine Automation,2023,49(4):106-112.
[18] 沈科,季亮,張?jiān)?,?基于改進(jìn)YOLOv5s模型的煤矸目標(biāo)檢測[J].工礦自動(dòng)化,2021,47(11):107-111,118.
SHEN Ke,JI Liang,ZHANG Yuanhao,et al.Research on coal and gangue detection algorithm based on improved YOLOv5s model[J]. Industry and Mine Automation,2021,47(11):107-111,118.
[19] DING X H,ZHANG X Y,HAN J G,et al.Scaling up your kernels to 3131:revisiting large kernel design in CNNs[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition,June 18-24,2022,New Orleans,LA,USA.IEEE,2022:11963-11975.
[20] LI H,DENG L B,YANG C,et al.Enhanced YOLOv3 tiny network for real-time ship detection from visual image[J].IEEE Access,2021,9: 16692-16706.