国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于YOLOv8的深度學(xué)習(xí)目標(biāo)檢測(cè)研究

2024-06-17 00:00:00陳妍
消費(fèi)電子 2024年5期
關(guān)鍵詞:目標(biāo)檢測(cè)應(yīng)用前景評(píng)價(jià)指標(biāo)

【關(guān)鍵詞】深度學(xué)習(xí);YOLOv8;目標(biāo)檢測(cè);評(píng)價(jià)指標(biāo);應(yīng)用前景

當(dāng)今科學(xué)界,人工智能發(fā)展圍繞模擬人腦的探索路徑主要有符號(hào)主義與聯(lián)結(jié)主義兩種,其中,聯(lián)結(jié)主義旨在實(shí)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,目前主要有三大典型模型:卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型、深度信任網(wǎng)絡(luò)(DBN)模型和堆棧自編碼網(wǎng)絡(luò)(SAE)模型。深度學(xué)習(xí)作為人工智能的一大熱潮,在自然語(yǔ)言識(shí)別處理(例如:美國(guó)OpenAI公司于2022年底研發(fā)推出的ChatGPT聊天機(jī)器人軟件)與計(jì)算機(jī)視覺(jué)等領(lǐng)域發(fā)揮著極大的作用。人類(lèi)通過(guò)構(gòu)建人工神經(jīng)網(wǎng)絡(luò),基于龐大數(shù)據(jù)集輸入的基礎(chǔ)上,利用深度學(xué)習(xí)算法對(duì)計(jì)算機(jī)進(jìn)行不斷的訓(xùn)練,結(jié)合攝像頭,實(shí)現(xiàn)對(duì)圖像或視頻中目標(biāo)對(duì)象的識(shí)別、分類(lèi)與分割。類(lèi)似于人類(lèi)大腦結(jié)構(gòu),神經(jīng)元數(shù)量、數(shù)據(jù)量、網(wǎng)絡(luò)模型的擴(kuò)展程度與深度學(xué)習(xí)的算法性能成正比。自20世紀(jì)以來(lái),深度學(xué)習(xí)的預(yù)測(cè)能力與準(zhǔn)確性在各個(gè)領(lǐng)域都有所提高,各式各樣的深度學(xué)習(xí)算法逐漸問(wèn)世[1]。

YOLO(You Only Look Once)系列算法是以CNN(卷積神經(jīng)網(wǎng)絡(luò))為基礎(chǔ),通過(guò)一次性的前向傳播實(shí)現(xiàn)目標(biāo)檢測(cè)的算法,其構(gòu)建了更為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)以實(shí)現(xiàn)高精度與高效率的目標(biāo)檢測(cè)。YOLO算法是典型的one-stage單階段深度學(xué)習(xí)檢測(cè)方法,相較于two-stage兩階段(例如:Fasterrcnn、Mask-Rcnn等系列算法),one-stage單階段深度學(xué)習(xí)檢測(cè)方法在執(zhí)行實(shí)時(shí)檢測(cè)任務(wù)上具有其最核心的優(yōu)勢(shì):檢測(cè)速度遙遙領(lǐng)先。目前,通過(guò)不斷地迭代優(yōu)化更新,Ultralytics公司已開(kāi)發(fā)出YOLOv8,在計(jì)算機(jī)視覺(jué)領(lǐng)域具有廣泛的應(yīng)用。

一、YOLOv8算法思想與原理

(一)YOLO算法思想的獨(dú)特性

YOLO算法的目標(biāo)檢測(cè)是基于整個(gè)圖片的,屬于Region-free檢測(cè)方法,不同于Region-based類(lèi)方法需要先行確定可能包含目標(biāo)對(duì)象的候選區(qū)域作為后續(xù)檢測(cè)的備選[2],YOLO算法迅速識(shí)別出目標(biāo)對(duì)象的類(lèi)別與其精確位置只需經(jīng)過(guò)單次對(duì)圖像的遍歷,因此也被稱(chēng)為單階段(onestage)模型。

YOLO目標(biāo)檢測(cè)算法對(duì)于輸入的每張圖片,其監(jiān)督信息詳盡地標(biāo)注了圖片中所有物體的類(lèi)別、中心位置以及尺寸(高與寬)。這些數(shù)據(jù)中的位置信息均經(jīng)過(guò)歸一化處理,以確保算法能夠高效、準(zhǔn)確地處理。與YOLO之前的傳統(tǒng)目標(biāo)檢測(cè)算法不同,后者通常利用不同尺寸的滑動(dòng)窗口在圖片上逐一掃描,并將每個(gè)窗口的內(nèi)容輸入分類(lèi)器進(jìn)行識(shí)別。而YOLO則采用了一種更為高效的方式,它能夠一次性輸出所有檢測(cè)到的目標(biāo)信息[3],因此具有較高的檢測(cè)速率,對(duì)實(shí)時(shí)的目標(biāo)檢測(cè)任務(wù)具有良好的效果。

(二)YOLO目標(biāo)檢測(cè)算法原理

第一步,將圖片分割為個(gè)n*n個(gè)大小相等的grid,對(duì)每個(gè)grid都預(yù)測(cè)出若干個(gè)固定數(shù)量的bounding box邊界框,每個(gè)bounding box包含的信息為物體中心位置(x,y)、高(h)、寬(w)以及此次預(yù)測(cè)的置信度,置信度confidence的計(jì)算公式如下:

式中,IOU為交并比,即預(yù)測(cè)框與真實(shí)框的重合度;Pr(Obj)為該grid含有目標(biāo)對(duì)象物體的概率。

最終,對(duì)于n*n個(gè)grid,假設(shè)每個(gè)grid將預(yù)測(cè)出B個(gè)bounding boxes邊界框,分類(lèi)器可識(shí)別的物體種類(lèi)有C種,那么將會(huì)輸出一個(gè)n*n*(B*5+C)大小的ground truth作為目標(biāo)檢測(cè)結(jié)果,其中C位數(shù)值為該gird檢測(cè)出的物體分別屬于這C種類(lèi)別的概率。

但是,在實(shí)際檢測(cè)情況中,如果物體體積較為龐大,而grid占據(jù)的面積又較小,往往會(huì)出現(xiàn)同一個(gè)物體被多個(gè)gird所識(shí)別的現(xiàn)象,因此,YOLO算法引入了非極大值抑制NMS(Non-maximal suppression)技術(shù)。非極大值抑制NMS主要利用置信度confidence,選擇保留置信度數(shù)值最大的bounding boxes邊界框,即該bounding boxes在所有的邊界框中具有最大的把握預(yù)測(cè)出目標(biāo)對(duì)象物體在自己的grid中。

(三)YOLOv8算法的特點(diǎn)與核心改動(dòng)

基于幾代YOLO算法的不斷更新優(yōu)化,最新版本的YOLOv8算法展現(xiàn)出了明顯的優(yōu)勢(shì),更高的精度、更快的速度、強(qiáng)大的通用性及其更穩(wěn)定且高效的訓(xùn)練策略使其成為當(dāng)前目標(biāo)檢測(cè)領(lǐng)域的一種先進(jìn)算法。以下為YOLOv8算法的核心改動(dòng):

Backbone骨干網(wǎng)絡(luò)和Neck部分使用能夠兼具輕量化與豐富梯度流信息的C2f模塊替換原來(lái)YOLOv5中的C3模塊,并且對(duì)不同尺度的模型設(shè)置了不同的通道數(shù),可滿足不同場(chǎng)景的需求,大幅度地提升了其性能。

Head部分參考了目前較為主流的解耦頭結(jié)構(gòu),實(shí)現(xiàn)了分類(lèi)與檢測(cè)頭的分離。另外,使用Anchor-Free替代Anchor-Based,在定位方式上不再需要預(yù)先設(shè)置錨點(diǎn),可以直接從特征圖中推斷物體的位置與大小,對(duì)于目標(biāo)對(duì)象大小與形狀變化較大的情況,Anchor-Free顯然能夠處理得更加靈活;在模型復(fù)雜度上,Anchor-Free方法簡(jiǎn)化了模型復(fù)雜度,一定程度上提高了檢測(cè)效率。

損失函數(shù)LOSS計(jì)算方面舍去了原來(lái)的objectness分支,只包含分類(lèi)與回歸的分支,YOLOv8算法直接引用TOOD的TaskAlignedAssigner,根據(jù)分類(lèi)與回歸的分?jǐn)?shù)加權(quán)的分?jǐn)?shù)選擇正樣本。

前幾代YOLO算法在小目標(biāo)的檢測(cè)上往往表現(xiàn)不佳,許多被遮擋的目標(biāo)對(duì)象難以檢測(cè)。為了實(shí)現(xiàn)小目標(biāo)的檢測(cè),模型采用Mosaic增強(qiáng)技術(shù),將輸入的大圖像進(jìn)行拼接并隨機(jī)裁剪生成新的訓(xùn)練樣本,在每個(gè)輪次中,模型識(shí)別的圖像略有不同,迫使模型學(xué)習(xí)新位置,達(dá)到對(duì)部分遮擋對(duì)象的識(shí)別要求。同時(shí),為了提升模型訓(xùn)練效率,YOLOv8采用與YOLOX類(lèi)似的操作,在最后10個(gè)epoch中關(guān)閉了Mosaic增強(qiáng),加快了模型訓(xùn)練速度[4]。

二、YOLOv8目標(biāo)檢測(cè)流程探究

對(duì)于YOLOv8算法的模型訓(xùn)練需要輸入的數(shù)據(jù)集要求為YOLO格式。利用訓(xùn)練好的YOLOv8模型進(jìn)行實(shí)際推理時(shí),需要對(duì)其模型的預(yù)測(cè)效果進(jìn)行指標(biāo)評(píng)估。在對(duì)深度學(xué)習(xí)模型進(jìn)行評(píng)價(jià)時(shí),常使用四個(gè)主要指標(biāo)進(jìn)行模型的優(yōu)劣評(píng)價(jià),分別為準(zhǔn)確率、精確率、召回率與值。

1)準(zhǔn)確率(Accuracy)是評(píng)估分類(lèi)模型最全面宏觀又清晰直觀的指標(biāo),它表示模型正確預(yù)測(cè)的樣本數(shù)(包括所有的正類(lèi)樣本與負(fù)類(lèi)樣本)占總樣本數(shù)的比例。

式中,TP(True Positives)為模型正確預(yù)測(cè)為正類(lèi)的實(shí)例數(shù),TN(True Negatives)表示模型正確預(yù)測(cè)為負(fù)例的實(shí)例數(shù),F(xiàn)P(False Positives)為模型錯(cuò)誤預(yù)測(cè)為正例的實(shí)例數(shù),F(xiàn)N(False Negatives)為模型錯(cuò)誤預(yù)測(cè)為負(fù)類(lèi)的實(shí)際正類(lèi)實(shí)例數(shù)。

這些指標(biāo)可以從不同角度來(lái)反映一個(gè)分類(lèi)模型的預(yù)測(cè)能力,有利于幫助我們更好地評(píng)估模型,并針對(duì)性地進(jìn)行模型的后續(xù)優(yōu)化,以求得到檢測(cè)效果更優(yōu)的分類(lèi)模型。

三、YOLOv8應(yīng)用前景

(一)YOLOv8應(yīng)用范圍廣且可用性強(qiáng)

YOLOv8作為當(dāng)前先進(jìn)的目標(biāo)檢測(cè)算法之一,可應(yīng)用領(lǐng)域范圍廣。在交通領(lǐng)域,YOLOv8可通過(guò)幫助車(chē)輛實(shí)時(shí)識(shí)別行人、車(chē)輛、交通標(biāo)志等,來(lái)實(shí)現(xiàn)安全、自主的駕駛,從而極大地提升了駕駛的安全性,提高了道路交通的安全系數(shù),降低了道路交通事故的發(fā)生概率;在智能安防領(lǐng)域,YOLOv8同樣展現(xiàn)出了其強(qiáng)大的應(yīng)用能力,無(wú)論是人臉識(shí)別、行為分析還是異常檢測(cè),YOLOv8都能以高效準(zhǔn)確的方式完成任務(wù),通過(guò)實(shí)現(xiàn)在海量的監(jiān)控視頻數(shù)據(jù)中快速識(shí)別出關(guān)鍵信息,從而大大提高了安防系數(shù),為社會(huì)的和諧穩(wěn)定提供了有力的技術(shù)支持;此外,在醫(yī)療圖像分析領(lǐng)域,YOLOv8也展現(xiàn)出了其獨(dú)特的價(jià)值,通過(guò)醫(yī)學(xué)影像的精準(zhǔn)分析,醫(yī)生能夠準(zhǔn)確診斷出病變部位[6],不僅提升了醫(yī)療診斷的效率與精確度,更讓患者在康復(fù)之路上看到了更多的曙光和希望;在機(jī)器人視覺(jué)領(lǐng)域,YOLOv8同樣發(fā)揮著重要作用,它能夠幫助機(jī)器人實(shí)時(shí)識(shí)別并定位環(huán)境中的物體,從而使機(jī)器人一定程度上提高自主導(dǎo)航、物體抓取等功能的準(zhǔn)確性。

總之,YOLOv8作為一種兼具高效與準(zhǔn)確雙特性的目標(biāo)檢測(cè)算法,在計(jì)算機(jī)視覺(jué)領(lǐng)域具有廣泛的應(yīng)用前景。

(二)應(yīng)用難點(diǎn)及分析

雖然YOLOv8算法功能的強(qiáng)大程度是毋庸置疑的,但將其投入實(shí)際應(yīng)用時(shí)仍存在一定的缺陷與局限性:

(1)算力需求支撐問(wèn)題。涉及YOLOv8類(lèi)似的深度學(xué)習(xí)算法使用時(shí),無(wú)論是模型訓(xùn)練還是實(shí)際部署,都極度依賴(lài)于高性能的GPU算力支持,且為了確保算法的高效運(yùn)行,這些GPU通常需要能夠支持美國(guó)英偉達(dá)公司的CUDA計(jì)算架構(gòu),因此我國(guó)在自主創(chuàng)新與國(guó)產(chǎn)化取代方面的探索仍需繼續(xù)努力[7]。

(2)數(shù)據(jù)集采集問(wèn)題。由于模型的優(yōu)劣程度與數(shù)據(jù)集的規(guī)模與質(zhì)量成正比,因此數(shù)據(jù)集的采集過(guò)程往往至關(guān)重要。然而,在實(shí)際研究中依賴(lài)攝像頭進(jìn)行數(shù)據(jù)的采集時(shí),一旦遇到一些不可控的外力因素,例如強(qiáng)電磁輻射、攝像頭震動(dòng)、物理遮擋(如煙霧)等,都可能對(duì)采集的數(shù)據(jù)的質(zhì)量產(chǎn)生一定的影響。并且,涉及實(shí)際預(yù)測(cè)時(shí),也對(duì)攝像頭采集的實(shí)時(shí)視頻數(shù)據(jù)流有較高的清晰度要求。因此,攝像設(shè)備的成本問(wèn)題也是YOLOv8算法實(shí)際應(yīng)用難點(diǎn)之一。

針對(duì)以上問(wèn)題,我們可以從以下幾個(gè)方面著手解決:首先,加大在GPU芯片研發(fā)上的投入,推動(dòng)國(guó)產(chǎn)GPU芯片的技術(shù)突破和性能提升,減少對(duì)國(guó)外技術(shù)的依賴(lài);其次,建立完善的GPU算力資源共享平臺(tái),通過(guò)云計(jì)算、邊緣計(jì)算等方式,實(shí)現(xiàn)GPU算力的合理分配和高效利用;另外,我們可以選擇高質(zhì)量、穩(wěn)定性好的攝像頭設(shè)備,以減少外力因素對(duì)數(shù)據(jù)采集的影響。

結(jié)束語(yǔ)

YOLOv8目標(biāo)檢測(cè)算法在計(jì)算機(jī)視覺(jué)領(lǐng)域已具有極大的研究?jī)r(jià)值與重要的地位,在其余諸多應(yīng)用場(chǎng)景中也發(fā)揮著越來(lái)越重要的作用。通過(guò)對(duì)YOLOv8算法原理的深入剖析與當(dāng)今市場(chǎng)其余目標(biāo)檢測(cè)算法的對(duì)比,結(jié)合對(duì)YOLOv8算法的使用研究及其模型、網(wǎng)絡(luò)結(jié)構(gòu)的評(píng)估分析,最終成功驗(yàn)證了YOLOv8在實(shí)時(shí)目標(biāo)檢測(cè)任務(wù)中的優(yōu)越性與靈活性。

猜你喜歡
目標(biāo)檢測(cè)應(yīng)用前景評(píng)價(jià)指標(biāo)
視頻中目標(biāo)檢測(cè)算法研究
軟件(2016年4期)2017-01-20 09:38:03
行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
第三方物流企業(yè)績(jī)效評(píng)價(jià)研究綜述
商(2016年33期)2016-11-24 23:50:25
基于UML的高校思想政治教育工作評(píng)價(jià)系統(tǒng)的分析與研究
公共文化服務(wù)體系評(píng)價(jià)指標(biāo)的國(guó)際經(jīng)驗(yàn)與啟示
單片機(jī)在企業(yè)生產(chǎn)中的應(yīng)用前景
LED集魚(yú)燈在遠(yuǎn)洋漁業(yè)的應(yīng)用前景探討
會(huì)計(jì)信息化檔案管理中存在的問(wèn)題及應(yīng)對(duì)
資源型企業(yè)財(cái)務(wù)競(jìng)爭(zhēng)力評(píng)價(jià)研究
移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
清水县| 罗源县| 海安县| 新乐市| 邵阳市| 定州市| 汉川市| 平顺县| 溧阳市| 汾阳市| 珲春市| 汝南县| 景宁| 平顺县| 柳河县| 宿迁市| 密山市| 普陀区| 交城县| 和田县| 高州市| 邵东县| 珲春市| 凤冈县| 临邑县| 安达市| 城口县| 淳安县| 湄潭县| 临城县| 贵德县| 集贤县| 胶州市| 盈江县| 泾川县| 富阳市| 松溪县| 株洲县| 黑龙江省| 嘉定区| 鄂托克旗|