国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)的AlexNet的無人駕駛研究

2024-06-17 00:00:00張銳戈張瑞張安陳
消費(fèi)電子 2024年5期
關(guān)鍵詞:池化無人駕駛攝像頭

【關(guān)鍵詞】無人駕駛;AlexNet 算法;空間金字塔池化(SPP);全局平均池化(GAP); 圖像識別

引言

在過去十年中,深度學(xué)習(xí)技術(shù)的迅猛發(fā)展已經(jīng)在多個(gè)領(lǐng)域展現(xiàn)出其革命性的影響力。特別是在無人駕駛汽車的領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)技術(shù)已成為關(guān)鍵的推動力。這種技術(shù)的應(yīng)用不僅極大地提高了自動駕駛汽車的安全性和可靠性,也提供了一個(gè)探索人工智能與日常生活融合的獨(dú)特視角。深度神經(jīng)網(wǎng)絡(luò)在此過程中起到了不可替代的作用,它通過模擬人類大腦處理信息的方式,使得無人駕駛汽車能夠?qū)崟r(shí)、準(zhǔn)確地識別路況和作出反應(yīng)。

然而,這種技術(shù)的高速發(fā)展也帶來了新的挑戰(zhàn),特別是在確保其可靠性和安全性方面[1]。本文將深入探討深度神經(jīng)網(wǎng)絡(luò)在無人駕駛汽車領(lǐng)域的應(yīng)用,尤其重點(diǎn)關(guān)注如何通過改進(jìn)傳統(tǒng)的AlexNet模型以提高其性能。本文將集中討論通過空間金字塔池化(SPP)和全局平均池化(GAP)對AlexNet進(jìn)行優(yōu)化的方法,以及如何使用攝像頭數(shù)據(jù)驗(yàn)證這些改進(jìn)措施的有效性。

一、研究方法

(一)實(shí)驗(yàn)設(shè)計(jì)

本研究采用了一種集成多攝像頭系統(tǒng)的無人駕駛車輛模型。在本研究中,無人駕駛車輛使用了四個(gè)高清攝像頭,分別定位于車輛的前、后、左、右四個(gè)方向,以實(shí)現(xiàn)360度的全方位視野。每個(gè)攝像頭均采用了先進(jìn)的CMOS傳感器,在低光照條件下也能夠提供高分辨率的圖像。此外,車輛上還安裝了IMU(慣性測量單元)和GPS系統(tǒng),以輔助定位和運(yùn)動狀態(tài)的檢測,整體實(shí)驗(yàn)步驟如圖1所示。

圖1 整體實(shí)驗(yàn)步驟

車輛的運(yùn)動行為控制如圖2所示,實(shí)驗(yàn)車輛使用樹莓派3b作為處理器,stm32f103單片機(jī)作為車輛運(yùn)動的主控。實(shí)驗(yàn)識別成功的標(biāo)準(zhǔn)是車輛在識別到三種道路特征后,執(zhí)行對應(yīng)的操作,如直行、轉(zhuǎn)彎或停止。

圖2 車輛行為控制流程

(二)數(shù)據(jù)收集

本研究以直車道、彎車道、人行道等三種道路的基本元素為對象,數(shù)據(jù)通過Python爬蟲算法爬取Google圖片里的相關(guān)關(guān)鍵字,每一類選取500張,共1500張構(gòu)成數(shù)據(jù)集。按總量的80%、10%、10%的比例劃分出1200張訓(xùn)練集、150張測試集、150張驗(yàn)證集,如圖3所示。

圖3 三類識別對象

(三)預(yù)處理

(a)去噪:使用高斯濾波器減少圖像中的隨機(jī)噪聲。

數(shù)學(xué)表達(dá)式為:

式中:σ 是標(biāo)準(zhǔn)差,控制濾波器的寬度。

(b)對比度調(diào)整:采用直方圖均衡化增強(qiáng)圖像的對比度。這一步驟通過重新分配圖像的亮度,使得分布更加均勻。

(c)將所有圖像調(diào)整到統(tǒng)一的分辨率,以確保后續(xù)處理的一致性。

(四)算法設(shè)計(jì)及模型訓(xùn)練

本研究采用了AlexNet算法用于場景分類。在第三部分,將主要介紹嵌入了空間金字塔池化、全局平均池化的AlexNet-SG算法。筆者首先將預(yù)處理的圖像數(shù)據(jù)輸入到CNN模型。模型通過多個(gè)卷積層、池化層和全連接層自動提取和學(xué)習(xí)圖像中的特征。每個(gè)卷積層會應(yīng)用不同的卷積核,以檢測圖像中的不同特征,如邊緣、角點(diǎn)等[2]。經(jīng)過一系列層的處理后,最終的全連接層將提取到的特征用于物體識別和分類。

(五)實(shí)驗(yàn)驗(yàn)證

采用基于樹莓派作為主控的無人駕駛車輛模型,將上一部分訓(xùn)練的模型導(dǎo)入主控。實(shí)驗(yàn)?zāi)M真實(shí)情境,車輛在運(yùn)動情況下識別三種道路的圖片,并反饋準(zhǔn)確率,錯誤率等參數(shù),實(shí)驗(yàn)驗(yàn)證和評估改進(jìn)的AlexNet-SG算法在提高無人駕駛車輛在復(fù)雜城市環(huán)境中導(dǎo)航能力方面的有效性。

二、圖像處理算法及優(yōu)化

(一)AlexNet算法

AlexNet是一種開創(chuàng)性的卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu),對推動深度學(xué)習(xí)領(lǐng)域的發(fā)展起到了重要作用,在2012年的ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中取得了顯著的表現(xiàn),證明了它在圖像分類任務(wù)中的有效性。AlexNet由8個(gè)權(quán)重層組成,包括5個(gè)卷積層和3個(gè)全連接層[3],以及在第一,第二和第五個(gè)卷積層之后的三個(gè)最大池化層,如圖4[4]所示。

在AlexNet網(wǎng)絡(luò)架構(gòu)中,代替?zhèn)鹘y(tǒng)的Sigmoid激活函數(shù),選用了ReLU函數(shù)。這種替換旨在解決梯度消失的問題,并提升了網(wǎng)絡(luò)學(xué)習(xí)的速率。在此之后,通過LRN(局部響應(yīng)歸一化),在ReLU激活函數(shù)后,為局部神經(jīng)元創(chuàng)造了一種競爭環(huán)境。這個(gè)過程有效地抑制了活性較低的神經(jīng)元,從而增強(qiáng)了模型的泛化能力[5]。Hinton于2012年在其AlexNet模型中展示了這一點(diǎn),并提供了相應(yīng)的計(jì)算公式[6]:

式中:a為卷積層后的輸出結(jié)果,N 是通道數(shù),n為相鄰的卷積核,k是偏差,α和β是自定義的值。

(二)空間金字塔池化

空間金字塔池化(SPP)是一種在深度學(xué)習(xí)中用于處理不同尺寸輸入圖像的技術(shù)。SPP模型的功能是它可以將不同尺度的特征進(jìn)行融合,這樣能夠?qū)⑷我獯笮〉奶卣鲌D(feature map)轉(zhuǎn)換成固定大小的特征向量,并輸入到全連接層。這種方法通過在卷積層后應(yīng)用一系列固定大小的池化操作,將不同尺寸的圖像轉(zhuǎn)換為統(tǒng)一維度的特征表示[7]。這樣,網(wǎng)絡(luò)就能夠處理任意尺度的圖像,同時(shí)避免了圖像變形或信息損失,從而提高了模型的識別精度和泛化能力,增強(qiáng)了圖像分類和目標(biāo)檢測的性能。

如圖5[8]所示,卷積層的特征圖輸出之后會輸入到SPP模塊,能輸出總計(jì)(16+4+1)×256個(gè)特征,其中16+4+1代表空間單元的數(shù)量,256代表卷積核的數(shù)量。通過這種方式,可以獲得多尺度的特征向量。

圖5 通過SPP得到不同尺寸特征圖的大小相同的特征向

(三)全局平均池化

將全連接層(FC層)替換為全局平均池化層,這樣做可以減少過擬合效應(yīng),同時(shí)不影響最終圖像特征的表現(xiàn)。全局平均池化作為一種計(jì)算方法,其核心原理在于將卷積層產(chǎn)生的每個(gè)特征圖上的響應(yīng)平均化,以此生成代表性的特征值。這一過程有效減少了全連接層的參數(shù)數(shù)量,從而降低模型復(fù)雜度和過擬合的風(fēng)險(xiǎn)[9]。在應(yīng)用中,GAP作為網(wǎng)絡(luò)結(jié)構(gòu)的一部分,有助于提升模型對圖像識別任務(wù)的泛化能力,因?yàn)樗鼜?qiáng)迫網(wǎng)絡(luò)關(guān)注于整個(gè)圖像,而不是圖像的局部特征。

假設(shè)最后一個(gè)卷積層輸出的4個(gè)4*4的特征圖,使用GAP如圖6(a)所示,先求每個(gè)特征圖均值,再輸入softmax有更好的效果。而使用傳統(tǒng)的FC,如圖6(b)所示,有參數(shù)過多、可能過擬合的問題[10]。

圖6 對比使用GAP和傳統(tǒng)FC層的輸出效果

(四)整體結(jié)構(gòu)

算法采用經(jīng)過優(yōu)化的AlexNet-SG,將SPP,GAP嵌入經(jīng)典的AlexNet網(wǎng)絡(luò),如圖7所示。

圖7 改進(jìn)的AlexNet的整體結(jié)構(gòu)

在最后一個(gè)卷積層后先應(yīng)用SPP,然后在接下來的全連接層之前應(yīng)用GAP。通過這種結(jié)合,SPP提供了多尺度的空間特征,而GAP則減少了模型參數(shù)并提高了泛化能力。這種組合可以有效提高AlexNet-SG在各種尺寸圖像上的性能,同時(shí)保持模型的簡潔性和效率??傮w上,通過將SPP和GAP技術(shù)集成,可以在不犧牲模型準(zhǔn)確性的情況下提高其靈活性和效率。

三、實(shí)驗(yàn)結(jié)果

(一)網(wǎng)絡(luò)模型對比

首先采用筆者收集的數(shù)據(jù)集中的訓(xùn)練集和測試集對不同優(yōu)化的AlexNet模型進(jìn)行測試,測試的內(nèi)容包括對比訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率,結(jié)果如表1所示。

表1 對比不同網(wǎng)絡(luò)模型的訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率

改進(jìn)的AlexNet-SG本質(zhì)上是一個(gè)比LeNet更深更大的網(wǎng)絡(luò)結(jié)構(gòu)。這一點(diǎn)讓網(wǎng)絡(luò)能夠捕獲更復(fù)雜和細(xì)微的特征,從而提高識別準(zhǔn)確率。改進(jìn)的AlexNet-SG將LeNet的Sigmoid激活函數(shù)替換為ReLU激活函數(shù)。ReLU函數(shù)解決了梯度消失問題,加快了網(wǎng)絡(luò)的收斂速度,同時(shí)保持了稀疏激活的特性,提高了模型的泛化能力[11]。在模型壓縮和加速方面,改進(jìn)的AlexNet-SG通過各種技術(shù)對模型進(jìn)行優(yōu)化,提高了模型在移動端和嵌入式設(shè)備上的部署效率。這包括對CNN網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行有效的模型壓縮與加速,使之適應(yīng)于資源受限的環(huán)境[12]。

(二)攝像頭實(shí)地測試結(jié)果

使用數(shù)據(jù)集之外的圖片,直車道、彎車道、人行道各500張,小車在運(yùn)動情況下,由遠(yuǎn)及近識別A4大小的三種圖片。

測試的內(nèi)容包括識別每類圖片的正確率,識別距離。正確率為500張圖片中攝像頭識別正確的數(shù)量與總數(shù)的比值,識別距離為500次識別中攝像頭識別到對象并返回結(jié)果的平均距離。測試結(jié)果如表2所示。

表2 對比不同場景的攝像頭實(shí)地測試結(jié)果

結(jié)論與展望

在本研究中,筆者成功地實(shí)現(xiàn)了對AlexNet的改進(jìn),通過引入空間金字塔池化(SPP)和全局平均池化(GAP),顯著提高了網(wǎng)絡(luò)在無人駕駛應(yīng)用中的表現(xiàn)。這些改進(jìn)不僅增強(qiáng)了網(wǎng)絡(luò)處理不同尺寸圖像的能力,還提高了其在復(fù)雜交通環(huán)境下的準(zhǔn)確性和效率。通過對AlexNet的改進(jìn),筆者證明了深度學(xué)習(xí)模型在處理動態(tài)和不確定環(huán)境下的有效性。實(shí)驗(yàn)數(shù)據(jù)表明,在不同的場景下,AlexNet-SG與原始AlexNet模型相比均有明顯的性能提升。在目標(biāo)檢測和環(huán)境識別等關(guān)鍵任務(wù)中,AlexNet-SG的準(zhǔn)確率普遍高于原始模型。優(yōu)化后的模型在多車道、交叉路口等復(fù)雜場景中展現(xiàn)出了更高的準(zhǔn)確率。這一結(jié)果表明,深度學(xué)習(xí)技術(shù)在自動駕駛等領(lǐng)域具有巨大的應(yīng)用潛力[13]。未來工作可以聚焦于進(jìn)一步優(yōu)化網(wǎng)絡(luò)架構(gòu),提高模型的泛化能力和在更加復(fù)雜環(huán)境中的穩(wěn)定性[14]。筆者發(fā)現(xiàn)人行道的識別度較低是因?yàn)樗惴y以分割圖片上的人行道和車道,導(dǎo)致識別錯誤,之后還需要研究更為準(zhǔn)確的圖像分割算法[15]。本研究的成果可以應(yīng)用于多個(gè)領(lǐng)域,如無人航空器的導(dǎo)航系統(tǒng)和智能監(jiān)控系統(tǒng),從而推動深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用。

猜你喜歡
池化無人駕駛攝像頭
基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識別方法研究
無線電工程(2024年8期)2024-09-16 00:00:00
基于Sobel算子的池化算法設(shè)計(jì)
浙江首試公路非現(xiàn)場執(zhí)法新型攝像頭
我們村的無人駕駛公交
卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
攝像頭連接器可提供360°視角圖像
無人駕駛車輛
科學(xué)(2020年3期)2020-11-26 08:18:28
無人駕駛公園
基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
奔馳360°攝像頭系統(tǒng)介紹
滦南县| 东阿县| 阿鲁科尔沁旗| 昌邑市| 丰都县| 陇西县| 本溪| 洪雅县| 永新县| 山西省| 德兴市| 绥宁县| 凤山市| 长乐市| 泸西县| 枣强县| 平遥县| 江阴市| 新乡市| 寿宁县| 当涂县| 绥棱县| 景谷| 望谟县| 溧阳市| 长治市| 商洛市| 昌邑市| 军事| 迁西县| 洪湖市| 彰武县| 禄丰县| 饶河县| 汉寿县| 共和县| 胶州市| 西畴县| 手游| 城市| 礼泉县|