国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于YOLO模型的智能盲人手杖系統(tǒng)

2025-02-23 00:00:00張騰熙齊錦柏恒
物聯(lián)網(wǎng)技術(shù) 2025年4期
關(guān)鍵詞:超聲波測(cè)距計(jì)算機(jī)視覺目標(biāo)檢測(cè)

摘 要:傳統(tǒng)盲人手杖只注重盲人使用過程中的多功能性和舒適性,而忽視了與信息技術(shù)的結(jié)合,為此設(shè)計(jì)了一款基于計(jì)算機(jī)視覺的智能盲人手杖系統(tǒng),旨在解決盲人出行中遇到的實(shí)際問題。系統(tǒng)利用計(jì)算機(jī)視覺進(jìn)行目標(biāo)檢測(cè)和人臉識(shí)別,采用超聲波模塊測(cè)量盲杖前方障礙物的距離,通過耳機(jī)語(yǔ)音實(shí)時(shí)播報(bào),幫助盲人更好地感知周圍環(huán)境。系統(tǒng)由K210主控制器、超聲波模塊、攝像頭模塊、LCD顯示屏和語(yǔ)音提示器等組成,使用YOLO模型對(duì)圖像進(jìn)行處理分析,將識(shí)別結(jié)果顯示在LCD屏幕上,并實(shí)現(xiàn)同步實(shí)時(shí)的語(yǔ)音提示。經(jīng)驗(yàn)證,系統(tǒng)運(yùn)行穩(wěn)定,且具有通用性和適配性,可以嫁接到其他盲人手杖上,并可根據(jù)用戶需求進(jìn)行升級(jí),具有較廣闊的應(yīng)用前景。

關(guān)鍵詞:智能手杖;超聲波測(cè)距;YOLO模型;目標(biāo)檢測(cè);計(jì)算機(jī)視覺;卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2025)04-0-03

0 引 言

目前我國(guó)盲人群體龐大,為方便盲人出行,往往為其配一只導(dǎo)盲犬,但導(dǎo)盲犬培養(yǎng)周期長(zhǎng),服役時(shí)間短,數(shù)量遠(yuǎn)遠(yuǎn)不足且大眾對(duì)導(dǎo)盲犬認(rèn)知較少,導(dǎo)致該方法不能得到普及。盲人出行大多依靠傳統(tǒng)盲人手杖以“盲人探路”的方式前進(jìn),但由于無(wú)法看到物體,在尋找物品時(shí)會(huì)遇到各種各樣的困難[1]。因此選擇為盲人手杖添加信息化智能工具,通過為普通盲杖添加計(jì)算機(jī)視覺功能以輔助盲人的視物能力。

當(dāng)前的盲人手杖制造商僅注重其多功能性,一根手杖包含有喇叭、手電筒以及其他實(shí)用的工具。本文設(shè)計(jì)的盲人手杖不僅能夠幫助盲人出行,更能夠幫助盲人更好地生活。系統(tǒng)通過計(jì)算機(jī)視覺分析、識(shí)別生活中的物品,再將檢測(cè)信息傳回給盲人使用者。而且該輔助設(shè)備可以輕松嫁接到其他種類的盲人手杖上,對(duì)其進(jìn)行信息化升級(jí),從而適配更多盲人的需求。通過深度學(xué)習(xí)錄入常見物體或人臉信息,不僅有助于檢測(cè)當(dāng)前物體,還可以根據(jù)個(gè)人需求來(lái)自定義所檢測(cè)的物體種類和人臉圖譜[2]。最初人們采用人工特征提取的方法進(jìn)行物體檢測(cè),然而這種方法存在較大局限性。隨著卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用,物體檢測(cè)效率和準(zhǔn)確率逐年上升。這一系列的技術(shù)進(jìn)步,使得深度學(xué)習(xí)在物體檢測(cè)領(lǐng)域變得更加專業(yè)和高效。因此,為經(jīng)典盲人手杖添加智能視覺功能變得更容易、更便捷。

1 目標(biāo)檢測(cè)技術(shù)

1.1 卷積神經(jīng)網(wǎng)絡(luò)

本文通過計(jì)算機(jī)卷積神經(jīng)網(wǎng)絡(luò)對(duì)外界圖像進(jìn)行處理分析,對(duì)圖像中的核心要素與數(shù)據(jù)庫(kù)存入的信息進(jìn)行比對(duì),實(shí)現(xiàn)了人臉識(shí)別和物體檢測(cè)功能。

卷積神經(jīng)網(wǎng)絡(luò)作為一種前饋型神經(jīng)網(wǎng)絡(luò),是用機(jī)械化神經(jīng)元構(gòu)成的龐大網(wǎng)絡(luò)。該網(wǎng)絡(luò)直接輸入原始圖像,有效避免了復(fù)雜的圖像前期預(yù)處理流程,提升了對(duì)圖像的分析處理速率[3],因此被應(yīng)用于目標(biāo)識(shí)別、檢測(cè)、分類、分割等領(lǐng)域。

由于在多層神經(jīng)網(wǎng)絡(luò)中需要設(shè)置一個(gè)激活函數(shù),將上一層神經(jīng)元的輸出值經(jīng)過函數(shù)處理后傳遞給下一層,且僅當(dāng)前面樹突傳遞的信號(hào)加權(quán)和值超過特定的閾值時(shí),后面的神經(jīng)元才會(huì)被觸發(fā),從而保證卷積神經(jīng)網(wǎng)絡(luò)可以應(yīng)用到非線性模型中。本系統(tǒng)選用的激活函數(shù)為ReLU函數(shù),數(shù)學(xué)表達(dá)式如下:

(1)

式中:x為上一層神經(jīng)元輸入的卷積核,如果x與特征值強(qiáng)相關(guān),即x>0時(shí)輸出等于輸入,否則為0。在反向傳播算法中,下降梯度等于敏感度乘以前一層的輸出值,所以前一層輸出越大,下降的梯度越大,實(shí)現(xiàn)近似非線性的模型計(jì)算邏輯。

1.2 基于YOLO的目標(biāo)檢測(cè)技術(shù)

物體檢測(cè)時(shí)采用YOLOv2算法,使用Darknet-19作為基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)[4],輸入圖像被劃分為固定大小的網(wǎng)格(grid),每個(gè)網(wǎng)格負(fù)責(zé)預(yù)測(cè)一個(gè)或多個(gè)物體,預(yù)測(cè)的物體數(shù)量由預(yù)設(shè)的參數(shù)決定,通過卷積神經(jīng)網(wǎng)絡(luò)提取特征,以預(yù)測(cè)物體的類別和邊界框的位置[2]。通常使用卷積層輸出的特征圖來(lái)進(jìn)行預(yù)測(cè),通過非極大值抑制篩選和合并重疊的邊界框,以得到最終的物體檢測(cè)結(jié)果。

本系統(tǒng)共包括19層卷積層,5層池化層,3層全連接層,用于預(yù)測(cè)檢測(cè)框的位置和類別。本系統(tǒng)采用YOLOv2算法,與SSD、MobileNet[4-5]相比速度更快,一次前向傳播就可以完成物體檢測(cè)和定位,更適合于實(shí)時(shí)物體檢測(cè)[6]。同時(shí),YOLO算法的檢測(cè)準(zhǔn)確率也能滿足要求,不僅可以檢測(cè)不同尺寸的物體,對(duì)于小物體的檢測(cè)效果相對(duì)更好。然而,由于YOLO算法需將圖像劃分為網(wǎng)格,無(wú)法對(duì)部分物體進(jìn)行精細(xì)定位,因此對(duì)物體邊界的檢測(cè)準(zhǔn)確度可能不如其他算法高[7-9]。

為了提高物體識(shí)別時(shí)檢測(cè)的準(zhǔn)確率,本系統(tǒng)對(duì)同種物體圖片進(jìn)行縮放、裁剪、旋轉(zhuǎn)、模糊化等操作,以擴(kuò)大現(xiàn)有數(shù)據(jù)集,保證物體識(shí)別過程中不會(huì)受攝像頭角度影響導(dǎo)致出現(xiàn)較大的識(shí)別誤差。啟動(dòng)系統(tǒng)后,掃描攝像頭前物體所處坐標(biāo),與數(shù)據(jù)庫(kù)物體特征值比對(duì)得到物體的分類概率,再進(jìn)行閾值過濾將可能性較小的分類去除,最后返回識(shí)別結(jié)果并顯示在LCD屏幕上。

目前數(shù)據(jù)集中能夠檢測(cè)的物體有:自行車、小鳥、瓶子、公交車、狗、電視等十九種常見的生活物品。

2 系統(tǒng)硬件框架

2.1 視覺模塊

智能盲人手杖系統(tǒng)如圖1所示。系統(tǒng)硬件主要由 K210主控制器、超聲波模塊、攝像頭模塊、LCD顯示屏和蜂鳴器組成。

本系統(tǒng)主控芯片選用K210芯片[10],通過超聲波模塊HC-SR04測(cè)距,當(dāng)測(cè)試距離為20 cm時(shí),令蜂鳴器發(fā)出斷斷續(xù)續(xù)的聲音,隨著距離的縮短,聲音的斷續(xù)頻率逐漸增加,用于提示距離的長(zhǎng)短變化。通過攝像頭將圖像信息傳回K210芯片并處理后輸送到LCD顯示屏,LCD顯示相關(guān)內(nèi)容并標(biāo)計(jì)數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)的圖像模型。

本系統(tǒng)使用KPU作為神經(jīng)網(wǎng)絡(luò)處理器,它可以在低功耗模式下實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算,實(shí)時(shí)獲取被檢測(cè)目標(biāo)的大小、坐標(biāo)和種類,完成對(duì)人臉或者物體的高效檢測(cè)與分類。KPU參數(shù)配置如下:采用YOLO框架按照特定限制規(guī)則訓(xùn)練定點(diǎn)化模型,LCD輸入輸出長(zhǎng)寬比設(shè)置為3∶2,選擇ReLU函數(shù)[8]作為激活函數(shù)。

系統(tǒng)將外界的圖像信息顯示到LCD屏上,并對(duì)圖像信息進(jìn)行數(shù)據(jù)比對(duì),如果存在和訓(xùn)練模型匹配的圖像形狀,則在LCD屏幕上輸出所標(biāo)識(shí)的物體信息。

2.2 超聲波測(cè)距模塊

本文采用HC-SR04超聲波模塊進(jìn)行距離測(cè)量,HC-SR04最大測(cè)量距離約為400 cm,接通電源后發(fā)出超聲波信號(hào),保持Echo處于低電平狀態(tài),若在一定時(shí)間內(nèi)接收到信號(hào),則使Echo變?yōu)楦唠娖?,根?jù)距離時(shí)間公式計(jì)算超聲波模塊與前方障礙物之間的距離。

2.3 語(yǔ)音提示模塊

若檢測(cè)到前方有障礙物,則對(duì)有源蜂鳴器模塊的I/O口輸出一個(gè)脈沖即可使蜂鳴器報(bào)警,通過處理器對(duì)計(jì)算的距離進(jìn)行判斷,根據(jù)距離的遠(yuǎn)近來(lái)控制蜂鳴器的蜂鳴頻率。當(dāng)距離大于200 cm時(shí),蜂鳴器被置低電平;當(dāng)距離小于200 cm但大于150 cm時(shí),蜂鳴器每1 s蜂鳴一次;當(dāng)距離小于150 cm但大于100 cm時(shí),蜂鳴器每0.5 s蜂鳴一次;當(dāng)距離小于100 cm時(shí),蜂鳴器每0.2 s蜂鳴一次。

超聲波模塊和蜂鳴器連接電路如圖2所示。

3 系統(tǒng)軟件設(shè)計(jì)

本文的軟件部分采用VsCode編寫,通過CMake程序整合并燒錄,在初始化各模塊的功能后,運(yùn)行檢測(cè)模型,待檢測(cè)完成后在LCD上顯示攝像頭拍攝的內(nèi)容并識(shí)別物體信息。本系統(tǒng)主要流程:外部硬件初始化;物體檢測(cè)初始化;待攝像頭采集完成,將采集的圖像輸入到KPU運(yùn)行模型,KPU處理完成后獲取最終的處理結(jié)果;把結(jié)果代入?yún)^(qū)域?qū)?,?jì)算識(shí)別的位置和結(jié)果,再將上述信息輸出到指定服務(wù)區(qū)進(jìn)行響應(yīng)。系統(tǒng)軟件運(yùn)行流程如圖3所示。

本系統(tǒng)通過對(duì)物體進(jìn)行特征值比對(duì),得到與數(shù)據(jù)集中圖片吻合的概率,當(dāng)概率超出閾值時(shí)輸出該圖片對(duì)應(yīng)的信息。

使用Mx-YOLOv3軟件訓(xùn)練模型[10],該軟件的優(yōu)點(diǎn)是可以迅速對(duì)大量圖像進(jìn)行訓(xùn)練,且配置環(huán)境相對(duì)簡(jiǎn)單,制作效率高。本文對(duì)貓、狗、瓶子、汽車等十九種常見物體進(jìn)行模型訓(xùn)練,為每種物體提供50張照片作為數(shù)據(jù)集,將其中每種一兩張標(biāo)注成xml文件后進(jìn)行YOLOv2-K210訓(xùn)練,得到訓(xùn)練模型。為YOLO模型部署SD卡后,運(yùn)行模型對(duì)符合數(shù)據(jù)集特征的物體進(jìn)行標(biāo)注,完成物體識(shí)別。

針對(duì)超聲波測(cè)距模塊與蜂鳴器部分,初始化其I/O口,輸出Trig信號(hào),定時(shí)器計(jì)時(shí),如果Echo接收到信號(hào)則觸發(fā)一次中斷,并獲取定時(shí)器的計(jì)數(shù)值,再根據(jù)計(jì)數(shù)值推算距離,關(guān)鍵代碼如下所示:

TRIG_Send = 1;//發(fā)送超聲波信號(hào)

delay_us(20);

TRIG_Send = 0;

while(ECHO_Reci == 0);

OpenTimerForHc();//無(wú)信號(hào)傳回時(shí)定時(shí)器保持

while(ECHO_Reci == 1);

CloseTimerForHc();//有信號(hào)傳回時(shí)定時(shí)器關(guān)閉

t = GetEchoTimer();

lengthTemp = ((float)t/58.0);//計(jì)算距離

4 系統(tǒng)測(cè)試

通過雙向夾將智能設(shè)備與普通手杖連接,調(diào)節(jié)旋轉(zhuǎn)頭直至穩(wěn)定,然后通過模擬使用盲杖過程進(jìn)行系統(tǒng)測(cè)試。

連通開關(guān)待LCD屏幕顯示正常后,使用盲杖進(jìn)行移動(dòng)時(shí)的障礙物測(cè)試。經(jīng)測(cè)試,當(dāng)盲杖前方距離小于約180 cm時(shí),蜂鳴器開始緩慢報(bào)警,小于130 cm時(shí)報(bào)警頻率加快,距離障礙物越近,鳴響頻率越高。

當(dāng)攝像頭前方出現(xiàn)符合模型數(shù)據(jù)集中的物體或者圖片時(shí),K210芯片會(huì)將信息進(jìn)行處理分析,輸出最符合其特征的物體信息。加裝語(yǔ)音提示系統(tǒng)后,可以做到掃描盲杖前的物體并通過語(yǔ)音提醒用戶。在本系統(tǒng)測(cè)試過程中以LCD屏幕是否能夠準(zhǔn)確顯示文字信息作為測(cè)試標(biāo)準(zhǔn)。

圖4為本系統(tǒng)智能識(shí)別模塊的部分測(cè)試結(jié)果,經(jīng)測(cè)試可知,本系統(tǒng)對(duì)于單個(gè)物體有著清晰明確的捕獲和反應(yīng),當(dāng)攝像頭前方僅有一個(gè)物體時(shí),系統(tǒng)可以迅速檢測(cè)并在LCD屏幕上顯示特征物體的信息。而在對(duì)多物體識(shí)別時(shí)因受到視角或重疊等因素影響,會(huì)對(duì)本系統(tǒng)多物體的識(shí)別速度和誤差率產(chǎn)生較大影響。

部分多物體測(cè)試結(jié)果如圖5所示。經(jīng)過調(diào)試后,從測(cè)試過程中可以看到,當(dāng)物體數(shù)量超過2個(gè)時(shí),識(shí)別全部物體的可能性明顯下降,但對(duì)于絕大多數(shù)環(huán)境來(lái)說,需要檢測(cè)的物體不會(huì)超過2個(gè),因此并不會(huì)過多影響盲人手杖的實(shí)用性。

5 結(jié) 語(yǔ)

在經(jīng)過一定程度的市場(chǎng)調(diào)研和盲人痛點(diǎn)問詢后,本系統(tǒng)以視障人群的出行困難為出發(fā)點(diǎn)展開設(shè)計(jì),以盲人最常用的生活工具—盲人手杖為載體進(jìn)行信息化升級(jí),加裝微型計(jì)算機(jī),以計(jì)算機(jī)卷積神經(jīng)網(wǎng)絡(luò)的方式獲得訓(xùn)練結(jié)果,輔助盲人出行。本系統(tǒng)植入的數(shù)據(jù)庫(kù)有限,但可以根據(jù)用戶自己的想法添加所需物體信息和人臉信息。從適配性角度看,本系統(tǒng)可以以外設(shè)的方式嫁接到其他盲杖上,攝像頭也可根據(jù)需求進(jìn)行升級(jí)和替換,具有一定的通用性。

注:本文通訊作者為柏恒。

參考文獻(xiàn)

[1]潘虹,黨小娟,陳江萍.基于物聯(lián)網(wǎng)技術(shù)的智能導(dǎo)盲系統(tǒng)設(shè)計(jì)[J].物聯(lián)網(wǎng)技術(shù),2024,14(2):90-92.

[2]馮今瑀,張魁星,張鐵林,等.輔助視障出行融合障礙物檢測(cè)的路徑規(guī)劃研究進(jìn)展[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2024,33(4):50-49.

[3]趙立波.基于改進(jìn)YOLO的車輛及行人識(shí)別算法研究[D].南京:南京郵電大學(xué),2023.

[4]康兆楠.基于YOLOv2的空間場(chǎng)景目標(biāo)檢測(cè)算法研究與實(shí)現(xiàn)[D].北京:北京交通大學(xué),2022.

[5]李云鵬,席志紅.基于RetinaFace與FaceNet的動(dòng)態(tài)人臉識(shí)別系統(tǒng)設(shè)計(jì)[J].電子科技,2024,37(12):79-86.

[6]陳冠宇.基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)方法研究[D].北京:中國(guó)地質(zhì)大學(xué),2020.

[7] ALRUWAILI M, SIDDIQI H M, ATTA N M , et al. Deep learning and ubiquitous systems for disabled people detection using YOLO models [J]. Computers in human behavior, 2024.

[8]張愷翊,張寧燕,江志浩,等.深度學(xué)習(xí)模型中不同激活函數(shù)的性能分析[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(z1):149-156.

[9]蘇佳,秦一暢,賈澤,等.基于ATO-YOLO的小目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2024,60(6):68-77.

[10]陳業(yè)宏.基于YOLOv2目標(biāo)檢測(cè)算法和K210芯片的智能壓板狀態(tài)識(shí)別系統(tǒng)[J].電子制作,2024,32(2):67-71.

猜你喜歡
超聲波測(cè)距計(jì)算機(jī)視覺目標(biāo)檢測(cè)
視頻中目標(biāo)檢測(cè)算法研究
軟件(2016年4期)2017-01-20 09:38:03
行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
機(jī)器視覺技術(shù)發(fā)展及其工業(yè)應(yīng)用
溫度修正的超聲波測(cè)距系統(tǒng)
科學(xué)家(2016年3期)2016-12-30 00:09:18
危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺監(jiān)控識(shí)別報(bào)警系統(tǒng)設(shè)計(jì)
計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用
基于計(jì)算機(jī)視覺的細(xì)小顆粒團(tuán)重量測(cè)量的研究
移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
基于P3電位的目標(biāo)檢測(cè)研究
科技視界(2016年4期)2016-02-22 13:09:19
一種基于超聲波測(cè)距技術(shù)的飲水機(jī)智能訂水裝置的研發(fā)
福泉市| 元阳县| 德州市| 红桥区| 开平市| 镇远县| 新丰县| 深泽县| 鹿邑县| 通辽市| 平武县| 繁昌县| 康乐县| 玛曲县| 望都县| 隆昌县| 新河县| 靖远县| 临夏县| 长寿区| 临湘市| 梅州市| 河南省| 信丰县| 西青区| 天峨县| 河池市| 巢湖市| 清水河县| 六盘水市| 弋阳县| 隆子县| 肥东县| 北宁市| 英德市| 麟游县| 车致| 彰武县| 密山市| 泰兴市| 天台县|