国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡的果蔬識別與定位軟件的設計與實現(xiàn)

2024-11-05 00:00:00何偉
現(xiàn)代信息科技 2024年16期

摘 要:在智慧農(nóng)業(yè)領域,精確識別果蔬種類及定位對提高農(nóng)業(yè)生產(chǎn)效率至關重要?;诰矸e神經(jīng)網(wǎng)絡探索CNN圖像識別原理及關鍵技術,構建一個從數(shù)據(jù)采集、預處理到智能識別的果蔬圖像的高質量識別模型,設計并實現(xiàn)了基于卷積神經(jīng)網(wǎng)絡的果蔬識別與定位軟件,該軟件能高效地從復雜的果蔬外觀特征中提取有效信息,智能精準識別果蔬類型及位置信息,能顯著提升農(nóng)業(yè)自動化和智能化水平,為提升農(nóng)作物管理效率和優(yōu)化生產(chǎn)流程提供高效的工具,對推動智慧農(nóng)業(yè)的發(fā)展提供有力技術支撐。

關鍵詞:卷積神經(jīng)網(wǎng)絡;軟件開發(fā);果蔬圖像識別;智慧農(nóng)業(yè)

中圖分類號:TP391.41 文獻標識碼:A 文章編號:2096-4706(2024)16-0098-05

Design and Implementation of Fruit and Vegetable Recognition and Localization Software Based on Convolutional Neural Networks

Abstract: In the field of smart agriculture, accurately iNGAuBV49rX3pU5/qUZXljgG4bZe4fGFIU79427y18BI=dentifying the types and locations of fruits and vegetables is crucial for improving agricultural production efficiency. This paper explores the principles and key technologies of image recognition based on Convolutional Neural Networks (CNN), and constructs a high-quality recognition model for fruit and vegetable images that encompasses data collection, preprocessing, and intelligent recognition. A software based on Convolutional Neural Networks for the recognition and location of fruits and vegetables is designed and implemented. This software can efficiently extract useful information from complex appearances of fruits and vegetables, intelligently and accurately identify their types and location information, significantly enhancing the level of agricultural automation and intelligence. It provides a powerful tool for improving crop management efficiency and optimizing production processes, offering strong technical support for the advancement of smart agriculture.

Keywords: Convolutional Neural Networks; software development; fruit and vegetable image recognition; smart agriculture

0 引 言

隨著全球人口的持續(xù)增長,農(nóng)業(yè)生產(chǎn)面臨著前所未有的挑戰(zhàn)。為了滿足日益增長的食物需求,提高農(nóng)業(yè)生產(chǎn)效率和產(chǎn)品質量變得至關重要。在此背景下,智慧農(nóng)業(yè)作為一種利用現(xiàn)代信息技術來優(yōu)化農(nóng)業(yè)生產(chǎn)的新興模式,逐漸得到了廣泛的關注和應用[1]。其中,果蔬類農(nóng)產(chǎn)品的精準識別是智慧農(nóng)業(yè)中一個重要且基礎的環(huán)節(jié),它對于農(nóng)產(chǎn)品的分類、質量檢測和產(chǎn)量估算等方面具有顯著的影響。

傳統(tǒng)的機器學習方法已在果蔬圖像識別領域取得了一定的進展,但在處理大規(guī)模、高維度和復雜的圖像數(shù)據(jù)時,往往會遇到一些困難和挑戰(zhàn)。特別是在圖像特征提取和分類準確度方面,傳統(tǒng)方法往往無法滿足日益嚴格的應用需求。相較而言,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)作為一種深度學習的核心技術,憑借其卓越的自動特征提取能力和高準確率,在圖像識別領域中表現(xiàn)出了強大的應用潛力[2]。

近年來,卷積神經(jīng)網(wǎng)絡已成功應用于多個領域,包括計算機視覺、自然語言處理和醫(yī)學圖像分析等。特別是在圖像識別方面,卷積神經(jīng)網(wǎng)絡已經(jīng)成為當前的主流技術[3]?;诰矸e神經(jīng)網(wǎng)絡的圖像識別技術,不僅能夠大幅的提高識別準確度,還能處理大規(guī)模的圖像數(shù)據(jù),為實時和在線的應用提供了可能。

因此,本文探討卷積神經(jīng)網(wǎng)絡在果蔬圖像識別領域的應用,以及其對智慧農(nóng)業(yè)的推動作用。通過設計和實現(xiàn)一個基于卷積神經(jīng)網(wǎng)絡的果蔬識別與定位軟件,以期為果蔬的精準識別和智慧農(nóng)業(yè)的發(fā)展提供有力的技術支持。

1 系統(tǒng)總體架構

系統(tǒng)采用Django+Vue前后端分離技術,分為數(shù)據(jù)層,服務層及用戶層三層[4],系統(tǒng)架構圖如圖1所示。用戶層分為手機端APP和PC端的Web頁面兩個組成部分,APP端基于Vue+MinitUI,Web端采用Vue+ElementUI開發(fā)框架實現(xiàn)。服務層采用Django框架實現(xiàn),具體包括智能識別服務、用戶服務、數(shù)據(jù)分析服務等,Django開發(fā)框架是高水準的Python編程語言驅動的一個開源模型,起源于開源社區(qū)。使用該架構,可以方便、快捷地創(chuàng)建高品質、易維護、數(shù)據(jù)庫驅動的應用程序。數(shù)據(jù)層基于MySQL數(shù)據(jù)庫,實現(xiàn)對于采集數(shù)據(jù)、分析數(shù)據(jù)、用戶數(shù)據(jù)等內容的存儲。

果蔬識別與定位軟件功能結構圖如圖2所示。用戶可以分別從Web端和手機端進行識別定位應用。手機APP具有拍照上傳或從手機相冊中選擇圖片的功能,圖片上傳到Web服務器,Web服務器對上傳數(shù)據(jù)進行分析,調用智能識別模型識別圖像,返回圖像識別結果(類型、數(shù)量及定位坐標),APP獲取返回數(shù)據(jù)后將識別結果繪制在圖片上,所有查詢數(shù)據(jù)保存到數(shù)據(jù)庫中供統(tǒng)計分析使用[5]。Web端實現(xiàn)功能包括:果蔬圖片批量上傳識別定位,用戶數(shù)據(jù)表的統(tǒng)計查詢及按日期進行搜索。管理員賬號登錄后臺管理界面可以實現(xiàn)對普通用戶信息及識別數(shù)據(jù)進行增、刪、改、查等管理工作。

2 基于卷積神經(jīng)網(wǎng)絡的智能識別模塊

卷積神經(jīng)網(wǎng)絡(CNN)是一種深度學習的核心架構,適用于圖像識別和處理任務?;窘Y構包括卷積層、激活層、池化層和全連接層,這些層次通過特定的方式組合,形成了能夠自動提取圖像特征并進行分類的神經(jīng)網(wǎng)絡[6]。

卷積層是CNN的核心組成部分,通過卷積運算處理輸入數(shù)據(jù),提取圖像中的局部特征。每個卷積核在圖像上滑動時,會提取圖像的不同特征,如邊緣、角點等。多個卷積核可以提取多維度的特征,為后續(xù)的圖像識別提供豐富的特征信息。激活層通常緊隨卷積層,目的是引入非線性因素,使得網(wǎng)絡能夠學習到更復雜的特征。ReLU(Rectified Linear Unit)是最常用的激活函數(shù),它可以增加模型的非線性表達能力,同時保持計算的高效。池化層用于減小數(shù)據(jù)的空間維度,同時保持圖像的主要特征。常用的池化操作有最大池化和平均池化。池化層能夠減少網(wǎng)絡參數(shù),降低過擬合的風險,同時保持對圖像特征的良好表達。全連接層通常位于網(wǎng)絡的最后幾層,它將前面的所有特征連接在一起,并輸出到分類器,如Softmax分類器,以得到最終的分類結果。

卷積神經(jīng)網(wǎng)絡因其出色的自動特征提取能力和高分類準確率,已成為圖像識別領域的主流技術。通過端到端的訓練,CNN可以自動學習到圖像的多層次和多尺度特征,大大降低了傳統(tǒng)機器學習方法中手工設計特征的復雜度。同時,卷積神經(jīng)網(wǎng)絡還能處理大量的圖像數(shù)據(jù),適應不同的圖像識別任務,為圖像識別提供了一種強大而通用的解決方案[7]。

為了實現(xiàn)果蔬圖像的智能識別,本文設計了一個基于卷積神經(jīng)網(wǎng)絡(CNN)的智能識別模塊,如圖3所示。該模塊主要包含四個部分:數(shù)據(jù)預處理、卷積神經(jīng)網(wǎng)絡模型、訓練與優(yōu)化和識別與評估。

數(shù)據(jù)預處理模塊負責對采集到的原始圖像數(shù)據(jù)進行預處理,包括圖像增強、數(shù)據(jù)增強、歸一化處理、尺寸調整等,以得到適合于模型訓練的高質量圖像數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡模型模塊包括了卷積神經(jīng)網(wǎng)絡的設計與構建,通過設計一個多層卷積神經(jīng)網(wǎng)絡,包括卷積層、激活層、池化層、全連接層和SoftmaxO4kQrx9iNKdSL7Ra7cf2eg==輸出層,以實現(xiàn)果蔬圖像的特征提取和分類[8]。訓練與優(yōu)化模塊負責對卷積神經(jīng)網(wǎng)絡模型進行訓練和優(yōu)化。使用交叉熵損失函數(shù),并選擇Adam優(yōu)化算法來最小化損失函數(shù)。同時,利用驗證集對模型的性能進行評估,通過調整模型的參數(shù)和結構來優(yōu)化模型的性能[9]。識別與評估模塊負責對訓練好的模型進行果蔬圖像識別,并通過測試集對模型的識別性能進行評估,計算模型的準確率、召回率和F1值等指標,全面評估模型的性能。

2.1 數(shù)據(jù)采集與預處理

在果蔬圖像識別研究中,圖像的采集和預處理是至關重要的步驟,為后續(xù)的模型訓練和驗證提供必要的數(shù)據(jù)支持。

構建一個具有代表性和多樣性的果蔬圖像數(shù)據(jù)集是實現(xiàn)準確識別的前提。一個好的數(shù)據(jù)集應包括多種類型和類別的果蔬,同時應包含不同光照、角度和背景條件下的圖像,以增加模型的泛化能力。數(shù)據(jù)集構建的主要步驟包括:

1)圖像采集。采集圖像是構建數(shù)據(jù)集的第一步,應盡可能地收集不同種類、成熟度和顏色的果蔬圖像。圖像的來源可以多樣化,包括公開的果蔬圖像數(shù)據(jù)集、網(wǎng)絡爬蟲抓取的圖像以及實地拍攝的圖像等。

2)標簽分配。為每個圖像分配正確的標簽是至關重要的,這需要專業(yè)知識以確保標簽的準確性。標簽應明確表示果蔬圖像中的種類和狀態(tài),如“桔子”“綠番茄”“紅番茄”等。

3)數(shù)據(jù)分割。將收集到的數(shù)據(jù)集分割為訓練集、驗證集和測試集是常見的做法,比例設置為80%、10%和10%。這樣可以確保模型在不同的數(shù)據(jù)子集上都能得到有效地訓練和驗證。

圖像預處理旨在改善圖像質量,減少噪聲和不相關的信息,使圖像數(shù)據(jù)更適合于卷積神經(jīng)網(wǎng)絡的訓練和識別。主要的圖像預處理方法包括[10]:

1)圖像增強。圖像增強技術可以提高圖像的清晰度,強化圖像的邊緣和紋理信息,從而提高圖像的識別準確率。

對比拉伸處理公式如式(1)所示:

其中,r、s分別為原圖像和增強圖像的灰度值,rmin和rmax為圖像的最小和最大灰度值,a為放大系數(shù)。

2)數(shù)據(jù)增強。通過對原始圖像進行一系列的幾何和光度變換(如旋轉、翻轉、縮放、裁剪、亮度和對比度調整等),可以增加訓練數(shù)據(jù)的多樣性,提高模型的泛化能力和魯棒性。

3)歸一化處理。歸一化處理是將圖像的像素值范圍縮放到0,1或-1,1,有助于保持數(shù)據(jù)的數(shù)值穩(wěn)定性,加速網(wǎng)絡的收斂。歸一化處理的處理公式如式(2)所示:

4)尺寸調整。所有的圖像都需要調整到統(tǒng)一的尺寸以適應卷積神經(jīng)網(wǎng)絡的輸入要求,調整尺寸如224×224或299×299像素。

2.2 CNN模型設計與訓練

本文設計并訓練了一個CNN模型來實現(xiàn)果蔬圖像的智能識別模塊,CNN模型由卷積層、激活層、池化層和全連接層組成,模型結構如圖4所示。

卷積層:卷積層用于提取圖像的局部特征,通過應用卷積核(或過濾器)來實現(xiàn)。卷積操作的數(shù)學表達式如式(3)所示:

其中,(x,y)為輸出特征圖的位置,(m,n)遍歷卷積核g的所有元素,f(m,n)和g(x-m,y-n)分別為輸入圖像和卷積核在相應位置的元素值。

激活層:激活層用于增加模型的非線性。在模型中選擇使用ReLU(Rectified Linear Unit)激活函數(shù)。

池化層:池化層用于降低特征圖的空間維度,同時保持圖像的重要特征。最常用的池化操作是最大池化,數(shù)學表達式如式(4)所示:

全連接層:全連接層用于將卷積和池化得到的特征圖轉換為一維特征向量,并通過Softmax函數(shù)進行果蔬類別的概率分布輸出。Softmax函數(shù)的數(shù)學表達式如式(5)所示:

其中,K為果蔬類別的數(shù)量,z為全連接層的輸出。

損失函數(shù):本文選擇交叉熵損失函數(shù)作為優(yōu)化目標,可以衡量模型預測概率分布與真實概率分布之間的差異。交叉熵損失函數(shù)的數(shù)學表達式如式(6)所示:

其中,k為果蔬類別的總和,yi為真實分布,如果樣本屬于第i類,則yi=1,否則為0。pi為模型預測樣本屬于第i類的概率。

模型評估:在每個訓練周期結束時,本文使用驗證集評估模型的性能,監(jiān)控準確率、損失值等指標,以確保模型正在正確地學習。

3 系統(tǒng)實現(xiàn)

3.1 智能識別實驗設置

對果蔬圖像智能識別實驗的具體設置,包括數(shù)據(jù)集的構建、圖像預處理、模型參數(shù)選擇、訓練設置以及評估指標和硬件、軟件環(huán)境配置。

1)數(shù)據(jù)集。為了保證實驗的真實性和有效性,本文收集了一個包含6種不同果蔬的大規(guī)模圖像數(shù)據(jù)集。每種果蔬類別包含1 000張圖像,總共6 000張圖像。首先需要手動清洗數(shù)據(jù)集,以確保每張圖像的質量和標簽的準確性,然后將數(shù)據(jù)集隨機劃分為訓練集(80%)、驗證集(10%)和測試集(10%),以確保模型的泛化能力。

2)圖像預處理。所有圖像都經(jīng)過了一系列的預處理步驟,以提高模型的識別準確率。這些步驟包括圖像裁剪、縮放到統(tǒng)一尺寸(224×224像素)、歸一化(像素值范圍0到1),以及數(shù)據(jù)增強(包括隨機旋轉、翻轉和亮度調整等)。

3)模型參數(shù)。在模型訓練過程中,本文設置了初始學習率為0.01,并采用了學習率衰減策略,每經(jīng)過10個周期,學習率減小10%。為了在保證模型性能的同時,加速模型的訓練,選擇每批大小為32,以確保模型的穩(wěn)定收斂。在優(yōu)化算法上,選擇Adam優(yōu)化算法,由于其自適應學習率調整的特性,能夠加速模型的收斂。

4)訓練設置。模型在訓練集上訓練了50個周期,每個周期結束后,使用驗證集評估模型的性能。為了避免過擬合,本文應用了早停技術,并在驗證集上的準確率不再提升時停止訓練,同時保存了在驗證集上表現(xiàn)最好的模型,以便后續(xù)的測試和分析。

5)評估指標和硬件軟件環(huán)境。本文選擇了準確率、召回率和F1值作為模型性能的評估指標。這些指標能全面反映模型的識別性能,并為后續(xù)的模型優(yōu)化提供參考。

3.2 Web頁面

果蔬識別與定位軟件中用戶登錄后可以在Web頁面中選擇本地數(shù)據(jù)文件,將文件上傳到遠端服務器。點擊信息提交,服務器端對圖像信息進行智能識別,返回識別結果,并將結果記錄到數(shù)據(jù)庫中。

前端收到識別結果后將識別類型和位置定位到圖片上顯示給用戶,效果圖如圖5所示。

點擊“我的工作臺”—“數(shù)據(jù)查詢”菜單,可以查看用戶個人的所有查詢記錄,列出每張圖片的識別類別和數(shù)量。數(shù)據(jù)查詢功能還可以按照開始時間和結束時間進行選擇性檢索。

系統(tǒng)用戶分為普通用戶和管理員,普通用戶可使用識別功能并查詢個人數(shù)據(jù),管理員賬號可以對所有的用戶信息及系統(tǒng)數(shù)據(jù)進行管理。

3.3 APP功能

用戶注冊好后,跳轉到登錄界面,輸入用戶名和密碼進入果蔬定位界面。

該界面可實現(xiàn)拍照和從相冊中選擇圖片兩個功能,用戶獲得圖片后,點擊上傳,將文件上傳到遠端服務器。服務器端對圖像信息進行智能識別,然后返回識別結果,再將結果記錄到數(shù)據(jù)庫中。前端收到識別結果后,將識別類型和位置定位到圖片上顯示給用戶,所有查詢數(shù)據(jù)統(tǒng)計信息可點擊數(shù)據(jù)查詢菜單查看,部分APP效果圖如圖6所示。

4 結 論

隨著科技的進步,智慧農(nóng)業(yè)成為中國農(nóng)業(yè)產(chǎn)業(yè)升級的關鍵方向,特別是在提升農(nóng)產(chǎn)品品質和減少資源浪費方面展現(xiàn)出巨大潛力。本文通過采用機器學習技術,展現(xiàn)了如何利用智能化手段優(yōu)化果實的生長監(jiān)控和管理。通過分析果蔬采集照片中農(nóng)產(chǎn)品的外觀特征,如顏色、大小和形狀。項目還深入探討了數(shù)據(jù)處理與分析、平臺設計與開發(fā)等方面,通過設計用戶友好的界面,將果蔬識別技術和數(shù)據(jù)分析結果整合到一個平臺中,項目不僅服務于農(nóng)業(yè)管理者,也便于消費者獲取信息。這種技術的應用代表了農(nóng)業(yè)技術創(chuàng)新的方向,有助于推動農(nóng)業(yè)產(chǎn)業(yè)向更高效、可持續(xù)的未來發(fā)展。

參考文獻:

[1] 徐巖,劉林,李中遠,等.基于卷積神經(jīng)網(wǎng)絡的玉米品種識別 [J].江蘇農(nóng)業(yè)學報,2020,36(1):18-23.

[2] 張文韜,張婷.基于遷移學習的卷積神經(jīng)網(wǎng)絡圖像識別方法研究 [J].現(xiàn)代信息科技,2023,7(14):57-60.

[3] 苗宇杰,祝詩平,普京,等.基于卷積神經(jīng)網(wǎng)絡的家具木材圖像種類識別 [J].林業(yè)科學,2023,59(8):133-140.

[4] 高志輝,秦琦,段暕,等.基于實時Web技術的車間監(jiān)測系統(tǒng)設計與實現(xiàn) [J].計算機應用,2023,43(S1):201-206.

[5] 段中興,李偉哲,張亞俐,等.基于圖像識別的果蔬自助結算系統(tǒng) [J].計算機測量與控制,2021,29(12):195-203.

[6] 段毛毛,翟睿.基于融合卷積神經(jīng)網(wǎng)絡的花卉識別方法 [J].計算機與數(shù)字工程,2024,52(2):567-571.

[7] 劉忠意,魏登峰,李萌,等.基于改進YOLO v5的橙子果實識別方法 [J].江蘇農(nóng)業(yè)科學,2023,51(19):173-181.

[8] 朱駿宇.基于卷積神經(jīng)網(wǎng)絡的圖像識別的技術分析 [J].長江信息通信,2023,36(8):66-68.

[9] 王卓,王健,王梟雄,等.基于改進YOLO v4的自然環(huán)境蘋果輕量級檢測方法 [J].農(nóng)業(yè)機械學報,2022,53(8):294-302.

[10] 蘇俊楷,段先華,葉趙兵.改進YOLOv5算法的玉米病害檢測研究 [J].計算機科學與探索,2023,17(4):933-941.

鸡东县| 壤塘县| 沿河| 八宿县| 合江县| 二手房| 汤阴县| 收藏| 北宁市| 海口市| 塔城市| 东阿县| 工布江达县| 博湖县| 衢州市| 中方县| 乳源| 沙雅县| 班玛县| 赞皇县| 右玉县| 庄河市| 神木县| 姚安县| 犍为县| 仁寿县| 盐源县| 博兴县| 连山| 宁南县| 溧水县| 巫山县| 鄂托克前旗| 金塔县| 东海县| 东明县| 水城县| 余庆县| 大埔区| 怀安县| 静海县|