国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聯(lián)邦學(xué)習(xí)的玉米葉片病害識別方法

2024-10-29 00:00:00趙盎然蘭鵬任洪澤吳勇孫豐剛

關(guān)鍵詞:病害識別;聯(lián)邦學(xué)習(xí);異構(gòu)數(shù)據(jù);梯度更新;自監(jiān)督學(xué)習(xí);玉米葉片

玉米作為我國的主要糧食作物,近年來,其葉片病害呈重發(fā)態(tài)勢,嚴重影響作物產(chǎn)量[1]。病害快準識別有助于及時診斷葉片受災(zāi)狀況,開展針對性病害防治,指導(dǎo)后續(xù)種植管理,以降低農(nóng)業(yè)經(jīng)濟損失、促進農(nóng)業(yè)發(fā)展。

當下,以深度學(xué)習(xí)為代表的人工智能算法在病害識別方面取得積極進展。杜甜甜等[2]通過改進RegNet結(jié)合遷移學(xué)習(xí)增強模型特征提取能力,提高對馬鈴薯等農(nóng)作物病害程度識別準確率。孫俊等[3]在MobileNet-V2模型基礎(chǔ)上,嵌入輕量化坐標注意力機制識別玉米等葉片病害,可有效平衡模型復(fù)雜度和識別準確率。王澤鈞等[4]提出融合注意力機制和多尺度特征的輕量化模型LMA-CNNs,兼顧識別準確率和模型參數(shù)量。深度學(xué)習(xí)模型在農(nóng)業(yè)病害識別領(lǐng)域潛力巨大,但性能卻嚴重依賴于大規(guī)模數(shù)據(jù)集。實際應(yīng)用中,病害數(shù)據(jù)通常具有分散性且缺少有效互通,形成“數(shù)據(jù)孤島”?;诒镜財?shù)據(jù)所形成的局部模型難以擬合種類繁多、特征多樣的病害樣本,若對分散數(shù)據(jù)進行集中訓(xùn)練則會急劇增大數(shù)據(jù)傳輸、存儲和處理壓力,甚至造成數(shù)據(jù)泄露。將聯(lián)邦學(xué)習(xí)引入玉米葉片病害識別模型訓(xùn)練過程,利用不同區(qū)域農(nóng)場的病害數(shù)據(jù)執(zhí)行本地模型訓(xùn)練,以模型共享的方式訓(xùn)練全局模型,從而提高玉米葉片病害識別的準確性和泛化能力。另一方面,深度學(xué)習(xí)所需人工參與數(shù)據(jù)標注的屬性更加強化資源共享和數(shù)據(jù)規(guī)模對其發(fā)展的影響。而自監(jiān)督技術(shù)利用數(shù)據(jù)自身信息進行特征學(xué)習(xí)和模型訓(xùn)練,降低標注數(shù)據(jù)需求,輔助解決病害識別問題。Monowar等[5]提出一種自監(jiān)督聚類模型,在多種作物葉片病害分類中取得優(yōu)秀性能。Li等[6]全面介紹了在農(nóng)業(yè)應(yīng)用中以自監(jiān)督學(xué)習(xí)為代表的標簽高效技術(shù)方案,用以解決收集、處理和標記數(shù)據(jù)集昂貴且耗時的問題。

聯(lián)邦學(xué)習(xí)通過本地訓(xùn)練、云端聚合的方式形成全局模型,避免用戶數(shù)據(jù)上傳[7],可有效降低數(shù)據(jù)傳輸帶寬限制和數(shù)據(jù)泄露風險。Zhang等[8]提出一種基于聯(lián)邦隨機森林的玉米產(chǎn)量預(yù)測算法,性能不僅優(yōu)于本地訓(xùn)練模型,且與傳統(tǒng)集中范式隨機森林方法相比,準確性幾乎無損。Kumar等[9]提出一種基于深度隱私編碼的聯(lián)邦學(xué)習(xí)框架以最大限度地降低智慧農(nóng)業(yè)中安全風險和數(shù)據(jù)隱私侵犯。Yu等[10]針對農(nóng)業(yè)物聯(lián)網(wǎng)中邊緣計算設(shè)備能源和通信資源有限的問題,提出能量感知設(shè)備調(diào)度的聯(lián)邦學(xué)習(xí)框架,提升了模型收斂速度、建模精度,降低了通信成本。然而,現(xiàn)有聯(lián)邦學(xué)習(xí)研究多面向處理數(shù)據(jù)分布與資源差異問題[11,12],缺少應(yīng)對數(shù)據(jù)特征差異[13(]分辨率不同、收集環(huán)境差異)與數(shù)據(jù)種類缺失異構(gòu)的方案。

本文提出基于聯(lián)邦學(xué)習(xí)的玉米葉片病害識別方法,針對數(shù)據(jù)種類缺失異構(gòu)利用損失函數(shù)梯度更新策略,達成模型訓(xùn)練過程趨于穩(wěn)定的同時學(xué)習(xí)識別本地缺失病害權(quán)重信息,提升模型泛化準確率。針對數(shù)據(jù)特征差異通過DeepClusterv2[14]算法在服務(wù)器端對初始模型進行數(shù)據(jù)通用低維特征提取的自監(jiān)督預(yù)訓(xùn)練,緩解模型過度擬合本地特征差異數(shù)據(jù),提高模型性能和收斂速度。

1 試驗數(shù)據(jù)

本文所采用的玉米葉片病害數(shù)據(jù)來自于“AIChallenger”農(nóng)作物病害程度數(shù)據(jù)集,詳見表1。根據(jù)病害種類可劃分為5種:灰斑病、銹病、葉斑病、矮花葉病、健康;依據(jù)病害嚴重程度可細化為:灰斑病(一般):G(G)、灰斑?。▏乐兀篏(S)、銹病(一般):R(G)、銹?。▏乐兀篟(S)、葉斑?。ㄒ话悖篠(G)、葉斑病(嚴重):S(S)、矮花葉病:D、健康:H。玉米葉片病害數(shù)據(jù)樣例如圖1所示。

數(shù)據(jù)處理可使模型學(xué)習(xí)同類數(shù)據(jù)的不變互信息(Invariantmutualinformation)[15],但數(shù)據(jù)集規(guī)模較小時,過多處理反而會引入一定噪聲[16,17],丟失原始數(shù)據(jù)部分特征信息。因此,本文采用兩種處理方式:1)歸一化:為避免特征差異數(shù)據(jù)的不同尺度導(dǎo)致優(yōu)化算法不穩(wěn)定,采用數(shù)據(jù)各維度像素特征的均值與方差歸一化;2)中心裁剪:為去除數(shù)據(jù)非相關(guān)信息、減少計算復(fù)雜度,采用與模型輸入維度尺寸匹配的中心裁剪。

2 算法與模型設(shè)計

2.1 模型結(jié)構(gòu)

本文選擇原始ResNet50作為基礎(chǔ)模型[18],其殘差網(wǎng)絡(luò)有效解決深層網(wǎng)絡(luò)中的梯度問題,使其特征表達能力隨著網(wǎng)絡(luò)層數(shù)的增加而提高,簡單易用亦可擴展到其他作物,其主干網(wǎng)絡(luò)為圖2中的Bottleneck層。

自監(jiān)督預(yù)訓(xùn)練階段,以最大化互信息為導(dǎo)向的訓(xùn)練方式使模型Bottleneck層可以取得捕獲數(shù)據(jù)的低維通用表示[19],而聚類層其自發(fā)實現(xiàn)的聚類、偽標簽標注和分類操作實現(xiàn)模型的訓(xùn)練閉環(huán)。因預(yù)訓(xùn)練數(shù)據(jù)無真實標簽標注,在后續(xù)聯(lián)邦訓(xùn)練中只保留Bottleneck層,如圖2(a)所示。聯(lián)邦訓(xùn)練階段模型參數(shù)權(quán)重中Bottleneck層為通用特征提取器,為保留預(yù)訓(xùn)練模型學(xué)習(xí)到的通用特征表示,防止本地數(shù)據(jù)破壞其通用互信息的提取能力,需在聯(lián)邦訓(xùn)練伊始增設(shè)新的全連接層作為分類器以重新構(gòu)建全局模型,使用微調(diào)實現(xiàn)分類層與Bottleneck層前期分步訓(xùn)練,避免Bottleneck層參數(shù)權(quán)重在訓(xùn)練初期過度擬合用戶數(shù)據(jù),丟失其原有特性,如圖2(b)所示。

2.2 基于FedAvg的聯(lián)邦學(xué)習(xí)框架

聯(lián)邦學(xué)習(xí)是一種分布式機器學(xué)習(xí)技術(shù),可在多個擁有本地數(shù)據(jù)的用戶之間進行分布式訓(xùn)練,通過聚合模型參數(shù)構(gòu)建全局模型,因無需上傳本地數(shù)據(jù)可實現(xiàn)數(shù)據(jù)隱私保護和共享計算的平衡。聯(lián)邦學(xué)習(xí)訓(xùn)練過程包含5個步驟:服務(wù)器模型下發(fā)、本地訓(xùn)練、模型上傳、聚合和模型迭代,如圖3所示?;诼?lián)邦學(xué)習(xí)的農(nóng)作物病害識別場景下,通常優(yōu)先選擇使用平均算法FedAvg[7]的聯(lián)邦架構(gòu),其對非極端異構(gòu)設(shè)備和不平衡數(shù)據(jù)等情況有較高的訓(xùn)練穩(wěn)定性,對網(wǎng)絡(luò)帶寬和計算資源需求較低。

基于FedAvg的聯(lián)邦學(xué)習(xí)框架因計算節(jié)點與服務(wù)器中心物理地址不同導(dǎo)致高通信成本,連續(xù)通信輪次之間需執(zhí)行多個梯度優(yōu)化,使其不同于分布式學(xué)習(xí)優(yōu)化,需解決因聯(lián)邦用戶數(shù)據(jù)缺失異構(gòu)及數(shù)據(jù)特征差異帶來的模型優(yōu)化問題。由此,提出針對性解決上述問題的廣義聯(lián)邦平均算法G-FedAvg。

2.3 廣義聯(lián)邦平均算法

2.3.1 聯(lián)邦異構(gòu)限制性更新 聯(lián)邦學(xué)習(xí)具備利用局部信息學(xué)習(xí)全局信息的泛化能力,但本地數(shù)據(jù)類型缺失導(dǎo)致模型參數(shù)權(quán)重偏離全局最優(yōu)點,產(chǎn)生用戶模型漂移,對聯(lián)邦學(xué)習(xí)性能和收斂產(chǎn)生較大影響[20]。

為保證聯(lián)邦學(xué)習(xí)在數(shù)據(jù)缺失異構(gòu)環(huán)境下的模型性能與收斂性,需對模型全局損失函數(shù)梯度更新進行約束。本文在聯(lián)邦學(xué)習(xí)收斂性證明[21]基礎(chǔ)上,對其更新策略和具體實施做出改進,提出公式(1)所示聯(lián)邦限制更新策略,聯(lián)合數(shù)據(jù)類型缺失用戶訓(xùn)練全局泛化模型。改進措施為簡化參數(shù)設(shè)置,降低工程復(fù)雜度,將服務(wù)器與聯(lián)邦用戶雙側(cè)學(xué)習(xí)率優(yōu)化歸約為聯(lián)邦用戶的單側(cè)學(xué)習(xí)率優(yōu)化。實施策略中,模型、數(shù)據(jù)和其他參數(shù)相互影響且具有一定梯度更新冗余,其參數(shù)選擇應(yīng)以實際訓(xùn)練損失為依據(jù)。

其中f為損失函數(shù),f0為初始損失值,f*最優(yōu)損失值,c為常數(shù),η為學(xué)習(xí)率,E為本地迭代次數(shù),T為訓(xùn)練輪數(shù),φ為問題實例參數(shù),L為模型參數(shù)權(quán)重與梯度間的利普西茨常數(shù),λ為冗余系數(shù)。

依據(jù)利普西茨連續(xù)梯度,將聯(lián)邦優(yōu)化問題轉(zhuǎn)化為優(yōu)化其損失值上界,在梯度下降中控制更新步長,逐輪降低損失函數(shù)期望。聯(lián)邦學(xué)習(xí)連續(xù)通信輪次之間的多個局部SGD步驟近似看作傳統(tǒng)分布式學(xué)習(xí)中全局損失的單個優(yōu)化步驟,其每次迭代會對模型權(quán)重進行更新,如公式(1)所示,合理控制其更新步長,使模型在非過擬合學(xué)習(xí)的同時保持收斂性。

2.3.2 聯(lián)邦自監(jiān)督預(yù)訓(xùn)練 自監(jiān)督學(xué)習(xí)[22]是一種無需人工標注標簽的深度學(xué)習(xí)方法,利用數(shù)據(jù)自身信息進行訓(xùn)練,能有效解決監(jiān)督學(xué)習(xí)標注數(shù)據(jù)不足問題。監(jiān)督學(xué)習(xí)針對基于標記數(shù)據(jù)先驗知識的專用信息提取,與其標注限制相比,自監(jiān)督可學(xué)習(xí)數(shù)據(jù)通用特征表示。對一個卷積神經(jīng)網(wǎng)絡(luò)而言,淺層的卷積層、池化層可視為特征提取器,而深層的全連接層,可視為分類器。卷積神經(jīng)網(wǎng)絡(luò)中淺層(靠近輸入)編碼的是可通用的復(fù)用特征,而深層(靠近輸出)編碼的是更專業(yè)的分類特征[23,24]。因為預(yù)訓(xùn)練操作使淺層網(wǎng)絡(luò)獲得提取數(shù)據(jù)通用特征的能力,其后續(xù)的圖像識別、目標檢測等訓(xùn)練任務(wù)水平可以得到有效提升[25,26]。

本文使用一種聚類與深度學(xué)習(xí)結(jié)合的自監(jiān)督預(yù)訓(xùn)練算法DeepCluster-v2。針對DeepCluster[27]離線連續(xù)聚類無相關(guān)性和隨機初始化問題[28]導(dǎo)致訓(xùn)練不穩(wěn)定進行優(yōu)化。其學(xué)習(xí)方式包含數(shù)據(jù)編碼特征聚類和模型參數(shù)反向傳播兩個過程,結(jié)構(gòu)如圖4所示。

(1)特征向量聚類

數(shù)據(jù)經(jīng)模型降維生成特征向量,其聚類結(jié)果用于產(chǎn)生數(shù)據(jù)偽標簽參與模型后續(xù)自監(jiān)督訓(xùn)練。隨機篩選K個特征向量作為原型矩陣,每個特征向量即為聚類中心向量。將特征向量與原型矩陣求內(nèi)積以衡量兩者的相似度,將同一聚類的特征向量取平均作為新的聚類中心向量,如公式(2)所示,其中,zi為特征向量,ck為聚類中心向量,C為聚類原型矩陣,k為特征向量zi與原型矩陣C內(nèi)積的最大分量,用以偽標簽分類索引。

由圖4所示,卷積網(wǎng)絡(luò)模塊為模型的主體部分,分類模塊由3個聚類原型矩陣構(gòu)成,特征向量聚類需進行多次循環(huán)迭代,并將最終聚類結(jié)果作為分類依據(jù)。

(2)模型參數(shù)更新

將聚類偽標簽作為數(shù)據(jù)標注參與常規(guī)模型訓(xùn)練。相較于傳統(tǒng)監(jiān)督學(xué)習(xí)訓(xùn)練過程中的標簽,自監(jiān)督深度聚類的偽標簽完全在訓(xùn)練中生成,其損失函數(shù)如公式(3)所示。

其中q為特征向量經(jīng)聚類后形成的數(shù)據(jù)偽標簽,模型依據(jù)偽標簽標注學(xué)習(xí)不同類別數(shù)據(jù)間的特征信息權(quán)重。改進后的DeepCluster-v2的多聚類頭屬性使模型的低維通用信息盡可能由淺層網(wǎng)絡(luò)習(xí)得,更加強化其互信息提取能力。

2.3.3 算法流程 本文廣義聯(lián)邦平均算法的實現(xiàn)分為服務(wù)器端和用戶端兩部分,本文按照算法流程順序給出如下執(zhí)行過程:(1)服務(wù)器端執(zhí)行自監(jiān)督預(yù)訓(xùn)練完成模型參數(shù)初始化,選擇參與聯(lián)邦學(xué)習(xí)的用戶并下發(fā)模型。

(2)用戶端接收服務(wù)器下發(fā)的全局模型,判斷是否為初次迭代,并行參與本地模型微調(diào)或常規(guī)訓(xùn)練。

(3)聯(lián)邦用戶本地模型完成指定訓(xùn)練輪數(shù),上傳至服務(wù)器。

(4)服務(wù)器端接收各用戶本地模型,根據(jù)聯(lián)邦用戶的本地數(shù)據(jù)量加權(quán)聚合模型參數(shù),聚合模型作為新的全局模型下發(fā)至各用戶。

(5)順序執(zhí)行上述4個算法流程,循環(huán)迭代算法流程(2)—(4)直至模型收斂,其具體實現(xiàn)細節(jié)見表2。

3 試驗與結(jié)果分析

3.1 試驗環(huán)境與參數(shù)

本文試驗的GPU為NVIDIAGeForceRTX4060Ti16G,采用深度學(xué)習(xí)框架Pytorch1.13.1,Python版本為3.8.0,使用深度神經(jīng)網(wǎng)絡(luò)加速庫CUDA11.6.0,cuDNN8.9.0。試驗內(nèi)容主要包含兩個部分,病害種類識別和病害嚴重程度識別,后者是在前者基礎(chǔ)上的進一步試驗,用以分辨農(nóng)作物的病害嚴重程度。

試驗中設(shè)置10個虛擬用戶用以模擬參與訓(xùn)練的農(nóng)場,并將數(shù)據(jù)集隨機劃分作為聯(lián)邦用戶的本地私有數(shù)據(jù),每次迭代訓(xùn)練批次大小為64。初始階段使用ImageNet自監(jiān)督預(yù)訓(xùn)練權(quán)重作為模型基礎(chǔ)參數(shù),聯(lián)邦用戶接收全局模型并進行微調(diào)[29]。因Adam優(yōu)化器損失函數(shù)的極小值選擇理論[30],致使微調(diào)訓(xùn)練階段與測試階段識別準確率不匹配,故模型優(yōu)化采用隨機梯度下降SGD最小化損失函數(shù),優(yōu)化器動量Momentum參數(shù)設(shè)置為0.9。

3.2 試驗結(jié)果

(1)與集中學(xué)習(xí)對比試驗

本部分將所提聯(lián)邦學(xué)習(xí)與集中學(xué)習(xí)進行對比試驗,以驗證聯(lián)邦學(xué)習(xí)本地訓(xùn)練、模型共享的優(yōu)勢。對比集中學(xué)習(xí)模型為:CDCNNv2[31]和PD2SE-Net50[32],兩者均是基于ResNet50的改進模型。

表3為本文算法G-FedAvg與集中學(xué)習(xí)模型在病害種類識別和病害程度識別準確率的對比試驗結(jié)果。此外,考慮到集中學(xué)習(xí)需要將用戶數(shù)據(jù)上傳至中心服務(wù)器,但由于隱私、數(shù)據(jù)資產(chǎn)保護要求及通信資源限制,集中學(xué)習(xí)訓(xùn)練方式難以實現(xiàn)。對比試驗也考慮了僅利用單一用戶本地數(shù)據(jù)完成聯(lián)邦學(xué)習(xí)基礎(chǔ)ResNet50模型訓(xùn)練的情況,對應(yīng)表3中“單一本地用戶”的情況。試驗是對集中學(xué)習(xí)與聯(lián)邦學(xué)習(xí)過程的簡化仿真,真實應(yīng)用場景中集中學(xué)習(xí)的數(shù)據(jù)上傳與聯(lián)邦學(xué)習(xí)的模型傳輸難以模擬,無法有效比較各學(xué)習(xí)方法的效率,因此后續(xù)試驗結(jié)果沒有訓(xùn)練時長對比。

在病害識別準確率方面,所提算法GFedAvg較集中學(xué)習(xí)模型CDCNNv2和PD2SENet50分別提升0.68%和0.22%,較單一本地用戶模型ResNet50提升10.2%;在病害程度識別準確率方面,所提算法G-FedAvg較集中學(xué)習(xí)模型CDCNNv2和PD2SE-Net50分別提升2.72%和1.59%,較單一本地用戶模型ResNet50提升14.29%。數(shù)據(jù)特征差異使模型在訓(xùn)練過程逐漸偏離最優(yōu)解,但G-FedAvg打破潛在特征學(xué)習(xí)定式,掌握整體數(shù)據(jù)特征分布,其全局聚合優(yōu)化隱式地進行優(yōu)化方向糾偏,使本地模型聚合后產(chǎn)生優(yōu)化方向的修正[33],使模型朝著最優(yōu)解方向發(fā)展。表明現(xiàn)階段深度學(xué)習(xí)數(shù)據(jù)驅(qū)動的重要性,反映出聯(lián)邦學(xué)習(xí)模型能夠有效融合各方本地數(shù)據(jù)信息。

(2)與傳統(tǒng)聯(lián)邦學(xué)習(xí)對比試驗

本部分試驗?zāi)康氖球炞C本文算法G-FedAvg在數(shù)據(jù)獨立同分布設(shè)置下對比傳統(tǒng)聯(lián)邦學(xué)習(xí)是否存在性能提升,其中,獨立同分布即數(shù)據(jù)集隨機均勻劃分給各聯(lián)邦用戶。圖5為本文算法GFedAvg與傳統(tǒng)聯(lián)邦學(xué)習(xí)模型Vanilla-FedAvg[7,33]關(guān)于病害種類識別與病害嚴重程度識別準確率對比結(jié)果。

現(xiàn)實數(shù)據(jù)的特征差異使得聯(lián)邦學(xué)習(xí)無法如同理論分析的平穩(wěn)、健壯[34],本文提出G-FedAvg模型框架,從訓(xùn)練源頭避免因全局模型的隨機初始狀態(tài)使得用戶模型快速擬合本地數(shù)據(jù)致使全局聚合模型性能下降與收斂速度變慢。由圖5所示,G-FedAvg全局聚合模型初始階段的識別準確率遠高于Vanilla-FedAvg,表現(xiàn)出良好的用戶模型漂移抑制效果,有效避免因全局聚合對用戶模型訓(xùn)練方向頻繁修正所造成的識別準確率波動,加速全局模型優(yōu)化進程。

結(jié)果表明本文算法G-FedAvg利用自監(jiān)督預(yù)訓(xùn)練緩解用戶模型過度擬合特征差異數(shù)據(jù)造成的優(yōu)化方向偏差,彌合本地模型與全局模型權(quán)重差異,有效提升識別準確度與收斂速度的同時顯著降低準確率波動。

(3)數(shù)據(jù)種類缺失異構(gòu)環(huán)境下聯(lián)邦學(xué)習(xí)試驗

本部分試驗?zāi)康臑?,?lián)邦用戶在數(shù)據(jù)種類缺失環(huán)境下,進行聯(lián)邦學(xué)習(xí)模型聚合訓(xùn)練,識別全種類測試集,驗證其泛化準確率。試驗設(shè)置如下,每個用戶隨機缺失三類病害種類與四類病害嚴重程度數(shù)據(jù),且用戶數(shù)據(jù)彼此不存在交集,數(shù)據(jù)分布具體明細見表4。因監(jiān)督學(xué)習(xí)的局限性,不參與聯(lián)邦學(xué)習(xí)的本地用戶進行病害識別僅限于用戶所擁有的部分類別數(shù)據(jù),本地模型無法識別劃分未經(jīng)訓(xùn)練數(shù)據(jù)類別。

圖6-7分別為數(shù)據(jù)種類缺失異構(gòu)環(huán)境下病害及其程度識別的泛化準確率對比試驗,具體結(jié)果如表5所示,所提算法G-FedAvg的病害及其程度識別的泛化準確率較單一本地用戶模型ResNet50分別提升55.78%和41.15%,表明聯(lián)邦學(xué)習(xí)切實提升了全局模型的泛化能力,有效解決數(shù)據(jù)種類缺失異構(gòu)環(huán)境下模型訓(xùn)練的難點。

為進一步驗證所提方案的泛化能力,將損失函數(shù)梯度更新策略和初始模型自監(jiān)督預(yù)訓(xùn)練應(yīng)用至FedProx[35],形成G-FedProx,并將原方案與本文方案進行對比,F(xiàn)edProx為聯(lián)邦異構(gòu)環(huán)境常用算法,表5給出各方案泛化識別準確率對比結(jié)果。本文所提方案G-FedAvg的病害及其程度識別的泛化準確率在數(shù)據(jù)種類缺失異構(gòu)場景下較Vanilla-FedAvg分別提升33.56%和10.66%,改進后的G-FedProx的病害及其程度識別的泛化準確率較原方案分別提升22.91%-30.84%和7.71%-11.79%,由表5可知,G-FedAvg相較FedProx的泛化識別準確率提升同樣明顯。由圖6a、圖7a訓(xùn)練損失值對比反映出G-FedAvg作為一種底層基礎(chǔ)架構(gòu)有效緩解模型關(guān)于本地特征差異數(shù)據(jù)的過擬合問題,而由圖6b、圖7b識別準確率的提高則充分反映出其對模型性能的優(yōu)化。

4 結(jié)論

本文將聯(lián)邦學(xué)習(xí)理論框架應(yīng)用至農(nóng)作物病害識別場景中,在保證參訓(xùn)用戶數(shù)據(jù)資產(chǎn)安全和數(shù)據(jù)隱私的前提下通過共享模型參數(shù)實現(xiàn)病害識別模型訓(xùn)練,得出如下結(jié)論:

(1)基于聯(lián)邦學(xué)習(xí)玉米葉片病害識別方法的性能對比集中范式,病害識別準確率領(lǐng)先0.22%-0.68%,病害程度識別準確率領(lǐng)先1.59%-2.72%。聯(lián)邦學(xué)習(xí)參訓(xùn)用戶本地私有數(shù)據(jù)無需上傳,減輕數(shù)據(jù)傳輸、存儲和處理壓力,避免了數(shù)據(jù)泄露風險,其用戶規(guī)模和數(shù)據(jù)來源得以極大擴充,使得基于聯(lián)邦學(xué)習(xí)的玉米葉片病害識別方法在未來更具優(yōu)勢。

(2)限制性損失函數(shù)梯度更新策略和自監(jiān)督預(yù)訓(xùn)練使病害數(shù)據(jù)種類缺失異構(gòu)的用戶在穩(wěn)定訓(xùn)練的前提下快速學(xué)習(xí)到全種類的病害泛化信息,緩解本地模型擬合特征差異數(shù)據(jù)所造成的性能下降,并使其在初始階段便可捕獲數(shù)據(jù)的通用低維表示信息。在數(shù)據(jù)缺失異構(gòu)場景下,病害識別準確率提升33.56%,病害程度識別準確率提升10.66%,收斂速度有效提升,準確率波動顯著降低。

本文提出基于G-FedAvg算法的聯(lián)邦學(xué)習(xí)玉米葉片病害識別方法,對玉米葉片的病害及其嚴重程度進行識別,使模型從準確率、收斂速度、訓(xùn)練平穩(wěn)度、泛化準確率等方面均得到提升,順應(yīng)當前數(shù)據(jù)驅(qū)動的基于深度學(xué)習(xí)的農(nóng)作物病害識別技術(shù)發(fā)展趨勢。

黔西| 满城县| 广汉市| 小金县| 镇赉县| 独山县| 泰和县| 新昌县| 聊城市| 阳高县| 台州市| 将乐县| 荆门市| 雅安市| 南乐县| 濮阳市| 青州市| 宜良县| 洪江市| 苗栗县| 河池市| 上栗县| 宁蒗| 潍坊市| 康乐县| 黄冈市| 安新县| 凌云县| 砀山县| 孟村| 大城县| 芦山县| 镇原县| 红桥区| 凌海市| 金寨县| 兖州市| 汤阴县| 乐陵市| 东乌珠穆沁旗| 五河县|