楊志和 魯凌云
(1.北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 北京市 100044 2.北京交通大學(xué)軟件學(xué)院 北京市 100044)
隨著科學(xué)技術(shù)發(fā)展,車輛配備越來越多的智能化設(shè)備,以滿足人們對駕駛和娛樂需求。因此車輛計(jì)算資源的需求越來越大??紤]到能源有限、成本問題,車輛無法承載大量的計(jì)算設(shè)備。因此當(dāng)面對視頻流采集分析,并實(shí)時(shí)路徑規(guī)劃這樣計(jì)算密集,對時(shí)延敏感的任務(wù)時(shí),無法獨(dú)立完成。車輛需要將部分任務(wù)卸載到具有更多空閑計(jì)算資源的設(shè)備上。一種選擇是云計(jì)算中心,但是由于它距離車輛較遠(yuǎn),傳輸任務(wù)過程中帶來了不可忽略的時(shí)延,不適用于對時(shí)延敏感的任務(wù)。移動(dòng)邊緣計(jì)算(Mobile Edge Computing,MEC)可以提供這種低時(shí)延的卸載服務(wù)。車輛可以將空閑的資源共享,與路邊單元(road side unit,RSU)共同提供任務(wù)卸載服務(wù)。為了將這些資源合理的分配,有必要設(shè)計(jì)一個(gè)有效的方案,利用V2V(Vehicle to Vehicle)、V2I(Vehicle to Infrastructure)將車路進(jìn)行協(xié)同,提升資源利用率和任務(wù)卸載的高效性。
在V2X(Vehicle to Everything)應(yīng)用中有27個(gè)用例,其中就包括車輛編隊(duì)。車輛編隊(duì)是自動(dòng)駕駛領(lǐng)域發(fā)展中關(guān)鍵一步,也被認(rèn)為是第五代移動(dòng)通訊技術(shù)中最具代表性的用例之一。在編隊(duì)中使用虛擬鏈連接相鄰車輛,并通過實(shí)時(shí)更新移動(dòng)數(shù)據(jù)控制車輛,比如速度,相對距離。車輛編隊(duì)中同樣面臨處理如自動(dòng)駕駛,3D導(dǎo)航等計(jì)算密集型時(shí)延敏感任務(wù)的問題。本文關(guān)注于車輛編隊(duì)的任務(wù)卸載激勵(lì)機(jī)制,以優(yōu)化計(jì)算資源的利用,提升任務(wù)卸載效率。
現(xiàn)有一些研究車輛編隊(duì)任務(wù)卸載的工作。Hu Y等人將車輛任務(wù)卸載優(yōu)化建模為最小化平均能耗的問題,并采用李雅普諾夫優(yōu)化確定任務(wù)卸載到車隊(duì)成員、MEC服務(wù)器還是本地。Du H等人針對車輛配備大量的傳感設(shè)備,及其產(chǎn)生的傳感任務(wù)提出一種新的車輛編隊(duì)協(xié)同感知體系架構(gòu),并采用最大-最小公平算法以及迭代算法進(jìn)行求解。Xiao T等人以最小化系統(tǒng)整體能量消耗和時(shí)延為目標(biāo),將搶占式調(diào)度策略與排隊(duì)論相結(jié)合,建立了具有兩個(gè)搶占式優(yōu)先級規(guī)則的任務(wù)卸載排隊(duì)模型。Ma X等人考慮到車輛的移動(dòng)性,采取重分配的任務(wù)卸載策略,并根據(jù)斯塔克伯格博弈理論利用強(qiáng)化學(xué)習(xí)理論求解。Yang C等人針對高速車輛提出了一種基于契約的激勵(lì)機(jī)制,促使車輛形成編隊(duì),由此進(jìn)行任務(wù)卸載和資源分配。以上工作僅僅考慮了邊緣計(jì)算服務(wù)器和車輛編隊(duì)成員作為任務(wù)卸載服務(wù)節(jié)點(diǎn)。
Shi J等人在車輛網(wǎng)中考慮一種動(dòng)態(tài)定價(jià)的方案對提供任務(wù)卸載服務(wù)的車輛進(jìn)行獎(jiǎng)勵(lì),文中僅僅考慮了根據(jù)計(jì)算資源的分配量進(jìn)行定價(jià)的方案。Y Yue等人,依據(jù)拍賣理論采取雙向拍賣的方法進(jìn)行任務(wù)卸載,但是存在多次競拍的情況,無法滿足低時(shí)延的要求。
本文提出將車輛編隊(duì)可通訊范圍內(nèi)的車輛也作為任務(wù)卸載服務(wù)節(jié)點(diǎn)的任務(wù)卸載策略,并考慮到車輛的移動(dòng)性。同時(shí),為了激勵(lì)車輛能提供空閑的計(jì)算資源,提出了綜合車輛能源,通訊資源,計(jì)算資源的動(dòng)態(tài)定價(jià)激勵(lì)策略,車輛根據(jù)定價(jià)貢獻(xiàn)相應(yīng)的資源。將問題建模為一個(gè)序列決策問題,采用強(qiáng)化學(xué)習(xí)的方法以優(yōu)化車輛的最大效用。
圖1:系統(tǒng)架構(gòu)
當(dāng)車輛編隊(duì)成員有任務(wù)要卸載時(shí),由編隊(duì)領(lǐng)隊(duì)節(jié)點(diǎn)收集相關(guān)信息,包括任務(wù)信息,車輛通信資源信息,以及計(jì)算資源信息。編隊(duì)領(lǐng)隊(duì)向RSU發(fā)送任務(wù)卸載請求,RSU進(jìn)行卸載決策,并確定預(yù)計(jì)支付服務(wù)節(jié)點(diǎn)相應(yīng)的酬金,任務(wù)節(jié)點(diǎn)進(jìn)行相應(yīng)的任務(wù)卸載,服務(wù)節(jié)點(diǎn)執(zhí)行完成并返回結(jié)果后任務(wù)節(jié)點(diǎn)根據(jù)任務(wù)完成情況確定最終定價(jià)并給付酬金,完成任務(wù)卸載。
當(dāng)任務(wù)節(jié)點(diǎn)進(jìn)行任務(wù)卸載時(shí),某一個(gè)服務(wù)節(jié)點(diǎn)的總體時(shí)延可以分為三個(gè)部分,包括任務(wù)節(jié)點(diǎn)到服務(wù)節(jié)點(diǎn)的傳輸時(shí)延,服務(wù)節(jié)點(diǎn)的計(jì)算時(shí)延,服務(wù)節(jié)點(diǎn)將結(jié)果傳輸?shù)饺蝿?wù)節(jié)點(diǎn)的傳輸時(shí)延。即
設(shè)α為輸出結(jié)果與任務(wù)數(shù)據(jù)量的比例,一般情況下α<<1,因此在計(jì)算時(shí)時(shí)延可以忽略不計(jì)。
對于每個(gè)服務(wù)節(jié)點(diǎn),計(jì)算任務(wù)所需的時(shí)延如下:
其中,f為服務(wù)節(jié)點(diǎn)為卸載的任務(wù)可分配的計(jì)算資源。傳輸任務(wù)所需時(shí)延如下:
其中r為數(shù)據(jù)傳輸速率,可表示為:
其中,tr(i,j)為車輛編隊(duì)外節(jié)點(diǎn)與任務(wù)節(jié)點(diǎn)的鏈路失效時(shí)間,tf(j)為車輛編隊(duì)外節(jié)點(diǎn)與車隊(duì)的可通訊時(shí)間。如圖2所示,根據(jù)車輛位置與速度評估出鏈路失效時(shí)間(Link Expiration Time ,LET)。
圖2:鏈路失效時(shí)間計(jì)算圖
其中,(x,y)、(x,y)為兩輛車的位置,θ、θ為兩輛車的行駛方向,v、v為兩輛車的行駛速度,r為車輛的可通訊半徑。由式(7-10)可得輛車相對位置(d,d)以及相對速度(v,v),由此可得:
通過化簡可得:
由此可得:
當(dāng)車隊(duì)內(nèi)外車輛行使方向一致時(shí),可得:
對于一個(gè)任務(wù)而言,其完成時(shí)間可表示為:
任務(wù)能耗分為兩個(gè)部分,即任務(wù)的傳輸能耗與計(jì)算能耗,表示為:
計(jì)算能耗為:
傳輸功耗為:
由于車輛在提供卸載服務(wù)時(shí)需要消耗一定的資源,并且計(jì)算結(jié)果對自己并無利用價(jià)值,需要相應(yīng)的激勵(lì)機(jī)制來鼓勵(lì)貢獻(xiàn)出空閑資源。本文依據(jù)合同理論設(shè)計(jì)相應(yīng)的方法,任務(wù)節(jié)點(diǎn)根據(jù)資源質(zhì)量以及完成情況向提供卸載服務(wù)的節(jié)點(diǎn)提供相應(yīng)的報(bào)酬。
根據(jù)合同理論,機(jī)制應(yīng)當(dāng)滿足兩個(gè)基本約束。
激勵(lì)相容約束:服務(wù)節(jié)點(diǎn)更喜歡提供自己真實(shí)的能力信息,而不愿意提供虛假信息來騙取報(bào)酬。由于涉及到報(bào)酬問題,每個(gè)車輛都愿意盡力獲取更高的收益,激勵(lì)機(jī)制應(yīng)當(dāng)避免車輛提供虛假信息而獲得更高的收益。
個(gè)體理性約束:服務(wù)節(jié)點(diǎn)相對于閑置資源,更愿意將空閑資源提供出來,供其他車輛使用。為了激勵(lì)車輛更愿意提供出空閑資源,激勵(lì)機(jī)制應(yīng)當(dāng)考慮車輛提供出資源能夠獲得更高的報(bào)酬,促使形成積極環(huán)境。
為了量化節(jié)點(diǎn)的收益與支出本文定義了任務(wù)節(jié)點(diǎn)和服務(wù)節(jié)點(diǎn)的效用函數(shù)。任務(wù)節(jié)點(diǎn)通過任務(wù)完成時(shí)間的描述來表達(dá)對任務(wù)完成情況的滿意程度,其表示為:
同時(shí),任務(wù)節(jié)點(diǎn)需要根據(jù)提供的資源情況向服務(wù)節(jié)點(diǎn)支付相應(yīng)報(bào)酬,包括計(jì)算資源以及能量資源。由于計(jì)算資源屬于稀缺資源,需要對其單價(jià)根據(jù)供應(yīng)量進(jìn)行相應(yīng)調(diào)整,設(shè)計(jì)算資源的基礎(chǔ)單價(jià)為常量x,任務(wù)節(jié)點(diǎn)i根據(jù)提供的計(jì)算資源數(shù)量向服務(wù)節(jié)點(diǎn)j支付的單價(jià)為γ'。此外,根據(jù)每個(gè)節(jié)點(diǎn)的情況,對支付單價(jià)動(dòng)態(tài)調(diào)整,包括信道狀態(tài),能源情況,剩余計(jì)算資源情況,最終確定的單價(jià)為:
其中,E為節(jié)點(diǎn)剩余的能量,f為節(jié)點(diǎn)空閑的計(jì)算資源。任務(wù)節(jié)點(diǎn)需向服務(wù)節(jié)點(diǎn)支付的計(jì)算資源報(bào)酬為:
除計(jì)算資源外,服務(wù)節(jié)點(diǎn)提供卸載服務(wù)需要消耗一定的能量,因此任務(wù)節(jié)點(diǎn)也需要為此提供相應(yīng)的酬勞,設(shè)基本的用電單價(jià)為常量e。任務(wù)節(jié)點(diǎn)根據(jù)服務(wù)節(jié)點(diǎn)的剩余電量對單價(jià)進(jìn)行動(dòng)態(tài)調(diào)整,為:
由此,任務(wù)節(jié)點(diǎn)向服務(wù)節(jié)點(diǎn)支付的能源報(bào)酬為:
任務(wù)節(jié)點(diǎn)的綜合效用函數(shù)為:
服務(wù)節(jié)點(diǎn)根據(jù)邊際效用遞減原則,其根據(jù)任務(wù)節(jié)點(diǎn)的定價(jià)γ'來確定其貢獻(xiàn)的計(jì)算資源為:
服務(wù)節(jié)點(diǎn)的綜合效用函數(shù)為:
為約束服務(wù)節(jié)點(diǎn)能夠提供實(shí)際的資源狀況,需對服務(wù)節(jié)點(diǎn)執(zhí)行卸載服務(wù)的效果進(jìn)行評估,并對未達(dá)到承諾的節(jié)點(diǎn)進(jìn)行相應(yīng)的處罰,處罰函數(shù)定如下:
其中t'為實(shí)際任務(wù)執(zhí)行所需時(shí)間,k,z為懲罰系數(shù)滿足:
當(dāng)進(jìn)行任務(wù)卸載決策時(shí),系統(tǒng)的目標(biāo)是最大化任務(wù)節(jié)點(diǎn)的效用函數(shù),以達(dá)到最優(yōu)效果。目標(biāo)問題描述如下:
其中,約束C1保證任務(wù)傳出過程中不會(huì)因兩個(gè)節(jié)點(diǎn)超出可通訊時(shí)間而中斷,C2保證任務(wù)整個(gè)卸載過程能在車輛與車隊(duì)可通訊時(shí)間內(nèi)完成,C3、C4保證任務(wù)能夠被完全分配,C5、C6保證服務(wù)節(jié)點(diǎn)分配出的計(jì)算資源不超過其空閑資源。
在提出的算法中,路邊單元作為智能體用于任務(wù)卸載決策。當(dāng)車輛之間進(jìn)入可通訊范圍時(shí)假設(shè)可以自動(dòng)及時(shí)建立拓?fù)溥B接。因此,車隊(duì)領(lǐng)隊(duì)節(jié)點(diǎn)可以實(shí)時(shí)掌握車隊(duì)通訊范圍內(nèi)車輛的狀態(tài)以及整個(gè)拓?fù)鋱D,其中狀態(tài)包括位置,速度,可利用的計(jì)算資源,能量狀況等。當(dāng)領(lǐng)隊(duì)車輛獲取它們的狀態(tài)后,上傳至路邊單元,由路邊單元評估其信道狀態(tài),并計(jì)算該拓?fù)淇沙掷m(xù)的時(shí)間,以此進(jìn)行卸載決策?;镜沫h(huán)境模型如下。
4.1.1 系統(tǒng)狀態(tài)
假設(shè)任務(wù)節(jié)點(diǎn)能夠?qū)⑿遁d任務(wù)分配到各個(gè)服務(wù)節(jié)點(diǎn)。除此之外,在任務(wù)卸載期間,每個(gè)服務(wù)節(jié)點(diǎn)的其他任務(wù)對計(jì)算資源的需求不會(huì)增加,使得每個(gè)服務(wù)節(jié)點(diǎn)的相關(guān)狀態(tài)不變。當(dāng)任務(wù)節(jié)點(diǎn)采取行動(dòng),將一定比例的任務(wù)卸載到服務(wù)節(jié)點(diǎn)時(shí),服務(wù)節(jié)點(diǎn)的計(jì)算資源情況也隨之改變。同時(shí)SNR和車輛之間的鏈路過期時(shí)間也由于車輛的移動(dòng)發(fā)生改變,因此當(dāng)前狀態(tài)轉(zhuǎn)移到下一個(gè)狀態(tài)。
4.1.2 動(dòng)作
p為任務(wù)節(jié)點(diǎn)i分配給節(jié)點(diǎn)j的比例p∈[0,1],假設(shè)任務(wù)是可以進(jìn)行劃分的,γ為對應(yīng)預(yù)支付的計(jì)算資源單價(jià)。
4.1.3 獎(jiǎng)勵(lì)
依據(jù)優(yōu)化目標(biāo)(30),設(shè)定相應(yīng)的獎(jiǎng)勵(lì)函數(shù),目的是降低任務(wù)的時(shí)延同時(shí)考慮能耗,在當(dāng)前狀態(tài)s(t)下,執(zhí)行a(t)決策所獲得的獎(jiǎng)勵(lì)為:
該獎(jiǎng)勵(lì)函數(shù)的設(shè)立目的是降低任務(wù)時(shí)延,降低任務(wù)總功耗,g(x)為設(shè)置的懲罰函數(shù),對節(jié)點(diǎn)傳輸時(shí)間超出鏈路失效時(shí)間,節(jié)點(diǎn)總時(shí)間超出與車隊(duì)通訊的時(shí)間的情況進(jìn)行懲罰。
由于動(dòng)態(tài)的車輛環(huán)境,隨時(shí)變化的通訊鏈路,節(jié)點(diǎn)的可利用資源是很難預(yù)測的,因此,很難給出精確的狀態(tài)轉(zhuǎn)移概率。而Model-free的強(qiáng)化學(xué)習(xí),可以解決這樣的問題。
為了解決這個(gè)問題,本文采用Model-free的A3C方法。目的是在一個(gè)時(shí)期內(nèi)最小化任務(wù)節(jié)點(diǎn)的任務(wù)時(shí)延,能耗等,因此需要獲取最優(yōu)策略來最大化任務(wù)節(jié)點(diǎn)的累計(jì)回報(bào)期望。
策略π(a|s;θ),其參數(shù)為θ,根據(jù)目前環(huán)境狀態(tài)s,選擇合適的動(dòng)作a,獲取到獎(jiǎng)勵(lì)r,環(huán)境狀態(tài)變?yōu)閟,直至任務(wù)完成,最終的獎(jiǎng)勵(lì)和為R。由此形成一個(gè)由狀態(tài),動(dòng)作組成的序列τ有:
該序列具馬爾科夫性,則其發(fā)生的概率為:
序列τ所獲得的獎(jiǎng)勵(lì)和為R(τ),而在策略π的情況下,其期望為:
之后定義狀態(tài)價(jià)值函數(shù),即從狀態(tài)s開始遵循策略π的預(yù)期回報(bào):
通過神經(jīng)網(wǎng)絡(luò)對其擬合估計(jì)值為V(s;θ),其中θ為網(wǎng)絡(luò)參數(shù)。定義優(yōu)勢函數(shù)為:
其中γ為折扣因子γ∈[0,1]。目的是在某一個(gè)狀態(tài)下,使其具有越高的優(yōu)勢函數(shù)值的動(dòng)作,策略π選中它的概率越高。
如圖3所示,考慮到強(qiáng)化學(xué)習(xí)需要經(jīng)過多次的訓(xùn)練才能達(dá)到預(yù)期的效果,本文采用多個(gè)智能體并行學(xué)習(xí)的方式以提升訓(xùn)練效率,其中全局網(wǎng)絡(luò)由路邊單元維護(hù),并向本地網(wǎng)絡(luò)提供最新網(wǎng)絡(luò)參數(shù),本地網(wǎng)絡(luò)由每一個(gè)在路邊單元通訊范圍內(nèi)的任務(wù)車輛維護(hù),可拉取全局網(wǎng)絡(luò)參數(shù),并訓(xùn)練更新,向全局網(wǎng)絡(luò)推送。
圖3:基于A3C協(xié)同任務(wù)卸載算法架構(gòu)
智能體中分為兩個(gè)子網(wǎng)絡(luò)Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò),Actor網(wǎng)絡(luò)用于訓(xùn)練策略π,Critic網(wǎng)絡(luò)用于對網(wǎng)絡(luò)提出的任務(wù)分配策略進(jìn)行評判。在每一輪訓(xùn)練中,智能體先從全局網(wǎng)絡(luò)拉取參數(shù)到本地網(wǎng)絡(luò),收集初始的車輛狀態(tài)s,然后在每一步中,依據(jù)策略π選擇任務(wù)分配策略,依據(jù)策略進(jìn)行任務(wù)卸載比例分配,服務(wù)節(jié)點(diǎn)根據(jù)任務(wù)分配進(jìn)行計(jì)算,并反饋結(jié)果,智能體計(jì)算獎(jiǎng)勵(lì)值r,車輛狀態(tài)由當(dāng)前狀態(tài)轉(zhuǎn)入下一個(gè)狀態(tài)s,并將經(jīng)歷(s,a,r,s)存儲(chǔ)起來。當(dāng)?shù)竭_(dá)一定步數(shù)時(shí),智能體更新Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)參數(shù),并異步更新到全局網(wǎng)絡(luò)。具體的算法如下。
算法1 基于A3C的任務(wù)卸載算法
1./*假設(shè)全局共享參數(shù)向量為θ和θ*/
2./*假設(shè)本地參數(shù)向量為θ'和θ'*/;
3.初始化本地計(jì)數(shù)器t←1
4.repeat
5.梯度清零dθ←0
6.依據(jù)全局共享參數(shù)同步本地參數(shù)θ'=θ且
7.θ'=θ
8.t=t 獲取初始車輛節(jié)點(diǎn)狀態(tài)s
9.repeat
10.依據(jù)策略π(a|s;θ')獲取任務(wù)分配策略a
11.并執(zhí)行,依據(jù)任務(wù)的時(shí)延及資源消耗情況
12.計(jì)算獎(jiǎng)勵(lì)r
13.節(jié)點(diǎn)狀態(tài)由s轉(zhuǎn)變?yōu)閟
14.t←t+1,T←T+1
15.R=V(s,θ')
16.for i∈{t-1,…,t} do
17.R←r+γR
18.dθ←dθ+
19.?logπ(a|s;θ')(R‐V(s;θ')
20.dθ←dθ+?(R‐V(s;θ'))/?θ'
21.end for
22.依據(jù)dθ,dθ異步更新θ和θ
23.until 任務(wù)完成計(jì)算
24.until T>T
在該節(jié)中,將展示仿真結(jié)果來評估本文提出方案的性能。具體的仿真參數(shù)如表1所示。為了對比,本文提供了另兩個(gè)任務(wù)卸載算法,定義如下。
表1:仿真參數(shù)
貪心算法(GA):對于每個(gè)任務(wù),任務(wù)節(jié)點(diǎn)均選擇空閑計(jì)算資源最多的服務(wù)節(jié)點(diǎn),并且選擇使得效用函數(shù)最大的定價(jià)支付酬勞。
隨機(jī)算法(SA):對于每個(gè)任務(wù),任務(wù)節(jié)點(diǎn),隨機(jī)選擇服務(wù)節(jié)點(diǎn)進(jìn)行任務(wù)卸載,同樣選擇使效用函數(shù)最大的定價(jià)支付酬勞。
在仿真中,共有30個(gè)卸載任務(wù),并且車隊(duì)由5輛車組成,車間距為10m,與車隊(duì)可通訊的車輛數(shù)為5至50輛,其與車隊(duì)內(nèi)可直接通訊的距離范圍為[-50,50]m。車隊(duì)的行使速度保持在90km/h,其他車輛與車隊(duì)的相對速度范圍是[-10,10]km/h。
如圖4所示,對比了在車隊(duì)外車輛數(shù)不同時(shí),任務(wù)車輛的平均效用的變化??梢宰⒁獾教岢龅幕贏3C的任務(wù)卸載算法,任務(wù)車輛的平均效用高于其他兩種算法。一方面,提出的任務(wù)卸載算法可以將任務(wù)分配到多個(gè)服務(wù)節(jié)點(diǎn)進(jìn)行計(jì)算,另一方面A3C算法并不是只考慮當(dāng)前狀態(tài)提出策略,而是會(huì)考慮到未來狀態(tài)的影響,從而會(huì)有更好的效果。
圖4:平均效用對比
如圖5所示,對比了三種算法隨車隊(duì)外車輛數(shù)目變化任務(wù)時(shí)延占任務(wù)最大可容忍時(shí)延比例的變化,基于A3C的任務(wù)卸載算法整體上會(huì)隨服務(wù)節(jié)點(diǎn)數(shù)的增加而減小,這是由于任務(wù)有更多的節(jié)點(diǎn)可以卸載,提高了任務(wù)的并行度。而基于貪心的算法只選擇具有高計(jì)算能力的節(jié)點(diǎn)卸載,并不會(huì)隨服務(wù)節(jié)點(diǎn)的數(shù)量增加而明顯減少。
圖5:時(shí)延對比
如圖6所示,基于A3C的卸載算法能量消耗高于基于貪心的算法和隨機(jī)算法,這是由于為了提升任務(wù)節(jié)點(diǎn)的總體效用值,對于能耗的關(guān)注度較少,為了分配更合理的計(jì)算資源提升任務(wù)時(shí)延,需要消耗稍多的能量。
圖6:能耗對比
本文研究了車聯(lián)網(wǎng)中車隊(duì)場景下分布式任務(wù)卸載問題。將任務(wù)卸載問題構(gòu)建為一個(gè)順序決策問題?;贏3C算法,本文提出一個(gè)基于服務(wù)節(jié)點(diǎn)綜合能力的動(dòng)態(tài)定價(jià)激勵(lì)方案,并進(jìn)行任務(wù)卸載決策。仿真結(jié)果證明了本文提出的方案與其他常規(guī)方案相比有更好的性能。未來會(huì)考慮多個(gè)車隊(duì)同場景且跨越路邊單元的任務(wù)卸載問題。