張國平,陳 雪,徐洪波
(華中師范大學(xué)物理科學(xué)與技術(shù)學(xué)院,湖北 武漢 430079)
隨著5G通信技術(shù)發(fā)展、流量爆炸式增長和移動智能終端普及,移動用戶對服務(wù)質(zhì)量的要求也不斷提高,尤其是時(shí)延和能耗問題。為了解決時(shí)延敏感型任務(wù)、計(jì)算密集型與移動設(shè)備資源有限之間的矛盾,歐洲電信標(biāo)準(zhǔn)協(xié)會ETSI提出移動邊緣計(jì)算(MEC)技術(shù)[1]。MEC技術(shù)是一種新型的無線網(wǎng)絡(luò)接入模式,通過在移動用戶附近的接入點(diǎn)(Access Points)部署高性能服務(wù)器,提高網(wǎng)絡(luò)邊緣的計(jì)算能力。移動設(shè)備通過無線網(wǎng)絡(luò)將計(jì)算密集型任務(wù)卸載到邊緣服務(wù)器上執(zhí)行,能夠有效降低任務(wù)執(zhí)行時(shí)延和移動設(shè)備的能量消耗,從而提高用戶的服務(wù)體驗(yàn)。
近年來,工業(yè)界和學(xué)術(shù)界普遍認(rèn)為合理的卸載決策和資源分配能夠大大提升MEC系統(tǒng)的性能[2]。但是,由于MEC中卸載決策和資源分配的聯(lián)合優(yōu)化問題多為非凸的NP-hard問題,傳統(tǒng)數(shù)學(xué)方法解該類問題計(jì)算量大,復(fù)雜性高,這為MEC網(wǎng)絡(luò)帶來巨大的負(fù)擔(dān)。隨著深度學(xué)習(xí)(DL)的快速發(fā)展,其在自然語言處理、語音識別和計(jì)算機(jī)視覺等領(lǐng)域取得了巨大成功,研究表明DL也可以用來處理復(fù)雜的通信問題,例如信道預(yù)編碼、功率控制、信道估計(jì)等[3-5]。為了降低MEC聯(lián)合優(yōu)化問題的計(jì)算復(fù)雜度和任務(wù)執(zhí)行時(shí)延,本文提出了基于無監(jiān)督深度學(xué)習(xí)的計(jì)算卸載算法。通過聯(lián)合優(yōu)化卸載決策和通信資源分配,在滿足時(shí)延約束的條件下,最小化移動設(shè)備的能量加權(quán)和。
為了提高M(jìn)EC系統(tǒng)的性能,學(xué)者們提出許多基于數(shù)學(xué)分析的傳統(tǒng)算法來解決計(jì)算卸載問題。文獻(xiàn)[4]提出了一種高效的一維搜索算法來處理功率約束的時(shí)延最小化問題,該算法根據(jù)應(yīng)用緩沖區(qū)的緩沖狀態(tài)、本地設(shè)備和遠(yuǎn)程傳輸?shù)目捎霉β蕘慝@得最優(yōu)的卸載決策,以及移動設(shè)備(Mobile Device,MD)和MEC服務(wù)器之間的信道狀態(tài)信息(Channel State Information,CSI)。然而,該算法中MD需要MEC服務(wù)器的反饋才能做出卸載決策,增加了信令開銷。文獻(xiàn)[5]為了獲得高效的卸載決策,設(shè)計(jì)了一種基于博弈論的分布式計(jì)算卸載方法,該算法需要MD和MEC進(jìn)行多次通信迭代。類似的,文獻(xiàn)[6]和[7]通過迭代更新完全卸載決策,解決卸載決策和資源聯(lián)合分配問題。雖然這些算法能夠有效解決計(jì)算卸載問題,但由于其較高的計(jì)算復(fù)雜度和較長的時(shí)延,并不適用于執(zhí)行實(shí)時(shí)卸載任務(wù)。
隨著人工智能的發(fā)展,機(jī)器學(xué)習(xí)在許多領(lǐng)域取得顯著成功,而深度學(xué)習(xí)性能優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí),并被廣泛用于通信領(lǐng)域。文獻(xiàn)[8]采用深度強(qiáng)化學(xué)習(xí)方法處理無線MEC系統(tǒng)的資源分配問題。文獻(xiàn)[9]提出了一種基于DL的智能節(jié)能部分卸載方案,根據(jù)設(shè)備剩余能量、應(yīng)用能耗、信道條件、卸載數(shù)據(jù)量、計(jì)算能力等因素選擇最優(yōu)卸載方案,最小化損失函數(shù)和傳輸時(shí)延。文獻(xiàn)[10]利用DL方法解決MEC卸載問題,通過優(yōu)化移動環(huán)境狀態(tài)變量最小化損失函數(shù)。但是,前面提到的深度學(xué)習(xí)方法都是有監(jiān)督學(xué)習(xí),很難獲得合適的訓(xùn)練集,因此,本文設(shè)計(jì)了一種基于無監(jiān)督學(xué)習(xí)的計(jì)算卸載方法,以提高M(jìn)EC系統(tǒng)的性能。
本文考慮了一個(gè)多用戶移動邊緣計(jì)算卸載系統(tǒng),如圖1所示,包含K個(gè)單天線移動設(shè)備和一個(gè)部署有高性能服務(wù)器的單天線基站。時(shí)間T被劃分為K個(gè)時(shí)隙并分配給K個(gè)移動設(shè)備。在每個(gè)時(shí)隙里,設(shè)備選擇將任務(wù)通過時(shí)分多址技術(shù)(TDMA)卸載到邊緣服務(wù)器執(zhí)行或者在本地執(zhí)行。假設(shè)移動端任務(wù)可分割,即可以部分在本地執(zhí)行,部分卸載到服務(wù)器上執(zhí)行。為了使基站選擇合適的移動設(shè)備進(jìn)行任務(wù)卸載,可假設(shè)基站能獲得所有設(shè)備的CSI和計(jì)算能力,而且在一個(gè)時(shí)隙內(nèi)信道保持不變。
圖1 多用戶移動邊緣計(jì)算卸載網(wǎng)絡(luò)
對于本地執(zhí)行模型,根據(jù)P=εf3計(jì)算本地設(shè)備執(zhí)行任務(wù)的能量消耗[11],其中,ε由芯片結(jié)構(gòu)決定,f表示中央處理器(CPU)的計(jì)算速度,單位為轉(zhuǎn)數(shù)/秒。用Bk、Ck、fk分別表示設(shè)備k的任務(wù)大小、處理單位比特任務(wù)CPU的轉(zhuǎn)數(shù)和計(jì)算速度,并假設(shè)每個(gè)設(shè)備的Ck、fk保持不變。用ak表示設(shè)備的卸載決策,假設(shè)任務(wù)可分割,則ak∈[0,1]代表卸載任務(wù)的比率。設(shè)備k處理Bk任務(wù)CPU需要的轉(zhuǎn)數(shù)為(1-ak)CkBk,所以設(shè)備k本地執(zhí)行任務(wù)的時(shí)間可表示為
設(shè)備k本地執(zhí)行任務(wù)的能量消耗可表示為
計(jì)算卸載包括3部分:1)移動端上行任務(wù)傳輸(采用TDMA技術(shù)無線接入邊緣服務(wù)器);2)邊緣服務(wù)器執(zhí)行卸載任務(wù);3)服務(wù)器返回執(zhí)行結(jié)果。受帶寬和發(fā)射功率的限制,任務(wù)執(zhí)行和結(jié)果返回的時(shí)延遠(yuǎn)小于任務(wù)上傳,因此,本文只考慮任務(wù)上傳過程的資源分配。設(shè)備k上傳任務(wù)時(shí)的傳輸速率可表示為
其中,pk、gk表示設(shè)備k的發(fā)射功率和信道增益,N0表示復(fù)雜高斯白噪聲的方差,W表示帶寬。設(shè)備k卸載任務(wù)需要的時(shí)間可表示為
假設(shè)設(shè)備分配的發(fā)送時(shí)隙為τk,為保證任務(wù)能完全上傳,需滿足條件:。設(shè)備k卸載任務(wù)的能耗可表示為
為了降低移動設(shè)備能量消耗,本文在滿足時(shí)延和功率約束的條件下,通過優(yōu)化卸載決策、發(fā)射時(shí)間和發(fā)射功率,最小化移動設(shè)備的能耗和,相應(yīng)的優(yōu)化問題表示為
其中,βk為正定的權(quán)重因子,用來保證用戶的公平性。由于傳統(tǒng)數(shù)學(xué)分析方法求解該問題存在計(jì)算量大、復(fù)雜度高等不足,因此本文使用無監(jiān)督深度學(xué)習(xí)方法進(jìn)行求解。
本文采用無監(jiān)督深度神經(jīng)網(wǎng)絡(luò)求解優(yōu)化問題P1,其中信道增益作為網(wǎng)絡(luò)輸入,卸載策略、時(shí)間分配和功率分配作為網(wǎng)絡(luò)輸出。首先介紹基于全連接層網(wǎng)絡(luò)的深度學(xué)習(xí)框架,接著將問題P1轉(zhuǎn)化為無約束的優(yōu)化問題,最后采用無監(jiān)督學(xué)習(xí)方法進(jìn)行求解。
本文采用的全連接層神經(jīng)網(wǎng)絡(luò)包括一個(gè)輸入層、兩個(gè)隱藏層和一個(gè)輸出層,如圖2所示,其中K個(gè)設(shè)備的信道增益g作為網(wǎng)絡(luò)輸入層,卸載策略a、時(shí)間分配t和功率分配p作為輸出層。Li,i=1,2表示第i個(gè)隱藏層節(jié)點(diǎn)的個(gè)數(shù),第i個(gè)隱藏層的輸出表示為
圖2 全連接層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
其中,xi、xi-1分別表示當(dāng)前層和前一層的輸出向量,Wi為第i層節(jié)點(diǎn)的權(quán)重矩陣,bi為偏置矩陣,BN(batch normalization)表示批量歸一化,ReLU表示線性修正函數(shù)max(x,0)。該網(wǎng)絡(luò)選擇sigmoid函數(shù)作為激活層函數(shù),其形式為
因此,全連接層神經(jīng)網(wǎng)絡(luò)的輸出可以用參數(shù)化模型表示為
其中,g表示輸入的信道增益,θ表示網(wǎng)絡(luò)參數(shù){W,b}。
由于標(biāo)準(zhǔn)的深度學(xué)習(xí)問題為無約束問題,處理深度學(xué)習(xí)問題的方法并不能直接用于處理帶約束的MECO問題。常用的消除約束的方法包括:拼接自定義激活層作為輸出層和在損失函數(shù)上增加額外的約束項(xiàng)以懲罰約束違反。本文也采用以上兩種方法將優(yōu)化問題P1轉(zhuǎn)化為無約束深度學(xué)習(xí)問題。將優(yōu)化變量參數(shù)轉(zhuǎn)化為網(wǎng)絡(luò)參數(shù)的函數(shù):
將優(yōu)化變量參數(shù)化后,優(yōu)化問題可以轉(zhuǎn)化為以下形式:
同時(shí),為滿足功率分配約束C3,且sigmoid函數(shù)能夠?qū)⒆兞坑成涞剑?,1)之間,將網(wǎng)絡(luò)的激活層定義為
計(jì)算卸載決策需要滿足約束C2和C4,假設(shè)ak表示本地任務(wù)卸載比率,則必須滿足且,,因此,激活函數(shù)可定義為
通過以上自定義激活層,優(yōu)化問題P2可轉(zhuǎn)化為
通過在神經(jīng)網(wǎng)絡(luò)末端拼接不同的自定義激活層,優(yōu)化問題P3只需要滿足約束C5。
為了滿足約束C5,在神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中添加懲罰項(xiàng),懲罰約束違反。由于懲罰項(xiàng)只考慮約束違反的情況,在約束滿足的情況下可以忽略的值,因此定義如下函數(shù):
其中,λB為超參數(shù),用于平衡損失函數(shù)和懲罰項(xiàng)。
綜上所述,通過引入自定義激活層和懲罰項(xiàng),成功將原優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題。
優(yōu)化問題P4為標(biāo)準(zhǔn)的深度學(xué)習(xí)問題,通過隨機(jī)梯度下降法,最小化損失函數(shù)loss(θ,λB),無監(jiān)督深度學(xué)習(xí)網(wǎng)絡(luò)實(shí)現(xiàn)從信道樣本到卸載決策和資源分配策略的映射,具體算法如算法1所示。與傳統(tǒng)的有監(jiān)督學(xué)習(xí)相比,無監(jiān)督學(xué)習(xí)不需要有標(biāo)簽的訓(xùn)練集,而有標(biāo)簽的數(shù)據(jù)集多是通過傳統(tǒng)數(shù)學(xué)分析方法獲得,計(jì)算量大,復(fù)雜度高。在輸入信道樣本后,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò),直接輸出最優(yōu)分配策略,有效縮短時(shí)延,并降低復(fù)雜度。
算法1基于無監(jiān)督深度學(xué)習(xí)計(jì)算卸載算法
1)初始化網(wǎng)絡(luò)參數(shù)θ,超參數(shù)λB,步長α,總迭代次數(shù)T;
2)生成20 000個(gè)信道數(shù)據(jù)樣本并且設(shè)定minibatch-size=1 000;
3)fori=1:Tdo;
4)更新全連接層神經(jīng)網(wǎng)絡(luò)參數(shù)θ通過最小化loss(θ,λB);
5)更新懲罰項(xiàng)參數(shù)λB,通過次梯度下降法更新;
6)end for
本小節(jié)通過數(shù)值仿真驗(yàn)證了無監(jiān)督深度學(xué)習(xí)算法的有效性。考慮多用戶MEC系統(tǒng),其由一個(gè)部署有高性能服務(wù)器的單天線基站和K個(gè)單天線移動設(shè)備構(gòu)成。假設(shè)無線信道為大規(guī)模瑞利衰落信道,大規(guī)模衰落平均功率損耗為10-6,其他仿真參數(shù)如表1所示。
表1 仿真參數(shù)設(shè)置
通過對比本文提出的無監(jiān)督深度學(xué)習(xí)計(jì)算卸載機(jī)制和最小計(jì)算卸載機(jī)制,以說明無監(jiān)督深度學(xué)習(xí)計(jì)算卸載算法的有效性。最小卸載機(jī)制(MCOS):該方法優(yōu)先考慮本地執(zhí)行,如果本地計(jì)算能力不足,將剩余任務(wù)以最大發(fā)射功率傳輸?shù)椒?wù)器上執(zhí)行,計(jì)算K個(gè)設(shè)備的能耗加權(quán)和。無監(jiān)督計(jì)算卸載機(jī)制(UDLCOS):通過無監(jiān)督神經(jīng)網(wǎng)絡(luò)優(yōu)化卸載決策、功率分配、時(shí)間分配,在得到最優(yōu)解的情況下,計(jì)算K個(gè)設(shè)備的能耗加權(quán)和。
圖3為MCOS和UDLCOS兩種方案K個(gè)設(shè)備的能耗加權(quán)和??梢?,隨著設(shè)備數(shù)從4增加到20、總時(shí)延為0.5 s時(shí),兩種方案的能耗加權(quán)和都增加,且MCOS的能耗加權(quán)和明顯高于UDLCOS,說明在延遲約束下,合理的卸載決策和資源分配能夠有效降低設(shè)備的能耗,證明了UDLCOS是有效的。圖4展示了總時(shí)延從0.3 s增加到1.6 s、總設(shè)備數(shù)為14時(shí),UDLCOS和MCOS兩方案對設(shè)備能量消耗權(quán)重和的影響??梢?,隨著總時(shí)延的增加,MCOS的能耗加權(quán)和基本保持不變,而UDLCOS的能耗加權(quán)和先隨著總時(shí)延的增加下降,隨后保持不變。對于UDLCOS而言,由于優(yōu)先考慮本地計(jì)算,分配的時(shí)間總是能滿足本地任務(wù)的卸載需求,所以總時(shí)延增加對能耗加權(quán)和幾乎沒有影響;而隨著總時(shí)延的增加,UDLCOS下設(shè)備能夠?qū)⒏嗟娜蝿?wù)卸載到服務(wù)器上執(zhí)行,當(dāng)總時(shí)延進(jìn)一步增加時(shí),能耗加權(quán)和基本保持不變,說明時(shí)延已經(jīng)達(dá)到飽和,即滿足所有任務(wù)卸載的需求。因此,合理的卸載決策和資源分配能夠有效降低本地設(shè)備的能耗加權(quán)和,證明了UDLCOS的有效性。
圖3 UDLCOS和MCOS下能量消耗權(quán)重和與設(shè)備數(shù)K的關(guān)系
圖4 UDLCOS和MCOS下K為14時(shí)能量消耗權(quán)重和與時(shí)延的關(guān)系
綜上所述,為了緩解移動設(shè)備存儲能耗有限的問題,本文提出了一種基于無監(jiān)督深度學(xué)習(xí)的計(jì)算卸載方案,該方案在規(guī)定時(shí)延約束下可以有效降低移動端設(shè)備能量消耗。本文考慮多用戶移動邊緣計(jì)算卸載系統(tǒng),其包含一個(gè)部署有高性能服務(wù)器的單天線基站和K個(gè)單天線移動設(shè)備,在規(guī)定時(shí)延和功率約束下,通過優(yōu)化卸載決策、時(shí)間分配和功率分配,最小化設(shè)備的能耗加權(quán)和。通過將該約束優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題,采用無監(jiān)督深度學(xué)習(xí)方法進(jìn)行求解,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠在低復(fù)雜度的情況下,獲得最優(yōu)的卸載決策和資源分配方案,有效地降低了移動邊緣計(jì)算設(shè)備的總能耗。仿真結(jié)果亦證明了所提出的卸載方案是有效的。在未來工作中,我們將研究基于聯(lián)邦學(xué)習(xí)的移動邊緣計(jì)算方案。