国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

強(qiáng)化學(xué)習(xí)在協(xié)作頻譜感知中的應(yīng)用

2024-09-19 00:00:00劉春玲許軍郭楷文
無(wú)線電工程 2024年6期
關(guān)鍵詞:強(qiáng)化學(xué)習(xí)

摘 要:針對(duì)隨著節(jié)點(diǎn)數(shù)量的增多,多節(jié)點(diǎn)協(xié)作頻譜感知(Cooperative Spectrum Sensing,CSS) 會(huì)產(chǎn)生大量本地?cái)?shù)據(jù),導(dǎo)致能耗變高和全局決策延遲的問(wèn)題,提出節(jié)點(diǎn)評(píng)估與選擇(Node Evaluation Selection,NES) 和網(wǎng)格搜索(Grid Search,GS) 的強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL) 算法。通過(guò)NES 算法在融合中心(Fusion Center,FC) 實(shí)時(shí)更新協(xié)作用戶的信任值,對(duì)信任值大小進(jìn)行排序,根據(jù)設(shè)定的閾值,阻止惡意用戶(Malicious Users,MU) 參與CSS。通過(guò)基于GS 的RL 機(jī)制對(duì)處理后的數(shù)據(jù)進(jìn)行標(biāo)記,把信噪比(Signal to Noise Ratio,SNR) 和信任值作為輸入?yún)?shù),搜索出所有可能的參數(shù)組合。在相同環(huán)境參數(shù)時(shí),FC 可以直接調(diào)用該環(huán)境下的節(jié)點(diǎn),不需要再重新進(jìn)行感知操作,如果有新用戶加入時(shí)通過(guò)改變參數(shù)的范圍重新搜索,新用戶可以模仿其他用戶RL 的經(jīng)驗(yàn),從而獲得更加快速的信道占用情況。仿真結(jié)果表明,該方法與其他算法相比,在提高檢測(cè)概率的同時(shí),降低了能耗,減少重復(fù)計(jì)算的時(shí)間,解決了全局決策延遲的問(wèn)題。

關(guān)鍵詞:協(xié)作頻譜感知;認(rèn)知無(wú)線網(wǎng)絡(luò);融合中心;網(wǎng)格搜索;強(qiáng)化學(xué)習(xí)

中圖分類(lèi)號(hào):TN925 文獻(xiàn)標(biāo)志碼:A 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

文章編號(hào):1003-3106(2024)06-1346-09

0 引言

隨著5G 進(jìn)入商業(yè)階段,云計(jì)算、網(wǎng)絡(luò)功能虛擬化和軟件定義網(wǎng)絡(luò)概念的快速革命[1],人們已經(jīng)開(kāi)始6G[2]移動(dòng)通信的研究,在6G 網(wǎng)絡(luò)中不再局限于傳統(tǒng)的地面蜂窩架構(gòu),正在向地面-水下-空中-空間混合網(wǎng)絡(luò)發(fā)展。6G 的頻譜研究將集中在擴(kuò)展頻譜資源、頻譜共享與動(dòng)態(tài)分配、智能頻譜管理等方面,以滿足未來(lái)移動(dòng)通信的需求,并提供更快速、可靠和高效的連接體驗(yàn)。認(rèn)知無(wú)線電(CognitiveRadio,CR)系統(tǒng)是針對(duì)射頻環(huán)境中頻譜稀缺[3]問(wèn)題提出的一種解決方案,主要提高頻譜的整體利用率。頻譜感知是通信期間,次用戶(Secondary User,SU)利用未使用的主用戶(Primary User,PU)頻譜[4],實(shí)現(xiàn)頻譜共享、頻譜動(dòng)態(tài)分配和干擾檢測(cè)等功能。由于地理位置對(duì)頻譜感知的影響,單節(jié)點(diǎn)的感知精度低,而多節(jié)點(diǎn)協(xié)作頻譜感知(Cooperative SpectrumSensing,CSS)可以克服由于多徑衰落和陰影導(dǎo)致的頻譜感知性能下降的問(wèn)題。因此,在認(rèn)知無(wú)線電網(wǎng)絡(luò)(Cognitive Radio Network,CRN)中,CSS 是一種被廣泛使用的感知技術(shù),可以成功地提高感知精度[5]。但隨著感知節(jié)點(diǎn)數(shù)量的增加,CRN 中全局決策實(shí)時(shí)性降低且能量消耗也隨之增加。

在CSS 中,一些惡意節(jié)點(diǎn)可能會(huì)參與到頻譜感知中,從而混淆檢測(cè)系統(tǒng),也可能因?yàn)閭鞲性O(shè)備錯(cuò)誤或信道噪聲,一些節(jié)點(diǎn)會(huì)向融合中心(FusionCenter,FC)發(fā)送不正確的結(jié)果,這些節(jié)點(diǎn)會(huì)干擾CSS。為了實(shí)現(xiàn)高效的頻譜感知,檢測(cè)惡意用戶(Malicious Users,MU)是一個(gè)具有挑戰(zhàn)性的問(wèn)題,許多研究人員一直在研究這個(gè)問(wèn)題[6]。文獻(xiàn)[7]設(shè)計(jì)了一種以信譽(yù)值為基礎(chǔ)的拍賣(mài)算法,用于分配感知收益。該算法不僅確保感知收益公平分配,降低了算法復(fù)雜度,還可以促進(jìn)更多群智感知(Crowd Sensors)參與感知任務(wù)。利用區(qū)塊鏈的去中心化和去信任化特性,提高了頻譜感知的穩(wěn)定性和可靠性。然而,該算法在考慮報(bào)價(jià)策略時(shí)沒(méi)有考慮到環(huán)境的變化以及Crowd Sensors 在能量消耗方面的影響。文獻(xiàn)[8]提出了一種雙自適應(yīng)閾值技術(shù),以增強(qiáng)其信譽(yù)計(jì)算算法的魯棒性。該技術(shù)計(jì)算每個(gè)用戶的信譽(yù)分?jǐn)?shù),并計(jì)算一組可疑用戶,利用自適應(yīng)閾值對(duì)這組可疑用戶執(zhí)行第二信譽(yù)計(jì)算。未通過(guò)此雙重檢查的可疑用戶將被歸類(lèi)為最終MU,同時(shí)在感知用戶數(shù)增多時(shí)整個(gè)感知過(guò)程計(jì)算量也在變大。文獻(xiàn)[9]提出了一種稱為頻譜感知策略選擇的新算法,以協(xié)作或獨(dú)立的方式選擇更好的感知策略。為了推導(dǎo)節(jié)點(diǎn)頻譜狀態(tài)的最大后驗(yàn)估計(jì),通過(guò)基于圖割的CSS方法構(gòu)建了拓?fù)湫畔⒊杀竞瘮?shù)和感知結(jié)果成本函數(shù)。把信譽(yù)值應(yīng)用于評(píng)估CSS 和獨(dú)立感知的性能,以最大限度地降低選擇性能較差的感知方式的概率。文獻(xiàn)[10]提出了一種基于強(qiáng)化學(xué)習(xí)(Rein-forcement Learning,RL)的協(xié)同頻譜感知方案,用于SU 確定信道掃描順序和選擇合作伙伴進(jìn)行協(xié)同頻譜感知。通過(guò)Q-learning 方法,每個(gè)SU 學(xué)習(xí)主要通道的占用模式,以生成動(dòng)態(tài)的掃描優(yōu)先列表,從而降低掃描成本并減少訪問(wèn)延遲。然而沒(méi)有考慮阻止置信度低的用戶參與協(xié)作感知,使其能耗偏高。文獻(xiàn)[11]提出的混合方案將差分進(jìn)化(Differential E-volution,DE)優(yōu)化方案與基于機(jī)器學(xué)習(xí)的增強(qiáng)樹(shù)算法相結(jié)合以減輕MU 在CSS 系統(tǒng)中的影響,根據(jù)使用DE 的SU 確定優(yōu)化閾值和系數(shù)向量用于訓(xùn)練增強(qiáng)樹(shù)算法,從而獲得可靠的感知結(jié)果。雖然檢測(cè)概率得到了提高,但感知時(shí)間和能量消耗的成本也在變大。在文獻(xiàn)[12]中,FC 根據(jù)從所有SU 接收到的硬二進(jìn)制決策進(jìn)行全局決策。遺傳算法(Genetic Algorithm ,GA)采用一對(duì)多鄰居距離和z-score 作為適應(yīng)度函數(shù),在有MU 的情況下通過(guò)選擇和交叉來(lái)識(shí)別最佳感知結(jié)果,該方案能夠在不識(shí)別MU 的情況下避免MU 在CSS 中的影響,但整個(gè)網(wǎng)絡(luò)的能量消耗也在增高。

針對(duì)以上問(wèn)題,提出了節(jié)點(diǎn)評(píng)估與選擇(NodeEvaluation Selection,NES)算法剔除信任值低的節(jié)點(diǎn)(MU),選擇信任值高的節(jié)點(diǎn)(可靠節(jié)點(diǎn))參與CSS,從而在保證檢測(cè)性能的情況下減少了能量的消耗。提出基于網(wǎng)格搜索(Grid Search,GS)的RL,在出現(xiàn)相同環(huán)境參數(shù)時(shí),FC 可以直接調(diào)用當(dāng)前節(jié)點(diǎn),而無(wú)需再次進(jìn)行感知操作,從而減少數(shù)據(jù)的處理,提高全局決策的實(shí)時(shí)性。

1 系統(tǒng)模型

1. 1 CSS 模型

建立了由一個(gè)PU 和若干個(gè)SU 組成的模擬CR模型,各節(jié)點(diǎn)通過(guò)FC 通信,FC 通過(guò)各節(jié)點(diǎn)信息判斷PU 通道是否空閑。CRN 模型如圖1 所示。

1. 2 能量檢測(cè)模型

在頻譜感知中,每個(gè)SU 獨(dú)立執(zhí)行一個(gè)能量檢測(cè)[13]過(guò)程。這是因?yàn)槟芰繖z測(cè)操作簡(jiǎn)單,且不需要PU 的先驗(yàn)信息。第j 個(gè)SU 接收到的信號(hào)確定如下:

式中:qnj是前一感知周期中第j 個(gè)節(jié)點(diǎn)的信任值,qn+1j 是第j 個(gè)結(jié)點(diǎn)的當(dāng)前信任值,v 是前一周期的綜合返回值,τnj是前一個(gè)周期的綜合校正系數(shù),Φ 是加權(quán)因子,值?。?或0。Φ 的值?。?的次數(shù)越多時(shí),能量利用效率越高。反之,表明需要調(diào)整感知節(jié)點(diǎn)以提高感知性能和能耗指數(shù)。

調(diào)整感知節(jié)點(diǎn)的數(shù)量,再調(diào)用信任值大于閾值的節(jié)點(diǎn)參與CSS,這里的閾值設(shè)置為信任值的平均值,當(dāng)信任值大于等于平均值時(shí)節(jié)點(diǎn)是可靠的,當(dāng)信任值小于平均值時(shí)節(jié)點(diǎn)是不可靠的,公式為:

qave = qmax + qmin/2 。(20)

NES 算法流程如算法1 所示。

3 基于GS 的RL

3. 1 GS

GS[15]是指事先在給定的超參數(shù)空間中定義一組候選超參數(shù),然后進(jìn)行排列組合,形成一個(gè)超參數(shù)的“網(wǎng)格”,按照“網(wǎng)格”依次搜索超參數(shù)空間中的各個(gè)組合。GS 的好處是能夠?qū)λ锌赡艿膮?shù)組合進(jìn)行搜索??梢允褂盟阉鱽?lái)獲得信任值可靠的節(jié)點(diǎn)qj,為了提高搜索效率,進(jìn)行了GS。訓(xùn)練搜索后的參數(shù)包括SNR 和信任值,其中設(shè)置SNR ∈(-20,-10)dB,qj ∈(0. 5,1)。通過(guò)搜索把這些信息作為先驗(yàn)知識(shí)保存到知識(shí)庫(kù)中。GS 的過(guò)程如下:

① 當(dāng)ηi 出現(xiàn)時(shí),FC 將進(jìn)行實(shí)時(shí)搜索,從而獲得qj,并得到對(duì)應(yīng)的Pd。其中ηi 是第i(正整數(shù))個(gè)出現(xiàn)的SNR,如果SNR 是新出現(xiàn)的,就設(shè)置新的參數(shù)重新搜索。最后搜索的結(jié)果將在Pd 和qj 返回時(shí)輸出。此外,qj 和ηi 將成為FC 搜索的先驗(yàn)知識(shí),搜索得到的數(shù)據(jù)存儲(chǔ)庫(kù)Ω 為:

Ω = f(qj,ηi), (21)

式中:f 是一個(gè)搜索函數(shù)。

② 當(dāng)ηi 不是新出現(xiàn)時(shí),FC 將利用學(xué)習(xí)的知識(shí)直接選擇qj:

qi = f -1(ηi,Ω)。(22)

③ 在ηi 下,形成i×j 的網(wǎng)格,i 是所設(shè)的SNR 的步長(zhǎng),j 是節(jié)點(diǎn)數(shù),步長(zhǎng)都為1。

④ Pd,j 是第j 個(gè)網(wǎng)格的節(jié)點(diǎn)檢測(cè)概率,一直增加到所參與的協(xié)作的節(jié)點(diǎn)數(shù),或當(dāng)Pd,j = 1 時(shí)停止搜索時(shí);否則將繼續(xù)搜索。

⑤ 當(dāng)實(shí)時(shí)搜索完成時(shí),會(huì)得到概率Pd 的集合和相應(yīng)的qj:

3. 2 RL 的過(guò)程

RL[16]是一種機(jī)器學(xué)習(xí)方法,主要包括環(huán)境和智能體(agent)兩部分。而Q-learning 在RL 方法中經(jīng)常被使用,其中處于狀態(tài)s 的智能體通過(guò)采取動(dòng)作a 來(lái)與環(huán)境交互,目的是從行動(dòng)的結(jié)果中學(xué)習(xí)環(huán)境。根據(jù)結(jié)果,智能體獲得獎(jiǎng)勵(lì)值r(s,a),并更新Q值。在每個(gè)時(shí)間點(diǎn)t,智能體可能處于特定的狀態(tài)s,并且可以根據(jù)其在之前迭代中的學(xué)習(xí)選擇一個(gè)動(dòng)作。Q-learning 的歷史可以用狀態(tài)-動(dòng)作獎(jiǎng)勵(lì)序列表示:<s0,a0,r1,s1,a1,r2,s2,a2,r3,s3,a3,r4,s4,s4,… >,智能體在狀態(tài)s0 時(shí)采取行動(dòng)a0 ,并獲得獎(jiǎng)勵(lì)值r1 。之后,進(jìn)入狀態(tài)s1 ,以此類(lèi)推。智能體從狀態(tài)-行動(dòng)-獎(jiǎng)勵(lì)歷史中學(xué)習(xí)。一種狀態(tài)-行動(dòng)-獎(jiǎng)勵(lì)的經(jīng)驗(yàn)(<s,a,r,s′>)獲得回報(bào)值Q(s,a),同時(shí)按照貝爾曼最優(yōu)化準(zhǔn)則進(jìn)行Q 值的更新來(lái)選擇下一步動(dòng)作,表達(dá)式為:

Qt+1(s,a) = (1 - α)Qt(s,a)+α{rt(s,a)+ ξmax[Qt+1(s′,a′)]},(24)

式中:學(xué)習(xí)因子α 和折損因子ξ 取值都為(0,1),當(dāng)α 接近于0 時(shí),智能體從狀態(tài)-行動(dòng)-獎(jiǎng)勵(lì)過(guò)程中學(xué)到的很少,歷史占主導(dǎo)地位。如果環(huán)境是確定的,則α 的最優(yōu)值為1。

在GS 后將RL 的理論運(yùn)用SU 的狀態(tài)和環(huán)境的學(xué)習(xí)。將SU 比作RL 中的智能體[17]學(xué)習(xí)信道占用的模式,st 表示信道的狀態(tài),在t 時(shí)刻信道是否被PU 占用。當(dāng)SUj 出現(xiàn)時(shí),通過(guò)掃描信道(ci )來(lái)采取行動(dòng)。使用Q 學(xué)習(xí)方法,獲得獎(jiǎng)勵(lì)值rjt(st,ci )在時(shí)間t 下信道的狀態(tài):

式中:sj(ci)= 1 表示信道空閑,sj(ci)= 0 表示信道繁忙,ωjt(ci)與式(7)一致表示權(quán)重。于是節(jié)點(diǎn)j 在信道狀態(tài)ci 時(shí)Q 值的更新為:

Qj(st+1 ,ci)← (1 - α)·Qj(st,ci)+α·{rj(si,ci)- ξ(e-τm )}, (26)

式中:τ 表示(0,1)的常數(shù),m 表示SU 第m 次掃描信道。信息融合與前面的Ez 一致,信道的判決結(jié)果如下所示:

在融合階段結(jié)束時(shí),得出m 個(gè)協(xié)作用戶的測(cè)量值,將測(cè)量值存放于矩陣Z 中。當(dāng)CR 環(huán)境與存儲(chǔ)矩陣Z 的數(shù)據(jù)一致時(shí),RL 采用直接從動(dòng)作空間A 中選擇適當(dāng)?shù)膭?dòng)作來(lái)更新函數(shù)值,通過(guò)持續(xù)的迭代更新獲得最優(yōu)動(dòng)作a* ,從而選出參與協(xié)作感知的用戶。如果有新用戶加入到CR 環(huán)境中,就需要重新設(shè)置網(wǎng)GS 的參數(shù),在原來(lái)的矩陣擴(kuò)充第m+1 維數(shù),協(xié)作結(jié)束時(shí),將協(xié)作結(jié)果廣播到所有協(xié)作用戶。在矩陣Z 中的第一列表示信任值可靠的節(jié)點(diǎn)Qj,第二列表示SNR 的值。每行表示通過(guò)在特定無(wú)線電環(huán)境中執(zhí)行GS 的RL 算法找到參與協(xié)作的節(jié)點(diǎn)。

在FC 完成GS 的RL 后,獲得的矩陣Z 表示如下:

算法結(jié)構(gòu)框圖如圖2 所示。

4 算法仿真及分析

通過(guò)蒙特卡洛模擬進(jìn)行實(shí)驗(yàn),在CRN 中所有節(jié)點(diǎn)的仿真結(jié)果都超過(guò)了2 000 次迭代,建模的CRN中有8 個(gè)輔助節(jié)點(diǎn)[18]和30 個(gè)感知節(jié)點(diǎn)。在加性高斯白噪聲(Additive White Gaussian Noise,AWGN)的信道下,感知場(chǎng)景范圍為200 m,節(jié)點(diǎn)隨機(jī)分布,PU在場(chǎng)景的邊緣,所需的節(jié)點(diǎn)總數(shù)為30(每10 個(gè)節(jié)點(diǎn)為SNR = -12、-10、-8 dB),8 個(gè)輔助節(jié)點(diǎn)(SNR =-8 dB),BPSK 信號(hào)功率為100 mW,帶寬為100 kHz。在此仿真環(huán)境中,MU 在2 種不同情況下進(jìn)行設(shè)置:第一種情況,如果有5 個(gè)MU,其中在SNR = -12 dB 下有2 個(gè);第二種情況,如果有9 個(gè)MU,在SNR = -10 dB 下有4 個(gè)MU。為了驗(yàn)證本文算法的性能,將其與DE 和GA 進(jìn)行比較。在考慮NES 時(shí),設(shè)置9 個(gè)惡意節(jié)點(diǎn),在其他2 種算法中,設(shè)置5 個(gè)惡意節(jié)點(diǎn),其他參數(shù)都相同。仿真場(chǎng)景如圖3 所示。NES 與其他2 種算法感知性能比較如圖4 所示。檢測(cè)概率隨協(xié)作用戶數(shù)變化曲線如圖5所示。

從圖4 可以看出,在SNR 低于-12 dB 時(shí),NES算法的檢測(cè)概率高于DE 和GA 算法,這是因?yàn)椋危牛铀惴紤]了CRN 中MU 的存在,并阻止了MU 參與CSS,所以使整個(gè)網(wǎng)絡(luò)具有更強(qiáng)的可靠性。當(dāng)SNR為- 15 dB 時(shí),NES 算法比GA 算法檢測(cè)概率高0. 46。通過(guò)圖5 可以發(fā)現(xiàn),隨著協(xié)作用戶數(shù)的增加,3 種算法的檢測(cè)概率都呈現(xiàn)增加的趨勢(shì),在M <70時(shí),NES 算法檢測(cè)概率比GA 和DE 算法檢測(cè)概率高,這是因?yàn)椋危牛?算法剔除了MU,參與協(xié)作感知的都是可靠用戶。

NES 算法與GA 和DE 算法在相同條件下的能耗對(duì)比,其他仿真實(shí)驗(yàn)參數(shù)與上實(shí)驗(yàn)相同,感知周期與能耗的變化曲線如圖6 所示。從圖6 結(jié)果可以看出,m<60 時(shí)隨著感知周期數(shù)的增加三者能耗都在增加,但NES 算法效果比GA 和DE 算法優(yōu)益,但當(dāng)感知周期數(shù)m>60 時(shí),三者能耗基本趨于穩(wěn)定,此時(shí)NES 算法與GA 算法能耗接近,但整個(gè)周期中NES算法比GA 算法節(jié)能效果好。

在NES 后,加入GS 算法與隨機(jī)搜索算法[19]和固定-雙閾值算法[20]作比較,如圖7 所示。由圖可以看出,相同的SNR 下,GS 算法的檢測(cè)概率比隨機(jī)搜索和固定-雙閾值算法都要高,在-17 dB 時(shí)GS 算法比隨機(jī)搜索檢測(cè)概率高了0. 1,比固定—雙閾值算法檢測(cè)概率高了0. 16。這是因?yàn)椋牵?算法可以在遍歷指定的參數(shù)組合時(shí),保證在任何環(huán)境下可以找到最優(yōu)的參數(shù),而隨機(jī)搜索和固定-雙閾值會(huì)出現(xiàn)無(wú)效或者冗余取值的情況。

獎(jiǎng)勵(lì)值隨協(xié)作用戶的數(shù)量變化曲線如圖8 所示??梢钥闯?,隨著協(xié)作用戶的增加獎(jiǎng)勵(lì)值也在增加,在達(dá)到一定用戶數(shù)時(shí)收斂于1,這也符合協(xié)作感知的規(guī)律;協(xié)作用戶M<60 時(shí),GS 算法后的RL 獎(jiǎng)勵(lì)值高于單獨(dú)RL 下的值,這是因?yàn)椋牵?算法得到了最優(yōu)的協(xié)作用戶。圖9 顯示了PU 在頻帶使用率不同時(shí),Q 值隨著時(shí)間的變化,PU 占用的頻帶越低Q 值通常較高。此外,在感知期間隨著時(shí)間的推移Q 值在減小,并在某個(gè)時(shí)間趨于穩(wěn)定。不同SNR 下感知時(shí)間比較如圖10 所示??梢钥闯?,在相同SNR 情況下,基于GS 算法的RL 比沒(méi)有RL 加入時(shí)感知時(shí)間更短,因此,提高了全局決策的實(shí)時(shí)性。如果沒(méi)有使用RL,那么每個(gè)頻譜感知過(guò)程都需要使用GS 算法來(lái)查找可靠的節(jié)點(diǎn),這將導(dǎo)致感知時(shí)間增加。當(dāng)SNR 增加時(shí),感知時(shí)間減少,這是因?yàn)殡S著SNR 的提高,存儲(chǔ)的信息更少,更容易做出判斷。

5 結(jié)束語(yǔ)

提出了一種基于RL 的CSS 算法。利用NES 算法解決了CRN 中可能存在MU 參與CSS 導(dǎo)致能量消耗高和感知精度低的問(wèn)題;通過(guò)GS 的RL 算法解決了在相同CR 環(huán)境下重復(fù)計(jì)算的時(shí)間,減少了計(jì)算量,縮短了感知時(shí)間,提高了頻譜感知速度,為全局決策的實(shí)時(shí)性提供了保障,使頻譜動(dòng)態(tài)分配成為可能。后續(xù)在此基礎(chǔ)上評(píng)估網(wǎng)絡(luò)的平均生存周期,根據(jù)仿真結(jié)果,對(duì)網(wǎng)絡(luò)模型和頻譜感知算法進(jìn)行優(yōu)化改進(jìn)。

參考文獻(xiàn)

[1] JAGADEESAN N A,NACHIKETHAS B . SoftwaredefinedNetworking Paradigms in Wireless Networks:A Survey[J]. ACM Computing Surveys,2014,47(2):1-11.

[2] JIANG W,HAN B,HABIBI M A,et al. The Road Towards6G:A Comprehensive Survey[J]. IEEE Open Journal ofthe Communications Society,2021,2:334-366.

[3] SAAVEDRA E,MASCARAQUE L,CALDERON G,et al.A Universal Testbed for IoT Wireless Technologies:Abstracting Latency,Error Rate and Stability from the IoTProtocol and Hardware Platform [J]. Sensors,2022,22(11):4159.

[4] PERARASI T,NAGARAJAIN G,GAYATHRI R,et al.Evaluation of Cooperative Spectrum Sensing with FilteredBank Multi Carrier Utilized for Detecting in CognitiveRadio Network [J]. Transactions on Emerging Telecommunications Technologies,2022,33(7):e4478.

[5] 李葉. 基于單節(jié)點(diǎn)及多節(jié)點(diǎn)頻譜感知的認(rèn)知無(wú)線電網(wǎng)絡(luò)資源分配研究[D]. 成都:西南交通大學(xué),2021.

[6] HWANG J,KIM J,SUNG I,et al. Fast and AccurateDetection of Malicious Users in Cooperative SpectrumSensing Network[J]. Wireless Personal Communications,2021,118(2):1709-1731.

[7] 呂培,趙杭生,張建照. 一種基于信譽(yù)值拍賣(mài)的區(qū)塊鏈下的感知收益分配機(jī)制[J]. 電訊技術(shù),2021,61(1):1-7.

[8] JIBRAN M,KIM J,KOO J,et al. A Double AdaptiveApproach to Tackle Malicious Users in Cognitive RadioNetworks[J]. Wireless Communications and Mobile Computing,2019,2019:2214-2223.

[9] SUN Z G,XU Z Y,CHEN Z M,et al. ReputationbasedSpectrum Sensing Strategy Selection in Cognitive RadioAd Hoc Networks[J]. Sensors,2018,18(12):4377.

[10] NING W L,HUANG X Y,YANG K,et al. ReinforcementLearning Enabled Cooperative Spectrum Sensing in Cognitive Radio Networks[J]. Journal of Communications andNetworks,2020,22(1):12-22.

[11] GUL N,KIM S M,AHMED S,et al. Differential EvolutionBased Machine Learning Scheme for Secure CooperativeSpectru Sensing System [J ]. Electronics,2021,10(14):1687.

[12] GUL N,QURESHI I M,ELAHI A,et al. Defense AgainstMalicious Users in Cooperative Spectrum Sensing UsingGenetic Algorithm [J]. International Journal of Antennasand Propagation,2018,2018:1-11.

[13] 王聰,劉雄厚,孫超,等. 基于頻率著色的被動(dòng)聲吶寬帶能量檢測(cè)方法[J]. 哈爾濱工程大學(xué)學(xué)報(bào),2021,42(4):456-462.

[14] PAGE E L,PEIGN? M,PHAM D C. Central LimitTheorem for a Critical Multitype Branching Process inRandom Environments[J]. Tunisian Journal of Mathematics,2021,3(4):801-842.

[15] FAYED H A,ATIYA A F. Speed up Gridsearch forParameter Selection of Support Vector Machines [J ].Applied Soft Computing,2019,80:202-210.

[16] HAN K,YE C Y. Power Control Research for DevicetoDevice Wireless Network Underlying ReinforcementLearning[C]∥ Global Conference on Robotics,ArtificialIntelligence and Information Technology. Chicago:IEEE,2022:351-354.

[17] 李冠雄,李桂林. 基于強(qiáng)化學(xué)習(xí)的合作頻譜分配算法[J]. 電波科學(xué)學(xué)報(bào),2022,37(1):8-14.

[18] 曹龍,趙杭生,鮑麗娜,等. 基于輔助節(jié)點(diǎn)的安全協(xié)作頻譜感知[J]. 計(jì)算機(jī)工程,2014,40(2):123-127.

[19] KOSTEN V A,SELEZENEV L E. Random Search Algorithmwith Selflearning for Neural Network Training[J]. OpticalMemory and Neural Networks,2021,30(2):180-186.

[20] HUANG T,YIN X D,CAO Q J. A New Algorithm forConsidering Green Communication and Excellent SensingPerformance in Cognitive Radio Networks [J ].International Journal of Distributed Sensor Networks,2020,16(6):645-649.

作者簡(jiǎn)介

劉春玲 女,(1971—),博士,教授,碩士生導(dǎo)師,CCF 會(huì)員。主要研究方向:信號(hào)檢測(cè)與信號(hào)處理。

許 軍 男,(1996—),碩士研究生。主要研究方向:認(rèn)知無(wú)線電與壓縮感知。

郭楷文 男,(1997—),碩士研究生。主要研究方向:機(jī)器人路徑規(guī)劃。

基金項(xiàng)目:遼寧省教育廳面上基金項(xiàng)目(LJKZ1184)

猜你喜歡
強(qiáng)化學(xué)習(xí)
基于強(qiáng)化學(xué)習(xí)的無(wú)線網(wǎng)絡(luò)智能接入控制技術(shù)
機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究
未來(lái)人工智能自主學(xué)習(xí)網(wǎng)絡(luò)的構(gòu)建
轉(zhuǎn)觀念 強(qiáng)服務(wù) 樹(shù)立用電檢查新價(jià)值
智能車(chē)自主避障路徑規(guī)劃研究綜述
一種記憶可修剪型仿生機(jī)器人的速度跟蹤算法研究
基于強(qiáng)化學(xué)習(xí)的在線訂單配送時(shí)隙運(yùn)能分配
論“以讀促寫(xiě)”在初中英語(yǔ)寫(xiě)作教學(xué)中的應(yīng)用
智能交通車(chē)流自動(dòng)導(dǎo)引系統(tǒng)
分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
贵南县| 彭阳县| 长汀县| 彭州市| 福鼎市| 五常市| 陇南市| 得荣县| 南宫市| 鹤壁市| 昭苏县| 文昌市| 竹北市| 河曲县| 尉氏县| 射洪县| 晋城| 辛集市| 来安县| 盘山县| 定兴县| 曲麻莱县| 华池县| 特克斯县| 曲松县| 开远市| 珠海市| 平阳县| 手游| 镇原县| 友谊县| 保德县| 望谟县| 五原县| 雷波县| 壶关县| 临湘市| 道孚县| 东兴市| 惠州市| 凤翔县|