国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Stackelberg博弈的雙目標(biāo)WOA頻譜共享算法

2020-10-11 03:08:16張力廖天何業(yè)軍
通信學(xué)報(bào) 2020年9期
關(guān)鍵詞:獵物頻譜公平

張力,廖天,何業(yè)軍

(深圳大學(xué)電子與信息工程學(xué)院,廣東 深圳 518060)

1 引言

人們對(duì)通信的需求從早期的文字通信演變?yōu)楫?dāng)今的視頻通信[1]。隨著通信需求的不斷增加,有限的頻譜資源很難滿足人們的需求[2],主要表現(xiàn)為現(xiàn)有頻譜資源調(diào)度和分配的不合理[3]。

現(xiàn)有的頻譜資源共享方式[4]無(wú)法最大程度地保證通信服務(wù)質(zhì)量,原因是在解決認(rèn)知用戶和授權(quán)用戶之間頻譜資源的共享問(wèn)題及認(rèn)知用戶之間頻譜資源的競(jìng)爭(zhēng)問(wèn)題時(shí)沒(méi)有考慮授權(quán)用戶和認(rèn)知用戶的通信質(zhì)量,也沒(méi)有考慮系統(tǒng)中所有用戶的公平度,對(duì)于系統(tǒng)中授權(quán)用戶和認(rèn)知用戶之間的競(jìng)爭(zhēng)也沒(méi)有考慮。而解決這類問(wèn)題的主要方法就是博弈論[5],通過(guò)博弈論的相關(guān)原理有效地解決授權(quán)用戶和認(rèn)知用戶之間的競(jìng)爭(zhēng)關(guān)系,使最終的調(diào)度方案達(dá)到納什均衡[6]。

Niyato等[7]對(duì)合作博弈方式和非合作博弈方式進(jìn)行了對(duì)比分析,對(duì)這2種博弈方式的應(yīng)用場(chǎng)合、優(yōu)缺點(diǎn)及構(gòu)架進(jìn)行了介紹,并給出了不同場(chǎng)合選擇博弈方式的依據(jù),為博弈論的進(jìn)一步應(yīng)用奠定了基礎(chǔ),但只停留在理論分析階段。Kim 等[8]提出了一種多主多從結(jié)構(gòu)的Stackelberg博弈理論,并從理論上論證了該方法通過(guò)多次迭代和反饋之后可以搜索到最優(yōu)的納什均衡,但復(fù)雜的反饋決策限制了應(yīng)用。Nguyen等[9]提出一種基于預(yù)測(cè)和感知的頻譜共享方法,該方法將資源塊的時(shí)間結(jié)構(gòu)分為頻譜預(yù)測(cè)、頻譜感知和數(shù)據(jù)傳輸,改善了部分性能但未在博弈理論進(jìn)一步研究。Zhu等[10]針對(duì)宏用戶提供更多訪問(wèn)頻譜的機(jī)會(huì),設(shè)計(jì)了一種激勵(lì)機(jī)制,該機(jī)制使用一種分層的動(dòng)態(tài)博弈框架,下層建立演化博弈模型,上層建立Stackelberg差分博弈模型,然而該分層博弈架構(gòu)將引入層間干擾問(wèn)題,但文中并未考慮。張婷等[11]設(shè)計(jì)演化博弈算子,建立分式規(guī)劃?rùn)C(jī)制的次用戶效用函數(shù),實(shí)現(xiàn)了能效最優(yōu)的資源分配,但該方法僅考慮能效而未考慮如頻譜利用率等問(wèn)題。Vidal等[12]基于博弈論研究在不干擾主用戶的條件下讓次用戶使用頻譜,而該方法提高的頻譜利用率有限。Yang等[13]基于Stackelberg博弈調(diào)整使資源分配最大化效用,降低能耗,該方法在其他資源分配模型中有待進(jìn)一步驗(yàn)證。Al-Talabani等[14]研究基于Stackelberg博弈讓主網(wǎng)絡(luò)和次節(jié)點(diǎn)共享頻譜資源,并加入噪聲提高認(rèn)知無(wú)線電網(wǎng)絡(luò)傳輸保密性。韓松等[15]考慮主用戶二次邊際成本,設(shè)計(jì)主用戶反饋機(jī)制和次用戶信任機(jī)制,以最大化效用和提高頻譜利用率,其考慮的主次用戶效用函數(shù)較為簡(jiǎn)單。博弈和非博弈集中調(diào)度最主要的差異是博弈集中調(diào)度的認(rèn)知用戶和授權(quán)用戶的博弈結(jié)果會(huì)相互影響,從而不斷在博弈策略中選擇較優(yōu)的博弈結(jié)果,非博弈集中調(diào)度取決于具體的調(diào)度參與者,一般不會(huì)相互影響。

本文考慮用戶的公平度,給出了反映認(rèn)知用戶頻譜需求的效益函數(shù),引入了雙目標(biāo)鯨魚(yú)優(yōu)化算法(WOA,whale optimization algorithm),實(shí)現(xiàn)公平有效的頻譜分配。本文的貢獻(xiàn)如下:1)基于Stackelberg博弈引入雙目標(biāo)WOA,將授權(quán)用戶和認(rèn)知用戶共同的收益優(yōu)化分為各自的收益優(yōu)化過(guò)程,設(shè)計(jì)出一種新的基于Stackelberg博弈的頻譜共享調(diào)度算法;2)通過(guò)加入影響認(rèn)知用戶公平分配頻譜的函數(shù)到認(rèn)知用戶收益的優(yōu)化模型中,能實(shí)現(xiàn)認(rèn)知用戶較為公平的頻譜分配,最終得到授權(quán)用戶和認(rèn)知用戶的最優(yōu)頻譜分配結(jié)果。

本文首先描述雙目標(biāo)WOA;然后建立頻譜共享博弈模型,提出了雙目標(biāo)WOA頻譜共享算法,并介紹了算法的實(shí)現(xiàn)步驟和流程;最后對(duì)本文算法進(jìn)行仿真驗(yàn)證,分析了算法復(fù)雜度、仿真時(shí)間、系統(tǒng)效用方面等性能。

2 雙目標(biāo)WOA

傳統(tǒng)的WOA[16]主要針對(duì)單一目標(biāo)的獵捕,當(dāng)考慮2個(gè)目標(biāo)獵物時(shí),主要會(huì)涉及以下關(guān)鍵因素。

1)每個(gè)“獵物群”的“獵物”數(shù)量。如果2個(gè)“獵物群”中的“獵物”個(gè)體數(shù)量差異比較大,“獵物”個(gè)體是否優(yōu)先考慮大“獵物群”,以滿足“獵物”個(gè)體最后的“捕食”需求。

2)距離2個(gè)獵物群中心位置的距離。如果“獵物”個(gè)體與小數(shù)量獵物群的距離遠(yuǎn)小于與大數(shù)量獵物群的距離,是否先考慮捕食小“獵物群”,進(jìn)而圍捕大“獵物群”。

3)約束條件。在何種情況下會(huì)形成雙目標(biāo)捕食環(huán)境等。

2.1 初始條件

針對(duì)初始鯨魚(yú)群個(gè)體環(huán)繞數(shù)量,設(shè)置個(gè)體數(shù)量浮動(dòng)因子F,群族個(gè)體數(shù)量Q,環(huán)繞“獵物”(“獵物1”和“獵物2”)的初始個(gè)體數(shù)量表示為

其中,rand()表示(0,1)之間的隨機(jī)量,Q1與Q2分別表示“獵物1”與“獵物2”初始環(huán)繞的捕獵者數(shù)量,F(xiàn)表示(0,1)之間的變量。

2.2 距離與權(quán)重

距離是優(yōu)先考慮的因素,當(dāng)距離優(yōu)勢(shì)足夠明顯時(shí),即d1>2d2,則不考慮其他因素的影響直接追擊“獵物2”,反之亦然,其中d1和d2表示捕獵者分別與“獵物1”“獵物2”的距離。當(dāng)距離優(yōu)勢(shì)不夠明顯時(shí),則需要考慮目標(biāo)對(duì)于個(gè)體的最要性來(lái)決定下一時(shí)刻的追擊目標(biāo),可得式(3)。

其中,μi表示獵物個(gè)體在整個(gè)獵物群體中的權(quán)值,i=1,2,…,N。當(dāng)同時(shí)考慮距離與權(quán)重時(shí),則每個(gè)個(gè)體在更新位置前需要做出式(4)所示的判斷。

其中,K表示影響目標(biāo)選擇的個(gè)數(shù);αk表示各影響因素之間的比重;βk為對(duì)應(yīng)因素的權(quán)值;n表示該時(shí)刻捕獵的目標(biāo),以對(duì)下一時(shí)刻的位置進(jìn)行更新。

2.3 收斂速度與精度

在鯨魚(yú)螺旋捕食階段[16],根據(jù)式(5)進(jìn)行優(yōu)化。

其中,X(t+1)為捕獵者的位置向量;t為迭代參數(shù);D′為捕獵者與獵物的距離向量;l為 0~1的隨機(jī)變量;b為常量;X*(t)為每次迭代捕獵者的局部最優(yōu)位置向量;γ為更新權(quán)值,如式(6)所示。

其中,γmin表示最小權(quán)值,取值為0.05;γmax表示最大權(quán)值,取值為0.95;f(x)表示修正函數(shù),如式(7)所示。

其中,μ表示xi的均值。

2.4 停止條件

選擇狩獵目標(biāo)數(shù)量比和單目標(biāo)權(quán)重比的關(guān)系為停止條件,對(duì)收斂速率和收斂精度都有一定影響。當(dāng)滿足式(8)時(shí),停止對(duì)于狩獵目標(biāo)的選擇,以前一時(shí)刻的目標(biāo)為基準(zhǔn),直至完成狩獵目標(biāo)的捕獲。

其中,Q1(t)和Q2(t)分別表示t次迭代時(shí),環(huán)繞“獵物1”與“獵物2”鯨魚(yú)的數(shù)量。

3 頻譜共享博弈模型

當(dāng)分布式天線系統(tǒng)(DAS,distributed antenna system)和集中式天線系統(tǒng)(CAS,centralized antenna system)通信過(guò)程產(chǎn)生相同的吞吐量時(shí),CAS需要更大的發(fā)送功率。當(dāng)DAS和CAS以相同的發(fā)送功率進(jìn)行通信的時(shí)候,DAS具有更高的吞吐量[17]。

DAS和CAS能量效率和頻譜效率的關(guān)系如圖1所示。從圖1可知,CAS和DAS在頻率效率小于2 bit/(s.Hz)時(shí),隨著頻率效率的增加,兩者的能量效率均增加。當(dāng)頻率效率大于2 bit/(s.Hz)時(shí),兩者的能量效率逐漸降低并趨于平穩(wěn)。由于其天線距離用戶較遠(yuǎn),CAS的大尺度衰落現(xiàn)象較為嚴(yán)重,因此能量效率較低。由于DAS的天線隨機(jī)分布在小區(qū)的不同位置,天線距離用戶較近,因此大尺度衰落現(xiàn)象較輕,能量效率較高。由圖1還可知,DAS的理論最小值的能量效率也大于CAS,因此本文在DAS的基礎(chǔ)上進(jìn)行研究。

圖1 DAS與CAS能量效率與頻譜效率關(guān)系

本文頻譜共享的認(rèn)知無(wú)線電系統(tǒng)如圖2所示。假設(shè)系統(tǒng)有M個(gè)授權(quán)用戶,一個(gè)基站及N個(gè)隨機(jī)分布的天線,其中,N個(gè)天線只用于數(shù)據(jù)信號(hào)的發(fā)送和接收。所有授權(quán)用戶將閑置的頻譜資源整合為一個(gè)共享池,并出售頻譜資源給認(rèn)知用戶,從而獲得收益。認(rèn)知用戶通過(guò)購(gòu)買共享池的頻譜資源來(lái)實(shí)現(xiàn)信號(hào)發(fā)送和接收?;驹谡麄€(gè)交易環(huán)節(jié)作為“中間人”,協(xié)調(diào)授權(quán)用戶和認(rèn)知用戶間的交易。

圖2 網(wǎng)絡(luò)頻譜共享系統(tǒng)

3.1 認(rèn)知用戶的收益建模

假設(shè)授權(quán)用戶的價(jià)格策略為P*,認(rèn)知用戶購(gòu)買的帶寬b*,引入式(9)所示的認(rèn)知用戶收益函數(shù)[18]。

其中,U(b)為認(rèn)知用戶的收益;b=[b1,...,bi,...,bM]表示M個(gè)授權(quán)用戶給基站的帶寬向量;表示認(rèn)知用戶的頻譜利用率;ωi表示認(rèn)知用戶所擁有的單位傳輸速率下所帶來(lái)的收益;Pi表示授權(quán)用戶i的頻譜價(jià)格;b′j表示認(rèn)知用戶j的實(shí)際頻譜需求;f(·)表示實(shí)際的頻譜需求函數(shù),其作用是當(dāng)實(shí)際的網(wǎng)絡(luò)頻譜需求改變時(shí),認(rèn)知用戶收益也會(huì)改變,所得的均衡點(diǎn)也會(huì)發(fā)生改變[19-20],從而使認(rèn)知用戶收益更符合實(shí)際頻譜需求情況。

假設(shè)xij表示天線j的頻譜資源是否分配給用戶i,如果是,則xij=1,否則xij=0。那么認(rèn)知用戶的收益目標(biāo)函數(shù)為

其中,Uj表示認(rèn)知用戶的收益函數(shù),即式(9)的認(rèn)知用戶收益函數(shù)。如果某個(gè)用戶i被分配天線j,那么將產(chǎn)生一個(gè)收益Uj。然后通過(guò)式(10)計(jì)算得到所有認(rèn)知用戶的整體收益值。

3.2 授權(quán)用戶的收益建模

單個(gè)授權(quán)用戶的收益函數(shù)為[21]

其中,Mi表示授權(quán)用戶的連接數(shù)量;c1表示授權(quán)用戶收益權(quán)值;c2表示授權(quán)用戶損失權(quán)值;表示授權(quán)用戶系統(tǒng)連接者需求帶寬;表示授權(quán)用戶的頻譜利用率;Wi表示授權(quán)用戶擁有的閑置頻譜資源。

當(dāng)存在多個(gè)授權(quán)用戶時(shí),授權(quán)用戶的收益函數(shù)將有所不同。在Stackelberg博弈中,假設(shè)授權(quán)用戶A的頻譜資源價(jià)格為pA,授權(quán)用戶B觀測(cè)到A的價(jià)格后,考慮自身的利益,選擇價(jià)格pB。在整個(gè)過(guò)程中,A先有價(jià)格,B根據(jù)A的價(jià)格選擇價(jià)格,而A無(wú)法預(yù)先獲得B的價(jià)格。B的策略定義為SB:QA→QB,其中,QA=(0,∞)表示A的價(jià)格區(qū)間,QB=(0,∞)表示B的價(jià)格區(qū)間。因此,其價(jià)格向量可以表示為(pA,SB(pA))。同理,對(duì)于授權(quán)用戶C,其價(jià)格向量表示為(pA,pB,SC(pA,pB)),其中,pB=SB(pA)。在Stackelberg博弈中,本文以2個(gè)授權(quán)用戶為例,則授權(quán)用戶收益函數(shù)為[21]

那么授權(quán)用戶的收益目標(biāo)函數(shù)為

其中,Пi(P)為授權(quán)用戶的收益函數(shù),即式(12)的授權(quán)用戶收益函數(shù)。如果天線j的頻譜資源被出售,那么對(duì)授權(quán)用戶將產(chǎn)生一個(gè)收益Пi。通過(guò)式(13)計(jì)算得到所有授權(quán)用戶的整體收益值。

3.3 認(rèn)知用戶公平度建模

頻譜分配的公平度目標(biāo)函數(shù)如式(14)所示。

其中,ξ表示一個(gè)較小值,一般取0.000 01,以避免出現(xiàn)值為0的情況。

假設(shè)某一天線的閑置頻譜資源較多,其他天線閑置頻譜資源較少,若大多數(shù)用戶都去搶占該天線資源,將會(huì)導(dǎo)致認(rèn)知用戶的個(gè)體收益下降,而采用頻譜分配的公平度目標(biāo)函數(shù)后,認(rèn)知用戶則選擇不同的天線來(lái)均衡地購(gòu)買頻譜資源。

3.4 系統(tǒng)效用的建模

認(rèn)知用戶和授權(quán)用戶的整體收益反映系統(tǒng)效用,設(shè)認(rèn)知用戶和授權(quán)用戶收益歸一化值分別為y1和y2,系統(tǒng)效用函數(shù)為

其中,λ1和λ2表示加權(quán)值,均取值0.5。

3.5 雙目標(biāo)WOA頻譜共享算法

在Stackelberg博弈的基礎(chǔ)下,本文所采用雙目標(biāo)WOA頻譜共享算法的優(yōu)化模型如式(16)和式(17)所示。

其中,δ1、δ2和δ3表示權(quán)值,有δ1+δ2+δ3=1。如果頻譜分配結(jié)果偏向于認(rèn)知用戶收益,增大δ1;如果頻譜分配結(jié)果偏向于授權(quán)用戶收益,增大δ2;如果頻譜分配結(jié)果偏向于認(rèn)知用戶的公平度,則增大δ3的值。

在優(yōu)化模型中,為了避免出現(xiàn)不符合實(shí)際情況的最優(yōu)解,使頻譜分配更符合實(shí)際情況,設(shè)置了3個(gè)約束條件[17],如式(18)~式(20)所示。其中,式(18)表示所有認(rèn)知用戶的整體頻譜資源需求之和小于所有授權(quán)用戶的閑置頻譜資源;式(19)表示每一個(gè)用戶只使用某一個(gè)授權(quán)用戶的頻譜資源或者不使用任何授權(quán)用戶的頻譜資源;式(20)表示如果認(rèn)知用戶被分配某授權(quán)用戶的頻譜資源,那么xij={1},否則xij={0}。在該約束條件下的優(yōu)化結(jié)果中,優(yōu)化模型的結(jié)果將更符合實(shí)際頻譜需求。

3.6 算法步驟及流程

在雙目標(biāo)WOA頻譜共享算法中,需要優(yōu)化變量xij的值,所有的xij可組合成M×N維向量,將其轉(zhuǎn)換為一維向量記為

那么在雙目標(biāo)WOA頻譜共享算法中,只需要將待優(yōu)化變量[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]、式(16)和式(17)的優(yōu)化目標(biāo)加入算法進(jìn)行優(yōu)化即可。具體步驟如下。

Step1進(jìn)行參數(shù)初始化,隨機(jī)分配參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN],即在初始條件下,認(rèn)知用戶隨機(jī)分配頻譜資源。

Step2根據(jù)式(16)和式(17)計(jì)算初始參數(shù)下認(rèn)知用戶的優(yōu)化目標(biāo)和授權(quán)用戶的優(yōu)化目標(biāo)。

Step3開(kāi)始進(jìn)入雙目標(biāo)WOA優(yōu)化,結(jié)合第2節(jié),通過(guò)WOA的鯨魚(yú)行走覓食階段、鯨魚(yú)包圍階段和鯨魚(yú)螺旋捕食階段實(shí)現(xiàn)參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]的迭代更新,并同時(shí)計(jì)算對(duì)應(yīng)的優(yōu)化目標(biāo)函數(shù)值。

Step4將每次迭代計(jì)算得到的優(yōu)化目標(biāo)函數(shù)值和當(dāng)前迭代的最優(yōu)目標(biāo)函數(shù)值進(jìn)行對(duì)比,并獲得較優(yōu)的目標(biāo)函數(shù)值。

Step5重復(fù)上述步驟,直到完成所有的迭代計(jì)算,將最后迭代輸出的參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]作為最后的優(yōu)化結(jié)果,即頻譜分配結(jié)果。

雙目標(biāo)WOA頻譜共享算法流程如圖3所示。

圖3 雙目標(biāo)WOA頻譜共享算法流程

4 性能測(cè)試與分析

仿真實(shí)驗(yàn)參數(shù)如表1所示。本文算法將與基于Bertrand博弈算法和基于Stackelberg博弈算法進(jìn)行對(duì)比仿真,其中,基于Bertrand博弈算法無(wú)法反映實(shí)際的頻譜需求,屬于靜態(tài)博弈;基于Stackelberg博弈算法可以反映實(shí)際的頻譜需求,屬于動(dòng)態(tài)博弈。通過(guò)與這2種博弈進(jìn)行對(duì)比,可討論不同博弈對(duì)仿真性能的影響。

表1 仿真實(shí)驗(yàn)參數(shù)

價(jià)格納什均衡點(diǎn)和頻譜請(qǐng)求帶寬納什均衡點(diǎn)的仿真結(jié)果如圖4和圖5所示,這2個(gè)均衡點(diǎn)是與性能相關(guān)的分技術(shù)指標(biāo)。由圖4可知,2個(gè)授權(quán)用戶的價(jià)格呈正向變動(dòng),這意味著當(dāng)一個(gè)授權(quán)用戶提高價(jià)格時(shí),另一個(gè)授權(quán)用戶也會(huì)提高價(jià)格,其反應(yīng)函數(shù)曲線呈y=x對(duì)稱形式。圖4中,P1和P2表示授權(quán)用戶1和授權(quán)用戶2的歸一化價(jià)格。由圖5可知,2個(gè)認(rèn)知用戶的頻譜請(qǐng)求帶寬與授權(quán)用戶價(jià)格呈反比,即授權(quán)用戶價(jià)格越低,請(qǐng)求帶寬越高。認(rèn)知用戶的請(qǐng)求帶寬提高會(huì)降低授權(quán)用戶的頻譜價(jià)格,間接提高授權(quán)用戶出租的頻譜資源,從而提高認(rèn)知用戶和授權(quán)用戶的收益,進(jìn)一步提高系統(tǒng)效用,而系統(tǒng)效用的提升也意味著通信系統(tǒng)的吞吐率的提升。由圖4和圖5可知,基于Stackelberg博弈算法相對(duì)于基于Bertrand博弈算法,其頻譜價(jià)格有一定程度的降低,而認(rèn)知用戶的頻譜請(qǐng)求則較大幅度提升。而本文算法中,各授權(quán)用戶在參考其他授權(quán)用戶的價(jià)格后才給出價(jià)格,因此其最終的價(jià)格將低于基于Stackelberg博弈算法的博弈模型,而其對(duì)應(yīng)的認(rèn)知用戶頻譜請(qǐng)求則最大。

圖4 授權(quán)用戶的價(jià)格納什均衡點(diǎn)

最佳授權(quán)價(jià)格隨可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖6所示,最佳授權(quán)價(jià)格是與性能相關(guān)的分技術(shù)指標(biāo)。由圖6可知,隨著可出租的閑置頻譜資源的增加,為了讓更多的認(rèn)知用戶購(gòu)買頻譜資源,其最優(yōu)的授權(quán)價(jià)格逐漸減低。當(dāng)閑置頻譜資源增加到一定程度時(shí),為保證授權(quán)用戶的收益,其授權(quán)價(jià)格將趨于穩(wěn)定。其中,基于Bertrand博弈算法考慮的情況較為理想化,認(rèn)為博弈參與者最優(yōu)價(jià)格最大,從而使認(rèn)知用戶收益降低。基于Stackelberg博弈算法相對(duì)于基于Bertrand博弈算法更符合實(shí)際情況,能夠吸引更多的認(rèn)知用戶來(lái)購(gòu)買頻譜資源,因此得到的最優(yōu)授權(quán)價(jià)格低于基于Bertrand博弈算法的價(jià)格。本文算法采用了基于Stackelberg博弈算法,各個(gè)授權(quán)用戶在參考其他授權(quán)用戶的價(jià)格后才給出價(jià)格,最終的價(jià)格將低于基于Stackelberg博弈算法,因此具有最低的授權(quán)價(jià)格。3種算法的最終價(jià)格分別為5.95(本文算法)、6.36(基于Stackelberg博弈算法)、7.03(基于Bertrand博弈算法)。本文算法的最終價(jià)格為基于Bertrand博弈算法價(jià)格的84.64%,為基于Stackelberg博弈算法價(jià)格的93.55%。

圖6 授權(quán)頻譜最佳授權(quán)價(jià)格變化

授權(quán)用戶收益隨著可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖7所示,授權(quán)用戶收益是與性能相關(guān)的分技術(shù)指標(biāo)。由圖7可知,隨著可出租閑置頻譜資源的增加,授權(quán)用戶的收益逐漸增加,這是由于當(dāng)閑置頻譜資源逐漸增加,其售價(jià)不斷減低,從而吸引更多的認(rèn)知用戶購(gòu)買頻譜資源。當(dāng)閑置頻譜資源大于5的時(shí)候,隨著認(rèn)知用戶的頻譜需求逐漸得到滿足,授權(quán)用戶出售的頻譜價(jià)格逐漸趨于穩(wěn)定,系統(tǒng)的整體收益也逐漸平穩(wěn)。同理,由于基于Bertrand博弈算法假設(shè)博弈參與者的條件是完全相同的,在實(shí)際的系統(tǒng)中的最優(yōu)價(jià)格最大,導(dǎo)致參與購(gòu)買頻譜資源的認(rèn)知用戶較少,因此整體的收益最低。基于Stackelberg博弈算法的頻譜價(jià)格小于基于Bertrand博弈算法,因此整體收益更高。本文算法采用了基于Stackelberg博弈,價(jià)格最低,參與購(gòu)買的用戶數(shù)量也最多,因此整體收益也最大。3種算法對(duì)應(yīng)的授權(quán)用戶的最終收益分別為455(本文算法)、364(基于Bertrand博弈算法)、418(基于Stackelberg博弈算法)。本文算法授權(quán)用戶的收益相對(duì)于Bertrand博弈算法價(jià)格提升了25%,相對(duì)于基于Stackelberg博弈算法價(jià)格提升了8.85%。

認(rèn)知用戶收益隨著可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖8所示,認(rèn)知用戶收益是與性能相關(guān)的分技術(shù)指標(biāo)。由圖8可知,隨著可出租的閑置頻譜資源的增加,認(rèn)知用戶的收益逐漸增加,由于頻譜資源價(jià)格的不斷降低,對(duì)于購(gòu)買者認(rèn)知用戶來(lái)講,其收益逐漸增加,當(dāng)閑置資源數(shù)量大于20時(shí),絕大多數(shù)認(rèn)知用戶的頻譜需求得到了滿足,授權(quán)用戶出售的頻譜價(jià)格也趨于穩(wěn)定,因此其收益保持不變。由于基于Bertrand博弈算法假設(shè)博弈參與者的條件是完全相同的,因此該算法應(yīng)用到實(shí)際的系統(tǒng)中,其最優(yōu)價(jià)格最大,認(rèn)知用戶的收益自然也就最小。而基于Stackelberg博弈算法,其頻譜價(jià)格小于基于Bertrand博弈算法,認(rèn)知用戶的收益較高。而本文算法的價(jià)格最低,認(rèn)知用戶的收益也最大。3種算法對(duì)應(yīng)的認(rèn)知用戶的最終收益分別為2 789(本文算法)、2 563(基于Bertrand博弈算法)、2 307(基于Stackelberg博弈算法)。本文算法中認(rèn)知用戶的收益相對(duì)于基于Bertrand博弈算法價(jià)格提升了20.89%,相對(duì)于基于Stackelberg博弈算法價(jià)格提升了8.82%。

圖7 授權(quán)用戶收益

圖8 認(rèn)知用戶收益

系統(tǒng)效用是系統(tǒng)的技術(shù)指標(biāo),系統(tǒng)效用隨用戶數(shù)量的變化情況如圖9所示。由圖9可見(jiàn),隨著用戶數(shù)量的逐漸增加,不同博弈模型下的系統(tǒng)效用均逐漸增加。若都不考慮認(rèn)知用戶公平度,基于Bertrand博弈算法及基于Stackelberg博弈算法的系統(tǒng)效用均比本文算法低,這是由于仿生智能算法具有強(qiáng)并行計(jì)算能力,經(jīng)過(guò)復(fù)雜的迭代優(yōu)化獲得了較優(yōu)授權(quán)用戶受益和認(rèn)知用戶受益,因此其系統(tǒng)效用將會(huì)更高。

圖9 系統(tǒng)效用

圖10給出了不同公平加權(quán)系數(shù)δ3對(duì)算法性能的影響,分別設(shè)置δ3=0.9、δ3=0.5、δ3=0.1。公平度是通信性能的技術(shù)指標(biāo),它和通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率是相互矛盾的,如果公平度越高,通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率將會(huì)越低,如果公平度越低,通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率將會(huì)越高。由圖10可知,對(duì)比3種算法的系統(tǒng)效用,當(dāng)公平度加權(quán)系數(shù)較小的時(shí)候,頻譜資源分配受認(rèn)知用戶信道質(zhì)量影響較小,本文算法可以獲得更高的系統(tǒng)效用,而當(dāng)公平度加權(quán)系數(shù)較大的時(shí)候,由于算法過(guò)于強(qiáng)調(diào)公平度,信道較差的認(rèn)知用戶也能獲得較多頻譜資源,反而影響了最終的系統(tǒng)效用。因此,在實(shí)際中,需要根據(jù)用戶的實(shí)際需求來(lái)設(shè)置加權(quán)系數(shù)。

圖10 不同公平加權(quán)系數(shù)δ3對(duì)系統(tǒng)效用的影響

圖11給出了對(duì)200個(gè)用戶使用3種對(duì)比算法其對(duì)應(yīng)的公平度指標(biāo),此時(shí)由圖11可知,由于本文算法在頻譜分配過(guò)程中,考慮了頻譜分配公平度指標(biāo),因此進(jìn)行頻譜分配時(shí)具有最高的公平度,平均達(dá)到了86.8%。而基于Stackelberg博弈算法雖然考慮了實(shí)際博弈過(guò)程的特點(diǎn),但是由于沒(méi)有涉及公平度的因素,其最終分配結(jié)果所計(jì)算得到的公平度只有71.3%。基于Bertrand博弈算法假設(shè)了各個(gè)博弈參與者完全相同的條件,因此在實(shí)際中,無(wú)法獲得較好的頻譜分配結(jié)果,其公平度只有59.2%。

圖11 系統(tǒng)公平度指標(biāo)對(duì)比

圖12給出了3種對(duì)比算法對(duì)應(yīng)的仿真時(shí)間,其是與通信相關(guān)的分技術(shù)指標(biāo),對(duì)認(rèn)知用戶數(shù)量從10逐漸遞增到200的仿真時(shí)間進(jìn)行對(duì)比。由圖12可知,本文算法的仿真時(shí)間最長(zhǎng),因?yàn)橥ㄟ^(guò)雙目標(biāo)WOA優(yōu)化需要迭代,這會(huì)增加算法的復(fù)雜度。而基于Bertrand博弈算法的實(shí)現(xiàn)復(fù)雜度最小,因此其仿真時(shí)間最短。

圖12 算法仿真時(shí)間對(duì)比

通過(guò)以上分析,在考慮公平度的情況下,本文算法的復(fù)雜度和仿真時(shí)間雖然不占優(yōu)勢(shì),但其他性能優(yōu)勢(shì)明顯,故本文算法在整體上有較為明顯的性能優(yōu)勢(shì)。

5 結(jié)束語(yǔ)

通過(guò)分析WOA的特點(diǎn)及應(yīng)用對(duì)象,提出了一種雙目標(biāo)WOA頻譜共享算法,并給出了算法步驟和流程。本文基于Stackelberg博弈,引入強(qiáng)并行計(jì)算能力的雙目標(biāo)WOA,加入影響認(rèn)知用戶公平分配的函數(shù),建立基于Stackelberg博弈的雙目標(biāo)WOA頻譜共享算法。仿真結(jié)果符合預(yù)期目標(biāo),在算法復(fù)雜度、仿真時(shí)間和系統(tǒng)效用方面性能雖稍占劣勢(shì),但其他性能均取得較好結(jié)果,因此,所提方法在博弈論的頻譜共享中有一定探索價(jià)值。

猜你喜歡
獵物頻譜公平
不公平
公平對(duì)抗
蟒蛇為什么不會(huì)被獵物噎死
怎樣才公平
一種用于深空探測(cè)的Chirp變換頻譜分析儀設(shè)計(jì)與實(shí)現(xiàn)
可怕的殺手角鼻龍
一種基于稀疏度估計(jì)的自適應(yīng)壓縮頻譜感知算法
公平比較
霸王龍的第一只大型獵物
你是創(chuàng)業(yè)圈的獵人還是獵物
长垣县| 民权县| 珠海市| 稻城县| 临朐县| 云林县| 电白县| 东海县| 茂名市| 长武县| 尚义县| 林州市| 巴南区| 化州市| 江孜县| 温宿县| 海晏县| 延长县| 唐河县| 绥滨县| 湾仔区| 安顺市| 三原县| 清丰县| 龙海市| 张家川| 襄城县| 吴旗县| 济阳县| 荔波县| 桦南县| 革吉县| 东海县| 巴塘县| 穆棱市| 拉萨市| 双城市| 句容市| 曲周县| 景泰县| 丰原市|