鄭紅燕,馮延蓬,仵 博,2,孟憲軍
(1.深圳職業(yè)技術(shù)學(xué)院 教育技術(shù)與信息中心,廣東 深圳518055;2.中南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙410083)
頻譜資源匱乏、利用率低的問題已成為制約無線通信發(fā)展的主要因素之一,具有無線環(huán)境認(rèn)知能力、動(dòng)態(tài)頻譜管理能力、重配置能力的新一代認(rèn)知無線電 (cognitive radio,CR)技術(shù)[1],允許部分非授權(quán)用戶 (以下稱 “認(rèn)知用戶”)在不影響授權(quán)用戶 (primary user,PU)的前提下,機(jī)會(huì)式的利用空閑頻譜段進(jìn)行通信,為頻譜資源共享問題提供了一個(gè)全新的方向,得到國(guó)內(nèi)外學(xué)者的廣泛關(guān)注,成為通信領(lǐng)域研究的熱點(diǎn)[2,3]。頻譜感知是認(rèn)知無線電中實(shí)現(xiàn)動(dòng)態(tài)頻譜共享的前提和關(guān)鍵[4]。
目前針對(duì)MAC層的頻譜感知技術(shù)研究已經(jīng)趨于成熟,但針對(duì)頻譜感知機(jī)制的研究卻相對(duì)較少。在文獻(xiàn) [5]中,提出隨機(jī)搜索、串行搜索機(jī)制、n-步串行搜索機(jī)制,并指出相鄰的信道之間在頻譜占用規(guī)律上具有相關(guān)性,采用n-步串行搜索機(jī)制可以減少平均檢測(cè)信道個(gè)數(shù),同時(shí)保證信道檢測(cè)的性能,但未考慮認(rèn)知用戶在被迫中斷后需檢測(cè)時(shí)的搜索策略。文獻(xiàn) [6]提出一種停止規(guī)則 (stopping rule),將信道感知和接入判決問題轉(zhuǎn)化為獲取最大吞吐量的最優(yōu)求解問題。文獻(xiàn) [7]引入部分可觀察馬爾可夫決策過程 (partially observable Markov decision process,POMDP)對(duì)認(rèn)知無線電信道感知策略進(jìn)行建模,按照信道空閑概率進(jìn)行排序,求取最優(yōu)感知信道,但由于POMDP中的狀態(tài)信念空間求解是一個(gè)維數(shù)災(zāi)問題,難以滿足認(rèn)知用戶信道搜索的實(shí)時(shí)性要求。
本文基于多認(rèn)知用戶集中式協(xié)作感知思想,提出一種帶緩沖區(qū)的雙周期n步串行協(xié)作感知機(jī)制。該機(jī)制利用多認(rèn)知用戶分時(shí)、分段協(xié)作感知,建立空閑信道頻譜池,既減小單用戶頻譜感知與數(shù)據(jù)傳輸時(shí)間占比,又縮短中斷后信道切換時(shí)間。此外,還建立離散馬爾可夫信道感知參數(shù)優(yōu)化模型,通過量化分析感知模式、感知周期、信道分段數(shù)與感知性能的關(guān)系,建立信道轉(zhuǎn)移概率和報(bào)酬函數(shù)模型,并利用值迭代算法求解最優(yōu)感知參數(shù),在保證頻譜感知效率的同時(shí),減小認(rèn)知用戶的被迫中斷時(shí)間。
認(rèn)知無線網(wǎng)絡(luò)按系統(tǒng)架構(gòu)可以劃分為集中式和分布式[8],其中,集中式網(wǎng)絡(luò)架構(gòu)是由一個(gè)或多個(gè)集中的實(shí)體協(xié)調(diào)頻譜資源,稱為認(rèn)知基站 (或稱頻譜管理單元),如IEEE802.22系統(tǒng);分布式網(wǎng)絡(luò)架構(gòu)頻譜資源管理則依靠點(diǎn)到點(diǎn)的連接分布在各個(gè)認(rèn)知無線終端上,如Cognet系統(tǒng),但隨著終端數(shù)量的增加,它們之間的連接數(shù)目會(huì)呈指數(shù)增長(zhǎng),通信和管理成本較高。因此,本文針對(duì)集中式認(rèn)知無線網(wǎng)絡(luò)的信道共享技術(shù)展開研究,網(wǎng)絡(luò)模型如圖1所示。
圖1 集中式信道共享認(rèn)知無線網(wǎng)絡(luò)模型
假設(shè)認(rèn)知無線網(wǎng)絡(luò)中存在P個(gè)授權(quán)用戶、M個(gè)認(rèn)知用戶和N個(gè)信道,存在一個(gè)具有較高運(yùn)算能力認(rèn)知基站,該基站通過一個(gè)全局公共控制信道來收集認(rèn)知用戶信道感知信息,建立和維護(hù)動(dòng)態(tài)頻譜池,并對(duì)認(rèn)知用戶的信道感知參數(shù)進(jìn)行分配,包括按何種順序、對(duì)哪些信道開始搜索、優(yōu)化信道感知周期等,目的在于提高認(rèn)知用戶的感知準(zhǔn)確度和信道利用率。
在每個(gè)時(shí)隙,每個(gè)信道有Busy和Free兩種狀態(tài),Busy表示信道被占用,F(xiàn)ree則表示信道空閑。空閑信道允許認(rèn)知用戶采用Overlay的方式機(jī)會(huì)式接入,并假設(shè)每個(gè)認(rèn)知用戶每個(gè)時(shí)隙只能占用一個(gè)信道。
在認(rèn)知無線電技術(shù)的實(shí)際應(yīng)用環(huán)境中,認(rèn)知用戶受自身硬件成本、感知能力等的限制[9],使得單一認(rèn)知用戶感知范圍、感知精度有限;認(rèn)知用戶通信信道被授權(quán)用戶搶占時(shí),認(rèn)知用戶被迫重新搜索新的空閑信道 (稱之為按需搜索),需重新進(jìn)行多信道搜索,感知時(shí)間較長(zhǎng),會(huì)大大影響認(rèn)知用戶通信QoS。針對(duì)以上問題,本文基于鏈路層的多認(rèn)知用戶集中式協(xié)作感知思想,提出一種帶頻譜池的n-步串行 協(xié) 作 搜 索 機(jī) 制 (n-step serial search with spectrum pool,n-SSSP),通過多認(rèn)知用戶分時(shí)、分段協(xié)作,有效減小單用戶頻譜感知與數(shù)據(jù)傳輸時(shí)間比,提高頻譜感知效率。
由于相鄰信道間的信道占用規(guī)律具有一定相關(guān)性,認(rèn)知用戶在進(jìn)行信道感知時(shí),串行順序檢測(cè)可能遭遇連續(xù)的非空閑信道,增大頻譜感知時(shí)間。n-SSSP的基本思想如下:由基站將頻譜劃分為Nsection段,每段固定包含n個(gè)信道,n=?N/Nsection」。每個(gè)加入認(rèn)知網(wǎng)絡(luò)的認(rèn)知用戶,在首個(gè)感知周期內(nèi),主動(dòng)從認(rèn)知基站獲取一個(gè)隨機(jī)的起始信道號(hào)i,以n為步長(zhǎng)進(jìn)行搜索,直到遍歷每個(gè)信道段的第i信道。如果認(rèn)知用戶在該輪搜索中未感知到空閑信道,則重新從認(rèn)知基站獲取新的信道號(hào)i′,并以n為步長(zhǎng)對(duì)Nsection個(gè)信道段進(jìn)行新的遍歷,如此反復(fù),直到搜索到空閑信道為止。完成信道感知后,認(rèn)知用戶根據(jù)自身帶寬需求,在感知到的一個(gè)空閑信道中選擇一個(gè)合適信道接入,并把剩余感知到的空閑信道號(hào)上報(bào)給基站,基站將認(rèn)知用戶的感知信息進(jìn)行與操作,構(gòu)成頻譜池?;驹砣鐖D2所示。
圖2 n-步串行協(xié)作頻譜搜索機(jī)制
與傳統(tǒng)搜索機(jī)制不同,n-SSSP在認(rèn)知用戶搜索到空閑信道后,并不馬上停止,而是繼續(xù)完成所有Nsection段的信道遍歷,并將盈余的空閑信道信息上報(bào)基站,建立空閑頻譜池。頻譜池用來向被中斷的認(rèn)知用戶提供搜索的信道號(hào)。當(dāng)認(rèn)知用戶通信信道被授權(quán)用戶搶占時(shí),認(rèn)知用戶不再?gòu)幕倦S機(jī)獲取信道號(hào),而是通過認(rèn)知基站獲取頻譜池中的信道號(hào),由于頻譜池中的信道為感知后驗(yàn)證的空閑信道,因此被再次感知到是空閑信道的概率將大大提高,從而有效縮短認(rèn)知用戶通信被迫中斷后的頻譜感知時(shí)間。認(rèn)知用戶在獲得頻譜池中的信道號(hào)之后,再通過本地感知尋找可使用的空閑信道。
為保證頻譜池的時(shí)效性,并進(jìn)一步提高認(rèn)知用戶頻譜感知效率,減小頻譜感知與數(shù)據(jù)傳輸時(shí)間占比,在n-SSSP的基礎(chǔ)上提出一種雙周期感知策略,所謂雙周期,是指認(rèn)知基站為所有認(rèn)知用戶指定一個(gè)頻譜池更新周期T1,再將T1劃分為若干個(gè)相等的感知周期T2。如圖3所示。
圖3 雙周期機(jī)制
對(duì)于每個(gè)認(rèn)知用戶,無論通信是否被中斷,每隔T1時(shí)間,必須從基站獲取一個(gè)信道號(hào)i,并以n為步長(zhǎng)對(duì)每個(gè)信道段內(nèi)的第i個(gè)信道進(jìn)行感知,并將除自用外的剩余空閑信道信息上報(bào)給認(rèn)知基站,并由認(rèn)知基站對(duì)多認(rèn)知用戶感知信息進(jìn)行匯聚和融合,更新頻譜池,以備被中斷用戶使用,該過程稱為:共享式頻譜感知。
每個(gè)感知周期T1的首個(gè)感知周期T2即用來共享式頻譜感知,它完成包含本地檢測(cè)、與基站通信和數(shù)據(jù)傳輸3個(gè)部分,除首個(gè)感知周期外,其余感知周期在時(shí)間上與T2一致,正常情況下僅包含本地檢測(cè)和數(shù)據(jù)傳輸兩個(gè)部分,認(rèn)知用戶只需對(duì)自身接入的信道進(jìn)行感知,如果該信道仍為空閑狀態(tài),則繼續(xù)使用,無需與基站通信;如果信道被授權(quán)用戶占用,則觸發(fā)按需信道搜索,由認(rèn)知用戶從頻譜池中獲取一個(gè)空閑概率較高的信道進(jìn)行感知,以便快速回復(fù)通信。相比傳統(tǒng)周期性感知機(jī)制,無需每個(gè)周期都進(jìn)行多個(gè)信道的感知,特別是中斷后,能快速找到新的空閑信道,這樣認(rèn)知用戶用于感知信道的時(shí)間將大大縮短,為數(shù)據(jù)傳輸預(yù)留更多時(shí)間,可以提高感知效率,縮短響應(yīng)時(shí)間。
搜索步長(zhǎng)n以及頻譜池更新周期T1和感知周期T2的設(shè)定將直接影響到頻譜感知效率和頻譜池的時(shí)間有效性。因此,本文提出一種基于馬爾可夫決策過程 (Markov decision process,MDP)的n-SSSP感知參數(shù)優(yōu)化模型 (以下簡(jiǎn)稱為:MDP-SSSP),綜合考慮頻譜感知效率、用戶被中斷時(shí)間兩要素構(gòu)建報(bào)酬函數(shù),并通過值迭代算法求取搜索步長(zhǎng)和感知周期的最優(yōu)解。
MDP模型是在給定當(dāng)前知識(shí)和信息的情況下,預(yù)測(cè)和決策未來,可以用一個(gè)四元組 <S,A,T,R> 表示[10]。其中,S表示狀態(tài)集,表示所有可能到達(dá)的狀態(tài);A表示動(dòng)作集,表示所有可能執(zhí)行的動(dòng)作;T:S×A→ ∏(S)為狀態(tài)轉(zhuǎn)移函數(shù),表示在狀態(tài)s下執(zhí)行a到達(dá)狀態(tài)s′的概率,記為T(s,a,s′);R:S×A→R表示策略評(píng)價(jià)函數(shù)。
(1)狀態(tài)集和動(dòng)作集定義
建立離散時(shí)間MDP模型,t表示當(dāng)前時(shí)刻,t′表示下一時(shí)刻,t′=t+ΔT,其中,ΔT即為認(rèn)知用戶感知周期,故:ΔT=T2。
設(shè)
其中,Np(t)和Ns(t)分別為系統(tǒng)在t時(shí)刻的授權(quán)用戶和認(rèn)知用戶的數(shù)量,則系統(tǒng)狀態(tài)集可表示為
動(dòng)作集包含系統(tǒng)待優(yōu)化的參數(shù),本文以搜索步長(zhǎng)和感知周期為優(yōu)化目標(biāo)。特別的,針對(duì)感知周期,選取頻譜池更新周期T1和感知周期T2均為優(yōu)化參數(shù),為降低模型求解難度,以T2基本時(shí)間單位,定義雙感知周期比τ(τ=T2/T1)為優(yōu)化目標(biāo)。則系統(tǒng)動(dòng)作集可表示為
(2)狀態(tài)轉(zhuǎn)移概率建模
狀態(tài)轉(zhuǎn)移函數(shù)表示信道狀態(tài)在相鄰兩個(gè)時(shí)間片上的變化,與系統(tǒng)業(yè)務(wù)模型緊密相關(guān),為了求取狀態(tài)轉(zhuǎn)移概率,對(duì)系統(tǒng)業(yè)務(wù)流進(jìn)行建模。
定理1 對(duì)系統(tǒng)中認(rèn)知用戶與授權(quán)用戶流量利用隨機(jī)過程進(jìn)行建模,假定授權(quán)用戶與認(rèn)知用戶的到達(dá)流量均滿足泊松隨機(jī)過程,其到達(dá)率分別為λp、λs;頻譜使用的持續(xù)時(shí)間滿足負(fù)指數(shù)分布,平均占用時(shí)間分別為:1/μp和1/μs,認(rèn)知用戶每次僅能夠接入一個(gè)空閑信道,且忽略一個(gè)時(shí)隙內(nèi)認(rèn)知用戶因?yàn)槭跈?quán)用戶的出現(xiàn)而讓出相應(yīng)信道的時(shí)間,則系統(tǒng)狀態(tài)轉(zhuǎn)移概率如下
證明:設(shè)NA∈{NPA,NSA}為授權(quán)用戶和認(rèn)知用戶的在間隔ΔT內(nèi)的到達(dá)數(shù),ND∈{NPD,NSD}為授權(quán)用戶和認(rèn)知用戶在間隔ΔT內(nèi)的離開數(shù)。PA(NPA)和PA(NSA)表示在間隔ΔT內(nèi)到達(dá)NPA和NSA個(gè)授權(quán)/認(rèn)知用戶的概率,PD(ND=m,k)表示在間隔ΔT內(nèi)從m 中離開k個(gè)授權(quán)/認(rèn)知用戶的概率。
根據(jù)系統(tǒng)業(yè)務(wù)模型可知授權(quán)用戶和認(rèn)知用戶到達(dá)率λp和λs,那么在間隔ΔT內(nèi),由泊松過程的狀態(tài)概率分布可知,到達(dá)NPA個(gè)授權(quán)用戶和NSA個(gè)認(rèn)知用戶的概率分別為
頻譜使用的持續(xù)時(shí)間滿足負(fù)指數(shù)分布,平均占用時(shí)間分別為:1/μp和1/μs,則從m中離開k個(gè)授權(quán)用戶和認(rèn)知用戶的概率[11]為
同樣有
將式(6)-式(10)代入式(4)可得
證畢。
(3)性能指標(biāo)及報(bào)酬函數(shù)建模
由圖2可知,在正常情況下,在首個(gè)感知周期T2內(nèi),認(rèn)知用戶需執(zhí)行進(jìn)行本地感知、上報(bào)基站和數(shù)據(jù)傳輸3個(gè)動(dòng)作,其余感知周期,只需檢測(cè)本占用信道和進(jìn)行數(shù)據(jù)傳輸,那么設(shè)認(rèn)知用戶對(duì)單位信道的本地感知花費(fèi)時(shí)間為Tsense,與基站通信花費(fèi)的時(shí)間為Ttransport,不考慮認(rèn)知用戶因被中斷觸發(fā)的按需感知時(shí)的感知效率,可以得出認(rèn)知用戶在非中斷時(shí)的感知效率為
式中:μ——認(rèn)知用戶首次感知到空閑信道所需要輪詢的圈數(shù),由授權(quán)用戶占用信道密度和分布決定,授權(quán)用戶占用信道密度越大,信道越繁忙,被檢測(cè)信道內(nèi)不包含空閑信道的概率越大,則認(rèn)知用戶首次感知到空閑信道所需的輪詢的圈數(shù)也就越大。
在用戶被中斷時(shí),直接從頻譜池獲取信道進(jìn)行感知,并進(jìn)行數(shù)據(jù)傳輸,仍然以一個(gè)感知周期作為一次中斷檢測(cè)評(píng)價(jià)單位,則認(rèn)知用戶在中斷時(shí)的感知效率為
式中:δ——認(rèn)知用戶中斷后重新感知到新的空閑信道所需要檢測(cè)的信道數(shù),與認(rèn)知被中斷概率、被中斷時(shí)間相關(guān),可通過離線訓(xùn)練獲取。
信道感知效率Ηsence可定義為認(rèn)知用戶在中斷和非中斷時(shí)感知效率的加權(quán)和
式中:α——加權(quán)因子,與認(rèn)知用戶被中斷概率相關(guān)。
除感知效率外,認(rèn)知用戶被迫中斷時(shí)間Τinterrupt與搜索步長(zhǎng)n和雙感知周期比τ也緊密相關(guān)。在相同的授權(quán)用戶到達(dá)率和檢測(cè)周期Τ2下,認(rèn)知用戶被迫中斷概率隨授權(quán)用戶到率的增大而增大,業(yè)務(wù)中斷后,利用頻譜池中預(yù)留空閑組建新的會(huì)話,頻譜池更新周期Τ1越小,則頻譜池中的信道空閑概率越高,認(rèn)知用戶在業(yè)務(wù)中斷后能越快搜索到新的空閑信道,即中斷時(shí)間Τinterrupt越小。
可以看出感知效率和被迫中斷時(shí)間是一對(duì)矛盾的性能指標(biāo),為保證認(rèn)知用戶有較高的感知效率Ηsence和較小的中斷時(shí)間Τinterrupt,設(shè)系統(tǒng)報(bào)酬函數(shù)如下
感知效率越高,業(yè)務(wù)被迫中斷時(shí)間越小,則系統(tǒng)報(bào)酬值越大,反之越小。其中β為被迫中斷時(shí)間權(quán)重調(diào)節(jié)因子,可以針對(duì)不同的認(rèn)知業(yè)務(wù)進(jìn)行調(diào)節(jié),如:對(duì)于QoS要求較高的語音業(yè)務(wù),則增大β取值,通過適量犧牲感知效率來獲得更低的業(yè)務(wù)被迫中斷時(shí)間Τinterrupt,反之,對(duì)于QoS要求較低的數(shù)據(jù)業(yè)務(wù),則可以減小β取值。
經(jīng)過對(duì)認(rèn)知網(wǎng)絡(luò)進(jìn)行MDP建模,認(rèn)知用戶頻譜感知周期優(yōu)化問題轉(zhuǎn)化為MDP報(bào)酬函數(shù)的最大化問題,報(bào)酬值越大,頻譜感知性能越好。本文采用值迭代算法[12]獲取MDP最大報(bào)酬值,具體描述見表1。其中,Vt(s)通過Bellman方程計(jì)算,代表模型在不同狀態(tài)的值函數(shù),γ為折扣因子;最優(yōu)策略π*t(s)是使折扣報(bào)酬值和的期望值最大時(shí)的動(dòng)作取值。
表1 MDP求解算法
本文從兩個(gè)角度評(píng)價(jià)帶頻譜池的雙周期n-步串行協(xié)作信道感知策略的有效性。首先,針對(duì)本文算法在不同搜索步長(zhǎng)n和雙感知周期比τ下的性能進(jìn)行仿真和縱向?qū)Ρ?,?yàn)證參數(shù)優(yōu)化前后對(duì)算法性能的影響;其次分別實(shí)現(xiàn)本文算法與隨機(jī)搜索、傳統(tǒng)串行搜索算法,在不同的授權(quán)用戶到達(dá)率λp下的性能指標(biāo)進(jìn)行橫向?qū)Ρ?,?yàn)證本文算法的有效性,仿真參數(shù)見表2。
利用Matlab搭建仿真實(shí)驗(yàn)平臺(tái),開展兩組實(shí)驗(yàn),每組實(shí)驗(yàn)分別重復(fù)10次求平均值,每次實(shí)驗(yàn)運(yùn)行30分鐘。
(1)為了對(duì)比n-SSSP和MDP-SSSP算法性能,并驗(yàn)證參數(shù)對(duì)(n,τ)與感知效率Ηsence和被迫中斷時(shí)間Τinterrupt之間的關(guān)系,首先,固定參數(shù)τ,倍數(shù)逐漸增大n抽?。╪,τ)=(1,3)、(2,3)、(4,3)、(8,3)、(16,3)5組參數(shù),然后,固定參數(shù)n,逐漸增大τ抽取 (n,τ)= (4,1)、(4,2)、(4,4)、(4,5)4組參數(shù)分別進(jìn)行實(shí)驗(yàn),將結(jié)果與MDP-SSSP進(jìn)行對(duì)比,結(jié)果如圖4 (a)、(b)所示。
表2 仿真環(huán)境參數(shù)
圖4 感知效率和中斷時(shí)間隨參數(shù)變化
就圖4(a)、(b)單獨(dú)而言,在τ保持不變時(shí),感知效率隨n的增大而減小,在n保持不變時(shí),感知效率隨τ的增大而增大;被迫中斷時(shí)間則與n和τ無明顯線性關(guān)系,但綜合兩個(gè)圖發(fā)現(xiàn),在實(shí)驗(yàn)抽?。╪,τ)參數(shù)對(duì)中,感知效率最優(yōu)時(shí),被迫中斷時(shí)間則很長(zhǎng),被迫中斷時(shí)間最優(yōu)時(shí),則感知效率偏低。而采用MDP-SSSP算法,兩項(xiàng)指標(biāo)參數(shù)雖然不是最優(yōu),但可以平衡各項(xiàng)指標(biāo),獲取最優(yōu)參數(shù),提高系統(tǒng)的整體性能。
(2)將 MDP-SSSP與隨機(jī)搜索 (random search,RS)、傳統(tǒng)串行搜索算法 (serial search,SS)比對(duì),認(rèn)知用戶被迫中斷概率、感知效率Ηsence和中斷時(shí)間Τinterrupt隨授權(quán)用戶到達(dá)率λp變化情況如圖5 (a)、(b)、(c)所示。
圖5 信道關(guān)鍵指標(biāo)隨授權(quán)用戶到達(dá)率變化
MDP-SSSP的平均感知效率為0.74,而RS和SS的平均感知效率分別為0.53和0.36,由于采用了 MDP建模和針對(duì)感知效率的求解算法,在感知效率上MDP-SSSP具有明顯優(yōu)勢(shì)。由于采用了雙周期搜索策略,MDP-SSSP的被中斷率和中斷時(shí)間都優(yōu)于RS和SS。RS和SS的平均被中斷率比較接近,MDP-SSSP的平均被中斷率為0.398,比RS和SS低20%。RS和SS的平均中斷時(shí)間分別為MDPSSSP的2倍和2.2倍,因此MDP-SSSP可以使認(rèn)知用戶在被授權(quán)用戶中斷后更快地找到可用信道。
由此可見,MDP-SSSP算法在感知效率Ηsence,被中斷概率和中斷時(shí)間Τinterrupt三項(xiàng)性能指標(biāo)上均優(yōu)于傳統(tǒng)頻譜感知機(jī)制,尤其是在授權(quán)用戶到達(dá)率較高,信道占用率提高的情況下,仍能保證在較高感知效率下,實(shí)現(xiàn)較低的中斷時(shí)間,從而有效保證了認(rèn)知用戶的通信質(zhì)量。
本文綜合考慮信道檢測(cè)效率和認(rèn)知用戶被迫中斷時(shí)間兩個(gè)因素,提出了帶頻譜池的n步串行信道搜索策略,在認(rèn)知用戶被迫中斷后,通過頻譜池中的先驗(yàn)信道感知信息,快速搜索到新的空閑信道,通過構(gòu)建離散馬爾可夫模型,求取參數(shù)最優(yōu)解,通過仿真實(shí)驗(yàn)驗(yàn)證,表明引入頻譜池和MDP優(yōu)化模型的MDP-SSSP策略相比隨機(jī)搜索和串行搜索,能顯著地提高信道感知效率,縮短認(rèn)知用戶被迫中斷時(shí)間。
[1]Mitola Joseph.The inventor of cognitive radio [J].Electronic Engineering Times,2005 (1):47-50.
[2]Srinivasa S,Jafar S A.The throughput potential of cognitive radio:A theoretical perspective [J].IEEE Communications Magazine,2007,45 (5):73-79.
[3]WEI Jibo,WANG Shan,ZHAO Haitao.Cognitive wireless networks:Key techniques and sate of the art [J].Journal on Communications,2011,32 (11):147-158 (in Chinese).[魏急波,王杉,趙海濤.認(rèn)知無線網(wǎng)絡(luò):關(guān)鍵技術(shù)與研究現(xiàn)狀[J].通信學(xué)報(bào),2011,32 (11):147-158.]
[4]Ghasemi A,Sousa E S.Spectrum sensing in cognitive radio networks:Requirements,challenges and design trade-offs [J].IEEE Communications Magazine,2008,46 (4):32-39.
[5]Ling Luo,Sumit Roy.Analysis of search schemes in cognitive radio [C]//San Diego:2nd IEEE Workshop on Networking Technologies for Software Define Radio Networks,2007:17-24.
[6]Jia J,Zhang Q,Shen X.HC_M(jìn)AC:A hardware-constrained cognitive MAC for efficient spectrum management [J].IEEE Journal on Selected Areas in Communications,2008,26(1):104-117.
[7]Jayakrishnan Unnikrishnan,Venugopal V Veeravalli.Algorithms for dynamic spectrum access with learning for cognitive radio [J].IEEE Transactions on Signal Processing,2010,58(2):750-760.
[8]MIAO Dan.Research on dynamic spectrum allocation technology in cognitive wireless network [D].Beijing:Beijing University of Posts and Telecommunications,2010:27-29 (in Chinese). [苗丹.認(rèn)知無線網(wǎng)絡(luò)中的動(dòng)態(tài)頻譜分配技術(shù)研究[D].北京:北京郵電大學(xué),2010:27-29.]
[9]Yunxia Chen,Qing Zhao,Ananthram Swami.Joint design and separation principle for opportunistic spectrum access in the presence of sensing errors [J].IEEE Transactions on Information Theory,2008,54 (5):2053-2071.
[10]Bhatnagar S,Abdulla M S.Simulation-based optimization algorithms for finite-h(huán)orizon Markov decision processes [J].Simulation,2008,84 (12):577-600.
[11]Xavier Gelabert,Oriol Sallent.Spectrum sharing in cognitive radio networks with imperfect sensing:A discrete-time Markov model[J].Computer Networks,2010,54 (14):2519-2536.
[12]Stevens-Navarro E,Yuxia Lin,Wong V W S.An MDP-based vertical handoff decision algorithm for heterogeneous wireless networks [J].IEEE Transactions on Vehicular Technology,2008,57 (2):1243-1254.