張秘
【摘要】 博弈論(Game theory)是一種依靠嚴謹?shù)臄?shù)學模型,來解決現(xiàn)實世界中決策主體之間相互利益競爭的工具。博弈的目的,就是為了尋求一個能實現(xiàn)整體最優(yōu)的最佳策略組合(即所謂的納什均衡),從而使每個參與者的策略都是對其他參與者策略的最優(yōu)反應。論文分析了一種基于代價函數(shù)的動態(tài)頻譜接入方法,主要考慮了認知無線電場景中多個次用戶欲共享授權(quán)用戶的頻譜時的問題,該問題可視為壟斷的市場競爭的問題,論文建立了相應的博弈模型以尋求次用戶的最優(yōu)頻譜分配結(jié)果,即納什均衡。
【關鍵詞】 無線電 博弈論 納什均衡
一、博弈論的概述
1.1概念
博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題的理論[20]。也就是說,博弈論研究當一個主體,譬如說一個人或一個企業(yè)的選擇受到其他人(其他企業(yè))的選擇的影響,而且反過來影響到其他人(其他企業(yè))選擇時的決策問題和均衡問題。所以在這個意義上說,博弈論又稱為“對策論”。博弈論是一種使用嚴謹數(shù)學模型來解決現(xiàn)實中利害沖突的理論,由于沖突、合作、競爭等行為是現(xiàn)實中常見的現(xiàn)象,因此很多領域都能應用博弈論,如軍事領域、經(jīng)濟領域、政治外交等。
1.2博弈論模型簡介
博弈論自產(chǎn)生到發(fā)展至今已形成了較成熟的理論體系,它并不是經(jīng)濟學的一個分支,它是一種方法,應用范圍不僅包括經(jīng)濟學,政治學、軍事、外交、國際關系、公共選擇,還有犯罪學等都涉及到博弈論。不過博弈論也具有自身的基本模型,可以對一個博弈過程用5個方面來描述,G={P,A,O,I,U}
① P(player):博弈的參與方。
② A(action):博弈方可選擇的全部行為或策略的集合
③ O(orders):博弈的次序。
④ I(information):博弈的信息。
⑤ U(utility):博弈方的收益。
以上五個方面是定義一個博弈時必須首先設定的,確定了上述五個方面就是確定了一個博弈。博弈論就是系統(tǒng)研究用上述方法定義的各種各樣的博弈問題,尋求各博弈方合理選擇策略的情況下博弈的解,也既是均衡。
1.3博弈論的分類
現(xiàn)實中各種博弈可以按照不同的辦法進行分類。根據(jù)參與人的多少,可以將博弈分為兩人博弈和多人博弈;根據(jù)參與人是否合作,可以將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可以將博弈分為零和博弈、常和博弈和變和博弈。
1.4納什均衡
1.4.1納什均衡的定義
納什均衡(Nash Equilibrium)[20]是一種策略組合,它能夠使得每個參與者的策略都是對其他參與者策略的最優(yōu)反應?!白顑?yōu)反應”指的是該策略帶給采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能帶來的利益。博弈的目的,就是為了尋求這樣的一個最佳的策略組合。
1.5 一些特殊的博弈模型
1.5.1重復博弈模型
重復博弈是目前人們了解的最為透徹的一類動態(tài)博弈,參與人每一期都面對同樣的“階段博弈”或“選民博弈”,而且參與人的全部收益是每階段所得收益的加權(quán)平均。參與者基于對博弈過程的認知,例如對過去行為的了解,對未來的預期和對當前情況的觀察,在每一個階段的博弈中選擇自身的策略。這些策略可以是固定的,也可以隨其它參與者行動的改變而變化,甚至可以是自適應的。
1.5.2潛在博弈模型
潛在博弈是一般形式博弈中的一種特殊類型,存在函數(shù)u:S→R當單方面的背離發(fā)生時,u的變化Δu將被反映到單方面背離博弈者的效用上。
二、在無線通信系統(tǒng)資源分配問題中應用博弈論的可行性分析
隨著無線通信系統(tǒng)的飛速發(fā)展,許多概念和技術與現(xiàn)有系統(tǒng)相比都有很大的變化。通信系統(tǒng)將具有智能的資源管理,采用大量動態(tài)的、分布式的、自適應式的資源管理方式。
三、基于博弈論的動態(tài)頻譜接入方法
如何利用博弈論方法對認知無線電技術的研究進行分析,其中的關鍵是如何將博弈論引入到相應算法的設計和分析中,找到算法的納什均衡點。在開始具體的算法研究之前,需要將所研究的問題抽象成博弈論問題模型。
3.1 分布式自適應頻譜接入方法
博弈論模型適用于分析認知無線電系統(tǒng)各用戶競爭頻譜的分布式行為,各用戶根據(jù)自己獲得的信息單獨進行決策。
3.2基于代價函數(shù)的動態(tài)頻譜接入方法
由于非合作的關系導致每個用戶都致力于通過選擇合適的頻譜傳輸以實現(xiàn)自身效用函數(shù)的最大化,但是卻忽視了對系統(tǒng)中其它用戶產(chǎn)生的干擾,以及對主用戶的干擾,這種終端用戶的個人利益最大化的行為將嚴重影響到系統(tǒng)的整體通信性能,因此需要引入代價機制[23]。引入了代價機制之后,不僅能給系統(tǒng)增加利潤,同時也能敦促系統(tǒng)中的用戶合理利用資源。價格函數(shù)反應了用戶使用網(wǎng)絡資源所要付出的代價(cost),同時也是通信服務供應商的實際需求。