楊繼君,佘 廉
(1. 國家行政學院應急管理培訓中心,北京 100089;2. 廣西行政學院應急管理培訓部,廣西 南寧 530021)
?
面向多災點需求的應急資源調度博弈模型及優(yōu)化
楊繼君1,2,佘 廉1
(1. 國家行政學院應急管理培訓中心,北京 100089;2. 廣西行政學院應急管理培訓部,廣西 南寧 530021)
非常規(guī)突發(fā)事件爆發(fā)后經(jīng)常會造成多個災點,而各災點的需求往往是不同的,單獨的應急資源中心很難同時滿足這種要求,因此如何把多個應急資源中心所儲備的應急資源公平合理地調配到各個災點成為應急決策者亟待解決的現(xiàn)實問題。本文首先描述了各災點對應急資源需求變化的動態(tài)過程即按照應急資源需求信息的變化將整個應急資源調度過程劃分成若干階段,在此基礎上構建了基于多災點多階段的應急資源調度過程理論模型。隨后以博弈論為工具,在進行一系列模型假設和確定各災點災情的前提下,建立面向多災點需求的應急資源博弈調度模型,并采用改進的蟻群算法進行求解,實現(xiàn)對各災點以最小的“虛擬成本”進行所需應急資源的調度。最后的模型仿真測試和算例分析驗證了所建模型的有效性和可行性。該模型與算法也為商業(yè)物流中的資源配送提供了新的解決方案和實現(xiàn)途徑。
非常規(guī)突發(fā)事件;資源需求;調度博弈;改進蟻群算法
當非常規(guī)突發(fā)事件發(fā)生后,通常會造成多個受災點(后簡稱“災點”),這在5.12汶川大地震中就有明顯的體現(xiàn),此次地震中同時造成了汶川、北川、青川和綿竹等多個重災點。通常情況下,各災點的需求往往是不同的,同時隨著事態(tài)的不斷演化它們的需求也是不斷變化的,而且單獨的應急資源中心很難同時滿足這種要求,因此把多個應急資源中心所儲備的應急資源公平合理地調配到各個災點的研究更具有現(xiàn)實意義。
目前,國內外針對多災點的應急資源調配方法已展開了一些研究:Shetty與Gupta[1-2]通過建立多災點的非合作博弈模型探討應急資源公平合理調度問題,但是該模型是建立在完全信息基礎之上的,這與實際情況不符。Wang Susheng等[3]提出了通過各災點方案調整算法來解決多災點資源競爭的問題,但該算法對于多目標問題的求解呈現(xiàn)了一定的局限性。Rubel等[4]建立了基于Agent的多災點應急資源調配模型,以期解決應急資源調配過程中低效率問題,但在調配成本函數(shù)的構建中僅考慮距離和時間兩個因素而忽略災情的嚴重程度是其主要不足。王蘇生等[5]以雙層決策方法建立基于公平優(yōu)先原則的多災點應急資源配置模型及其算法,使應急資源配置過程兼顧及時性和公平性,但該研究把成本最小化作為優(yōu)化目標與應急管理中的弱經(jīng)濟性明顯有出入。楊勃等[6]建立了多受災點救災物資分配調度模型及其啟發(fā)式求解算法,實現(xiàn)滿足所有受災點物資需求的時間最小化,但該研究僅涉及一類特殊情形即由單一資源中心向多個受災點調配應急資源的情形,其拓展性不強。王旭坪等[7]以前景理論為工具,建立了災民感知滿意度的多災點應急資源分配模型,但災民滿意度函數(shù)的刻畫缺乏客觀量化標準和科學依據(jù),并且確定的方案不滿足動態(tài)調整要求。詹沙磊等[8]在綜合考慮了需求點和配送路徑連通性的隨機性以及出救點對受災點的最大覆蓋范圍等限制條件下建立了基于信息更新的應急物資配送多目標隨機規(guī)劃模型,該研究是建立在多個觀測時刻上的單次決策問題,這與應急決策中的動態(tài)性和連續(xù)性相悖。蔡玫等[9]構建多出救點、多受災點的多目標模糊調度優(yōu)化模型,采用模糊評價方法研究應急決策者風險偏好對應急物資調度策略的影響,劉曄等[10]從風險偏好的視角也做過類似研究。宋曉宇等[11]從物資調度費用最小化和受災點滿意度最大化的雙重目標出發(fā),構建了多受災點、多出救點、多階段動態(tài)調度模型,可是該研究忽略了應急物資調度中最為重要的目標即時間最短問題。張玲等[12]綜合考慮應急資源保障的可靠性、不同情景的決策魯棒性和救災代價的經(jīng)濟性等目標建立了二階段災后應急救災網(wǎng)絡模型,解決了應急配送中心選擇和應急救災物資配送問題,但在第二階段對滿足各個災點所需應急物資的均衡性沒有涉及;陳濤等[13]通過在二階段模型中引入信息更新機制也做過類似研究。阮俊虎等[14]以最小化總的醫(yī)療物資運輸持續(xù)時間為目標提出了基于聚類的兩階段醫(yī)療物資聯(lián)合運輸模型,該模型和算法能夠有效選擇出應急中轉點和安排具體的運輸路線,不過把通往各醫(yī)療救助點的車輛行駛速度設為常數(shù)與實際情況有些出入,因為通往各醫(yī)療點的路況各不相同(損壞程度不一樣)必然導致車輛行駛速度各異。許勝銘等[15]針對煤礦瓦斯爆炸事故的特點,通過引入受災點人員傷亡密度和運輸費用兩個優(yōu)化目標,構建多出救點、多物資、多受災點的應急物資調度模型,該研究雖然具有很強的針對性,但把純粹運輸費用作為優(yōu)化目標有些欠妥。筆者在上述研究成果的基礎上,綜合考慮各災點的災害嚴重程度、響應時間和距離(應急資源中心到災點的距離)、路況等因素的情況下,以博弈論為工具構建面向多災點需求的應急資源調度模型和智能求解算法,力圖實現(xiàn)對各個災點進行公平合理的應急資源調度。
2.1 模型假設
在每一階段,由于應急資源中心所存儲的應急資源是有限的,各個災點所需資源可能是相互沖突的,具有對抗的性質,應用博弈論的語言,各災點(局中人)間對應急資源的需求就可認為是非合作博弈的,它們博弈的目的是盡量以最小的“虛擬成本”獲得所急需的資源。
在建立面向多災點需求的應急資源調度博弈模型之前,作如下假設:
(1)具備先進的應急信息平臺即信息更新方式和速度滿足要求。在每一階段,應急資源中心都能夠及時獲取災點的數(shù)量、嚴重程度及所需資源量等狀況信息,同時各個災點也能及時了解所有應急資源中心的資源狀況;
(2)為了滿足各災點的需求,需要多個應急資源中心相互配合來完成。若該區(qū)域內的應急資源中心的應急資源不能滿足需求,則可從離該區(qū)域最近的應急資源中心獲取所需應急資源;
(3)對各個災點,根據(jù)災情性質、影響和嚴重程度進行分類分級并預估響應時間;
(4)最初對各個災點的資源分配是在不考慮應急資源中心的資源數(shù)量情況下,按照救災單位“虛擬成本”最小原則進行初始分配。而“虛擬成本”(后簡稱“成本”)函數(shù)是一個多元復合函數(shù),其影響因素為災情的嚴重程度、響應時間、平均速度和距離。這樣,首先需要對災點向各應急資源中心所支付的單位調度成本按大小進行排序。當多個災點以相同單位成本向同一應急資源中心調度資源,而該應急資源中心所擁有的資源又無法滿足所有災點的需求時,則就形成多個災點對該應急資源的競爭。
2.2 基于非合作博弈的應急資源調度模型構建
將應急資源調度模型映射為非合作博弈模型,該模型的標準形式定義如下:
G={t,N,(Si(t))i∈N,(P(t)i)i∈N}
(1)
其中,Si(t)是災點i在t階段全部可選策略的集合即災點i可采取的行動方案,Pi(t)=Pi(s1,s2,…,sn)為災點i在t階段的效用函數(shù),它是由調度成本的倒數(shù)映射而來;s=(s1,s2,…,sn)為n個災點的一個組合策略。
(1)資源調度的速度vik(t)
(2)
其中,μ(t)為路況系數(shù),它反映的是應急資源中心k到災點i的道路好壞狀況,μ(t)∈[0,1],路況越好,μ(t)越大。
(2)救災單位成本函數(shù)cik(t)
救災單位成本是應急資源調度的依據(jù),其函數(shù)定義如下:
(3)
(3)資源需求量與供應量的確定
突發(fā)事件爆發(fā)后,首要的工作就是要確定受災點的數(shù)量與所需要的資源種類和數(shù)量,同時還要確定所在區(qū)域內各應急資源中心所儲備的資源狀況。在我們的模型中規(guī)定:若區(qū)域內所儲備的應急資源不能滿足區(qū)域內各災點對資源的需求,則臨近區(qū)域的應急資源中心自動加入救災行動中,這樣做的目的一方面是為了實現(xiàn)快速救援,盡量減少災區(qū)的生命和財產(chǎn)損失,另一方面也是為了保證救災成本盡量最小化。為使問題簡化,以各災點需要的同一類資源例如帳篷加以說明,具體確定步驟如下:
① 在災區(qū)內,確定所有災點所需資源總量
(4)
其中,qi表示第i個災點所要的資源量。
② 確定區(qū)域內各應急資源中心所儲備的資源量
(5)
其中,uk為第k個應急資源中心所能夠提供的資源量,M={1,2,…,m}為區(qū)域內m個應急資源中心集合。
③ 若Q>U,說明該區(qū)域內的應急資源不能滿足災區(qū)的需要,則臨近區(qū)域的應急中心自動進入災區(qū)進行救災,此時能夠提供的應急資源總量為U=U+um+1+…um+k,直到U=Q為止;若Q≤U,說明區(qū)域內的資源是能夠滿足災區(qū)需要的,不需要區(qū)域外應急資源中心的援助。
(4)策略的構建與簡化
各災點的信息集狀況是影響各災點策略選擇和博弈結果的重要因素,也是構建博弈策略的核心內容。在本模型的構建中,局中人的信息集包括以下內容:①災點的數(shù)量;②應急資源中心的數(shù)量;③每個災點到達各應急資源中心的距離和路況信息;④災點的災情嚴重程度即各災點的級別;⑤每個災點所需要資源的數(shù)量。
(6)
圖1 災點i的博弈調度策略構建示意圖
其中,各災點對特定應急資源中心k的資源爭奪滿足的條件為:
(7)
各災點因爭奪資源而進行博弈時,必須首先確定各災點采取的所有可能策略,只有這樣,每個災點在其他災點采取行動時才能夠采取最優(yōu)行動,使自己的效用最大化。各災點在特定組合策略Sj下對某一應急資源中心k的資源博弈過程如圖2所示。
圖2 各災點對應急資源中心k的資源博弈過程
假設應急資源中心k儲備有uk單位的可用資源(k∈M),則每個災點從所有應急資源中心獲取資源的所有可能的行動方案數(shù)為Z=u1*u2*…*um,其資源調度策略為Si=(si,1,si,2,…,si,h(i)),其中h(i)≤Z。
按上述方法構建的策略集中可能存在不可行的策略,因此有必要對其進行剔出,使問題得到簡化。剔出不合理的行動策略可依照如下兩條準則來進行:
② 對每個應急資源中心的資源需求量不能超過該應急資源中心所儲備的資源量即不能調度應急資源中心不存在的資源,故須滿足式(7)。
(5)調度總成本函數(shù)的確定
(8)
(6)博弈策略的排序
為了使各個災點按照成本最低原則選擇最優(yōu)策略向每個應急資源中心調度資源,故對各個災點的策略進行合理排序是非常有必要的。
① 調度策略以調度總成本的大小按升序排列即調度成本越小的策略,其等級越高,排序越靠前;
② 若出現(xiàn)兩個調度策略的總成本相同,則以調度策略中調度單位成本最小的為最優(yōu),依次類推。例如,災點i的兩個策略分別為si,j和si,g,其調度總成本分別為Ci,j和Ci,g(按公式(8)求取),各自的單位調度成本與對應的調度資源的數(shù)量的比值最小來確定。設si,j和si,g所對應的比值βsi,j、θsi,g分別為:
(9)
(10)
其中,式(9)和(10)中的分子按式(3)求取。若Ci,j=Ci,g,則分別求出βsi,j與θsi,g中最小值即
(11)
(12)
③ 災點向應急資源中心調度資源時,以單位調度成本最小原則進行最大量的資源調度,這樣做的實質是反映救災時間緊迫原則即在盡量短的時間內調度最大量的資源,其調度總成本也是最低的。式(3)和(8)就說明了調度時間、調度的資源量、災點的嚴重程度和調度成本的關系。
(7)收益函數(shù)
在博弈中,收益函數(shù)反映在一個特定的策略組合下局中人i所期望得到的效用水平,在應急資源調度中,災點i選擇某一調度策略j時調度單位成本從應急資源中心k調度應急資源量的多少來表示其效用的大?。?/p>
(13)
災點i從所有應急資源中心M調度所需資源的效用滿足疊加定理,可以表示如下:
(14)
(8)目標函數(shù)
應急資源調度的目標是在對各個災點實現(xiàn)公平調度的情況下,使總的效用函數(shù)最大化。
目標函數(shù)定義如下:
(15)
(9)收益矩陣
局中人i收益矩陣可表示如下:
(16)
借鑒基本蟻群算法(Ant Colony Optimization, ACO)[16]的進化思想,對其進行必要的延伸和修改,將該算法拓展到博弈模型的納什均衡求解問題中?;舅悸窞椋好恐晃浵伿紫冗M行全局搜索,然后在各自鄰域內進行局部搜索,得到局部最優(yōu)解,完成一次進化后,每只螞蟻依據(jù)各自所在的位置更新信息素強度。
3.1 全局搜索
各螞蟻根據(jù)當前的信息素強度和適應度函數(shù)計算轉移概率,并按公式(19)和(20)生成子代蟻群。
定義1 參考余謙和王先甲[17],定義蟻群算法的適應度函數(shù)(Fitness)如下:
(17)
定義2 轉移函數(shù):
(18)
其中,f(Xi)為螞蟻i的適應度函數(shù),Δfij=f(Xi)-f(Xj);τ(j)為螞蟻j的信息素強度值。
全局搜索中引入遺傳算法(GA)的交叉和變異操作,產(chǎn)生適應度函數(shù)更優(yōu)的子代蟻群。螞蟻i根據(jù)轉移概率p選擇下一步移動的目標,按公式(19)生成子代個體:
Xi=δXi+(1-δ)Xj
(19)
式(19)不僅保證了螞蟻i向其他信息素濃度更高的螞蟻j的鄰域范圍內移動,而且保證了進化后的子代蟻群仍然在博弈的混合策略空間內,其中δ為在(0,1)內產(chǎn)生的一個隨機數(shù)。
3.2 局部搜索
變鄰域搜索方法(Variable Neighbourhood Search, VNS)是Hansen等人[18]提出的一種啟發(fā)式算法,目前已被用于解決許多經(jīng)典的優(yōu)化問題[19,20]。該算法從一個初始解開始,通過系統(tǒng)地改變鄰域搜索中的鄰域結構來提高求解的質量,避免陷入局部最優(yōu)。
每只螞蟻采用變鄰域搜索策略,在半徑為r的鄰域空間內隨機搜索,并通過控制迭代步長,使得各只螞蟻的位置始終保持在可行解范圍內。
定義3 鄰域搜索公式:
(20)
其中,Xit表示螞蟻t搜索到局中人i的解策略,Δri表示[-r,r]之間的一組隨機搜索向量,為可變的鄰域搜索項。
定理1 若初始化的每只螞蟻在混合策略組合空間內,即
根據(jù)以上的證明,可以保證蟻群中每個局中人的混合策略是在他的混合策略空間內,因而螞蟻在進化過程中始終保持在博弈的混合策略組合空間內。
信息素更新規(guī)則:局部搜索結束后,按照如下公式更新信息素強度:
(21)
其中,λ是一個非常小的正數(shù),防止出現(xiàn)除數(shù)為0的情況,ρ表示信息素揮發(fā)系數(shù)。
3.3 改進蟻群算法的效果分析
文中提出的改進蟻群算法(Improved ACO)主要用于對所建的博弈模型進行納什均衡求解。為了說明其改進效果,我們將與陳士俊等人[21]采用遺傳算法(GA)對納什均衡求解的效果進行比較。選取陳士俊等[21]中的三維雙博弈矩陣, 采用改進蟻群算法求解該博弈的納什均衡解,參數(shù)設置:
M=20,genMax=1000,gMax=100,R0=0.9,low-percentage=0.5,精度為10-4, high-percentage=1。
采用MATLAB[22]編程實現(xiàn)求解。 利用改進蟻群算法求解該博弈的結果如表1所示。該博弈的唯一納什均衡為(1/3,1/3,1/3;1/3,1/3,1/3),陳士俊等[21]采用遺傳算法計算400代得到該博弈的近似解(0.3333,0.3333,0.3333;0.3333,0.3333,0.3333),而利用改進蟻群算法平均進化73代即得到該近似解。
表1 求解結果
圖3為采用遺傳算法和改進蟻群算法求解該博弈的離線性能比較圖,GA曲線為遺傳算法的離線性能,Improved ACO曲線為改進蟻群算法的離線性能。從圖3可以得知,改進后的蟻群算法優(yōu)于遺傳算法,表現(xiàn)更快更好的收斂性能。
圖3 兩種算法求解博弈的離線性能比較
3.4 模型仿真測試與分析
仿真測試目的是為了評估所建模型的有效性和可行性。當突發(fā)事件發(fā)生時,響應時間關系到應急資源中心是否能夠迅速采取有效措施,把應急資源及時調度到各個災點,減少時間延誤,降低災害對社會正常秩序的沖擊和人員傷亡。救災響應時間的影響因素包括:①災點的數(shù)量;②應急資源中心的數(shù)量;③應急資源中心所擁有的資源單位數(shù)量。現(xiàn)分別從上述三個方面進行仿真來分析模型的響應時間情況。
測試數(shù)據(jù)假設:當發(fā)生一次突發(fā)事件時,該區(qū)域的災點數(shù)為2~4個,可以參與救災的應急資源中心為2~12,針對某一類特定資源最大供給總量為150個單位,每個災點的最大需求量為60個單位,模型的其它相關參數(shù)隨機生成。下面所有測試都是針對某一類應急資源。
測試1:單個應急資源中心所擁有應急資源數(shù)量的變化對模型算法收斂時間的影響
在模型進行每次測試時,首先保證每次測試的應急資源中心的個數(shù)為常數(shù)的情況下,仿真結果為單個應急資源中心所擁有資源數(shù)量的變化對模型算法收斂性的影響。圖4給出了應急資源中心為10個,各災點的總需求為100個單位的仿真結果和不同災點數(shù)目下的對比曲線。
圖4 單個應急資源中心資源量對收斂時間的影響
從圖4可知,隨著每個資源中心所擁有的應急資源數(shù)量的增加,算法的收斂時間逐漸減少,其原因是資源量的增加導致了各災點在該應急資源中心減少了相互之間的競爭機會,策略空間也相應地變小,這樣必然會使算法的收斂性加快。比較理想的情況是就某種資源一個應急資源中心能夠滿足需要該種資源的所有災點,這樣各災點就不會存在相互競爭。但是,當應急資源中心所擁有的資源量超過一定范圍時,算法的收斂時間反而會增加,這可能是由于太多的災點為了以支付較低成本來調度所需要的資源而匯集在某個應急資源中心而進行資源爭奪,結果反而導致博弈的策略空間變大,從而使算法的收斂時間延長。另外,從圖4還可以看出,隨著災點個數(shù)的增加,其收斂時間都有增大的趨勢,這是因為災點的增多,意味著參加博弈的局中人增加,相應總的策略空間增大,所以其收斂時間就會有增大的趨勢。上述測試結果是與實際救災情況相符的。
測試2:應急資源中心數(shù)量變化對模型執(zhí)行時間的影響
在保證應急資源單位總量為常數(shù)的情況下,應急資源中心個數(shù)的變化對模型執(zhí)行時間的影響進行仿真?,F(xiàn)就應急資源總量為120個單位,各災點總需求量為100個單位,各應急資源中心所擁有的資源量為7~40個單位之間的條件下仿真結果如圖5所示。
圖5 應急資源中心數(shù)量對模型執(zhí)行時間的影響
從圖5可知,當應急資源中心的數(shù)量比較少時(2~5個),模型的執(zhí)行時間比較長,導致該結果的原因是由于應急資源中心太少,幾乎所有的災點都要到這些應急資源中心調度所需資源,這樣就會使各災點間需要進行一系列的博弈來實行資源的最優(yōu)調度。相反,當應急資源中心個數(shù)增加時,各災點調度所需要的資源就有更多的選擇,減少了相互之間博弈的機會,因此就降低了模型的執(zhí)行時間。另外,從圖5的對比曲線得知,隨著災點個數(shù)的增加,模型的執(zhí)行時間逐漸增大,引起此種現(xiàn)象的原因是災點個數(shù)的增加勢必增加了博弈的策略空間,會導致了更多的競爭。這也都是與實際情況相符的。
算例1:設某地區(qū)發(fā)生地震造成2個比較嚴重的災點,該區(qū)域內有2個應急資源中心(分別用A和B表示)向災點提供應急資源(以帳篷為例)。另外,該區(qū)域附近有一個應急資源中心(用C表示)。應急資源供求關系如表2所示,假定平時車輛的運輸速度為1 km/min,應急資源中心到各災點之間的距離如表3所示。1表示災害等級程度高,2表示災害等級程度一般,3表示災害等級程度低。
分析:由表2可知,區(qū)域內的應急資源中心A和應急資源中心B不能同時滿足2個災點對帳篷的需求,因為Q=10(需求量)>U=8(供給量),故該區(qū)域附近的應急資源中心C自動加入災區(qū)的救災行動中,此時有Q=10
M=30,genMax=1000,gMax=10,
η=10-4,R0=0.9,low-percentage=0.5,
high-percentage=1,其它參數(shù)隨機生成。
表2 災點/應急救援中心資源供求關系
表3 應急資源中心與各災點間的距離(單位:km)
采用上述改進蟻群優(yōu)化算法求解該博弈模型的Nash均衡解,5次計算結果如表4所示:
表4 求解結果
按照式(3)確定單位調度成本:
c1A=8;c1B=10;c1C=9
c2A=5;c1B=6;c1C=6
C1=3×8+10×0+9×1=33
C2=36, C=C1+C2=69
從上面的分析可知:災點1首先從應急資源中心A調度3個單位的帳篷,然后再從應急資源中心C調度1個單位的帳篷;而災點2首先從應急資源中心B調度5個單位的帳篷,然后從應急資源中心C調度1個單位的帳篷來滿足資源需求。此時,按上述策略完成整個應急資源調度任務所需要的總成本為69,成本最小,因而總體效用最大,故為最優(yōu)調度方案。
算例2:再考慮4個應急資源中心,3個災點的情形,參數(shù)設置與算例1相同。應急資源供求關系如表5所示;應急資源中心到各災點之間的距離如表6所示:
表5 災點/應急救援中心資源供求關系
表6 應急資源中心與各災點間的距離(單位:km)
采用上述改進蟻群優(yōu)化算法求解該博弈模型的Nash均衡解,5次計算結果如表7所示:
表7 求解結果
按照式(3)確定單位調度成本:
c1A=10;c1B=3;c1C=7;c1D=6
c2A=8;c2B=12;c2C=4;c2D=22
c3A=12;c3B=21;c3C=24;c3D=6
C1=10×1+3×8+7×0+6×0=34
C2=36,C3=36,C=106
從上面的分析可知:災點1首先從應急資源中心A調度1個單位的帳篷,然后再從應急資源中心B調度8個單位的帳篷;而災點2首先從應急資源中心A調度3個單位的帳篷,然后從應急資源中心C調度3個單位的帳篷來滿足資源需求;災點3首先從應急資源中心A調度1個單位的帳篷,再從應急資源中心D調度4個單位的帳篷。此時,按上述策略完成整個應急資源調度任務所需要的總成本為106,調度總成本最小,因而總體效用最大,故為最優(yōu)調度方案。
另外,算例2中平均計算時間(4.25s)大于算例1中平均計算時間(2.93s),也間接驗證了模型測試的正確性,因為隨著災點數(shù)量的增加(算例1中災點數(shù)2,而算例2中災點數(shù)為3),模型的執(zhí)行時間逐漸增大,引起此種現(xiàn)象的原因是災點個數(shù)增加勢必增加了博弈的策略空間,導致了更多的競爭,這也是模型測試的基本結論之一。
針對突發(fā)事件爆發(fā)后經(jīng)常會引發(fā)多個災點的實際情況,通過分析各災點為了獲取所需要的應急資源而進行相互競爭的行為,具有非合作的性質,但對各災點進行應急資源調度時,又必須兼顧社會公平性,博弈論恰恰為此問題的解決提供了有效途徑。因此,本文以博弈理論為分析工具,在確定各災點災情的基礎上,建立了面向多災點需求的應急資源調度博弈模型并給出了智能求解算法。最后的模型仿真測試和算例分析驗證了所建模型的有效性和可行性。該模型與算法也為商業(yè)物流中的資源配送提供了新的解決方案和實現(xiàn)途徑。
[1] Shetty R, Gupta U. An automated decision support system based on game theoretic optimization for emergency management in urban[J]. Journal of Homeland Security and Emergency Management, 2007, 4(2): 1-25.
[2] Shetty R. An event driven single game solution for resource allocation in a multi-crisis environment[D]. Tampa: University of South Florida, 2004.
[3] Wang Susheng, Wang Yan, Sun Jian. An optimized emergency resources allocation algorithm for large-scale public emergency[C]// Proceedings of the Sixth International Conference on Machine Learning and Cybernetics, Hong Kong, August 19-22, 2007.
[4] Rubel D, Shinya H. An agent-based model for resource allocation during relief distribution[J]. Journal of Humanitarian Logistics and Supply Chain Management, 2014, 4(2): 265-285.
[5] 王蘇生, 王巖. 基于公平優(yōu)先原則的多受災點應急資源配置算法[J]. 運籌與管理, 2008, 17(3): 16-21.
[6] 楊勃, 杜冰, 李小林. 多受災點救災物資分配調度問題啟發(fā)式算法[J]. 系統(tǒng)工程, 2012, 30(1): 97-102.
[7] 王旭坪, 董莉, 陳明天. 考慮感知滿意度的多受災點應急資源分配模型[J]. 系統(tǒng)管理學報, 2013, 22(2): 251-256.
[8] 詹沙磊, 劉南. 基于災情信息更新的應急物資配送多目標隨機規(guī)劃模型[J]. 系統(tǒng)工程理論與實踐, 2013, 33(1): 159-166.
[9] 蔡玫, 羅倩, 朱莉,等. 面向應急物資調度的一種模糊規(guī)劃模型[J]. 系統(tǒng)管理學報, 2013, 22(4): 487-493.
[10] 劉曄, 姜國剛. 決策者風險態(tài)度對應急物資調度影響研究[J]. 中國安全科學學報, 2014, 24(8): 170-176.
[11] 宋曉宇, 王建國, 常春光. 基于需求緊迫度的非線性連續(xù)消耗應急調度模型與算法[J]. 信息與控制, 2014, 43(6): 735-743.
[12] 張玲, 陳濤, 黃鈞. 基于最小最大后悔值的應急救災網(wǎng)絡構建魯棒優(yōu)化模型與算法[J]. 中國管理科學, 2014, 22(7): 131-139.
[13] 陳濤, 黃鈞, 朱建明. 基于信息更新的兩階段魯棒-隨機優(yōu)化調配模型研究[J]. 中國管理科學, 2015, 23(10): 67-77.
[14] 阮俊虎, 王旭坪, 楊挺. 大規(guī)模災害中基于聚類的醫(yī)療物資聯(lián)合運送優(yōu)化[J]. 中國管理科學, 2014, 22(10): 80-89.
[15] 許勝銘, 景國勛. 煤礦瓦斯爆炸事故的應急救援物資調度模型研究[J]. 安全與環(huán)境學報, 2015, 15(5): 104-107.
[16] Dorigo M, Maniezzo V, Colorni A. Ant system: Optimization by a colony of cooperative agents[J]. IEEE Transactions on SMC, 1996, 26(1): 28-41.
[17] 余謙, 王先甲. 基于粒子群優(yōu)化求解納什均衡的演化算法[J]. 武漢大學學報(理學版), 2006, 52(1): 25-29.
[18] Mladenovic N, Hansen P. Variable neighbourhood search[J]. Computers and Operations Research, 1997, 24(11): 1097-1100.
[19] Hansen P, Mladenovic N, Peter J A. Variable neighbourhood search: Methods and applications[J]. Annals of Operations Research, 2010, 175(1): 367-407.
[20] 曹正洋, 許維勝, 徐志宇. 開放式兩級車輛路徑問題建模與多起始點變鄰域下降法求解[J]. 計算機科學, 2014, 41(10): 232-237.
[21] 陳士俊, 孫永廣, 吳宗鑫. 一種求解NASH均衡解的遺傳算法[J]. 系統(tǒng)工程, 2001, 19(5): 67-70.
[22] 劉維. 精通Matlab與C/C++混合程序設計(第二版)[M]. 北京:北京航空航天大學出版社, 2008.
Game Model and Optimization Based on Resource Requirements of Multiple Crisis Locations
YANG Ji-jun1,2, SHE Lian1
(1. National Institute of Emergency Management, Chinese Academy of Governance, Beijing 100089,China;2. Department of Emergency Management, Guangxi Institute of Administration, Nanning 530021,China)
There would always be a lot of crisis locations when an unconventional emergency breaks out. The requirements of each crisis location are usually different, which is difficult to meet the requirements of multiple crisis locations for a single resource centre. So it is a practical problem to be solved urgently by decision makers how to fairly and reasonably schedule emergency resources for multiple crisis locations. According to the demand information, the dynamic process of emergency resources scheduling for multiple crisis locations are described, in which the emergency resources scheduling process are divided into several stages according to the change of demand information for multiple crisis locations. On this basis, a theoretical model of multi-stage emergency resources scheduling process is designed for multiple crisis locations. After a series of assumptions are made, the game model based on resource requirements of multiple crisis locations is set up by using game theory according to the degree of disaster, and the improved ant colony optimization (ACO) is introduced to seek out the solution in order to schedule emergency resources for multiple crisis locations according to the minimum virtual cost. Simulation tests and numerical analyses are given to demonstrate the feasibility and availability of the model. The model and algorithm can also provide a new solution and approach for the distribution of resources in business logistics.
unconventional emergency;resource requirements;game scheduling;improved ACO
2015-07-15;
2016-01-06
國家社科基金重點資助項目(16AGL017);國家自然科學基金重大研究計劃(91324203);中國博士后基金項目(2015M570995)
簡介:楊繼君(1973-),男(土家族),湖南石門人,國家行政學院應急管理培訓中心博士后,英國紐卡斯爾大學訪問學者,博士,副教授,研究方向:應急管理與博弈論,E-mail: peteryang708@163.com.
TP393.07
A
1003-207(2016)08-0154-10
10.16381/j.cnki.issn1003-207x.2016.08.019