李 鳳,阿布都熱合曼·卡的爾
(新疆財經(jīng)大學 信息管理學院,新疆烏魯木齊 830000)
近年來世界經(jīng)濟持續(xù)而快速的增長給生態(tài)環(huán)境帶來了沉重的負擔,如何協(xié)調(diào)與整合生態(tài)環(huán)境與經(jīng)濟發(fā)展,是人們一直在探討的問題。綠色供應(yīng)鏈延續(xù)了可持續(xù)發(fā)展的戰(zhàn)略思想,綜合考慮環(huán)境的影響以及資源的有效利用,通過生產(chǎn)綠色能源電動汽車、回收可利用資源、減少碳排放等措施給現(xiàn)代企業(yè)帶來新的思路。與此同時,電子商務(wù)以及物流產(chǎn)業(yè)的快速發(fā)展、互聯(lián)網(wǎng)直播銷售行業(yè)的興起使得線上銷售變得越來越便捷、越來越受歡迎,許多傳統(tǒng)供應(yīng)鏈廠商也開始嘗試利用雙渠道銷售產(chǎn)品,在減少庫存成本的同時,又能增加產(chǎn)量與利潤。但是新的發(fā)展模式以及新的銷售方式給供應(yīng)鏈成員帶來更多利潤的同時,也帶來了更多的不確定性,面對這些機遇與挑戰(zhàn),企業(yè)必須要審視自身對抗風險的能力,以及科學地決策以增加自身的利潤,在面對風險時,大多企業(yè)都會選擇規(guī)避風險,而供應(yīng)鏈中制造商抵抗風險的能力又比零售商強。因此,本文將零售商風險規(guī)避行為引入到雙渠道綠色供應(yīng)鏈中,分析其對最優(yōu)決策以及穩(wěn)定性的影響。
關(guān)于雙渠道綠色供應(yīng)鏈的定價以及綠色度的研究,Ranjan 等[1]發(fā)現(xiàn)協(xié)作模式下供應(yīng)鏈的綠色質(zhì)量水平更高,對環(huán)境更有利;Rahmani 等[2]探討了市場需求出現(xiàn)中斷時產(chǎn)品定價以及相應(yīng)的綠色度變化;胡文豐[3]對確定需求以及隨機需求下的供應(yīng)鏈定價做了對比分析,研究渠道需求相依性的影響與建議;Li 等[4]利用一致性定價方法探討了綠色化成本的最大閾值以及開通雙渠道的條件;經(jīng)有國等[5]加入了線上零售商搭便車和線下零售商努力推廣模式,得出收益共享與成本共擔模式總體更優(yōu);周巖等[6]發(fā)現(xiàn)高綠色化效率、高公平關(guān)切度和低傳統(tǒng)渠道忠誠度下制造商才愿意開通直銷渠道;韓同銀等[7]在此基礎(chǔ)上又分析了政府補貼以及政府不補貼時公平關(guān)切系數(shù)對供應(yīng)鏈的影響。
關(guān)于風險規(guī)避行為對供應(yīng)鏈的影響,江世英和楊渠等[8-9]分別探討了具有風險規(guī)避行為的制造商和零售商在綠色供應(yīng)鏈的集中決策與分散決策下的最優(yōu)選擇;傅端香和朱琳等[10-11]又在風險規(guī)避的基礎(chǔ)上考慮了政府補貼的影響,其中傅端香以供應(yīng)鏈成員是否為風險規(guī)避為分類依據(jù),而朱琳以政府補貼類型為分類依據(jù)進行研究,并且建立了以零售商為主導的Stackelberg 博弈模型;宋英華等[12]在風險規(guī)避的基礎(chǔ)上又考慮了零售商謊報行為,通過調(diào)整風險規(guī)避與謊報系數(shù),研究其對最優(yōu)策略的影響;李知遠[13]研究發(fā)現(xiàn)風險規(guī)避行為會更有利于對方的效應(yīng)增長,而使自身利潤下降。
關(guān)于利用動態(tài)復(fù)雜模型來研究供應(yīng)鏈中的定價以及穩(wěn)定性問題上,李秋香[14]著重研究了單渠道中具有風險規(guī)避行為的制造商和零售商在價格和產(chǎn)量上的博弈及其價格調(diào)整速度等對整體穩(wěn)定性和利潤等的影響;代魯峰[15]在風險規(guī)避型雙渠道供應(yīng)鏈中發(fā)現(xiàn)制造商的風險規(guī)避對系統(tǒng)穩(wěn)定性有益,而零售商的風險規(guī)避在部分情況下并不利于系統(tǒng)穩(wěn)定;張芳等[16]在閉環(huán)供應(yīng)鏈發(fā)現(xiàn)過快的調(diào)整速度會使系統(tǒng)進入不穩(wěn)定的混沌狀態(tài);Zhang 等[17]在雙渠道供應(yīng)鏈中加入零售商關(guān)注公平關(guān)切行為,并分別通過建立Nash 均衡模型以及Stackelberg 模型來進行混沌分析,研究表明過大的公平關(guān)切系數(shù)并不會一直有利于零售商,甚至會使系統(tǒng)穩(wěn)定區(qū)域變小,從而更快的進入混沌狀態(tài);范如國等[18]發(fā)現(xiàn)制造商的利他行為對系統(tǒng)穩(wěn)定性的影響大于零售商的利他行為對系統(tǒng)穩(wěn)定性的影響,而且批發(fā)價格調(diào)整參數(shù)對系統(tǒng)穩(wěn)定域的影響更大;侯愛麗[19]研究了政府補貼下的綠色供應(yīng)鏈雙寡頭的動態(tài)復(fù)雜性;Lin 等[20]在研究具有社會偏好的低碳供應(yīng)鏈時發(fā)現(xiàn),供應(yīng)鏈系統(tǒng)的穩(wěn)定性隨著零售商社會偏好的增加而增加。
通過對國內(nèi)外文獻的梳理總結(jié)可以發(fā)現(xiàn),已有的文獻大多都側(cè)重于分析風險規(guī)避對雙渠道供應(yīng)鏈以及單一渠道的綠色供應(yīng)鏈中定價和利潤等的影響,而沒有深入考慮風險態(tài)度對雙渠道綠色供應(yīng)鏈的定價和穩(wěn)定性的影響。在供應(yīng)鏈中,最優(yōu)決策定價并不是一蹴而就的,而是需要經(jīng)過長期而復(fù)雜的博弈,當價格調(diào)整速度過快時系統(tǒng)可能會進入無序的混沌狀態(tài),這種狀態(tài)可能會使利潤發(fā)生轉(zhuǎn)變,因此本文在靜態(tài)模型的基礎(chǔ)上,建立雙渠道綠色供應(yīng)鏈的動態(tài)模型,分析風險規(guī)避型雙渠道綠色供應(yīng)鏈的定價以及穩(wěn)定性問題。
首先構(gòu)建一個二層供應(yīng)鏈,它是由一個制造商和一個零售商構(gòu)成的,其中制造商生產(chǎn)綠色度為θ的產(chǎn)品,并將其以ω 的價格批發(fā)給零售商,零售商經(jīng)過加工后再以pr的價格銷售給消費者,而制造商為了增加利潤開通直銷渠道,以pm的價格直接將綠色產(chǎn)品銷售給消費者,消費者可以根據(jù)自己的喜好從任一渠道購買產(chǎn)品。雙渠道綠色供應(yīng)鏈結(jié)構(gòu)如圖1 所示。
圖1 雙渠道綠色供應(yīng)鏈
為建立數(shù)學模型,做出如下假設(shè):
(1)雙渠道綠色供應(yīng)鏈的市場需求是關(guān)于產(chǎn)品銷售價格pr、pm以及產(chǎn)品綠色度θ 的線性函數(shù),參考文獻[6]的需求模型,則傳統(tǒng)零售商渠道市場需求函數(shù)Dr與直銷渠道市場需求函數(shù)Dm可以表示為
其中,a(a>0)為市場需求潛在規(guī)模,由于市場需求具有不確定性,因此假設(shè)為市場的基本需求,反映市場的不確定性,ε~N(0,δ2);δ(0<δ<1)為消費者忠誠于傳統(tǒng)銷售渠道的程度,則δa 為零售商的市場規(guī)模,(1-δ)a 為制造商的市場規(guī)模;b1為產(chǎn)品的交叉價格彈性;k 為消費者的綠色偏好系數(shù)。
(2)在綠色產(chǎn)品的銷售過程中,為減少雙渠道之間不必要的利益沖突,參考文獻[4]將雙渠道的銷售價格進行統(tǒng)一化處理,即令pr=pm=p,b=1-b1,則調(diào)整后的需求函數(shù)為
根據(jù)實際情況,參數(shù)設(shè)置應(yīng)該滿足需求函數(shù)非負數(shù),并且銷售價格大于批發(fā)價格,即
(3)制造商每增加一單位綠色產(chǎn)品需要支付c 單位成本,且在研發(fā)綠色產(chǎn)品時還需要額外投入,其中,η(η>0)是綠色產(chǎn)品研發(fā)成本系數(shù)。
根據(jù)以上假設(shè)可以得到制造商與零售商的利潤函數(shù)分別為
當零售商為風險規(guī)避者時,零售商的效應(yīng)函數(shù)為
其中,λ 為零售商的風險規(guī)避系數(shù),數(shù)值越大表明風險規(guī)避程度越強。
供應(yīng)鏈雙方采用分散決策模型,即在雙方僅考慮自身利益最大化的基礎(chǔ)上分別確定自身的最優(yōu)決策,其定價遵循制造商為主導的Stackelberg 博弈模型。
證明 利用逆序歸納法,首先對式(7)求關(guān)于p 的一階和二階偏導,即
令一階導數(shù)(8)等于零可以求出最優(yōu)銷售價格p*,即
然后把求得的最優(yōu)銷售價格p*帶入到式(5)中,并分別對式(5)求ω 和θ 的一階偏導,即
繼續(xù)求解ω 和θ 的二階偏導得到下面的Hessian 矩陣
令一階偏導等于零,求出如下最優(yōu)的批發(fā)價格以及最優(yōu)綠色度
將最優(yōu)的批發(fā)價格ω*和綠色度θ*帶入式(10)可以求出如下最優(yōu)銷售價格
命題一得證。
將命題一求解的最優(yōu)決策帶回制造商與零售商的利潤函數(shù)當中,可以得到如下傳統(tǒng)渠道與直銷渠道的最優(yōu)利潤函數(shù)
利用MATLAB 對靜態(tài)模型進行數(shù)值模擬仿真,通過觀察渠道忠誠度δ 和風險規(guī)避系數(shù)λ 對最優(yōu)批發(fā)價格ω*、最優(yōu)綠色度θ*和最優(yōu)銷售價格p*以及制造商與零售商最優(yōu)利潤的影響,確定最優(yōu)的渠道忠誠度以及風險規(guī)避系數(shù)λ。
2.2.1 渠道忠誠度δ 對系統(tǒng)的影響
令a=100,b=1,c=10,k=0.3,σ=2,η=10,λ=0.2。從圖2a 中可以看出,δ 在0.298 之后才有實際的研究意義,而隨著δ 的不斷增大,批發(fā)價格與產(chǎn)品綠色度都越來越低,這是因為當零售商占據(jù)越來越多的市場份額時,直銷渠道的銷量將會越來越少,制造商的直銷利潤會越來越低,為了減少成本消耗,制造商會生產(chǎn)低綠色度的產(chǎn)品,并相應(yīng)的降低其批發(fā)價格。而隨著人們對傳統(tǒng)渠道忠誠度的增強以及批發(fā)價格的下降,每單產(chǎn)品的利潤差額將會給零售商利潤帶來更大的增長空間,零售商利潤將會穩(wěn)步增長,如圖2c 所示,在渠道忠誠度達到0.731 時,制造商依靠傳統(tǒng)渠道批發(fā)綠色產(chǎn)品所得到的利潤已經(jīng)不足以彌補直銷渠道以及研發(fā)成本所造成的損失,制造商利潤最終變?yōu)樨摂?shù),且這時制造商需求函數(shù)早已變?yōu)樨摂?shù)不再具有實際意義。
圖2 渠道忠誠度對批發(fā)價格、銷售價格、綠色度以及利潤的影響
2.2.2 風險規(guī)避系數(shù)λ對系統(tǒng)的影響
令a=100,b=1,c=10,k=0.3,δ=0.4,σ=2,η=10。從圖3 可以看出,隨著λ的增強,與制造商相關(guān)的ω*、θ*以及都在增加,而與零售商相關(guān)的p*和都在降低,這是因為零售商在面對風險時,會盡量避免商品發(fā)生滯銷,因此它會主動降低銷售價格來促進綠色產(chǎn)品的銷量,而制造商為了增加自身利潤,則會主動提高產(chǎn)品的批發(fā)價格以及綠色度。對于零售商而言,降低產(chǎn)品的銷售價格所帶來的銷售利潤的增長低于降低價格所帶來的利潤損失,即零售商整體利潤會隨著風險規(guī)避程度的增加而減少,而制造商在傳統(tǒng)渠道以及直銷渠道所獲得的銷售利潤的增長大于研發(fā)成本的增長,因此制造商整體利潤呈現(xiàn)上升趨勢。綜上,零售商的風險規(guī)避行為會損害自身的利潤而促進制造商利潤的增長,而且零售商的風險規(guī)避行為對系統(tǒng)整體的影響比渠道忠誠度所造成的影響更小。
圖3 風險規(guī)避系數(shù)對批發(fā)價格、銷售價格、綠色度以及利潤的影響
假設(shè)供應(yīng)鏈成員在進行長期的價格決策博弈時采用的是有限理性原則,即決策者會依據(jù)當期的邊際利潤來合理地調(diào)整下一期的決策數(shù)值,如果當期的邊際利潤為正,則下一個決策周期決策者會適當?shù)靥岣邇r格,反之,則降低價格,即
其中,β1是批發(fā)價格的有限理性調(diào)整參數(shù),大于零。
由于產(chǎn)品綠色度的增加是一個逐漸積累的穩(wěn)定過程,因此考慮制造商采用自適應(yīng)調(diào)整機制,根據(jù)上一時期的產(chǎn)品綠色度水平及其最佳產(chǎn)品綠色度調(diào)整當期的產(chǎn)品綠色度水平,即
其中,β2是產(chǎn)品綠色度的自適應(yīng)調(diào)整參數(shù),大于零。
則風險規(guī)避型雙渠道綠色供應(yīng)鏈博弈模型的離散動力系統(tǒng)可以表示為
其中
令ω(t+1)=ω(t)、θ(t+1)=θ(t),可以得到如下系統(tǒng)(19)的兩個均衡點
系統(tǒng)(19)的雅克比矩陣可以寫做
其中
為分析均衡點的穩(wěn)定性,可以將均衡點E1、E2的值帶入其雅克比矩陣內(nèi),如果求得的特征值小于1,則該點即為穩(wěn)定的均衡解。參考文獻[14],對部分參數(shù)進行賦值,取a=100,b=1,c=10,k=0.3,δ=0.4,σ=2,η=10,λ=0.2,得到均衡解分別為:E1(0,0.527),E2(27.264,1.036)。
當E1為(0,0.526 5)時,系統(tǒng)的雅克比矩陣為
則E1的特征多項式為f(λ)=(λ-(1+47.164β1))(λ-β2),可以求得的E1特征值分別為λ1=1+47.164β1,λ2=β2。因為價格調(diào)整參數(shù)β1、β2都是正數(shù),因此兩個特征值都是大于或等于1 的,是不穩(wěn)定的均衡點。
當E2為(27.264,1.036)時,系統(tǒng)的雅克比矩陣為
特征多項式為
其中,tr(J(E2))=1-47.258 8β1+β2,det(J(E2))=β2-0.094 7β1-47.164 1β1β2。
均衡點E2的局部穩(wěn)定充要條件可以通過Jury 穩(wěn)定性條件求得,即
均衡點E2的局部穩(wěn)定性條件是指在規(guī)定的條件下,系統(tǒng)是穩(wěn)定的,但是當系統(tǒng)的調(diào)整參數(shù)出這個范圍,系統(tǒng)就會變成無序的混沌狀態(tài)。
下面對系統(tǒng)(19)的博弈模型進行數(shù)值模擬分析,觀察風險規(guī)避系數(shù)對系統(tǒng)穩(wěn)定域的影響,及其各自的分岔圖與李雅普諾夫指數(shù)圖,最后觀察調(diào)整參數(shù)對系統(tǒng)利潤的影響。
3.2.1 調(diào)整風險規(guī)避系數(shù)對系統(tǒng)穩(wěn)定域的影響
圖4 為調(diào)整風險規(guī)避系數(shù)前后系統(tǒng)穩(wěn)定域的范圍變化,其中,圖4a 為初始系統(tǒng)(19)的穩(wěn)定域,此時λ=0.2,β1的穩(wěn)定區(qū)間為0 到0.042,β2的穩(wěn)定區(qū)間為0 到1,在這一區(qū)域內(nèi),系統(tǒng)的調(diào)整都是穩(wěn)定的均衡解,一旦超出這一穩(wěn)定域,系統(tǒng)就會進入一種無序的混沌狀態(tài);當λ=0.4 時,系統(tǒng)的整體穩(wěn)定域范圍變小了,β1的穩(wěn)定域從0.042 降到0.038,β2的穩(wěn)定區(qū)域不變,這是因為零售商風險規(guī)避系數(shù)越強,批發(fā)價格越高,使得批發(fā)價格的調(diào)整參數(shù)方向上穩(wěn)定域減少,而產(chǎn)品綠色度的調(diào)整參數(shù)采取的是自適應(yīng)調(diào)整參數(shù),因此風險規(guī)避系數(shù)的增加對其沒有影響,但是整體來說零售商風險規(guī)避程度的增加對系統(tǒng)穩(wěn)定性是不利的。
圖4 不同風險規(guī)避系數(shù)對應(yīng)的系統(tǒng)穩(wěn)定域范圍
3.2.2 調(diào)整風險規(guī)避系數(shù)前后的系統(tǒng)分岔圖與李雅普諾夫指數(shù)
固定β2=0.01,圖5 和圖6 分別為λ=0.2 與λ=0.4 時系統(tǒng)隨批發(fā)價格調(diào)整參數(shù)β1變化的分岔圖和最大Lyapunov 指數(shù)圖。從圖5a 中可以看出,當β1為0.042 時,系統(tǒng)開始出現(xiàn)第一次分岔,然后隨著不斷增大,系統(tǒng)會通過二周期、四周期等倍周期分岔在0.054 之后徹底進入混沌狀態(tài),右側(cè)的李雅普諾夫指數(shù)圖也印證了這個觀點,在0 到0.042 之間,李雅普諾夫指數(shù)小于零,系統(tǒng)是穩(wěn)定的,從0.054 開始李雅普諾夫指數(shù)大于零,系統(tǒng)表現(xiàn)為混沌狀態(tài),而且越到后期數(shù)值越大,混沌程度越高;圖6 為增加零售商風險規(guī)避系數(shù)后的分岔圖,這時的均衡值為(ω*,θ*,p*)=(27.634,1.058,32.683),相較于λ=0.2 時的最優(yōu)值,批發(fā)價格以及產(chǎn)品綠色度都提高了,產(chǎn)品銷售價格降低了,系統(tǒng)的第一次分岔點也由最初的0.042減小為0.038,混沌狀態(tài)的進入點也由0.054 降為0.048,因此可以看出零售商的風險規(guī)避系數(shù)的增加會使系統(tǒng)更快地進入混沌狀態(tài)。
圖5 當β2=0.01,λ=0.2 時系統(tǒng)隨β1 變化的分岔圖與李雅普諾夫指數(shù)圖
圖6 當β2=0.01,λ=0.4 時系統(tǒng)隨β1 變化的分岔圖與李雅普諾夫指數(shù)圖
固定β1=0.01,圖7 分別為λ=0.2 與λ=0.4 時系統(tǒng)隨產(chǎn)品綠色度的自適應(yīng)調(diào)整參數(shù)β2變化的最大Lyapunov 指數(shù)圖。當λ=0.2 時,在1.001 后李雅普諾夫指數(shù)開始大于零,即系統(tǒng)進入混沌狀態(tài);λ=0.4時,系統(tǒng)同樣在1.001 后進入混沌狀態(tài),因此看出風險規(guī)避系數(shù)的變化并不影響產(chǎn)品綠色度的穩(wěn)定域區(qū)間,系統(tǒng)進入混沌狀態(tài)的節(jié)點相同。
圖7 當β1=0.01,λ=0.2 與λ=0.4 時系統(tǒng)隨β2 變化的李雅普諾夫指數(shù)圖
3.2.3 調(diào)整參數(shù)對系統(tǒng)利潤的影響
當制造商開通雙渠道銷售產(chǎn)品時,它的利潤一般會大于零售商的利潤,系統(tǒng)初始均衡利潤值為=(748.383,37.727)。固定β2=0.01,隨著批發(fā)價格調(diào)整參數(shù)β1的增大,系統(tǒng)利潤的變化與系統(tǒng)(19)的變化節(jié)點相同,在0.054 之后都進入了無序的混沌狀態(tài)。而進入混沌狀態(tài)后制造商利潤出現(xiàn)了下降趨勢,零售商利潤微微上漲,但整體變化并不明顯,如圖8a 所示。當固定β1=0.01 時,隨著產(chǎn)品綠色度的自適應(yīng)調(diào)整參數(shù)β2的增加,制造商利潤與零售商利潤在1.001 處開始出現(xiàn)不同程度的下降,如圖8b、c 所示。
圖8 調(diào)整參數(shù)對利潤的影響
綜上所述,當零售商風險規(guī)避程度增加時,系統(tǒng)的穩(wěn)定域?qū)⒆冃?,系統(tǒng)會更快地進入混沌狀態(tài),即零售商的風險規(guī)避對系統(tǒng)穩(wěn)定性起到了反向的作用。初始階段系統(tǒng)的納什均衡穩(wěn)定狀態(tài)會隨著批發(fā)價格以及產(chǎn)品綠色度的調(diào)整參數(shù)的加快,經(jīng)過不同形式的變化進入混沌狀態(tài),而進入混沌狀態(tài)之后,決策者對未來的定價預(yù)測調(diào)整將會受到非常大的影響,當決策者無法評估未來的走向時,整個系統(tǒng)的利潤都將會受到影響。隨著批發(fā)價格調(diào)整參數(shù)的加快,制造商利潤和零售商利潤都會進入無序的混沌狀態(tài),且制造商利潤呈現(xiàn)降低趨勢,零售商利潤基本保持不變;而隨著產(chǎn)品綠色度的調(diào)整參數(shù)加快,制造商與零售商的利潤都會出現(xiàn)降低趨勢。
本文考慮了零售商的風險規(guī)避行為,建立了雙渠道綠色供應(yīng)鏈的靜態(tài)與動態(tài)博弈模型,通過靜態(tài)模型確定合理的渠道忠誠度以及風險規(guī)避系數(shù),隨后在動態(tài)模型中研究風險規(guī)避系數(shù)對系統(tǒng)穩(wěn)定性等的影響。得出以下結(jié)論:
(1)在靜態(tài)模型中,銷售價格與零售商效用隨渠道忠誠度的增加而增加,批發(fā)價格、綠色度以及制造商利潤隨渠道忠誠度的增加而減少,當渠道忠誠度大于0.298 時,銷售價格開始大于批發(fā)價格;當渠道忠誠度大于0.731 時,制造商利潤變?yōu)樨摂?shù),將會退出市場;對于零售商的風險規(guī)避行為來說,其數(shù)值越大對零售商越不利,對制造商卻起到了正向促進作用。
(2)在動態(tài)模型中,批發(fā)價格調(diào)整參數(shù)以及產(chǎn)品綠色度自適應(yīng)調(diào)整參數(shù)要維持在一定范圍內(nèi),才會保持系統(tǒng)穩(wěn)定,否則,過快的調(diào)整速度會使系統(tǒng)出現(xiàn)分岔甚至進入無序的混沌狀態(tài);當增加風險規(guī)避數(shù)值之后,批發(fā)價格的調(diào)整參數(shù)方向的穩(wěn)定域?qū)冃?,產(chǎn)品綠色度方向的調(diào)整參數(shù)穩(wěn)定域不變,系統(tǒng)整體的穩(wěn)定域?qū)⒖s小,即風險規(guī)避行為會使得系統(tǒng)變得更加不穩(wěn)定,更快地進入混沌狀態(tài),而且混沌狀態(tài)會使得決策者對后續(xù)的預(yù)測以及決策帶來許多誤差,不可避免地會對利潤產(chǎn)生一定的影響,批發(fā)價格及產(chǎn)品綠色度調(diào)整參數(shù)過快都會導致制造商利潤下降,產(chǎn)品綠色度調(diào)整參數(shù)會使零售商利潤下降。
在后續(xù)的研究中,可以考慮制造商和零售商都有風險規(guī)避行為時的博弈模型,以及以零售商主導的Stackelberg 博弈模型。