日毛吉,張愛萍
(1.西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,甘肅 蘭州 730030;2.城關(guān)區(qū)教師進(jìn)修學(xué)校附設(shè)小學(xué),甘肅 蘭州 730030)
動(dòng)態(tài)規(guī)劃主要是按照系統(tǒng)狀態(tài)而進(jìn)行時(shí)間與空間上的階段性控制,并運(yùn)用數(shù)學(xué)方法對(duì)各個(gè)階段的狀態(tài)進(jìn)行推算,并做出最終最具實(shí)效性、最佳經(jīng)濟(jì)效益的決策[2].在經(jīng)濟(jì)發(fā)展的不斷推動(dòng)下,各行各業(yè)的生產(chǎn)經(jīng)營(yíng)活動(dòng)的擴(kuò)張,增加了資金管理、資源管理、能源管理、人力資源管理、公共事業(yè)管理等的復(fù)雜程度,給管理科學(xué)提出了許多新的要求與問題,數(shù)學(xué)作為管理科學(xué)中數(shù)量分析方法的基礎(chǔ),解決這些問題具有獨(dú)特的思路和方法,其中動(dòng)態(tài)規(guī)劃的思想方法顯著的效果得到了廣泛的應(yīng)用[8,10].因?yàn)閯?dòng)態(tài)規(guī)劃的方法在處理某些比較復(fù)雜的問題進(jìn)行優(yōu)化時(shí),比整數(shù)規(guī)劃、目標(biāo)規(guī)劃,線性規(guī)劃和非線性規(guī)劃等用動(dòng)態(tài)規(guī)劃比其他方法更方便求解.但實(shí)施動(dòng)態(tài)規(guī)劃需要充足的資金支持和對(duì)管理系統(tǒng)進(jìn)行維護(hù),不僅對(duì)系統(tǒng)維護(hù)人員和維護(hù)費(fèi)用都需要資金的支持,還要有充足的人力、資金和物質(zhì)來保障的條件下才能有效進(jìn)行.動(dòng)態(tài)規(guī)劃管理在企業(yè)發(fā)展和市場(chǎng)競(jìng)爭(zhēng)力的提高中起著重要的作用,它可以優(yōu)化企業(yè)的管理過程,為企業(yè)的發(fā)展帶來重要的保障[1].
動(dòng)態(tài)規(guī)劃最初是由理查德·貝爾曼(Richard Bellman)在20世紀(jì)40年代提出的,是為了敘述并處理某一些比較特殊問題的過程,所以在該過程中不時(shí)地尋找最優(yōu)的決策方案.到1953年,Bellman繼續(xù)對(duì)動(dòng)態(tài)規(guī)劃問題進(jìn)行了推理分析,著重提出動(dòng)態(tài)規(guī)劃的作用是在較大的決策中代入較小的決策問題.1957年Bellman發(fā)表了很多學(xué)術(shù)論文,并出版了他的第一部著作《動(dòng)態(tài)規(guī)劃》,這本書成為當(dāng)時(shí)應(yīng)用和研究動(dòng)態(tài)規(guī)劃理論的唯一書籍.在Bellman與協(xié)助他的工作人員正在完善和推廣此方法的同時(shí),在時(shí)刻關(guān)注動(dòng)態(tài)規(guī)劃發(fā)展的其他的一些學(xué)者也對(duì)此做出了很大的功績(jī),其中貢獻(xiàn)最大的是Aris和Mitten.Aris在三年期間共出版了兩部涉及動(dòng)態(tài)規(guī)劃的著作,并在1964年與Wild.
Nemhauser聯(lián)手創(chuàng)立了解決分枝、循環(huán)性多階段決策系統(tǒng)的一套理論.
自從動(dòng)態(tài)規(guī)劃在我國(guó)應(yīng)用開始,很多學(xué)者對(duì)動(dòng)態(tài)規(guī)劃進(jìn)行了詳細(xì)的研究,2014年趙娟、樊超[3]對(duì)動(dòng)態(tài)規(guī)劃的使用方法進(jìn)行了詳細(xì)的描述;2015年梁聰剛、王鴻章[9]對(duì)供應(yīng)鏈與排序問題在動(dòng)態(tài)規(guī)劃的背景下進(jìn)行研究;2014年潘云濤[6]將動(dòng)態(tài)規(guī)劃與公共設(shè)施管理聯(lián)系在一起進(jìn)行研究.2015年程六滿、王柯敬[11]闡述了各行各業(yè)的企業(yè)都在管理應(yīng)用中加入取得到了廣泛的應(yīng)用.常淑芬[7]通過實(shí)際管理中的一些例子來闡述動(dòng)態(tài)規(guī)劃在管理中的應(yīng)用.而Mitten則提出的一些基礎(chǔ)性觀點(diǎn)后來也被應(yīng)用在動(dòng)態(tài)規(guī)劃的發(fā)展當(dāng)中,并對(duì)顯式動(dòng)態(tài)規(guī)劃路徑的數(shù)學(xué)性質(zhì)做出了很大的貢獻(xiàn).
一個(gè)過程的最優(yōu)策略具有這樣的性質(zhì),即無論其初始狀態(tài)及其初始策略如何,其以后諸決策對(duì)以第一個(gè)決策所形成的狀態(tài)作為初始狀態(tài)而言,必須構(gòu)成最優(yōu)策略[4,5].
基本步驟:
(1)將問題的求解過程恰當(dāng)?shù)胤殖扇舾呻A段,一段可按問題所處的空間或時(shí)間進(jìn)行分,并確定階段變量,對(duì)n個(gè)階段問題(k=1,2,...,n);
(2)正確地選擇狀態(tài)變量sk,它應(yīng)當(dāng)滿足無后效性等三個(gè)條件,并確定狀態(tài)集合sk;
(3)確定決策變量xk及階段的允許決策集合Dk(sk);
(4)寫出狀態(tài)轉(zhuǎn)移函數(shù)sk+1=Tk(sk,xk);
(5)由已知條件,得到指標(biāo)函數(shù)Fk,n,fk(sk),F1,n,f1(s1)由最優(yōu)化原理,列出
fk(sk)={Fk,n(sk)}=min{d(sk,xk)+fk+1,n(sk+1)}.
于是得基本方程
也稱為逆序法遞推公式.
由于查找最優(yōu)解優(yōu)方向與多階段決策過程的實(shí)際進(jìn)行方向相反,從最后一段開始計(jì)算逐段前推,求得全過程的最優(yōu)策略.
解:令第k階段初已有的狀態(tài)變量sk是分配給第k到第三個(gè)項(xiàng)目的金額;決策變量yk為投第k個(gè)項(xiàng)目的資金;狀態(tài)轉(zhuǎn)移方程為sk+1=sk-yk.初始狀態(tài)為sk時(shí),從第k到第三個(gè)項(xiàng)目的利潤(rùn)最大,第k階段的最優(yōu)指標(biāo)函數(shù)用gk(sk)表示,那么g1(s1)為所計(jì)算的總利潤(rùn).
遞推方程為:
k=3時(shí),
k=2時(shí),
設(shè)
當(dāng)k=1時(shí),
g2(s2)=9s2時(shí),
其次,穩(wěn)定供需關(guān)系,健全天然氣需求管理。建立天然氣發(fā)展綜合協(xié)調(diào)機(jī)制,推動(dòng)供用氣企業(yè)全面簽訂合同,鼓勵(lì)簽訂中長(zhǎng)期的供氣合同?!懊焊臍狻眻?jiān)持以氣定改,在落實(shí)氣源的前提下有規(guī)劃的推進(jìn)。突出京津冀及周邊重點(diǎn)區(qū)域,同時(shí)建立和完善天然氣領(lǐng)域信用體系,對(duì)嚴(yán)重違法失信行為實(shí)施聯(lián)合懲戒,健全天然氣供需側(cè)管理,準(zhǔn)確預(yù)測(cè)天然氣需求。
因此,最優(yōu)方案于投資第三個(gè)項(xiàng)目,最大利潤(rùn)為200萬元.
尋優(yōu)方向與過程的行進(jìn)方向相同,計(jì)算時(shí)從第一段開始逐段向后遞推,計(jì)算后一階段要用到前一段的求優(yōu)結(jié)果,最后一段計(jì)算的結(jié)果是全過程的最優(yōu)結(jié)果.
解:設(shè)第1到第k個(gè)項(xiàng)目投入的資金用狀態(tài)變量sk+1,那么s4=10,s3=s4-y3,s2=s3-y2.即狀態(tài)轉(zhuǎn)移方程:sk=sk+1-yk,令第k段投入的資金sk+1用最優(yōu)指標(biāo)函數(shù)gk(sk+1)表示,當(dāng)投入的資金sk+1時(shí),獲得第1到第k項(xiàng)目的最大利潤(rùn),故可得基本方程為:
因此,最優(yōu)解與逆序法是相同的,該公司只投資于第三項(xiàng)時(shí)才獲得最大利潤(rùn)200元.
例3.M集團(tuán)有5個(gè)新設(shè)備,將分配給下屬的三個(gè)分公司機(jī)構(gòu),利潤(rùn)如表1所示.那么,該集團(tuán)如何分配設(shè)備以實(shí)現(xiàn)總利潤(rùn)最大化.
表1 設(shè)備臺(tái)數(shù)及利潤(rùn)的關(guān)系
分析:管理的目標(biāo)是在最小成本下實(shí)現(xiàn)最大利潤(rùn),如何獲得有限資源的最優(yōu)配置是項(xiàng)目投資中要考慮的問題.
解:
(1)建立數(shù)學(xué)模型
令第i個(gè)分公司收到xi設(shè)備后得到的收益用目標(biāo)函數(shù)Ti表示,分配給第i個(gè)分公司的設(shè)備總數(shù)用決策變量xi表示,那么
設(shè)備分配給第k個(gè)分公司的過程為第k個(gè)階(k=1,2,3),狀態(tài)變量sk為分配給第k個(gè)分公司的設(shè)備總數(shù),0≤sk≤5,決策變量xk為分配給第k個(gè)分公司的設(shè)備數(shù),0≤xk≤sk,狀態(tài)轉(zhuǎn)移方程:
第k個(gè)分公司接受xk設(shè)備后得到的收益用階段目標(biāo)函數(shù)Tk(sk,xk)表示,將設(shè)備sk分配給第k個(gè)分公司到第n個(gè)分公司后到的總收益用最優(yōu)指標(biāo)函數(shù)gk(xk)表示.從而動(dòng)態(tài)規(guī)劃的基本方程為:
(2)遞序法求解
變量sk=0,1,…,5,xk=0,1,…,5,k=0,1,…,5.
(3)結(jié)論分析
求解得出最大利潤(rùn)g1(s1),然后按k=1,k=2,k=3.遞推,從而得出最優(yōu)策略有兩種方案:x1=0,x2=2,x3=3或x1=1,x2=2,x3=1.得到的結(jié)果可知,第三個(gè)分公司1臺(tái),分配給第二個(gè)和第三個(gè)分公司2臺(tái),或分配第一個(gè)分公司0臺(tái),第二個(gè)分公司2臺(tái)設(shè)備,第三個(gè)分公司3臺(tái)設(shè)備或分配給第一個(gè)分公司2臺(tái),該集團(tuán)的利潤(rùn)和為21萬元.
例4.服裝城使用倉(cāng)庫(kù)來專門銷售一種產(chǎn)品.倉(cāng)庫(kù)的最大容量可以儲(chǔ)存1000單位的貨物.如果服裝城每個(gè)月只能銷售倉(cāng)庫(kù)月的貨物.該服裝城在某月進(jìn)貨時(shí),貨物下月初能到,甲商品四個(gè)月的買賣價(jià)格如表2所示,若服裝城自一月銷售以來,倉(cāng)庫(kù)有商品500單位.該服裝城如何計(jì)劃一月至四月的進(jìn)購(gòu)與銷售,若不算庫(kù)存成本,使預(yù)期收益最大.
表2 買賣價(jià)格表
解:(1)變量說明
狀態(tài)變量sk:第k月初倉(cāng)庫(kù)中的存貨量;決策變量xk:第k月賣出的貨物數(shù)量;決策變量yk:第k月訂購(gòu)的貨物數(shù)量;狀態(tài)轉(zhuǎn)移方程:sk+1=sk+yk-xk;最優(yōu)指標(biāo)函數(shù)fk(sk):從第k月到4月末所獲得的最大收益.則有以下逆序遞推關(guān)系式:
(2)問題求解
x3=s3,y3=1000時(shí),有最大值,f3(s3)=60000+13s3;
得x2=0,y2=10000-s2,f2(s2)=6000+13s2+4000-4x2=10000+9s2;
得x1=500,y1=0,f1(500)=14500+3×500=16000.
表3 最優(yōu)策略表
(3)結(jié)論分析:第一月訂購(gòu)的貨物數(shù)量為0.賣出的貨物數(shù)量為500時(shí),則由逆序遞推得出最大利潤(rùn)為16000.
例5.時(shí)代設(shè)計(jì)公司一個(gè)機(jī)器設(shè)計(jì)出兩種不同價(jià)格產(chǎn)品的模型,機(jī)器一天內(nèi)可利用8小時(shí),設(shè)計(jì)兩種模型的任意一種都要占機(jī)器1小時(shí),令兩種模型售價(jià)與產(chǎn)量成線性關(guān)系.(10-s1)與(14-2s2)為該兩種產(chǎn)品的銷售價(jià)格,而s1,s2分別為兩種產(chǎn)品模型的產(chǎn)量,設(shè)兩種產(chǎn)品的成本分別為2s1和4s2,如何安排兩種產(chǎn)品模型的生產(chǎn)量才能使該電腦在8小時(shí)內(nèi)獲收益最大.
解:(1)問題分析:令y1是電腦可利用的,即s1=8,y2是生產(chǎn)第一種產(chǎn)品s1件后剩余的可利用的電腦時(shí)間,y3是生產(chǎn)第二種產(chǎn)品s2件后電腦可利用的時(shí)間.
(2)建立模型:因要求電腦用8小時(shí),所y3=0.于是狀態(tài)方程為:
由狀態(tài)方程y2=y1-s1代入上式得:
由此得到最優(yōu)策略生產(chǎn)第一種產(chǎn)品模型5件,第二種產(chǎn)品模型3件,8小時(shí)可獲收益27百元.
例6.全自動(dòng)洗衣機(jī)的平均一年的更新凈費(fèi)以及維修費(fèi)用、效益表4所示,如何在接下來五年內(nèi)制定更新戰(zhàn)略,以實(shí)現(xiàn)總利潤(rùn)最大化.
表4 更新凈費(fèi)和維修費(fèi)、效益用表
解:當(dāng)k=5時(shí),狀態(tài)變量r5可取1,2,3,4
當(dāng)k=4時(shí),狀態(tài)變量r4可取 1,2,3,
當(dāng)k=3時(shí),狀態(tài)變量r3可取1,2,
當(dāng)k=2時(shí),狀態(tài)變量r3只取1,
當(dāng)k=1時(shí),狀態(tài)變量r3只取0,
所以最優(yōu)策略為:{K,Q,Q,Q,K},即第一年初購(gòu)買的全自動(dòng)洗衣機(jī)到第2、3、4初各更新一次,可用到第5年末,總利潤(rùn)為17千元.
通過對(duì)動(dòng)態(tài)規(guī)劃在管理等方面的應(yīng)用得知,利用動(dòng)態(tài)規(guī)劃解決某些多階段決策問題,它的思路清晰、簡(jiǎn)單、容易實(shí)現(xiàn).在一般情況下,將一個(gè)大問題拆分成若干個(gè)小問題時(shí),利用數(shù)學(xué)算法的方式找到解決每一個(gè)分問題的最優(yōu)方法,從而解決一些較大的問題.若在管理的工作中融入動(dòng)態(tài)規(guī)劃的思想方法,可以為企業(yè)的銷售管理、生產(chǎn)管理、經(jīng)營(yíng)管理、資源分配等領(lǐng)域的發(fā)展提供有效決策,并且為企業(yè)規(guī)劃人員、處理數(shù)據(jù)和監(jiān)督檢查等部署業(yè)務(wù)做出合理的判斷和分析,更新管理方法和優(yōu)化企業(yè)管理手段,從而提高企業(yè)經(jīng)營(yíng)各個(gè)環(huán)節(jié)的效率和應(yīng)變能力,實(shí)現(xiàn)企業(yè)經(jīng)濟(jì)效益增長(zhǎng),就會(huì)給企業(yè)的管理工作帶來極大的方便.