◆胡雪嬌 王艷萍 劉繼升 馬國(guó)棟 李慧
教育裝備是現(xiàn)代教育教學(xué)的重要手段,是改善學(xué)校的辦學(xué)水平、提高教學(xué)質(zhì)量和效率的重要途徑[1]。先進(jìn)的教育裝備為學(xué)校提供了豐富的教學(xué)資源和良好的教學(xué)環(huán)境,在培養(yǎng)學(xué)生創(chuàng)新精神和實(shí)踐能力方面起到重要作用。
近年來,學(xué)校在教育裝備方面的投資逐漸增大,增添和更新了許多教學(xué)設(shè)施。因此,在當(dāng)前的教育教學(xué)中,教育裝備已經(jīng)成為教學(xué)過程中不可缺少的重要條件。由于教育裝備的理論研究還不成熟,學(xué)校對(duì)教育裝備的管理還處于初級(jí)階段,使得教育裝備不能發(fā)揮應(yīng)有的使用效能[2-3]。
為保障教學(xué)質(zhì)量,滿足教育需求,學(xué)校需要及時(shí)對(duì)教育裝備進(jìn)行更新和維護(hù)。由于教育裝備經(jīng)費(fèi)有限,因此在決定是否對(duì)裝備進(jìn)行更新時(shí),要考慮裝備更新的成本以及舊裝備維修費(fèi)用等問題。教育裝備更新問題屬于教育裝備資源分配的一種,而教育裝備資源分配中的許多決策優(yōu)化問題屬于多階段決策問題,動(dòng)態(tài)規(guī)劃是求解多階段決策問題的有效工具[4]。本文將隨機(jī)性動(dòng)態(tài)規(guī)劃應(yīng)用于教育裝備更新問題,以確定一種裝備在使用多少年后更新,使得某段時(shí)間內(nèi)總費(fèi)用達(dá)到最小,為教育裝備的更新提供最優(yōu)化策略。
動(dòng)態(tài)規(guī)劃(Dynamic Programming)是運(yùn)籌學(xué)的一個(gè)重要分支,它是1951年由美國(guó)數(shù)學(xué)家R.Bellman等人創(chuàng)立的用來解決多階段決策過程優(yōu)化問題的一種方法[5]。所謂多階段決策問題,就是將問題劃分為若干個(gè)相互聯(lián)系的階段,每個(gè)階段都有一組可供選取的決策,當(dāng)決策確定后,下階段的初始狀態(tài)也隨之確定。動(dòng)態(tài)規(guī)劃的特點(diǎn)是將多階段決策問題變換為一系列相互聯(lián)系的單階段問題,然后逐個(gè)加以解決[6]。其基本概念如下:
1)階段:根據(jù)時(shí)間順序或空間特征將問題劃分為若干個(gè)相互聯(lián)系的子問題,這些子問題即為階段。描述階段的變量稱為階段變量,通常用k表示,n表示階段的個(gè)數(shù),當(dāng)某個(gè)問題被劃分為n個(gè)階段時(shí),其階段變量為k=1,2,…,n。
2)狀態(tài):每個(gè)階段在開始時(shí)所處的狀況。通常用Sk表示每個(gè)狀態(tài)的變量。
3)決策:當(dāng)問題處于某個(gè)階段的某個(gè)狀態(tài)時(shí),決策者做出的決定使該狀態(tài)演變到下一個(gè)狀態(tài),這種決定就稱為決策。通常用Uk(Sk)表示決策變量,即為階段k的狀態(tài)為Sk時(shí)的決策變量。
4)狀態(tài)轉(zhuǎn)移方程:描述過程由一個(gè)狀態(tài)到另一個(gè)狀態(tài)的轉(zhuǎn)變過程。反映這種演變過程的公式記為:
5)策略:是由各個(gè)階段的決策按順序排列組成的。由k階段開始到終止?fàn)顟B(tài)的決策按順序排列組成的序列稱為k子過程策略,記為:
6)指標(biāo)函數(shù):指標(biāo)函數(shù)包括階段指標(biāo)函數(shù)和過程指標(biāo)函數(shù)[7-8]。階段指標(biāo)函數(shù)記為gk(Sk,Uk),它表示在第k階段處于Sk狀態(tài)下,使用決策Uk后產(chǎn)生的效應(yīng)。過程指標(biāo)函數(shù)是用來描述實(shí)現(xiàn)過程效果優(yōu)劣的數(shù)量指標(biāo),記為Vk(Sk,Uk),是各個(gè)階段的指標(biāo)函數(shù)的累積。
7)最優(yōu)指標(biāo)函數(shù):指從某一階段開始到終止階段選取最優(yōu)策略得到的指標(biāo)函數(shù)值,記為:
opt即最優(yōu)化optimization,根據(jù)具體問題可取max或min[9]。
根據(jù)決策過程所面臨的方案是否確定,可以將動(dòng)態(tài)規(guī)劃分為確定性動(dòng)態(tài)規(guī)劃和隨機(jī)性動(dòng)態(tài)規(guī)劃[10]。由于教育裝備在使用過程每年受到的磨損程度不同,需要的維修費(fèi)也不同,根據(jù)每個(gè)階段裝備的受損程度來判斷是否進(jìn)行更新,因此,采用隨機(jī)性動(dòng)態(tài)規(guī)劃制定更新策略。
假設(shè)某一種裝備的使用規(guī)劃是n年,隨著使用年數(shù)的增加,需要的維修費(fèi)用和更換新設(shè)備使用的費(fèi)用也隨之增加。以年為單位,將裝備更新問題看作多階段發(fā)展的問題,則在每年年初都有兩種決策可以選擇:維修后繼續(xù)使用或進(jìn)行更新。則設(shè):
R表示更新設(shè)備;
K表示繼續(xù)使用;
Sk表示狀態(tài)變量,k表示裝備使用的年數(shù)(k=1,2,…,n);
R(Sk)表示第k年初裝備的維修費(fèi)用;
Ck表示第k年初更新裝備的費(fèi)用;
fk(Sk)表示裝備使用了k年后的最優(yōu)指標(biāo)函數(shù);
xk為決策變量,在每一階段每一狀態(tài)所需作出的決策只有兩個(gè),繼續(xù)使用(Keep)或更新(Replacement),則裝備更新問題的狀態(tài)轉(zhuǎn)移方程為:
當(dāng)決策繼續(xù)使用時(shí),函數(shù)指標(biāo)值為R( Sk)+fk+1(Sk+1);當(dāng)決策更新時(shí),函數(shù)指標(biāo)值為Ck+R(0)+fk+1(1)。則最優(yōu)指標(biāo)函數(shù)為:
某學(xué)校的某種裝備已使用一年,為保障教學(xué)效率,學(xué)校需要考慮該裝備在5年內(nèi)的更新問題。因此,學(xué)校要在每年年初做出決策,是繼續(xù)使用還是更新。已知該種裝備在使用不同年限后,每年所需的維修費(fèi)用和更新費(fèi)用(單位:百元)分別如表1和表2所示。為確保使用經(jīng)費(fèi)最少,學(xué)校需要做出5年內(nèi)每年的更新策略。
表1 裝備維修費(fèi)用表
表2 裝備更新價(jià)格表
根據(jù)1.2節(jié)建立的隨機(jī)性動(dòng)態(tài)規(guī)劃模型求解本例,首先將問題分為5個(gè)階段,每年為一階段。狀態(tài)變量Sk表示為第k年年初裝備使用的年限(k=1,2,3,4,5),如S1=1表示裝備已使用了一年;S2=1則表示上一年設(shè)備進(jìn)行了更新,新裝備從第二年年初開始使用;S2=1則表示上一年設(shè)備繼續(xù)使用。
其次,根據(jù)表1和表2可以得到每個(gè)階段的維修費(fèi)用和更新費(fèi)用如表3所示。
表3 裝備維修費(fèi)用和更新價(jià)格表
再次,根據(jù)公式(5)可以得到不同狀態(tài)下的最優(yōu)指標(biāo)函數(shù):
穩(wěn)態(tài)調(diào)節(jié)是對(duì)動(dòng)植物生命活動(dòng)的調(diào)節(jié),在植物生長(zhǎng)過程中會(huì)通過生長(zhǎng)素或其他相關(guān)激素來對(duì)其生命進(jìn)行調(diào)節(jié),而動(dòng)物則會(huì)利用體液和神經(jīng)調(diào)節(jié)的方式進(jìn)行有序的生命活動(dòng)。在種植水果或蔬菜時(shí),人們會(huì)利用催熟劑來促進(jìn)植物快速生長(zhǎng),如乙烯具有催熟果實(shí)的重要作用。而人在調(diào)節(jié)身體平衡狀態(tài)時(shí),都是通過自身免疫力的調(diào)節(jié)來預(yù)防疾病發(fā)生,如食用維生素。以上都是生活中常見的穩(wěn)態(tài)調(diào)節(jié)。
用逆序遞推法求問題的最優(yōu)解。
當(dāng)k=5時(shí),S5=1,2,3,4,5。
根據(jù)公式(6)可得到f5( S5)在S5取不同值時(shí)的指標(biāo)值,見表4。
表4 第五階段決策表
當(dāng)k=4時(shí),S4=1,2,3,4。
根據(jù)公式(6)可得到 f4(S4)在S4取不同值時(shí)的指標(biāo)值,見表5。
?
當(dāng)k=3時(shí),S3=1,2,3。
表6 第三階段決策表
當(dāng)k=2時(shí),S2=1,2。
根據(jù)公式(6)可得到f2(S2)在S2取不同值時(shí)的指標(biāo)值,見表7。
表7 第二階段決策表
當(dāng)k=1時(shí),S1=1。
根據(jù)公式(6)可得到 f1( S1)在S1取不同值時(shí)的指標(biāo)值,見表8。
根據(jù)求解結(jié)果可以得到該種裝備更新的最優(yōu)決策為:第一年繼續(xù)使用,第二年繼續(xù)使用,第三年更新,第四年繼續(xù)使用,第五年繼續(xù)使用,使用的總費(fèi)用為5100元。
表8 第一階段決策表
教育裝備更新是學(xué)校在管理教育裝備過程中必然遇到的問題,裝備何時(shí)更新才能保證使用的教育經(jīng)費(fèi)最低是學(xué)校考慮的最重要的問題。從經(jīng)濟(jì)角度考慮,舊裝備每年的維修費(fèi)用不斷增加,新裝備雖然有較低的維修費(fèi)用,但初始投資大。因此,本文利用動(dòng)態(tài)規(guī)劃的最優(yōu)化原理,通過比較每年舊裝備的維修費(fèi)用和更新裝備費(fèi)用的大小,只有當(dāng)更新裝備的費(fèi)用小于舊裝備的維修費(fèi)用時(shí),才對(duì)舊裝備進(jìn)行更新,使得教育經(jīng)費(fèi)的消耗最低。
[1]許成果.教育裝備效能綜合評(píng)價(jià)研究[D].北京:首都師范大學(xué),2007.
[2]艾倫,興喬.話說裝備(二):教育裝備理論研究的必要性[J].中國(guó)教育技術(shù)裝備,2012(14):9-10.
[3]艾倫,姚玉琴,等.教育裝備從經(jīng)驗(yàn)管理走向科學(xué)管理[J].中國(guó)教育技術(shù)裝備,2009(32):17.
[4]李慧.教育裝備運(yùn)籌規(guī)劃[M].北京:北京大學(xué)出版社,2010.
[5]姜啟源.數(shù)學(xué)模型[M].北京:高等教育出版社,2003.
[6]朱麗娜,馬家余.淺論動(dòng)態(tài)規(guī)劃優(yōu)化模型在設(shè)備更新中的應(yīng)用[J].沿海企業(yè)與科技,2006(3):71-72.
[7]胡運(yùn)權(quán),郭耀煌.運(yùn)籌學(xué)教程[M].北京:清華大學(xué)出版社,2003.
[8]吳強(qiáng).基于動(dòng)態(tài)規(guī)劃的供應(yīng)鏈整合[J].科技創(chuàng)業(yè)月刊,2006(8):77-78.
[9]楊克昌.動(dòng)態(tài)規(guī)劃最優(yōu)化路徑搜索設(shè)計(jì)[J].岳陽師范學(xué)院學(xué)報(bào):自然科學(xué)版,2000(13):55-58.
[10]麻榮永.水電站水庫(kù)隨機(jī)優(yōu)化方法[M].北京:中國(guó)水利水電出版社,2001.