国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

制造企業(yè)零庫(kù)存管理物資調(diào)度方法研究

2019-09-20 09:33汪黎明
價(jià)值工程 2019年23期
關(guān)鍵詞:制造企業(yè)

汪黎明

摘要:制造企業(yè)為減少庫(kù)存成本、優(yōu)化資金結(jié)構(gòu)實(shí)施零庫(kù)存管理,在生產(chǎn)經(jīng)營(yíng)過(guò)程中如何高效調(diào)度物資使倉(cāng)儲(chǔ)保持零庫(kù)存動(dòng)態(tài)平衡是后續(xù)需要解決的難題。以制造企業(yè)倉(cāng)儲(chǔ)部門(mén)為研究對(duì)象,在零庫(kù)存管理思想指導(dǎo)下,提出一種基于Q學(xué)習(xí)的零庫(kù)存物資調(diào)度方法,并用實(shí)驗(yàn)驗(yàn)證方法的有效性,以期提高制造企業(yè)倉(cāng)儲(chǔ)管理效率,減少人為誤差,為實(shí)施零庫(kù)存管理提供后續(xù)技術(shù)支持。

Abstract: In order to reduce the cost of inventory and optimize the capital structure, the manufacturing enterprise implements zero inventory management. In the process of production and operation, how to efficiently dispatch materials to keep the dynamic balance of zero inventory is a difficult problem to be solved later. Taking the warehouse department of manufacturing enterprises as the research object, under the guidance of zero inventory management thought, a zero inventory material scheduling method based on Q-learning is proposed, and the effectiveness of the method was verified by experiments, in order to improve the efficiency of warehouse management and reduce human error. Provide follow-up technical support for implementing zero inventory management.

關(guān)鍵詞:零庫(kù)存管理;物資調(diào)度;Q學(xué)習(xí);制造企業(yè)

Key words: zero inventory management;material dispatching;Q-learning;manufacturing enterprise

中圖分類號(hào):F253.4 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào):1006-4311(2019)23-0126-04

0 ?引言

庫(kù)存是企業(yè)生產(chǎn)管理的重要組成部分,儲(chǔ)備著原材料、中間產(chǎn)品和產(chǎn)成品,適量的庫(kù)存對(duì)企業(yè)的正常運(yùn)作發(fā)揮著重要作用,如維持生產(chǎn)銷售穩(wěn)定,平衡企業(yè)物流與流通資金的占用等[1]。然而,多余的庫(kù)存會(huì)增加成本、占用企業(yè)大量資金,并掩蓋生產(chǎn)經(jīng)營(yíng)中的很多問(wèn)題。制造企業(yè)在我國(guó)經(jīng)濟(jì)發(fā)展中扮演著重要角色,庫(kù)存成本控制能夠提高企業(yè)的管理效率和經(jīng)濟(jì)效益,一直以來(lái)降低庫(kù)存成本成為企業(yè)想要達(dá)到的目標(biāo),也是學(xué)術(shù)界研究的熱點(diǎn)。零庫(kù)存管理(Zero Inventory Management)是一種特殊的管理理念,它并不是指庫(kù)存物資的數(shù)量為零,而是通過(guò)特殊的管理控制策略,使庫(kù)存量最小化,維持在一個(gè)對(duì)企業(yè)最有利的水平上。制造企業(yè)科學(xué)應(yīng)用零庫(kù)存管理,能夠降低成本、提高質(zhì)量、縮短產(chǎn)品生產(chǎn)周期,使其能夠快速響應(yīng)市場(chǎng)需求、提高企業(yè)競(jìng)爭(zhēng)力。

對(duì)于制造企業(yè)零庫(kù)存管理的研究,主要集中在以下幾個(gè)方面:①零庫(kù)存管理的可行性與風(fēng)險(xiǎn)研究。吳丹潔等[2]、黃文杰等[3]從經(jīng)營(yíng)環(huán)境、供應(yīng)商、供應(yīng)鏈、信息系統(tǒng)、不可控因素等方面闡述了企業(yè)實(shí)施零庫(kù)存管理的可行性,并對(duì)各方面存在的風(fēng)險(xiǎn)隱患提出了相應(yīng)對(duì)策。②零庫(kù)存管理的問(wèn)題與對(duì)策研究。陳宏佳[4]針對(duì)我國(guó)企業(yè)照搬豐田汽車公司零庫(kù)存管理模式產(chǎn)生的存貨管理失控和出庫(kù)數(shù)據(jù)不準(zhǔn)確影響核算準(zhǔn)確性等問(wèn)題提出了改進(jìn)措施。屈冠林[5]全面剖析零庫(kù)存的含義,提出企業(yè)實(shí)施零庫(kù)存管理的原則和充分利用第三方物流服務(wù)、協(xié)作生產(chǎn)、實(shí)行看板管理等實(shí)現(xiàn)零庫(kù)存的途徑。③零庫(kù)存管理實(shí)現(xiàn)方式研究。王涵等[6]、廖華昌[7]、朱文英等[8]以不同類型的制造企業(yè)為研究對(duì)象,在深度理解零庫(kù)存管理理論基礎(chǔ)上,從規(guī)范庫(kù)存管理流程、業(yè)務(wù)流程特點(diǎn)、供應(yīng)鏈等角度對(duì)零庫(kù)存管理進(jìn)行實(shí)踐探索。④零庫(kù)存管理的其他研究。潘燕華等[9]使用層次分析法構(gòu)建零庫(kù)存管理物資類別選擇決策優(yōu)化模型,研究某一物資類別是否適用于零庫(kù)存管理。

綜上所述,現(xiàn)階段學(xué)術(shù)界大都從企業(yè)或供應(yīng)鏈等宏觀視角出發(fā)研究零庫(kù)存管理的可行性、風(fēng)險(xiǎn)、對(duì)策措施、實(shí)現(xiàn)方式等方面,對(duì)于制造企業(yè)實(shí)施零庫(kù)存管理后倉(cāng)儲(chǔ)部門(mén)如何調(diào)度物資保持零庫(kù)存狀態(tài)的問(wèn)題則沒(méi)有涉及。在企業(yè)實(shí)際生產(chǎn)經(jīng)營(yíng)過(guò)程中,庫(kù)存不可能一直保持不變,故實(shí)行零庫(kù)存管理后調(diào)度物資在動(dòng)態(tài)情況下保持平衡是非常重要的,我國(guó)大多數(shù)制造企業(yè)仍采用以人為主的傳統(tǒng)庫(kù)存管理模式,由于出入庫(kù)頻繁、人為誤差大等因素,該模式不僅需要較高的人力成本,且存在管理流程不規(guī)范、庫(kù)存信息不完整等問(wèn)題,企業(yè)信息系統(tǒng)應(yīng)用程度不高,零庫(kù)存管理下倉(cāng)儲(chǔ)物資調(diào)度缺乏規(guī)范有效的指導(dǎo)方法。本文提出一種基于Q學(xué)習(xí)(Q-Learning)的制造企業(yè)零庫(kù)存管理倉(cāng)儲(chǔ)物資調(diào)度方法,依據(jù)零庫(kù)存管理思想與Q學(xué)習(xí)算法,結(jié)合制造企業(yè)倉(cāng)儲(chǔ)部門(mén)特點(diǎn),設(shè)計(jì)方法需要的各項(xiàng)參數(shù)、函數(shù),輸出結(jié)果為調(diào)度物資達(dá)到零庫(kù)存狀態(tài)的全局最優(yōu)策略,最后用實(shí)際案例驗(yàn)證方法的有效性。

1 ?方法概述

1.1 Q學(xué)習(xí)算法

Q學(xué)習(xí)(Q-learning)算法是一種與模型無(wú)關(guān)的強(qiáng)化學(xué)習(xí)算法,以馬爾科夫決策過(guò)程(Markov decision processes, MDPs)為理論基礎(chǔ)[10]。標(biāo)準(zhǔn)的馬爾科夫決策過(guò)程可以用一個(gè)五元組表示,其中:S是一個(gè)離散有界的狀態(tài)空間;A是一個(gè)離散的動(dòng)作空間;P為狀態(tài)轉(zhuǎn)移概率函數(shù),表示agent在狀態(tài)s下選取動(dòng)作a后轉(zhuǎn)移到s'的概率;R為回報(bào)函數(shù),用于計(jì)算agent由當(dāng)前狀態(tài)s選取動(dòng)作a后轉(zhuǎn)移到下一狀態(tài)s'得到的立即回報(bào)值,由當(dāng)前狀態(tài)和選取的動(dòng)作決定,體現(xiàn)了馬爾科夫性的特點(diǎn);γ∈[0,1]是折扣因子,用于確定延遲回報(bào)與立即回報(bào)的相對(duì)比例,γ越大表明延遲回報(bào)的重要程度越高。馬爾科夫決策問(wèn)題的目標(biāo)是找到一個(gè)策略π:S→A,使其回報(bào)函數(shù)R(s,a)的長(zhǎng)期累積值的數(shù)學(xué)期望

最大。其中,策略π只和狀態(tài)相關(guān),與時(shí)間無(wú)關(guān)(靜態(tài)的)。st是t時(shí)刻的環(huán)境狀態(tài),at是t時(shí)刻選擇的動(dòng)作。根據(jù)Bellman最優(yōu)準(zhǔn)則,得到最優(yōu)策略π*對(duì)應(yīng)的最優(yōu)指標(biāo)為[11]:

其中,R(s,a)為R(st,at)的數(shù)學(xué)期望,Ps,a(s')為在狀態(tài)s下選取動(dòng)作a后轉(zhuǎn)移到下一狀態(tài)狀態(tài)s'的概率。由于倉(cāng)庫(kù)環(huán)境中狀態(tài)之間的轉(zhuǎn)移概率P不容易獲得,直接學(xué)習(xí)π*:S→A是很困難的,而Q學(xué)習(xí)不需要獲取轉(zhuǎn)移概率P,因而本文采用Q學(xué)習(xí)算法解決此類具有馬爾可夫性的倉(cāng)儲(chǔ)物資調(diào)度問(wèn)題。

Q學(xué)習(xí)是一種與環(huán)境無(wú)關(guān)的算法,是一種基于數(shù)值迭代的動(dòng)態(tài)規(guī)劃方法[12]。定義一個(gè)Q函數(shù)作為評(píng)估函數(shù):

評(píng)估函數(shù)Q(s,a)的函數(shù)值是從狀態(tài)s開(kāi)始選擇第一個(gè)動(dòng)作a執(zhí)行后獲得的最大累積回報(bào)的折算值,通俗地說(shuō),Q值等于立即回報(bào)值R(s,a)加上遵循最優(yōu)策略的折算值,此時(shí)的最優(yōu)策略可改寫(xiě)為:

該策略表達(dá)式的意義在于:如果agent用Q函數(shù)代替Vπ函數(shù),就可以不考慮轉(zhuǎn)移概率P,只考慮當(dāng)前狀態(tài)s的所有可供選擇的動(dòng)作a,并從中選出使Q(s,a)最大的動(dòng)作,即agent對(duì)當(dāng)前狀態(tài)的部分Q值做出多次反應(yīng),便可以選出動(dòng)作序列,使全局最優(yōu)化。在Q學(xué)習(xí)中,agent由初始狀態(tài)轉(zhuǎn)移到目標(biāo)狀態(tài)的過(guò)程稱為“Episode”,即“場(chǎng)景”。Q函數(shù)可以表示為以下的迭代形式進(jìn)行Q矩陣的更新:

在每一步的迭代中,上式又可寫(xiě)為:

即Q矩陣(st,at)位置元素的值等于回報(bào)函數(shù)R的相應(yīng)值加上折扣因子γ乘以轉(zhuǎn)換到下一個(gè)狀態(tài)后最大的Q值。

上述的Q學(xué)習(xí)算法可以看出,當(dāng)劃分的狀態(tài)有限時(shí),每一節(jié)隨機(jī)選擇的初始狀態(tài)s在算法的指導(dǎo)下探索環(huán)境,最終一定可以到達(dá)目標(biāo)狀態(tài)s*,回報(bào)函數(shù)R(s,a)是有界的,并且動(dòng)作的選擇能夠使每個(gè)狀態(tài)映射到動(dòng)作對(duì)的訪問(wèn)是無(wú)限頻率,則整個(gè)學(xué)習(xí)過(guò)程就能夠訓(xùn)練出來(lái)。Q學(xué)習(xí)通過(guò)對(duì)環(huán)境的不斷探索,積累歷史經(jīng)驗(yàn),agent通過(guò)不斷試錯(cuò)來(lái)強(qiáng)化自身,最終可以達(dá)到自主選擇最優(yōu)動(dòng)作的目標(biāo),即不論出于何種狀態(tài),都可給出到達(dá)目標(biāo)狀態(tài)的最優(yōu)選擇路徑,該算法中環(huán)境和動(dòng)作相互影響,動(dòng)作的選擇影響環(huán)境狀態(tài),環(huán)境也可以通過(guò)強(qiáng)化回報(bào)函數(shù)R(s,a)來(lái)反饋動(dòng)作的優(yōu)劣性,影響動(dòng)作的選擇[13]。

1.2 基于Q學(xué)習(xí)的零庫(kù)存物資調(diào)度方法

根據(jù)Q學(xué)習(xí)理論和制造企業(yè)倉(cāng)儲(chǔ)環(huán)境實(shí)際情況,本文對(duì)庫(kù)存管理方法的系統(tǒng)狀態(tài)、動(dòng)作選擇、回報(bào)函數(shù)、評(píng)估矩陣等設(shè)計(jì)如下:

1.2.1 系統(tǒng)狀態(tài)

在實(shí)際的庫(kù)存問(wèn)題中,對(duì)于可以進(jìn)行零庫(kù)存管理的物資,根據(jù)其具體狀況進(jìn)行狀態(tài)的劃分,這是方法應(yīng)用的第一步。通常影響狀態(tài)劃分的因素有:物資的計(jì)量單位,零庫(kù)存狀態(tài)時(shí)物資之間是否有相互關(guān)系,物資的物理狀態(tài)是否會(huì)發(fā)生改變等。本文為了將倉(cāng)儲(chǔ)環(huán)境劃分為有限狀態(tài),一方面,庫(kù)存的變化量默認(rèn)以整數(shù)為單位,實(shí)現(xiàn)離散化處理;另一方面,零庫(kù)存狀態(tài)是唯一的,也就是說(shuō)達(dá)到零庫(kù)存狀態(tài)時(shí)各種物資的量是一定的,零庫(kù)存狀態(tài)可采用機(jī)器學(xué)習(xí)方法從歷史數(shù)據(jù)中訓(xùn)練得到。

1.2.2 動(dòng)作選擇

環(huán)境劃分為有限個(gè)狀態(tài),狀態(tài)之間相互聯(lián)系,可以設(shè)計(jì)動(dòng)作實(shí)現(xiàn)狀態(tài)的轉(zhuǎn)移。在訓(xùn)練過(guò)程中,采用隨機(jī)動(dòng)作作為選擇策略,任一動(dòng)作被選中的概率相同。動(dòng)作即管理人員調(diào)整庫(kù)存物資的行為,用a表示,動(dòng)作空間A表示所有可能動(dòng)作的集合。

1.2.3 回報(bào)函數(shù)R

在Q學(xué)習(xí)算法中,回報(bào)函數(shù)R(s,a)設(shè)計(jì)的好壞直接影響著學(xué)習(xí)訓(xùn)練的效果,通過(guò)設(shè)計(jì)回報(bào)函數(shù)可以將從歷史數(shù)據(jù)中學(xué)習(xí)到的先驗(yàn)知識(shí)應(yīng)用到學(xué)習(xí)過(guò)程中。在物資調(diào)度問(wèn)題中,希望每一場(chǎng)景中agent可以盡快達(dá)到零庫(kù)存最優(yōu)狀態(tài),同時(shí)希望Q矩陣盡快收斂。本方法將狀態(tài)與動(dòng)作抽象到二維或多維空間,用點(diǎn)和線表示,回報(bào)函數(shù)設(shè)計(jì)為三部分,第一部分對(duì)agent當(dāng)前狀態(tài)到目標(biāo)狀態(tài)的距離進(jìn)行懲罰(即靠近目標(biāo)位置會(huì)獲得獎(jiǎng)勵(lì)),第二部分對(duì)agent到達(dá)目標(biāo)狀態(tài)進(jìn)行巨額獎(jiǎng)勵(lì),第三部分對(duì)agent超出庫(kù)存狀態(tài)限定范圍進(jìn)行巨額懲罰(狀態(tài)空間是有界)。

單從數(shù)值上看,第一、三部分的回報(bào)值遠(yuǎn)遠(yuǎn)大于第二部分,故agent在面臨選擇時(shí),零庫(kù)存狀態(tài)處于最高優(yōu)先級(jí),而選擇使?fàn)顟B(tài)超出限定范圍的動(dòng)作的可能性趨于0。第二部分回報(bào)值設(shè)置為負(fù),越靠近目標(biāo)狀態(tài),則回報(bào)值越大,這樣設(shè)置的意義在于,該算法的最終目標(biāo)是使庫(kù)存達(dá)到零庫(kù)存狀態(tài),而不僅僅是為了縮短與目標(biāo)狀態(tài)間的距離,添加距離懲罰機(jī)制,有助于提高學(xué)習(xí)效率,可以防止agent為獲取回報(bào)而產(chǎn)生不必要的移動(dòng)。

1.2.4 評(píng)估矩陣Q

agent對(duì)環(huán)境不斷探索、試錯(cuò),Q矩陣相當(dāng)于它的大腦,記錄每一場(chǎng)景得到的信息,使用公式(6)對(duì)Q矩陣進(jìn)行更新,不斷訓(xùn)練直到Q矩陣收斂。訓(xùn)練的基本思路如圖1所示。

基于算法思想,訓(xùn)練Q矩陣的具體流程如下:

步驟1.初始化倉(cāng)庫(kù)環(huán)境:抽象倉(cāng)儲(chǔ)環(huán)境,根據(jù)管理的各種物資的實(shí)際情況設(shè)計(jì)狀態(tài)空間和動(dòng)作空間。

步驟2.初始化算法參數(shù):最大訓(xùn)練周期數(shù)(每一場(chǎng)景即為一個(gè)周期),折扣因子γ,即時(shí)回報(bào)函數(shù)R和評(píng)估矩陣Q。

步驟3.隨機(jī)選擇一個(gè)初始狀態(tài)s。

步驟4.在當(dāng)前狀態(tài)s的所有可能動(dòng)作中隨機(jī)選擇一個(gè)動(dòng)作a,選擇每一動(dòng)作的概率相等。

步驟5.當(dāng)前狀態(tài)s選取動(dòng)作a后到達(dá)狀態(tài)s'。

步驟6.對(duì)于下一狀態(tài)s',根據(jù)其所有可能的動(dòng)作,以下式更新Q矩陣:

步驟7.設(shè)置下一狀態(tài)為當(dāng)前狀態(tài):s'→s。若s未達(dá)到目標(biāo)狀態(tài),則轉(zhuǎn)步驟4。

步驟8.如果算法未達(dá)到最大訓(xùn)練周期數(shù),轉(zhuǎn)步驟3進(jìn)入下一場(chǎng)景。否則結(jié)束訓(xùn)練,此時(shí)得到訓(xùn)練完畢的收斂Q矩陣。

在上述算法中,Q矩陣訓(xùn)練到一定場(chǎng)景數(shù)后收斂,故最大周期數(shù)應(yīng)設(shè)置的足夠大,保證算法結(jié)束后Q矩陣已收斂,根據(jù)Q矩陣輸出agent的最優(yōu)動(dòng)作序列。

2 ?實(shí)驗(yàn)與分析

2.1 實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置

本文以制造企業(yè)小型倉(cāng)儲(chǔ)問(wèn)題為例,介紹該方法的具體實(shí)施步驟,分析結(jié)果并對(duì)其可行性進(jìn)行闡述。案例描述如下:假設(shè)某倉(cāng)庫(kù)存儲(chǔ)A、B兩種物資,均可進(jìn)行零庫(kù)存管理,倉(cāng)儲(chǔ)環(huán)境的約束條件為:

當(dāng)且僅當(dāng)A、B的庫(kù)存量分別為2單位和3單位時(shí)庫(kù)存達(dá)到最優(yōu)狀態(tài)(即零庫(kù)存狀態(tài),此目標(biāo)狀態(tài)可利用機(jī)器學(xué)習(xí)的方法處理歷史數(shù)據(jù)得到),每種物資均可通過(guò)消耗、轉(zhuǎn)移等方式進(jìn)行調(diào)整(減少1單位,保持不變或者增加1單位)。

根據(jù)已知條件,設(shè)A和B的庫(kù)存量為wA和wB,wA∈[0,10],wB∈[0,10]且均為整數(shù),倉(cāng)儲(chǔ)環(huán)境里每一個(gè)狀態(tài)均由兩物資的庫(kù)存量共同組成,即S=(wA,wB),共11×11個(gè)狀態(tài),零庫(kù)存狀態(tài)設(shè)置為s*=(2,3)。物資A、B的庫(kù)存量變化分為三種情況:-1、0、+1,設(shè)計(jì)動(dòng)作要綜合二者的變化,故共有32種動(dòng)作 ,所有可能動(dòng)作的集合記為A,表示如下:

動(dòng)作即為庫(kù)存量變化的組合,為方便后續(xù)程序的索引處理,用序號(hào)0-8與上式中的動(dòng)作一一對(duì)應(yīng)。將整個(gè)狀態(tài)空閑抽象為一個(gè)二維直角坐標(biāo)系,橫坐標(biāo)為wA,縱坐標(biāo)為wB,坐標(biāo)系中每個(gè)點(diǎn)都是一個(gè)狀態(tài),回報(bào)函數(shù)如下:

式中:R(s,a)——狀態(tài)s選擇動(dòng)作a后獲得的回報(bào)值;

xk——agent下一狀態(tài)的坐標(biāo),即xk=sk+ak;

xg——目標(biāo)狀態(tài)(零庫(kù)存狀態(tài)),即xg=(2,3)。

agent對(duì)倉(cāng)儲(chǔ)環(huán)境不斷探索、試錯(cuò),Q矩陣相當(dāng)于它的大腦,記錄每一場(chǎng)景得到的信息,使用公式(6)對(duì)Q矩陣進(jìn)行更新,不斷訓(xùn)練直到Q矩陣收斂。本案例中Q矩陣是一個(gè)121×9的矩陣,行表示agent的當(dāng)前狀態(tài),列表示到達(dá)下一狀態(tài)的可能動(dòng)作,矩陣元素Q(st,at)表示立即回報(bào)值R(st,at)加上轉(zhuǎn)換到下一狀態(tài)后此行的最大Q值乘上折扣因子γ。初始化的Q矩陣如圖2所示,按圖中狀態(tài)、動(dòng)作的順序建立索引(0-120;0-8),方便后續(xù)操作。

2.2 結(jié)果與分析

各種編程語(yǔ)言均可進(jìn)行程序的編寫(xiě),部分軟件也滿足本方法的需要,本文采用python語(yǔ)言進(jìn)行程序編寫(xiě)。設(shè)置折扣因子γ為0.8,最大訓(xùn)練周期數(shù)為1000。程序運(yùn)行結(jié)果如圖3所示。

訓(xùn)練之后會(huì)得到收斂的Q矩陣,通過(guò)比較數(shù)值能夠得到某個(gè)狀態(tài)下選擇各個(gè)動(dòng)作的優(yōu)先程度,即選擇該狀態(tài)對(duì)應(yīng)行的最大Q值的對(duì)應(yīng)動(dòng)作,從初始狀態(tài)到目標(biāo)狀態(tài)每一步最優(yōu)即可得到整體的最優(yōu)策略。例如,若當(dāng)前庫(kù)存狀態(tài)為(5,7),即A、B的庫(kù)存量分別為5單位和7單位,程序給出最優(yōu)策略:(5,7)→(4,6)→(3,5)→(2,4)→(2,3),管理人員只要依據(jù)此策略調(diào)整物資即可快速實(shí)現(xiàn)零庫(kù)存管理的目標(biāo)。為了更加直觀地展示實(shí)驗(yàn)結(jié)果,選擇4個(gè)初始狀態(tài)進(jìn)行程序測(cè)試,結(jié)果可視化展示如圖4所示,圖中標(biāo)注了初始狀態(tài)點(diǎn)和零庫(kù)存目標(biāo)狀態(tài)點(diǎn),連接線段即為調(diào)整庫(kù)存的策略路徑,能夠明顯看出,程序結(jié)果為案例已知條件下調(diào)整物資的最優(yōu)策略,實(shí)驗(yàn)證明本方法能夠有效應(yīng)用于零庫(kù)存管理物資調(diào)度問(wèn)題。

3 ?結(jié)論

本文針對(duì)制造企業(yè)實(shí)施零庫(kù)存管理下如何快速調(diào)度物資維持零庫(kù)存動(dòng)態(tài)平衡這一問(wèn)題進(jìn)行研究,提出基于Q學(xué)習(xí)的零庫(kù)存物資調(diào)度方法。實(shí)驗(yàn)結(jié)果表明,該方法提高了庫(kù)存調(diào)整效率,減少了人為因素造成的偏差,能夠有效地解決此問(wèn)題。在實(shí)際應(yīng)用場(chǎng)景中,存在更為復(fù)雜的倉(cāng)儲(chǔ)狀況,需要根據(jù)實(shí)際情況進(jìn)行狀態(tài)劃分,動(dòng)作選擇、回報(bào)函數(shù)、評(píng)估矩陣等設(shè)計(jì),最后根據(jù)算法流程圖進(jìn)行編程或者軟件處理,依據(jù)輸出結(jié)果調(diào)度物資實(shí)現(xiàn)零庫(kù)存。在“互聯(lián)網(wǎng)+”大背景下,將信息技術(shù)應(yīng)用到制造企業(yè)生產(chǎn)管理中是必然趨勢(shì),傳統(tǒng)的管理模式正在向智能化管理轉(zhuǎn)變。本文提出的制造企業(yè)零庫(kù)存管理倉(cāng)儲(chǔ)物資調(diào)度方法,將信息技術(shù)與零庫(kù)存管理思想相結(jié)合,用計(jì)算機(jī)代替人為判斷,為企業(yè)實(shí)施零庫(kù)存管理后的的物資調(diào)度提供方法支撐,提高了庫(kù)存管理效率,適應(yīng)新形勢(shì)下追求企業(yè)整體經(jīng)營(yíng)成本降低的需要,有效減少企業(yè)庫(kù)存成本和人力成本,提高整體效益和市場(chǎng)競(jìng)爭(zhēng)力,實(shí)現(xiàn)企業(yè)高質(zhì)量發(fā)展。

參考文獻(xiàn):

[1]胡雨亭.庫(kù)存的弊端與實(shí)現(xiàn)零庫(kù)存的方法[J].湖北社會(huì)科學(xué),2011(03):87-89.

[2]吳丹潔,蘇俊華,鄭建陽(yáng).企業(yè)零庫(kù)存的適用與風(fēng)險(xiǎn)探析[J].改革與戰(zhàn)略,2015,31(05):83-91.

[3]黃文杰,黃奕.零庫(kù)存可行性分析和風(fēng)險(xiǎn)防范措施[J].企業(yè)經(jīng)濟(jì),2009(09):38-40.

[4]陳宏佳.我國(guó)企業(yè)應(yīng)用零庫(kù)存管理法存在的問(wèn)題[J].財(cái)務(wù)與會(huì)計(jì),2016(04):56-57.

[5]屈冠林.科學(xué)地認(rèn)識(shí)零庫(kù)存——淺議零庫(kù)存策略的內(nèi)涵與實(shí)施[J].中國(guó)物流與采購(gòu),2003(11):34-35.

[6]王涵,蔡安江,褚崴.制造企業(yè)庫(kù)存管理信息系統(tǒng)的研究與實(shí)施[J].制造業(yè)自動(dòng)化,2014,36(10):17-20.

[7]繆華昌.制造企業(yè)零庫(kù)存模式的實(shí)踐探索與研究[J].物流工程與管理,2015,37(06):56-58.

[8]朱文英,馬天山.零庫(kù)存管理理論在制造企業(yè)中的應(yīng)用[J].物流技術(shù),2009,28(08):140-142.

[9]潘燕華,陳婷婷,李向遠(yuǎn).船舶制造企業(yè)零庫(kù)存管理物資類別選擇決策模型構(gòu)建[J].財(cái)會(huì)月刊,2017(29):43-47.

[10]聶春雨,祝明,鄭澤偉,等.基于Q-Learning算法和神經(jīng)網(wǎng)絡(luò)的飛艇控制[J].北京航空航天大學(xué)學(xué)報(bào),2017,43(12):2431-2438.

[11]PUTERMAN M L. Markov Decision Processes: Discrete Stochastic Dynamic Programming[M]. New York: John Wiley & Sons, 1994.

[12]方敏,李浩.基于狀態(tài)回溯代價(jià)分析的啟發(fā)式Q學(xué)習(xí)[J].模式識(shí)別與人工智能,2013,26(9):838-844.

[13]張佳立,尼俊紅.基于Q學(xué)習(xí)的配電異構(gòu)無(wú)線網(wǎng)絡(luò)選擇算法[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,38(02):54-59.

猜你喜歡
制造企業(yè)
制造企業(yè)成本控制中運(yùn)用價(jià)值流分析探究
基于SAP信息化系統(tǒng)下的制造企業(yè)成本管理控制趨勢(shì)分析
從平衡記分卡看績(jī)效評(píng)價(jià)
基于營(yíng)改增背景下的制造企業(yè)納稅籌劃方法分析