国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多價(jià)值鏈的汽車零配件需求預(yù)測研究

2020-10-12 09:20陳明露江偉煒
現(xiàn)代計(jì)算機(jī) 2020年24期
關(guān)鍵詞:需求量配件預(yù)測

陳明露,江偉煒

(西南交通大學(xué),制造業(yè)產(chǎn)業(yè)鏈協(xié)同與信息化支撐技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,成都 611756)

0 引言

隨著經(jīng)濟(jì)大環(huán)境下汽車配件市場競爭的不斷加劇,汽車配件銷售企業(yè)面臨著生產(chǎn),倉儲,物流等業(yè)務(wù)成本不斷增加風(fēng)險(xiǎn)。要想在競爭中脫穎而出,不斷發(fā)展并且獲得更多的利潤,企業(yè)必須對市場具有敏銳的嗅覺和清晰的認(rèn)識。伴隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,利用其對配件市場需求量進(jìn)行高效準(zhǔn)確的預(yù)測,并以此作為數(shù)據(jù)支撐制定高效精準(zhǔn)的配件銷售決策是各企業(yè)目前迫切需要解決的問題。本文從汽車配件代理商的角度出發(fā),依托汽車產(chǎn)業(yè)鏈協(xié)同平臺[3]數(shù)據(jù)空間中海量的多鏈條配件業(yè)務(wù)數(shù)據(jù),研究配件市場需求量的預(yù)測問題,為配件代理商的銷售決策提供數(shù)據(jù)支持。

1 相關(guān)工作

針對配件需求預(yù)測問題,已經(jīng)有不少學(xué)者做出研究,他們利用若干種預(yù)測方案,取得了一定的效果[4-7]。經(jīng)過分析發(fā)現(xiàn),他們訓(xùn)練模型的數(shù)據(jù)來源普遍只源于某一個(gè)供應(yīng)鏈條上的配件銷售數(shù)據(jù)。其中單鏈條數(shù)據(jù)訓(xùn)練預(yù)測模型,得出的配件市場需求量僅僅是本供應(yīng)鏈條內(nèi)的配件需求量,其他鏈條內(nèi)的同種配件的需求量則不能預(yù)測出來。然而配件市場需求量為市場上多鏈條下游服務(wù)站的配件需求量的總和,這就導(dǎo)致單鏈數(shù)據(jù)預(yù)測值往往與實(shí)際市場需求量相差較大。

如圖1 所示,本文依托于汽車產(chǎn)業(yè)鏈協(xié)同平臺,將多鏈條的整車保有數(shù)據(jù)、配件銷售數(shù)據(jù)以及配件故障數(shù)據(jù)等配件需求相關(guān)數(shù)據(jù)資源,從平臺數(shù)據(jù)空間中進(jìn)行數(shù)據(jù)抽取,經(jīng)歷抽取、清洗、加載三個(gè)階段集中寫入配件代理商專業(yè)數(shù)據(jù)庫中,將其作為模型訓(xùn)練數(shù)據(jù)。在實(shí)際應(yīng)用中,充分利用平臺多鏈數(shù)據(jù)有條件共享的優(yōu)勢,提升配件市場需求量預(yù)測的準(zhǔn)確度。

在使用多鏈數(shù)據(jù)作為模型訓(xùn)練數(shù)據(jù)集的基礎(chǔ)上,本文還利用組合預(yù)測模型提高模型配件需求量的預(yù)測精度。近年來,產(chǎn)品市場需求量預(yù)測模型構(gòu)建一直是國內(nèi)外研究的熱門領(lǐng)域。由于企業(yè)的銷售業(yè)務(wù)數(shù)據(jù)多是時(shí)變數(shù)據(jù),所以產(chǎn)品需求量的預(yù)測通常是利用時(shí)間序列數(shù)據(jù)進(jìn)行模型的訓(xùn)練。其中神經(jīng)網(wǎng)絡(luò)因其優(yōu)良的非線性擬合能力被廣泛應(yīng)用于時(shí)間序列預(yù)測問題[8-9]。由于產(chǎn)品需求量預(yù)測屬于復(fù)雜問題,歷史時(shí)間序列數(shù)據(jù)中通常同時(shí)包含線性成分與非線性成分,并且需求量預(yù)測值的影響特征因素往往較多,所以單一的預(yù)測模型往往不能很好擬合其中的復(fù)雜特性,為了解決這一問題,組合預(yù)測模型被廣泛使用[10-13]。

根據(jù)以上研究現(xiàn)狀分析,本文針對汽車產(chǎn)業(yè)鏈協(xié)同平臺上代理商配件銷售數(shù)據(jù)以及需求影響特征數(shù)據(jù)進(jìn)行實(shí)驗(yàn),構(gòu)建隨機(jī)森林(RF)和長短期時(shí)間記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)的組合預(yù)測模型。首先利用隨機(jī)森林(RF)算法對影響配件銷量的多種特征(包括配件故障率、適配車型整車保有量以及配件滯銷比等)進(jìn)行選取,提取出最優(yōu)特征子集,消除特征集中的噪聲,并降低其維度。然后將其提取的特征子集作為LSTM 的訓(xùn)練數(shù)據(jù),得到預(yù)測結(jié)果,結(jié)果表明,該組合預(yù)測模型相比于單一組件模型具有更高的預(yù)測精度和更快的收斂速度。

圖1 代理商多價(jià)值鏈數(shù)據(jù)來源示意圖

2 多鏈數(shù)據(jù)集構(gòu)建

2.1 多鏈數(shù)據(jù)抽取

價(jià)值鏈數(shù)據(jù)的具體表現(xiàn)形式是產(chǎn)品供應(yīng)鏈業(yè)務(wù)數(shù)據(jù),主要指供應(yīng)商,制造廠,代理商等鏈上的節(jié)點(diǎn)企業(yè)日常業(yè)務(wù)中的銷售、采購、庫存和計(jì)劃等信息數(shù)據(jù)[14]。本文研究所依托的汽車產(chǎn)業(yè)鏈協(xié)同平臺是一個(gè)為汽車供應(yīng)鏈中小型企業(yè)提供信息化系統(tǒng)服務(wù),同時(shí)實(shí)現(xiàn)聯(lián)盟成員之間的信息共享的第三方平臺。目前在平臺上已經(jīng)積累了大量的整車銷售、配件采購、配件銷售和售后服務(wù)數(shù)據(jù)。其中平臺數(shù)據(jù)空間面向汽車產(chǎn)業(yè)全生命周期,采用分布式多元存儲的方式,將汽車產(chǎn)業(yè)多價(jià)值鏈數(shù)據(jù)整合匯聚在一起,為本文多鏈數(shù)據(jù)集構(gòu)建提供數(shù)據(jù)支持。由于配件市場需求預(yù)測具有較強(qiáng)的時(shí)效性,所以本文采用增量抽取方法,在數(shù)據(jù)空間對應(yīng)的數(shù)據(jù)表上構(gòu)建插入、修改、刪除三個(gè)觸發(fā)器,然后在源數(shù)據(jù)表操作數(shù)據(jù)的時(shí)候,將其經(jīng)過統(tǒng)計(jì)計(jì)算再進(jìn)行插入、修改并存入特征屬性表中,其具體過程如圖2 所示。

圖2 多價(jià)值鏈數(shù)據(jù)抽取示意圖

2.2 配件需求影響特征選取

明確了多鏈條數(shù)據(jù)來源,還需要對需要提取的數(shù)據(jù)內(nèi)容進(jìn)行確定。本文以汽車產(chǎn)業(yè)鏈協(xié)同平臺上多鏈條數(shù)據(jù)為實(shí)驗(yàn)對象。其為代理商某配件的銷量以及需求影響特征因素時(shí)間序列,以蓄電池配件為例,其具體數(shù)據(jù)格式如表1 所示。

表1 配件需求量特征集結(jié)構(gòu)表

需求特征主要包括以下幾種。

(1)整車保有量:指目標(biāo)配件各個(gè)型號的適配車型的市場保有量,可通過整車銷售數(shù)據(jù)間接得到。

(2)配件故障率:指配件損壞的數(shù)量占總體整車保有量的比重。

(3)配件使用時(shí)間:本文選取對應(yīng)時(shí)間段內(nèi)所有維修配件的平均使用時(shí)長作為該值。

(4)配件滯銷比率:指目標(biāo)配件銷售過程中,滯銷數(shù)量與實(shí)際銷售量之間的比率。

(5)配件急缺比率:指代理商目標(biāo)配件急缺數(shù)量占服務(wù)站該配件采購計(jì)劃數(shù)量的占比。

(6)配件退貨率:目標(biāo)配件退貨數(shù)量與銷售數(shù)據(jù)的比值為該配件的退貨率。

2.3 數(shù)據(jù)清洗與預(yù)處理

基于前文采集的多鏈條數(shù)據(jù)集,在模型構(gòu)建過程之前,需要對該數(shù)據(jù)集進(jìn)行清洗與預(yù)處理,避免臟數(shù)據(jù)或者不規(guī)范數(shù)據(jù)對模型的預(yù)測結(jié)果產(chǎn)生影響,其中本文具體的數(shù)據(jù)預(yù)處理過程如下所示。

(1)異常值處理:如果某特征值超過標(biāo)準(zhǔn)差三倍以上,則認(rèn)定為異常值,按照缺失值處理。

(2)數(shù)據(jù)填充:有可能在數(shù)據(jù)庫記錄過程中某條數(shù)據(jù)樣本丟失或不全。這些缺失值取前后時(shí)刻該特征值的平均數(shù)。

(3)格式內(nèi)容轉(zhuǎn)換:本文從日期,數(shù)值格式,以及內(nèi)容異常數(shù)據(jù)這幾個(gè)方面對數(shù)據(jù)的格式進(jìn)行檢測,然后對格式不符的數(shù)據(jù)進(jìn)行相應(yīng)的轉(zhuǎn)換。

(4)數(shù)據(jù)歸一化:本文采用min-max 標(biāo)準(zhǔn)化將輸入數(shù)據(jù)均映射到[0,1]區(qū)間內(nèi),從而消除各特征值之間的相互影響。其數(shù)學(xué)表達(dá)式如公式(1)所示。

其中xmin和xmax分別表示樣本數(shù)據(jù)之間的最小值和最大值,x 表示當(dāng)前時(shí)刻的觀測值。

3 組合預(yù)測模型

LSTM 神經(jīng)網(wǎng)絡(luò)模型因其獨(dú)特的記憶單元機(jī)制具有對長時(shí)間跨度歷史數(shù)據(jù)的感知能力,適合用于對歷史數(shù)據(jù)具有長時(shí)間依賴的配件市場需求量的預(yù)測。同時(shí)配件需求量預(yù)測屬于復(fù)雜問題,其影響因素眾多,如果將所有特征均作為LSTM 模型的輸入數(shù)據(jù)進(jìn)行訓(xùn)練,則容易導(dǎo)致模型因?yàn)榫W(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜以及參數(shù)較多在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象。并且配件需求量時(shí)間序列數(shù)據(jù)通常具有周期性以及隨機(jī)性的特點(diǎn),其中的噪聲通常影響模型預(yù)測精度。為了解決這一問題,本文選取隨機(jī)森林模型選取指定個(gè)數(shù)的最優(yōu)特征子集作為LSTM 模型的輸入數(shù)據(jù),組合模型具體構(gòu)建過程如圖3 所示。通過實(shí)驗(yàn)驗(yàn)證,經(jīng)過隨機(jī)森林優(yōu)化的LSTM陷入過擬合的概率較低,并且其在加快模型收斂速度的同時(shí),一定程度上增加了模型的預(yù)測精度。

3.1 模型理論分析

(1)隨機(jī)森林原理分析

隨機(jī)森林是一種Bagging 集成學(xué)習(xí)算法,既可用于解決分類問題,也能用于回歸預(yù)測。在解決預(yù)測問題時(shí),其基本思想是首先利用bootstrap(自助采樣)方法生成n 個(gè)數(shù)據(jù)集,其次對每個(gè)數(shù)據(jù)集構(gòu)建一個(gè)決策樹并將它們隨機(jī)整合形成森林(其中各個(gè)決策樹之間沒有依賴關(guān)系),最后計(jì)算各個(gè)決策樹預(yù)測結(jié)果的平均值作為最終預(yù)測結(jié)果[15]。隨機(jī)森林模型通??梢员苊膺^擬合的原因是其不僅對樣本進(jìn)行采樣,同時(shí)對屬性特征也會進(jìn)行采樣。首先其對特征進(jìn)行選取之前會先判斷特征的重要性,并對每個(gè)特征按照重要性降序排序,然后按重要性順序刪除一定比例的特征,得到特征子集,接著重復(fù)以上篩選過程,直到得到預(yù)期m 個(gè)特征,在通過重復(fù)以上過程得到若干個(gè)特征集以及對應(yīng)的袋外誤差,選取誤差最小的特征集作為最優(yōu)特征子集。

圖3 配件需求預(yù)測組合模型結(jié)構(gòu)示意圖

(2)LSTM 原理分析

LSTM 神經(jīng)網(wǎng)絡(luò)模型[2]是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))的改進(jìn)模型,其解決了RNN 的梯度消失問題,引入信息長時(shí)間選擇性有效的機(jī)制。其內(nèi)部結(jié)構(gòu)在RNN 的基礎(chǔ)上進(jìn)行了優(yōu)化,增加了輸入門(input gate),遺忘門(forget gate),輸出門(output gate)三個(gè)邏輯控制單元,且各自聯(lián)結(jié)到一個(gè)乘法元件上[12]。具體結(jié)構(gòu)如圖4所示。

圖4 LSTM隱藏層內(nèi)部結(jié)構(gòu)示意圖

LSTM 模型中各門控單元的描述如下:

①遺忘門:其輸入數(shù)據(jù)包含上一時(shí)刻隱藏層的輸出數(shù)據(jù)ht-1以及當(dāng)前時(shí)刻的輸入數(shù)據(jù)xt,然后將兩個(gè)輸入數(shù)據(jù)傳入sigmoid 函數(shù)中,得到一個(gè)屬于[0,1]區(qū)間的ft值,該值會直接傳遞到上一時(shí)刻的長期記憶Ct-1中,從而決定是否讓上一時(shí)刻學(xué)到的信息通過或者部分通過。其具體公式如下:

其中σ為 sigmoid()函數(shù),Wf是遺忘門的權(quán)重矩陣,中括號表示兩個(gè)向量聯(lián)結(jié),bf為遺忘門的偏置項(xiàng)。

②輸入門:其可分為兩個(gè)部分,一部分與遺忘門類似,通過sigmoid 函數(shù)對上一時(shí)刻隱藏層的輸出數(shù)據(jù)ht-1以及當(dāng)前時(shí)刻的輸入數(shù)據(jù)xt進(jìn)行非線性變化,生成0-1 的數(shù)值用于決定輸入信息,另一部分是一個(gè)tanh層用來生成新的候選值。其具體公式如下:

③輸出門:其首先同樣利用sigmoid 函數(shù)對上一時(shí)刻隱藏層的輸出數(shù)據(jù)ht-1以及當(dāng)前時(shí)刻的輸入數(shù)據(jù)xt進(jìn)行非線性變化,然后使用tanh 將值縮放到-1 到1間,再與sigmoid 得到的輸出逐對相乘,從而得到過濾之后的模型輸出。其具體公式如下所示。

3.2 組合模型構(gòu)建

(1)隨機(jī)森林參數(shù)選取

隨機(jī)森林模型的使用較為簡單,在訓(xùn)練過程中,對參數(shù)進(jìn)行準(zhǔn)確的調(diào)節(jié)有利于提高預(yù)測精度。其重要參數(shù)主要有以下三個(gè)。

①n_estimators:即模型決策樹的個(gè)數(shù),由于隨機(jī)森林不易過擬合,所以通過增加組件決策樹的個(gè)數(shù)可以有效減少模型的誤差。

②max_features:表示在構(gòu)建決策樹時(shí)選取的最大特征數(shù),在選擇最優(yōu)特征子集時(shí)提取的特征個(gè)數(shù)不能超過該值。

③min_sample_leaf:表示葉子節(jié)點(diǎn)最小的樣本數(shù),如果分支后子節(jié)點(diǎn)的訓(xùn)練樣本個(gè)數(shù)低于該值,則分支不被允許。

由于人工手動(dòng)調(diào)參通常費(fèi)事費(fèi)力,且容易產(chǎn)生疏漏,本文使用 Python 語言中 sklearn 包中的 grid-SearchCV(網(wǎng)格搜索)函數(shù),讓其在一定范圍內(nèi)對隨機(jī)森林的最優(yōu)參數(shù)組合進(jìn)行選取,最優(yōu)值如表2 所示。

表2 隨機(jī)森林模型超參數(shù)初始值

(2)LSTM 模型構(gòu)建

上文對隨機(jī)森林參數(shù)選取過程進(jìn)行了描述,本文將經(jīng)過其提取的與配件需求量具有較高相關(guān)度的最優(yōu)特征子集,作為LSTM 模型的輸入數(shù)據(jù)集。LSTM 模型的構(gòu)建過程如圖5 所示。

圖5 LSTM模型構(gòu)建流程圖

首先為了避免數(shù)值問題以及臟數(shù)據(jù)對模型預(yù)測結(jié)果造成影響,需要對模型的輸入數(shù)據(jù)進(jìn)行清洗與預(yù)處理,由于神經(jīng)網(wǎng)絡(luò)模型屬于有監(jiān)督學(xué)習(xí),所以需要對輸入數(shù)據(jù)集進(jìn)行適配處理,轉(zhuǎn)換為適用于監(jiān)督學(xué)習(xí)問題的輸入輸出兩部分?jǐn)?shù)據(jù)。模型的結(jié)構(gòu)為三層網(wǎng)絡(luò),包括輸入層、隱藏層和輸出層。模型的輸入層接受的是由t 個(gè)連續(xù)時(shí)刻觀測值組成的輸入向量,輸出層的t+1時(shí)刻的預(yù)測值。LSTM 隱藏層的節(jié)點(diǎn)個(gè)數(shù)初始值設(shè)為256。然后本文選取自適應(yīng)估計(jì)(Adam)作為優(yōu)化方法。模型激活函數(shù)選取ReLU,其可以在一定程度上緩解梯度消失問題,公式如下所示。

通過以上構(gòu)建過程,本文使用Python 語言,采用機(jī)器學(xué)習(xí)庫Keras 對LSTM 模型進(jìn)行構(gòu)建、訓(xùn)練以及評估。模型的超參數(shù)設(shè)置如表3 所示。

4 實(shí)驗(yàn)結(jié)果與分析

為驗(yàn)證RF_LSTM 配件需求預(yù)測模型的準(zhǔn)確性與高效性,本文采用汽車產(chǎn)業(yè)鏈協(xié)同平臺上某代理商2017 年到2019 年的蓄電池配件銷售數(shù)據(jù)以及上下游企業(yè)共享的整車保有數(shù)據(jù)和配件故障數(shù)據(jù),構(gòu)建實(shí)驗(yàn)數(shù)據(jù)集對模型進(jìn)行訓(xùn)練和測試。本文實(shí)驗(yàn)環(huán)境如表4所示。

表3 LSTM 模型超參數(shù)初始值

表4 實(shí)驗(yàn)環(huán)境配置列表

為了評估模型預(yù)測精度,本文選取均方根誤差(RMSE)和平均絕對誤差(MAE)作為評價(jià)指標(biāo)。其公式如下所示。

其中,yi表示預(yù)測數(shù)據(jù)的真正值,表示預(yù)測值,N 表示樣本數(shù)量。

本文選取隨機(jī)森林模型與LSTM 模型以及ARIMA-LSTM 組合預(yù)測模型作為對比實(shí)驗(yàn)?zāi)P?,對本文模型的預(yù)測性能進(jìn)行對比分析。為了更好的定量比較各實(shí)驗(yàn)?zāi)P偷念A(yù)測精度,表5 對各模型的評估指標(biāo)RMSE 和MAE 的值進(jìn)行對比。

表5 實(shí)驗(yàn)?zāi)P驮u價(jià)指標(biāo)取值對比表

對比發(fā)現(xiàn),經(jīng)過隨機(jī)森林優(yōu)化特征集的RF-LSTM配件需求量預(yù)測模型的RMSE 值和MAE 值比其他對比實(shí)驗(yàn)?zāi)P投嫉?,說明其預(yù)測精度更高,預(yù)測的配件需求量與實(shí)際需求量之間的誤差更小。ARIMA-LSTM 組合模型效果次之,對于單一組件模型,LSTM 模型對該數(shù)據(jù)集的預(yù)測效果好于隨機(jī)森林。

5 結(jié)語

本文首先提取汽車產(chǎn)業(yè)鏈協(xié)同平臺上多價(jià)值鏈配件需求特征數(shù)據(jù),整合了多鏈數(shù)據(jù)集,然后構(gòu)建隨機(jī)森林與LSTM 的組合預(yù)測模型,利用隨機(jī)森林選取特征,優(yōu)化LSTM 網(wǎng)絡(luò)結(jié)構(gòu),提升模型預(yù)測精度。最后利用實(shí)驗(yàn)數(shù)據(jù)集對模型預(yù)測性能進(jìn)行了實(shí)例驗(yàn)證。結(jié)果表明,多鏈數(shù)據(jù)集的整合與組合預(yù)測模型的建立對配件需求量的預(yù)測精度有一定程度的提升。未來的工作我們可以使用其他模型組合方案,或者利用諸如遺傳算法等優(yōu)化算法對模型的參數(shù)設(shè)置進(jìn)行優(yōu)化,以便進(jìn)一步提高模型預(yù)測性能。

猜你喜歡
需求量配件預(yù)測
無可預(yù)測
原材配件
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
選修2—2期中考試預(yù)測卷(A卷)
從數(shù)學(xué)角度看“彈性”
基于云計(jì)算技術(shù)的城市就業(yè)需求量預(yù)測研究
妝發(fā)與配件缺一不可
原材配件商情
原材配件商情