趙 超,李 俚,李 博
(廣西大學(xué)機械工程學(xué)院,廣西南寧 530004)
目前機器學(xué)習(xí)的研究和應(yīng)用已取得較好成效,利用精益思想,結(jié)合生產(chǎn)場景所產(chǎn)生的數(shù)據(jù),將機器學(xué)習(xí)模型應(yīng)用到生產(chǎn)車間物料供應(yīng)物流資源匹配成為目前關(guān)注方向。
文獻[1]利用機器學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)利用藥品數(shù)據(jù)推薦相似功效藥品輔助新產(chǎn)品研發(fā),準(zhǔn)確率超過85.6%,節(jié)約數(shù)億美元和縮短研發(fā)周期。
文獻[2]研究了產(chǎn)品配置過程中客戶需求與產(chǎn)品結(jié)構(gòu)單元特征之間的映射關(guān)系,提出了相似度的計算流程。文獻[3]提出利用機器學(xué)習(xí)技術(shù)改進物資標(biāo)準(zhǔn)化工作,提高標(biāo)準(zhǔn)物料的選用集中度與選擇效率。
文獻[4]提出利用機器學(xué)習(xí)領(lǐng)域中CBR技術(shù),進一步提高了產(chǎn)品配置的效率。文獻[5]在基于用戶數(shù)據(jù)推薦算法的基礎(chǔ)上,通過引入用戶信息數(shù)據(jù)提高了推薦結(jié)果的準(zhǔn)確性。
文獻[6]提出了一種既考慮詞項的概率分布、又兼顧詞項之間的語義關(guān)系的文本相似度計算方法,提高文本推薦結(jié)果的準(zhǔn)確性。文獻[7]在向量空間中提出了梯形直覺模糊數(shù)(TIFN)之間的三種向量相似性度量,有效的提高推薦的精度。
文獻[8]提出一種基于FunkSVD矩陣分解和相似度矩陣的推薦算法,解決了數(shù)據(jù)稀疏及不同評分項目差異的問題,提高了評分預(yù)測的準(zhǔn)確性、優(yōu)化了推薦結(jié)果。
文獻[9]提出了基于Kendall相關(guān)性的協(xié)同過濾算法,有效的克服了最近鄰居(NN)算法存在的問題并提供了更加豐富的用戶建模。這里在文獻研究的基礎(chǔ)上,結(jié)合車間PFEP中產(chǎn)品物料基礎(chǔ)數(shù)據(jù)以及物流資源配置數(shù)據(jù),構(gòu)建機器學(xué)習(xí)車間物料匹配Recsys模型,利用TF?IDF算法,開展物流資源配置推薦研究,以期實現(xiàn)生產(chǎn)車間物料資源快速匹配,改善企業(yè)生產(chǎn)物流運轉(zhuǎn)效率。
生產(chǎn)車間物料PFEP 包含物料基礎(chǔ)信息、產(chǎn)線信息、單元化信息、供應(yīng)商信息、存儲信息和配送上線信息。
將物料在車間內(nèi)的狀態(tài)進行分類,收集相關(guān)信息參數(shù),繪制狀態(tài)轉(zhuǎn)換圖:
采購狀態(tài)(物料從供應(yīng)商到達廠內(nèi)車間)—存儲狀態(tài)(線邊倉庫)—配送狀態(tài)(線邊配送)—生產(chǎn)加工狀態(tài)(上線生產(chǎn))。
根據(jù)物料流動狀態(tài)轉(zhuǎn)換圖,以物料有效流動為目標(biāo),識別物料流動屬性,構(gòu)建PFEP配置文件表。
結(jié)合PFEP表大量數(shù)據(jù),提取生產(chǎn)物流資源特征,構(gòu)建產(chǎn)品?物料的特征矩陣。
根據(jù)產(chǎn)品?物料特征矩陣,利用相似度計算算法,求出物品與目標(biāo)之間相似度,篩選出與目標(biāo)相似程度最高的N個相似的物品推薦給目標(biāo)用戶。
推薦系統(tǒng)的框架包括從產(chǎn)品的基本數(shù)據(jù)(產(chǎn)品尺寸、重量等數(shù)據(jù))中提取出適合計算機分析的信息;通過推薦模型推薦相關(guān)性較高的產(chǎn)品;依據(jù)相關(guān)度推薦最符合的產(chǎn)品。車間物流資源推薦框架,如圖1所示。
圖1 車間物流資源推薦框架Fig.1 Workshop Logistics Resource Recommendation Framework
3.2.1 Recsys特征模型構(gòu)建
提取產(chǎn)品中具有明顯區(qū)分度的數(shù)據(jù),構(gòu)建空間向量模型(VSM),進行特征匹配,實現(xiàn)Recsys模型的相似度計算。
如給定一個產(chǎn)品集中N個產(chǎn)品,產(chǎn)品根據(jù)關(guān)鍵物料分解為M維向量,產(chǎn)品集中物料的使用頻次可構(gòu)建產(chǎn)品?物料矩陣表來表示,進而可基于向量實現(xiàn)相似性的計算,產(chǎn)品模型,如式(1)所示。
式中:d—產(chǎn)品;j—物料編號;W—物料在產(chǎn)品中的權(quán)重;t—物料個數(shù)。
結(jié)合式(1),構(gòu)建產(chǎn)品?物料矩陣,如表1所示。表格中數(shù)字即表示出現(xiàn)的頻率。
表1 產(chǎn)品-物料矩陣Tab.1 Product-Material Matrix
3.2.2 基于TF?IDF的相似性算法
在車間PFEP 數(shù)據(jù)中,為了區(qū)分產(chǎn)品族物料之間的差異性、篩除冗余信息,采用TF?IDF算法對VSM中各關(guān)鍵向量的權(quán)重進行賦值。
TF?IDF算法采用詞頻(TF)和逆文本頻率(IDF)兩個關(guān)鍵指標(biāo)值來計算權(quán)重。產(chǎn)品族VSM向量的TF和IDF,可用式(2)和式(3)表示。
式中:ni,j—目標(biāo)詞在文檔dj中出現(xiàn)的次數(shù),分母是指文檔dj中所有字詞出現(xiàn)的次數(shù);|D|—指數(shù)據(jù)集中文件的總數(shù)量,式(3)中分母是指包含ti的所有文檔總數(shù),如果ti不在文檔中,會出現(xiàn)分母為零的情況,所以一般在上式(3)分母中再加1。TF?IDF的權(quán)重計算是TF值與IDF值相乘,如式(4)所示。
式中:Wi,j—特定關(guān)鍵詞i在文檔j中的權(quán)重值。利用TF?IDF算法建模,計算產(chǎn)品族關(guān)鍵物料向量表示f,為了減少通用物料對判斷產(chǎn)品相似度的影響,將物料庫轉(zhuǎn)化為TF?IDF表示(TF?IDF實數(shù)權(quán)重),兩個產(chǎn)品的相似度比較計算(余弦算法)可用式(5)表示。
式中:fxi和fyi—所比較的兩個產(chǎn)品中關(guān)鍵物料的向量表示,TF?IDF算法用于產(chǎn)品關(guān)鍵物料篩選中,可以有效去除通用和區(qū)分度不高的產(chǎn)品,提高推薦精度。
實驗中使用的數(shù)據(jù)來自M 公司電子分廠遙控器車間PFEP中的數(shù)據(jù),數(shù)據(jù)包含物料基本信息、單元化信息、配送存儲信息和供應(yīng)商信息,PFEP的部分?jǐn)?shù)據(jù),如表2所示。
表2 遙控器車間PFEP數(shù)據(jù)Tab.2 PFEP Data of Remote Control Workshop
從PFEP 數(shù)據(jù)中抽取物料基本信息中的關(guān)鍵字段作為測試集,并以CSV格式保存為特征數(shù)據(jù)。
采用包括Gensim庫、sklearn庫以及Anaconda庫的Python實現(xiàn)推薦算法和評估。
將PFEP中產(chǎn)品物料BOM等信息構(gòu)成數(shù)據(jù)集,導(dǎo)入物料特征文件,將區(qū)分度不明顯的物料進行向量化,應(yīng)用TF?IDF算法對物料特征進行權(quán)重計算,通過相似性算法計算最相似的K個產(chǎn)品的資源配置情況,推薦實現(xiàn)流程如下:
(1)引入Python編程文件,設(shè)置運行記錄。
(2)通過PFEP 初步得到已有產(chǎn)品的信息,包括產(chǎn)品型號、BOM數(shù)據(jù)和尺寸數(shù)據(jù)等關(guān)鍵屬性,導(dǎo)入數(shù)據(jù)集中。
(3)建立所有物料屬性與編號之間的映射的物料詞典(Diction‐ary),獲取特征數(shù),遍歷基于數(shù)據(jù)集的物料關(guān)鍵屬性,計算每個物料屬性出現(xiàn)的頻率,根據(jù)實際需求過濾頻率小于n的物料屬性。
(4)建立物料庫,將物料庫轉(zhuǎn)化為存儲稀疏向量的列表,如物料詞集為“液晶顯示屏?上蓋?導(dǎo)電橡膠條?導(dǎo)電橡膠按鍵”,構(gòu)建的物料詞典為(液晶顯示屏:0.上蓋;1.導(dǎo)電橡膠;2.導(dǎo)電橡膠按鍵;3.物料庫為{(0,2),(1,2),(2,2),(3,1)})。
(5)初始化TF?IDF 模型,進行向量轉(zhuǎn)換,將物料庫轉(zhuǎn)化為TF?IDF表示,計算每個屬性TD?IDF的值,建立產(chǎn)品向量空間模型,如第p個產(chǎn)品的VSM為如下所示。
式中:fpi—產(chǎn)品p中的第i個特征;tf-idf(fpi)—產(chǎn)品P中第i個特征的TF?IDF值。
(6)基于各產(chǎn)品所構(gòu)建的TF?IDF 向量空間模型利用式(5)進行相似度的計算,輸出相似度最大的N個產(chǎn)品的相似度匹配數(shù)據(jù)。
4.3.1 車間物料包裝資源匹配
物料合理容裝是生產(chǎn)物流得以高效運行的基礎(chǔ),結(jié)合圖2的推薦模型,以RG56遙控器產(chǎn)品為例進行包裝資源匹配,第一,獲取目標(biāo)產(chǎn)品基礎(chǔ)信息,即RG56物料信息,如表3所示。提取物料關(guān)鍵特征。利用TF?IDF模型與余弦相似度混合算法,推薦初始結(jié)果,進一步進行過濾、排序,獲得最佳的物料包裝和單元化數(shù)據(jù),包裝資源匹配,如表4所示。
表3 RG56物料信息Tab.3 RG56 Material Information
表4 物料包裝單元化匹配數(shù)據(jù)Tab.4 Material Packaging Unitized Matching Data
同時,將包裝資源配置數(shù)據(jù)更新至PFEP,作為存儲、配送上線物流實施的數(shù)據(jù)基礎(chǔ)。
4.3.2 生產(chǎn)物料存儲配置推薦
統(tǒng)計遙控器生產(chǎn)車間上一年的歷史存儲數(shù)據(jù),形成數(shù)據(jù)集,并提取關(guān)鍵特征,獲得遙控器產(chǎn)品各類物料排產(chǎn)數(shù)據(jù)和歷史波動情況。以RG56產(chǎn)品物料存儲配置為例,上一年歷史數(shù)據(jù),如表5所示。并對其進行ABC-XYZ分析和型譜配置數(shù)據(jù)集,同時,獲取RG56的排產(chǎn)數(shù)據(jù)以及對應(yīng)的組裝產(chǎn)線,提取特征并向量化。
表5 物料需求和波動情況Tab.5 Material Requirements and Fluctuations
利用TF?IDF 與余弦相似度混合算法,結(jié)合約束條件(存儲模式、面積、器具等)進行相似度分析,根據(jù)RG56產(chǎn)品在排產(chǎn)數(shù)據(jù)和波動性相似度進行排序篩選,基于存儲資源配置推薦需求得出RG56產(chǎn)品存儲配置推薦結(jié)果,如表6所示。
表6 產(chǎn)品物料存儲配置推薦結(jié)果Tab.6 Recommended Product Material Storage Configuration Results
同時,將數(shù)據(jù)更新至PFEP 表以支持儲存和配送上線優(yōu)化設(shè)計。
4.3.3 物料配送上線配置實現(xiàn)
遙控器物料配送上線需求是在生產(chǎn)節(jié)拍、配送路徑與批次、合理容裝和儲存的條件下,生產(chǎn)工位物料與配送周轉(zhuǎn)器具的合理匹配,以支持產(chǎn)線的高效生產(chǎn)。
以目標(biāo)產(chǎn)品RG56為例,提取有關(guān)RG56產(chǎn)品的PFEP物料數(shù)據(jù)庫,以及與配送強關(guān)聯(lián)存儲、包裝以及物料基礎(chǔ)信息,如表7所示。并進行特征向量化處理。
表7 配送資源基礎(chǔ)信息Tab.7 Basic Information of Distribution Resources
利用TF?IDF與余弦混合算法,結(jié)合約束條件(存儲通道、防靜電等)進行相似度計算,根據(jù)物料包裝、存儲、生產(chǎn)工位、節(jié)拍、配送方式和路徑等屬性的相似度進行排序篩選,基于配送資源推薦需求,得出RG56 產(chǎn)品上線配送最佳匹配資源配置,如表8 所示。同時,將最佳配置數(shù)據(jù)更新至PFEP表,以支持持續(xù)改善。
表8 RG56 配送資源配置推薦結(jié)果Tab.8 RG56 Distribution Resource Allocation Recommendation Results
采用Recsys 模型和TF?IDF 算法,利用生產(chǎn)物流的PFEP 數(shù)據(jù)庫在包裝、存儲和配送上線等資源進行優(yōu)化配置推薦,獲取了大量的優(yōu)化改善支持?jǐn)?shù)據(jù)。利用優(yōu)化后的PFEP數(shù)據(jù),在M企業(yè)的空調(diào)遙控器車間進行物料包裝、物料儲存和上線配送等環(huán)節(jié)開展生產(chǎn)物流的改善工作。實施后,為掌握改善前后準(zhǔn)時率提升效果,在物料配送起點和線上終點設(shè)置打卡器,分別記錄物料配送員在配送出發(fā)和到達時間,統(tǒng)計改善前后9月和10月的數(shù)據(jù),繪制物配送料準(zhǔn)時率對比圖,如圖2所示。從圖上可以看出,10月份的物料配送準(zhǔn)點率明顯比9月份的提升。
圖2 物料配送準(zhǔn)時率對比圖Fig.2 Comparison Chart of On?Time Rate of Material Distribution
這里基于機器學(xué)習(xí)領(lǐng)域推薦算法和相關(guān)技術(shù),結(jié)合車間PFEP中產(chǎn)品物料基礎(chǔ)數(shù)據(jù)以及物流資源配置數(shù)據(jù),研究了物流資源配置推薦方法,研究結(jié)果摘要如下:(1)利用TF?IDF算法用于產(chǎn)品關(guān)鍵物料篩選中,可以有效去除通用和區(qū)分度不高的產(chǎn)品,篩除冗余信息數(shù)據(jù),提高推薦模型精度。(2)采用本模型可對生產(chǎn)物流的PFEP數(shù)據(jù)庫在包裝、存儲和配送上線等資源進行優(yōu)化配置推薦,通過獲取的大量優(yōu)化改善支持?jǐn)?shù)據(jù)開展生產(chǎn)物流的改善工作后,物料配送準(zhǔn)點率明顯提升,企業(yè)物流配置效率得到顯著改善。