摘要:本文在對(duì)數(shù)據(jù)挖掘的概念概述的基礎(chǔ)上,著重介紹了數(shù)據(jù)挖掘在物流業(yè)中的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)挖掘;物流業(yè);信息系統(tǒng)
一、數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘,是指從大量的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。它是數(shù)據(jù)庫(kù)研究中的一個(gè)新領(lǐng)域,融合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域的理論和技術(shù),把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的查詢,提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持的層級(jí)。
從商業(yè)角度看,數(shù)據(jù)挖掘是一種商業(yè)信息處理技術(shù),特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析等,從中提取可用于輔助商業(yè)決策的關(guān)鍵數(shù)據(jù)。數(shù)據(jù)挖掘的目標(biāo)是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關(guān)系,從而服務(wù)于決策。數(shù)據(jù)挖掘一般有以下幾類任務(wù):
分類。分類分析就是通過(guò)分析樣本數(shù)據(jù)庫(kù)中的數(shù)據(jù),為每個(gè)類別做出準(zhǔn)確的描述,或挖掘出分類規(guī)則,然后用這個(gè)分類規(guī)則對(duì)其他記錄進(jìn)行分類。
聚類。聚類是把一組個(gè)體按照相似性歸成若干類別,即“物以類聚”。聚類將沒有分類的記錄,在不知道應(yīng)分成幾類的情況下,按照數(shù)據(jù)內(nèi)在的差異性,合理地劃分成幾類,并確定每個(gè)記錄所屬類別。
關(guān)聯(lián)分析。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián),關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。
預(yù)測(cè)。預(yù)測(cè)是根據(jù)對(duì)象屬性之過(guò)去觀察值來(lái)預(yù)測(cè)該屬性未來(lái)之值。數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫(kù)中尋找預(yù)測(cè)性信息。
偏差檢測(cè)。數(shù)據(jù)庫(kù)中的數(shù)據(jù)常有一些異常記錄,稱之為偏差。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例等。
二、數(shù)據(jù)挖掘在物流業(yè)中的應(yīng)用
現(xiàn)代物流系統(tǒng)是一個(gè)龐大復(fù)雜的系統(tǒng),特別是全程物流,包括運(yùn)輸、倉(cāng)儲(chǔ)、配送、搬運(yùn)、包裝和再加工等環(huán)節(jié),每個(gè)環(huán)節(jié)信息流量十分巨大,使企業(yè)很難對(duì)這些數(shù)據(jù)進(jìn)行及時(shí)、準(zhǔn)確的處理。為了幫助決策者快速、準(zhǔn)確地做出決策,提高企業(yè)的運(yùn)作效率,降低物流成本、增加收益,就需要一種新的數(shù)據(jù)分析技術(shù)來(lái)處理數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)能幫助企業(yè)在物流信息系統(tǒng)管理中,及時(shí)、準(zhǔn)確地收集和分析各種信息,對(duì)客戶的行為及市場(chǎng)趨勢(shì)進(jìn)行有效的分析,了解不同客戶的愛好,從而為客戶提供有針對(duì)性的產(chǎn)品和服務(wù),提高各類客戶對(duì)企業(yè)和產(chǎn)品的滿意度。
物流決策系統(tǒng)是一種結(jié)合了數(shù)據(jù)挖掘和人工智能的新型經(jīng)營(yíng)決策系統(tǒng),主要通過(guò)人工智能對(duì)原料采購(gòu)、加工生產(chǎn)、分銷配送到商品銷售的各個(gè)環(huán)節(jié)的信息進(jìn)行采集,并利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘?qū)ζ溥M(jìn)行分析處理,確定相應(yīng)的經(jīng)營(yíng)策略。
數(shù)據(jù)倉(cāng)庫(kù)作為數(shù)據(jù)挖掘的基礎(chǔ),它具有面向主題的、集成的、隨時(shí)間變化的特性。各個(gè)聯(lián)機(jī)事務(wù)處理系統(tǒng)作為數(shù)據(jù)倉(cāng)庫(kù)的原始數(shù)據(jù)源,以文件方式提供企業(yè)在日?;顒?dòng)中收集的數(shù)據(jù)資料和報(bào)表,同時(shí)還有大量的外部信息等數(shù)據(jù)。基于數(shù)據(jù)挖掘的物流信息的體系結(jié)構(gòu)主要由以下幾部分組成:
采購(gòu)進(jìn)貨管理系統(tǒng)。主要功能是面對(duì)供貨商的作業(yè),包括向廠商發(fā)出訂購(gòu)信息或接收廠商的出貨信息、采購(gòu)決策、存貨控制、采購(gòu)價(jià)格管理等信息管理子系統(tǒng)。
銷貨出貨管理系統(tǒng)。其功能是收集客戶需求信息、記錄客戶購(gòu)買信息、管理銷售價(jià)格、處理應(yīng)收貨款及退款等。
庫(kù)存儲(chǔ)位管理系統(tǒng)。該系統(tǒng)包括儲(chǔ)存管理、進(jìn)出貨管理、機(jī)械設(shè)備管理、流通加工等功能子系統(tǒng),負(fù)責(zé)相關(guān)信息的處理。
財(cái)務(wù)管理和結(jié)算系統(tǒng)。財(cái)務(wù)管理系統(tǒng)主要功能是對(duì)銷售管理系統(tǒng)和采購(gòu)系統(tǒng)所形成的應(yīng)付、應(yīng)收帳進(jìn)行會(huì)計(jì)操作,同時(shí)對(duì)物流中心的整個(gè)業(yè)務(wù)與資金進(jìn)行平衡、測(cè)算和分析,編制財(cái)務(wù)報(bào)表,并與銀行進(jìn)行轉(zhuǎn)帳。結(jié)算系統(tǒng)主要功能是利用現(xiàn)有的業(yè)務(wù)信息管理系統(tǒng)和計(jì)算機(jī)處理能力,自動(dòng)為客戶提供各類業(yè)務(wù)費(fèi)用信息,為廣大物流企業(yè)的自動(dòng)結(jié)算提供一套完整的解決方案。
運(yùn)輸配送管理系統(tǒng)。該系統(tǒng)包括出貨配送管理、運(yùn)輸調(diào)度計(jì)劃、分配計(jì)劃等功能子系統(tǒng)。
物流分析系統(tǒng)。其主要功能是應(yīng)用GIS技術(shù)與運(yùn)籌決策模型,完善物流分析技術(shù)。
物流決策支持系統(tǒng)。此系統(tǒng)的功能獲取內(nèi)部各系統(tǒng)業(yè)務(wù)信息,取得外部信息,并結(jié)合內(nèi)部和外部信息編制各種報(bào)告,提供分析圖表。通過(guò)建立決策支持系統(tǒng),及時(shí)地掌握商流、物流、資金流和信息流所產(chǎn)生的信息并加以利用,在數(shù)據(jù)倉(cāng)庫(kù)技術(shù)、運(yùn)籌學(xué)模型的基礎(chǔ)上,運(yùn)用數(shù)據(jù)挖掘工具對(duì)歷史數(shù)據(jù)進(jìn)行多角度、立體的分析,實(shí)現(xiàn)對(duì)物流中心的資源的綜合管理,為決策提供科學(xué)決策的依據(jù)。
作者單位:山東工商學(xué)院 統(tǒng)計(jì)學(xué)院
(編輯 雨露)
參考文獻(xiàn):
[1]Jiawei H