張 超
淺談大數(shù)據(jù)時(shí)代的物流信息挖掘與應(yīng)用
張超
(長(zhǎng)治職業(yè)技術(shù)學(xué)院山西長(zhǎng)治046000)
文章圍繞大數(shù)據(jù)時(shí)代的物流信息挖掘應(yīng)用展開分析,介紹了數(shù)據(jù)挖掘的概念,分析了物流信息挖掘與應(yīng)用的意義,以及數(shù)據(jù)挖掘的相關(guān)技術(shù)以及物流系統(tǒng)中的數(shù)據(jù)挖掘過程,提出了數(shù)據(jù)挖掘在物流信息中的應(yīng)用。
大數(shù)據(jù)時(shí)代;物流信息;數(shù)據(jù)挖掘;概念;特征;應(yīng)用
在物流快速發(fā)展的過程當(dāng)中,只有充分的借助于大數(shù)據(jù)信息技術(shù),建立網(wǎng)絡(luò)交流平臺(tái),加強(qiáng)對(duì)各種物流信息數(shù)據(jù)的使用,才能夠保證物流行業(yè)的發(fā)展更加迅猛,因此需要充分了解物流挖掘的相關(guān)技術(shù),然后充分的應(yīng)用在物流管理系統(tǒng)當(dāng)中。通過對(duì)各類數(shù)據(jù)進(jìn)行有效的挖掘,為物流行業(yè)發(fā)展提供強(qiáng)力的技術(shù)支撐。
在互聯(lián)網(wǎng)的背景之下,數(shù)據(jù)非常繁多,尤其是對(duì)于物流企業(yè)而言,做好數(shù)據(jù)挖掘工作至關(guān)重要。但是由于數(shù)據(jù)相對(duì)量比較多,而且相對(duì)多樣化,同時(shí)數(shù)據(jù)信息變化也比較快,但是部分信息具有價(jià)值,而部分信息沒有價(jià)值,這就需要進(jìn)行數(shù)據(jù)挖掘作業(yè)。所謂數(shù)據(jù)挖掘是指從大量的、模糊的、隨機(jī)的數(shù)據(jù)中來提取盡可能有價(jià)值的相關(guān)知識(shí)和信息。
隨著數(shù)字挖掘技術(shù)的不斷應(yīng)用,數(shù)據(jù)挖掘已經(jīng)由傳統(tǒng)的簡(jiǎn)單查詢升級(jí)到了挖掘數(shù)據(jù)的階段,不僅能夠?yàn)闆Q策提供技術(shù)保障,而且也能夠?qū)崿F(xiàn)對(duì)各類信息的有效處理,從而轉(zhuǎn)換成企業(yè)數(shù)據(jù)庫中需要的重要數(shù)據(jù),推動(dòng)企業(yè)的發(fā)展
經(jīng)過調(diào)查研究發(fā)現(xiàn),當(dāng)下數(shù)據(jù)挖掘技術(shù)在物流企業(yè)中應(yīng)用主要有以下幾方面的作用。
隨著物流行業(yè)競(jìng)爭(zhēng)日益加劇,只有借助于數(shù)據(jù)挖掘這種先進(jìn)的技術(shù),應(yīng)用大數(shù)據(jù)相關(guān)的平臺(tái)對(duì)各種信息進(jìn)行收集和整理,才能夠真正的選取出有價(jià)值的信息,節(jié)省空間,能夠使得企業(yè)更加科學(xué)合理的規(guī)劃相關(guān)的物流項(xiàng)目,從而滿足企業(yè)的多樣化需求。
通過進(jìn)行數(shù)據(jù)挖掘,能夠使得數(shù)據(jù)庫內(nèi)的信息數(shù)據(jù)更加具有價(jià)值,尤其是能夠及時(shí)的分析和診斷物流企業(yè)在推進(jìn)各項(xiàng)業(yè)務(wù)時(shí)存在的問題和現(xiàn)狀,從而為企業(yè)決策提供更加有價(jià)值的信息[1]。
通過借助于數(shù)據(jù)挖掘技術(shù)能夠?qū)ξ锪餍畔⑾到y(tǒng)的各個(gè)模塊進(jìn)行分析和整理,針對(duì)于財(cái)務(wù)管理、運(yùn)輸管理、銷售管理以及采購管理等相關(guān)的重要管理工作提供技術(shù)保障,提供相關(guān)的數(shù)字依據(jù),從而滿足物流企業(yè)的基本發(fā)展需求,實(shí)現(xiàn)更好更快發(fā)展。
數(shù)據(jù)挖掘技術(shù)包括以下幾個(gè)方面:
人工神經(jīng)網(wǎng)絡(luò)是指借助于類似人類大腦的系統(tǒng)來進(jìn)行智能化的操作和應(yīng)用,通過搭建人工神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)對(duì)相關(guān)模式的識(shí)別,也可以進(jìn)行自主學(xué)習(xí),從而實(shí)現(xiàn)預(yù)測(cè)的功能。在物流行業(yè)發(fā)展中,需要基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)來搭建計(jì)算機(jī)網(wǎng)絡(luò),從而實(shí)現(xiàn)對(duì)經(jīng)濟(jì)市場(chǎng)的有效預(yù)測(cè),同時(shí)人工神經(jīng)網(wǎng)絡(luò)也可以借助于人類大腦的聯(lián)想過程對(duì)各類信息進(jìn)行快速有效地處理,從而達(dá)到最優(yōu)解。同時(shí)人工神經(jīng)網(wǎng)絡(luò)通過利用計(jì)算機(jī)的快速處理能力,能夠搜尋到復(fù)雜問題的最優(yōu)解,因此應(yīng)用正逐漸擴(kuò)大[2]。
遺傳算法是模擬了自然選擇和遺傳中發(fā)生的繁殖、交配和基因突變的現(xiàn)象,從任意一個(gè)種群中開始進(jìn)行隨機(jī)的選擇、交叉以及變異等一系列操作,最終形成一個(gè)最適應(yīng)的群體。遺傳算法的優(yōu)點(diǎn)是可以直接搜索到有用的信息,而把沒有價(jià)值的信息排除在群的范圍外。因此遺傳算法的應(yīng)用主要針對(duì)于適合度信息,而沒有利用導(dǎo)數(shù)等相關(guān)信息、非線性比較強(qiáng),應(yīng)用領(lǐng)域非常的廣泛。這種算法可以給出一組優(yōu)化解,既可以方便物流企業(yè)進(jìn)行多種選擇,也避免出現(xiàn)了局部最優(yōu)解的現(xiàn)象[3]。
這種方法相當(dāng)于分類,可能會(huì)尋找到成本最低的解決方法,不僅計(jì)算的量小,還可以清晰的、精細(xì)的顯示出重要的字段。比如,在針對(duì)申請(qǐng)貸款時(shí),也會(huì)對(duì)申請(qǐng)的風(fēng)險(xiǎn)大小作出相關(guān)的判斷。
關(guān)聯(lián)規(guī)則是利用了信度因子衡量關(guān)聯(lián)對(duì)大數(shù)據(jù)進(jìn)行計(jì)算,從而形成一個(gè)大數(shù)據(jù)集,然后利用相關(guān)的規(guī)則對(duì)大數(shù)據(jù)集進(jìn)行進(jìn)一步的分類和數(shù)據(jù)挖掘。
當(dāng)下數(shù)字挖掘技術(shù)還有一些其他的方法,比如利用定量化方法來為物流企業(yè)的決策者提供相關(guān)的科學(xué)依據(jù)。包括的技術(shù)也比較多,比如統(tǒng)籌技術(shù)、動(dòng)態(tài)規(guī)劃技術(shù)、非線性規(guī)劃技術(shù)等等。再比如,近鄰算法是指對(duì)數(shù)據(jù)集合中的每一個(gè)相鄰記錄進(jìn)行歸類,進(jìn)一步掌握了數(shù)據(jù)的規(guī)律,便于使用和理解[4]。
在運(yùn)用數(shù)據(jù)挖掘技術(shù)是需要經(jīng)過一系列的流程,主要包括以下幾個(gè)方面。
由于物流企業(yè)的客戶信息量大,而且地域分布也相對(duì)較廣,面臨競(jìng)爭(zhēng)日益激烈的現(xiàn)狀,需要對(duì)一些待挖掘的數(shù)據(jù)源進(jìn)行有效的數(shù)據(jù)分析。而待挖掘的數(shù)據(jù)源中要尋找出影響到物流客戶購買行為決策的一些關(guān)鍵因素,這就需要關(guān)注和跟蹤關(guān)鍵性的聯(lián)系,然后修改相關(guān)的服務(wù)方案,從而留住老客戶,吸引新客戶。這就需要對(duì)待挖掘的數(shù)據(jù)源進(jìn)行收集,以備整理各類信息。
準(zhǔn)備數(shù)據(jù)階段也是數(shù)據(jù)挖掘的一個(gè)關(guān)鍵環(huán)節(jié),具體包括了數(shù)據(jù)集成、數(shù)據(jù)選擇和數(shù)據(jù)預(yù)處理三個(gè)關(guān)鍵步驟。數(shù)據(jù)集成是指從多個(gè)不同的操作性數(shù)據(jù)庫文件中抽取一些數(shù)據(jù)進(jìn)行集成。數(shù)據(jù)預(yù)處理是指在挖掘之前對(duì)于限定的數(shù)據(jù)要進(jìn)一步的縮減和轉(zhuǎn)化。比如在進(jìn)行配送路徑選擇時(shí),路徑直接影響到了企業(yè)的配送效率,這就需要充分的考慮到車輛的路徑以及客戶的路徑,同時(shí)也要考慮車輛的利用能力??傊M(jìn)行全面分析,準(zhǔn)備各類數(shù)據(jù)[5]。
由于數(shù)據(jù)挖掘技術(shù)比較多,應(yīng)該結(jié)合物流企業(yè)的實(shí)際需求選擇恰當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù),才能找到數(shù)據(jù)中最隱秘、最具有價(jià)值的相關(guān)信息。在建立挖掘模型之后要通過對(duì)已經(jīng)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行進(jìn)一步的挖掘??梢岳貌煌姆治龇椒ㄒ约巴诰蚬ぞ叩奶卣鱽磉M(jìn)行選定。
通過解釋與評(píng)價(jià)環(huán)節(jié)能夠了解不同的分析方式方法所產(chǎn)生的效果和作用。通過對(duì)挖掘的結(jié)果進(jìn)行評(píng)價(jià)、篩選能夠?qū)⒆钪匾男畔⒈4嫦聛怼?/p>
通過進(jìn)行數(shù)據(jù)挖掘之后,形成對(duì)于物流企業(yè)具有幫助的數(shù)據(jù)知識(shí)庫,為企業(yè)領(lǐng)導(dǎo)者做出重要的依據(jù)。數(shù)據(jù)庫中要包括圖表、規(guī)則,但是一定要保證通俗易懂,便于領(lǐng)導(dǎo)者進(jìn)行決策。
面臨物流行業(yè)快速發(fā)展的現(xiàn)狀,只有借助于大數(shù)據(jù)技術(shù)才能夠獲得長(zhǎng)遠(yuǎn)的發(fā)展。所謂數(shù)據(jù)挖掘是指對(duì)多樣化的、量大的、價(jià)值高的信息進(jìn)行有效的尋找,從而為物流行業(yè)發(fā)展提供數(shù)字依據(jù)。在進(jìn)行數(shù)據(jù)挖掘時(shí)需要借助一些數(shù)據(jù)挖掘的技術(shù),包括人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策樹、關(guān)聯(lián)原則和其他方法。在對(duì)數(shù)據(jù)進(jìn)行使用時(shí)需要對(duì)數(shù)據(jù)進(jìn)行分析,包括待挖掘的數(shù)據(jù)源、然后進(jìn)行數(shù)據(jù)的準(zhǔn)備工作,最后確定出合適的數(shù)據(jù),然后通過評(píng)價(jià)從而充分地運(yùn)用在物流系統(tǒng)中,形成相關(guān)的數(shù)據(jù)庫。通過進(jìn)行數(shù)據(jù)挖掘能夠滿足物流企業(yè)的多樣化的需求,并且能夠保證數(shù)據(jù)更加精準(zhǔn),從而推動(dòng)物流企業(yè)做強(qiáng)做大。
[1]于晶.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及應(yīng)用探究[J].科技與創(chuàng)新,2018(24):89-90.
[2]劉銘,呂丹,安永燦.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].科技導(dǎo)報(bào),2018(9):73-83.
[3]王慧.大數(shù)據(jù)時(shí)代物流信息平臺(tái)構(gòu)建與建設(shè)對(duì)策研究[J].信息記錄材料,2019(5):109-111.
[4]陽柳, YangLiu.大數(shù)據(jù)時(shí)代的物流信息挖掘與應(yīng)用[J].物流技術(shù),2018(23):414-416.
[5]田志民,梁品超,任艷紅,等.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].當(dāng)代教育實(shí)踐與教學(xué)研究,2019(10):10-11.
TP311.13
A
2095-1205(2019)11-53-02
10.3969/j.issn.2095-1205.2019.11.30