摘要:文章闡述了企業(yè)在兩化融合發(fā)展進(jìn)程中數(shù)據(jù)開(kāi)發(fā)利用的需求,給出了以實(shí)際操作層、信息系統(tǒng)層和數(shù)據(jù)分析層為組成部分的數(shù)據(jù)開(kāi)發(fā)利用體系框架,并結(jié)合CRISP-DM模型提出了企業(yè)進(jìn)行數(shù)據(jù)開(kāi)發(fā)利用的實(shí)施過(guò)程,最后提出具體實(shí)施過(guò)程中的關(guān)鍵點(diǎn)。
關(guān)鍵詞:兩化融合;CRISP-DM模型;數(shù)據(jù)開(kāi)發(fā)利用 文獻(xiàn)標(biāo)識(shí)碼:A
中圖分類號(hào):F427 文章編號(hào):1009-2374(2015)21-0029-02 DOI:10.13535/j.cnki.11-4406/n.2015.21.015
信息化和工業(yè)化融合(以下簡(jiǎn)稱“兩化融合”)是當(dāng)今國(guó)家乃至世界發(fā)展的大趨勢(shì),對(duì)于企業(yè)而言,兩化融合是將信息化作為手段,夯實(shí)工業(yè)化基礎(chǔ),推進(jìn)企業(yè)數(shù)據(jù)、技術(shù)、業(yè)務(wù)流程、組織結(jié)構(gòu)的互動(dòng)創(chuàng)新和持續(xù)優(yōu)化,從而打造信息化環(huán)境下新型能力的過(guò)程。近年來(lái),隨著企業(yè)單項(xiàng)應(yīng)用的增加及集成度的提升,計(jì)算機(jī)對(duì)數(shù)據(jù)的處理能力顯著提高,隨之而來(lái)的數(shù)據(jù)量與日俱增。市場(chǎng)競(jìng)爭(zhēng)的加劇、企業(yè)規(guī)模的增大、數(shù)據(jù)復(fù)雜度的提升都要求企業(yè)實(shí)現(xiàn)數(shù)據(jù)的開(kāi)發(fā)利用,為領(lǐng)導(dǎo)決策提供相應(yīng)的依據(jù)。為進(jìn)一步規(guī)范企業(yè)數(shù)據(jù)的開(kāi)發(fā)利用,《信息化與工業(yè)化融合管理體系要求》中也著重提出了“有效地開(kāi)發(fā)利用數(shù)據(jù)”的要求。故本文提出在兩化融合過(guò)程中,企業(yè)利用CRISP-DM(cross-industry standard process for data mining)模型規(guī)范數(shù)據(jù)開(kāi)發(fā)利用的過(guò)程。
1 數(shù)據(jù)開(kāi)發(fā)利用體系框架
數(shù)據(jù)開(kāi)發(fā)利用體系框架如圖1所示,可分為三個(gè)
部分:
1.1 實(shí)際操作層
涵蓋研發(fā)、制造、銷售等環(huán)節(jié),是企業(yè)數(shù)據(jù)的最初來(lái)源和最終落腳點(diǎn),各部門(mén)負(fù)責(zé)采集其中的數(shù)據(jù),將其作為信息系統(tǒng)的輸入,并利用決策的結(jié)果對(duì)實(shí)際業(yè)務(wù)進(jìn)行調(diào)整。
1.2 信息系統(tǒng)層
涵蓋企業(yè)ERP、OA、PLM等已有信息系統(tǒng),對(duì)其進(jìn)行集成應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)、接口的標(biāo)準(zhǔn)化和規(guī)范化,確保為數(shù)據(jù)分析層提供有效的數(shù)據(jù)。
1.3 數(shù)據(jù)分析層
涵蓋了數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘和決策支持/商業(yè)智能三部分,用于將信息系統(tǒng)中的數(shù)據(jù)提取出來(lái),并根據(jù)需要進(jìn)行轉(zhuǎn)換和存儲(chǔ),然后按照特定目的進(jìn)行挖掘、統(tǒng)計(jì)和分析,從而產(chǎn)生供管理者參考的決策,可包括:研發(fā)方向調(diào)整、銷售市場(chǎng)細(xì)分、職能部門(mén)優(yōu)化等,最終將決策反饋至實(shí)際操作層,并對(duì)信息系統(tǒng)作相應(yīng)變更。
2 利用CRISP-DM模型實(shí)現(xiàn)企業(yè)數(shù)據(jù)開(kāi)發(fā)利用
CRISP-DM由歐盟機(jī)構(gòu)于1999年聯(lián)合起草,為全工業(yè)界提供數(shù)據(jù)挖掘利用的全生命周期管理標(biāo)準(zhǔn)。CRISP-DM模型定義了六個(gè)過(guò)程,按照此模型,企業(yè)可按如下步驟實(shí)施數(shù)據(jù)開(kāi)發(fā)利用:
2.1 商業(yè)理解
從企業(yè)戰(zhàn)略出發(fā),確定可持續(xù)競(jìng)爭(zhēng)優(yōu)勢(shì)和需要打造的信息化環(huán)境下新型能力,再細(xì)化到需要實(shí)現(xiàn)的兩化融合目標(biāo),從待實(shí)現(xiàn)的目標(biāo)中提出需解決的數(shù)據(jù)開(kāi)發(fā)利用問(wèn)題,進(jìn)行數(shù)據(jù)開(kāi)發(fā)利用策劃,需涵蓋開(kāi)發(fā)目標(biāo)、涉及部門(mén)、數(shù)據(jù)來(lái)源、開(kāi)發(fā)過(guò)程等。
2.2 數(shù)據(jù)理解
根據(jù)數(shù)據(jù)開(kāi)發(fā)利用策劃,從各部門(mén)、各流程、各崗位、各系統(tǒng)中收集相關(guān)數(shù)據(jù),并對(duì)數(shù)據(jù)質(zhì)量加以鑒別,以確保數(shù)據(jù)的準(zhǔn)確性、全面性、有效性,此外,還需初步探索數(shù)據(jù)自身的特征及數(shù)據(jù)間的相互聯(lián)系,形成對(duì)潛在信息的假設(shè)。
2.3 數(shù)據(jù)準(zhǔn)備
根據(jù)與數(shù)據(jù)開(kāi)發(fā)利用目標(biāo)的相關(guān)性、數(shù)據(jù)質(zhì)量及開(kāi)發(fā)利用技術(shù),進(jìn)行建模前的數(shù)據(jù)準(zhǔn)備。首先進(jìn)行數(shù)據(jù)表制作,將數(shù)據(jù)統(tǒng)一格式后進(jìn)行記錄,然后為適應(yīng)建模工具進(jìn)行數(shù)據(jù)清理,這一過(guò)程一般需反復(fù)實(shí)施多次,直至篩選出最終數(shù)據(jù)集。
2.4 建立模型
根據(jù)待數(shù)據(jù)開(kāi)發(fā)利用的問(wèn)題類型,選擇對(duì)應(yīng)的建模技術(shù)。與以往類似的可對(duì)原技術(shù)加以修改沿用,與以往不相同的則需要重新建模。在此過(guò)程中,當(dāng)涉及到數(shù)據(jù)不匹配時(shí),可能會(huì)重新進(jìn)行數(shù)據(jù)準(zhǔn)備過(guò)程,實(shí)現(xiàn)對(duì)數(shù)據(jù)參數(shù)的精準(zhǔn)校對(duì)。
2.5 模型評(píng)估
在數(shù)據(jù)模型最終部署之前,需對(duì)修改和新增的模型進(jìn)行再評(píng)估,回顧其中每個(gè)步驟、每個(gè)數(shù)據(jù)、每個(gè)邏輯,尤其要考慮和兩化融合目標(biāo)的關(guān)聯(lián)性,確定是否可解決提出的數(shù)據(jù)開(kāi)發(fā)利用問(wèn)題,為模型部署成功提供
保障。
2.6 部署實(shí)施
由信息部門(mén)和相關(guān)業(yè)務(wù)部門(mén)共同完成相關(guān)信息系統(tǒng)的搭建、改造和完善,明確各部門(mén)、各崗位參與數(shù)據(jù)開(kāi)發(fā)利用的主體和具體職責(zé),以制度文件的形式規(guī)范下來(lái),共同參與數(shù)據(jù)開(kāi)發(fā)利用過(guò)程。
3 數(shù)據(jù)開(kāi)發(fā)利用的關(guān)鍵點(diǎn)
根據(jù)對(duì)應(yīng)的規(guī)范要求和過(guò)程指導(dǎo),為確保有效開(kāi)發(fā)和利用數(shù)據(jù),在具體實(shí)施過(guò)程中應(yīng)重點(diǎn)關(guān)注以下幾點(diǎn):
3.1 重視商業(yè)理解,統(tǒng)籌管理全局
商業(yè)理解是數(shù)據(jù)開(kāi)發(fā)利用的第一步,它關(guān)注數(shù)據(jù)開(kāi)發(fā)利用過(guò)程中的方向性問(wèn)題。應(yīng)由領(lǐng)導(dǎo)層深入?yún)⑴c,正確把握兩化融合目標(biāo),明確待解決問(wèn)題對(duì)達(dá)成目標(biāo)的關(guān)聯(lián)度和貢獻(xiàn)性,在各部門(mén)提出需求的基礎(chǔ)上,重點(diǎn)關(guān)注最迫切的數(shù)據(jù)開(kāi)發(fā)利用方向。只有始終抓住這個(gè)重點(diǎn),才能對(duì)后續(xù)的實(shí)施全局起決定性的指導(dǎo)作用。
3.2 嚴(yán)把數(shù)據(jù)來(lái)源,推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)的可靠性、真實(shí)性、完整性是數(shù)據(jù)開(kāi)發(fā)利用的基礎(chǔ),也是達(dá)成兩化融合目標(biāo)的保障。如果數(shù)據(jù)質(zhì)量不好,即使模型很完美,也不可避免產(chǎn)生一個(gè)偏差或者錯(cuò)誤的結(jié)果。應(yīng)嚴(yán)格篩選和過(guò)濾各部門(mén)、流程、崗位及系統(tǒng)提供的數(shù)據(jù),推進(jìn)數(shù)據(jù)處理環(huán)節(jié)的標(biāo)準(zhǔn)化,并建立相應(yīng)的數(shù)據(jù)校對(duì)機(jī)制,逐步提高數(shù)據(jù)的質(zhì)量。
3.3 落實(shí)責(zé)任主體,明確具體職責(zé)
職責(zé)分配落實(shí)是確保數(shù)據(jù)開(kāi)發(fā)利用有序進(jìn)行的關(guān)鍵,也是長(zhǎng)期進(jìn)行數(shù)據(jù)治理的必要措施。如果不能從制度上落實(shí)職責(zé),很容易造成數(shù)據(jù)的遺漏和丟失。應(yīng)制定相關(guān)制度,規(guī)定數(shù)據(jù)采集和維護(hù)的周期,指定專門(mén)崗位按制度要求負(fù)責(zé)數(shù)據(jù)的采集、匯總、校驗(yàn)、錄入等,并由上級(jí)領(lǐng)導(dǎo)對(duì)數(shù)據(jù)的真實(shí)性進(jìn)行審核,對(duì)數(shù)據(jù)的準(zhǔn)確性負(fù)責(zé)。
3.4 定期回顧總結(jié),提升決策質(zhì)量
對(duì)數(shù)據(jù)的定期回顧和總結(jié)是不斷提升決策質(zhì)量的必要環(huán)節(jié),它關(guān)注于數(shù)據(jù)開(kāi)發(fā)利用中的方向修正問(wèn)題。如果無(wú)法通過(guò)回顧總結(jié)發(fā)現(xiàn)其中的疏漏和不完善,會(huì)對(duì)決策準(zhǔn)確性造成影響。應(yīng)周期性地對(duì)數(shù)據(jù)的質(zhì)量及數(shù)據(jù)對(duì)達(dá)成目標(biāo)的貢獻(xiàn)性進(jìn)行回顧總結(jié),調(diào)整優(yōu)化相應(yīng)業(yè)務(wù)流程和崗位職責(zé),對(duì)應(yīng)地更新信息系統(tǒng),確保數(shù)據(jù)開(kāi)發(fā)利用的高效和準(zhǔn)確。
4 結(jié)語(yǔ)
隨著工業(yè)4.0時(shí)代的到來(lái),IT技術(shù)的發(fā)展為企業(yè)帶來(lái)了新的思路,數(shù)據(jù)作為企業(yè)各生產(chǎn)環(huán)節(jié)的核心,對(duì)其進(jìn)行開(kāi)發(fā)利用是企業(yè)必須持續(xù)推進(jìn)、不斷提升的系統(tǒng)性、全局性工作。必須圍繞數(shù)據(jù)對(duì)企業(yè)的經(jīng)營(yíng)發(fā)展做長(zhǎng)遠(yuǎn)布局,梳理當(dāng)前已有的管理、生產(chǎn)、銷售、人員等數(shù)據(jù),調(diào)整優(yōu)化信息系統(tǒng)、管理制度、崗位職責(zé),實(shí)現(xiàn)企業(yè)從傳統(tǒng)制造向智能制造的轉(zhuǎn)型。
參考文獻(xiàn)
[1] 中華人民共和國(guó)工業(yè)和信息化部.信息化和工業(yè)化融合管理體系要求(試行)[S].2014.
[2] 野村綜合研究所.圖解CIO工作指南[M].北京:人民郵電出版社,2014.
[3] 郭亮.用CRISP-DM模型來(lái)規(guī)范企業(yè)數(shù)據(jù)中心建設(shè)
[J].華北科技學(xué)院學(xué)報(bào),2008,4(5).
作者簡(jiǎn)介:華苗苗(1987-),女,浙江人,浙江省電子信息產(chǎn)品檢驗(yàn)所助理工程師,碩士,研究方向:兩化融合。
(責(zé)任編輯:周 瓊)