鄭 斌
(中國(guó)石化銷售股份有限公司,北京 100728)
大數(shù)據(jù)技術(shù)是指實(shí)現(xiàn)一切大數(shù)據(jù)采集與預(yù)處理、存儲(chǔ)管理、大數(shù)據(jù)分析挖掘、大數(shù)據(jù)安全和大數(shù)據(jù)可視化的技術(shù)手段,是大數(shù)據(jù)價(jià)值實(shí)現(xiàn)的重要條件。大數(shù)據(jù)技術(shù)能夠從海量數(shù)據(jù)中快速獲取有價(jià)值信息,因而獲得快速發(fā)展。當(dāng)前,大數(shù)據(jù)技術(shù)已經(jīng)深入各行各業(yè),尤其在金融、互聯(lián)網(wǎng)、電信、電子商務(wù)等行業(yè)取得了顯著的應(yīng)用效果。
在質(zhì)量管理領(lǐng)域,隨著信息化水平提升,質(zhì)量信息的獲取越來(lái)越便捷,大數(shù)據(jù)技術(shù)與質(zhì)量管理相結(jié)合成為企業(yè)提升質(zhì)量管理的重要手段。應(yīng)用大數(shù)據(jù)技術(shù)對(duì)產(chǎn)品質(zhì)量信息進(jìn)行管理,能夠?qū)A康臄?shù)據(jù)和信息進(jìn)行分析、處理和預(yù)測(cè),有助于加強(qiáng)質(zhì)量預(yù)防,將質(zhì)量控制關(guān)口前移;通過(guò)對(duì)大量數(shù)據(jù)的分析評(píng)價(jià)可以監(jiān)視生產(chǎn)過(guò)程的動(dòng)態(tài)變化和產(chǎn)品的特性及趨勢(shì),可以適當(dāng)?shù)夭扇☆A(yù)防措施并進(jìn)行質(zhì)量改進(jìn)[1]。在我國(guó),大數(shù)據(jù)技術(shù)在質(zhì)量管理領(lǐng)域的應(yīng)用日益廣泛,在制造業(yè)質(zhì)量管理、食品安全治理、政府質(zhì)量監(jiān)管等方面取得成功應(yīng)用[2-7]。但在成品油銷售行業(yè),在質(zhì)量管理方面開展大數(shù)據(jù)技術(shù)研究與應(yīng)用的鮮有報(bào)道。
本文針對(duì)傳統(tǒng)成品油質(zhì)量管理中存在的突出問(wèn)題,嘗試?yán)么髷?shù)據(jù)技術(shù),挖掘質(zhì)量數(shù)據(jù)背后的規(guī)律性和趨勢(shì)性關(guān)系,在供應(yīng)商油品特征畫像、外采油品溯源以及汽油辛烷值指標(biāo)檢測(cè)方面進(jìn)行了探索性嘗試,并建立了成品油質(zhì)量大數(shù)據(jù)分析平臺(tái)應(yīng)用于質(zhì)量管理當(dāng)中,開創(chuàng)了運(yùn)用大數(shù)據(jù)技術(shù)解決成品油質(zhì)量管理問(wèn)題的新思路、新途徑。
成品油質(zhì)量管理貫穿于采儲(chǔ)運(yùn)銷的整個(gè)業(yè)務(wù)流程,業(yè)務(wù)鏈條長(zhǎng)、涉及單位多、影響因素復(fù)雜。外采油品是銷售企業(yè)重要的資源補(bǔ)充,也是最大的質(zhì)量風(fēng)險(xiǎn)源,是質(zhì)量管理的重點(diǎn)和難點(diǎn)。中國(guó)石化銷售企業(yè)通過(guò)建立完善的質(zhì)量管理體系,強(qiáng)化源頭管理和過(guò)程管控,質(zhì)量管理水平不斷提升,但在防范外采質(zhì)量風(fēng)險(xiǎn)、流通過(guò)程質(zhì)量監(jiān)控等方面,仍然存在一些傳統(tǒng)管理手段難以解決的問(wèn)題。
銷售企業(yè)油品采購(gòu)涉及的供應(yīng)商數(shù)量眾多。傳統(tǒng)的質(zhì)量管理,企業(yè)間乃至質(zhì)檢室之間數(shù)據(jù)不能共享,存在信息孤島,質(zhì)量管理人員只能了解自己范圍內(nèi)的供應(yīng)商質(zhì)量數(shù)據(jù),對(duì)于供應(yīng)商的產(chǎn)品質(zhì)量特點(diǎn)認(rèn)識(shí)存在局限。
外采油品來(lái)源復(fù)雜,產(chǎn)品質(zhì)量良莠不齊,非法調(diào)和油品以及合格但不好用的油品在市場(chǎng)中長(zhǎng)期存在,僅關(guān)注產(chǎn)品質(zhì)量是否合格早已不能滿足質(zhì)量風(fēng)險(xiǎn)管控的要求。而識(shí)別潛在質(zhì)量風(fēng)險(xiǎn)對(duì)于人員能力的要求較高,目前一線質(zhì)檢人員透過(guò)數(shù)據(jù)發(fā)現(xiàn)潛在風(fēng)險(xiǎn)的能力還普遍不足。
外采供應(yīng)商為了將調(diào)和油品或源頭不明的油品賣入銷售企業(yè),偽造油品來(lái)源的事件時(shí)有發(fā)生。識(shí)別和追溯外采油品的來(lái)源,是防范外采質(zhì)量風(fēng)險(xiǎn)的重要手段。但傳統(tǒng)的人工查驗(yàn)報(bào)告單真?zhèn)魏捅葘?duì)質(zhì)檢數(shù)據(jù)一致性的方法準(zhǔn)確性不高,質(zhì)量管理人員鑒別油源真?zhèn)魏妥匪萦推穪?lái)源的手段有限。
汽油辛烷值和柴油十六烷值是汽柴油采購(gòu)、儲(chǔ)運(yùn)和銷售過(guò)程中重要的質(zhì)量控制指標(biāo)。銷售企業(yè)點(diǎn)多線長(zhǎng)面廣,雖然實(shí)驗(yàn)室眾多,但辛烷值機(jī)、十六烷值機(jī)等檢測(cè)儀器往往一個(gè)省公司只有1臺(tái),檢測(cè)需要跨區(qū)域送檢,耗時(shí)長(zhǎng)、成本高,是銷售企業(yè)質(zhì)量管理的瓶頸。
2011年,中國(guó)石化開始在銷售企業(yè)建設(shè)實(shí)驗(yàn)室信息管理系統(tǒng)(LIMS),至2017年3月,建成了覆蓋30多家銷售企業(yè)、380多座實(shí)驗(yàn)室的集中式LIMS系統(tǒng)。銷售企業(yè)LIMS系統(tǒng)的應(yīng)用,實(shí)現(xiàn)了數(shù)據(jù)的集中存儲(chǔ)和統(tǒng)一管理,采購(gòu)、儲(chǔ)存、運(yùn)輸、銷售各環(huán)節(jié)的質(zhì)量數(shù)據(jù)得以收集和積累,初步形成了中國(guó)石化的成品油質(zhì)量數(shù)據(jù)庫(kù)(檢驗(yàn)樣品數(shù)超過(guò)320萬(wàn)條)。海量質(zhì)量數(shù)據(jù)的積累為應(yīng)用大數(shù)據(jù)技術(shù)奠定了基礎(chǔ),因此,如何利用大數(shù)據(jù)技術(shù),挖掘數(shù)據(jù)背后的規(guī)律,改進(jìn)質(zhì)量管理手段、提升質(zhì)量管理水平顯得尤為迫切。
用戶畫像是商業(yè)領(lǐng)域中典型的大數(shù)據(jù)分析應(yīng)用,通過(guò)對(duì)用戶歷史數(shù)據(jù)的分析來(lái)對(duì)用戶進(jìn)行“標(biāo)簽化”處理,并且實(shí)現(xiàn)對(duì)于用戶群體特征的概括,從而實(shí)現(xiàn)對(duì)用戶的深度了解,并根據(jù)不同的應(yīng)用場(chǎng)景轉(zhuǎn)化為相應(yīng)的商業(yè)價(jià)值。
為了便于管理人員準(zhǔn)確地了解每個(gè)供應(yīng)商的油品質(zhì)量特點(diǎn),借鑒用戶畫像的思路,嘗試運(yùn)用油品群落分析的方法,為供應(yīng)商油品進(jìn)行特征畫像。油品群落分析的流程如圖1所示。以汽油產(chǎn)品為例,采用決策樹和K–means算法,建立了汽油質(zhì)量群落劃分模型。首先,按照油品來(lái)源,從業(yè)務(wù)意義上將油品劃分為配置油和外采油。其次,根據(jù)配置油和外采油的特征,使用決策樹分類模型,采用分類監(jiān)督劃分的方法,將油品劃分為四大類(典型配置油、典型外采油、類配置外采油、類外采配置油)。然后,采用K–means無(wú)監(jiān)督聚類的方法,根據(jù)油品間的相似性,將相似程度高的油品聚為一類,由此將每一大類油品細(xì)分為5個(gè)群落。最后,對(duì)每個(gè)細(xì)分群落的油品進(jìn)行標(biāo)簽化(關(guān)鍵指標(biāo)特征刻畫描述),從而實(shí)現(xiàn)供應(yīng)商油品特征畫像。
圖1 供應(yīng)商油品群落分析示意
圖2為某供應(yīng)商92#汽油的群落劃分結(jié)果。從圖2可見,該供應(yīng)商79.7%的樣本落入典型配置油群落1,說(shuō)明該供應(yīng)商92#汽油的質(zhì)量比較穩(wěn)定,絕大多數(shù)屬于這一類別。通過(guò)典型配置油群落1的特征標(biāo)簽(餾程類指標(biāo)低,餾程短,20℃密度小,硫含量低),可以了解該供應(yīng)商92#汽油的主要特征是餾程類指標(biāo)低,密度低,硫含量低。通過(guò)油品特征畫像,使質(zhì)量管理人員統(tǒng)一了對(duì)供應(yīng)商的認(rèn)識(shí),更加直觀地了解供應(yīng)商的油品特點(diǎn),加深對(duì)于供應(yīng)商的理解,從而在油品入庫(kù)時(shí)更加高效、準(zhǔn)確地進(jìn)行質(zhì)量把關(guān)。
圖2 供應(yīng)商92#汽油群落劃分結(jié)果
為了解決外采油品人工溯源準(zhǔn)確率不高的難題,提出了一種基于大數(shù)據(jù)算法輔助人工溯源的方法。出自同一生產(chǎn)企業(yè)的油品具有相似的質(zhì)量特征,根據(jù)相近相似原理,如果能夠從歷史數(shù)據(jù)中找到與待溯源樣本質(zhì)量特征相似的油品,則可以根據(jù)相似樣本的來(lái)源推斷該油品來(lái)源。基于K近鄰算法,構(gòu)建了外采油品生產(chǎn)商匹配模型:以汽油為例,以汽油的常規(guī)理化指標(biāo)(研究法辛烷值、硫含量、烯烴含量、芳烴含量等)作為特征向量,采用歐式距離作為衡量樣本間相似度的度量方法。通過(guò)計(jì)算相似度在歷史數(shù)據(jù)庫(kù)中找出與待溯源樣本最相似的5個(gè)樣本,將該樣本與5個(gè)最近鄰樣本的生產(chǎn)商信息進(jìn)行匹配,當(dāng)該樣本與其中一個(gè)或多個(gè)樣本的生產(chǎn)商信息匹配成功時(shí),判斷該樣本所述生產(chǎn)商為真;否則,判斷該樣本所述生產(chǎn)商為假,該樣本來(lái)源存疑,并給出預(yù)警。
典型的模型匹配結(jié)果如表1所示。
表1 生產(chǎn)商匹配模型的匹配結(jié)果
由表1看出,外采油樣本(2130700)的模型匹配結(jié)果顯示,在5個(gè)最近鄰中有3個(gè)樣本與該樣本為同一個(gè)生產(chǎn)商,且樣本距離最近,從而提示該溯源樣本的油源為真實(shí)的。而對(duì)于未匹配成功的樣本,除了來(lái)源預(yù)警之外,還可以提示油品可能的真正來(lái)源。外采油樣本(2121049)的5個(gè)最近鄰中,待溯源樣本與第一個(gè)樣本的相似度顯著高于其余4個(gè),指示這兩批次油品可能來(lái)自同一來(lái)源。經(jīng)過(guò)人工追溯核實(shí),證實(shí)該兩批次油品確實(shí)出自同一源頭。將該模型進(jìn)行部署應(yīng)用,通過(guò)實(shí)時(shí)抽取LIMS數(shù)據(jù),可以為每一批次的外采油品進(jìn)行實(shí)時(shí)的來(lái)源分析。經(jīng)實(shí)踐證明,該方法具有良好的可行性,能夠有效輔助管理人員識(shí)別和追溯外采油品來(lái)源。
為了解決采儲(chǔ)運(yùn)銷全環(huán)節(jié)質(zhì)量管控中存在的汽油辛烷值指標(biāo)檢測(cè)難度大的問(wèn)題,基于歷史質(zhì)量數(shù)據(jù),研究構(gòu)建了一種研究法辛烷值回歸預(yù)測(cè)模型。
汽油的多項(xiàng)理化指標(biāo)與辛烷值具有良好相關(guān)性,如烯烴、芳烴、MTBE等是汽油辛烷值的主要貢獻(xiàn)者,烯烴、芳烴、氧含量與辛烷值具有直接且顯著的相關(guān)性?;诔善酚唾|(zhì)量數(shù)據(jù)庫(kù)中含有辛烷值檢測(cè)結(jié)果的歷史樣本數(shù)據(jù),提出一種汽油辛烷值的回歸預(yù)測(cè)方法。采用隨機(jī)森林回歸算法,選擇與汽油辛烷值具有相關(guān)性、且常規(guī)檢測(cè)易于獲得的理化指標(biāo)(烯烴含量、芳烴含量、氧含量、餾程和密度)作為自變量,建立了研究法辛烷值回歸預(yù)測(cè)模型[8]。
將模型預(yù)測(cè)結(jié)果與標(biāo)準(zhǔn)辛烷值機(jī)檢測(cè)結(jié)果的偏差進(jìn)行了統(tǒng)計(jì)分析,并與銷售企業(yè)目前常用的中紅外分析儀的檢測(cè)結(jié)果進(jìn)行了比較。圖3為回歸預(yù)測(cè)模型與中紅外檢測(cè)的偏差分布圖。由圖3可見,該模型的預(yù)測(cè)精度很高,95%的預(yù)測(cè)結(jié)果偏差在1個(gè)單位以內(nèi),模型的預(yù)測(cè)精度顯著優(yōu)于中紅外分析儀的檢測(cè)精度,能夠滿足銷售企業(yè)質(zhì)量監(jiān)控的需要。將預(yù)測(cè)模型進(jìn)行部署,通過(guò)實(shí)時(shí)抽取LIMS數(shù)據(jù)庫(kù)中新入庫(kù)汽油的檢測(cè)數(shù)據(jù),從而實(shí)現(xiàn)了汽油辛烷值的在線預(yù)測(cè)。
圖3 回歸預(yù)測(cè)模型與中紅外檢測(cè)的偏差分布
基于LIMS系統(tǒng)的實(shí)時(shí)數(shù)據(jù)和大數(shù)據(jù)分析挖掘的研究成果,采用可視化技術(shù),搭建了成品油質(zhì)量大數(shù)據(jù)分析平臺(tái)(見圖4),形成了油品質(zhì)量管理、供應(yīng)商管理和管理駕駛艙3個(gè)應(yīng)用模塊,幫助管理人員更加直觀地理解數(shù)據(jù)、科學(xué)決策。
圖4 成品油質(zhì)量大數(shù)據(jù)分析平臺(tái)架構(gòu)
3.4.1 油品質(zhì)量管理模塊
在油品質(zhì)量管理模塊,包括了供應(yīng)商群落分析、油品生產(chǎn)商溯源、質(zhì)量指標(biāo)預(yù)警、辛烷值預(yù)測(cè)等功能。管理人員通過(guò)供應(yīng)商群落分析,能夠了解每一個(gè)供應(yīng)商的油品特征,識(shí)別不同群落的油品差異,以及哪些供應(yīng)商具有相似的質(zhì)量特點(diǎn),在質(zhì)量把關(guān)時(shí)做到心中有數(shù);通過(guò)生產(chǎn)商溯源,能夠?qū)γ恳慌斡推返膩?lái)源進(jìn)行鑒別并輔助進(jìn)行溯源。
除此之外,通過(guò)對(duì)歷史數(shù)據(jù)的挖掘分析,制定了油品質(zhì)量指標(biāo)的量化評(píng)分規(guī)則,建立了油品質(zhì)量量化評(píng)價(jià)及警示模型,對(duì)每一批次新進(jìn)油品進(jìn)行量化評(píng)價(jià),并對(duì)得分較低的項(xiàng)目進(jìn)行警示,輔助管理人員識(shí)別潛在質(zhì)量風(fēng)險(xiǎn),及時(shí)采取科學(xué)處置措施。
3.4.2 供應(yīng)商管理模塊
在供應(yīng)商管理模塊,包括了供應(yīng)商指標(biāo)分布、指標(biāo)差異分析、質(zhì)量指標(biāo)控制、供應(yīng)商量化評(píng)價(jià)等功能,管理人員能夠從不同維度對(duì)供應(yīng)商及其油品質(zhì)量進(jìn)行監(jiān)控。通過(guò)指標(biāo)分布及差異對(duì)比,了解供應(yīng)商每一項(xiàng)質(zhì)量指標(biāo)的分布特點(diǎn),以及不同供應(yīng)商的指標(biāo)差異;通過(guò)質(zhì)量指標(biāo)控制,可視化地監(jiān)控供應(yīng)商的質(zhì)量狀態(tài),及時(shí)掌握供應(yīng)商產(chǎn)品質(zhì)量波動(dòng);通過(guò)供應(yīng)商量化評(píng)價(jià),全面了解供應(yīng)商的產(chǎn)品質(zhì)量水平,為優(yōu)化供應(yīng)商結(jié)構(gòu)、提升采購(gòu)質(zhì)量提供科學(xué)支撐。
3.4.3 管理駕駛艙模塊
在管理駕駛艙模塊,涵蓋了不合格油品情況、不合格指標(biāo)趨勢(shì)、內(nèi)外油指標(biāo)對(duì)比等多項(xiàng)功能,管理人員突破LIMS系統(tǒng)中只看到本省質(zhì)量數(shù)據(jù)的局限,可以多維度了解全國(guó)的質(zhì)量管理情況,不合格產(chǎn)品的分布及趨勢(shì),質(zhì)量風(fēng)險(xiǎn)集中在哪些方面,以及配置油與外采油的質(zhì)量差異,從而更好地管控采購(gòu)油品的質(zhì)量風(fēng)險(xiǎn)。
大數(shù)據(jù)蘊(yùn)藏著巨大價(jià)值,要充分發(fā)揮大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),助推企業(yè)管理創(chuàng)新,防范質(zhì)量風(fēng)險(xiǎn),實(shí)現(xiàn)質(zhì)量提升,還需要做好以下幾個(gè)方面的工作。
隨著信息化水平的不斷提升,銷售企業(yè)的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。傳統(tǒng)的質(zhì)量管理模式和方法,已經(jīng)不能滿足新形勢(shì)下的管理需求。因此,必須改變傳統(tǒng)的數(shù)據(jù)是靜止的、陳舊的、過(guò)后無(wú)用的思維,樹立數(shù)據(jù)是資源、數(shù)據(jù)是效益、數(shù)據(jù)分析是生產(chǎn)力的理念[3],在質(zhì)量管理中充分運(yùn)用大數(shù)據(jù)思維,提升大數(shù)據(jù)分析能力,從而實(shí)現(xiàn)質(zhì)量管理的革新和提升。
大數(shù)據(jù)技術(shù)在防范質(zhì)量風(fēng)險(xiǎn)、提升質(zhì)量管理方面擁有廣闊的應(yīng)用前景。對(duì)采儲(chǔ)運(yùn)銷全環(huán)節(jié)的質(zhì)量數(shù)據(jù)進(jìn)行整合,構(gòu)建成品油全生命周期的管理數(shù)據(jù)鏈條,設(shè)定“質(zhì)量預(yù)警閾值”,通過(guò)預(yù)警提前識(shí)別潛在風(fēng)險(xiǎn),并有效追溯問(wèn)題源頭。對(duì)歷史退貨油品數(shù)據(jù)進(jìn)行挖掘分析,確定問(wèn)題油品的判定規(guī)則,從而對(duì)重復(fù)、異地提交的問(wèn)題油品進(jìn)行預(yù)警。打通不同信息系統(tǒng)間的壁壘,整合外采系統(tǒng)的供應(yīng)商商流信息、LIMS系統(tǒng)的產(chǎn)品質(zhì)量信息以及商客、零管系統(tǒng)的客戶投訴信息,運(yùn)用大數(shù)據(jù)技術(shù),建立全面的供應(yīng)商評(píng)價(jià)及信用體系,從而實(shí)現(xiàn)供應(yīng)商精益管理。
本文中建設(shè)的成品油質(zhì)量大數(shù)據(jù)分析平臺(tái),是基于LIMS系統(tǒng)構(gòu)建的應(yīng)用于成品油質(zhì)量管理的數(shù)據(jù)分析應(yīng)用平臺(tái)。隨著成品油儲(chǔ)運(yùn)物聯(lián)網(wǎng)的建設(shè)與應(yīng)用,將大數(shù)據(jù)、物聯(lián)網(wǎng)以及云計(jì)算技術(shù)相結(jié)合,建設(shè)更廣泛的企業(yè)級(jí)大數(shù)據(jù)技術(shù)平臺(tái),提升數(shù)據(jù)資源的利用能力,推進(jìn)智慧管理模式建設(shè),將是未來(lái)的發(fā)展方向。
針對(duì)傳統(tǒng)成品油質(zhì)量管理手段存在的局限性,將大數(shù)據(jù)技術(shù)引入成品油質(zhì)量管理,在油品特征畫像、外采油品溯源以及汽油法辛烷值預(yù)測(cè)等方面開展了探索性研究,提出了新的解決方案。建立的成品油質(zhì)量大數(shù)據(jù)分析平臺(tái),對(duì)于提升管理人員對(duì)油品質(zhì)量的洞悉力,防范外采油品質(zhì)量風(fēng)險(xiǎn),提升供應(yīng)商精細(xì)管理起到了顯著作用。大數(shù)據(jù)技術(shù)在銷售企業(yè)質(zhì)量管理中具有廣闊的應(yīng)用空間,隨著質(zhì)量數(shù)據(jù)日益積累、應(yīng)用范圍不斷擴(kuò)大,以及數(shù)據(jù)挖掘能力的提升,必將為銷售企業(yè)質(zhì)量管理升級(jí)和提升經(jīng)營(yíng)創(chuàng)效能力發(fā)揮更大的作用。