李 怡,孔建益,王興東,劉軍偉
(武漢科技大學(xué)機械自動化學(xué)院,湖北 武漢,430081)
基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類
李 怡,孔建益,王興東,劉軍偉
(武漢科技大學(xué)機械自動化學(xué)院,湖北 武漢,430081)
針對工業(yè)生產(chǎn)過程中所產(chǎn)生的產(chǎn)品缺陷數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘后關(guān)聯(lián)規(guī)則存在不能有效組織的問題,提出一種基于項目屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,在建立模糊分類樹的基礎(chǔ)上,計算出關(guān)聯(lián)規(guī)則間距離,并采用自組織神經(jīng)網(wǎng)絡(luò)聚類的方法對挖掘結(jié)果進(jìn)行聚類分析。將該方法應(yīng)用于冷軋帶鋼表面缺陷數(shù)據(jù)挖掘后處理,結(jié)果表明,該方法不僅能夠得出兩種不同屬性項目間的關(guān)聯(lián)性,還可以求出缺陷關(guān)聯(lián)規(guī)則間的距離,距離越近的關(guān)聯(lián)規(guī)則被聚為一類,其相似性越大。
冷軋帶鋼;產(chǎn)品缺陷;屬性;關(guān)聯(lián)規(guī)則;模糊分類;距離;聚類分析;可視化
產(chǎn)品表面缺陷數(shù)據(jù)經(jīng)過挖掘后,往往會出現(xiàn)大量的關(guān)聯(lián)規(guī)則,若直接對這些規(guī)則進(jìn)行數(shù)據(jù)可視化,所體現(xiàn)出的有效信息會大大減弱,給決策者的判斷帶來困難,因此,有必要對關(guān)聯(lián)規(guī)則的挖掘結(jié)果進(jìn)行再處理。目前關(guān)聯(lián)規(guī)則挖掘結(jié)果的處理方法主要有聚類法、分組法與剔除法等,其中聚類法是一種通過挖掘數(shù)據(jù)分布情況來發(fā)現(xiàn)數(shù)據(jù)中隱含模式的一種處理方法,其將大量數(shù)據(jù)在某種算法下分成多類,使得每一類數(shù)據(jù)內(nèi)部存在相似性,而類與類數(shù)據(jù)之間又存在一定的差異性[1]。關(guān)聯(lián)規(guī)則聚類則將挖掘后“親近”的結(jié)果放在一起提供給決策者,便于決策者分析。Toivonen等[2]提出聚類組織關(guān)聯(lián)規(guī)則,并根據(jù)規(guī)則交易數(shù)的重合率來得出規(guī)則間距離,Strehl等[3]在其基礎(chǔ)上作了一些改進(jìn),使得距離值控制在區(qū)間[0,1]內(nèi),但以上方法在計算規(guī)則間距離時均須掃描初始數(shù)據(jù),不僅耗時,還會形成固定數(shù)目的簇而影響對挖掘結(jié)果可視化的效果。Chen等[4]提出了模糊分類樹的概念,阮備軍等[5]在其基礎(chǔ)上針對商品分類信息提出一種基于度量關(guān)聯(lián)規(guī)則間距離的聚類方法,沈斌等[6]又引入了語義差別,進(jìn)一步驗證了規(guī)則聚類的有效性。但是,工業(yè)生產(chǎn)中產(chǎn)品缺陷數(shù)據(jù)與產(chǎn)生缺陷的原因兩者不是建立在語義上面的差別,而是屬于不同屬性類別,因此基于語義差別的聚類方法并不適用。在文獻(xiàn)[4]的基礎(chǔ)上,劉軍偉[7]將兩種不同屬性項目應(yīng)用到了模糊分類樹中,并且以冷軋帶鋼表面缺陷為研究對象,挖掘出大量缺陷關(guān)聯(lián)規(guī)則,但沒有進(jìn)一步計算關(guān)聯(lián)規(guī)則的相似性。基于上述情況,本文提出一種基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,并采用自組織神經(jīng)網(wǎng)絡(luò)聚類法(self-organizing map clustering,SOMC)[8]對計算出的缺陷距離矩陣進(jìn)行總體聚類。
1.1 模糊分類樹的建立及其屬性權(quán)值的確定
在模糊分類樹中,每個分支可以看作是一類分類樹,可以描述為一個有向無環(huán)圖H=〈I,E,W〉,其中I={i1,…,im}為m個項的集合,E、W分別為有向邊和模糊隸屬度權(quán)值的集合。
圖1所示為兩種有向無環(huán)圖,圖中項目均屬于I集合。若從分類樹的結(jié)點X到結(jié)點Y存在有向邊,則稱X是Y的祖先,X、Y之間存在祖孫關(guān)系,且該關(guān)系間具有傳遞性。連接存在祖孫關(guān)系的結(jié)點X和結(jié)點Y的邊序列稱為X與Y之間的有向路徑,記為l(X,Y)=(e1,e2,…,en) ,其中有向邊ei的終點與ei+1的起點一致。
(a)H1
為了便于對分類樹中多類屬性項目的相似度進(jìn)行比較,需要將多個有向無環(huán)圖通過ROOT合并成一個有向無環(huán)圖。由于項目之間存在一定的屬性差異,故需要建立帶項目屬性差異信息的模糊分類樹,具體步驟如下:
第一步,根據(jù)項目屬性找出分類樹中各個項目所在層次。在結(jié)構(gòu)樹中,同一層次的項其屬性是相同的,因此可根據(jù)項目屬性找出分類樹中各個項目所在的層次,具體過程需遵循以下幾點:①合并有向無環(huán)圖;②根結(jié)點ROOT所在層次為1;③有向邊起點層次應(yīng)小于末層次;④不能存在某一層次中不含任何項目的情況;⑤在同一模糊結(jié)構(gòu)樹中,處于同一層次的結(jié)點項目之間要保證其屬性的相似性;⑥模糊結(jié)構(gòu)樹中層次間的項目屬性級別從大到小依次向下。
將有向無環(huán)圖H1與H2通過ROOT合并成一個有向無環(huán)圖,根據(jù)以上6項原則得到模糊分類樹的結(jié)構(gòu)如圖2所示,圖中γ為權(quán)值。合并后模糊分類樹項與項之間有可能存在多個有向邊序列,如圖2中項目Y2與X1之間就存在兩條有向路徑:l1={e(X1,x1),e(x1,Y2)},l2={e(X1,x2),e(x2,Y2)}。l1和l2中任意一條有向路徑都可以作為具有祖孫關(guān)系的X和Y之間的屬性相似性通路。
圖2 模糊分類樹結(jié)構(gòu)
對于同一結(jié)構(gòu)樹上兩個相鄰層次間的項目屬性差異,提出如下假設(shè)及定義:
假設(shè)1設(shè)在模糊分類樹中,有相鄰的兩個層次d和d+1(d∈),那么層次d越深,則層次d和d+1之間的項目屬性差異就越小。
定義1對于相鄰兩個層次d和d+1,項目屬性差異函數(shù)ly(d,d+1)是關(guān)于d的函數(shù),即ly(d,d+1)=f(d),并且對于兩組相鄰層次d1、d1+1和d2、d2+1,當(dāng)且僅當(dāng)d1≤d2成立時,ly(d1, d1+1)≥ ly(d2,d2+1)成立。
對于同一結(jié)構(gòu)樹上兩個不相鄰層次間的項目屬性差異,有如下假設(shè)及定義:
假設(shè)2在模糊分類樹中,有兩組不相鄰的層次d、d+n和d′、d′+n′(n、n′、d′∈),若d′≥d,d′+ n′≤ d+n,則ly(d,d+n)≥ly(d′,d′+n′)。
第三步,給模糊結(jié)構(gòu)樹中的每個有向邊賦予相應(yīng)的屬性差異權(quán)值。給出如下定義:
定義3如果給出模糊分類樹為H=〈I,E,W〉,則項目屬性差異信息的模糊分類樹可表示為H=〈I,E,W,W′〉。其中,項目屬性權(quán)值集合W′是從有向邊集合E到正實數(shù)集合的映射函數(shù),項目屬性差異權(quán)值w′(k(x,y))反映了有向邊起點項x和終點項y之間的屬性差異,它可以由下式得到:
(1)
其中,w(e(x,y))為有向邊e的模糊隸屬度權(quán)值,由W集合給出。一般情況下,有向邊的模糊隸屬度權(quán)值不應(yīng)取得過小,一般可設(shè)置在 [0.5,1]內(nèi)。
有向邊的項目屬性差異權(quán)值主要由以下兩方面的因素決定:其一,ly(d(x),d(y))越大,則有向邊的屬性差異權(quán)值越大,項目屬性差異權(quán)值w′(k(x,y))也越大;其二,有向邊的模糊隸屬度權(quán)值w(e(x,y))體現(xiàn)了項目屬性間相似性度量,即邊的模糊隸屬度越大,則相似性越高,屬性之間差別越小。
設(shè)圖2所示模糊結(jié)構(gòu)樹為4層,如果將相鄰的兩個不同層次設(shè)置為d和d+1,則d的最大取值為3,那么項目屬性層次差別函數(shù)可以設(shè)置為ly(d,d+1)=(3-d+1)/10,該函數(shù)的設(shè)置是符合定義1的條件的;對于不相鄰的兩個層次d和d+n,可以將其分解成多個相鄰層次,設(shè)置項目屬性差異函數(shù)如定義2中所示。
1.2 基于模糊分類樹的距離計算及聚類分析
1.2.1 項間距離
定義4如果x,y∈I,且x與y具有祖孫關(guān)系,那么x和y之間的項目屬性通路lr(x,y)是x和y之間全部有向路徑中所經(jīng)過邊的屬性差異權(quán)值,即最小的有向路徑lmin(x,y),具體可表示為:
(2)
式中:w′(e)為有向邊e的兩個結(jié)點項目之間的屬性差異權(quán)值。
定義5對于不具備祖孫關(guān)系的結(jié)點間的屬性通路,若項目屬性差異信息模糊分類樹H=〈I,E,W,W′〉有兩條相同起點的有效路徑l(x,y)=(e11,e12,…,e1n),l(x,z)=(e21,e22,…,e2m) (x,y,z∈I),那么可以對這兩條有向路徑進(jìn)行連接操作,結(jié)果記作l(x,y)l(x,z)=(e11,e12,…,e1n, e21,e22,…,e2m)。
定義6對于項目屬性差異信息的模糊分類樹H=〈I,E,W,W′〉,如果x、y∈I,則項x和y之間的屬性通路是邊的序列,記為lr(x,y ),可由如下方式得到:
情況1:如果x、y之間存在祖孫關(guān)系,設(shè)x是y的祖先,那么存在l(x,y),使得lr(x,y)=lmin(x,y)。
定義7對于模糊分類樹H=〈I,E,W,W′〉,若x、y∈I,則項x和y之間的距離定義為
(3)
根據(jù)圖2中的模糊分類樹以及定義5和定義6可得兩種情況下項目間的距離值為:
情況1:Ditem(X1,Y2)=lr(X1,Y2)={l1[e(X1,x1);e(x1,Y2)];l2[e(X1,x2);e(x2,Y2)]}min=∑w′(e)。
情況2:Ditem(X1,X2)={lr(ROOT,X1);lr(ROOT,X2)}=w′[e(ROOT,X1)]+w′[e(ROOT,X2)]。
1.2.2 項集間距離
關(guān)于項集間距離的定義方法有多種,如最近距離法、最遠(yuǎn)距離法、平均距離法等,本文采用平均距離法。
定義8存在項集I1={x1,x2,…,xm}和項集I2={y1,y2,…,yn},關(guān)于I1和I2之間的項集距離定義為
(4)
如果把項看成網(wǎng)格的結(jié)點,項目I的數(shù)量看成流量,項目間的差別Ditem的值作為單位費用,那么求項集的最佳匹配實際上是一個最小網(wǎng)絡(luò)費用流問題,可采用CS2算法進(jìn)行最小費用流解答[9]。
1.2.3 關(guān)聯(lián)規(guī)則間距離
在進(jìn)行關(guān)聯(lián)規(guī)則距離度量的時候,需要考慮結(jié)構(gòu)差別和規(guī)則度量差別兩個因素,關(guān)于其結(jié)構(gòu)距離、度量距離作如下定義:
定義9模糊分類樹H=〈I,E,W,W′〉中,如果有關(guān)聯(lián)規(guī)則1:X1?Y1, 關(guān)聯(lián)規(guī)則2: X2?Y2, 所有關(guān)聯(lián)規(guī)則都為非空子集,且存在非負(fù)實數(shù)δ1、δ2、δ3,則規(guī)則1和2之間的規(guī)則結(jié)構(gòu)距離定義如下:
Drule(R1,R2)=δ1Dset(X1∪Y1,X2∪Y2)+
δ2Dset(X1,X2)+δ3Dset(Y1,Y2)
(5)
從定義9中可以看出,關(guān)聯(lián)規(guī)則結(jié)構(gòu)差別分為3個部分:前項、后項和并集。其中δ1、δ2、δ3需要根據(jù)興趣愛好進(jìn)行設(shè)定,例如設(shè)定δ1=0、δ2=1、δ3=1/3,則表示強調(diào)關(guān)聯(lián)規(guī)則前項的相似性。從上述公式可以看出,Drule是關(guān)于Dset的一個線性組合。
在關(guān)聯(lián)規(guī)則距離計算的基礎(chǔ)上,采用SOMC法進(jìn)行可視化分析。
本文從武漢鋼鐵(集團(tuán))公司二冷軋連退機組鋼卷表面質(zhì)量判定信息數(shù)據(jù)庫中隨機抽取15組缺陷數(shù)據(jù)集合,結(jié)合文獻(xiàn)[7]數(shù)據(jù)挖掘結(jié)果,采用本文方法對其關(guān)聯(lián)規(guī)則進(jìn)行分類,以驗證本文方法的有效性。
2.1 模糊分類樹的建立
為方便表述,將不同的鋼卷表面缺陷原因及缺陷均用代號表示如下:①缺陷原因:酸洗為S、過酸洗為GS、欠酸洗為QS、乳化液為R;②缺陷:停車斑為TC、銹蝕為XS、氧化皮壓入為YH、夾雜為JZ、油斑為YB、黏結(jié)為NJ、碳化邊為TH、色差為SC、異物壓入為YW。以上缺陷主要來自兩種不同原因,因此可以建立包含兩種有向無環(huán)圖的模糊分類樹,其結(jié)構(gòu)如圖3所示。
圖3 缺陷及缺陷原因數(shù)據(jù)模糊分類樹
2.2 計算缺陷與缺陷原因?qū)傩圆町悪?quán)值
冷軋帶鋼表面缺陷和缺陷原因各項目之間存在一定的屬性差異,故需要建立帶屬性差異信息的模糊分類樹,根據(jù)1.1節(jié)中描述的步驟建立圖4所示帶模糊隸屬度權(quán)值的分類樹。
圖4 帶權(quán)值的缺陷及缺陷原因數(shù)據(jù)模糊分類樹
根據(jù)1.1節(jié)中相關(guān)假設(shè)及定義,結(jié)合文獻(xiàn)[7]冷軋帶鋼表面缺陷相關(guān)數(shù)據(jù),在此設(shè)項目屬性差異函數(shù)為ly(d,d+1)=(3-d+1)/10,計算可得模糊分類樹中有向邊的屬性差異權(quán)值如表1、表2所示。
表1 由酸洗產(chǎn)生的缺陷間屬性差異權(quán)值表
表2 由乳化液產(chǎn)生的缺陷間屬性差異權(quán)值表
2.3 確定關(guān)聯(lián)規(guī)則之間距離
2.3.1 項間距離
根據(jù)項間距離中的相關(guān)定義,結(jié)合表1和表2中的屬性差異權(quán)值表,分別計算兩種情況下的距離值:
情況1:Ditem(S,XS)=lse-r(S,XS)={l1[e(S,GS);e(GS,XS)];l2[e(S,QS);e(QS,XS)]}min=∑w′(e)。
其中,l1[e(S,GS);e(GS,XS)]=0.2+0.17=0.37;l2[e(S,QS);e(QS,XS)=0.2+0.14=0.34;Ditem(S,XS)=0.34。
情況2:Ditem(S,R)={lse-r(ROOT,S);lse-r(ROOT,R)}=w′[e(ROOT,S)]+w′[e(ROOT,R)]=0.3+0.3=0.6。
2.3.2 項集間距離
項集間距離采用CS2算法中計算最小費用流的方法來計算。結(jié)合定義8,設(shè)有集合I1={TC,XS,YB}和I2={YH,JZ},通過圖5所示方法計算可得:Dset(I1,I2)=(0.67+0.6+0.31+0.24+1.47+1.4)/(2×3)=0.782。
圖5 最小費用流解答項集間距離求法
用同樣的方法計算出多對項集間的距離值如表3所示。由表3可以觀察具有祖孫關(guān)系的缺陷與不具有祖孫關(guān)系的缺陷集合間的距離大小與相似性。
從表3中總體可以看出項集間的距離大小是由兩方面決定的,其一,項集間是否具有相同項目;其二,項集間的項目是否屬于同一祖先。
表3 多對項集間距離的值
2.3.3 關(guān)聯(lián)規(guī)則距離
本文采用文獻(xiàn)[7]中的冷軋帶鋼相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘,將加權(quán)置信度和加權(quán)支持度分別設(shè)置為0.25和0.0125,采用文獻(xiàn)[7]中加權(quán)模糊層次關(guān)聯(lián)規(guī)則挖掘算法得到關(guān)聯(lián)規(guī)則頻繁項集有102條,其中缺陷之間二元頻繁項集有52條,符合條件的有15條,將得到的關(guān)聯(lián)規(guī)則按照產(chǎn)生原因次序排列,根據(jù)定義9,將δ1、δ2、δ3分別設(shè)置為0、1、1,主要強調(diào)前項與后項的作用,最后得到15階對稱矩陣D(15×15)。
為測試本文關(guān)聯(lián)規(guī)則距離計算方法的效率,將其與文獻(xiàn)[3]、文獻(xiàn)[5]和文獻(xiàn)[6]中的距離計算方法所需的運行時間進(jìn)行對比,結(jié)果如圖6所示。由圖6中可見,采用本文方法計算所需的運行時間最短,且隨著規(guī)則數(shù)不斷增加,運行時間的變化率呈先慢后快的趨勢。
本文方法的優(yōu)勢在于采用文獻(xiàn)[7]中加權(quán)模糊層次挖掘算法得到缺陷關(guān)聯(lián)規(guī)則后,在計算距離時弱化了置信度和支持度之間距離的計算,只強調(diào)前項和后項的作用,直接在模糊分類樹分層時就賦予各項目的權(quán)重值,因此在計算關(guān)聯(lián)規(guī)則距離時會比其他方法快一些。
圖6 規(guī)則距離矩陣計算時間對比
2.4 聚類可視化
在缺陷關(guān)聯(lián)規(guī)則距離計算的基礎(chǔ)上,采用自組織神經(jīng)網(wǎng)絡(luò)聚類法(SOMC)對冷軋帶鋼缺陷數(shù)據(jù)挖掘后的關(guān)聯(lián)規(guī)則進(jìn)行聚類分析,整體實施步驟如下:
(1)采用加權(quán)模糊層次關(guān)聯(lián)規(guī)則挖掘算法對缺陷原因數(shù)據(jù)進(jìn)行關(guān)聯(lián)關(guān)系數(shù)據(jù)挖掘,設(shè)置好相關(guān)參數(shù),剔除原因與原因間的規(guī)則以及原因與缺陷間的規(guī)則,保留缺陷與缺陷間的規(guī)則。
(2)計算關(guān)聯(lián)規(guī)則間距離,得到距離矩陣D。
(3)將已經(jīng)計算好的關(guān)聯(lián)規(guī)則距離輸入到SOMC工具箱。
(4)分析比較SOMC可視化的結(jié)果。實驗過程采用SOMC工具箱進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,經(jīng)過200次Batch算法迭代得到基于關(guān)聯(lián)規(guī)則距離的聚類可視化圖,如圖7所示。圖7 (a)中灰色六邊形代表神經(jīng)元(15*15),為距離矩陣訓(xùn)練前狀態(tài),圖7(b)中紅色線連接相鄰的神經(jīng)元(包含有紅色線的顏色區(qū)域)表示神經(jīng)元之間的權(quán)值距離,即實現(xiàn)這一路徑的概率大小,顏色越深代表距離越大,反之則距離越小。圖7(b)中以顏色較深處為分界線可將缺陷關(guān)聯(lián)規(guī)則距離數(shù)據(jù)大致劃分為8類,表明本文提出的規(guī)則聚類方法在組織大量關(guān)聯(lián)規(guī)則方面是實用有效的。相比其他的聚類可視化,本文方法更為直觀,方便決策者瀏覽和分析挖掘結(jié)果,從而發(fā)現(xiàn)其感興趣的關(guān)聯(lián)規(guī)則。
(a)訓(xùn)練前
(b)訓(xùn)練后
本文提出一種基于屬性差異的產(chǎn)品缺陷數(shù)據(jù)關(guān)聯(lián)規(guī)則模糊分類方法,通過缺陷關(guān)聯(lián)規(guī)則距離計算和聚類達(dá)到關(guān)聯(lián)規(guī)則分類的目的。相比以往的研究不同之處在于,該方法通過建立模糊結(jié)構(gòu)分類樹提前對關(guān)聯(lián)規(guī)則距離進(jìn)行了求解,進(jìn)一步縮短了數(shù)據(jù)掃描的耗時;在進(jìn)行規(guī)則距離計算時,通過給模糊結(jié)構(gòu)分類樹層次間添加模糊隸屬度,能夠更有效建立不同屬性項目之間的屬性差異;采用SOMC聚類的方法,把高維數(shù)據(jù)映射到低維輸出空間,使得關(guān)聯(lián)規(guī)則距離數(shù)據(jù)更加集中,分類的準(zhǔn)確度更高。以冷軋帶鋼表面缺陷數(shù)據(jù)為例進(jìn)行驗證,結(jié)果表明該方法在處理大量數(shù)據(jù)關(guān)聯(lián)規(guī)則分類問題上是可行的。
[1] Xu R, Wunsch D. Survey of clustering algorithms[J]. IEEE Transaction on Neural Networks, 2005, 16(3): 645-678.
[2] Toivonen H, Klemettinen M, Ronkainen P, et al. Pruning and grouping discovered association rules[J]. Anesthesiology, 2008, 73(3A):971-975.
[3] Strehl A,Gupta G K,Ghosh J. Distance based clustering of association rules[C]. St Louis, Missouri:Proc of Intelligent Engineering Systems Through Artificial Neural Networks, 1999:759-764.
[4] Chen G Q, Wei Q. Fuzzy association rules and the extended mining algorithms[J].Information Sciences, 2002,147:201-228.
[5] 阮備軍,朱揚勇.基于商品分類信息的關(guān)聯(lián)規(guī)則聚類[J].計算機研究與發(fā)展,2004,41(2):352-360.
[6] 沈斌,姚敏,劉艷彬.基于帶語義差別的模糊Taxonomy的交易數(shù)據(jù)庫關(guān)聯(lián)規(guī)則聚類[J].情報學(xué)報,2010,29(2):246-253.
[7] 劉軍偉.鋼鐵工業(yè)泛在信息匹配推送服務(wù)體系及其實現(xiàn)方法研究[D]. 武漢:武漢科技大學(xué),2015.
[8] 陳安,陳寧,周龍驤,等.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2006:203,221.
[9] Goldberg A V. An efficient implementation of a scaling minimum-cost flow algorithm[J]. Journal of Algorithms, 1997, 22:1-29.
[責(zé)任編輯 鄭淑芳]
Fuzzy classification of defect data association rules based on attribute differences
LiYi,KongJianyi,WangXingdong,LiuJunwei
(College of Machinery and Automation, Wuhan University of Science and Technology, Wuhan 430081,China)
In light of the fact that the association rules for defect data produced in the industrial process cannot be effectively organized after data mining, this paper proposes a fuzzy method for classification of defect data association rules on the basis of project attribute differences. Based on the fuzzy structure tree, the distance between the association rules is calculated, and the result is analyzed by the method of self-organizing neural network clustering. The proposed method is applied to the clustering analysis of data mining on the surface defects of cold rolled strip. The results show that the proposed method can not only obtain the correlation between two different attribute items but also find the distance between the defect association rules. The closer the distance association rules that are grouped into one class, the more similar they are.
cold rolled strip; product defect; attribute; association rule; fuzzy classification; distance; cluster analysis; visualization
2016-09-06
國家自然科學(xué)基金面上項目(51174151);湖北省重大科技創(chuàng)新計劃項目(2013AAA011);湖北省自然科學(xué)基金資助項目(2013CFA131).
李 怡(1991-),男,武漢科技大學(xué)碩士生.E-mail:yilee1991@qq.com
孔建益(1961-),男,武漢科技大學(xué)教授,博士生導(dǎo)師.E-mail:kongjianyi@wust.edu.cn
10.3969/j.issn.1674-3644.2017.01.010
TH164
A
1674-3644(2017)01-0049-06