孫琦宗,華爾天,孫麗穎
(1.浙江工業(yè)職業(yè)技術(shù)學(xué)院,312000,浙江,紹興;2.浙江工業(yè)大學(xué)特種裝備制造與先進(jìn)加工技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,310014,杭州)
隨著消費(fèi)者知識(shí)水平的提高和社會(huì)的進(jìn)步,消費(fèi)者崇尚并追求“定制生活”的趨勢(shì)愈加明顯,物聯(lián)網(wǎng)技術(shù)的發(fā)展和應(yīng)用,進(jìn)一步推動(dòng)了消費(fèi)與生產(chǎn)的“定制”模式[1]。通過(guò)定制,消費(fèi)者可以精確地獲得自己想要的產(chǎn)品,企業(yè)可以有效地獲取、整合、轉(zhuǎn)化客戶(hù)需求,定制已成為相關(guān)行業(yè)的發(fā)展熱點(diǎn)。盡管產(chǎn)品的定制服務(wù)已在國(guó)內(nèi)外有應(yīng)用案例[2-4],也取得了一定的理論和應(yīng)用研究成果,但大多定制的效率和智能化程度不高,且缺乏定制過(guò)程的引導(dǎo)性和條理性。為了改善此類(lèi)問(wèn)題,需要對(duì)產(chǎn)品定制特征進(jìn)行識(shí)別和分類(lèi)。近年來(lái),對(duì)于分類(lèi)方法的創(chuàng)新研究多集中在醫(yī)學(xué)領(lǐng)域[5-6]、經(jīng)濟(jì)學(xué)領(lǐng)域[7-8]、生物學(xué)領(lǐng)域[9-10]、軍事領(lǐng)域[11]等,在產(chǎn)品個(gè)性化定制領(lǐng)域,創(chuàng)新研究較少。在產(chǎn)品定制領(lǐng)域,朱上上等提出一種基于可拓設(shè)計(jì)的產(chǎn)品個(gè)性化定制方法,構(gòu)建了面向客戶(hù)需求的產(chǎn)品個(gè)性化推薦機(jī)制[12];華爾天等提出了一種用于汽車(chē)個(gè)性化定制的基于組織符號(hào)學(xué)思想的智能交互方法,促進(jìn)了個(gè)性化定制服務(wù)的互動(dòng)性和引導(dǎo)性[13];Y T ZHAO探索了服裝定制系統(tǒng)的功能需求,設(shè)計(jì)了服裝定制系統(tǒng),并完成了基于工業(yè)大數(shù)據(jù)的服裝定制過(guò)程[14]。這些研究為產(chǎn)品個(gè)性化定制做出了貢獻(xiàn),但創(chuàng)新研究多側(cè)重于研究定制方法,對(duì)于定制過(guò)程中的產(chǎn)品特征分類(lèi)方法沒(méi)有過(guò)多的研究,定制過(guò)程仍然存在定制效率和智能化程度不高,且定制過(guò)程的引導(dǎo)性和條理性不足等問(wèn)題。
K-means聚類(lèi)算法是一種傳統(tǒng)的監(jiān)督分類(lèi)算法[15],它通過(guò)距離來(lái)評(píng)估相似度,根據(jù)相似度來(lái)對(duì)待分類(lèi)樣本數(shù)據(jù)進(jìn)行分類(lèi)。K-means聚類(lèi)算法廣泛地應(yīng)用在醫(yī)學(xué)領(lǐng)域[16-17]、農(nóng)業(yè)領(lǐng)域[18]、能源領(lǐng)域[19]、圖像處理領(lǐng)域[20]。在產(chǎn)品定制領(lǐng)域,閔鈺麟等提出了基于K-means聚類(lèi)算法的自適應(yīng)主題模型,實(shí)現(xiàn)了用戶(hù)定制主題聚焦爬蟲(chóng)[21];王旭等以國(guó)標(biāo)和非國(guó)標(biāo)號(hào)型對(duì)初始聚心和聚類(lèi)數(shù)的確定進(jìn)行探討,實(shí)現(xiàn)了批量定制服裝號(hào)型的分類(lèi)[22]。本文利用產(chǎn)品特征關(guān)聯(lián)度和類(lèi)別權(quán)重指標(biāo)為參數(shù),采用K-means聚類(lèi)算法對(duì)定制產(chǎn)品特征進(jìn)行聚類(lèi)迭代計(jì)算,將定制產(chǎn)品特征進(jìn)行分類(lèi),從而為提高定制過(guò)程中的定制效率和智能化程度而服務(wù),達(dá)到增加用戶(hù)的定制滿(mǎn)意度的目的。
對(duì)于產(chǎn)品定制系統(tǒng)來(lái)講,不是所有產(chǎn)品特征都開(kāi)放給客戶(hù)去定制,為了提高定制效率,提升客戶(hù)定制滿(mǎn)意度,需要對(duì)產(chǎn)品特征和用戶(hù)需求進(jìn)行分析,建立兩者之間的聯(lián)系,以便以用戶(hù)個(gè)性需求為目標(biāo),來(lái)開(kāi)放對(duì)應(yīng)的產(chǎn)品定制特征屬性,并對(duì)開(kāi)放的產(chǎn)品定制特征進(jìn)行聚類(lèi)劃分,提高定制效率。
為了獲得高效率和高滿(mǎn)意度的定制體驗(yàn),需要研究用戶(hù)的個(gè)性化需求和產(chǎn)品特征之間的關(guān)系,并以用戶(hù)需求為基礎(chǔ),研究并建立產(chǎn)品特征和用戶(hù)需求之間的關(guān)系模型,根據(jù)用戶(hù)的個(gè)性化需求來(lái)選擇開(kāi)放定制的產(chǎn)品特征,從而根據(jù)定制特征來(lái)研究特征的分類(lèi)方法。
將客戶(hù)需求用矩陣表示為:
(1)
用矩陣表示定制產(chǎn)品的特征為:
(2)
其中:Ci表示定制產(chǎn)品的第i個(gè)定制特征,cij(i=1,2,…p;j=1,2,…,k)為定制產(chǎn)品的第i個(gè)特征所對(duì)應(yīng)的第j個(gè)特征參數(shù)變量值,其中cij可以為0。
定制專(zhuān)家系統(tǒng)以用戶(hù)個(gè)性需求為目標(biāo)來(lái)實(shí)現(xiàn)產(chǎn)品的定制服務(wù),客戶(hù)只能對(duì)專(zhuān)家系統(tǒng)開(kāi)放的定制特征進(jìn)行定制,假定專(zhuān)家系統(tǒng)開(kāi)放了N個(gè)定制特征,這N個(gè)定制特征經(jīng)過(guò)聚類(lèi)迭代后,生成k個(gè)聚類(lèi)簇,則矩陣表示為:
(3)
其中:Hi表示第i聚類(lèi)定制特征屬性集,imax=k,hij表示第i個(gè)聚類(lèi)定制特征的第j個(gè)定制特征屬性值。
在復(fù)雜定制產(chǎn)品內(nèi)部,各零部件特征之間有橫向和縱向2種關(guān)聯(lián)關(guān)系,各零部件特征之間的關(guān)聯(lián)關(guān)系大小用關(guān)聯(lián)度αij來(lái)表示,關(guān)聯(lián)度的大小與2個(gè)關(guān)聯(lián)特征之間的約束因數(shù)有關(guān)。假設(shè)定制產(chǎn)品的第i個(gè)可定制特征表示為βi,則n個(gè)定制特征組成的關(guān)聯(lián)度為n×n維數(shù)據(jù)表(如表1),其中縱橫坐標(biāo)交叉位置為2個(gè)特征之間的關(guān)聯(lián)度指標(biāo),即αij表示特征i和特征j的關(guān)聯(lián)度取值,由于αij與αji都是表示特征i和特征j之間的關(guān)聯(lián)度,所以2個(gè)關(guān)聯(lián)度相等,此特征關(guān)聯(lián)度數(shù)據(jù)表為角對(duì)稱(chēng)數(shù)據(jù)。
表1 特征關(guān)聯(lián)度數(shù)據(jù)表
αij=[(ηj-ηi)2+(νj-νi)2+(λj-λi)2+(σj-σi)2+(ωj-ωi)2+1]-1
(4)
2.3.1 k-means算法 聚類(lèi)算法[15]是將數(shù)據(jù)集中的樣本劃分為若干個(gè)通常是不相交的子集,即根據(jù)規(guī)則,把相似或相關(guān)度近的對(duì)象歸為一個(gè)簇中,聚類(lèi)方法幾乎可以應(yīng)用于所有對(duì)象的分類(lèi),簇內(nèi)的對(duì)象越相似,距離越近,聚類(lèi)效果越好。k均值聚類(lèi)算法(k-means clustering algorithm)是一種迭代求解的聚類(lèi)分析算法,由于其簡(jiǎn)潔和高效的特性,成為應(yīng)用廣泛的聚類(lèi)算法。k均值算法,通常用最小化平方誤差法進(jìn)行迭代計(jì)算。表達(dá)式如下:
給定樣本集D={χ1,χ2,…,χn},得到簇劃分為C={C1,C2,L,Ck},最小化平方誤差為:
(5)
2.3.2 聚類(lèi)數(shù)目k值的確定 聚類(lèi)數(shù)目k值選擇的好壞直接影響聚類(lèi)的效果,所以使用k-means進(jìn)行聚類(lèi)分析時(shí),首要任務(wù)是確定一個(gè)合適的k值,在傳統(tǒng)應(yīng)用中,k值的選取一般通過(guò)枚舉的方法,令k從2到一個(gè)固定值,在每個(gè)k值上重復(fù)運(yùn)行多次,計(jì)算當(dāng)前k的平均輪廓系數(shù),從而確定最終的集群數(shù)目k,但這種方法的缺點(diǎn)是容易產(chǎn)生局部最優(yōu)解。也有研究者利用Silhouette指數(shù)[23]和蘭德指數(shù),從計(jì)算效率來(lái)看Calinski_Harabaz的效率最高[24],本文利用Calinski-Harabasz準(zhǔn)則來(lái)確定最優(yōu)聚類(lèi)數(shù)目k,從而提高聚類(lèi)效率。
Calinski_Harabaz指數(shù)的計(jì)算公式如下:
(6)
其中m為樣本總量,k為分類(lèi)的數(shù)量(簇?cái)?shù)),Bk是簇間協(xié)方差矩陣,Wk是簇內(nèi)協(xié)方差矩陣,tr是矩陣的跡。
基于K-means聚類(lèi)算法的產(chǎn)品特征集的分類(lèi)方法流程如圖1。
圖1 產(chǎn)品特征集的分類(lèi)方法流程圖
以洗衣機(jī)產(chǎn)品的定制為例,進(jìn)行此方法的驗(yàn)證。
洗衣機(jī)是一個(gè)比較復(fù)雜的產(chǎn)品,組成洗衣機(jī)的機(jī)構(gòu)和零件多種多樣,在此選取部分定制特征來(lái)進(jìn)行方法的驗(yàn)證。洗衣機(jī)的部分定制特征樣本集如圖2。
根據(jù)公式(2),將洗衣機(jī)部分定制特征屬性用矩陣表示為:
圖2 洗衣機(jī)的部分定制特征樣本集
C洗衣機(jī)=(C產(chǎn)品類(lèi)型C尺寸C洗滌容量C電機(jī)類(lèi)型C顏色C特色)T=
(7)
設(shè)定產(chǎn)品定制特征屬性類(lèi)別權(quán)重,此項(xiàng)權(quán)重的設(shè)置是專(zhuān)業(yè)技術(shù)人員根據(jù)產(chǎn)品的各特征屬性的特性進(jìn)行設(shè)定,在此選取28個(gè)定制特征進(jìn)行權(quán)重設(shè)置(表2)。
表2 洗衣機(jī)產(chǎn)品特征類(lèi)別權(quán)重值
為了獲得最佳的聚類(lèi)簇?cái)?shù)k值,采用2.3節(jié)提到的Calinski_Harabaz公式進(jìn)行求解最佳的聚類(lèi)簇?cái)?shù)k值。取樣本總數(shù)為28,如表2,在實(shí)驗(yàn)中最佳的k值為5,如圖3。
圖3 聚類(lèi)數(shù)目與Calinski_Harabaz指數(shù)關(guān)系示意圖
根據(jù)公式(4),進(jìn)行產(chǎn)品特征關(guān)聯(lián)度的計(jì)算,并進(jìn)行聚類(lèi)劃分,過(guò)程如下。
聚類(lèi)簇?cái)?shù)選k=5,算法開(kāi)始時(shí),選取5個(gè)樣本β2、β5、β10、β11、β16作為初始均值向量,即:μ1=(0.62,0.51,1.12,1.11,4);μ2=(0,2.12,0,4,1.11);μ3=(1.02,1.12,3.78,0,0.23);μ4=(3.89,1.21,0.23,0.67,1.34);μ5=(0.34,3.45,0.23,0,1.25)。
考察樣本β1,根據(jù)公式dji=αji-1,計(jì)算β1與當(dāng)前均值向量μ1、μ2、μ3、μ4、μ5的距離(關(guān)聯(lián)度)分別為0.123 687,0.040 098,0.029 011,0.139 305,0.034 551,因此β1將劃入簇G4中,類(lèi)似的,對(duì)表2數(shù)據(jù)集中的所有樣本考察計(jì)算距離(關(guān)聯(lián)度),可得當(dāng)前聚類(lèi)劃分為:
G1={β2,β22,β23,β28};
G2={β5,β24};
G3={β9,β10,β14,β19,β21};
G4={β1,β3,β4,β11,β12,β13,β18,β20,β25,β26};
G5={β6,β7,β8,β15,β16,β17,β27};
然后根據(jù)均值迭代計(jì)算公式,從G1到G5中分別求出新的聚類(lèi)中心:
μ1′=(1.34,0.79,2.3,0.74,3.34);
μ2′=(1.08,2.12,0.06,3.56,1.16);
μ3′=(2.47,1.56,3.44,0.05,1.01);
μ4′=(3.32,1.09,0.74,0.87,2);
μ5′=(1.07,3.51,0.31,0.21,1.52)。
更新當(dāng)前均值向量,不斷重復(fù)上述算法過(guò)程,迭代到第2代結(jié)果和第1代相同,算法停止,得到最終聚類(lèi)簇為:
G1={β2,β22,β23,β28};
G2={β5,β24};
G3={β9,β10,β14,β19,β21};
G4={β1,β3,β4,β11,β12,β13,β18,β20,β25,β26};
G5={β6,β7,β8,β15,β16,β17,β27}
本文分析了個(gè)性化定制產(chǎn)品的特征屬性和用戶(hù)需求之間的關(guān)系,定義了產(chǎn)品特征關(guān)聯(lián)度計(jì)算方法,利用產(chǎn)品特征關(guān)聯(lián)度和類(lèi)別權(quán)重指標(biāo)對(duì)K-means算法進(jìn)行優(yōu)化計(jì)算,提出了應(yīng)用于產(chǎn)品定制特征分類(lèi)的一直聚類(lèi)算法,并以洗衣機(jī)的定制為案例驗(yàn)證了此方法的可行性。
在下一階段,將研究把此優(yōu)化方法和機(jī)器學(xué)習(xí)相結(jié)合,對(duì)個(gè)性化定制服務(wù)系統(tǒng)的定制智能交互方法進(jìn)行研究和優(yōu)化,提高個(gè)性化定制的智能化程度和顧客定制的滿(mǎn)意度指標(biāo)。