齊雪良,袁惠芬,王 旭,2
?
上海地區(qū)成年女性批量定制服裝號型分類研究
齊雪良1,袁惠芬1*,王 旭1,2
(1. “紡織面料”安徽省高校重點實驗室 安徽工程大學,安徽 蕪湖 241000; 2. 安徽工程大學 紡織行業(yè)科技公共服務平臺,安徽 蕪湖 241000)
為確定批量定制服裝合理板型數(shù)及提高合體度,以上海地區(qū)520名成年女性為研究對象,選擇身高、胸圍、腰圍、領圍為變量,提出了基于K-means聚類分析的非國標規(guī)格的號型分類方法。探討了初始聚心的選擇和最佳聚類數(shù)的確定,并以Calinski-Harabasz(CH)指標、變異系數(shù)和相對偏差為指標,對聚類效果進行評價。研究表明:以國標號型規(guī)格為初始聚心,號型被分為30類;相同CH指標時,以非國標規(guī)格號型為初始聚心,號型被分為20類,即板型數(shù)減少,且變異系數(shù)和相對偏差明顯降低。
K-means算法;批量定制;號型分類;聚類分析
服裝批量定制是在批量生產(chǎn)條件下滿足顧客個性化需求和合體性要求的企業(yè)生產(chǎn)新模式[1],相比普通定制加工模式具有低成本和快速度等特點。企業(yè)在批量定制生產(chǎn)前,需要對獲取的人體測量數(shù)據(jù)進行號型歸檔。目前我國定制服裝企業(yè),主要采用傳統(tǒng)國標號型規(guī)格,以人工歸檔方法進行歸檔,存在周期長、錯歸、漏歸等問題,從而制約合同交貨期和產(chǎn)品質(zhì)量[2]。近年來,根據(jù)測量數(shù)據(jù)的相似性,運用聚類分析方法,采用計算機輔助進行服裝號型歸檔已逐漸成為該領域的研究熱點,其中運用K-means算法進行號型分類較為常用。方方等[3]運用K-means算法對219名女性進行了號型分類。鄭艷等[4]研究發(fā)現(xiàn)以胸腰差和羅氏指數(shù)為分類變量時運用K-means分類效果較好。目前基于K-means聚類的號型分類,尚未形成標準的、系統(tǒng)的分類和評價方法。本文以上海地區(qū)成年女性為研究對象,結(jié)合K-means聚類分析算法,提出適合大批量定制服裝號型分類和提高服裝合體度的非國標號型分類方法,并以反映類間類內(nèi)距離比的Calinski- Harabasz(CH)值[5]、變異系數(shù)和相對偏差作為評價聚類效果好壞的指標。K-means聚類研究表明,在相同CH指標條件下,以最大最小距離法選擇的非國標規(guī)格初始聚心的號型分類結(jié)果與以國標 GB/T 1335.2-2008規(guī)格初始聚心按一次性擇近原則分類結(jié)果對比,板型數(shù)從30減少為20。此外,變異系數(shù)和相對偏差,非國標規(guī)格號型也明顯優(yōu)于國標規(guī)格。研究結(jié)果為確定批量定制服裝合理板型數(shù)及提高服裝合體度具有一定參考價值。
上海市某行政事業(yè)單位520名30歲-55歲的成年女性,身高150~175cm之間。
被測試者穿緊身內(nèi)衣,不能佩戴首飾和手表,兩腳并攏目視前方,手臂自然下垂。
根據(jù)要求本次測量項目包括:身高、胸圍、腰圍、領圍。每項目重復測量3次取均值[6]。
聚類分析前的數(shù)據(jù)預處理[7],包括異常值和正態(tài)分布檢驗。基于Walsh檢驗和一般經(jīng)驗法[8],本文520個樣品各測量項目無異常值且滿足正態(tài)分布。
根據(jù)GB/T 1335.2-2008女子服裝號型和南京某定制服裝公司胸圍與領圍的搭配關系,根據(jù)測量數(shù)據(jù)分布范圍,選擇國標號型初始聚心47個(略)。運行SPSS軟件,讀入初始聚心,以僅分類方式執(zhí)行K-means聚類。聚類結(jié)果發(fā)現(xiàn)有17個號型類別無樣品分入,即520個樣品被分為30類,其結(jié)果如表1。
表1 以國標號型為初始聚心的K-means分類結(jié)果
1. 非國標號型初始聚心的選擇
經(jīng)典K-means算法聚類結(jié)果易受到初始聚心的影響。本文以最大最小距離法產(chǎn)生出非國標規(guī)格的初始聚心?;谧畲笞钚【嚯x法的初始聚心選擇是一種改進的方法,其思想是取盡可能遠離的樣品做為聚類中心, 避免了隨機確定初始聚心時出現(xiàn)由于聚心過于接近導致分類效果不理想的情況。其步驟如下[9]:
(1)取距離所有樣本中心最近樣品作為第1初始聚心Z1;
(2)取距離Z1最遠的樣品作為第2聚心Z2;
(3)計算其他樣品Xi與Z1和Z2間距離di1和di2,若,(為比例系數(shù),表示第i次聚類中心最大改變量),則樣品Xi為第3聚心Z3,否則歸入到其中一個聚類中;
(4)重復上述操作,直到找不到符合條件的新聚心為止。
表2 非國標初始聚心與聚類結(jié)果
2. 聚類數(shù)K的確定
基于K-means的聚類分析,聚類數(shù)的選擇對聚類結(jié)果產(chǎn)生重要影響[10]。對于大批量定制服裝數(shù)據(jù),聚類數(shù)K的確定直接關系到板型數(shù)及服裝合體度。本文結(jié)合CH指標及與國標號型分類情況,進行聚類數(shù)K的確定。CH指標的計算如式(1)。
其中:D1表示類內(nèi)距離和,如式(2);D2表示類間距離和,如式(3);
通常CH越大,聚類效果越好,但聚類數(shù)K會增加,CH越小,聚類效果越差,聚類數(shù)K會減少,導致服裝合體性差。故為節(jié)約成本,可在不影響聚類效果的情況下,盡量減少板型數(shù)。本文以非國標規(guī)格為初始聚心的聚類數(shù)K,是以國標聚類結(jié)果(K=30,CH=0.2166)為基準,根據(jù)CH值接近為原則確定。運行SPSS軟件,執(zhí)行K-means算法,讀入29個非國標號型初始聚心,以迭代(最大20次)并分類方式將520個樣品依次從K=2到K=29進行28次聚類。注意到當K=20時,即520個樣品分為20類時CH=0.2186,接近按國標K=30的CH值,故最終確定將520個樣品分為20類,即按照前20個初始聚心(Z1,Z2,…,Z20),執(zhí)行聚類,結(jié)果如表2所示,其中括號內(nèi)的數(shù)據(jù)為經(jīng)過K-means聚類后,各類的均值并按四舍五入取整,即產(chǎn)生的20個非國標的規(guī)格,將作為板型設計的依據(jù)。上述結(jié)果表明,本文提出的按非國標初始聚心的K-means聚類結(jié)果,在和國標歸檔相比具有更少的板型數(shù),且按CH指標分類效果接近。
3. 合體度的評價指標
CH指標對分類數(shù)的確定有一定的參考意義,反映了聚類效果的好壞。從定制服裝合體性角度,評價每個類內(nèi)樣品測量項目和最終聚心(類均值)的變異系數(shù)和相對偏差,在一定程度上更具有指導意義。變異系數(shù)cv和相對偏差分別是衡量數(shù)據(jù)變異和偏離均值程度的指標,計算式分別如式(4)、(5):
為了對比按照國標號型與按非國標規(guī)格為初始聚心的K-means聚類效果,分別計算了兩種聚類結(jié)果各測量項目的變異系數(shù)和相對偏差,結(jié)果如表3所示。
表3 國標與非國標分類變異系數(shù)與相對偏差對比
表3中某測量項目總變異系數(shù)和平均變異系數(shù),分別為各類別的變異系數(shù)之和及變異系數(shù)的均值。相對偏差大于3%樣品所占比例,表示各類別中樣品測量值超過該類別均值達3%樣品所占的比例。
由表3可知,4個測量項目中非國標分類結(jié)果總變異系數(shù)均小于國標分類結(jié)果,表明非國標方式聚類效果優(yōu)于國標。但平均變異系數(shù)國標優(yōu)于非國標,其原因是由于國標聚類數(shù)30大于非國標聚類數(shù)20所導致。測量項目腰圍的變異系數(shù)最大,說明樣本反映的成年女性群體腰圍變異較大。
根據(jù)國標檔差在4個測量項目中,相對偏差小于3%具有實際意義。各測量項目相對偏差腰圍最大,其次是胸圍、領圍和身高。當相對偏差為3%時,國標和非國標腰圍超標比例分別減少為44.81%和10.38%,其他3個項目身高、胸圍和領圍超標比例國標和非國標對應關系為0.58%和0.38%,8.65%和2.12%,1.54%和1.92%。綜上分析,非國標分類結(jié)果變異系數(shù)和相對偏差均小于國標分類結(jié)果,表明數(shù)據(jù)偏離程度小,按非國標的分類結(jié)果,板型的合體性更好。
(1)以最大最小距離法選擇的非國標規(guī)格作為K-means聚類初始聚心,在相同CH指標時,具有比以國標規(guī)格為初始聚心更少的聚類數(shù)。
(2)以變異系數(shù)和相對偏差作為合體性依據(jù),以非國標規(guī)格作為K-means聚類初始聚心,聚類效果板型更合體。
(3)樣本反映成年女性4個測量項目中,變異系數(shù)從大到小依次為,腰圍、胸圍、領圍、身高。
[1] 項鈴鈴.基于服裝批量定制的華東青年女性體形分析[D].無錫:江南大學,2007.
[2] 毋濤,王銀.服裝批量定制量體服務系統(tǒng)的設計與實現(xiàn)[J].陜西科技大學學報,2011,29(8):54-56.
[3] 方方,王子英.K-means聚類分析在人體體型分類中的應用[J].東華大學學報:自然科學版,2014,40(10):593-598.
[4] 鄭艷,張欣.我國三地區(qū)女大學生體型分類研究[J].西安工程科技學院學報,2004,18(3):210-214.
[5] 劉燕馳,高學東,國宏偉,等.聚類有效性的組合評價方法[J].計算機工程與應用,2011,47(19):15-17,30.
[6] 張寧,王宏付.基于三維人體測量的江浙女模特體型分類[J].紡織學報,2012,33(6):71-75.
[7] 齊靜,李毅,張欣.我國西部地區(qū)青年男性體型描述與體型分類研究[J].紡織學報,2010,31(5):107-111.
[8] 郁崇文,汪軍,王新厚.工程參數(shù)的最優(yōu)化設計[M].上海:東華大學出版社,2003.4-6.
[9] 周涓,熊忠陽,張玉芳,等.基于最大最小距離法的多中心聚類算法[J].計算機應用,2006,26(6):1425-1427.
[10] 周世兵,徐振源,唐旭清.新的K-均值算法最佳聚類數(shù)確定方法[J].計算機工程與應用,2010,46(16):27-31.
Investigation on Shanghai Adult Female Mass Customization Clothing Shape Classification
QI Xue-liang1,YUAN Hui-fen1,WANG Xu1,2
(1. Anhui Provincial Key Lab of Textile Fabric, Anhui Polytechnic University, Wuhu Anhui 241000, China;2. The Science and Technology Public Service Platform for Textile industry, Anhui Polytechnic University, Wuhu Anhui 241000, China)
In order to determine reasonable patterns number of mass customization and improve clothing fitness, this paper analyzed 520 Shanghai adult female body data by K-means cluster algorithm with four classified variables such as height, bust circumference, waist circumference and collar circumference.A new non-GB shape classification method based K-means cluster was proposed. Initial cluster centers and optimal clusters were discussed. Classification result in each cluster was evaluated in Calinski-Harabasz index, coefficient of variation and relative deviation. It showed that the number of clusters was 30 when the GB shape was as initial cluster centers. According to parity of Calinski-Harabasz principle, the number of clusters of non-GB standard shape was 20 and coefficient of variation and relative deviation was decreased obviously.
K-means algorithm; mass customization; shape analysis; cluster analysis
TS941-09
A
2095-414X(2016)04-0008-05
袁惠芬(1972-),女,教授,研究方向:服裝數(shù)字化.
“紡織面料”安徽省高校重點實驗室開放基金(2015FZ001);安 程大 學研究生創(chuàng)新項目(2015).