孫 潔,金娟鳳,倪世明,葉 玲,劉 燾,鄒奉元,3
(1.浙江理工大學(xué)服裝學(xué)院,浙江杭州 310018;2.嘉興學(xué)院設(shè)計(jì)學(xué)院,浙江嘉興 314000;3.浙江理工大學(xué)浙江省服裝工程技術(shù)研究中心,浙江杭州 310018)
服裝號(hào)型是服裝生產(chǎn)銷售過程中的重要依據(jù)和參考。但是個(gè)體體型對(duì)標(biāo)準(zhǔn)體型的離散性使服裝的合體性難以滿足消費(fèi)者的要求,而批量定制成為解決這一矛盾的重要途徑。在細(xì)化服裝控制部位的基礎(chǔ)上,實(shí)現(xiàn)號(hào)型自動(dòng)歸檔正是服裝批量定制的關(guān)鍵技術(shù)之一[1]。目前,在服裝號(hào)型自動(dòng)歸檔的相關(guān)研究中,主要采用線性規(guī)劃算法[2]、擇近原則[3]、LBG算法[4]、建立多層前饋 BP 神經(jīng)網(wǎng)絡(luò)模型[5]、模糊神經(jīng)網(wǎng)絡(luò)模型[6]等方法,在一定程度上克服了傳統(tǒng)歸檔過程中工作量大,效率低,且經(jīng)常會(huì)出現(xiàn)漏歸、錯(cuò)歸、重復(fù)歸檔的問題[3,7]。但是,以上算法過于復(fù)雜,影響運(yùn)算速度,并且未對(duì)各控制部位權(quán)重給出科學(xué)設(shè)置;通過構(gòu)建結(jié)構(gòu)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型以提升精度時(shí),易發(fā)生過擬合現(xiàn)象,使得神經(jīng)網(wǎng)絡(luò)的泛化能力大大減弱。服裝號(hào)型歸檔是一個(gè)大樣本歸檔過程,要求歸檔模型同時(shí)具備運(yùn)算速度快,運(yùn)算精度高和泛化能力強(qiáng)的特點(diǎn)。近年來,神經(jīng)網(wǎng)絡(luò)集成(neural network ensemble,NNE)方法的提出為解決神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)選擇和過度擬合等問題提供了新的途徑[8]。Hansen等[9]證明,通過訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)并將其結(jié)果合成輸出,可以顯著提高神經(jīng)網(wǎng)絡(luò)的泛化能力。
本文采用平均影響值(MIV)的方法,對(duì)號(hào)型歸檔模型的輸入變量進(jìn)行篩選,通過Adaboost算法集成多個(gè)簡單BP神經(jīng)網(wǎng)絡(luò),構(gòu)建神經(jīng)網(wǎng)絡(luò)集成歸檔模型,實(shí)現(xiàn)快速、精確自動(dòng)歸檔,為服裝批量定制的數(shù)字化過程奠定關(guān)鍵技術(shù)基礎(chǔ)。
1.1 數(shù)據(jù)采集
實(shí)驗(yàn)以18~25歲的在青年女性為研究對(duì)象。運(yùn)用美國TC2三維人體掃描與測量系統(tǒng)及馬丁測量儀進(jìn)行人體數(shù)據(jù)采集。本文是在GB/T 1335.2—2008《服裝號(hào)型女子》的基礎(chǔ)上進(jìn)行研究,因此主要測試部位也是根據(jù)國家號(hào)型中的控制部位進(jìn)行設(shè)定。此外,根據(jù)下裝的特點(diǎn),選擇相應(yīng)的人體控制部位作為其合體性的評(píng)價(jià)因素[10]。我國國家標(biāo)準(zhǔn)號(hào)型下裝的主要控制部位為身高、腰圍高、腰圍、臀圍,根據(jù)服裝結(jié)構(gòu)設(shè)計(jì)的需要,增加腹圍、腰長、前襠長、后襠長、大腿圍、膝蓋高作為新增控制部位,各測量項(xiàng)目定義見表1。
選取某品牌的合體女褲裝為穿著實(shí)驗(yàn)樣衣,如圖1所示。該款下裝為基本款褲裝,放松量設(shè)計(jì)主要考慮生理衛(wèi)生和體型變化2個(gè)方面,款式設(shè)計(jì)松量很少,不同號(hào)型的穿著效果對(duì)比明顯,有利于本文號(hào)型歸檔的研究。測試者通過試穿確定穿著效果最佳的褲裝號(hào)型,從而構(gòu)建由控制部位參數(shù)集合到下裝號(hào)型的映射。
表1 測量項(xiàng)目Tab.1 M easurem ent item s
圖1 160/68A褲裝試穿效果Fig.1 Wearing rendering of160/68A pant
1.2 數(shù)據(jù)預(yù)處理
對(duì)510個(gè)樣本進(jìn)行三維人體測量,運(yùn)用點(diǎn)變量頻數(shù)分布對(duì)數(shù)據(jù)進(jìn)行歸類整理,剔除異常數(shù)據(jù)后得到樣本量為500個(gè),樣本數(shù)據(jù)10個(gè)控制部位參數(shù)的基本統(tǒng)計(jì)信息如表2所示。統(tǒng)計(jì)結(jié)果顯示,樣本身高、腰圍、腰圍高接近國標(biāo)中M碼,控制部位數(shù)值為:身高160 cm,腰圍高98.0 cm,腰圍64.0 cm;樣本臀圍眾數(shù)比國家標(biāo)準(zhǔn)數(shù)值小2.5 cm;身高、腰圍、臀圍平均值均大于國家標(biāo)準(zhǔn)中相應(yīng)部位數(shù)值。可見青年女性中存在多數(shù)個(gè)體體形特征與國家標(biāo)準(zhǔn)相符合,但整體樣本離散性較大,與國家標(biāo)準(zhǔn)控制部位數(shù)值存在差異,以臀部差異最為明顯。
表2 控制部位參數(shù)基本統(tǒng)計(jì)信息Tab.2 Statistical in formation of control position parameters cm
2.1 M IV算法原理
神經(jīng)網(wǎng)絡(luò)在處理多重共線性(multicollinearity)數(shù)據(jù)時(shí),易發(fā)生過度擬合現(xiàn)象,即回歸模型中自變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計(jì)失真或難以估計(jì)準(zhǔn)確。本文在構(gòu)建回歸模型時(shí),運(yùn)用平均影響值(mean impact value,MIV)對(duì)構(gòu)建歸檔模型的變量進(jìn)行篩選,進(jìn)而構(gòu)建自變量更少,效果更好的神經(jīng)網(wǎng)絡(luò)模型。
MIV是用于確定輸入神經(jīng)元影響大小的一個(gè)指標(biāo),其符號(hào)代表相關(guān)的方向,絕對(duì)值大小代表影響的相對(duì)重要性[11-12]。具體計(jì)算過程為:在網(wǎng)絡(luò)訓(xùn)練終止后,將樣本P中的每個(gè)自變量特征在其原值的基礎(chǔ)上分別增加和減少10%,構(gòu)成新的訓(xùn)練樣本P1和P2;將P1和P2分別作為仿真樣本利用已建成的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到仿真結(jié)果A1和A2;得出A1與A2的差值即為變動(dòng)該變量后對(duì)輸出產(chǎn)生的影響變化值(Ⅳ),最后將Ⅳ按觀測例數(shù)取平均值得出自變量對(duì)于應(yīng)變量的MIV。通過以上步驟依次計(jì)算各個(gè)網(wǎng)絡(luò)輸出影響的相對(duì)重要性位次,從而判斷輸入變量對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)的影響程度,即實(shí)現(xiàn)了變量篩選。
2.2 簡單BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
本文共有500組人體數(shù)據(jù),隨機(jī)選取450個(gè)樣本作為訓(xùn)練集,50個(gè)樣本作為測試集。BP神經(jīng)網(wǎng)絡(luò)輸入層為10維,代表10項(xiàng)控制部位參數(shù);輸出層為服裝號(hào)型,根據(jù)下裝號(hào)型模式,選取160/68A號(hào)型,其中包含身高和腰圍2個(gè)數(shù)值項(xiàng)。為得到各控制部位參數(shù)分別對(duì)身高和腰圍的影響,將輸出節(jié)點(diǎn)確定為1,分別訓(xùn)練身高和腰圍。根據(jù)經(jīng)驗(yàn)公式(1),確定隱含層節(jié)點(diǎn)數(shù)。
式中:n為輸入層節(jié)點(diǎn)數(shù);m為輸出層節(jié)點(diǎn)數(shù);α為1~10之間的常數(shù)。
在經(jīng)驗(yàn)值附近尋找最優(yōu)節(jié)點(diǎn)數(shù)值,經(jīng)實(shí)驗(yàn)比較網(wǎng)絡(luò)的收斂速度和性能,最終確定隱含層節(jié)點(diǎn)數(shù)為6。運(yùn)用MatLab(R2010a)軟件神經(jīng)網(wǎng)絡(luò)工具箱構(gòu)建模型,其程序設(shè)計(jì)步驟如圖2所示。
圖2 變量篩選程序步驟Fig.2 Procedure steps of variable selection
2.3 變量篩選
根據(jù)MIV值對(duì)變量進(jìn)行篩選,各控制部位的MIV值如表3所示。在確定模型輸入層變量時(shí),在滿足高精度的同時(shí)盡量保留較少的控制部位參數(shù),以使模型結(jié)構(gòu)更為簡單,提升網(wǎng)絡(luò)的泛化能力。通過實(shí)驗(yàn)對(duì)比,剔除MIV值小于0.1的控制部位,確定身高、腰圍、臀圍、腰圍高、后襠長5個(gè)變量作為身高歸檔模型的輸入變量,腰圍、臀圍、大腿圍、腰長、身高5個(gè)變量作為腰圍歸檔模型的輸入變量。
表3 各控制部位M IV值Tab.3 M IV values of each control position
3.1 Adaboost算法原理
Adaboost算法的思想是合成多個(gè)“弱”神經(jīng)網(wǎng)絡(luò)輸出以產(chǎn)生有效預(yù)測結(jié)論,它具有算法結(jié)構(gòu)簡單,易于實(shí)現(xiàn)的特點(diǎn),學(xué)習(xí)得到的集成網(wǎng)絡(luò)一般具有較高的準(zhǔn)確率和泛化能力[14]。其主要步驟為:首先給出弱學(xué)習(xí)算法和樣本空間(x,y),從樣本中隨機(jī)找出m組訓(xùn)練數(shù)據(jù),每組訓(xùn)練數(shù)據(jù)的權(quán)重為1/m;然后用弱學(xué)習(xí)算法迭代運(yùn)算T次,每次運(yùn)算后都按照預(yù)測結(jié)果更新訓(xùn)練數(shù)據(jù)權(quán)重分布,增加預(yù)測誤差超過閥值的樣本權(quán)重,下一次迭代運(yùn)算時(shí)更加關(guān)注這些訓(xùn)練個(gè)體,弱神經(jīng)網(wǎng)絡(luò)通過迭代得到一個(gè)預(yù)測函數(shù)序列f1,f2,…fT,每個(gè)預(yù)測函數(shù)賦予一個(gè)權(quán)重,預(yù)測結(jié)果越好的函數(shù),其對(duì)應(yīng)權(quán)重越大;T次迭代后,最后集成神經(jīng)網(wǎng)絡(luò)的輸出函數(shù)F由弱預(yù)測函數(shù)加權(quán)得到。
3.2 集成歸檔模型構(gòu)建
本文實(shí)驗(yàn)把BP神經(jīng)網(wǎng)絡(luò)作為弱預(yù)測器,將篩選得到的5個(gè)控制部位參數(shù)作為輸入層,通過Adaboost算法生成10個(gè)簡單BP神經(jīng)網(wǎng)絡(luò)集成的強(qiáng)預(yù)測器。訓(xùn)練曲線見圖3、4。
圖3 身高預(yù)測模型訓(xùn)練曲線Fig.3 Heightmodel's training curve
圖4 腰圍預(yù)測模型訓(xùn)練曲線Fig.4 Waist circumferencemodel's training curve
由圖3可知,經(jīng)過4代訓(xùn)練后身高預(yù)測均方誤差達(dá)到最小值為0.049 063;由圖4可知,經(jīng)過6代訓(xùn)練腰圍預(yù)測均方差達(dá)到最小值為0.050 67。50個(gè)測試樣本的身高預(yù)測值誤差結(jié)果如圖5所示,腰圍預(yù)測值誤差結(jié)果如圖6所示。
圖5 身高預(yù)測誤差Fig.5 Heightmodel's prediction errors
圖6 腰圍預(yù)測誤差Fig.6 Waist circumferencemodel's prediction errors
根據(jù) GB/T 1335.2—2008《服裝號(hào)型 女子》,5.4號(hào)型系列和5.2號(hào)型系列中身高檔差為5 cm,確定其預(yù)測值可接受誤差范圍為(-2.5,2.5),腰圍檔差分別為4 cm和2 cm,確定其預(yù)測值可接受誤差范圍分別為(-2,2)和(-1,1),根據(jù)圖5和圖6中誤差絕對(duì)值分布統(tǒng)計(jì)50個(gè)測試集的誤差,測試集歸檔準(zhǔn)確率如表4所示,可見運(yùn)用集成方法后精度得到明顯提高。
表4 歸檔準(zhǔn)確率比較Tab.4 Comparison of filing accuracy
1)通過MIV算法得到女下裝歸檔模型中各控制部位的影響度位序,并將模型的輸入變量由10維降為5維,即將身高、腰圍、臀圍、腰圍高、后襠長作為身高歸檔模型的輸入變量,將腰圍、臀圍、大腿圍、腰長、身高作為腰圍歸檔模型的輸入變量。在變量篩選的基礎(chǔ)上進(jìn)一步簡化神經(jīng)網(wǎng)絡(luò)預(yù)測模型,提升模型的泛化能力。
2)將Adaboost算法運(yùn)用于服裝號(hào)型歸檔問題,通過集成10個(gè)簡單BP神經(jīng)網(wǎng)絡(luò)獲得高精度的號(hào)型歸檔模型。
此外,神經(jīng)網(wǎng)絡(luò)集成方法不僅可以運(yùn)用于BP神經(jīng)網(wǎng)絡(luò),還可與支持向量機(jī)、概率神經(jīng)網(wǎng)絡(luò)等結(jié)合以提升神經(jīng)網(wǎng)絡(luò)的預(yù)測精度。
[1] 張欣,張恒.基于批量定制的服裝號(hào)型歸檔方法[J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2009,35(4):436-440.ZHANG Xin,ZHANG Heng.The type filing for garment size type based on the lot custom-made [J].Journal of Donghua University:Natural Science Edition,2009,35(4):436-440.
[2] GUPTA D.Developing body measurement charts for garment manufacture based on a linear programming approach[J]. Technology and Management,2006,5(1):1-13.
[3] 王建萍,李月麗,喻芳.基于擇近原則的服裝號(hào)型數(shù)字化歸檔方法[J].紡織學(xué)報(bào),2007,28(11):106-110.WANG Jianping, LI Yueli, YU Fang. Digitalized categorization for garment size designation based on the approaching principle[J].Journal of Textile Research,2007,28(11):106-110.
[4] 董麗.基于MC的號(hào)型規(guī)格庫建立及自動(dòng)歸檔算法的研究[D].杭州:浙江理工大學(xué),2007:35-41.DONG Li.Garment size database establishment and research of automatic size classify approach based on Mass customization[D].Hangzhou:Zhejiang Sci-Tech University,2007:35 -41.
[5] 任天亮.基于服裝MTM的男體數(shù)據(jù)庫的建立及其在號(hào)型歸檔中的應(yīng)用[D].上海:東華大學(xué),2009:52-74.REN Tianliang.Establishment of male body database and the application in garment size categorization based on MTM[D].Shanghai:Donghua University,2009:52-74.
[6] 東苗,郝礦榮,丁永生.基于模糊神經(jīng)網(wǎng)絡(luò)的服裝號(hào)型推薦專家系統(tǒng)[J].微型電腦應(yīng)用,2010,26(3):.21-26.DONG Miao, HAO Kuangrong,DING Yongsheng.Garment size recommendation based on fuzzy neural network expertsystem[J].Microcomputer Applications,2010,26(3):21-26.
[7] 徐繼紅,張向輝,張文斌.定制服裝號(hào)型歸檔與裁剪方案數(shù)字化研究[J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2003,29(1):37-42.XU Jihong,ZHANG Xianghui,ZHANGWenbin.Study on the digitalization of filing custom-made garments'types and cutting plan[J]. Journal of Donghua University:Natural Science Edition,2003,29(1):37-42.
[8] 朱人杰,田雨波,賈則.混沌搜索神經(jīng)網(wǎng)絡(luò)集成求解廣義異或分類問題[J].微電子學(xué)與計(jì)算機(jī),2009,26(5):99-102.ZHU Renjie,TIAN Yubo,JIA Ze.Generalized XOR classification solution using neural networks ensemble based on chaos searching[J].Microelectronics and Computer,2009,26(5):99 -102.
[9] HANSEN L K, SALAMON P. Neural network ensembles[C]//IEEE Transaction on Pattern Analysis and Machine Intelligence,1990,12(10):993-1001.
[10] ALEXANDER M, LENDA J C P. Clothing fit preferences of young female adult consumers[J].Journal of Clothing Science and Techonogy,2005,17(1):52-64.
[11] 盧勇艷,王維國.財(cái)務(wù)困境預(yù)測中的變量篩選:基于平均影響值的 SVM方法[J].系統(tǒng)工程,2011,29(8):73-78.LU Yongyan,WANG Weiguo.Filtration of variables in the prediction of financial:SVM method based on mean impact values[J].Systems Engineering,2011,29(8):73-78.
[12] 徐富強(qiáng),劉相國.基于優(yōu)化的BRF神經(jīng)網(wǎng)絡(luò)的變量篩選方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(3):206-208.XU Fuqiang, LIU Xiangguo. Variables screening methods based on the optimization of RBF neural network[J].Computer Systems Applications,2012,21(3):206-208.
[13] 王儉,胡筱敏,鄭龍熙,等.基于BP模型的大氣污染預(yù)報(bào)方法的研究[J].環(huán)境科學(xué)研究,2002,15(5):62-63.WANG Jian,HU Xiaomin,ZHENG Longxi,et al.Study on forecasting of air pollution based on BP model[J].Research of Environmental Sciences,2002,15(5):62-63.
[14] 張偉松,高智英.快速多分類器集成算法研究[J].計(jì)算機(jī)工程,2012,38(2):178-180.ZHANG Weisong, GAO Zhiying. Research on fast multi-classifier ensemble algorithm [J]. Computer Engineering,2012,38(2):178-180.