周 捷,王 萍,毛 倩,王奧斯
(1.西安工程大學(xué) 服裝與藝術(shù)設(shè)計(jì)學(xué)院,陜西 西安710048;2.利茲大學(xué) 設(shè)計(jì)學(xué)院,英國(guó) 利茲 LS2 9JT)
女性乳房形態(tài)具有差異性與復(fù)雜性,導(dǎo)致市場(chǎng)上文胸號(hào)型分類往往不能滿足消費(fèi)者的個(gè)體需求[1],因此準(zhǔn)確識(shí)別乳房形態(tài)將對(duì)改善文胸合體性[2]、優(yōu)化文胸結(jié)構(gòu)設(shè)計(jì)[3-6]和鋼圈設(shè)計(jì)[7-9]、完善文胸號(hào)型的分類[10]以及滿足消費(fèi)者對(duì)文胸的情感需求[11-12]具有重要作用。一些研究者主要從人體測(cè)量、乳房分類[13-17]等方面對(duì)乳房形態(tài)開展相關(guān)研究。基于三維人體掃描,文獻(xiàn)[15]以上乳房角和內(nèi)外乳點(diǎn)角/乳房深為參數(shù),將267位18~35歲女性的乳房立體形態(tài)分為9類。文獻(xiàn)[16]以乳間距和胸高將西部女大學(xué)生乳房形態(tài)也分為9種類型。文獻(xiàn)[17]基于馬丁人體測(cè)量,采用K-means聚類分析法,將華東地區(qū)20~40歲女性罩杯分為AA、A、B、C等4類,再通過幾何推導(dǎo)關(guān)鍵值,最終將胸部側(cè)面形態(tài)分為圓盤型、圓球型、紡錘型和下垂型4種類型,以上分類方法均能夠有效表征乳房形態(tài)立體特征。雖然乳房形態(tài)分類在文胸款式和結(jié)構(gòu)設(shè)計(jì)中起著不可或缺的作用,但還不能直接應(yīng)用到號(hào)型推薦及文胸個(gè)性化定制中。而運(yùn)用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型能夠相對(duì)快速且高效地識(shí)別不同的乳房形態(tài)[18-20],基于其形態(tài)識(shí)別的參數(shù)可以設(shè)計(jì)生產(chǎn)文胸。因此,乳房形態(tài)識(shí)別模型在實(shí)際應(yīng)用過程中就顯得尤為重要。
目前已有研究學(xué)者以胸圍、下胸圍、胸寬作為輸入變量預(yù)測(cè)乳房根圍,計(jì)算并比較了BP神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型的預(yù)測(cè)精度,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型識(shí)別精度更高,達(dá)95.9%,但沒有給出具體的運(yùn)行時(shí)間[18]。文獻(xiàn)[19]采用基于多視角卷積神經(jīng)網(wǎng)絡(luò)的乳房X射線分類方法對(duì)乳腺圖像進(jìn)行分類,其精度和魯棒性有所提高。有研究學(xué)者通過廣義回歸神經(jīng)網(wǎng)絡(luò)和概率神經(jīng)網(wǎng)絡(luò)2種算法研究了乳房特征對(duì)乳房形態(tài)識(shí)別的影響[20],盡管這2種算法的識(shí)別準(zhǔn)確率均相對(duì)較高,如廣義回歸神經(jīng)網(wǎng)絡(luò)模型為88.89%,但其準(zhǔn)確率還有待提高。
而ELM是一種單隱層前向神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,已被廣泛應(yīng)用于識(shí)別、預(yù)測(cè)以及醫(yī)學(xué)診斷領(lǐng)域[21-22]。與傳統(tǒng)的訓(xùn)練算法相比,ELM算法最突出的優(yōu)勢(shì)在于:輸入層和隱含層之間的連接權(quán)值隨機(jī)產(chǎn)生,且確定后無(wú)需再調(diào)整;隱含層和輸出層之間通過解方程一次計(jì)算完成,無(wú)需依靠迭代計(jì)算來(lái)完成訓(xùn)練學(xué)習(xí),整體精確度較高且訓(xùn)練速度較快[22]。因此,為進(jìn)一步提高乳房形態(tài)識(shí)別的精度與模型運(yùn)行速度,本文通過CFSFDP算法對(duì)108位青年女性的乳房形態(tài)進(jìn)行分類,再用ELM算法對(duì)乳房形態(tài)進(jìn)行識(shí)別,分析ELM乳房形態(tài)識(shí)別模型的識(shí)別準(zhǔn)確率與模型運(yùn)行時(shí)間,并對(duì)比不同激活函數(shù)下隱含層神經(jīng)元個(gè)數(shù)對(duì)ELM乳房形態(tài)識(shí)別模型識(shí)別準(zhǔn)確率的影響,確定最佳參數(shù)。
采用馬丁人體測(cè)量?jī)x,對(duì)108位年齡(23.13±3.75)歲、身高(160.07±5.89)cm、身體質(zhì)量指數(shù)(21.01±3.97)kg/m2,且乳房基本發(fā)育成熟的西部地區(qū)女性進(jìn)行乳房特征數(shù)據(jù)采集。
室內(nèi)環(huán)境溫度為(25±2)℃,相對(duì)濕度為(65±2)%。被測(cè)試者上身呈裸體狀態(tài)、足跟并攏、自然站立于水平地面上、雙眼平視前方、肩部放松、雙臂自然下垂。測(cè)試者依照GB/T 5703—2010《用于技術(shù)設(shè)計(jì)的人體測(cè)量基礎(chǔ)項(xiàng)目》的測(cè)量要求采集被測(cè)試者的乳房特征數(shù)據(jù)。
基于相關(guān)文獻(xiàn)研究[12-14],選取6個(gè)測(cè)量項(xiàng)目部位:乳平圍、乳間距、胸厚、胸寬、頸窩點(diǎn)至乳頭點(diǎn)長(zhǎng)以及胸圍至下胸圍高。
根據(jù)測(cè)量的6個(gè)項(xiàng)目計(jì)算得到4個(gè)乳房特征值,其中乳平圍、胸厚與胸寬的比值,共同描繪了乳房的豐挺程度;乳間距與胸寬的比值描繪了乳房聚攏的情況;頸窩點(diǎn)至乳頭點(diǎn)長(zhǎng)與胸圍至下胸圍高的比值代表乳房高度情況。因此確定乳平圍、乳間距/胸寬、胸厚/胸寬、頸窩點(diǎn)至乳頭點(diǎn)長(zhǎng)/胸圍至下胸圍高4個(gè)乳房特征為乳房形態(tài)類別的判斷依據(jù)[20]。
本文首先采用CFSFDP算法[23]對(duì)4個(gè)乳房特征進(jìn)行乳房形態(tài)的聚類分析,建立ELM乳房形態(tài)識(shí)別模型并對(duì)乳房形態(tài)進(jìn)行識(shí)別,然后通過式(1)計(jì)算模型的乳房形態(tài)識(shí)別準(zhǔn)確率R,同時(shí)得到模型運(yùn)行時(shí)間,對(duì)比采用不同激活函數(shù)時(shí)ELM乳房識(shí)別模型的識(shí)別率。ELM乳房形態(tài)識(shí)別流程如圖1所示。
(1)
式中:N表示測(cè)試集中乳房形態(tài)識(shí)別正確的樣本數(shù);M表示測(cè)試集樣本總數(shù)。
圖 1 ELM乳房形態(tài)識(shí)別流程圖Fig.1 Flow chart of ELM breast shape recognition
常用的K-means、FCM聚類算法對(duì)非球形集群數(shù)據(jù)監(jiān)測(cè)效果并不顯著,而CFSFDP算法適用于各種形狀的數(shù)據(jù)集,且對(duì)非球形集群數(shù)據(jù)聚類效果較顯著[24],并能夠在得到直觀聚類中心數(shù)的同時(shí)提高聚類準(zhǔn)確性[20]。因此本文采用CFSFDP聚類算法對(duì)乳房形態(tài)進(jìn)行分類。基于局部密度和相對(duì)距離[25],根據(jù)決策圖識(shí)別出密度最大且與其周圍的點(diǎn)距離最短的4個(gè)樣本數(shù)據(jù)點(diǎn)作為聚類中心,利用該算法計(jì)算出4類類簇中心的乳房特征值及特征均值,見表1。
表 1 類簇中心的特征值及特征均值
由表1可知,從乳平圍和胸厚/胸寬這2個(gè)特征來(lái)看,乳平圍在類簇2的數(shù)值最大,類簇3的數(shù)值最小,且相差較大;而胸厚/胸寬在類簇2的值最大,類簇1、3、4的值較小且相差不大。這表明類簇2的乳房形態(tài)特征表現(xiàn)為豐滿且挺拔,類簇1、3、4的乳房形態(tài)特征均為扁平狀,同時(shí)類簇1相對(duì)豐滿,類簇4次之,類簇3的乳房形態(tài)相對(duì)瘦小。乳間距/胸寬在類簇2、3的值較大,說明這2種乳房形態(tài)表現(xiàn)為內(nèi)斂;類簇1、4的值最小,乳房為偏外擴(kuò)形態(tài)。根據(jù)頸窩點(diǎn)至乳頭點(diǎn)長(zhǎng)/胸圍至下胸圍高的特征數(shù)值,類簇2的值最大,類簇1、3的值次之,類簇4的值最小,表明類簇4的乳房高度最高,類簇1、3適中,類簇2最低,乳房呈下垂?fàn)顟B(tài)。計(jì)算4類乳房形態(tài)的各項(xiàng)乳房特征平均值,求得4類類簇中心特征值與4類類簇特征均值的差值絕對(duì)值范圍中心,分別為[0.01,0.67]、[0.03,0.59]、[0.04,1.3]、[0.01,0.64] cm。差值范圍越大,則類簇樣本分布越離散。類簇2的差值范圍0.56 cm最小,表明該類簇樣本分布較集中且類簇中心代表性較強(qiáng),類簇1和類簇4的差值范圍0.66 cm和0.63 cm相對(duì)較小,表明該類簇樣本分布較為集中,類簇中心可以代表該類簇乳房形態(tài)。類簇3的差值最大,為1.3 cm,表明該類簇樣本分布較分散,這類類簇的聚類效果偏差。因此,將相對(duì)豐滿、較扁平且偏外擴(kuò)的類簇1定義為標(biāo)準(zhǔn)型乳房(A型),豐滿、挺拔、內(nèi)斂且下垂的類簇2定義為豐滿型(B型),相對(duì)瘦小、扁平且內(nèi)斂的類簇3定義為扁瘦型(C型),特征為扁平、比較瘦小、乳房高度較高且外擴(kuò)的類簇4定義為高挺型(D型)。
將樣本數(shù)據(jù)點(diǎn)歸屬到相對(duì)距離較小的聚類中心,得到4類乳房形態(tài)的分類,如圖2所示。
圖 2 乳房形態(tài)分類圖Fig.2 Classification of breast morphology
圖2中,屬于標(biāo)準(zhǔn)型(A型)的類簇1數(shù)量最多,占比為41.28%,其次為高挺型(D型)的類簇4,占比33.03%,扁瘦型(C型)的類簇3較少,豐滿型(B型)的類簇2最少僅占總樣本量的6.42%。說明標(biāo)準(zhǔn)型和高挺型是西部地區(qū)女性乳房的主要特征。
ELM算法結(jié)構(gòu)包含輸入層、隱含層和輸出層(圖3),其中輸入層和隱含層之間的連接權(quán)值以及隱含層神經(jīng)元的閾值隨機(jī)產(chǎn)生[26-27]。
圖 3 ELM算法結(jié)構(gòu)Fig.3 ELM algorithm structure
圖3中,x代表訓(xùn)練集樣本的輸入層,即4類乳房特征數(shù)據(jù);y表示訓(xùn)練集樣本的輸出層,即4種乳房形態(tài)類別;ωij表示第i個(gè)輸入層神經(jīng)元和第j個(gè)隱含層神經(jīng)元之間的連接權(quán)值;g(·)表示激活函數(shù);O1,O2,…,OL表示隱含層節(jié)點(diǎn);βjk表示第j個(gè)隱含層神經(jīng)元和第k個(gè)輸出層神經(jīng)元之間的連接權(quán)值。
ELM學(xué)習(xí)與識(shí)別步驟如下:
1) 導(dǎo)入訓(xùn)練集樣本的矩陣X與輸出矩陣T,其中矩陣X的行是樣本的4個(gè)乳房形態(tài)特征,矩陣T的行是4類乳房形態(tài),兩矩陣的列均代表訓(xùn)練集樣本數(shù)為88個(gè),見式(2)與式(3)。
(2)
(3)
2) 隨機(jī)產(chǎn)生輸入層和隱含之間的連接權(quán)值ωij以及隱含層神經(jīng)元的閾值bi(i=1,2,…,L),其中L代表隱含層神經(jīng)元個(gè)數(shù)。
3) 計(jì)算隱含層的輸出矩陣H。
(4)
式中:G函數(shù)代表隱含層神經(jīng)元的輸出;g函數(shù)為激活函數(shù)。
4) 通過求解方程組計(jì)算隱含層和輸出層之間的連接權(quán)值β,‖Hβ-T‖=0,即
β=H-1T
(5)
5) 輸入測(cè)試集樣本的矩陣X′,其中行是4個(gè)乳房特征,列是20個(gè)測(cè)試集樣本數(shù)量,見式(6)。
(6)
6) 得到ELM乳房識(shí)別模型預(yù)測(cè)結(jié)果的輸出矩陣T′:
(7)
采用Matlab R2019a(MathWorks公司)自定義elmtrain函數(shù),以4個(gè)乳房特征作為ELM的輸入層,以乳房聚類結(jié)果作為ELM的輸出層。隨機(jī)產(chǎn)生訓(xùn)練集和測(cè)試集,其中訓(xùn)練集包含88個(gè)乳房數(shù)據(jù)點(diǎn),測(cè)試集包含20個(gè)數(shù)據(jù)點(diǎn)。激活函數(shù)設(shè)為sin且隱含層神經(jīng)元設(shè)為30,建立ELM網(wǎng)絡(luò)模型并訓(xùn)練。得到乳房形態(tài)測(cè)試集預(yù)測(cè)準(zhǔn)確率,見圖4。
圖 4 測(cè)試集仿真預(yù)測(cè)Fig.4 Simulation prediction of test set
從圖4可以看出,測(cè)試集預(yù)測(cè)準(zhǔn)確率為90%,其中A型和D型乳房形態(tài)識(shí)別率為100%,B型識(shí)別率為50%,C型乳房形態(tài)識(shí)別率83.3%,在這種情況下ELM乳房形態(tài)識(shí)別模型識(shí)別率整體較高。有2個(gè)樣本識(shí)別錯(cuò)誤,其中一個(gè)為B型乳房被識(shí)別為C型乳房,可能是因?yàn)檫@2類乳房特征的乳間距/胸寬的值很相近,且B型乳房形態(tài)樣本量偏少,訓(xùn)練樣本不足導(dǎo)致該類型乳房形態(tài)不易被識(shí)別。另一個(gè)是C型乳房形態(tài)樣本被識(shí)別為D型乳房,可能是因?yàn)檫@2類乳房形態(tài)特征數(shù)據(jù)中胸厚/胸寬的值很相近導(dǎo)致識(shí)別出現(xiàn)偏差。
將ELM乳房形態(tài)識(shí)別模型運(yùn)行10次并計(jì)時(shí),結(jié)果見圖5。該模型第1次運(yùn)行時(shí)間最長(zhǎng)為11.57 s,可能是由于模型首次訓(xùn)練時(shí)需要額外的讀取數(shù)據(jù)時(shí)間,之后的運(yùn)行時(shí)間大多在1.28 s左右,整體來(lái)看運(yùn)行時(shí)間較短。
圖 5 ELM模型運(yùn)行時(shí)間Fig.5 Running time of ELM models
通過以上分析可知,ELM模型乳房形態(tài)識(shí)別率整體較高,運(yùn)行時(shí)間較短??梢詾閮?nèi)衣企業(yè)個(gè)性化文胸定制以及完善文胸號(hào)型起到重要作用,給不同乳房形態(tài)的消費(fèi)者提供更滿意的選擇,同時(shí)指導(dǎo)文胸罩杯及結(jié)構(gòu)設(shè)計(jì),降低文胸對(duì)不同乳房形態(tài)女性的不合體度,從而做到對(duì)女性胸部的支撐與塑型功能。另外,本研究存在乳房形態(tài)樣本量不充足的缺點(diǎn),后續(xù)研究應(yīng)擴(kuò)大受試者群體,減少識(shí)別結(jié)果的誤差,進(jìn)一步提高乳房形態(tài)識(shí)別的準(zhǔn)確率。
為了提高乳房形態(tài)識(shí)別精度,采用不同的激活函數(shù)與神經(jīng)元個(gè)數(shù)來(lái)定義ELM模型[28]。針對(duì)hardlim、sig、sin等3種不同的激活函數(shù),分析隱含層神經(jīng)元個(gè)數(shù)值在500以內(nèi)、按照首項(xiàng)為5、公差為5的等差數(shù)列形式對(duì)樣本乳房形態(tài)識(shí)別精度產(chǎn)生的影響。
將乳房形態(tài)識(shí)別模型中的激活函數(shù)設(shè)為hardlim,見圖6。
圖 6 hardlim激活函數(shù)對(duì)預(yù)測(cè)準(zhǔn)確率的影響Fig.6 Influence of hardlim activation function on prediction accuracy
圖6中,當(dāng)隱含層神經(jīng)元個(gè)數(shù)在5~150之間時(shí),測(cè)試集預(yù)測(cè)準(zhǔn)確率波動(dòng)較小,但不低于50%;隱含層神經(jīng)元個(gè)數(shù)在150~500時(shí)預(yù)測(cè)準(zhǔn)確率波動(dòng)較大,且當(dāng)隱含層神經(jīng)元個(gè)數(shù)為470時(shí),預(yù)測(cè)準(zhǔn)確率達(dá)到最高,為71.7%。表明激活函數(shù)為hardlim時(shí),ELM乳房形態(tài)識(shí)別模型的識(shí)別率整體較低。
將乳房形態(tài)識(shí)別模型中的激活函數(shù)改為sig,見圖7。不難發(fā)現(xiàn)當(dāng)隱含層神經(jīng)元個(gè)數(shù)為30時(shí),該模型識(shí)別乳房形態(tài)的準(zhǔn)確率最高達(dá)到81.7%;當(dāng)隱含層神經(jīng)元個(gè)數(shù)在10~55之間時(shí),模型預(yù)測(cè)準(zhǔn)確率高于70%;而在30~45之間時(shí),準(zhǔn)確率均大于80%;說明神經(jīng)元個(gè)數(shù)設(shè)在此段時(shí)模型識(shí)別精確率較好;隱含層神經(jīng)元個(gè)數(shù)在50~100之間,預(yù)測(cè)精度下降明顯;隱含層神經(jīng)元個(gè)數(shù)在60~500時(shí),模型預(yù)測(cè)精度整體低于70%。因此當(dāng)激活函數(shù)為sig時(shí),建議將隱含層神經(jīng)元個(gè)數(shù)設(shè)置為30~45之間。
圖 7 Sig激活函數(shù)對(duì)預(yù)測(cè)準(zhǔn)確率的影響Fig.7 Influence of sig activation function on prediction accuracy
最后,將乳房形態(tài)識(shí)別模型中的激活函數(shù)改為sin,見圖8??梢钥闯鯡LM乳房形態(tài)識(shí)別模型的預(yù)測(cè)準(zhǔn)確率較好,隱含層神經(jīng)元個(gè)數(shù)設(shè)為25時(shí),預(yù)測(cè)準(zhǔn)確率平均達(dá)到98.3%,乳房形態(tài)識(shí)別率最好;隱含層神經(jīng)元個(gè)數(shù)在5~60之間時(shí),模型識(shí)別準(zhǔn)確率為80%以上,這表明此時(shí)模型識(shí)別準(zhǔn)確率較高,識(shí)別效果較好;隱含層神經(jīng)元個(gè)數(shù)在60~500之間時(shí),模型識(shí)別率均不超過80%,當(dāng)隱含層神經(jīng)元個(gè)數(shù)在85~90時(shí)識(shí)別精確率僅為45%,表明采用此段隱含層神經(jīng)元個(gè)數(shù)的模型預(yù)測(cè)精度不高。
圖 8 Sin激活函數(shù)對(duì)預(yù)測(cè)準(zhǔn)確率的影響Fig.8 Influence of sin activation function on prediction accuracy
綜上,在自定義乳房形態(tài)識(shí)別模型時(shí),激活函數(shù)設(shè)為hardlim時(shí),預(yù)測(cè)準(zhǔn)確率整體較低,不建議采用該激活函數(shù);sig激活函數(shù)下,建議將隱含層神經(jīng)元個(gè)數(shù)設(shè)置在30~45之間識(shí)別效果較好,準(zhǔn)確率均大于80%,且當(dāng)隱含層神經(jīng)元個(gè)數(shù)為30時(shí),該模型識(shí)別乳房形態(tài)的準(zhǔn)確率最高,為81.7%;激活函數(shù)為sin且當(dāng)隱含層神經(jīng)元個(gè)數(shù)在20~50時(shí),預(yù)測(cè)準(zhǔn)確率較高,平均為95%,隱含層神經(jīng)元個(gè)數(shù)設(shè)為25時(shí),預(yù)測(cè)準(zhǔn)確率平均為98.3%,最高可達(dá)100%。
ELM乳房形態(tài)識(shí)別模型識(shí)別效果較好,在sin激活函數(shù)下,當(dāng)隱含層神經(jīng)元個(gè)數(shù)設(shè)為25,模型的預(yù)測(cè)準(zhǔn)確率平均為98.3%,最高可達(dá)100%。模型運(yùn)行時(shí)間整體較短,除首次運(yùn)行11.57 s以外,平均為1.28 s。ELM乳房形態(tài)識(shí)別模型的探究有利于提高乳房形態(tài)識(shí)別準(zhǔn)確率,優(yōu)化消費(fèi)者穿著文胸的合體度,為文胸號(hào)型的細(xì)分和個(gè)性化定制提供理論參考。