王碧嶠 張梅 王靜 姜曉巍 李敏 王玲玲 張舒暢
摘要: 針對棉織物在靛藍(lán)染色時(shí)染色工藝條件對染色深度的非線性影響,導(dǎo)致染色深度難以控制,不符合客戶要求的問題,文章選取氫氧化鈉濃度、保險(xiǎn)粉濃度和靛藍(lán)染料濃度三個(gè)主要影響因素作為輸入變量,表觀顏色深度(K/S值)作為輸出變量,采用Python語言進(jìn)行編程,以混沌算法進(jìn)行尋參,應(yīng)用最小二乘支持向量機(jī)(LSSVM)算法建立了靛藍(lán)染色預(yù)測模型,并對模型的預(yù)測性能進(jìn)行了驗(yàn)證。結(jié)果表明:該模型對織物K/S值預(yù)測的平均絕對百分比誤差為1.759 7%,均方根相對誤差為0.029 4%,比網(wǎng)格尋參法的預(yù)測誤差更小,說明該模型具有較高的精度和良好的預(yù)測能力,可以為棉織物靛藍(lán)染色工藝的預(yù)測和優(yōu)化提供參考。
關(guān)鍵詞: 混沌算法;最小二乘支持向量機(jī)(LSSVM);Python;棉織物;靛藍(lán);染色預(yù)測模型
中圖分類號: TS190.9; TP181
文獻(xiàn)標(biāo)志碼: A
文章編號: 1001-7003(2023)07-0041
作者簡介:
王碧嶠(1984),女,講師,博士,主要從事天然染料染色、功能性紡織品方面的研究。
靛藍(lán)作為一種還原染料,歷史悠久,應(yīng)用廣泛。由于靛藍(lán)不能直接上染棉織物,在染色過程中通常要加入堿和還原劑,在堿性環(huán)境還原成可以上染的隱色體后進(jìn)行染色。染料、堿和還原劑的用量對靛藍(lán)染色棉織物的表觀顏色深度(K/S值)的影響是非線性的,為了達(dá)到想要的K/S值,目前常用單因子實(shí)驗(yàn)法和正交實(shí)驗(yàn)法來確定最優(yōu)工藝[1-2]。然而,這些方法有如下缺點(diǎn):1) 雖然進(jìn)行了多次實(shí)驗(yàn),但由于所取的工藝參數(shù)數(shù)值不連續(xù),找到的最優(yōu)工藝可能并非實(shí)際中真正的最優(yōu),而是所取工藝參數(shù)下的最優(yōu);2) 其最優(yōu)工藝的標(biāo)準(zhǔn)是K/S值達(dá)到最大,即表觀顏色最深,但在實(shí)際生產(chǎn)過程中,最優(yōu)工藝應(yīng)該是盡可能貼近客戶所要求色深的工藝。因此,一個(gè)能夠通過染色工藝條件準(zhǔn)確預(yù)測織物K/S值的模型對于降低成本、提高工藝變換效率具有重要意義。
目前,建立精確的預(yù)測模型一般采用機(jī)器學(xué)習(xí)的方法,如神經(jīng)網(wǎng)絡(luò)[3]、支持向量機(jī)(Support Vector Machine,SVM)[4]和最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)[5]等。LSSVM是SVM的一種擴(kuò)展,它降低了計(jì)算的復(fù)雜性,提高了機(jī)器學(xué)習(xí)的速度,在對小樣本、非線性數(shù)據(jù)的識別和預(yù)測中具有獨(dú)特的優(yōu)勢,在電子、化工、電氣等領(lǐng)域的預(yù)測模型中得到了廣泛應(yīng)用,但是在染色研究方面僅有幾篇應(yīng)用于活性染料染色棉織物的報(bào)道[6-7]。
LSSVM的超參數(shù)對于模型的精確度有很大影響,因此選擇合適的超參數(shù)非常重要。目前常用的超參數(shù)尋優(yōu)的方法有網(wǎng)格搜索法[7]、粒子群算法[8]、蟻群算法[9]等。網(wǎng)格搜索法簡單易行、應(yīng)用廣泛,可以通過較大的搜索范圍及較小的步長,找到全局最優(yōu)解,但較為耗費(fèi)計(jì)算資源和計(jì)算時(shí)間,效率較為低下。因此,實(shí)際應(yīng)用時(shí)一般先使用較大的搜索范圍和步長來尋找全局最優(yōu)解的位置,再逐漸縮小搜索范圍和步長以確定最優(yōu)值,這樣可以節(jié)省計(jì)算的時(shí)間和資源,但對于非凸函數(shù)很可能會(huì)錯(cuò)過全局最優(yōu)解。粒子群算法和蟻群算法能夠有效地提升模型精度,但也有容易陷入局部最優(yōu)解的缺點(diǎn)?;煦缢惴ㄈ炙阉髂芰?qiáng)、能有效避免陷入局部最優(yōu)解,且搜索效率較高,有利于建立精確的LSSVM模型[10]。
本文基于Python語言及其擴(kuò)展模塊,利用混沌算法進(jìn)行超參數(shù)尋優(yōu),從而建立一個(gè)用較小樣本量也能夠快速、精確預(yù)測靛藍(lán)染色棉織物K/S值的LSSVM模型。
1 染色預(yù)測模型
1.1 輸入變量選取
靛藍(lán)染色過程中,影響染色織物K/S值的因素有很多,如果將所有影響因素都作為輸入變量,會(huì)大幅增加建模的計(jì)算量,所需樣本量也會(huì)增加,因此需要對輸入變量進(jìn)行選擇。通過對靛藍(lán)上染棉織物機(jī)理的分析,再結(jié)合染色實(shí)踐的經(jīng)驗(yàn),最終篩選出靛藍(lán)染料濃度、氫氧化鈉濃度和保險(xiǎn)粉濃度這三個(gè)影響因素。
這三個(gè)因素既是影響靛藍(lán)染色棉織物的K/S值的主要因素,也有較強(qiáng)的交互作用:靛藍(lán)染料濃度直接影響氫氧化鈉和保險(xiǎn)粉的用量;氫氧化鈉濃度太低會(huì)造成染液pH值太低,靛藍(lán)無法充分還原成單酚鈉離子型隱色體,若氫氧化鈉濃度太高則會(huì)導(dǎo)致染液pH值過高,保險(xiǎn)粉消耗增加,靛藍(lán)被過度還原成上染率較低的雙酚鈉離子型隱色體;保險(xiǎn)粉濃度太低會(huì)導(dǎo)致靛藍(lán)還原不充分,太高會(huì)導(dǎo)致染液pH值下降甚至變成酸性,靛藍(lán)無法充分還原[11]。因此,這三個(gè)因素直接影響染液中可上染的靛藍(lán)隱色體的濃度,進(jìn)而影響染色織物的K/S值。
其他因素如染色溫度、染色時(shí)間等,雖然也對K/S值有影響,但對染液中靛藍(lán)隱色體的濃度影響不大,為了減少建模的計(jì)算量,未選擇這些因素,只選擇靛藍(lán)染料濃度、氫氧化鈉濃度和保險(xiǎn)粉濃度這三個(gè)因素作為染色預(yù)測模型的輸入變量,染色后棉織物的K/S值作為輸出變量。
1.2 LSSVM染色預(yù)測模型
由于選擇了三個(gè)因素,且三個(gè)因素對染色后棉織物的K/S值的影響是非線性的,這要求建立模型的算法應(yīng)該支持高維運(yùn)算和非線性樣本。同時(shí),為了節(jié)省工藝成本,提高工藝變換的效率,應(yīng)盡可能以較少的樣本量達(dá)到較高的預(yù)測精度。LSSVM算法則能夠滿足這些要求建立預(yù)測模型。
將25組染色數(shù)據(jù)轉(zhuǎn)換為訓(xùn)練樣本集{(xi,yi),xi∈Rn,yi∈R,i=(1,2,…,m)},其中x為n維輸入數(shù)據(jù),在此模型中即為三個(gè)影響因素:氫氧化鈉濃度、保險(xiǎn)粉濃度和靛藍(lán)染料濃度所組成的3維輸入數(shù)據(jù);y為一維輸出數(shù)據(jù),在此模型中即為K/S值;m表示訓(xùn)練用樣本量,在此模型中m=25。建模用的LSSVM的算法[12]主要描述如下:
1.3 數(shù)據(jù)集制作
為對模型進(jìn)行訓(xùn)練并對模型的預(yù)測準(zhǔn)確性進(jìn)行驗(yàn)證,用不同的實(shí)驗(yàn)參數(shù)對棉織物進(jìn)行染色,并測量染色后的K/S值。制作數(shù)據(jù)集時(shí),在較小的樣本量下,樣本數(shù)據(jù)要有較好的覆蓋性,并具有一定的隨機(jī)性。首先,在靛藍(lán)染色常用的濃度范圍內(nèi),分別對氫氧化鈉濃度、保險(xiǎn)粉濃度和靛藍(lán)染料濃度進(jìn)行5水平的單因子實(shí)驗(yàn),并剔除重復(fù)的實(shí)驗(yàn)參數(shù),共得到13組染色數(shù)據(jù)。其次,根據(jù)靛藍(lán)染色的機(jī)理,靛藍(lán)染料濃度決定了染液中能夠上染的隱色體濃度的上限,也決定了被染織物K/S值的上限,而氫氧化鈉和保險(xiǎn)粉的用量決定了有多少靛藍(lán)被轉(zhuǎn)化成隱色體,因此以靛藍(lán)染料濃度作為核心,確保每個(gè)水平的靛藍(lán)染料濃度都有5組染色數(shù)據(jù),氫氧化鈉和保險(xiǎn)粉的用量盡可能覆蓋整個(gè)區(qū)域,在此前提下,補(bǔ)充了12組實(shí)驗(yàn)。最后,為使數(shù)據(jù)集有一定隨機(jī)性,隨機(jī)選擇了5組實(shí)驗(yàn)參數(shù),共得到30組染色數(shù)據(jù)。隨機(jī)抽取25組染色數(shù)據(jù),作為訓(xùn)練模型的訓(xùn)練集,剩余5組染色數(shù)據(jù)用于驗(yàn)證模型預(yù)測準(zhǔn)確性的測試集。用于制作數(shù)據(jù)集的染色實(shí)驗(yàn)和測試的具體方案如下:
織物:純棉平紋織物,經(jīng)緯向密度分別為252、216根/10 cm,平方米質(zhì)量為129.5 g/m2。
材料:植物靛藍(lán)粉(貴州繡娘文化有限公司),氫氧化鈉(分析純,天津市大茂化學(xué)試劑廠),保險(xiǎn)粉(分析純,天津市福晨化學(xué)試劑廠),無水碳酸鈉(分析純,天津市天力化學(xué)試劑有限公司),皂片(商用,上海市紡織工業(yè)技術(shù)監(jiān)督所)。
儀器:Datacolor 200測色配色儀(美國Datacolor公司),HZT-A+200電子天平(華志科學(xué)儀器有限公司),HH-S6數(shù)顯恒溫水浴鍋(常州國宇儀器制造有限公司)。
染色流程:靛藍(lán)還原(一定量的靛藍(lán)粉、氫氧化鈉、保險(xiǎn)粉混合液,溫度40 ℃,還原20 min)→染色(40 ℃,20 min)→空氣氧化(10 min)→水洗→皂洗(皂片3 g/L,純堿3 g/L,浴比50︰1,溫度90 ℃,時(shí)間10 min)→水洗→自然晾干。
K/S值測試:使用Datacolor 200測色配色儀以CIE標(biāo)準(zhǔn)照明體D65光源,10°視角測試染色后棉織物在660 nm波長處的K/S值,在每個(gè)樣品的不同位置測試3次,取平均值。
1.4 染色預(yù)測模型的實(shí)現(xiàn)
染色預(yù)測模型通過Python語言編程實(shí)現(xiàn)。Python語言
是一種開源的機(jī)器語言,比起科研建模常用的Matlab,它具有免費(fèi)、不受版權(quán)限制、可移植性好的特點(diǎn),更適合在生產(chǎn)實(shí)踐中使用。使用Visual Studio Code編譯器運(yùn)行Python 3.0,并導(dǎo)入Numpy、Random和Openpyxl模塊。其中,Random模塊用來產(chǎn)生(0,1)之間的隨機(jī)數(shù),進(jìn)而產(chǎn)生混沌變量;Numpy模塊用來將樣本轉(zhuǎn)化成高維數(shù)組并進(jìn)行運(yùn)算;Openpyxl模塊用來將輸出結(jié)果導(dǎo)出為“.xls”文件。
2 結(jié)果與分析
2.1 染色預(yù)測模型訓(xùn)練
根據(jù)混沌優(yōu)化算法,最終選擇的最優(yōu)超參數(shù)(γ,σ)=(2 446.912 5,0.664 7),b=5.997 6。用訓(xùn)練集的25組染色實(shí)驗(yàn)數(shù)據(jù)作為樣本進(jìn)行模型訓(xùn)練,樣本的測試值和預(yù)測值見表1。其中,預(yù)測值保留4位小數(shù)。
從表1可以看出,測試值和染色預(yù)測模型預(yù)測值的相對誤差很小,相對誤差絕對值最大為0.345%,最小為0.004%。
模型的擬合程度與超參數(shù)γ和σ有密不可分的關(guān)系,因此超參數(shù)尋優(yōu)非常重要。表2是網(wǎng)格尋參法進(jìn)行超參數(shù)尋優(yōu)和用混沌算法尋優(yōu)后對應(yīng)的超參數(shù),以及對訓(xùn)練集預(yù)測的平均絕對百分比誤差eMAPE和均方根相對誤差eMSE。由表2可以看出,兩種尋參法得到的模型都具有較小的誤差,其中網(wǎng)格尋參得到的超參數(shù)比混沌算法尋優(yōu)得到的超參數(shù)誤差小,但誤差小并不代表對新樣本的預(yù)測準(zhǔn)確度更高。這是由于γ越大,模型的擬合誤差越小,但過大會(huì)造成模型的過擬合,會(huì)使模型對新樣本的預(yù)測有很大的誤差;σ越小,模型的擬合誤差也越小,但過小同樣也會(huì)造成過擬合現(xiàn)象。因此,要用測試集對訓(xùn)練出的模型進(jìn)行驗(yàn)證,從而檢驗(yàn)?zāi)P偷臏?zhǔn)確性。
2.2 染色預(yù)測模型性能驗(yàn)證
用測試集的5組染色數(shù)據(jù)代入已經(jīng)訓(xùn)練好的染色預(yù)測模型進(jìn)行預(yù)測,以驗(yàn)證模型預(yù)測的準(zhǔn)確度,預(yù)測結(jié)果見表3。其中,計(jì)算出的預(yù)測值有14小數(shù),在表3中只保留4位小數(shù)。
從表3可以看出,雖然混沌算法尋參在訓(xùn)練模型中表現(xiàn)的誤差比網(wǎng)格尋參法略高,但對測試集的預(yù)測結(jié)果的誤差明顯小于網(wǎng)格尋參法,說明網(wǎng)格尋參法找到的超參數(shù)不是全局最優(yōu)解,而混沌算法尋到的超參數(shù)更接近全局最優(yōu)。
綜上所述,混沌算法尋參LSSVM模型預(yù)測的eMAPE為1759 7%,eMSE為0.029 4%,預(yù)測誤差較小,預(yù)測效果較好,表明了采用該模型預(yù)測靛藍(lán)染色織物K/S值具有一定的可行性,對于降低靛藍(lán)染色生產(chǎn)成本、提高工藝變換效率具有應(yīng)用價(jià)值。
3 結(jié) 論
本文為提高靛藍(lán)染色織物的實(shí)際色深與需求色深的匹配度,以Python語言為基礎(chǔ),利用Numpy、Random和Openpyxl模塊,以靛藍(lán)染料濃度、氫氧化鈉濃度和保險(xiǎn)粉濃度為輸入變量,染色織物的K/S值為輸出變量,運(yùn)用混沌算法進(jìn)行超參數(shù)尋優(yōu),用訓(xùn)練集的25組染色數(shù)據(jù)進(jìn)行訓(xùn)練,建立了LSSVM靛藍(lán)染色工藝條件預(yù)測模型,并用測試集的5組染色數(shù)據(jù)驗(yàn)證了模型的預(yù)測準(zhǔn)確性。
1) 該模型對樣本具有很高的擬合度,模型的eMAPE為0061 6%,eMSE為0.000 1%,說明通過混沌算法尋優(yōu)得到的超參數(shù)能夠有效減少模型的預(yù)測誤差。
2) 通過混沌算法進(jìn)行超參數(shù)尋優(yōu),使模型展現(xiàn)了良好的預(yù)測能力,對染色棉織物K/S值預(yù)測的eMAPE為1.759 7%,eMSE為0.029 4%,比網(wǎng)格尋參法更有優(yōu)勢。這表明該模型通過小樣本的訓(xùn)練就可以達(dá)到較好的預(yù)測準(zhǔn)確度,可用于靛藍(lán)染色棉織物工藝條件的預(yù)測和優(yōu)化。
3) 該模型尚存在一定的局限性,主要體現(xiàn)在為了減少運(yùn)算量,輸入變量的數(shù)量受到限制,后續(xù)將通過改進(jìn)算法和模型,在不影響樣本量和預(yù)測性能的前提下,增加模型的可輸入變量,并將進(jìn)一步擴(kuò)展模型可預(yù)測的染色性能參數(shù)。
參考文獻(xiàn):
[1]馬俊然, 胡敏干, 周嵐, 等. 棉纖維靛藍(lán)染料/液蠟體系染色工藝[J]. 染整技術(shù), 2019, 41(10): 30-35.
MA Junran, HU Mingan, ZHOU Lan, et al. Dyeing process of cotton fiber in indligo dye/liquid paraffin system[J]. Textile Dyeing and Finishing Journal, 2019, 41(10): 30-35.
[2]李棟, 李鑫, 劉今強(qiáng), 等. 棉纖維的靛藍(lán)染料/D5體系染色[J]. 印染, 2016, 42(4): 9-13.
LI Dong, LI Xin, LIU Jinqiang, et al. Indigo dye/D5 system for cotton fiber dyeing[J]. China Dyeing & Finishing, 2016, 42(4): 9-13.
[3]HUANG J H, LIU H. A hybrid decomposition-boosting model for short-term multi-step solar radiation forecasting with NARX neural network[J]. Journal of Central South University, 2021, 28(2): 507-526.
[4]YU X, WANG H. Support vector machine classification model for color fastness to ironing of vat dyes[J]. Textile Research Journal. 2021, 91(15/16): 1889-1899.
[5]李明飛, 吳軍超, 張一馳. 基于最小二乘支持向量機(jī)的組合模型在區(qū)域似大地水準(zhǔn)面擬合中的應(yīng)用[J]. 大地測量與地球動(dòng)力學(xué), 2022, 42(9): 971-974.
LI Mingfei, WU Junchao, ZHANG Yichi. Application of combined model based on LSSVM in regional quasi-geoid fitting[J]. Journal of Geodesy and Geodynamics, 2022, 42(9): 971-974.
[6]劉佳, 金福江. 基于LS-SVM的棉針織物染色上染率模型的研究[J]. 福州大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 38(3): 446-449.
LIU Jia, JIN Fujiang. Study on the model of the uptake rate in dyeing of cotton fabric based on LS-SVM[J]. Journal of Fuzhou University (Natural Science Edition), 2010, 38(3): 446-449.
[7]陶開鑫, 俞成丙, 侯頎驁, 等. 基于最小二乘支持向量機(jī)的棉針織物活性染料濕蒸染色預(yù)測模型[J]. 紡織學(xué)報(bào), 2019, 40(7): 169-173.
TAO Kaixin, YU Chengbing, HOU Qi’ao, et al. Wet-steaming dyeing prediction model of cotton knitted fabric with reactive dye based on least squares support vector machine[J]. Journal of Textile Research, 2019, 40(7): 169-173.
[8]周昆鵬, 白旭芳, 畢衛(wèi)紅. 熒光光譜法檢測水質(zhì)COD時(shí)溫度、濁度、pH的影響分析[J]. 光譜學(xué)與光譜分析, 2019, 39(4): 107-112.
ZHOU Kunpeng, BAI Xufang, BI Weihong. The temperature, turbidity and pH impact analysis of water COD detected by fluorescence spectroscopy[J]. Spectroscopy and Spectral Analysis, 2019, 39(4): 1097-1102.
[9]黃光群, 段宏偉, 何金鴻, 等. 基于紅外光聲光譜的農(nóng)作物秸稈導(dǎo)熱系數(shù)定量分析[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2018, 49(7): 342-347.
HUANG Guangqun, DUAN Hongwei, HE Jinhong, et al. Rapid quantitative analysis of crop straws’ thermal conductivity based on infrared photoacoustic spectroscopy[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(7): 342-347.
[10]王磊, 劉雨, 劉志中, 等. 基于IABC-LSSVM的瓦斯涌出量預(yù)測模型研究[J]. 傳感器與微系統(tǒng), 2022, 41(2): 34-38.
WANG Lei, LIU Yu, LIU Zhizhong, et al. Research on prediction model for gas emission based on IABC-LSSVM[J]. Transducer and Microsystem Technologies, 2022, 41(2): 34-38.
[11]PAUK V, MICHALKOV J, JAGOOV K, et al. Origin of indigo colorants revealed by ion mobility spectrometry coupled to mass spectrometry followed by supervised classification[J]. Dyes and Pigments, 2022, 197: 109943.
[12]王建國, 張文興. 支持向量機(jī)建模及其智能優(yōu)化[M]. 北京: 清華大學(xué)出版社, 2015: 32-33.
WANG Jianguo, ZHANG Wenxing. Support Vector Machine Modeling and Intelligent Optimization[M]. Beijing: Tsinghua University Press, 2015: 32-33.