肖登輝,李立輕,b,汪 軍,b
(東華大學(xué)a.紡織學(xué)院;b.紡織面料技術(shù)教育部重點實驗室:上海 201620)
棉麻混紡比是紡織檢測中的重要參數(shù),其對于紗線的成紗質(zhì)量及棉、麻混紡織物的舒適性有重要的影響。棉、麻纖維是化學(xué)成分相同的植物纖維,難以通過化學(xué)方法區(qū)分鑒別[1];目前均采用物理方法,如顯微投影法[2],直接通過顯微鏡觀察,依靠檢測人員經(jīng)驗對棉、麻纖維進行鑒別,是目前廣泛應(yīng)用的方法,但該方法費時費力,且要求檢測人員經(jīng)驗豐富。溶解吸光法[3]和著色法[4]利用棉、麻纖維微觀結(jié)構(gòu)的不同進行鑒別,雖然檢測效率高,卻對環(huán)境溫度、時間控制等提出了較高的要求。近紅外光譜法[5]也比較常用,但只能定性分析、無法定量分析。除此以外,一些圖像處理方法,如邊緣檢測、BP神經(jīng)網(wǎng)絡(luò)、SVM[6]等也應(yīng)用于棉、麻檢測,此類方法只能進行定性檢測,無法測算出其中的棉、麻根數(shù)故其應(yīng)用受到限制。
Faster rcnn[7]是深度學(xué)習(xí)的一個網(wǎng)絡(luò)模型,相較于傳統(tǒng)的機器學(xué)習(xí)以及圖像處理的分類任務(wù),該網(wǎng)絡(luò)不需要提取目標特定的特征來進行擬合訓(xùn)練集,可以自動地根據(jù)目標的語義信息進行檢測,且具有高準確率。筆者提出了基于Faster rcnn對棉、麻纖維進行目標檢測,探究目標檢測在測算棉麻紗混紡比的可行性。
現(xiàn)有測算棉麻混紡比的方法,多數(shù)基于紡織行業(yè)標準FZ/T 30003—2009《麻棉混紡產(chǎn)品定量分析方法 顯微投影法》。該標準規(guī)定的方法,需要制作切片、通過肉眼對棉、麻纖維進行識別,當棉、麻纖維根數(shù)超過1000根時,測算的棉麻混紡比才具有代表性。這種方法費時費力,且結(jié)果存在太多的主觀因素。筆者選取的目標檢測技術(shù)能從圖片中檢測出目標,并對其進行框選。Faster rcnn作為目標檢測算法之一,雖然相較于其他目標檢測算法(YOLO[8],SSD[9],F(xiàn)COS[10])在速度上略差,但精度相對較高,是一個2階段的檢測網(wǎng)絡(luò),見圖1。
圖1 Faster rcnn網(wǎng)絡(luò)結(jié)構(gòu)
要得到Faster rcnn良好的模型,一般首先準備相關(guān)目標的數(shù)據(jù)集,接著訓(xùn)練模型(耗費時間較長),然后對模型評估。
模型評估是對模型優(yōu)良性的考察,mAP(平均精度的均值)作為目標檢測通用的評估參數(shù),它結(jié)合了目標置信度、預(yù)測框與真實框的IOU值以及分類準確度等因素,全方位考量模型的綜合指標,在計算mAP之前,需要計算精準率和召回率。精準率是預(yù)測目標數(shù)占總預(yù)測數(shù)的比值,召回率是模型預(yù)測準確個數(shù)占總實際真實目標個數(shù)的比值,IOU評估的是模型的預(yù)測框與真實框的擬合情況。
(1)
式(1)中,Sgt∩pre代表真實框與預(yù)測框的重疊面積,Sgt∪pre代表真實框與預(yù)測框的并集面積。
(2)
式(2)中,pre為精準率,TP為模型預(yù)測準確的目標數(shù),F(xiàn)P是模型預(yù)測錯誤的數(shù)量。
(3)
式(3)中,recall為召回率,F(xiàn)N為未被模型檢測出的實際框數(shù)量。
(4)
式(4)中,APC為C類的AP值,N為所有圖片中包含該類所有目標的數(shù)量。
獲得模型的具體流程,見圖2。
圖2 總流程圖
2.1 數(shù)據(jù)集的準備
數(shù)據(jù)集的格式采用VOC2007格式。數(shù)據(jù)集被分為訓(xùn)練集、驗證集和測試集,按8∶1∶1分配。
2.1.1 圖片的獲取
為了便于區(qū)分圖片中的目標,以便減少為標注帶來麻煩(主要是避免同張圖片出現(xiàn)棉纖維和大麻纖維),筆者將棉纖維圖片和大麻纖維圖片分開獲取,完全按照哈氏切片器的操作流程制作切片。切片制樣的對象為純棉或純麻纖維團,哈氏切片器頂出纖維團厚度設(shè)置為0.15 mm,即轉(zhuǎn)取15個旋鈕,利用YG002C型纖維細度儀在相機鏡頭50倍和物鏡4倍,即總放大倍數(shù)為200倍的條件下進行拍攝獲取圖片,見圖3。
圖3 獲取到纖維的圖片
2.1.2 圖像的預(yù)處理
在獲取圖像時,受到外界信號的干擾,會產(chǎn)生噪聲,筆者采用中值濾波進行處理。此外,由于Faster rcnn訓(xùn)練傳入的圖片要求統(tǒng)一尺寸,實驗采用雙線性插值方法將所有圖片統(tǒng)一為512像素×512像素。
2.1.3 圖像的標注
Faster rcnn訓(xùn)練過程是有監(jiān)督的學(xué)習(xí)過程,需要對目標標注,采用Labelimg軟件(見圖4);實驗只需要將圖片中的目標框出,該軟件就能將人為標注的信息自動保存為xml文件,每張圖片對應(yīng)1個xml文件。此外,存在于圖片邊緣的纖維,默認不計入根數(shù),在標注過程中不進行標注。
圖4 圖片的標注
2.1.4 數(shù)據(jù)增廣
數(shù)據(jù)集共有800張圖片,其中訓(xùn)練集為640張,這對于深度學(xué)習(xí)的訓(xùn)練是遠遠不夠的,因為過小的數(shù)據(jù)集容易引起模型的過擬合現(xiàn)象,增加數(shù)據(jù)集的數(shù)量可以加強模型的泛化能力。筆者采用了數(shù)據(jù)增廣方案,利用一個腳本對訓(xùn)練集中的每張圖片進行翻轉(zhuǎn)、鏡像、旋轉(zhuǎn)等操作(見圖5),在對圖片進行增廣時,圖片相對應(yīng)的標注文件也會相應(yīng)地增加,數(shù)據(jù)增廣后的訓(xùn)練數(shù)據(jù)數(shù)量達到了3200張。
圖5 數(shù)據(jù)增廣過程
2.2 模型的訓(xùn)練
數(shù)據(jù)集制作好后,需對Faster rcnn進行訓(xùn)練。筆者采用Ubuntu 16.04系統(tǒng),2塊1080ti,Pytorch框架作為訓(xùn)練環(huán)境,基于棉纖維和麻纖維的形態(tài)區(qū)別,采用的學(xué)習(xí)率在剛開始時設(shè)為0.010,用到的優(yōu)化函數(shù)為隨機梯度下降(SGD),批次大小(Batch size)設(shè)置為8。圖6和圖7為模型訓(xùn)練中的學(xué)習(xí)率和損失函數(shù)值表現(xiàn)。
圖6 訓(xùn)練過程中的學(xué)習(xí)率
圖7 訓(xùn)練過程中的損失函數(shù)值
2.3 模型的評估
模型對事先劃分好的測試集(共80張圖片)進行預(yù)測,由于檢測對框位置精度要求不高,將超參數(shù)IOU閾值設(shè)置為0.5,即IOU值大于0.5認為是預(yù)測準確的。此外,預(yù)測的置信度閾值設(shè)置為0.1。具體的實驗結(jié)果見表1,表1中的實例數(shù)量指的是80張圖片中對應(yīng)類別目標的總個數(shù)。
表1 模型的評估實驗結(jié)果
實驗測算混紡比的公式全部參照紡織行業(yè)標準FZ/T 30003—2009,具體見式(5)~式(8)。
(5)
N2=1000-N1
(6)
式中:
N1——棉纖維折算根數(shù);
n1——棉纖維實際計數(shù)根數(shù);
n2——大麻纖維實際計數(shù)根數(shù);
N2——大麻纖維折算根數(shù)。
(7)
X2=1-X1
(8)
式中:
X1——棉纖維質(zhì)量百分比;
d1——棉纖維直徑/μm;
ρ1——棉纖維密度/(g·cm-3);
d2——大麻纖維直徑/μm;
ρ2——大麻纖維密度/(g·cm-3);
X2——大麻纖維質(zhì)量百分比。
依據(jù)文獻,棉纖維密度為15.4 g/cm3[11],平均直徑為17.3 μm[12];大麻纖維密度為1.458 g/cm3,平均直徑為20 μm。
采用60%棉和40%大麻混紡18.7 tex紗進行驗證。實驗時,由于單根紗線無法直接利用哈氏切片器進行截取,故采用染黑的山羊絨包覆單根混紡紗的方法獲取長度為0.30 mm纖維團;接著從切下來的纖維團中分離出白色的紗線段。為了減少拍攝次數(shù)、即減少纖維分散面積,實驗用刀片將纖維聚集盡量均勻地分散在一條直線上,見圖8。通過該方法,只要調(diào)節(jié)載物臺前后移動便可拍攝所有纖維所在面積。實驗進行了10組,對每組實驗的圖片均進行預(yù)處理,統(tǒng)一尺寸為512像素×512像素,利用優(yōu)化后的模型對10組拍攝的圖片分別做預(yù)測,結(jié)果見表2。
圖8 纖維聚集在一條直線上
表2 模型在棉麻混紡紗的檢測結(jié)果
從表2數(shù)據(jù)可知,僅從平均根數(shù)得出的質(zhì)量百分比基本與實際質(zhì)量百分比相吻合。
基于Faster rcnn目標檢測網(wǎng)絡(luò),以棉、麻纖維作為數(shù)據(jù)集進行圖片采集、處理等,之后進行模型訓(xùn)練、評估和檢測實驗。實驗結(jié)果表明,利用Faster rcnn作為檢測棉、麻纖維的目標檢測網(wǎng)絡(luò)在測試集上mAP達到了0.905,并在驗證實驗中得出該模型檢測的棉麻混紡比與實際標準值的誤差基本吻合,說明了利用Faster rcnn網(wǎng)絡(luò)模型作為自動化檢測棉、麻纖維核心算法的可行性和可靠性。雖然,該方法在精度上可觀,然而在制樣中以及圖片采集過程中還是存在著耗時、耗力的問題,希望在后期發(fā)展中得到改進。