摘" 要:在煙支生產(chǎn)過程中,保障產(chǎn)品外觀質(zhì)量對于維持消費者信任和市場競爭力至關(guān)重要。該研究針對煙支外觀缺陷中的刺破和夾沫在微小尺度范圍內(nèi)難以區(qū)分的問題,通過面積、橫向中心點、偏度和峰度形狀特征進行數(shù)值化,然后采用非參數(shù)的檢驗方法來評估這些特征在刺破和夾沫缺陷之間的差異性。研究結(jié)果對于調(diào)整自動化視覺檢測系統(tǒng)中的識別算法和分類策略具有重要意義,能夠顯著提高檢測的準確性和效率。該研究不僅強化對煙支外觀缺陷特性的理解,也為煙支質(zhì)量控制和缺陷自動識別系統(tǒng)的設(shè)計提供實用的方法論支持,突顯高級數(shù)據(jù)分析在質(zhì)量保證中的應(yīng)用潛力。
關(guān)鍵詞:外觀缺陷;正態(tài)性檢驗;Mann-Whitney U檢驗;蒙特卡洛方法;質(zhì)量控制
中圖分類號:TP391.41" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2025)05-0142-05
Abstract: In the production of cigarettes, ensuring appearance quality is crucial for maintaining consumer trust and competitiveness. Aiming at the problem that puncture and foam entrapment in cigarette appearance defects are difficult to distinguish within a micro-scale range, this study numeralizes the shape characteristics of area, transverse center point, skewness and kurtosis, and then uses a non-parametric inspection method to evaluate the differences between puncture and foam entrapment defects. The research results are of great significance for adjusting recognition algorithms and classification strategies in automated vision inspection systems, and can significantly improve the accuracy and efficiency of inspection. This research not only strengthens the understanding of the appearance defect characteristics of cigarettes, but also provides practical support for the design of cigarette quality control and automatic defect identification systems, highlighting the application potential of advanced data analysis in quality assurance.
Keywords: appearance defect; normality test; Mann-Whitney U test; Monte Carlo method; quality control
在煙支生產(chǎn)中,外觀質(zhì)量極大地影響了最終產(chǎn)品的市場接受度。特別是在煙支外觀缺陷中,刺破和夾沫作為2種典型的缺陷,所占比重較大,如圖1所示。同時相較于爆口和皺紋等其他類型,因其微小的尺度而更加難以識別,這導(dǎo)致了較高的漏檢率。因此,對這些微小缺陷的準確識別和分類顯得尤為關(guān)鍵。傳統(tǒng)的人工檢測方法,因其主觀性和低下的效率,已難以適應(yīng)高速煙機生產(chǎn)的需求。這種局限性促進了煙支外觀缺陷數(shù)字化處理技術(shù)的發(fā)展。數(shù)字化處理不僅顯著提高了檢測的精確性和效率,還能通過深入的數(shù)據(jù)分析,揭示缺陷產(chǎn)生的本質(zhì)和成因,為生產(chǎn)過程中的質(zhì)量控制和改進提供科學(xué)依據(jù)。
此外,數(shù)字化技術(shù)的應(yīng)用使其可以系統(tǒng)地記錄和分析每一次檢測的詳細數(shù)據(jù),這不僅有助于即時糾正生產(chǎn)過程中的偏差,還可以通過長期累積的數(shù)據(jù)分析,預(yù)防潛在的質(zhì)量問題,從而在保證煙支質(zhì)量的同時,優(yōu)化資源配置和生產(chǎn)流程。
另一方面,在進行煙支外觀缺陷的數(shù)字化分析時,相較于其他維度如紋理和顏色,形狀維度特征較為關(guān)鍵。因為,形狀是最直觀和最易于量化的特征,能夠提供缺陷的基本幾何和結(jié)構(gòu)信息。具體來說,形狀維度包括缺陷的面積、橫向中心點、偏度和峰度等,這些形狀維度的選取不僅基于它們能夠提供關(guān)于缺陷直觀和實際的物理屬性的信息,還因為這些數(shù)據(jù)可以被統(tǒng)計方法有效處理,從而揭示出缺陷的內(nèi)在特性和生產(chǎn)過程中可能的偏差。此外,這些量化的形狀特征也為機器學(xué)習(xí)模型提供了可用于自動缺陷識別和分類的特征,進一步促進了質(zhì)量控制過程的自動化和智能化。
1" 相關(guān)研究
在煙支制造行業(yè)中,產(chǎn)品的外觀質(zhì)量對消費者的接受度和品牌的市場競爭力有著重要影響[1]。煙支外觀缺陷種類繁多,其中刺破和夾沫是2種典型且常見的缺陷。傳統(tǒng)的人工檢測方法由于其主觀性強、效率低,已逐漸不適應(yīng)現(xiàn)代生產(chǎn)的需求。隨著數(shù)字化技術(shù)的發(fā)展,煙支外觀缺陷的檢測和分析方法得到了顯著提升。張劍[2]通過將亮度參量和色度參量分開進行表示的像素編碼格式,對圖像進行無監(jiān)督聚類算法處理,并根據(jù)圖像的像素聚類屬性來分割圖像。Sheng等[3]通過圖像分割和形態(tài)學(xué)操作從背景中區(qū)分煙支區(qū)域,然后使用三線性模型對每支煙支進行定位,通過計算得到每個區(qū)域的像素數(shù)來確定煙支是否有缺陷。
目前,基于視覺的煙支缺陷檢測技術(shù)已在煙草企業(yè)中得到廣泛應(yīng)用。典型實例包括上海煙草機械公司的煙支視覺檢測圖像信息采集裝置[4]和上海奇信機電設(shè)備公司的煙支外觀缺陷視覺檢測系統(tǒng)[5]。這些系統(tǒng)主要通過CCD相機直接采集煙支表面圖像,并由視覺檢測算法對圖像進行分析,以識別并剔除不合格煙支。這種基于視覺的檢測方法不僅提高了檢測效率和準確性,還減少了人工檢驗的主觀性和勞動強度,成為現(xiàn)代煙草生產(chǎn)過程中質(zhì)量控制的重要手段。
2" 原理和方法
2.1" 正態(tài)性檢驗基本方法
在進行參數(shù)型假設(shè)檢驗時,確保數(shù)據(jù)滿足正態(tài)分布的假定是關(guān)鍵前提。此前提對于如T檢驗、F檢驗和方差分析(ANOVA)等常見檢驗至關(guān)重要,因為這些方法的有效性建立在數(shù)據(jù)近似正態(tài)分布的基礎(chǔ)上[6]。
為了驗證數(shù)據(jù)的正態(tài)性,科學(xué)家們通常采用2類主要方法:圖形識別方法和統(tǒng)計檢驗方法。圖形方法中,QQ圖和PP圖是最常用的工具,用于直觀地評估數(shù)據(jù)的正態(tài)性。例如QQ圖通過比較數(shù)據(jù)的分位數(shù)與理論分布的期望分位數(shù)來評估數(shù)據(jù)分布的正態(tài)性。如果數(shù)據(jù)點大體上位于直線上,則支持數(shù)據(jù)符合正態(tài)分布的假設(shè)。同理,PP圖利用累積分布函數(shù)來對比實際數(shù)據(jù)與理論分布,點聚集在對角線上則表明數(shù)據(jù)與目標分布近似一致。
QQ圖和PP圖的使用可以追溯到1986年,由加拿大統(tǒng)計學(xué)家Martin Bradbury Wilk和印度統(tǒng)計學(xué)家Ramanathan Gnanadesikan首次引入[7]。這些圖形工具以其直觀的視覺表現(xiàn)形式,成為評估數(shù)據(jù)正態(tài)性的重要手段,彌補了統(tǒng)計檢驗可能留下的不足,共同確保了參數(shù)型假設(shè)檢驗的準確性和可靠性。
此外,還有多種統(tǒng)計檢驗專門用于正態(tài)性檢驗,如D'Agostino檢驗、Kolmogorov-Smirnov(Lillie檢驗)、Shapiro-Wilk檢驗等。這些檢驗通過分析數(shù)據(jù)的統(tǒng)計特征,提供了判斷數(shù)據(jù)是否符合正態(tài)分布的數(shù)值方法。
2.2" Mann-Whitney非參數(shù)檢驗方法
Mann-Whitney檢驗方法是1947年Mann和Whitney在Wilcoxon非參數(shù)檢驗方法的基礎(chǔ)上提出的一種針對獨立非成對樣本總體間是否存在顯著差異的檢驗方法[8]。Sawilowsky通過研究說明了在不滿足正態(tài)假定的情況下,Mann-Whitney檢驗的勢是T檢驗的3~4倍[9],即不滿足正態(tài)分布假定時,Mann-Whitney檢驗不犯第二類錯誤的概率是T檢驗的3~4倍。非參數(shù)型的檢驗方法無須考慮總體的分布情況,不需要研究對象的分布為已知的確定分布。當(dāng)總體的分布未知或只知道很少一部分時,其性質(zhì)無法確定,不能夠滿足參數(shù)檢驗的條件時,非參數(shù)檢驗在應(yīng)用過程中具有重要價值[10-11]。
2.3" 檢驗原理
3" 實驗和結(jié)果分析
3.1" 數(shù)據(jù)來源
數(shù)據(jù)來源于某卷煙廠實際生產(chǎn)數(shù)據(jù),外觀缺陷總量為5 946,其中刺破和夾沫的缺陷比例為12.7%和16.1%,樣本量約755張和957張。
3.2" 結(jié)果分析
3.2.1" 正態(tài)性檢驗
圖2和圖3中的QQ圖可以觀察到刺破缺陷面積的實際數(shù)據(jù)點沒有呈現(xiàn)直線分布,說明刺破缺陷面積的數(shù)據(jù)與正態(tài)分布是存在差異的,且左邊有一部分點偏離在直線上方,說明實際的分位數(shù)值大于理論的分位數(shù)值,從密度曲線的角度看,實際數(shù)據(jù)的分布是偏向右邊,理論分布曲線向左延伸得更遠一些。從PP圖中也可以看出散點明顯偏離了中線,初步表明刺破缺陷面積不服從正態(tài)分布。通過PP圖和QQ圖只能初步說明數(shù)據(jù)特征,還需要通過統(tǒng)計學(xué)方法進行確定。
圖4的QQ圖發(fā)現(xiàn)刺破缺陷的橫向中心點位置與直線之間的差異較大,初步說明刺破缺陷的橫向中心點位置是不服從正態(tài)分布的。PP圖中的散點除中間存在幾個地方與中線相交外,在剛開始、中間和結(jié)束時都嚴重偏離了中線,所以說明刺破缺陷橫向中心點的位置與正態(tài)分布是存在差異的。但是,PP圖和QQ圖只能初步說明一部分數(shù)據(jù)特征,具體的是否滿足分布特征還需要統(tǒng)計學(xué)的方法進行檢驗。
由圖5的QQ圖可以看到,夾沫缺陷的橫向中心點位置并沒有呈現(xiàn)一條直線,數(shù)據(jù)點與直線之間的偏離度較大,說明夾沫缺陷的橫向中心點位置和正態(tài)分布之間存在一定的差異。PP圖中也能夠發(fā)現(xiàn)散點與中線是嚴重偏離的,初步可以得出夾沫橫向中心點位置是不服從正態(tài)分布的。但是通過QQ圖和PP圖主觀性較強,還需要使用具體的統(tǒng)計學(xué)方法進一步檢驗。
通過檢驗說明刺破缺陷的面積、夾沫缺陷的面積、刺破缺陷的中心點、夾沫缺陷的中心點的數(shù)據(jù)不服從正態(tài)分布,因此不能使用參數(shù)型的方法進行刺破缺陷的面積和夾沫缺陷的面積、刺破缺陷的中心點和夾沫缺陷的中心點兩兩之間的差異性比較。
3.2.2" 非參數(shù)檢驗結(jié)果
本文需要檢驗的是刺破和夾沫2種缺陷之間是否存在顯著差異,所以選擇面積和中心點2個角度來對其進行分析。Mann-Whitney檢驗比較的是2組數(shù)據(jù)中中位數(shù)之間的差異,設(shè)破缺陷的面積、夾沫缺陷的面積、刺破缺陷的中心點和夾沫缺陷的中心點的中位數(shù)依次為M1,M2,M3,M4。Mann-Whitney檢驗的原假設(shè)H0:M1=M2,M3=M4;對應(yīng)的備擇假設(shè)H1:M1≠M2,M3≠M4。通過描述性統(tǒng)計分析可以知道刺破缺陷的中心值和面積的中位數(shù)均小于夾沫缺陷,因此又可以做單側(cè)檢驗,單側(cè)備擇假設(shè)為H2:M1lt;M2,M3lt;M4。Mann-Whitney檢驗的結(jié)果見表1。
表1中的結(jié)果表明,刺破和夾沫缺陷面積的Mann-Whitney統(tǒng)計量U=212 045.500,Wilcoxon統(tǒng)計量W=668 535.500,正態(tài)近似的統(tǒng)計量Z=14.676,相應(yīng)的漸近雙側(cè)P值為0.000。由于數(shù)據(jù)量較大無法計算精確的顯著性,所以此處采用蒙特卡洛方法來計算精確的顯著性P值,蒙特卡洛方法計算得到的精確雙側(cè)P值為0.000,顯著性置信區(qū)間為[0.000,0.000 460];精確單側(cè)P值為0.000,顯著性置信區(qū)間為[0.000,0.000 460]。刺破和夾沫缺陷中心點的Mann-Whitney統(tǒng)計量U=346 386.500,Wilcoxon統(tǒng)計量W=802 876.500,正態(tài)近似的統(tǒng)計量Z=1.439,相應(yīng)的漸近雙尾P值為0.150。同樣由于數(shù)據(jù)量較大,只能使用蒙特卡洛方法來計算精確的顯著性P值,蒙特卡洛方法計算得到的精確雙側(cè)P值為0.156,顯著性置信區(qū)間為[0.147,0.166];精確單側(cè)P值為0.080,顯著性置信區(qū)間為[0.073,0.087]。對于雙側(cè)檢驗H0:M1=M2,M3=M4對H1:M1≠M2,M3≠M4,需要雙側(cè)檢驗的精確P值,刺破和夾沫缺陷面積的P值為0.000/2=0.000lt;0.05,拒絕原假設(shè),認為在0.05的顯著性水平下刺破缺陷的面積和夾沫缺陷的面積存在顯著差異。刺破和夾沫缺陷面積中心點的雙側(cè)精確P值為0.156/2=0.078gt;0.05,不能拒絕原假設(shè),認為在0.05的顯著性水平下刺破缺陷的中心點和夾沫缺陷的中心點不存在顯著差異。對于單側(cè)檢驗H0:M1=M2,M3=M4對H2:M1lt;M2,M3lt;M4,需要單側(cè)檢驗的精確P值,刺破和夾沫缺陷面積對應(yīng)單側(cè)的P值為0.000lt;0.05,拒絕原假設(shè),認為在0.05的顯著性水平下刺破缺陷的面積小于夾沫缺陷的面積。刺破和夾沫缺陷中心點的單側(cè)精確P值為0.08gt;0.05,不能拒絕原假設(shè),沒有充分的理由能夠證明在0.05的顯著性水平下刺破缺陷的中心點位置小于夾沫缺陷。因此,可以認為刺破和夾沫2類缺陷之間存在顯著差異。
4" 結(jié)論
本研究探討了煙支外觀缺陷的正態(tài)性檢驗方法,并通過Mann-Whitney U檢驗和蒙特卡洛方法分析了刺破和夾沫缺陷的面積及中心點。研究結(jié)果顯示,刺破和夾沫缺陷在面積上存在顯著差異,刺破缺陷的面積顯著小于夾沫缺陷。然而,2種缺陷在中心點位置上的差異不顯著,顯示出統(tǒng)計意義不明顯。這些發(fā)現(xiàn)為煙支質(zhì)量控制和缺陷檢測技術(shù)提供了重要的統(tǒng)計依據(jù)。在實際應(yīng)用中,建議在自動化視覺檢測系統(tǒng)中調(diào)整識別和分類策略,以優(yōu)化煙支生產(chǎn)過程中的質(zhì)量檢測流程,確保生產(chǎn)質(zhì)量管理的效率和準確性。這些調(diào)整有助于提升對缺陷識別的準確性,從而改進產(chǎn)品質(zhì)量。
參考文獻:
[1] 吳玉生,李安虎,萬亞明,等.基于機器視覺的煙草在線檢測技術(shù)研究進展[J].激光與光電子學(xué)進展,2024,61(8):49-62.
[2] 張劍.基于聚類分析的彩色煙支圖像的識別與計數(shù)[D].武漢:華中科技大學(xué),2007.
[3] SHENG F, SONG S Y, XIA S P. A real-time cigarettes counting and loose ends detection algorithm[C]// 2016 IEEE International Conference of Online Analysis and Computing Science(ICOACS), May 28-29, 2016,Chongqing, China. New York: IEEE Press, 2016:11-15.
[4] 俞康平,汪嶸,孫堅,等.煙支視覺檢測的圖像信息采集裝置:CN217084737U[P].2022-07-29.
[5] 王澤棟.一種煙支外觀缺陷視覺檢測系統(tǒng):CN214408724U[P].2021-10-15.
[6] 楊斌.正態(tài)性檢驗的幾種方法比較[J].統(tǒng)計與決策,2015(14): 72-74.
[7] WILK M B, GNANADESIKAN R. Probability plotting methods for the analysis for the analysis of data[J]. Biometrika, 1968,55(1):1-17.
[8] MANN H B, WHITNEY D R. On a test of whether one of two random variables is stochastically larger than the other[J]. The Annals of Mathematical Statistics,1947,18(1):50-60.
[9] BRIDGE T J. Deconstructing the comparative power of the independent samples t and the Wilcoxon Mann-Whitney for shift and slight heteroscedasticity[J].Dissertations amp; Theses Gradworks, 2007.
[10] ROSNER B. Fundamentals of biostatistics[M]. Boston: Cengage learning,2015.
[11] WASSERMAN L. All of nonparametric statistics[M]. Springer Science amp; Business Media,2006.