摘 要:為提高林業(yè)運(yùn)輸車輛的保險杠噴涂合格率,以某公司汽車保險杠的涂裝質(zhì)量數(shù)據(jù)為例,運(yùn)用排列圖對涂裝質(zhì)量數(shù)據(jù)進(jìn)行分析得出顆粒、桔皮屬于影響噴涂質(zhì)量的主要因素。從人、機(jī)、料、法、環(huán)5個方面分析產(chǎn)生顆粒、桔皮的主要原因,并采用斯皮爾曼(Spearman)相關(guān)系數(shù)進(jìn)行特征提取以及重要性分析,得出噴漆房的溫度、噴漆房相對濕度、機(jī)器人噴涂流量、旋杯轉(zhuǎn)速、噴涂距離、噴涂速度、漆的品牌、機(jī)器人(機(jī)器①、機(jī)器②、…、機(jī)器⑥)均會影響保險杠的噴涂質(zhì)量。運(yùn)用決策樹(classificationand regression tree,CART)算法確定噴涂流量、噴漆房的溫度、噴漆房相對濕度、機(jī)器人②和機(jī)器人④、漆的品牌是影響保險杠噴涂質(zhì)量的較為關(guān)鍵的因素。結(jié)果表明,利用CART分類算法對噴涂質(zhì)量數(shù)據(jù)進(jìn)行分析能夠?qū)崿F(xiàn)對故障點的判別,對于提高保險杠噴涂質(zhì)量具有借鑒意義。
關(guān)鍵詞:汽車保險杠; 噴涂質(zhì)量; 顆粒; 桔皮; 決策樹; 質(zhì)量控制; CART算法; 影響因素
中圖分類號:TP311. 13 文獻(xiàn)標(biāo)識碼:A DOI:10. 7525/j. issn. 1006-8023. 2025. 02. 013
0 引言
森林作業(yè)是人類獲取森林資源的主要手段[1],而林業(yè)運(yùn)材車則是作為森林作業(yè)的主要運(yùn)輸工具。隨著世界各國汽車銷售規(guī)模的不斷擴(kuò)大以及汽車工業(yè)的快速發(fā)展,汽車保險杠的需求也得到了很大的提高,這也導(dǎo)致保險杠的市場競爭尤為激烈。由于林業(yè)運(yùn)輸車經(jīng)常在復(fù)雜多變的環(huán)境中工作,因此保險杠需要具有出色的耐用性和可靠性。例如,在潮濕、多塵或高溫的環(huán)境中,保險杠的材料和結(jié)構(gòu)需要能夠抵抗腐蝕、磨損和變形。從安全性方面,當(dāng)車輛受到撞擊時,保險杠可以作為緩沖裝置,對前、后車身及行人進(jìn)行安全保護(hù);從外觀角度,高品質(zhì)的噴涂能夠與車身很好地融合,起到很好的美化效果,因此對保險杠實施高質(zhì)量的涂裝工藝至關(guān)重要。而作為保險杠制造商,如何提高生產(chǎn)質(zhì)量的同時降低生產(chǎn)成本是首要考慮的事。隨著保險杠生產(chǎn)工藝的日漸成熟,傳統(tǒng)保險杠制造企業(yè)加強(qiáng)了信息化建設(shè),使企業(yè)信息系統(tǒng)顯著增強(qiáng),生產(chǎn)數(shù)據(jù)的采集和收集能力也得到提高,將這類數(shù)據(jù)充分挖掘利用會對企業(yè)降低成本起到很大的作用。
在大數(shù)據(jù)的背景下,以數(shù)據(jù)驅(qū)動的方式解決產(chǎn)品質(zhì)量問題已是大勢所趨。數(shù)據(jù)驅(qū)動旨在從大量的數(shù)據(jù)中挖掘有價值的信息。數(shù)據(jù)驅(qū)動技術(shù)正被廣泛地應(yīng)用在各行各業(yè)[2]。王曉丹等[3]運(yùn)用大數(shù)據(jù)分析方法,通過對潛在的干擾因素進(jìn)行感知,借助分析建模方法來解決問題,阻止不利問題的產(chǎn)生;Wang等[4]研究開發(fā)了一個基于深度神經(jīng)網(wǎng)絡(luò)(deepneural network,DNN)的框架,用于監(jiān)測風(fēng)力渦輪機(jī)齒輪箱健康狀況并識別即將發(fā)生的故障,通過比較不同種數(shù)據(jù)挖掘算法,發(fā)現(xiàn)DNN模型最準(zhǔn)確。實際應(yīng)用表明,該方法能有效預(yù)測齒輪箱故障,優(yōu)于基于油溫的監(jiān)測方法。卜曉陽等[5]在分析C 5. 0決策樹算法原理的基礎(chǔ)上,采用信息熵方法,改進(jìn)現(xiàn)有的屬性選擇方式,使信息增益比率的計算速度得到提高,并給出了改進(jìn)的C 5. 0決策樹算法,該算法在數(shù)據(jù)分類方面具有良好的分類性能;Jiang[6]采用數(shù)據(jù)挖掘技術(shù),包括聚類、決策樹和層次分析法(theanalytic hierarchy process,AHP)程序,將市場分為6個部分并通過AHP排名,挖掘高價值家庭旅行者,以優(yōu)化在線航空公司和旅行社的CRM系統(tǒng),最終得出了4個分類規(guī)則,有助于提高客戶價值和增長率。謝鑫等[7]利用鄰域等價關(guān)系從而誘導(dǎo)鄰域ID3(iterativedichotomiser 3,ID3)算法,提出改進(jìn)后的算法能更好地連續(xù)處理離散化數(shù)據(jù),通過實例分析和數(shù)據(jù)試驗證明改進(jìn)后的ID3算法在連續(xù)數(shù)據(jù)分類時的有效性,且在分類機(jī)器學(xué)習(xí)中優(yōu)于ID3算法;潘永生等[8]研究了ID3 決策樹構(gòu)建方法和決策樹剪枝方法,將其用于乳腺病變圖像的數(shù)據(jù)挖掘中,得到具有實用價值的規(guī)律,并且具有較高的分類精度,由此表明該方法在醫(yī)學(xué)影像數(shù)據(jù)挖掘領(lǐng)域有著廣泛的應(yīng)用價值。
運(yùn)用數(shù)據(jù)挖掘技術(shù)所取得的效果是顯而易見的,但從目前的研究現(xiàn)狀來看,由于行業(yè)數(shù)據(jù)的高度機(jī)密性,以及在采集過程中缺乏統(tǒng)一的規(guī)范,導(dǎo)致其在工業(yè)生產(chǎn)實際應(yīng)用中很少被采用?,F(xiàn)有資料采集方法的改進(jìn),可以有效地把握生產(chǎn)流程中所累積的海量數(shù)據(jù)。為此,本項目擬采用基于決策樹的數(shù)據(jù)挖掘方法,充分挖掘保險杠噴涂過程中產(chǎn)生的海量數(shù)據(jù),并對其進(jìn)行深度挖掘,從中找出隱含的規(guī)律或潛在規(guī)則,為林業(yè)運(yùn)輸汽車保險杠的質(zhì)量控制提供參考。
1 某公司林業(yè)運(yùn)輸保險杠噴涂現(xiàn)狀
1. 1 保險杠涂裝工藝
本研究對象為某公司林業(yè)運(yùn)輸保險杠噴涂情況,保險杠的生產(chǎn)主要有注塑、噴涂、安裝三大工藝[9]。從生產(chǎn)設(shè)備和制造工藝上來說,噴涂工藝作為中間流程,由于包含眾多細(xì)小的工藝點,因此噴涂對汽車的外觀有著很大的影響,這一過程也是提高汽車附加值的一個關(guān)鍵環(huán)節(jié)[10]。詳細(xì)的保險杠噴涂工藝流程如圖1所示。
1. 2 噴涂情況的數(shù)據(jù)介紹
選擇2022年6—8月的噴涂數(shù)據(jù),結(jié)合人、機(jī)、料、法、環(huán)5個方面對噴涂情況進(jìn)行分析,選取噴漆房的溫度、噴漆房相對濕度、機(jī)器人、噴涂距離、噴涂流量、旋杯轉(zhuǎn)速、噴涂速度、漆的品牌作為特征屬性。經(jīng)過統(tǒng)計,共有樣本數(shù)據(jù)2 500條,結(jié)合這些數(shù)據(jù)構(gòu)建決策樹模型,從而尋找影響保險杠噴涂質(zhì)量的關(guān)鍵因素。企業(yè)根據(jù)噴涂結(jié)果將合格率劃分為A、B、C 3個檔次。合格率為95%~100%代表A級;合格率為90%~95%代表B級;合格率為75%~90%代表C級。經(jīng)統(tǒng)計,得到部分樣本數(shù)據(jù)見表1。
經(jīng)統(tǒng)計發(fā)現(xiàn),生產(chǎn)線共有6條;“噴涂距離”控制在200~400 mm;“噴涂流量”控制在200~500 mL/min;“旋杯轉(zhuǎn)速”控制在2 000~6 000 r/min;“噴涂速度”控制在0. 2~0. 6 m/s。
1. 3 噴涂環(huán)節(jié)合格率現(xiàn)狀
該公司的林業(yè)運(yùn)輸汽車保險杠采用機(jī)器人噴涂,收集2022年7—12月機(jī)器人噴涂各批次保險杠的一次合格率和總合格率數(shù)據(jù)。數(shù)據(jù)來源于一車間的實際生產(chǎn)記錄,數(shù)據(jù)的具有真實性和實用性,數(shù)據(jù)匯總見表2。
該公司2022年針對林業(yè)運(yùn)輸汽車保險杠的實際生產(chǎn)情況,提出了2022年的產(chǎn)品質(zhì)量要求:一次合格率不低于80%,總合格率不低于95%。由表2可以看出,2022年7—12月份,林業(yè)運(yùn)輸汽車保險杠的一次合格率和總合格率分別是76. 4%和93. 4%,由此可以看出,該公司林業(yè)運(yùn)輸保險杠噴涂合格率均不符合要求。因此,本研究通過對林業(yè)運(yùn)輸保險杠噴涂數(shù)據(jù)結(jié)合噴涂情況進(jìn)行分析,如何有效提高林業(yè)運(yùn)輸汽車保險杠的噴涂合格率,符合產(chǎn)品質(zhì)量要求。
1. 4 數(shù)據(jù)分析
1. 4. 1 影響因素
帕累托(Pareto)圖法是按照各類別數(shù)據(jù)的頻數(shù)多少排序(即根據(jù)頻率降序排列)繪制,并在同一張圖中畫出累積百分比的一種圖表。該圖表是將出現(xiàn)的質(zhì)量問題和質(zhì)量改進(jìn)項目按照重要程度依次排列而采用的一種圖表。帕累托法能迅速、精確地找出影響產(chǎn)品質(zhì)量的關(guān)鍵因素,其設(shè)計原則是通過把許多影響產(chǎn)品質(zhì)量的因素按照其對質(zhì)量的影響程度的大小,用直方圖的次序進(jìn)行排序,找出主導(dǎo)因素[11]。在帕累托圖中,占比在0%~80%的為Ⅰ類主要因素,也是對質(zhì)量產(chǎn)生影響最大的因素,占比在80%~90%的為Ⅱ類次要因素,占比在90%~100%的為Ⅲ類一般因素。
通過對林業(yè)運(yùn)輸汽車保險杠噴涂產(chǎn)品的質(zhì)量檢驗,發(fā)現(xiàn)在噴涂過程中存在顆粒、桔皮、發(fā)花和流掛等問題,將主要問題以及問題數(shù)量匯總?cè)鐖D2所示。
由圖2 可見,顆粒占比64. 3%,桔皮占比13. 0%,顆粒、桔皮累計占比77. 3%,在0%~80%,屬于Ⅰ類主要因素。由此可見這2個因素是導(dǎo)致林業(yè)運(yùn)輸保險杠噴涂合格率不達(dá)標(biāo)的主要影響因素,為此,針對顆粒和桔皮這2 個影響因素分析其產(chǎn)生原因。
1. 4. 2 主要影響因素顆粒和桔皮的原因分析
魚骨圖是一種問題分析與解決工具,通過圖形化的方式,將問題的原因或影響因素按類別整理成魚骨狀分支,幫助人們直觀識別問題的核心及關(guān)聯(lián)因素,從而更有效地找到解決方案,常用于質(zhì)量管理、項目管理等領(lǐng)域的問題分析與改進(jìn)。本研究使用魚骨圖分析法,從5個方面對顆粒、桔皮的品質(zhì)問題進(jìn)行剖析,即人員、機(jī)器、材料、方法和環(huán)境,如圖3和圖4所示。
由圖3和圖4可見,林業(yè)運(yùn)輸保險杠在噴涂生產(chǎn)的過程中,顆粒和桔皮產(chǎn)生的原因均涉及機(jī)器、方法和環(huán)境這4個方面的原因,在桔皮產(chǎn)生的原因中不涉及到人員影響。因此,主要從機(jī)器、方法、環(huán)境、材料4方面來探尋保險杠在噴涂過程中出現(xiàn)質(zhì)量問題的深層次原因。
1. 4. 3 影響因素相關(guān)性分析
根據(jù)魚骨圖的分析,得出影響林業(yè)運(yùn)輸汽車保險杠的涂裝質(zhì)量因素主要是機(jī)械因素、工藝因素、方法因素和環(huán)境因素。因此,從這4個方面中提取噴漆房溫度、噴漆房相對濕度、機(jī)器人噴涂流量、旋杯轉(zhuǎn)速、噴涂距離、噴漆速度、漆的品牌和機(jī)器人8個影響因素進(jìn)行相關(guān)性分析。
首先用直方圖繪制變量分布圖,直方圖可以用于展示數(shù)據(jù)集中各個變量值的分布情況和特征,是最常見的變量分布圖之一,將一車間的實際生產(chǎn)數(shù)據(jù)進(jìn)行匯總,繪制變量直方圖如圖5和圖6所示。
分類變量如“機(jī)器人”和“漆的品牌”屬于分類的字符串,得到變量分布圖如圖6所示。
由圖5和圖6可觀察到各因素均不符合正態(tài)分布,故采用斯皮爾曼(Spearman)相關(guān)系數(shù)對各變量進(jìn)行相關(guān)性分析。Spearman相關(guān)系數(shù)為[-1,1],當(dāng)取值趨近1時,表示2個變量之間存在較強(qiáng)的正相關(guān)關(guān)系;當(dāng)取值逼近-1時,表示2個變量之間存在較強(qiáng)的負(fù)相關(guān)關(guān)系;而值接近0時,則表示相關(guān)性很低[12]。將選取到的因素繪制相關(guān)系數(shù)矩陣圖,如圖7所示。
在相關(guān)性矩陣圖中,顏色越深、數(shù)值的絕對值越大代表相關(guān)性越強(qiáng),反之則相關(guān)性越弱。由圖7可知,各因素之間的相關(guān)系數(shù)都沒有達(dá)到0. 8以上,不存在具有強(qiáng)相關(guān)性的2個因素,所以這些影響因素都可以通過機(jī)器學(xué)習(xí)來建模[13]。
2 決策樹分析
2. 1 決策樹原理
決策樹算法的核心在于構(gòu)造精度高、規(guī)模小的決策樹[14]。采用Breiman提出的一種決策樹生成算法——CART(classification and regression tree)算法,其基本思路就是將特征變量和目錄變量組成的訓(xùn)練樣本進(jìn)行分析并不斷循環(huán),并將其分解為二叉樹的形式[15]?;嵯禂?shù)(Gini Index)是CART 算法中的一個關(guān)鍵參數(shù),決定最優(yōu)檢測變量和劃分門限的關(guān)鍵。直觀來說,基尼指數(shù)是從D組中選擇2組不同類別的樣本所得到的結(jié)果。樣本D的基尼值Gini(D)的表達(dá)式為
式中:pk = Ck/D ,D 為樣本的所有數(shù)量,Ck為第k 類樣本的數(shù)量;k 是一個索引變量,用于遍歷數(shù)據(jù)集D 中所有可能的類別;| y |表示數(shù)據(jù)集D中類別的總數(shù)。
在CART決策樹中,通過計算每個特征的基尼系數(shù),基尼值越小,代表數(shù)據(jù)集的純度越高[16]。選擇具有最小基尼系數(shù)的特征作為決策樹的劃分節(jié)點。這樣可以使得每次劃分后的子數(shù)據(jù)集的純度最高,從而提高決策樹的準(zhǔn)確性。若將樣本集D 按照屬性a 進(jìn)行劃分,則其計算公式為
式中:a 為屬性;D 為樣本的所有數(shù)量;ε 是索引變量,用于遍歷屬性a 的所有可能取值;v 是屬性a 的不同取值的個數(shù)。
將基尼系數(shù)最低的那一組作為分類屬性,依次遞推地調(diào)用其余的屬性,直到全部子數(shù)據(jù)集中的抽樣屬性都是相同的,或子數(shù)據(jù)集內(nèi)已無可分的屬性,便可停止決策樹的分叉。
2. 2 數(shù)據(jù)預(yù)處理
對于分類變量如“機(jī)器人”和“漆的品牌”,其取值并不是連續(xù)的數(shù)字,這種離散型的分類變量不能直接用于模型訓(xùn)練,需要進(jìn)行獨熱(One-Hot)編碼來轉(zhuǎn)換為模型可用的形式。因此,本研究將原始噴涂情況數(shù)據(jù)進(jìn)行處理,見表3。
2. 3 模型運(yùn)行
對原始噴涂質(zhì)量數(shù)據(jù)進(jìn)行預(yù)處理后,為確保模型有足夠數(shù)據(jù)訓(xùn)練,并能在未見數(shù)據(jù)上有效評估其泛化性能,同樣根據(jù)數(shù)據(jù)集的特性和本研究的實際研究問題的需求進(jìn)行模型訓(xùn)練,得到最佳的參數(shù)組合。將數(shù)據(jù)的70%劃分為訓(xùn)練集,另外的30%作為測試集,利用Python軟件,對CART算法進(jìn)行編碼,運(yùn)行結(jié)果如圖8所示。
圖8中,Sample代表該層下的樣本數(shù)量;Value表示在當(dāng)前節(jié)點的樣本中,分別屬于3個類別的樣本數(shù)量有多少;Gini為基尼值;Class為類別。由決策樹圖表中提取到的特定規(guī)則如下。
1)若機(jī)器人噴涂流量小于等于350 mL/min,機(jī)器人②小于等于0. 5,機(jī)器人④小于等于0. 5,立邦品牌漆小于等于0. 5,那么保險杠的噴涂質(zhì)量處于等級C。
2)若機(jī)器人噴涂流量小于等于350 mL/min,機(jī)器人②大于0. 5,那么保險杠的噴涂質(zhì)量處于等級B。
3)若機(jī)器人的噴涂流量大于350 mL/min,噴漆房溫度小于等于25. 5 ℃,機(jī)器人②小于等于0. 5,機(jī)器人④小于等于0. 5,那么保險杠的噴涂質(zhì)量處于等級C。
主要規(guī)則在此處列出,其他不再詳細(xì)敘述。
2. 4 模型測評
本研究對訓(xùn)練結(jié)果進(jìn)行測評,得到接收者操作特征曲線(Receiver Operating Characteristic,ROC)曲線圖。ROC曲線是在機(jī)器學(xué)習(xí)中二分類問題常用的結(jié)果可視化方法,根據(jù)預(yù)測結(jié)果作為可能的判斷閾值,其曲線下面積(area under the curve,AUC)作為預(yù)測精度的評估指標(biāo),取值范圍[0,1]。AUC越大,即曲線越靠近左上角,說明模型性能越好[17]。
應(yīng)用Python運(yùn)行代碼后,得到關(guān)于保險杠訓(xùn)練集和測試集數(shù)據(jù)的ROC曲線,如圖9所示。
在訓(xùn)練集上,該決策樹模型獲得了較為優(yōu)異的性能。具體而言,模型在訓(xùn)練集上的AUC指標(biāo)達(dá)到0. 964 6,在獨立的測試集上,模型同樣表現(xiàn)出色,測試集上的AUC達(dá)到0. 961 6,說明模型對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的判別能力較強(qiáng)。由此可以看出,該決策樹模型在經(jīng)過嚴(yán)格的訓(xùn)練和測試后,其性能指標(biāo)全面優(yōu)異,有著良好的分類精度、穩(wěn)定性和泛化能力。通過對關(guān)鍵結(jié)果指標(biāo)的多角度考量分析,可以判斷該決策樹分類模型是高度有效的。
2. 5 結(jié)果分析
CART算法通過選擇基尼系數(shù)作為特征標(biāo)準(zhǔn),遞歸地對數(shù)據(jù)進(jìn)行二元切分。從該決策樹可見,選擇的特征都是數(shù)值型變量,采用數(shù)值型的二分割點進(jìn)行遞歸劃分。本研究構(gòu)建的決策樹模型共有5層,23個節(jié)點。
1)機(jī)器人噴涂流量作為關(guān)鍵節(jié)點,由此可知噴涂流量是影響保險杠質(zhì)量的關(guān)鍵要素。選定標(biāo)準(zhǔn)為350 mL/min,此時基尼指數(shù)為0. 661,樣本標(biāo)簽分為3類,數(shù)量分別為568、682、500。噴涂流量對于等級的影響作用很大,噴涂流量不低于350 mL/min,則能確定等級較好。
2)決策樹的第2 層節(jié)點為噴漆房溫度和機(jī)器人,說明這兩者對等級的決定因素較大。噴漆房溫度作為下一重要節(jié)點進(jìn)行劃分,此時3類標(biāo)簽數(shù)量分為568、103、311。若噴漆房溫度小于25. 5 ℃,則產(chǎn)品等級會受到影響。因此,應(yīng)將保險杠噴涂放置在溫度在25. 5 ℃以上的車間內(nèi),則產(chǎn)品會獲得更好的等級。由圖8可以看出,機(jī)器人②和機(jī)器人④的生產(chǎn)質(zhì)量較高,經(jīng)由機(jī)器人②和機(jī)器人④得到的產(chǎn)品會獲得較高的等級,因此應(yīng)對其他機(jī)器人進(jìn)行改善以此提高噴涂質(zhì)量。
3)決策樹的第3層節(jié)點為漆的品牌和噴漆房相對濕度。由一車間的生產(chǎn)數(shù)據(jù)可知使用立邦漆得出的保險杠噴涂質(zhì)量的品質(zhì)較差,使用立邦噴漆的產(chǎn)品通常不會獲得較好的等級。此外,噴漆房的相對濕度也會對產(chǎn)品質(zhì)量產(chǎn)生影響。根據(jù)決策樹,相對濕度小于65. 5%通常會導(dǎo)致產(chǎn)品等級較低。
綜上,根據(jù)決策樹模型圖可以得出,噴涂流量大于350 mL/min、溫度大于25. 5 ℃、機(jī)器人②和機(jī)器人④、非立邦品牌的漆、噴漆房相對濕度大于65. 5%是對產(chǎn)品質(zhì)量的主要保障因素,對于在其他環(huán)境下進(jìn)行噴涂的保險杠,應(yīng)主要從噴涂流量、噴漆房溫度、機(jī)器人、漆的品牌和噴漆房相對濕度這5方面入手來優(yōu)化生產(chǎn)安排,從而對保險杠的噴涂質(zhì)量進(jìn)行提高。
3 結(jié)論
基于CART算法對保險杠噴涂過程中的各項數(shù)據(jù)進(jìn)行了分析,研究了林業(yè)運(yùn)輸汽車保險杠的噴涂質(zhì)量控制,得到了以下幾個方面的結(jié)論。
1)對某公司實際林業(yè)運(yùn)輸汽車保險杠合格率進(jìn)行統(tǒng)計,對噴涂生產(chǎn)過程中出現(xiàn)的故障問題進(jìn)行統(tǒng)計分析,得出桔皮和顆粒是影響保險杠噴涂質(zhì)量最大的2個因素。
2)結(jié)合人、機(jī)、料、法、環(huán)5個方面,通過變量相關(guān)性分析方法,識別出噴涂流量、旋杯轉(zhuǎn)速、噴涂速度、噴涂距離、噴漆房溫度、噴漆房相對濕度、機(jī)器人、漆的品牌都會對保險杠噴涂質(zhì)量造成影響。
3)運(yùn)用基于CART算法的數(shù)據(jù)分析方法,將數(shù)據(jù)挖掘運(yùn)用到保險杠的噴涂質(zhì)量控制中,得到了在影響質(zhì)量的各種要素中,噴涂流量、噴漆房溫度、噴漆房相對濕度、機(jī)器人和漆的品牌是影響保險杠質(zhì)量的最關(guān)鍵的4個因素。
4)通過采用大數(shù)據(jù)挖掘方法對各方面影響保險杠噴涂質(zhì)量的因素進(jìn)行程度分析,揭示了各種質(zhì)量數(shù)據(jù)之間的內(nèi)在聯(lián)系,為實現(xiàn)保險杠噴涂質(zhì)量的有效控制奠定基礎(chǔ)。
研究表明本研究所采用的CART算法具有一定的可行性和準(zhǔn)確性,能夠?qū)具M(jìn)行保險杠噴涂的質(zhì)量數(shù)據(jù)做出判別,可以運(yùn)用在質(zhì)量數(shù)據(jù)分析方面,在研究過程中發(fā)現(xiàn)CART算法還可以和其他機(jī)器算法相結(jié)合以提高模型精度,下一步將優(yōu)化算法,擴(kuò)大算法的使用范圍,為企業(yè)生產(chǎn)質(zhì)量控制提供有力的技術(shù)支持。
【參 考 文 獻(xiàn)】
[1] 張子成,王超,梁剛,等. 在原油中老化的螺桿泵定子氫化丁腈橡膠膠料的性能變化研究[J]. 橡膠工業(yè),2024,71(2):95-100.
ZHANG Z C,WANG C,LIANG G,et al. Study on variationsof properties of HNBR compounds for stator of screwpump aged in crude oil[J]. China Rubber Industry,2024,71(2):95-100.
[2] 覃榮艷. 軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)的方法研究[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023(12):54-55.
TAN R Y. A methodological study on the application ofdata mining techniques in software engineering[J]. NetworkSecurity Technology amp; Application,2023(12):54-55.
[3] 王曉丹,汪惠芬,柳林燕. 數(shù)據(jù)驅(qū)動下汽車注塑零部件的質(zhì)量控制研究[J]. 內(nèi)燃機(jī)與配件,2021(14):173-176.
WANG X D,WANG H F,LIU L Y. Data-driven qualitycontrol research for automobile injection products[J]. InternalCombustion Engine amp; Parts,2021(14):173-176.
[4] WANG L,ZHANG Z,LONG H,et al. Wind turbine gearboxfailure identification with deep neural networks[J].IEEE Transactions on Industrial Informatics,2017,13(3):1360-1368.
[5] 卜曉陽,蔡巖,王宗偉,等. 基于C5. 0決策樹算法的電力營銷數(shù)據(jù)挖掘[J]. 微型電腦應(yīng)用,2022,38(1):23-26.
BU X Y,CAI Y,WANG Z W,et al. Electric power marketingdata mining based on C5. 0 decision tree algorithm[J].Microcomputer Applications,2022,38(1):23-26.
[6] JIANG W Y. Applying data mining with a new model oncustomer relationship management systems: a case of airlineindustry in Taiwan[J]. Transportation Letters,2014,6(2):89-97.
[7] 謝鑫,張賢勇,楊霽琳. 鄰域等價關(guān)系誘導(dǎo)的改進(jìn)ID3決策樹算法[J]. 計算機(jī)應(yīng)用研究,2022,39(1):102-105,112.
XIE X,ZHANG X Y,YANG J L. Improved ID3 decisiontree algorithm induced by neighborhood equivalence relation[J]. Application Research of Computers,2022,39(1):102-105,112.
[81] 潘永生,莊天戈. 決策樹算法及其在乳腺疾病圖像數(shù)據(jù)挖掘中的應(yīng)用[J]. 計算機(jī)應(yīng)用研究,2002,19(9):78-79,145.
PAN Y S,ZHUANG T G. Decision tree and its applicationin the data mining of breast disease images[J]. ApplicationResearch of Computers,2002,19(9):78-79,145.
[9] 周康渠,肖燕,龔立雄,等. 汽車精益生產(chǎn)物流設(shè)計與管理[M]. 北京:機(jī)械工業(yè)出版社,2012.
ZHOU K Q,XIAO Y,GONG L X,et al. Automotive leanmanufacturing logistics design and management[M]. Beijing:China Machine Press,2012.
[10] 張明. 乘用車塑料涂裝保險杠的涂裝成本研究[D]. 上海:上海交通大學(xué),2010.
ZHANG M. Study on the painting cost of plastic bumperof passenger car[D]. Shanghai: Shanghai Jiao Tong University,2010.
[11] 馬杰. 中國轎車企業(yè)生產(chǎn)過程中的品質(zhì)管理策略研究[J]. 經(jīng)濟(jì)研究導(dǎo)刊,2018(26):22-40.
MA J. Research on quality management strategies in theproduction process of Chinese car enterprises[J]. EconomicResearch Guide,2018(26):22-40.
[12] 吳娟,朱躍龍,金松,等. 三種機(jī)器學(xué)習(xí)模型在太湖藻華面積預(yù)測中的應(yīng)用[J]. 河海大學(xué)學(xué)報(自然科學(xué)版),2020,48(6):542-551.
WU J,ZHU Y L,JIN S,et al. Area prediction of cyanobacterialblooms based on three machine learning methods inTaihu Lake[J]. Journal of Hohai University(Natural Sciences),2020,48(6):542-551.
[13] 侯霖莉,吳松,易建洲,等. 基于機(jī)器學(xué)習(xí)的綠泥石微量元素判別礦床類型[J]. 地球科學(xué),2024,1-24.
HOU L L,WU S,YI J Z,et al. Discriminating deposittypes using chlorite trace elements based on machinelearning[J]. Earth Science,2024: 1-24.
[14] BREIMAN L I,F(xiàn)RIEDMAN J H,OLSHEN R A,et al.Classification and Regression Trees(Wadsworth Statistics/Probability)[J]. Biometrics,1984,40(3):358.
[15] 董紅瑤,王弈丹,李麗紅. 隨機(jī)森林優(yōu)化算法綜述[J].信息與電腦,2021,33(17):34-37.
DONG H Y,WANG Y D,LI L H. A review of random forestoptimization algorithms[J]. Information amp; Computer,2021,33(17):34-37.
[16] 杜春蕾,張雪英,李鳳蓮. 改進(jìn)的CART算法在煤層底板突水預(yù)測中的應(yīng)用[J]. 工礦自動化,2014,40(12):52-56.
DU C L,ZHANG X Y,LI F L. Application of improvedCART algorithm in prediction of water inrush from coalseam floor[J]. Journal of Mine Automation,2014,40(12):52-56.
[17] 榮楚君,曹曉光,白相志. Facet方向?qū)?shù)特征與稀疏表示相結(jié)合的紅外弱小目標(biāo)檢測算法[J]. 中國圖象圖形學(xué)報,2018,23(11):1768-1776.
RONG C J,CAO X G,BAI X Z. Infrared small target detectionalgorithm based on derivative characteristics ofFacet combined with sparse presentation[J]. Journal ofImage and Graphics,2018,23(11):1768-1776.
基金項目:黑龍江省自然科學(xué)基金(LC201407)。