栗仕強,臧陽陽,梁昭磊,汪啟華
(中國航空綜合技術研究所,北京 100028)
產品質量已經成為產品核心競爭力的重要體現,產品質量的波動由制造過程多種因素共同影響,使得人們對制造過程質量影響因素的監(jiān)控、分析有極大需求[1,2]。因此,通過對制造過程質量影響因素的數據采集、整理和存儲,構建合理、高效的制造質量數據集,為數據驅動的質量分析方法提供數據基礎,對于提升產品質量具有重要作用[3]。
本文中制造質量數據集指產品制造過程中與產品質量特性形成相關的過程因素數據和檢驗檢測數據,包含人、機、料、法、環(huán)和測等。目前,制造質量數據集的構建具有以下關鍵共性難題:一是質量數據收集的完整性較差,傳統(tǒng)制造過程數據面向生產任務收集,而非以質量分析為目的,部分質量因素沒有受到關注;二是存在“數據孤島”現象,難以集成和共享[4],制造質量數據一般存儲在不同業(yè)務部門,可能采用不同的分類編目方法,造成了數據定義的不一致;由于不同的業(yè)務需要和信息化建設水平,普遍存在紙質文檔、電子文檔、數據庫系統(tǒng)等共存的現象,造成了存儲形式的不一致[5]。三是制造質量數據的可利用性較低,數據的整理分析工作存在欠缺,不同的數據采集方式使得數據整理方法不同,需要系統(tǒng)的開展質量數據的分類及關聯性分析工作。
近年來,質量數據集構建引起了工業(yè)界和學術界廣泛關注。各領域制造企業(yè)開始規(guī)劃布局工業(yè)互聯網、物聯網、5G基建等基礎設施,為制造過程數據的采集、融合、存儲及互聯互通提供了資源基礎[6];西門子、阿里巴巴、華為、航天云網等企業(yè)也一直致力于構建工業(yè)領域大數據集的云平臺,為基于數據服務的故障分析、質量監(jiān)控、反饋優(yōu)化等提供了平臺基礎[7]。目前針對質量數據集構建研究已有部分進展,唐曉青等[8]建立了以產品物料清單(BOM)為組織管理形式的面向產品全壽命周期的質量數據模型,實現了產品全壽命周期質量數據的初步集成。溫明川等[9]采用了基于制造執(zhí)行系統(tǒng)(MES)的裝配質量數據管理系統(tǒng),實現了質量數據的初步集成。劉明周等[10]提出了以品質物料清單為基礎的質量數據管理方法,較好實現了質量數據有效、有序的組織??傮w來說,大多數方法僅針對特定應用場景,對質量數據的整理分析不夠系統(tǒng),對影響制造過程產品質量的因素關聯性和完整性考慮不足。
因此,本文提出用于質量分析建模為目的的制造過程質量數據集構建流程和方法,為復雜產品制造過程質量分析和管控提供數據基礎。
制造過程質量數據不僅來源于產品的制造階段,還應包括前期論證、設計、研制、實驗和運維等質量信息,這些數據通常分布于不同的信息系統(tǒng)和部門,如圖1所示。
圖1 不同過程制造質量數據來源
前期論證及設計階段的質量信息在構建質量數據集時需要適時考慮。如在前期論證以及設計階段已經明確的關鍵質量特性信息。
制造階段是質量數據的主要來源,結合復雜產品制造過程劃分階段,主要包括原材料數據、生產工藝過程數據、試驗檢測數據以及包裝與交付數據等。
產品使用階段暴露出的質量問題通常需要反饋到產品設計與制造過程中,促進產品的改進和優(yōu)化,這些質量信息同樣需要收集和整理,它們能夠為產品質量的深度分析提供有效的數據支撐。
另外,部分經驗數據、歷史質量數據分析結果以及實驗設計數據等對產品質量產生重要影響,這些數據同樣不可忽略。
結合制造過程質量數據的來源,以生產過程為主線,借助“5M1E”方法,分別從過程維度、質量影響因素維度、數據存儲維度展開梳理制造過程質量影響因素和質量特性指標,并通過過程因素的實例化,形成具體產品的制造過程質量數據要素集合,如圖2所示。
圖2 制造過程質量數據集組成要素
1)過程維度。結合產品論證、設計和使用過程信息,對產品制造過程各類信息進行梳理,形成質量數據集組成要素,主要包括產品類數據、時間類數據、組織類數據、工藝設計類數據、加工制造類數據。
2)質量影響因素維度?;谥圃霣OM和制造質量BOM信息展開,對零部件產品加工過程和產品裝配過程從“5M1E”等較為系統(tǒng)的選取制造過程質量影響因素[11,12],包括制造人員信息、設備信息、加工數據、物料質量信息、方法質量信息、環(huán)境信息、測量信息,系統(tǒng)的明確質量數據集組成要素以及數據采集項的數據類型、采集頻率、樣本量大小和數據格式等要求。
3)數據存儲維度。結合質量數據存儲形式和位置,進一步清晰明確質量數據集組成要素,數據存儲維度包含:接入質量數據,如MES、產品數據管理系統(tǒng)(PDM)、實驗數據管理系統(tǒng)(TDM)、全面質量管理系統(tǒng)(TQM)等;生產線設備自動生成或手工輸入數據,如經驗數據、紙質記錄數據、excel/word/txt/rpt等非結構化文本數據等。
為了適應制造過程不同的加工形式、人力、成本、進度等要求,質量數據的采集方式是多樣的,人工記錄與設備自動記錄方式并存。根據采集的手段以及存儲形式,可將采集方式分為:人工記錄方式、移動終端自動識別方式和設備終端自動采集方式三大類。
1)人工記錄。部分加工過程受制于工藝與過程因素需要,仍采用手工記錄方式進行數據采集,它們通常以紙質的形式存儲。這種方式較為直接方便,易于管理,但是采集效率低,實時性較差并且數據精度難以保證,在后續(xù)數據建模和質量問題溯源時需要花費較大精力進行集成和校對。
2)移動終端自動識別。條形碼、RFID以及手持等方式的數據識別與采集,實現了數據的自動采集、存儲和管理。這種方式較為高效、準確和穩(wěn)定,且成本低廉,加工車間工人可將設備采集到的信息通過以太網傳遞給數據庫,但這種方式存在編碼信息污損、人工參與等帶來的誤檢或漏檢。
3)設備終端自動采集。這種方式在制造過程質量管控活動中廣泛使用,它們能實現數據的實時采集,采集數據量較大,一般需要數據特征提取和變換才能用于建模。
在進行制造質量數據集組成要素采集時,需要結合實際質量數據分析和檢測效率的需要,綜合采用不同的數據采集方式,以提高數據采集的準確度和穩(wěn)定性。
實際制造過程數據易受到外部干擾,直接采集數據的準確性和適用性難以保證,一般不能直接用于產品質量分析與建模,通常需要對采集的數據進行預處理。
1)數據異常值處理
數據異常值處理是去除數據集中的干擾數據并修正異常數據,以提高質量數據集的準確性和適用性。不同采集方式和存儲形式帶來的數據異常類型不一樣,手工記錄方式獲得的紙質、光盤等數據,可能存在空值、漏讀、誤讀、孤立點等問題,在構建質量數據集時需要進行數據檢驗和數據填補;自動采集數據受工作環(huán)境的影響,存在噪聲等干擾,在構建質量數據集時一般需要進行濾波、降噪、平滑等數據清洗工作。結合不同異常類型需要采取針對性的處理方法,主要的處理措施如表1所示。
表1 異常數據處理措施
2)數據可信度檢驗
數據是測量的結果,測量系統(tǒng)的波動過大會造成數據本身的可信度降低,使得質量分析模型結果不準確。因此,在質量數據采集之前,需要對數據采集系統(tǒng)進行測量系統(tǒng)分析與評價,了解度量錯誤對數據采集的影響,并對造成測量系統(tǒng)波動的問題進行修正。
測量系統(tǒng)分析需評價數據結果的準確性和精確性。針對計量型測量系統(tǒng),需要對測量系統(tǒng)開展穩(wěn)定性、偏倚、線性以及重復性和再現性等分析,通常采用作圖法、方差分析法、極差法等;針對計數型測量系統(tǒng),一般從系統(tǒng)的有效性、漏判率、誤判率等方面進行分析,通常采用假設檢驗方法、交叉表等來確定。
產品質量特性是多個制造過程因素共同作用、相互影響的結果,制造過程因素通過影響零部件質量特性從而影響產品的綜合質量特性。在進行制造質量數據集的構建時,為了便于質量數據的分析和理解,需要考慮制造過程因素之間的影響關系以及制造過程因素與產品質量特性的映射關系,實現產品制造質量數據從分散到集成、從無序到有序,提高質量數據的交互性和應用性。
1)制造過程因素之間的關聯關系
產品制造質量數據不僅存在因分散在不同的生產部門和信息系統(tǒng)中導致的數據冗余,而且存在由于數據之間相互影響導致的屬性冗余。在構建質量數據集時通過分析過程因素之間的關聯關系,形成產品過程因素影響關系鏈,完成制造過程冗余質量因素的識別、判定和處理。
在判定冗余質量因素時,重點從因果關系、時間序列關系、前后銜接關系、層次關系等展開,并結合工程機理、工藝經驗和數據特征,采取針對性的關聯關系分析方法。對于數據量較少的過程因素、經驗數據等,常采用DEMATEL方法、模糊函數、通用生成函數等方法[13,14];對于數據量較大的統(tǒng)計數據,常采用主成分分析、獨立成分分析、多元回歸分析、相關性分析、頻繁模式挖掘以及因子分析等方法。
在構建質量數據集時,對于冗余因素,根據實際建模需求,選擇合理的因素予以刪除;對于具有相關關系的因素集,可根據數學關系或機理關系進行因素變換。
2)制造過程因素與產品質量特性的映射關系
當產品性能出現質量問題時,為了能夠追溯具體的制造過程因素,需要構建制造過程因素與產品質量特性的映射關系,打通制造過程影響因素與產品質量特性之間的“壁壘”。
制造過程因素與產品質量特性的映射關系包含兩個層級,如圖3所示。一是工藝過程因素與零部件質量特性之間的映射,實現工序級過程因素到零部件質量特性的傳遞。主要梳理制造過程各因素對零部件質量特性形成過程的影響關系,一般需要對時間信號、空間信號等進行特征提取,例如,表面粗糙度指標是受機床在一段時間內的加工信號影響的,加工過程因素與粗糙度指標是“多對一”的映射關系。二是零部件質量特性與產品質量特性的映射,實現零部件級質量特性到產品質量特性的傳遞。主要分析零部件到產品的組成關系,從而形成質量特性傳遞鏈,例如,汽輪機主軸的表面粗糙度對汽輪機的旋轉精度、運行平穩(wěn)性以及可靠性等產生重要影響,主軸表面粗糙度和汽輪機運行性能是“一對一/多”的映射。
圖3 制造過程因素與產品質量特性的映射關系
從目前產品制造過程的質量分析需求、制造業(yè)信息化現狀、管理現狀、數據現狀出發(fā)[15,16],本文提出質量數據集管理平臺的功能架構包含基礎模塊、數據采集模塊、數據預處理模塊、數據應用功能模塊、數據可視化模塊五部分,如圖4所示。
圖4 系統(tǒng)功能架構圖
基礎模塊:包含用戶管理、權限管理、數據庫管理、工作流管理、菜單管理、日志管理等,實現系統(tǒng)級、用戶級的個性化配置。
數據采集模塊:包含數據編碼管理、數據配置、數據集成管理等,對數據元素進行描述,形成完整的數據信息,實現從人工檢測、傳感器采集、數字化掃描檢測、現場終端采集、ERP/MES系統(tǒng)等的數據接入和管理。
數據預處理模塊:包含空值檢測與處理算法、異常值檢測與處理算法等,實現質量數據的過濾與清洗。
數據應用功能模塊:包含數據變換、數據特征變換和提取、關聯關系分析、數據集組成要素動態(tài)管理、綜合查詢等,滿足數據的多樣化應用需求。
數據可視化功能模塊:包含報表管理功能、圖表管理功能、原型分享功能等。幫助用戶直觀的分析數據,方便多人合作了解數據規(guī)律。
依據前文研究所提出的質量數據集構建流程,該平臺在某航空高精度產品裝配過程中進行了應用。該航空產品涉及機械學、光學、電子科學、力學等多門學科。其裝配過程產生大量的過程數據和檢驗檢測數據,包含人員、設備、工裝、檢驗、工藝、制造和質量管理等,數據存儲分散、類型多樣且相互關聯。
首先,梳理該航空產品裝配過程工序57道,形成了產品維、工藝設計維、時間維和組織維的多維數據結構,獲得了數據集組成要素包括零件耗損、制造設備、檢驗設備等,明確了該產品質量數據集組成要素。
接下來,以該航空產品編號為索引,主要采集的質量數據有PDM、TDM、MES、TPS、PMIS、FMEA等系統(tǒng)數據,以及word/excel/txt/rpt等非結構化數據,形成了核心工藝參數記錄700萬條,單個產品的數據屬性2000多條,其中結構化數據2G左右,非結構化數據4G左右;在數據預處理時,發(fā)現并修正空值異常數據2500多條,檢測的異常值將近4000條,改進和修正數據采集方法和工具37處。
繼而,通過頻繁模式挖掘算法、層次分析等方法構建了制造過程因素之間的關聯關系和單個產品與2000多條數據的映射關系,形成了22個元數據模型,建立了該航空產品與加工過程質量特性的傳遞鏈。
最后,開發(fā)了該航空產品的制造質量數據集管理平臺,實現了數據的信息化管理,固化了制造質量數據產生、采集、錄入、檢測、清洗和檢驗等數據集構建流程。
本文針對目前質量數據收集不完整、采集準確性有待提高、質量數據可用性差的現狀,提出了面向制造過程質量分析與建模的數據集總體構建流程。分析了制造過程質量數據的來源,明確了質量數據集要素組成;研究了與不同數據采集方式相匹配的預處理方法;探討了過程因素間的關聯關系以及過程因素與產品質量特性的映射關系分析方法;最后提出了產品質量數據集管理平臺構建方法,并成功應用于某航空產品裝配過程的質量數據管理中,為制造過程質量分析與管控、質量預測、質量評估、質量問題追溯提供了數據支撐。