何釗
摘要:文章通過研究面向飛機機翼強度可靠性設計與驗證數據的收集、管理、分析、挖掘技術,構建相應強度數據新的處理模式,從微觀至宏觀對強度數據進行統(tǒng)計、分析、綜合和預測,掌握飛機典型結構的剛度變化規(guī)律及強度計算方法。突破強度大數據的處理、挖掘、可視化等關鍵技術,挖掘強度數據之間的相互關聯(lián)關系,為飛機研制全生命周期的各個階段提供技術支撐。
關鍵詞:數據挖掘;大數據;強度試驗
中圖分類號:TP273文獻標志碼:A
0引言
本論文通過研究面向機翼強度可靠性設計與驗證數據的收集、管理、分析、挖掘技術,構建相應強度數據新的處理模式,從微觀至宏觀對強度數據進行統(tǒng)計、分析、綜合和預測,掌握飛機典型結構的剛度變化規(guī)律及強度計算方法,形成飛機強度分布式數據倉庫;突破強度大數據的處理、挖掘、可視化等關鍵技術,挖掘強度數據之間的相互關聯(lián)關系,為飛機研制全生命周期的各個階段提供技術支撐。
1背景
1.1強度試驗大數據現(xiàn)狀
中國飛機強度研究所(以下簡稱“強度所”)作為我國航空工業(yè)唯一的飛機強度研究、驗證與鑒定中心,掌握了幾乎全部的飛機強度試驗數據以及強度試驗所產生的相關數據。這些圍繞著飛機強度試驗所產生的數據除了具備了基本的大數據4V特征之外,還具有其特有的強度數據特征。
1.1.1結構化數據與非結構化數據并存
在強度試驗研究中,對于強度試驗數據的精確性要求是十分高的,在任何階段產生的數據都需要真實、完整、可靠。這就需要強度結構化數據對飛機強度試驗的全生命周期無障礙互通,對強度試驗進行科學、理論、可度量的數據管理[1]。在強度試驗過程中又包含了大量的非結構化數據,根據現(xiàn)有強度所數據類型分析可得,大約有75%的強度試驗產生的數據為非結構化數據。這些非結構化數據無法利用傳統(tǒng)數據庫管理的方法進行分析處理,只有利用大數據思想的新型數據倉庫才能對其進行科學可靠完整的數據管理。
1.1.2強度數據的復雜性
飛機強度試驗是一項復雜的系統(tǒng)工程,其中蘊含了靜強度試驗、動強度試驗、疲勞試驗、熱強度試驗、噪聲試驗、氣候環(huán)境試驗等多專業(yè)工程試驗方法,復雜多變的現(xiàn)場試驗環(huán)境以及強度試驗的復雜功能工程模型。其復雜性決定了傳統(tǒng)數據庫管理方法遠遠不能滿足對強度數據的管理[2-3]。因此,構建滿足強度試驗數據管理要求的,利用大數據管理思路的分布式數據倉庫是飛機強度大數據挖掘與應用平臺的基礎組成部分。
1.2強度試驗大數據需求
強度試驗大數據應針對包含歷史數據在內的強度數據的綜合管理,并為平臺的大數據分析以及數據挖掘作基礎,滿足強度大數據的綜合分析、挖掘、處理的要求,實現(xiàn)強度試驗數據的持久積累與智能管理。本次強度試驗大數據需求如下:
1.2.1基于模型的強度數據管理
基于強度所各專業(yè)方向、各試驗類型相融合的分布式數據倉庫,利用模型統(tǒng)一管理策劃階段、設計階段、試驗階段、分析階段和試驗總結階段所產生的數據,本平臺數據倉庫主要構建了3個模型,實現(xiàn)強度試驗數據的全收集。
強度數據模型:強度數據模型是強度數據倉庫的核心模型,管理以試驗件數據、物理試驗數據、虛擬試驗數據以及輔助試驗進行的音視頻數據為主體的試驗核心數據,其數據特點為包含大量圍繞強度試驗三維可視化展現(xiàn)的三維模型;設計試驗階段物理虛擬試驗數據多為標準化與結構化數據;輔助試驗數據多為非結構化數據。
試驗環(huán)境模型:試驗環(huán)境模型主要管理強度試驗條件數據、位置數據、試驗準備數據、試驗設備數據和試驗人員數據等??勺鳛橹笤囼瀳鼍翱梢暬臄祿A。其特點為圍繞強度試驗的環(huán)境要素構建的環(huán)境模型,包含大量的環(huán)境三維數據,用于三維可視化應用。
試驗現(xiàn)場監(jiān)測模型:試驗過程模型依照試驗現(xiàn)場監(jiān)測體系要求,描述強度試驗過程中所產生的質量控制數據以及現(xiàn)場采集監(jiān)控數據。其特點是多為非機構化數據,但是檢測過程均需遵循試驗標準化規(guī)范要求;健康監(jiān)測數據主要為試驗現(xiàn)場故障檢測作基礎。
1.2.2分布式存儲管理
強度分布式數據倉庫借用Hadoop大數據技術思想中MapReduce計算框架,實現(xiàn)并行分片、并行存取。以Hadoop的分布式文件系統(tǒng)HDFS作為系統(tǒng)基礎[4-5]。建立元數據接口,對強度數據進行結構化的描述,規(guī)定強度數據的組織特征與屬性,覆蓋強度大數據全生命周期。設計標準化的元數據接口,將強度大數據關聯(lián)起來,形成強度分布式數據倉庫,實現(xiàn)強度試驗結構化數據以及非結構化數據的高效存儲、管理以及備份功能,滿足強度大數據的通用化數據訪問、數據分析、數據挖掘、數據備份以及管理的應用需求。
1.2.3強度大數據全生命周期管理
強度試驗數據管理一方面需要強度試驗的全過程數據管理一體化,即完成強度試驗的全生命周期,確保強度試驗數據信息的可追溯性。另一方面,強度試驗數據需要覆蓋強度試驗的全過程之外,還要與飛機設計數據、制造數據以及試飛數據進行對接,形成完整的、一致的飛機研制全生命周期數據倉庫。建立飛機研制的全生命周期數據管理,保證飛機研制全過程的試驗數據流轉、一致性以及完整性,為未來的飛機研制全過程大數據分析與挖掘作基礎。
1.2.4支持大數據分析與挖掘應用與云計算
強度分布式數據倉庫具備分析效率高、數據質量高、拓展性高的特點,不僅可以提供高效的海量數據保存,也為之后的大數據分析與挖掘甚至未來的云計算提供保障。
2研究方法
2.1強度數據表征技術研究
航空結構的飛機強度大數據是一個系統(tǒng)工程,涉及航空結構的設計、制造、試驗、試飛等眾多部門。對于飛機強度大數據來說,具有其自己的屬性。第一,數據處理時的高時效性,在強度試驗現(xiàn)場,需要對大量的測量數據進行實時處理和判斷,保證試驗的正常順利進行,不使飛機結構出現(xiàn)意外損傷或破壞,保證了經濟性。第二,非結構化數據的量遠大于結構化的數據,結構化數據為飛機強度試驗測量得到的數據,其數量并不大,但研究價值和意義深遠[2-3],其他為大量的非結構化數據,需要將其與結構化的數據一起進行挖掘,發(fā)現(xiàn)規(guī)律,為未來預測提供支持。第三,結構強度面臨的專業(yè)較多,即使是結構化的數據,其特征和意義也需要分別對應研究。第四,強度試驗數據一般具有明顯的正常和異常表征形式,一旦結構發(fā)生屈曲或共振,對應的應變曲線出現(xiàn)明顯拐折或者對應的振幅突變;試驗現(xiàn)場中的異常聲響、裂紋擴展等,都可以利用基本的數據特征進行表征。這些特征為關聯(lián)規(guī)則的挖掘提供了豐富的數據。
目前,試驗現(xiàn)場的狀態(tài)監(jiān)控數據來源主要為試驗件上應變片、傳感器等測量設備的測量參數,而這些測量參數隨著現(xiàn)有試驗規(guī)模的不斷增大以及試驗設備、測量手段的不斷更新,現(xiàn)場狀態(tài)數據的類型與數據量呈現(xiàn)越發(fā)龐大的趨勢,具備大數據分析的條件。本部分將構建試驗現(xiàn)場大數據源,以多來源多種類數據為基礎,通過歷史事件匹配、失效模式判斷、故障現(xiàn)象,形成試驗異常監(jiān)控的前兆信息,用ARMA時序模型對試驗前兆數據進行擬合及預測;利用變量R聚類的數據挖掘方法對前兆子數據之間的相似性進行度量,為試驗異常判別提供依據[4-5]。
2.1.1試驗件多來源現(xiàn)場監(jiān)測數據關聯(lián)
對試驗件現(xiàn)場監(jiān)測相關數據建立大數據模型。將設計載荷、試驗載荷等數據關聯(lián)至現(xiàn)場監(jiān)測大數據模型中,對于現(xiàn)場測量設備數據源進行大數據模型歸納分析,作為實時監(jiān)測的數據依據。?2.1.2試驗數據實時監(jiān)測、評估
試驗過程中對現(xiàn)場測量數據,實現(xiàn)實時監(jiān)測與評估。對現(xiàn)場狀態(tài)進行實時的監(jiān)測與評估,對可能出現(xiàn)的問題實現(xiàn)提前預判與診斷分析。實現(xiàn)試驗狀態(tài)識別科學化、理論化,形成強度知識體系。
2.1.3聲響定位與診斷
飛機結構在加載過程中,會出現(xiàn)各種各樣的聲響異常。常規(guī)方法基本屬于事后檢測,對試驗過程中出現(xiàn)的各種聲響,無法完全判斷其來自何處、是否由結構損傷引起。因此,常規(guī)檢測具有一定局限性和盲目性,極易忽略結構中非薄弱部位的損傷。聲發(fā)射作為一種動態(tài)、被動損傷監(jiān)測技術可全程對結構實時監(jiān)測,可及時發(fā)現(xiàn)損傷并定位,了解結構損傷的產生和擴展,為判定飛機結構安全性和準確定壽提供科學依據。通過數據挖掘技術,對聲發(fā)射所獲得的各類信號進行分析挖掘,及時有效的判斷損傷發(fā)生部位和損傷形式。根據監(jiān)控的信號,預測可能發(fā)生結構損傷情況,提前預警顯示。
2.2強度大數據處理及挖掘技術
地面強度試驗作為飛機研制全生命周期的第三階段,利用各類試驗技術,模擬真實的飛行狀態(tài),而強度大數據是首飛前飛機強度最全面、最真實的評價指標。這些數據信息不僅直接為首飛試驗提供鑒定、定型依據,而且對飛機及其系統(tǒng)的改進、改型或科學研究具有較大研究價值。強度大數據處理與挖掘應結合強度所各專業(yè)發(fā)展,提升強度試驗數據的挖掘分析處理能力。
數據挖掘技術是多學科交叉的新興技術,對強度大數據進行科學、理論的探索與分析,解釋強度大數據中的隱藏的、未知的規(guī)律性,將其進一步模型化、知識化。強度大數據挖掘處理及技術主要包含以下大類:關聯(lián)規(guī)則技術、分類技術、聚類技術、模式分析技術。強度大數據挖掘將實現(xiàn)對強度數據的低層次存儲、查詢的應用,提升為從強度數據到強度知識的轉化。
就試驗數據和仿真數據的挖掘而言,其基本任務是對元件級、部件級、全機級數據進行整理,利用數據挖掘及分析手段,實現(xiàn)數據與知識的智能篩選、層級之間的數據關聯(lián)、價值分析、趨勢預測等,最后將這些分析結果提供給仿真設計人員,指導仿真及設計過程,為仿真設計人員降低時間成本、提高仿真精度等提供智能化支持。
2.2.1關聯(lián)規(guī)則技術應用
根據數據挖掘中關聯(lián)規(guī)則的分類,對強度大數據所需進行的關聯(lián)挖掘進行分類,根據關聯(lián)規(guī)則方法中經典的Apriori算法,針對強度試驗過程中產生的不同類別結構化與非結構化強度數據進行數據預處理及提取之后,形成數據挖掘關聯(lián)規(guī)則標準下的項集。通過強度大數據之間的關聯(lián)關系構建,尤其是其中強關聯(lián)關系的發(fā)掘,對強度試驗過程中的時序或因果關聯(lián)判定,具有極大的參考價值。
本平臺在利用經典Apriori算法之外,還將根據強度試驗過程中的特點,進行關聯(lián)規(guī)則算法改進的相關研究,適應未來發(fā)展的新大數據應用與場景,主要在以下幾個方面進行提升:關聯(lián)規(guī)則算法效率;非結構化數據關聯(lián)規(guī)則挖掘;強度多專業(yè)數據關聯(lián)規(guī)則挖掘;關聯(lián)規(guī)則可視化。
2.2.2分類技術應用
針對強度大數據的特點,在分類技術上,平臺主要研究的算法包含決策樹方法、神經網絡方法、KNN分類方法、貝葉斯分類方法以及支持向量機分類方法。通過這幾類分類算法與方法的模塊化應用,結合機器學習與模式識別的相關知識,實現(xiàn)強度大數據不同層次、不同類別、多專業(yè)融合的數據分類。
構建強度分類體系時,對于強度大數據的策劃階段、設計階段、試驗階段與分析階段;靜強度、動強度、疲勞強度、熱強度、航空聲學、氣候環(huán)境適應性等14個研究方向;試驗類別區(qū)分物理試驗與虛擬試驗等不同條件的已知強度大數據,發(fā)掘分類規(guī)則,實現(xiàn)預測新數據類型的愿景。
2.2.3聚類分析技術應用
強度大數據包含了海量多種類、多層次、多維的數據。聚類分析利用數學工具、多元分析理論,通過衡量不同數據間的相似性,將數據分至不同的簇中,描述數據的固有結構與特征。平臺將根據數據間的距離與相似系數對強度數據進行度量,通過自定義度量參數,對強度數據進行進一步細分,定量的細分與劃分預設數據。平臺主要聚類算法包含Kmeans、層次聚類、神經網絡聚類、高斯聚類等幾種經典算法應用。
3結語
本文通過梳理一種面向機翼可靠性試驗的數據挖掘方法研究,分析試驗數據需求,給出試驗表征與數據挖掘方法,對試驗數據挖掘技術進行探索并取得成效,未來需進一步圍繞機翼負責試驗數據體系開展數字化研究,推動強度數據應用與挖掘專業(yè)的發(fā)展。
參考文獻
[1]陳玉斌,劉娜,趙志剛.基于數據挖掘的試驗數據關系挖掘方法研究[J].測繪與空間地理信息, 2020(43):173-176.
[2]鐘宇,陳歡,黃嘉偉.基于數據挖掘的試驗數據異常值檢測方法研究[J].現(xiàn)代電子技術,2020(43): 158-162.
[3]高彬,黃艷紅.基于數據挖掘的試驗數據預處理方法研究[J].現(xiàn)代計算機,2021(2):107-111.
[4]朱曉軍,楊曉芳,張賀.基于數據挖掘的試驗數據分析方法綜述[J].電子測量與儀器學報, 2021(35):1-9.
[5]馬曉娜,楊旭,趙明.基于數據挖掘的試驗數據分類與聚類方法研究[J].計算機工程與應用,2021(57):142-148.
(編輯何琳)
Data mining method for reliability design and test of aircraft wings
He ?Zhao
(National Key Laboratory of Strength and Structural Integrity, Aircraft Strength Research Institute
of China, Xian 710065,China)
Abstract: ?This paper studies the collection, management, analysis, and mining techniques for the design and verification of aircraft wing strength reliability data, and constructs a new processing mode for corresponding strength data. From micro to macro, the strength data is statistically analyzed, synthesized, and predicted, and the stiffness change laws and strength calculation methods of typical aircraft structures are mastered. Breaking through key technologies such as processing, mining, and visualization of strength big data, exploring the interrelationships between strength data, and providing technical support for various stages of the entire life cycle of aircraft development.
Key words: data mining; big data; strength test
作者簡介:何釗(1991—),男,工程師,碩士;研究方向:信息化規(guī)劃與數據管理。