謝 艷, 李 平, 蔣 鴻
(中國空氣動力研究與發(fā)展中心, 四川 綿陽 621000)
過去,人們認為許多數(shù)據(jù)都是陳舊的、無用的、冗余的,比如:飛機降落后,票價數(shù)據(jù)是陳舊的;網(wǎng)絡上搜索關鍵詞數(shù)據(jù)是無用的;風洞常規(guī)試驗中非階梯穩(wěn)定時刻的數(shù)據(jù)是冗余的,所以都被舍棄了[1-3]。
隨著大數(shù)據(jù)的引領,一些互聯(lián)網(wǎng)公司首先成了大數(shù)據(jù)的贏家和先行者。通過用戶搜索和使用信息數(shù)據(jù)累積,可以綜合分析出用戶的喜好,甚至通過關鍵詞搜索的頻次和來源地分析,可以獲取流感爆發(fā)地及爆發(fā)規(guī)模等重要信息。目前大數(shù)據(jù)已成了新發(fā)明和深刻洞見之源泉。
對大數(shù)據(jù)的定義,到目前還沒有公認的統(tǒng)一的標準,但普遍認為,大數(shù)據(jù)是指數(shù)據(jù)規(guī)模大且數(shù)據(jù)類型繁多。以盲人摸象為例:小數(shù)據(jù),僅幾個盲人摸摸大象的牙鼻身腳等特征部位,綜合后只能得出片面再加以猜想的結果;大數(shù)據(jù),可采用足夠多的盲人摸遍大象全身,再輔以坐標、時間等相關信息,最后通過復雜多樣的綜合分析就可獲得大象全身的、動態(tài)的、可精細到每個細節(jié)的大象外形結果。
由此,可看出大數(shù)據(jù)方法帶來的四個轉變:一是數(shù)據(jù)不再是隨機樣本,而是全體數(shù)據(jù);二是數(shù)據(jù)量和數(shù)據(jù)雜混性增加,導致數(shù)據(jù)處理復雜度呈指數(shù)型增長;三是大數(shù)據(jù)方便提供準確的相關、概率等關系,可幫助人們明了因果關系[4-5];四是分析結論不再是抽樣數(shù)據(jù)趨勢再加推測的結果,而是全面的、可精細到細節(jié)的、可與多種信息相關聯(lián)的分析結果。
我國風洞試驗在幾十年間積累了大量的階梯抽樣采集的氣動試驗數(shù)據(jù)。目前大數(shù)據(jù)分析在風洞試驗方面的應用研究主要集中在對風洞歷年生產(chǎn)的氣動試驗數(shù)據(jù)的分析挖掘上[6-7]。而運用大數(shù)據(jù)對風洞試驗全過程進行研究方面則幾乎還是空白。分析其原因是傳統(tǒng)的風洞常規(guī)試驗采用階梯采集的方式,一次車只采集十數(shù)個階梯數(shù)據(jù),而其它的數(shù)據(jù)被認為是無用的,直接就舍棄了。當試驗出現(xiàn)故障或者試驗數(shù)據(jù)出現(xiàn)異常時,人們很難從這么少的數(shù)據(jù)中得到更多的信息,定位故障,明確原因,所以只能采用換電源、換采集通道等多次的吹風測試來定位故障,費事費力,浪費能源,且效率不高。
自連續(xù)變迎角測力試驗技術投入應用,采集到了大量的風洞試驗全程的連續(xù)數(shù)據(jù)和信息,每次車的數(shù)據(jù)及信息量可達數(shù)十萬。在對這些海量試驗數(shù)據(jù)和信息的研究分析中,我們逐漸發(fā)現(xiàn)這些海量數(shù)據(jù)中富含許多階梯數(shù)據(jù)中沒有的頻率、概率、相關性等信息,可為風洞試驗數(shù)據(jù)和故障的深入分析等提供有力的支持。由此,我們探索開展了大數(shù)據(jù)在風洞試驗方面的應用研究。
要應用大數(shù)據(jù)方法深入分析風洞試驗全程,需要解決三個問題:一是風洞試驗全程大數(shù)據(jù)的采集;二是風洞試驗大數(shù)據(jù)的處理;三是風洞試驗大數(shù)據(jù)的可視化分析。下面簡要介紹解決方案。
過去,風洞常規(guī)試驗采用階梯抽樣采集方法,即風洞試驗時,迎角按照預先設定的階梯軌跡運行(如:-2°、-1°、0°、1°、2°、4°、6°、8°、10°、12°共10個階梯),測量只采集階梯穩(wěn)定時刻的數(shù)據(jù),試驗數(shù)據(jù)點與階梯數(shù)相同,數(shù)據(jù)少且時序、頻率等信息丟失,大數(shù)據(jù)應用缺少數(shù)據(jù)和信息的支持。
為此,發(fā)明風洞試驗“全程連續(xù)采集,階梯時刻標注,連續(xù)階梯兩全”的風洞試驗數(shù)據(jù)采集專利技術[8],即:風洞起動前10 s就起動采集系統(tǒng),以300~2000 Hz的采樣率連續(xù)采集數(shù)據(jù),并記錄每點的時序,階梯穩(wěn)定時連續(xù)采集不變,只對穩(wěn)定時刻數(shù)據(jù)點進行階梯標注,然后繼續(xù)下一階梯,直到風洞關車10 s后,結束連續(xù)采集,保存該次試驗全程的連續(xù)試驗數(shù)據(jù),并從連續(xù)試驗數(shù)據(jù)中將標注的全部階梯數(shù)據(jù)提取出來組成該次試驗的階梯試驗數(shù)據(jù)并保存。此采集方法即兼容傳統(tǒng)的階梯采集,又采集到試驗全程的全部連續(xù)數(shù)據(jù)、時頻域信息等,使試驗的宏觀全貌和各種細微、瞬時的數(shù)據(jù)信息得以保留,為大數(shù)據(jù)分析提供了數(shù)據(jù)支持。另外,此技術還為連續(xù)數(shù)據(jù)和階梯數(shù)據(jù)架起了相通的橋梁,使傳統(tǒng)的小數(shù)據(jù)分析和大數(shù)據(jù)分析可以相輔相成。
在專利技術的指導下,開發(fā)了2.4 m跨聲速風洞、2 m超聲速風洞測力/測壓試驗采集全數(shù)據(jù)的采集軟件[3],解決了風洞試驗應用大數(shù)據(jù)的數(shù)據(jù)來源問題。
傳統(tǒng)的風洞試驗處理程序的設計思想是:先梳理總結出風洞試驗數(shù)據(jù)有限種的處理方法,制定出數(shù)據(jù)處理規(guī)范,然后再依據(jù)規(guī)范,開發(fā)風洞試驗標準化的處理程序。按此設計思想開發(fā)的風洞試驗數(shù)據(jù)標準化處理程序在小數(shù)據(jù)時代,數(shù)據(jù)點和數(shù)據(jù)類型少、處理方法有限的情況下,是可以滿足數(shù)據(jù)處理需求的。但是,風洞試驗采用新采集方法后,數(shù)據(jù)量、數(shù)據(jù)類型、信息等大幅增加,數(shù)據(jù)處理方法亦呈指數(shù)型劇增,再沿用上述的程序設計思想,程序將面臨處理方法太多而程序不能全部涵蓋的困境。
為此,發(fā)明了自動識別、自動解析計算的通用風洞試驗數(shù)據(jù)處理程序。基本設計思想為:程序設計前,先制定出識別數(shù)據(jù)和解析計算方法的規(guī)則,然后設計程序實現(xiàn)輸入數(shù)據(jù)和計算方法;依據(jù)規(guī)則識別數(shù)據(jù)和解析計算方法;按識別和解析結果對數(shù)據(jù)進行計算輸出。這種設計思想,就像是在人與程序之間建立了一種交流語言,人們可以將能想到的計算方法通過這種語言告訴程序,程序就可以明白并智能的實現(xiàn)人們的要求。采用此設計思想實現(xiàn)了處理程序數(shù)據(jù)類型和處理方法的無限拓展,為風洞試驗大數(shù)據(jù)任意計算方法的處理分析搭建了基礎的計算平臺,解決了風洞試驗大數(shù)據(jù)多樣化處理的難題。
大數(shù)據(jù)分析最基本的方法就是數(shù)據(jù)特征提取和可視化分析,數(shù)據(jù)特征提取將蘊含在大數(shù)據(jù)中的特征明顯化,而可視化分析則直觀的呈現(xiàn)出大數(shù)據(jù)的特征[9-15]。為此,開發(fā)了風洞試驗海量雜混大數(shù)據(jù)顯示分析軟件,風洞試驗大數(shù)據(jù)頻譜分析、相關性分析等計算和顯示分析軟件。解決了風洞試驗大數(shù)據(jù)的可視化分析問題。
2009年某型號尾支干擾測力試驗(Ma=0.6),天平靜態(tài)正常,但試驗時,數(shù)據(jù)在小角度范圍出現(xiàn)異常跳動見圖1。
(a)俯仰力矩 (b)阻力
在傳統(tǒng)的小數(shù)據(jù)(階梯數(shù)據(jù))分析方法中,因只有十余個數(shù)據(jù)點,無法分析原因。采用大數(shù)據(jù)可視化分析,將故障車次與正常車次采集的試驗全程(包括起動關車前后)全部試驗數(shù)據(jù)按時序顯示出來,見圖2,就能從圖中的時序關系上看出數(shù)據(jù)異常是因為風洞起動引起了天平電源異常跳動所致,也即是天平電源的動態(tài)特性異常所致。同時,圖中細節(jié)也可以表現(xiàn)出天平階梯測值隨電源波動的相關性等。更換電源后,數(shù)據(jù)恢復正常。
圖2 正常和故障情況的全部試驗數(shù)據(jù)對比分析圖
此例是利用大數(shù)據(jù)可視化分析方法,將試驗大數(shù)據(jù)按時序顯示在圖中,直接從圖中的時序關系上找出天平電源異常和恢復的時刻,以及異常時天平電源、天平信號的故障形態(tài)的應用實例。
2015年某模型風洞試驗Ma=0.96時連續(xù)變迎角和階梯變迎角重復性驗證,發(fā)現(xiàn)比較車次馬赫數(shù)差量小于0.002、迎角差量小于0.015°時的阻力系數(shù)CD差量卻高達0.0024,CD差量達到常規(guī)差量的8倍左右。CD曲線對比如圖3(a)。
(a)CD~α
(b)CD~Ma
表1 比較車次變量差相關系數(shù)計算結果
用比較車次全部有效數(shù)據(jù)的CD差量與試驗中所有的其它變量的差量進行相關分析計算,得知CD差量與Ma差量的相關系數(shù)最大,即,CD的誤差多因馬赫數(shù)誤差引起。計算結果見表1。
有了上述相關分析后,再看該模型CD隨Ma的變化曲線(圖3(b))。該模型CD在Ma=0.9處開始發(fā)散,因此當Ma>0.9時,Ma的微量變化,將引起CD的大幅變化。這也是該模型試驗對Ma>0.9的控制精度要求極高的原因。
此例是利用大數(shù)據(jù)獲取數(shù)據(jù)間精準的相關關系,再由相關關系指明因果關系的。該例雖然也可以從階梯數(shù)據(jù)中獲取類似的相關關系,但是,從少量階梯數(shù)據(jù)中獲取的相關關系的可信度大大降低。
近3年來,GWA、WTAS傾角傳感器在2 m量級風洞的使用過程中,始終存在靜態(tài)工作正常但試驗狀態(tài)就出現(xiàn)跳數(shù)的現(xiàn)象(跳數(shù)誤差≤1.5°)。使用了減振、抗噪等措施后問題依然存在,故障原因一直不明確。傾角傳感器測量故障曲線見圖4。
(a)Ma=0.9時WTAS傾角傳感器測得的傾角運行軌跡(最大最小角度附近跳數(shù))
(b)Ma=0.6時WTAS傾角傳感器測得的傾角運行軌跡(全程正常)
采用大數(shù)據(jù)分析方法,將3年來所有GWA、WTAS傾角傳感器的全部試驗數(shù)據(jù)與試驗條件等信息進行概率和相關性分析,得出傾角傳感器跳數(shù)問題的宏觀表現(xiàn)規(guī)律:
(1)問題與馬赫數(shù)有關。在2.4 m跨聲速風洞,當Ma≥0.7,有跳數(shù),且強度和概率與馬赫數(shù)成正比;而在2 m超聲速風洞,當Ma≤2.75,有跳數(shù),但強度和概率與馬赫數(shù)成反比;相同馬赫數(shù),問題相似;
(2)問題與側滑角有關,跳數(shù)強度和發(fā)生概率隨傾滑角的增大而降低;
(3)兩種傳感器跳數(shù)時而同時,時而交錯;多數(shù)跳數(shù)發(fā)生時,未見模型有明顯振動;
(4)跳數(shù)大多發(fā)生在最大、最小角度位置,且角度測值的絕對值始終偏小。
雖然大數(shù)據(jù)宏觀分析得出了傾角傳感器跳數(shù)問題較為準確的概率和相關性的特征,但是傾角傳感器跳數(shù)為什么會與馬赫數(shù)和傾滑角相關仍然是個謎,需要再對大數(shù)據(jù)進行更加深入的微觀分析,明確各種跳數(shù)的相關性。
(1)通過多種相關性分析發(fā)現(xiàn),GWA、WTAS傳感器與氣流脈動(X)方向的頻譜相關性較強,而GWA、WTAS傳感器的跳數(shù)頻率又與風洞氣流脈動強度的相關性較強。根據(jù)這兩個相關性特點,推理出因GWA、WTAS敏感元件擺片正對氣流,所以對風洞氣流脈動敏感,導致跳數(shù)頻率和強度隨馬赫數(shù)變化,也即是隨脈動強度變化;而當β>0°時,擺片軸線偏離氣流脈動軸線,敏感性下降,故障頻率也隨之下降。傳感器擺片結構及傾角傳感器頻譜與X、Y、Z方向頻譜的比較見圖5。
(2)GWA、WTAS傳感器跳數(shù)主要由兩種跳數(shù)組成(見圖6)。第一種,V字狀跳數(shù)。模型有可見的振動;跳數(shù)誤差與振幅成正比;跳數(shù)變化緩慢,周期約2.5 s;多個傳感器會同步跳;跳數(shù)多出現(xiàn)在大位置。第二種,毛刺狀跳數(shù)。模型無明顯振動;跳數(shù)誤差與干擾信號溢出量成正比;跳數(shù)變化迅速,周期約0.4 s;多個傳感器同步跳概率低;跳數(shù)多出現(xiàn)在最大、最小角度位置。
(3)根據(jù)兩種跳數(shù)相關關系的指引,推理這兩種跳數(shù)所產(chǎn)生的原因。第一種,V字狀跳數(shù)是模型和支桿的縱橫向振動帶動傾角傳感器振動,從而對多個傾角傳感器的敏感元件擺片帶來離心力的影響;第二種,毛刺狀跳數(shù)是由于軸向的高頻脈動耦合上傾角傳感器擺片的固有頻率從而產(chǎn)生高能量的干擾信號,造成傾角傳感器輸出信號在最大、最小位置時非對稱溢出所致。因多個傾角傳感器擺片的固有頻率不同,所以此類跳數(shù)通常在多個傳感器之間交錯出現(xiàn)。
(a)風洞試驗時WTAS、GWA傳感器與X、Y、Z方向振動傳感器頻譜的結果對比
(b)傳感器擺片結構示意圖
(a)GWA、WTAS傳感器試驗時在6.6°階梯平臺產(chǎn)生V字狀跳數(shù)
(b)FL-26風洞Ma≥0.7時傾角傳感器測得的毛刺狀跳數(shù)
有了精確深入的跳數(shù)原因的分析后,制定了相應的改進措施。傾角傳感器GWA、WTAS在隨后的2.4 m跨聲速風洞、2 m超聲速風洞的多期試驗中的取得了全程精準測量無跳數(shù)現(xiàn)象的突破,解決了長期存在的問題。
此例是一個較為典型的應用大數(shù)據(jù)分析的例子,首先是利用歷年來大量試驗數(shù)據(jù)獲取宏觀上的跳數(shù)問題與馬赫數(shù)、側滑角及流場脈動等參數(shù)的概率分布和相關性;再拓展數(shù)據(jù)源,深入到微觀細節(jié)去探尋跳數(shù)問題與更加廣闊其它數(shù)據(jù)之間的聯(lián)系和相關性;最后,通過宏觀和微觀中獲得的多種相關性的引領分析,明確各種跳數(shù)產(chǎn)生的原因。
上述三個應用實例中使用的分析數(shù)據(jù)全部是采用風洞試驗數(shù)據(jù)采集新方法采集的試驗全程、全部試驗數(shù)據(jù)[16-18]。
1)結合大數(shù)據(jù)分析的基礎方法,通過對傳統(tǒng)風洞試驗采集、處理方法的改進創(chuàng)新,建立了一套集風洞試驗數(shù)據(jù)采集、分析、挖掘及結果展現(xiàn)為一體的風洞試驗大數(shù)據(jù)綜合分析處理系統(tǒng);
2)在風洞試驗中應用大數(shù)據(jù)分析方法,既可以對試驗宏觀現(xiàn)象進行精準分析,也可以對試驗局部和細節(jié)進行精細化微觀分析;
3)從風洞試驗大數(shù)據(jù)中挖掘出的頻率、概率、相關關系等數(shù)據(jù),可以為試驗數(shù)據(jù)的深入分析、試驗故障的準確定位指明方向。
本項研究目前只是風洞試驗大數(shù)據(jù)分析的簡易平臺,驗證了平臺建設中的一些關鍵設計思想,取得了階段性成果,實現(xiàn)了風洞試驗數(shù)據(jù)采集從傳統(tǒng)的階梯抽樣采集的小數(shù)據(jù)時代到采集試驗全程全部試驗數(shù)據(jù)和信息的大數(shù)據(jù)時代的初步轉變。但是,要繼續(xù)深入進行風洞試驗的大數(shù)據(jù)研究,還需要進一步夯實大數(shù)據(jù)軟硬件基礎平臺支撐能力。