,,
(1.杭州電子科技大學(xué) 計(jì)算機(jī)學(xué)院,杭州 310018; 2.浙江省計(jì)量科學(xué)研究院,杭州 310016)
在常見的數(shù)據(jù)采集系統(tǒng)中,采集到的數(shù)據(jù)通常包含較大的誤差,誤差雖然是被允許的,但是粗大誤差(也稱為野值)的出現(xiàn)會(huì)大大影響測量結(jié)果的準(zhǔn)確性,所以在測量得到一系列數(shù)據(jù)之后需要對粗大誤差進(jìn)行剔除,來保證測量結(jié)果的準(zhǔn)確性。粗大誤差的出現(xiàn)通常是因?yàn)闄z測環(huán)境受到外界的干擾或者是實(shí)驗(yàn)者的粗心大意引起的。常見的粗大誤差剔除方法有格拉布斯準(zhǔn)則、迪克遜準(zhǔn)則、拉伊達(dá)準(zhǔn)則等[1]。格拉布斯準(zhǔn)則和迪克遜準(zhǔn)則適用于測量樣本數(shù)較小時(shí)使用、計(jì)算公式復(fù)雜,在使用時(shí)需要查表;拉伊達(dá)準(zhǔn)則由變化的貝塞爾公式推導(dǎo)而來,使用時(shí)簡單方便,適用于測量樣本數(shù)較多的場景。在本系統(tǒng)中,溫度是一種遲滯性的緩變量,隨著不斷加熱,溫度會(huì)不斷線性緩慢上升直到目標(biāo)溫度,為了實(shí)時(shí)準(zhǔn)確地監(jiān)控溫度的變化,要頻繁的對整個(gè)過程進(jìn)行數(shù)據(jù)采集,所以拉伊達(dá)準(zhǔn)則在本系統(tǒng)中比較適用。
LabVIEW是Laboratory Virtual Instrument Engineering Workbench的縮寫,是一款使用圖形符號來編寫程序的編程環(huán)境,具有開發(fā)周期短、界面美觀大方、靈活方便、跨平臺(tái)等特性[2]。LabVIEW編程開發(fā)環(huán)境與常見的C、Java等開發(fā)環(huán)境有一個(gè)重要的區(qū)別是:LabVIEW是使用圖形的編程語言,而不是使用文本進(jìn)行編輯。一個(gè)VI界面可以分為前面板和程序框圖兩部分,前面板是VI的交互式圖形用戶界面,模擬了物理儀器的面板,可以有按鈕、溫度計(jì)、波形等顯示控件和輸入控件,且這些控件還能與Photoshop等圖片優(yōu)化軟件結(jié)合使用,使界面更加美觀大方[3]。程序框圖是VI的源代碼,類似于面向?qū)ο笳Z言的類,由LabVIEW的圖形化編程即G語言構(gòu)成,是實(shí)際可執(zhí)行的程序。程序框圖由子VI、庫函數(shù)、控制結(jié)構(gòu)和常量、對象等構(gòu)成,用連線將對象連接起來定義它們之間的數(shù)據(jù)流。對象對應(yīng)著前面板的終端,這樣就可以實(shí)現(xiàn)用戶和后臺(tái)程序的交互[4]。由于LabVIEW的以上特性,所以LabVIEW具有開發(fā)周期短,適合于實(shí)驗(yàn)研究場景等優(yōu)點(diǎn)[5]。
剔除粗大誤差的常見方法有格拉布斯準(zhǔn)則,迪克遜準(zhǔn)則、拉伊達(dá)準(zhǔn)則等[6],這幾種準(zhǔn)則的應(yīng)用都是以檢測樣本服從正太分布為前提的,以下內(nèi)容將進(jìn)行簡單介紹。
使用格拉布斯準(zhǔn)則對測量樣本T進(jìn)行粗大誤差剔除的步驟如下:
1)計(jì)算升序數(shù)列的平均值μ和標(biāo)準(zhǔn)差σ;
2)以平均值μ為基準(zhǔn)計(jì)算計(jì)算可疑數(shù)據(jù)的偏離值Vd,其中偏離值最大的為|Vi|max;
3)根據(jù)查表所得的置信概率α和測量次數(shù)n,確定臨界統(tǒng)計(jì)系數(shù)g(α,n);
4)若|Vi|max>g(α,n),則認(rèn)為xi為粗大誤差數(shù)據(jù),應(yīng)當(dāng)剔除,否則認(rèn)為序列T中不含粗大誤差數(shù)據(jù),剔除完畢;
5)剔除某一粗大誤差后繼續(xù)執(zhí)行1)~5),直到?jīng)]有粗大誤差為止。
以上步驟以流程如圖1所示。
圖1 格拉布斯準(zhǔn)則流程圖
迪克遜準(zhǔn)則是一種利用極差比雙側(cè)檢驗(yàn)來判別粗大誤差的方法,可以不用計(jì)算采集數(shù)據(jù)的平均值、標(biāo)準(zhǔn)差和殘差,簡化了計(jì)算過程,但是需要查表[7]。這種方法對于序列中只有一個(gè)粗大誤差值的測量數(shù)據(jù)效果較好,但是對于在同側(cè)存在多個(gè)粗大誤差值時(shí)檢測效果不佳。其檢測步驟如下:
1)將采集數(shù)據(jù)規(guī)模為n的數(shù)據(jù)從小到大進(jìn)行排序[2]形成待檢測序列T:t1 2)對待檢測序列觀察待檢測值是最大值還是最小值,如果是最大值,則構(gòu)造統(tǒng)計(jì)量: (1) 如待檢測值是最小值,則構(gòu)造統(tǒng)計(jì)量: (2) 3)查看迪克遜準(zhǔn)則給出的這些統(tǒng)計(jì)量的分布函數(shù)以及臨界值D(α,n)[6],則: P(y22>D(α,n))=α (3) 拉伊達(dá)準(zhǔn)則是一種依靠測量數(shù)據(jù)三倍標(biāo)準(zhǔn)差為極限標(biāo)準(zhǔn)取舍測量值的方法,其給定的置信率是99.73%,是一種適用于測量次數(shù)較多(n>15)的場景或者是經(jīng)過大量重復(fù)測量已經(jīng)統(tǒng)計(jì)出標(biāo)準(zhǔn)差σ的情況。同時(shí),在文獻(xiàn)[9]中,作者提出了一種基于拉伊達(dá)準(zhǔn)則進(jìn)行目標(biāo)值預(yù)測的方法,發(fā)現(xiàn)將拉伊達(dá)準(zhǔn)則用于測量數(shù)據(jù)較多的目標(biāo)預(yù)測場景時(shí)也能得到較好的結(jié)果。使用拉伊達(dá)準(zhǔn)則對規(guī)模為n的測量數(shù)據(jù)T進(jìn)行誤差剔除的一般步驟如下: (4) 2)根據(jù)均值求出殘差: (5) 3)根據(jù)殘差求出標(biāo)準(zhǔn)偏差: (6) 5)計(jì)算n-1個(gè)測量數(shù)據(jù)的均值、殘差、標(biāo)準(zhǔn)偏差繼續(xù)執(zhí)行(1)~(4),直至沒有粗大誤差時(shí)停止。 δi=ti-to (7) 平均值: (8) 殘差: (9) 推導(dǎo)變化的貝塞爾公式可以得出的標(biāo)準(zhǔn)偏差如下: (10) 一般溫度采集系統(tǒng)由采集對象、測溫?zé)犭娮枳鳛閭鞲衅鳌囟炔杉芈泛蜏囟炔杉浖M成[11]。 在本實(shí)驗(yàn)系統(tǒng)中,采集對象是RTS-35A恒溫水箱,RTS-35A恒溫水箱是一款可按照恒定功率進(jìn)行加熱或者降溫的設(shè)備,其升溫和降溫過程一般是按照某一斜率線性上升或者線性下降。測溫?zé)犭娮枋菧囟认到y(tǒng)中重要的傳感器,將被測對象的溫度以電阻的形式反應(yīng)出來,然后交由溫度采集回路進(jìn)行處理。溫度采集回路是將測溫?zé)犭娮璧闹祩魉椭翜囟炔杉浖M(jìn)行分析和處理,在本系統(tǒng)中,溫度采集回路使用的是Agilent34970A進(jìn)行采集,Agilent34970A的精度為六位半,有精確的測量能力,可以應(yīng)用于各種場合。Agilent34970A使用兩種標(biāo)準(zhǔn)通訊接口:GPIB(IEEE-488)、RS232,GPIB接口具有通訊質(zhì)量高性能穩(wěn)定等優(yōu)點(diǎn),但是PC機(jī)沒有GPIB接口,而且GPIB接口通信距離短等缺點(diǎn)使得GPIB接口不適用用本系統(tǒng),本系統(tǒng)采用RS232接口協(xié)議進(jìn)行通信。溫度采集軟件使用虛擬儀器語言Labview來實(shí)現(xiàn)[12]。本系統(tǒng)結(jié)構(gòu)如圖2所示。 圖2 溫度采集系統(tǒng)結(jié)構(gòu)圖 在本系統(tǒng)中,利用Agilent34970A六位半采集儀來對采集到的電阻值進(jìn)行轉(zhuǎn)換,再上傳到上位機(jī)Labview程序中,Agilent34970A與上位機(jī)的通訊是采用SCPI(可編程儀器控制命令)進(jìn)行,上位機(jī)發(fā)送“read?”指令給采集儀,采集儀就會(huì)返回所有通道的數(shù)據(jù)。Labview上位機(jī)采集數(shù)據(jù)使用VISA串口通信方式,VISA是應(yīng)用于儀器編程標(biāo)準(zhǔn)I/O應(yīng)用程序接口(API),是可以調(diào)用底層驅(qū)動(dòng)器的API,Labview在使用的時(shí)候也要安裝相應(yīng)的驅(qū)動(dòng)程序[13]。 采集數(shù)據(jù)可以分為五步,第一步上位機(jī)寫入“read?”指令到端口;第二步是等待延時(shí)時(shí)間保證能收到緩沖區(qū)里面正確的數(shù)據(jù);第三步是從端口中讀出數(shù)據(jù);第四步是對讀出的數(shù)據(jù)進(jìn)行處理和顯示;第五步采集結(jié)束后將采集到數(shù)據(jù)導(dǎo)入到excel文檔中。其程序如圖3所示。 圖3 采集程序程序框圖 圖4是利用改進(jìn)拉伊達(dá)準(zhǔn)則進(jìn)行野值剔除的程序框圖,程序在實(shí)現(xiàn)的過程中先去Excel表格中讀取測量樣本,存到原始數(shù)據(jù)數(shù)組中。取到測量樣本后,對原始數(shù)據(jù)數(shù)組利用改進(jìn)拉伊達(dá)準(zhǔn)則進(jìn)行處理。 處理步驟可以分為5個(gè)部分: 1)對原始數(shù)據(jù)進(jìn)行累加得到累加值,初始化ti-t0和(ti-t0)2數(shù)組; 2)利用累加值求出算術(shù)平均值,在本實(shí)驗(yàn)中,經(jīng)過多次取值計(jì)算發(fā)現(xiàn)初始值t0選擇為平均值時(shí)能得到最好的結(jié)果; 3)求得ti-t0和(ti-t0)2數(shù)組; 4)利用ti-t0和(ti-t0)2數(shù)組分別求出ti-t0和(ti-t0)2數(shù)組的和放在臨時(shí)變量1和臨時(shí)變量2中;圖4為利用改進(jìn)拉伊達(dá)準(zhǔn)則剔除粗大誤差的前四步程序框圖。 圖4 改進(jìn)拉伊達(dá)準(zhǔn)則剔除粗大誤差程序框圖 5)設(shè)置一個(gè)while loop循環(huán),在循環(huán)體里面利用前4步求得的臨時(shí)變量對測量樣本進(jìn)行粗大誤差剔除,首先根據(jù)臨時(shí)變量1、臨時(shí)變量2、預(yù)估計(jì)值求出平均值和標(biāo)準(zhǔn)偏差的3倍,并把剔除完成標(biāo)記置為0,接下來利用一個(gè)for loop循環(huán)對數(shù)據(jù)進(jìn)行實(shí)際操作,利用原始數(shù)據(jù)減去平均值和標(biāo)準(zhǔn)差的3倍進(jìn)行比較看是否是粗大誤差值,如果該值為粗大誤差值,粗大誤差數(shù)+1,臨時(shí)變量1和臨時(shí)變量2分別減去ti-t0數(shù)組、(ti-t0)2數(shù)組中位置為i的元素,并把原始數(shù)組位置為i的元素替換為平均值,并把剔除完成標(biāo)記置為1,表示剔除沒有完成,還要進(jìn)行下一輪的剔除,直到剔除完成為止。圖5是利用改進(jìn)拉伊達(dá)準(zhǔn)則剔除粗大誤差第五步程序框圖。 圖5 改進(jìn)拉伊達(dá)準(zhǔn)則剔除粗大誤差程序框圖 對采集對象恒溫水箱進(jìn)行設(shè)置,采集了從30 ℃上升到80 ℃的溫度,每隔500 ms采集一次,得到了數(shù)據(jù)每個(gè)時(shí)間間隔溫度上升為0.061 ℃左右,對其中的數(shù)據(jù)按每100個(gè)提取一個(gè)的方法進(jìn)行提取得到表1的數(shù)據(jù)作為原始數(shù)據(jù)。 表1 采集原始數(shù)據(jù) ℃ 在實(shí)際應(yīng)用中,利用拉伊達(dá)準(zhǔn)則進(jìn)行數(shù)據(jù)處理時(shí),要求被測數(shù)據(jù)穩(wěn)定在某個(gè)值附近,滿足正態(tài)分布;對于波動(dòng)特別大的數(shù)據(jù),就判定其為粗大誤差。在本實(shí)驗(yàn)系統(tǒng)中,溫度是一種帶有遲滯性的研究對象,其單位時(shí)間溫度上升是一個(gè)平滑的過程,對表1的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)數(shù)據(jù)處于一個(gè)基本穩(wěn)定上升的過程中,原因是恒溫加熱水箱通過某一恒定功率進(jìn)行加熱,其特點(diǎn)是在單位時(shí)間內(nèi)溫度的增量波動(dòng)不大。可以通過表1得到其單位時(shí)間內(nèi)溫度增量表表2,可以看出是符合前面提到的溫度單位時(shí)間內(nèi)上升0.061 ℃的要求的,為了進(jìn)一步的驗(yàn)證改進(jìn)拉伊達(dá)算法在本實(shí)驗(yàn)中可行性,在原始數(shù)據(jù)中加入毛刺數(shù)據(jù),共加入7個(gè),得到表3的數(shù)據(jù)。對表3的數(shù)據(jù)進(jìn)行減法分析處理得到單位時(shí)間的增量表表4。 表2 原始數(shù)據(jù)增量表 ℃ 表3 毛刺數(shù)據(jù)表 ℃ 對表4的數(shù)據(jù)通過圖4、5的Labview程序進(jìn)行處理,共循環(huán)兩次,發(fā)現(xiàn)加入的7個(gè)毛刺數(shù)據(jù)為粗大誤差值。第一次處理時(shí)得到平均值為0.482221,3倍的標(biāo)準(zhǔn)偏差值為2.616408,剔除了第6、13、68位毛刺數(shù)據(jù);第二次循環(huán)得到平均值為0.541301,3倍標(biāo)準(zhǔn)偏差值為2.054999,剔除了第18、27、45、48位毛刺數(shù)據(jù)。至此,毛刺數(shù)據(jù)剔除完畢,第三次循環(huán)時(shí)平均值為0.538886,3倍標(biāo)準(zhǔn)偏差值為2.106758,發(fā)現(xiàn)無粗大誤差,剔除過程結(jié)束。 表4 毛刺數(shù)據(jù)增量表 ℃ 通過分別比較剔除前和剔除后增量數(shù)據(jù)表與原始數(shù)據(jù)表,見圖5、6,可以發(fā)現(xiàn)原用于對穩(wěn)定數(shù)據(jù)進(jìn)行粗大誤差剔除的拉伊達(dá)準(zhǔn)則,對于增量數(shù)據(jù)的粗大誤差剔除,也能取得良好的效果,在保證漏剔率和誤剔率的同時(shí),還可以保證得到較為準(zhǔn)確的實(shí)驗(yàn)結(jié)果,對于后續(xù)的實(shí)驗(yàn)分析具有很大的幫助。 圖5 增量數(shù)據(jù)剔除前后對比 圖6 原始數(shù)據(jù)剔除前后對比 在工程的實(shí)際設(shè)計(jì)和測量過程中,靈活的運(yùn)用LabVIEW進(jìn)行開發(fā)可以大大的縮短開發(fā)周期和節(jié)約人力成本,也可以方便地構(gòu)建直觀的虛擬儀器界面。在基于LabVIEW設(shè)計(jì)的采集測量平臺(tái)中,進(jìn)一步改進(jìn)了拉伊達(dá)準(zhǔn)則,將其應(yīng)用在穩(wěn)定持續(xù)變化的溫度測量場合,擴(kuò)大了其應(yīng)用范圍。實(shí)驗(yàn)表明,改進(jìn)使用后的拉伊達(dá)準(zhǔn)則可以準(zhǔn)確的對試驗(yàn)產(chǎn)生的粗大誤差進(jìn)行剔除,大大提高了試驗(yàn)數(shù)據(jù)的準(zhǔn)確性,確保測試結(jié)果可信性,在后期涉及到多數(shù)據(jù)的采集中具有良好的實(shí)用意義。 參考文獻(xiàn): [1] 盧元磊,何佳洲,安 瑾. 幾種野值剔除準(zhǔn)則在目標(biāo)預(yù)測中的應(yīng)用研究[J]. 指揮控制與仿真,2011,33(4): 98-102. [2] 王中宇,劉智敏,夏新濤. 測量誤差與不確定度評定[M]. 北京: 科學(xué)出版社, 2008. [3] 張 敏. 拉依達(dá)(Pau θ Ta)準(zhǔn)則與異常值剔除[J]. 鄭州工業(yè)大學(xué)學(xué)報(bào). 1997,18(1):84-88. [4] 熊艷艷,吳先求.粗大誤差四種判別標(biāo)準(zhǔn)的比較與應(yīng)用[J].大學(xué)物理實(shí)驗(yàn),2010:66-68. [5] 覃 欣, 熊 娟.LabVIEW數(shù)據(jù)處理中3σ準(zhǔn)則的應(yīng)用[J].中國測試, 2009,35(5): 66-69. [6] 孫培強(qiáng).正確選擇統(tǒng)計(jì)判別法剔除異常值[J]. 計(jì)量技術(shù), 2013,11(12):71-73. [7] Zhang P Z. Design of hierarchical fuzzy PID controller based on Granular computing in LabVIEW[A].2009 Sixth International Conference on Fuzzy Systems and Knowledge Discovery[C].Tianjin, 2009. [8] 安海超, 楊人鳳, 楊 波. 基于LabVIEW的纖維投料機(jī)非線性偏差校正[J]. 北京工業(yè)大學(xué)學(xué)報(bào), 2016,42(11):1713-1719. [9] 陳亞斌, 王亞剛, 周代仝. 基于修正狄克遜準(zhǔn)則的多傳感器融合算法[J]. 通信技術(shù), 2014,47(10):1178-1182. [10] Zhao J P, Liu X F.Research on PID controller for Hydraulic Servo System based on LabVIEW[A]. 2015 International Conference on Fluid Power and Mechatronics[C].Harbin, 2015. [11] 鄭 峰, 王 睿, 宦克為. 粳米近紅外光譜模型中基于拉依達(dá)準(zhǔn)則的異常值剔除方法[A]. 第十七屆全國分子光譜學(xué)術(shù)報(bào)告會(huì)[C].廣東, 2012. [12] JunqinLlU S J. Design on the central air-conditioning controller based on LabVIEW[A]. 2010 International Conference on Computer Application and System Modeling (ICCASM 2010) [C].Taiyuan, 2010. [13] Panchal P, Patel A, Barve J.PI Control of Level Control System using PLC and LabVIEW based SCADA[A]. 2015 International Conference on Industrial Instrumentation and Control (ICIC)[C]. College of Engineering Pune, India,2015.1.3 標(biāo)準(zhǔn)拉伊達(dá)準(zhǔn)則
1.4 改進(jìn)的拉伊達(dá)準(zhǔn)則
2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
2.1 系統(tǒng)基本組成
2.2 系統(tǒng)采集詳細(xì)設(shè)計(jì)
2.3 利用改進(jìn)拉伊達(dá)準(zhǔn)則進(jìn)行數(shù)據(jù)處理
3 結(jié)論