李珍 賈晨剛
摘 要
氣象資料是氣象業(yè)務、科研和服務等工作的基礎(chǔ),數(shù)據(jù)資料的準確與否直接影響著中尺度、短時效等天氣預報的準確性和有效性。根據(jù)陜西省自動氣象站的實際情況,采用計算機自動實時質(zhì)量控制方法對自動站數(shù)據(jù)進行有效地質(zhì)量控制,其質(zhì)控結(jié)果準確度高于傳統(tǒng)的人工質(zhì)量控制方法,數(shù)據(jù)可信度較高。
【關(guān)鍵詞】自動氣象站 質(zhì)量控制 實時控制
隨著現(xiàn)代化技術(shù)的發(fā)展,中小尺度、短時天氣時效等天氣預報的需求日益高漲,為滿足日益高漲的氣象服務的需求,中尺度、短時氣象觀測資料是必不可少的。目前,世界上許多國家都建立了分布密集的地面自動站觀測網(wǎng)絡(luò),我國的地面自動站觀測網(wǎng)絡(luò)也在日趨完善。隨著“自動化觀測技術(shù)”項目的實施,陜西省從2003年開始建設(shè)自動氣象站,前后經(jīng)過三年建設(shè),于2005年建成了覆蓋全省的自動站觀測網(wǎng),包括100個國家級自動站。由于自動站觀測時通過傳感器、數(shù)據(jù)采集、數(shù)據(jù)通訊等系統(tǒng)自動進行實施采集數(shù)據(jù),形成觀測報告,生成和傳輸數(shù)據(jù)文件等過程,觀測數(shù)據(jù)經(jīng)過的每個過程都可能產(chǎn)生錯誤數(shù)據(jù),由于實時性強、人工干預少、缺少對錯誤觀測數(shù)據(jù)的補救措施,因此,自動觀測出現(xiàn)錯誤數(shù)據(jù)的幾率遠遠高于人工觀測,在自動站觀測資料應用前,進行質(zhì)量控制是十分必要的。
1 自動氣象站質(zhì)量控制技術(shù)
1.1 數(shù)據(jù)質(zhì)量控制碼的規(guī)定
在對數(shù)據(jù)進行質(zhì)量控制(QC)的過程中,隨著控制進程的進行,需要不斷的對被檢數(shù)據(jù)設(shè)置或修改QC碼。QC碼的規(guī)定如下:
數(shù)據(jù)正確: QC碼=0
數(shù)據(jù)可疑: QC碼=1
數(shù)據(jù)錯誤: QC碼=2
1.2 數(shù)據(jù)質(zhì)量控制技術(shù)
傳統(tǒng)的質(zhì)量控制主要根據(jù)氣象學、天氣學、氣候?qū)W原理,以氣象要素的時間、空間變化規(guī)律和各個要素間相互聯(lián)系的規(guī)律為線索,分析氣象資料是否合理。其方法包括:范圍檢查、極值檢查、內(nèi)部一致性檢查、空間一致性檢查、氣象學公式檢查、統(tǒng)計學檢查、均已性檢查,這些方法被普遍應用到地面氣象資料的質(zhì)量控制中。
我國地面觀測資料實行氣象臺站、省級、國家級的三級質(zhì)量控制系統(tǒng),各級質(zhì)量控制軟件融合了自動控制技術(shù)和交互式應用技術(shù),提高了自動進程能力,允許在必要時對特殊資料進行詳細的人工分析判斷與修正。臺站級質(zhì)量控制是氣象資料質(zhì)量控制的基礎(chǔ),包括觀測系統(tǒng)的維護、儀器檢定、觀測數(shù)據(jù)在采集器和數(shù)據(jù)處理環(huán)節(jié)的基本質(zhì)量控制。本文將重點介紹陜西省省級自動氣象站資料的質(zhì)量控制方法,省級自動氣象站質(zhì)量控制方法主要包括:氣候?qū)W界限值檢查、氣候極值檢查、內(nèi)部一致性檢查、空間一致性檢查、時間一致性檢查等,同時根據(jù)自動站實時數(shù)據(jù)文件的特點引入數(shù)據(jù)文件格式檢查、傳感器狀態(tài)文件檢查方法,最后綜合評價要素數(shù)據(jù)質(zhì)量。我省針對日常業(yè)務中使用的氣溫、雨量、氣壓、風速風向和地面溫度5類項目17個要素在實時和準實時兩個質(zhì)量控制環(huán)節(jié)進行質(zhì)量控制,具體所采用的方法如表1所示。
1.2.1 格式檢查
格式檢查為對數(shù)據(jù)進行質(zhì)量前的預處理檢查。主要檢查文件中的數(shù)據(jù)錄入格式是否與《地面氣象觀測數(shù)據(jù)文件格式和記錄簿表格式》中規(guī)定的文件格式一致。另外進行臺站參數(shù)中站號、年、月與文件名中的站號、年、月的一致性檢查。檢查內(nèi)容為:檢查數(shù)據(jù)文件中各個要素字符是否是觀測規(guī)范中的規(guī)定字符;將第一條記錄中的記錄數(shù)據(jù)和數(shù)據(jù)庫中存儲的臺站信息表進行比對,確定數(shù)據(jù)文件的正確性;將文件名中的文件生成時間和第二條記錄中的要素觀測時間進行一致性檢查。
對于沒有通過格式檢查的數(shù)據(jù),QC碼可直接標定為2,并不再進行其他檢查。
1.2.2 傳感器狀態(tài)文件檢查
狀態(tài)信息文件每小時生成一個,為順序文件,共2條記錄。第一條記錄為本站基本參數(shù),共20個字節(jié),第二條記錄為各個傳感器的狀態(tài)值,共87個字節(jié)。該文件和實時數(shù)據(jù)文件在正點后一起上傳至省級數(shù)據(jù)中心,文件中記錄了自動站各種傳感器的工作狀態(tài),0表示傳感器正常,1表示傳感器異常。只有在傳感器正常的情況下,采集到的數(shù)據(jù)才能反映大氣要素的測量值,數(shù)據(jù)是真實可靠的。結(jié)合狀態(tài)文件中的傳感器狀態(tài)值,確定數(shù)據(jù)文件中相應的測量值是否有效。在傳感器正常的情況下判定測量值有效,否則,判定測量值是錯誤值。
對于沒有通過傳感器狀態(tài)文件檢查的數(shù)據(jù),QC碼可直接標定為2,并不再進行其他檢查。
1.2.3 極值檢查
極值檢查分為氣候?qū)W界限值檢查和臺站氣候極值檢查兩部分。
從氣候的角度不可能超越的要素臨界值稱之為要素的氣候界限值。資料形成是規(guī)定采用的表示方式和范圍,為要素的允許范圍值。超出要素的氣候界限值或允許值范圍的資料為錯誤資料。
對于沒有通過氣候?qū)W界限值檢查的數(shù)據(jù),QC碼可直接標定為2,并不再進行其他檢查。
極值是指某個固定測站歷史記錄中某要素曾出現(xiàn)過的最大值(最小值),它與緯度帶、地形、高度、氣候特點等有關(guān),氣象資料要素值是否超出極值的檢查為極值檢查。極值范圍的上限參數(shù)是否合理直接決定了極值檢查的效果,設(shè)置太低,則個別極端大的正常數(shù)據(jù)可能被作為錯誤數(shù)據(jù)處理,設(shè)置太高,則錯誤數(shù)據(jù)又可能被當做正確數(shù)據(jù)處理,因此,對自動氣象站資料的氣候極值檢查應根據(jù)各個臺站的實際情況修改極值參數(shù)。陜西省氣象檔案館在做50年氣象資料整編時,經(jīng)過統(tǒng)計和質(zhì)量控制審核確定了陜西省各個臺站的臺站極值。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過臺站氣候極值檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.4 內(nèi)部一致性檢查
對固定測站不同要素之間是否符合某種物理聯(lián)系的檢查稱之為內(nèi)部一致性檢查,在質(zhì)量控制中,一下要素要符合以下條件:
日最低氣溫 日定時氣溫 日最高氣溫;日最低氣壓 日定時氣壓 日最高氣壓endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現(xiàn)象;有大風現(xiàn)象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內(nèi)部一致性檢查的數(shù)據(jù),QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數(shù)據(jù)QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續(xù)變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內(nèi)的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關(guān)性隨著時間分辨率增加而加強。檢查判斷依據(jù)與樣本的時間分辨率有關(guān)。在實時質(zhì)量控制階段主要進行連續(xù)2小時變率檢查,即將本時次的數(shù)據(jù)和上個時次的數(shù)據(jù)進行比對,超過設(shè)定閾值的數(shù)據(jù)確定為可疑數(shù)據(jù)。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規(guī)則。如表2所示。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過時間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數(shù)都具有一定的空間分布特點,根據(jù)這些空間分布特點及規(guī)律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網(wǎng)的密度和被檢參數(shù)與空間的相關(guān)程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質(zhì)量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規(guī)定為:與被檢站點的數(shù)據(jù)進行比較時,鄰近站數(shù)據(jù)應保證正確。而對于鄰近站點數(shù)量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過空間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.7 綜合分析法
在完成以上質(zhì)量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數(shù)據(jù)的將繼續(xù)對這些數(shù)據(jù)進行綜合分析對比。若同一數(shù)據(jù)的三個QC碼之和為3,即以上三種質(zhì)控檢查均未通過,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數(shù)據(jù)可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結(jié)果將給予較多的考慮權(quán)重;若QC碼之和為1,則認為該數(shù)據(jù)可以,QC碼標注為1。
1.3 數(shù)據(jù)質(zhì)量控制結(jié)果分析
為檢驗經(jīng)過上述質(zhì)量控制方法軟件系統(tǒng)自動進行質(zhì)控后結(jié)果的準確度,將2010年7月陜西省100個自動站的實時資料從數(shù)據(jù)庫中提取出來,采用原始人工質(zhì)量控制方法再一次進行質(zhì)量控制,并進行比較,計算機實時質(zhì)量控制結(jié)果人工驗證結(jié)果為(以個別要素為例):
1.3.1正點氣溫
在實時質(zhì)量控制階段總共檢測出了50個可疑和錯誤數(shù)據(jù)。經(jīng)過人工審核,除2個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼均正確未變,正確率為96%。
比對兩個數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數(shù)據(jù):小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過人工審核,1個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼未變,正確率為98%。
比對所更改的數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規(guī)則時兩個參與的數(shù)據(jù)均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質(zhì)量控制階段總共檢測出了31個錯誤和可疑數(shù)據(jù)。經(jīng)過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質(zhì)量控制階段總共檢測出了140個可以或錯誤數(shù)據(jù)。經(jīng)過審核全部正確,正確率100%。
1.3.6相對濕度
實時質(zhì)量控制階段總共檢測出了37個可疑或錯誤數(shù)據(jù),全部正確,正確率100%。
通過比較發(fā)現(xiàn),上述質(zhì)量控制方法質(zhì)控結(jié)果準確度高于傳統(tǒng)的人工質(zhì)量控制方法,數(shù)據(jù)可信度較高。
2 結(jié)束語
進行自動站實時數(shù)據(jù)質(zhì)量控制,可以保證資料使用者使用有質(zhì)量保障的數(shù)據(jù)開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業(yè)務。氣象資料是氣象業(yè)務的基礎(chǔ),使用正確的數(shù)據(jù)開展業(yè)務研究、應用,才可以得出正確的結(jié)論。利用計算機技術(shù)進行自動站實時數(shù)據(jù)質(zhì)量,可以滿足實時氣象業(yè)務的需求。自動站實時數(shù)據(jù),由于其數(shù)據(jù)及時性,在天氣實況監(jiān)測方面,越來越受到業(yè)務人員的重視,已經(jīng)成為天氣實況分析的重要數(shù)據(jù)來源,特別是在災害性天氣監(jiān)測方面,自動站的優(yōu)勢非常明顯。近年來信息技術(shù)及網(wǎng)絡(luò)技術(shù)飛速發(fā)展,計算機的性能和處理數(shù)據(jù)的能力越來越快,因此利用計算機技術(shù),結(jié)合氣象探測資料質(zhì)量控制規(guī)則,對自動站實時數(shù)據(jù)進行自動質(zhì)量控制,可以迅速完成,保證數(shù)據(jù)時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質(zhì)量控制方法研究[J].安徽農(nóng)業(yè)科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統(tǒng)[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質(zhì)量控制業(yè)務系統(tǒng)的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質(zhì)量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質(zhì)量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質(zhì)量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質(zhì)量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現(xiàn)象;有大風現(xiàn)象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內(nèi)部一致性檢查的數(shù)據(jù),QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數(shù)據(jù)QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續(xù)變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內(nèi)的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關(guān)性隨著時間分辨率增加而加強。檢查判斷依據(jù)與樣本的時間分辨率有關(guān)。在實時質(zhì)量控制階段主要進行連續(xù)2小時變率檢查,即將本時次的數(shù)據(jù)和上個時次的數(shù)據(jù)進行比對,超過設(shè)定閾值的數(shù)據(jù)確定為可疑數(shù)據(jù)。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規(guī)則。如表2所示。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過時間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數(shù)都具有一定的空間分布特點,根據(jù)這些空間分布特點及規(guī)律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網(wǎng)的密度和被檢參數(shù)與空間的相關(guān)程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質(zhì)量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規(guī)定為:與被檢站點的數(shù)據(jù)進行比較時,鄰近站數(shù)據(jù)應保證正確。而對于鄰近站點數(shù)量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過空間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.7 綜合分析法
在完成以上質(zhì)量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數(shù)據(jù)的將繼續(xù)對這些數(shù)據(jù)進行綜合分析對比。若同一數(shù)據(jù)的三個QC碼之和為3,即以上三種質(zhì)控檢查均未通過,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數(shù)據(jù)可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結(jié)果將給予較多的考慮權(quán)重;若QC碼之和為1,則認為該數(shù)據(jù)可以,QC碼標注為1。
1.3 數(shù)據(jù)質(zhì)量控制結(jié)果分析
為檢驗經(jīng)過上述質(zhì)量控制方法軟件系統(tǒng)自動進行質(zhì)控后結(jié)果的準確度,將2010年7月陜西省100個自動站的實時資料從數(shù)據(jù)庫中提取出來,采用原始人工質(zhì)量控制方法再一次進行質(zhì)量控制,并進行比較,計算機實時質(zhì)量控制結(jié)果人工驗證結(jié)果為(以個別要素為例):
1.3.1正點氣溫
在實時質(zhì)量控制階段總共檢測出了50個可疑和錯誤數(shù)據(jù)。經(jīng)過人工審核,除2個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼均正確未變,正確率為96%。
比對兩個數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數(shù)據(jù):小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過人工審核,1個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼未變,正確率為98%。
比對所更改的數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規(guī)則時兩個參與的數(shù)據(jù)均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質(zhì)量控制階段總共檢測出了31個錯誤和可疑數(shù)據(jù)。經(jīng)過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質(zhì)量控制階段總共檢測出了140個可以或錯誤數(shù)據(jù)。經(jīng)過審核全部正確,正確率100%。
1.3.6相對濕度
實時質(zhì)量控制階段總共檢測出了37個可疑或錯誤數(shù)據(jù),全部正確,正確率100%。
通過比較發(fā)現(xiàn),上述質(zhì)量控制方法質(zhì)控結(jié)果準確度高于傳統(tǒng)的人工質(zhì)量控制方法,數(shù)據(jù)可信度較高。
2 結(jié)束語
進行自動站實時數(shù)據(jù)質(zhì)量控制,可以保證資料使用者使用有質(zhì)量保障的數(shù)據(jù)開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業(yè)務。氣象資料是氣象業(yè)務的基礎(chǔ),使用正確的數(shù)據(jù)開展業(yè)務研究、應用,才可以得出正確的結(jié)論。利用計算機技術(shù)進行自動站實時數(shù)據(jù)質(zhì)量,可以滿足實時氣象業(yè)務的需求。自動站實時數(shù)據(jù),由于其數(shù)據(jù)及時性,在天氣實況監(jiān)測方面,越來越受到業(yè)務人員的重視,已經(jīng)成為天氣實況分析的重要數(shù)據(jù)來源,特別是在災害性天氣監(jiān)測方面,自動站的優(yōu)勢非常明顯。近年來信息技術(shù)及網(wǎng)絡(luò)技術(shù)飛速發(fā)展,計算機的性能和處理數(shù)據(jù)的能力越來越快,因此利用計算機技術(shù),結(jié)合氣象探測資料質(zhì)量控制規(guī)則,對自動站實時數(shù)據(jù)進行自動質(zhì)量控制,可以迅速完成,保證數(shù)據(jù)時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質(zhì)量控制方法研究[J].安徽農(nóng)業(yè)科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統(tǒng)[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質(zhì)量控制業(yè)務系統(tǒng)的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質(zhì)量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質(zhì)量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質(zhì)量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質(zhì)量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現(xiàn)象;有大風現(xiàn)象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內(nèi)部一致性檢查的數(shù)據(jù),QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數(shù)據(jù)QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續(xù)變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內(nèi)的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關(guān)性隨著時間分辨率增加而加強。檢查判斷依據(jù)與樣本的時間分辨率有關(guān)。在實時質(zhì)量控制階段主要進行連續(xù)2小時變率檢查,即將本時次的數(shù)據(jù)和上個時次的數(shù)據(jù)進行比對,超過設(shè)定閾值的數(shù)據(jù)確定為可疑數(shù)據(jù)。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規(guī)則。如表2所示。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過時間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數(shù)都具有一定的空間分布特點,根據(jù)這些空間分布特點及規(guī)律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網(wǎng)的密度和被檢參數(shù)與空間的相關(guān)程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質(zhì)量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規(guī)定為:與被檢站點的數(shù)據(jù)進行比較時,鄰近站數(shù)據(jù)應保證正確。而對于鄰近站點數(shù)量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數(shù)據(jù)當做錯誤數(shù)據(jù)處理,未通過空間一致性檢查的數(shù)據(jù),QC碼只標注為1,并繼續(xù)進行其他檢查。
1.2.7 綜合分析法
在完成以上質(zhì)量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數(shù)據(jù)的將繼續(xù)對這些數(shù)據(jù)進行綜合分析對比。若同一數(shù)據(jù)的三個QC碼之和為3,即以上三種質(zhì)控檢查均未通過,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數(shù)據(jù)錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數(shù)據(jù)可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結(jié)果將給予較多的考慮權(quán)重;若QC碼之和為1,則認為該數(shù)據(jù)可以,QC碼標注為1。
1.3 數(shù)據(jù)質(zhì)量控制結(jié)果分析
為檢驗經(jīng)過上述質(zhì)量控制方法軟件系統(tǒng)自動進行質(zhì)控后結(jié)果的準確度,將2010年7月陜西省100個自動站的實時資料從數(shù)據(jù)庫中提取出來,采用原始人工質(zhì)量控制方法再一次進行質(zhì)量控制,并進行比較,計算機實時質(zhì)量控制結(jié)果人工驗證結(jié)果為(以個別要素為例):
1.3.1正點氣溫
在實時質(zhì)量控制階段總共檢測出了50個可疑和錯誤數(shù)據(jù)。經(jīng)過人工審核,除2個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼均正確未變,正確率為96%。
比對兩個數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數(shù)據(jù):小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過人工審核,1個可疑數(shù)據(jù)改為正確,其他數(shù)據(jù)質(zhì)量控制碼未變,正確率為98%。
比對所更改的數(shù)據(jù):
2010年7月2日14時戶縣氣溫數(shù)據(jù):小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規(guī)則時兩個參與的數(shù)據(jù)均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結(jié)果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質(zhì)量控制階段總共檢測出了50個錯誤和可疑數(shù)據(jù)。經(jīng)過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質(zhì)量控制階段總共檢測出了31個錯誤和可疑數(shù)據(jù)。經(jīng)過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質(zhì)量控制階段總共檢測出了140個可以或錯誤數(shù)據(jù)。經(jīng)過審核全部正確,正確率100%。
1.3.6相對濕度
實時質(zhì)量控制階段總共檢測出了37個可疑或錯誤數(shù)據(jù),全部正確,正確率100%。
通過比較發(fā)現(xiàn),上述質(zhì)量控制方法質(zhì)控結(jié)果準確度高于傳統(tǒng)的人工質(zhì)量控制方法,數(shù)據(jù)可信度較高。
2 結(jié)束語
進行自動站實時數(shù)據(jù)質(zhì)量控制,可以保證資料使用者使用有質(zhì)量保障的數(shù)據(jù)開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業(yè)務。氣象資料是氣象業(yè)務的基礎(chǔ),使用正確的數(shù)據(jù)開展業(yè)務研究、應用,才可以得出正確的結(jié)論。利用計算機技術(shù)進行自動站實時數(shù)據(jù)質(zhì)量,可以滿足實時氣象業(yè)務的需求。自動站實時數(shù)據(jù),由于其數(shù)據(jù)及時性,在天氣實況監(jiān)測方面,越來越受到業(yè)務人員的重視,已經(jīng)成為天氣實況分析的重要數(shù)據(jù)來源,特別是在災害性天氣監(jiān)測方面,自動站的優(yōu)勢非常明顯。近年來信息技術(shù)及網(wǎng)絡(luò)技術(shù)飛速發(fā)展,計算機的性能和處理數(shù)據(jù)的能力越來越快,因此利用計算機技術(shù),結(jié)合氣象探測資料質(zhì)量控制規(guī)則,對自動站實時數(shù)據(jù)進行自動質(zhì)量控制,可以迅速完成,保證數(shù)據(jù)時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質(zhì)量控制方法研究[J].安徽農(nóng)業(yè)科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統(tǒng)[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質(zhì)量控制業(yè)務系統(tǒng)的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質(zhì)量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質(zhì)量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質(zhì)量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質(zhì)量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint