任建玲,徐 梅
(天津市氣象信息中心 天津300074)
地面氣象觀測資料是研究區(qū)域乃至全球氣候變化與預(yù)測、天氣動(dòng)力分析、數(shù)值天氣預(yù)報(bào)模式研究、資料同化的基礎(chǔ),是雷達(dá)與衛(wèi)星定標(biāo)、水文設(shè)計(jì)、農(nóng)業(yè)決策的重要依據(jù)[1]。在2004 年自動(dòng)觀測儀器使用前多以紙質(zhì)記錄為主,1979 年按照中央氣象局業(yè)務(wù)管理處下發(fā)的《全國基本站地面氣象資料信息化基本模式暫行規(guī)定》,天津市氣象局氣候資料室(信息中心前身)啟動(dòng)了地面氣候資料信息化工作。氣候資料的信息化工作,就是把氣象臺(tái)站觀測的各類原始?xì)庀笥涗洠?jīng)過人工輸入微機(jī)處理,轉(zhuǎn)換成計(jì)算機(jī)能夠接收和處理的信息[2]。初期是使用紙帶穿孔方法對紙質(zhì)地面氣象觀測記錄月報(bào)表進(jìn)行信息錄入操作,用手工打鍵的方法,把手工記載的氣象資料變成電子計(jì)算機(jī)能接收識(shí)別的信息,記入紙帶、卡片、磁帶或膠片等信息載體[3],將資料進(jìn)行紙帶穿孔后利用光電機(jī)進(jìn)行復(fù)查,后用DJS-6-108 機(jī)進(jìn)行邏輯檢查。1985 年9 月國家氣象局配備了CCS400 型微機(jī),從此氣候資料信息化工作全部轉(zhuǎn)入CCS400 型微機(jī)上;1989 年底完成了天津市全部臺(tái)站歷史氣候資料的信息化任務(wù),形成了A0 模式數(shù)據(jù)文件;1990 年底又完成了全部信息化資料的標(biāo)準(zhǔn)處理和信息載體的轉(zhuǎn)換工作。A0 文件作為重要的信息化氣候資料為之后的氣象事業(yè)發(fā)展提供了可靠的基礎(chǔ)數(shù)據(jù)資源[3]。
1987 年配置了電子計(jì)算機(jī)后,開始用計(jì)算機(jī)審核、修改和打印氣象觀測報(bào)表。1997 年全市所有臺(tái)站的資料均由臺(tái)站直接將地面資料信息化處理后以D文件的形式上傳到市氣象局,全部機(jī)審和制作機(jī)制報(bào)表。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,氣象資料的傳輸方式發(fā)生了根本變化,由以前的人工報(bào)送或郵寄紙質(zhì)報(bào)表,改變?yōu)榫W(wǎng)絡(luò)傳輸,1999 年國家氣象局規(guī)定停止報(bào)送紙質(zhì)報(bào)表,只報(bào)送經(jīng)計(jì)算機(jī)處理的標(biāo)準(zhǔn)數(shù)據(jù)。
2005 年開始,天津市所有臺(tái)站改為自動(dòng)氣象站,大部分觀測項(xiàng)目實(shí)行自動(dòng)儀器觀測。由于歷史地面信息化資料時(shí)間跨度大,地面氣象觀測規(guī)范也做過多次修改,數(shù)據(jù)格式(特別是信息化數(shù)據(jù)格式)變動(dòng)非常大,信息化工作參與人員眾多等因素或多或少影響數(shù)據(jù)的質(zhì)量,對其進(jìn)行質(zhì)量評估意義非常重大。
通過對天津市信息化地面氣候資料的評估,達(dá)到以下目的:
①為其他各類觀測資料的信息化工作提供參考,總結(jié)經(jīng)驗(yàn)吸取教訓(xùn),以便進(jìn)一步提高資料信息化質(zhì)量。
②讓信息化氣候資料數(shù)據(jù)的使用用戶了解各個(gè)觀測要素疑誤發(fā)生的頻次、時(shí)間分布、空間分布,以便他們使用數(shù)據(jù)時(shí),有一個(gè)全局和客觀定量的把握。
③了解地面氣候資料整體質(zhì)量狀況、疑誤數(shù)據(jù)類別和原因,避免類似錯(cuò)誤再次發(fā)生,為確定進(jìn)一步質(zhì)量控制工作的重點(diǎn)和方法、為數(shù)據(jù)產(chǎn)品研發(fā)等后續(xù)工作提供依據(jù)。
本次評估主要針對信息化地面月報(bào)數(shù)據(jù)文件(A文件)進(jìn)行評估,包括:
①疑誤數(shù)據(jù)時(shí)間分布;
②疑誤數(shù)據(jù)空間分布;
③疑誤數(shù)據(jù)要素分布;
④疑誤數(shù)據(jù)產(chǎn)生原因分析。
評估項(xiàng)目:新版本A 文件中所有要素。
資料時(shí)段:1951—2004年(自動(dòng)站正式使用之前)。
評估臺(tái)站:2 個(gè)國家基本站,11 個(gè)國家一般站。
使用資料:天津13 個(gè)地面站建站至2004 年共6 718 個(gè)A0 文件;天津2 個(gè)基本地面站1951—2004 年共1 296 個(gè)A6 文件。
采用中國氣象局下發(fā)的省級質(zhì)量控制軟件對天津市13 個(gè)地面觀測站1951—2004 年共6 718 個(gè)A文件進(jìn)行質(zhì)量檢查,A 文件是由信息化產(chǎn)生的A0 文件和A6 文件合成轉(zhuǎn)換生成的,經(jīng)省級質(zhì)量控制軟件質(zhì)量控制,形成帶質(zhì)量控制碼的A 文件,并同時(shí)得到各月質(zhì)檢結(jié)果提示文件AIIiiiyyyymm_Check.txt(其中IIiii 為區(qū)站號,yyyy 為年份,mm 為月份),再利用“A 文件質(zhì)檢結(jié)果統(tǒng)計(jì)軟件”-Project_Count.exe,對質(zhì)檢結(jié)果進(jìn)行統(tǒng)計(jì)輸出。
統(tǒng)計(jì)結(jié)果輸出文件:ErrTXT.txt、ErrYaosu.txt 和ErrYear.txt。其中ErrTXT.txt 是經(jīng)整理確認(rèn)后的全部“錯(cuò)誤”“可疑”和“提示”內(nèi)容文本文件;ErrYaosu.txt 是按要素統(tǒng)計(jì)的“錯(cuò)誤”“可疑”和“提示”內(nèi)容文本文件;ErrYear.txt 是各要素按年份統(tǒng)計(jì)的“錯(cuò)誤”“可疑”和“提示”內(nèi)容文本文件。
評估公式:
統(tǒng)計(jì)結(jié)果顯示,天津市13 個(gè)觀測站的地面資料均有疑誤數(shù)據(jù)產(chǎn)生。薊州、城市氣候監(jiān)測站(市區(qū))出現(xiàn)的疑誤數(shù)據(jù)明顯多于其他臺(tái)站,而大港和東麗站出現(xiàn)的疑誤數(shù)據(jù)相對較少。其中市區(qū)為687 個(gè),是天津地區(qū)出現(xiàn)疑誤數(shù)據(jù)最多的臺(tái)站,占全部疑誤個(gè)數(shù)的17.3%。統(tǒng)計(jì)結(jié)果與觀測時(shí)間長短和數(shù)據(jù)量多少有一定的關(guān)系。
圖1 疑誤數(shù)據(jù)年際分布圖Fig.1 Interannual distribution of suspected and incorrect data
圖1 給出天津市疑誤數(shù)據(jù)個(gè)數(shù)的年際分布圖。如圖所示,1951—2004 年各氣象要素的疑誤個(gè)數(shù)基本呈現(xiàn)雙峰分布,20 世紀(jì)70 年代至80 年代前期以及80 年代中后期為疑誤數(shù)據(jù)的集中分布區(qū),2000 年以后銳減。從年際變化來看,1951、1953 年沒有出現(xiàn)疑誤數(shù)據(jù),1987 年疑誤數(shù)據(jù)出現(xiàn)最多,為220 個(gè)。
從疑誤數(shù)據(jù)的逐月分布來看(圖2),春、秋季月份出現(xiàn)的疑誤數(shù)據(jù)個(gè)數(shù)較少,而夏、冬季月份出現(xiàn)相對較多。其中,7 月份出現(xiàn)526 個(gè)疑誤數(shù)據(jù),是全年中最多的月份,4 月份出現(xiàn)的最少,僅為170 個(gè)。
圖2 疑誤數(shù)據(jù)月際分布圖Fig.2 Monthly distribution of suspected and incorrect data
本次評估的氣象要素依次為:氣溫、降水、氣壓、濕球溫度、水汽壓、相對濕度、云量云狀、能見度、天氣現(xiàn)象、蒸發(fā)量、積雪、風(fēng)、地溫、凍土深度、自記風(fēng)、自記降水量、10 分鐘平均風(fēng)、日照。
其中:氣溫資料出現(xiàn)24 條疑誤,占總疑誤數(shù)的0.60%;降水資料出現(xiàn)539 條疑誤,占總疑誤數(shù)的13.56%;氣壓出現(xiàn)21 條疑誤,占總疑誤數(shù)的0.53%;濕球溫度資料出現(xiàn) 109 條疑誤,占總疑誤數(shù)的2.74%;相對濕度資料出現(xiàn)疑誤195 條,占總疑誤數(shù)的4.91%;云量云狀資料出現(xiàn)疑誤173 條,占總疑誤數(shù)的4.35%;能見度資料出現(xiàn)疑誤47 條,占總疑誤數(shù)的1.18%;天氣現(xiàn)象出現(xiàn)疑誤2 607 條,占總疑誤數(shù)的65.60%;蒸發(fā)量出現(xiàn)疑誤5 條,占總疑誤數(shù)的0.12%;雪深雪壓資料出現(xiàn)疑誤35 條,占總疑誤數(shù)的0.88%;風(fēng)速資料出現(xiàn)疑誤 36 條,占總疑誤數(shù)的0.90%;地溫資料出現(xiàn)疑誤158 條,占總疑誤數(shù)的3.97%;凍土深度資料出現(xiàn)疑誤23 條,占總疑誤數(shù)的0.58%;日照時(shí)數(shù)資料出現(xiàn)疑誤2 條,占總疑誤數(shù)的0.05%。其他要素質(zhì)量正確,沒有疑誤。具體見圖3。
以疑誤信息出現(xiàn)最多的要素天氣現(xiàn)象為例,疑誤產(chǎn)生原因包括:天氣現(xiàn)象終止時(shí)間小于開始時(shí)間,終止時(shí)間輸入錯(cuò)誤;天氣現(xiàn)象代碼記錄重復(fù),降水現(xiàn)象代碼及時(shí)間重復(fù)輸入;天氣現(xiàn)象時(shí)間格式錯(cuò),輸入降水現(xiàn)象時(shí)間間斷出現(xiàn)沒用“′”分隔;天氣現(xiàn)象較多占行時(shí),遇逗號程序不認(rèn)提出錯(cuò)誤;降水現(xiàn)象轉(zhuǎn)換時(shí)連接記載,程序提出錯(cuò)誤等。其他要素出現(xiàn)疑誤信息的原因包括:數(shù)據(jù)人工錄入錯(cuò)、要素方位有誤、天氣現(xiàn)象與記錄矛盾、錄入錯(cuò)、漏錄天氣現(xiàn)象符號等。
圖3 各要素疑誤數(shù)據(jù)占比分布圖Fig.3 Distribution chart of proportion of suspected and incorrect data of each element
按疑誤數(shù)據(jù)產(chǎn)生的方式可以分為4 種。
觀測錯(cuò)誤:地面氣象觀測記錄簿上的數(shù)據(jù)有誤,這可能是觀測員的觀測錯(cuò)誤或記錄錯(cuò)誤。
報(bào)表數(shù)據(jù)錯(cuò)誤:信息化地面氣候數(shù)據(jù)時(shí)的基礎(chǔ)數(shù)據(jù)來源于地面氣象記錄月報(bào)表(即氣表-1),而氣表-1的數(shù)據(jù)來源于地面氣象觀測記錄簿,如果氣象臺(tái)站觀測員在制作氣表-1 時(shí),數(shù)據(jù)抄錄錯(cuò)誤,將導(dǎo)致最終信息化的A 文件有誤。
信息化過程中產(chǎn)生的錯(cuò)誤:這類錯(cuò)誤是指在人工錄入A0 文件時(shí),由于人為疏忽等原因產(chǎn)生的錯(cuò)誤,如將觀測的氣溫33.3 錄入為30.3。
其他錯(cuò)誤:數(shù)據(jù)不符合數(shù)據(jù)文件格式要求;數(shù)據(jù)質(zhì)量控制處理軟件對于不同觀測規(guī)范的處理方法不同導(dǎo)致提示疑誤信息;數(shù)據(jù)質(zhì)量控制處理軟件本身的Bug 所引起的等。
總體來看,信息化地面氣候資料A0 文件質(zhì)量可靠,由A0 轉(zhuǎn)換的A 文件由于種種原因出現(xiàn)的疑誤信息較多,主要集中在天氣現(xiàn)象、云、能見度這3 個(gè)要素。其他氣象要素是按照國家標(biāo)準(zhǔn)規(guī)范以及通過檢定部門檢測的儀器進(jìn)行觀測記錄,數(shù)據(jù)質(zhì)量是可靠的。從2020 年4 月1 日開始,地面氣象觀測邁入全面自動(dòng)化時(shí)代,有效消除了人為觀測造成的誤差,也有效控制了天氣現(xiàn)象、云、能見度這3 個(gè)要素的疑誤信息。綜合所有統(tǒng)計(jì)結(jié)果,天津市13 個(gè)國家級地面氣象臺(tái)站的平均單站月疑誤數(shù)據(jù)個(gè)數(shù)為0.57 個(gè),疑誤數(shù)據(jù)率為0.043‰。