張聰娥(陜西省氣象信息中心,西安 710014)
陜西省歷史高空氣象觀測記錄表數(shù)字化成果
張聰娥
(陜西省氣象信息中心,西安 710014)
簡要介紹了“陜西省歷史高空氣象觀測記錄表數(shù)字化處理”工作的內(nèi)容、成果,并對成果數(shù)據(jù)集、文件結(jié)構(gòu)進(jìn)行了簡要介紹,旨在使資料管理者和使用者及時(shí)了解氣象檔案數(shù)據(jù)結(jié)構(gòu),提高資料檢索能力和資料使用效率;最后指出了本次數(shù)字化資料存在的問題,以供使用者參考和后續(xù)資料整編修正。
數(shù)字化;掃描圖像數(shù)據(jù)集;錄入文件數(shù)據(jù)集;陜西
氣象資料數(shù)字化處理是將紙介質(zhì)歷史資料轉(zhuǎn)為電子介質(zhì)信息,以實(shí)現(xiàn)氣象資料的電子檢索和利用。由于年代長、保存條件差和PC-1500計(jì)算機(jī)打印質(zhì)量等問題,許多高空觀測記錄表紙張已經(jīng)出現(xiàn)不同程度的變質(zhì),字跡嚴(yán)重變淡、變模糊,這些原始觀測資料急需盡快拯救和保護(hù)。目前,國家氣息信息中心已對館藏的高空氣象觀測記錄月報(bào)表(高表-1、高表-2)進(jìn)行了數(shù)字化掃描和數(shù)字化錄入,而各省(區(qū)、市)氣象檔案館館藏的歷史高空氣象觀測記錄表高表-11、高表-12、高表-13、高表-14、高表-16還沒有進(jìn)行信息化處理,因此,中國氣象局啟動了《氣候變化應(yīng)對決策支撐系統(tǒng)工程》—“近代器測歷史氣候資料拯救和數(shù)字化子系統(tǒng)”項(xiàng)目,要求對歷史高空氣象觀測記錄表進(jìn)行數(shù)字化處理。陜西省2012年5月—2013年9月開展“陜西省歷史高空氣象觀測記錄表數(shù)字化處理”工作,對西安(涇河)、延安、漢中、安康、洛川5個(gè)高空探測站1954—2010年高表-11、高表-12、高表-13、高表-14、高表-16等高空觀測記錄表進(jìn)行數(shù)字化掃描,對1957—2010年07時(shí)和19時(shí)高表-12、高表-13中從地面~5 hPa規(guī)定等壓面風(fēng)資料進(jìn)行數(shù)字化錄入,并對所有掃描的圖像文件和錄入的數(shù)據(jù)文件進(jìn)行了認(rèn)真全面的質(zhì)量檢查。本文簡要介紹成果數(shù)據(jù)集、文件結(jié)構(gòu),使資料管理者和使用者及時(shí)了解氣象檔案數(shù)據(jù)結(jié)構(gòu),提高資料檢索能力和資料使用效率。
“陜西省歷史高空氣象觀測記錄表數(shù)字化處理”工作主要形成以下數(shù)字化成果:高空觀測記錄表掃描圖像文件數(shù)據(jù)集(見表1)、高空觀測規(guī)定等壓面風(fēng)錄入文件數(shù)據(jù)集(見表2)。
表1 陜西省高空觀測記錄表圖像文件數(shù)據(jù)集清單
表2 陜西省高空規(guī)定等壓面風(fēng)錄入文件數(shù)據(jù)集清單
2.1 高空觀測記錄表掃描圖像文件數(shù)據(jù)集
該數(shù)據(jù)集提供高空風(fēng)向風(fēng)速、壓、溫、濕等原始探測數(shù)據(jù),由若干圖像文件組成,每頁記錄表對應(yīng)一個(gè)文件。當(dāng)需要原始探測數(shù)據(jù)時(shí)可檢索該數(shù)據(jù)集里的文件,調(diào)閱對應(yīng)觀測記錄表圖像。
經(jīng)緯儀小球測風(fēng)觀測記錄表(高表-11)掃描圖像文件數(shù)據(jù)集提供規(guī)定高度層風(fēng)向、風(fēng)速等原始探測數(shù)據(jù);探空球測風(fēng)觀測記錄表(高表-12)掃描圖像文件數(shù)據(jù)集、雷達(dá)測風(fēng)觀測記錄表(高表-13)掃描圖像文件數(shù)據(jù)集、雷達(dá)單獨(dú)測風(fēng)觀測記錄表(高表-16)掃描圖像文件數(shù)據(jù)集提供規(guī)定高度、規(guī)定等壓面層風(fēng)向、風(fēng)速等原始探測數(shù)據(jù)。文件名為“UPAR_WEW_xx_MUL_FTM_GBnn_JPG_IIiii_YYYYMMDD_TTz.jpg”,其中“UPAR_WEW”、“MUL_FTM”、“JPG”為固定碼;“xx” 為省區(qū)標(biāo)識符,陜西省為SN;“GBnn”為高表類別代碼,nn取11、12、13、16時(shí)分別表示高表-11、高表-12、高表-13、高表-16;“IIiii”為區(qū)站號(如延安為53845);“YYYYMMDD_TTz”為記錄表年(4位)、月(2位)、日(2位)、時(shí)(北京時(shí),2位)、頁碼(1位)。例如:文件UPAR_WEW_SN_MUL_FTM_GB11_JPG_53845_19580101_191.jpg表示延安1958年1月1日19時(shí)小球測風(fēng)觀測記錄表第1頁;探空觀測記錄表(高表-14)掃描圖像文件數(shù)據(jù)集提供規(guī)定等壓面層、特性層、零度層及對流層頂高度、壓、溫、濕等原始探測數(shù)據(jù)。文件名為UPAR_WEA_xx_MUL_FTM_GB14_JPG_IIiii_YYYYMMDD_TTz.jpg ,其中“UPAR_WEA”、“GB”為固定碼,其余含義同上。如UPAR_WEA_SN_MUL_FTM_GB14_JPG_53845_19580101_072.jpg表示延安1958年1月1日07時(shí)探空觀測記錄表第2頁。
2.2 高空觀測規(guī)定等壓面風(fēng)錄入文件數(shù)據(jù)集
該數(shù)據(jù)集提供規(guī)定等壓面層高度、風(fēng)向、風(fēng)速等數(shù)字化數(shù)據(jù),由若干文本文件組成,每月對應(yīng)一個(gè)文件。當(dāng)需要數(shù)字化資料時(shí)可檢索該數(shù)據(jù)集里的文件,打開對應(yīng)文件讀取數(shù)據(jù)。
文件名為“GAAF-IIiii-YYYYMM.TXT”,簡稱GAAF文件(GAAF表示高空觀測規(guī)定等壓面層風(fēng)),“IIiii”、“YYYY”、“MM”分別為區(qū)站號、年份、月份。例如,文件GAAF-53845-195803.TXT表示延安1958年3月規(guī)定等壓面風(fēng)錄入文件。
GAAF文件由臺站參數(shù)、風(fēng)資料數(shù)據(jù)和文件結(jié)束符組成。臺站參數(shù)是文件的第一條記錄,共5組占一行,從左至右分別為區(qū)站號、測風(fēng)海拔高度、測站類別和探測次數(shù)、年份、月份;風(fēng)資料數(shù)據(jù)分時(shí)次(先07時(shí)后19時(shí))按日期升序錄入。每日數(shù)據(jù)記錄包括探測時(shí)間、各層(地面~5 hPa)數(shù)據(jù)兩部分。探測時(shí)間為一組,共8位占一行;各層數(shù)據(jù)排列規(guī)則為:每層5組數(shù)據(jù)占一行,從左至右分別為氣壓、位勢高度、時(shí)間、風(fēng)向、風(fēng)速,根據(jù)等壓面層數(shù)順序錄入。每日數(shù)據(jù)記錄以“,”結(jié)束,月最后一日記錄以“=”結(jié)束,文件以“######”結(jié)束。
(1) B01文件是包含規(guī)定等壓面風(fēng)資料的數(shù)據(jù)集,是最有比對性的參照數(shù)據(jù)源。利用“高空數(shù)據(jù)錄入質(zhì)量檢查軟件”對1981—2010年規(guī)定等壓面風(fēng)錄入數(shù)據(jù)進(jìn)行質(zhì)量檢查時(shí)主要采用“與B01文件對比檢查”這一檢查方法,而1957—1980年無B01文件,所以對這一段錄入數(shù)據(jù)進(jìn)行質(zhì)量檢查時(shí)由于沒有參照數(shù)據(jù),“與B01文件對比檢查”這一關(guān)鍵檢查無法進(jìn)行,錄入數(shù)據(jù)中存在的一些潛在錯(cuò)誤可能沒有及時(shí)發(fā)現(xiàn)。
(2)1957—1968年高表-11和高表-12交替使用頻繁,承擔(dān)高空觀測記錄表數(shù)字化的公司錄入人員不熟悉記錄表格式,有些時(shí)次高表-11的風(fēng)資料被誤錄入。由于高表-11是用規(guī)定等壓面的平均高度而非實(shí)測高度計(jì)算出來的風(fēng)資料,數(shù)據(jù)缺乏代表性,但時(shí)間緊、任務(wù)重,這些錯(cuò)誤還未得到糾正,以致這部分?jǐn)?shù)字化資料缺乏真實(shí)性和可信度。
以上問題有待在今后資料整編、資料服務(wù)以及業(yè)務(wù)、科研使用過程中繼續(xù)修正和完善。
張聰娥.陜西省歷史高空氣象觀測記錄表數(shù)字化成果[J].陜西氣象,2014(2):36-38.
1006-4354(2014)02-0036-03
2014-01-07
張聰娥(1963—),女,陜西戶縣人,工程師,從事高空氣象資料、報(bào)表審核。
中國氣象局重點(diǎn)建設(shè)項(xiàng)目“氣候變化應(yīng)對決策支撐系統(tǒng)工程”
B