王位鑫,陳德清
(水利部水利信息中心,北京 100053)
水利普查編碼的目的是以數(shù)字和字母代表水利普查對(duì)象及指標(biāo),準(zhǔn)確地識(shí)別和管理水利普查對(duì)象及指標(biāo),通過(guò)編碼簡(jiǎn)化對(duì)象之間關(guān)系的描述,方便基層普查工作的開(kāi)展及人工和計(jì)算機(jī)處理,提高數(shù)據(jù)處理工作效率,保障審核與匯總分析的順利開(kāi)展和最終普查數(shù)據(jù)的質(zhì)量。
通過(guò)編碼方案制定,梳理普查對(duì)象之間的關(guān)系,提高普查工作的科學(xué)性及可操作性;通過(guò)編碼對(duì)各環(huán)節(jié)的聯(lián)系,增強(qiáng)普查資料的正確性;通過(guò)編碼的簡(jiǎn)約化處理,方便資料錄入及計(jì)算機(jī)管理,提高水利普查工作效率;通過(guò)編碼在不同對(duì)象之間的聯(lián)系,加強(qiáng)信息共享與綜合分析。
目前水利行業(yè)現(xiàn)有的編碼標(biāo)準(zhǔn)有:SL213-1998《水利工程基礎(chǔ)信息代碼編制規(guī)定》、SL249-1999《中國(guó)河流名稱代碼》、SL259-2000《中國(guó)水庫(kù)名稱代碼》、SL263-2000《中國(guó)蓄滯洪區(qū)名稱代碼》、SL261-1998《中國(guó)湖泊名稱代碼》、SL262-2000《中國(guó)水閘名稱代碼》、SL452-2009《水土保持監(jiān)測(cè)點(diǎn)代碼》。
已有編碼標(biāo)準(zhǔn)經(jīng)過(guò)這些年的使用和完善在適應(yīng)性及普及方面存在很大的優(yōu)勢(shì),部分業(yè)務(wù)熟悉的專家甚至只通過(guò)水利工程的編碼,就能判斷出該工程所在的流域及工程相關(guān)的特征值。但是本次普查涉及的范圍廣,包涵 8 大專題共 30 類對(duì)象,如果仍然沿用原有標(biāo)準(zhǔn)會(huì)遇到如下問(wèn)題:
1)SL213-98《水利工程基礎(chǔ)信息代碼編制規(guī)定》[1]僅涉及 19 種水利工程及相關(guān)設(shè)施的編碼原則,分類工程的編碼分冊(cè)目前正式頒布的僅有 9 個(gè),有部分設(shè)施類編碼工作雖已列入修訂計(jì)劃,但仍在進(jìn)行之中,如堤防、海堤編碼標(biāo)準(zhǔn)啟動(dòng)多年,但仍難以收斂,還有一些設(shè)施類編碼工作目前尚未啟動(dòng),何時(shí)能將《水利工程基礎(chǔ)信息代碼編制規(guī)定》涉及的 19 種水利工程類別的編碼全部完成,目前還難以估計(jì)。
2)目前在用的河流、湖泊、水工設(shè)施編碼標(biāo)準(zhǔn)與本次普查涉及的 30 個(gè)對(duì)象類的類別重合率僅有16.67 %,在正式普查工作開(kāi)始之前設(shè)想采用編制并補(bǔ)齊行業(yè)標(biāo)準(zhǔn)的方式,完成普查所需的 25 類其它對(duì)象類編碼標(biāo)準(zhǔn)的現(xiàn)實(shí)可行性不大。
3)由于設(shè)施對(duì)象編碼中涉及河湖所在流域、干支流層級(jí)關(guān)系,不同設(shè)施類型的編碼隱含繼承關(guān)系要求。
例如水閘編碼(水閘編碼中包含著所屬流域信息)必須在河湖普查全部完成之后,方能順序組織開(kāi)展其它設(shè)施類對(duì)象的清查登記和編碼工作,編碼如圖1 所示[2]。既有編碼規(guī)則中規(guī)定的部分字段包含工程特征參數(shù),而在本次普查工作中是將其作為普查階段的工作進(jìn)行填報(bào)的,如果嚴(yán)格遵照行業(yè)標(biāo)準(zhǔn)開(kāi)展普查,勢(shì)必在對(duì)象清查登記階段,就會(huì)因編碼問(wèn)題把清查和普查 2 個(gè)階段的工作界限混淆。既有編碼規(guī)則要求在掌握全部對(duì)象個(gè)體的基礎(chǔ)上,由上級(jí)主管部門(mén)集中安排編碼方能保持其順序關(guān)系。而本次普查在預(yù)先不能確定對(duì)象個(gè)數(shù)的情況下,按(6+2)個(gè)普查主題、2860 個(gè)縣級(jí)基層普查單位并行作業(yè)的組織模式[3],如在清查登記工作執(zhí)行過(guò)程中因編碼問(wèn)題過(guò)多地牽扯時(shí)間和精力,用于各級(jí)普查單位之間的編碼協(xié)調(diào)問(wèn)題,勢(shì)必增加各級(jí)普查層級(jí)按時(shí)完成普查匯總分析工作的困難。
圖1 水閘編碼
從普查的實(shí)情考慮,舊的標(biāo)準(zhǔn)不能完全滿足本次普查的需要,因此重新定制 1 套新的、能滿足本次普查需求的編碼標(biāo)準(zhǔn)是必要的。
重新定制 1 套編碼標(biāo)準(zhǔn)不意味著完全拋棄舊的標(biāo)準(zhǔn),新的編碼標(biāo)準(zhǔn)只是為了服務(wù)于本次普查,在普查數(shù)據(jù)收集匯總后,可以通過(guò)基層填報(bào)的指標(biāo)屬性將對(duì)象按原有的編碼規(guī)則重新編碼,不會(huì)對(duì)已有標(biāo)準(zhǔn)的使用習(xí)慣造成影響。
擬采用對(duì)象編碼分為對(duì)象和指標(biāo) 2 種編碼。對(duì)象編碼用來(lái)標(biāo)識(shí)水利普查對(duì)象,作為水利普查對(duì)象指標(biāo)數(shù)據(jù)的管理唯一代碼,在整個(gè)水利普查數(shù)據(jù)庫(kù)中,所有對(duì)象編碼唯一,根據(jù)不同對(duì)象特點(diǎn)和管理需要,對(duì)象編碼采用數(shù)字串,可采用定長(zhǎng)或變長(zhǎng)編碼,除河流湖泊對(duì)象編碼外,其他對(duì)象編碼采用行政區(qū)劃代碼加行政區(qū)內(nèi)同類對(duì)象順序號(hào)組成對(duì)象編碼。對(duì)象編碼體系如表1 所示。指標(biāo)編碼也適用于水利普查 7 種對(duì)象類別,指標(biāo)編碼類型歸納為位置、時(shí)間、數(shù)值、枚舉和文字型 5 種,數(shù)值型根據(jù)指標(biāo)特點(diǎn)確定數(shù)位和取值范圍;枚舉型使用自然數(shù)順序編碼,在枚舉型中,除明確無(wú)其他項(xiàng)目外,確有其他項(xiàng)目的編碼均采用 9 或 99;文字型屬性編碼應(yīng)盡量少用,確有需要時(shí),應(yīng)限制其文本長(zhǎng)度并遵從 GB18030-2000《信息交換用漢字編碼字符集基本集的擴(kuò)充》。
表1 水利普查對(duì)象編碼體系
水利普查對(duì)象編碼僅限于信息系統(tǒng)內(nèi)部對(duì)象標(biāo)識(shí),除位置視角以外不捆綁其它任何屬性信息。
賦碼過(guò)程根據(jù)不同主題普查技術(shù)方案,分別采用內(nèi)業(yè)集中統(tǒng)一編碼或各級(jí)水利普查機(jī)構(gòu)并行賦碼 2 種方式,其成果在全國(guó)范圍內(nèi)唯一標(biāo)識(shí)水利普查對(duì)象。
對(duì)象在域內(nèi)順序編碼,因各種原因造成對(duì)象修改、調(diào)整時(shí),順序賦予新號(hào),使用過(guò)的域內(nèi)順序碼不允許重復(fù)使用。
對(duì)象跨行政區(qū)的,其行政區(qū)劃代碼使用上一級(jí)行政機(jī)構(gòu)的區(qū)劃代碼,跨省級(jí)行政區(qū)的全國(guó)行政區(qū)劃代碼約定使用 888888。
2.2.1 降低初始編碼難度
在普查實(shí)施過(guò)程中,充分考慮多主題、多個(gè)工作單元并行作業(yè),各級(jí)普查人員技術(shù)水平、能力不盡一致的現(xiàn)實(shí),從便于基層普查員盡可能獨(dú)立完成對(duì)象登記工作出發(fā),在對(duì)象清查初始登記階段簡(jiǎn)化編碼所必需遵從的依賴關(guān)系,優(yōu)先解決對(duì)象不重、不漏、不錯(cuò)問(wèn)題,在普查填報(bào)階段著重解決屬性完整問(wèn)題,借助數(shù)據(jù)庫(kù)對(duì)象個(gè)體和關(guān)系管理的雙重功能,適度分解對(duì)象清查、屬性普查填報(bào)工作的關(guān)聯(lián)度,最大限度地降低普查數(shù)據(jù)采集和數(shù)據(jù)庫(kù)建庫(kù)的工作實(shí)施難度。
2.2.2 分離普查實(shí)施與成果應(yīng)用
在完成普查任務(wù)的基礎(chǔ)上,考慮把業(yè)務(wù)應(yīng)用部門(mén)既關(guān)心對(duì)象個(gè)體,又關(guān)心其關(guān)聯(lián)關(guān)系和其它特征屬性的綜合編碼應(yīng)用問(wèn)題,放在普查成果的應(yīng)用階段進(jìn)行,可通過(guò)在普查成果內(nèi)部管理代碼與業(yè)務(wù)編碼映射關(guān)系的方式實(shí)現(xiàn)[4]。
2.2.3 分階段解決綜合問(wèn)題
在數(shù)據(jù)處理流程的設(shè)計(jì)過(guò)程中,根據(jù)數(shù)據(jù)處理流程的階段劃分,分別選擇了不同的優(yōu)先策略:在數(shù)據(jù)采集階段優(yōu)先解決數(shù)據(jù)準(zhǔn)確填報(bào)、數(shù)據(jù)質(zhì)量的把控(完整性、準(zhǔn)確性),在數(shù)據(jù)庫(kù)建庫(kù)階段通盤(pán)考慮適宜的數(shù)據(jù)粒度和關(guān)系的建立(嚴(yán)密性、可管理性、可持續(xù)性),數(shù)據(jù)成果應(yīng)用階段盡可能地兼顧多目標(biāo)(乃至目前還不能確定的目標(biāo))應(yīng)用需求(靈活性、適應(yīng)性)問(wèn)題,而不是僅通過(guò)編碼試圖解決所有應(yīng)用環(huán)節(jié)的不同問(wèn)題。
2.2.4 符合當(dāng)前 IT 主流設(shè)計(jì)理念和發(fā)展趨勢(shì)
本次普查數(shù)據(jù)處理過(guò)程試圖借鑒國(guó)外同類工作中長(zhǎng)期摸索總結(jié)形成的基本準(zhǔn)則,在數(shù)據(jù)處理流程中采用面向?qū)ο蟮?IT 設(shè)計(jì)理念,嚴(yán)格區(qū)分調(diào)查、數(shù)據(jù)建模、數(shù)據(jù)實(shí)體建庫(kù)、成果應(yīng)用 4 種不同的視角,采用:調(diào)查(6+2)主題:數(shù)據(jù)模型:數(shù)據(jù)庫(kù)實(shí)體(含元數(shù)據(jù)):普查專題成果,逐一建立映射關(guān)系的辦法予以保證,通過(guò)數(shù)據(jù)與應(yīng)用保持相對(duì)獨(dú)立的設(shè)計(jì),支持成果應(yīng)用多樣性目標(biāo)的有效實(shí)現(xiàn)(流域分區(qū)數(shù)據(jù)組織示例)。
擬采用對(duì)象編碼標(biāo)準(zhǔn)設(shè)計(jì)立足當(dāng)前,著眼未來(lái),不僅可以有效降低本次普查技術(shù)數(shù)據(jù)處理技術(shù)工作的組織難度,滿足本次普查數(shù)據(jù)匯集、處理全過(guò)程的工作需要,還可以兼顧未來(lái)普查成果綜合應(yīng)用共性需求(綜合庫(kù)的形式)和專項(xiàng)業(yè)務(wù)應(yīng)用個(gè)性化需求(專題庫(kù)的形式);通過(guò)普查成果的匯集,為各專業(yè)在其基礎(chǔ)上開(kāi)展專業(yè)應(yīng)用分析和編碼試驗(yàn)驗(yàn)證工作,提供必要的數(shù)據(jù)基礎(chǔ)。
[1]國(guó)家防汛抗旱總指揮部辦公室,河海大學(xué). SL213-98 水利工程基礎(chǔ)信息代碼編制規(guī)定[S]. 北京:中國(guó)水利水電出版社,1998: 1-12.
[2]國(guó)家防汛抗旱總指揮部辦公室. SL262-2000 中國(guó)水閘名稱代碼[S]. 北京:國(guó)家防汛抗旱總指揮部辦公室,2001: 1-20.
[3]中華人民共和國(guó)水利部,國(guó)務(wù)院第一次全國(guó)水利普查領(lǐng)導(dǎo)小組辦公室. 第一次全國(guó)水利普查實(shí)施方案綜述[R].北京:中華人民共和國(guó)水利部,2010:1-20.
[4]程益聯(lián). 第一次全國(guó)水利普查編碼方案[M]. 北京:中華人民共和國(guó)水利部,2010: 2-3.