文/蔡 焱
目前,機器可讀標準在國內(nèi)外尚未形成統(tǒng)一的明確的定義。根據(jù)國際標準化組織(ISO)、國際電工委員會(IEC)有關(guān)文件中的描述,這一概念可理解為標準的技術(shù)內(nèi)容可直接由機器、軟件或其他自動化系統(tǒng)解析和使用,并以數(shù)字形式提供給應(yīng)用程序或用戶自定義的方式,即在系統(tǒng)中無須人工操作即可實現(xiàn)機器可用、可讀、可解析的標準,簡稱SMART(Standards Machine Applicable, Readable and Transferable)。
機器可讀標準提供了一種標準新型表達方式和交付形式,使計算機系統(tǒng)能夠自主理解和處理標準,因此成為目前國際標準化組織的研究重點。機器可讀標準將加快適用于機器應(yīng)用的數(shù)字形式標準交付,使標準開發(fā)者(如技術(shù)委員會專家)、標準提供者(如ISO、IEC等)、標準使用者(如市場需求方)都能受益。
《ISO戰(zhàn)略2030》將數(shù)字技術(shù)帶來的影響作為戰(zhàn)略變革的驅(qū)動因素之一,認為數(shù)字技術(shù)的發(fā)展與其他傳統(tǒng)技術(shù)的融合將有助于提高標準交付效率和創(chuàng)造競爭優(yōu)勢,為ISO核心活動和產(chǎn)品帶來最大價值。
2018年,ISO建立了機器可讀標準戰(zhàn)略顧問組(SAGMRS),其主要任務(wù)包括:研究機器可讀標準的定義;制定ISO引入和實施機器可讀標準的路線圖;將標準格式轉(zhuǎn)換為機器可讀作為ISO優(yōu)先工作事項,制定ISO機器可讀標準指南等。
ISO認為,標準數(shù)字化轉(zhuǎn)型可劃分為兩個階段:第一階段為實施ISO標準標簽集(ISO Standards Tag Set);第二階段為推進機器可讀標準,實現(xiàn)標準的機器可用、可讀、可解析。
IEC也非常重視數(shù)字化轉(zhuǎn)型工作,包括機器可讀標準的研究。理事局(CB)將“機器可讀標準”納入2018版《IEC總體規(guī)劃》。該規(guī)劃提出,將積極應(yīng)對可直接由機器使用的數(shù)字標準新形式影響其核心業(yè)務(wù)的根本性轉(zhuǎn)變。標準化管理委員會(SMB)建立的數(shù)字化轉(zhuǎn)型戰(zhàn)略小組(SMB/SG 12“數(shù)字化轉(zhuǎn)型和系統(tǒng)方法”),則負責推進IEC的數(shù)字化轉(zhuǎn)型相關(guān)任務(wù),包括制定機器可讀標準框架。
除了國際標準化組織,世界發(fā)達國家均已啟動新型標準的研究和實施工作,標準數(shù)字化、開源化、系統(tǒng)化迅猛發(fā)展。
《2021歐洲標準化工作計劃》提及當年的戰(zhàn)略重點工作就聚焦在數(shù)字化轉(zhuǎn)型方面,包括對“標準在線協(xié)作編寫”在線平臺、“未來標準”和“開源創(chuàng)新”的研究。
美國國家標準學會(ANSI)在2019年—2020年的年報中強調(diào)了機器可讀標準的戰(zhàn)略重要性,其和美國行業(yè)合作伙伴正在幫助推進ISO實施機器可讀標準的發(fā)展,這為企業(yè)將ISO標準的內(nèi)容納入產(chǎn)品、流程和服務(wù)節(jié)省大量時間和成本。目前,ANSI已在無人機系統(tǒng)、5G、商業(yè)航天工業(yè)等6個領(lǐng)域開展相關(guān)研究工作。
2021年7月,英國政府發(fā)布《第四次工業(yè)革命標準:釋放標準創(chuàng)新價值的HMG-NQI行動計劃》。該計劃指出,英國標準協(xié)會(BSI)開發(fā)了新型標準形式BSI Flex,其具有靈活制定、快速迭代、迅速響應(yīng)市場需求、提供開放性咨詢等新型數(shù)字化標準特點。BSI將進一步研究機器可讀標準,與相關(guān)利益相關(guān)方合作和協(xié)商,以反映用戶的需要。BSI將與英國皇家認可委員會(UKAS)合作,推動機器可讀標準認證。
基于標準具有的機器可讀能力,ISO與IEC分別組建相應(yīng)戰(zhàn)略工作組,合作繪制了機器可讀標準的成熟度分類模型(見圖1)。該模型描述了數(shù)字標準的特征并將其分類到不同的級別,以定義一個標準的數(shù)字化程度。
圖1 機器可讀標準分類和特征
該模型共分為5個級別(0~4級):
0級——傳統(tǒng)紙本介質(zhì)(如紙質(zhì)文件、TXT);
1級——開放數(shù)字格式(如PDF),可顯示和搜索相關(guān)內(nèi)容;
2級——機器可讀文件(如XML),包含標準文本結(jié)構(gòu)化的內(nèi)容,可利用軟件識別文件結(jié)構(gòu)并執(zhí)行基本操作;
3級——機器可讀可執(zhí)行內(nèi)容,可根據(jù)應(yīng)用場景選擇性訪問賦有語義的標準內(nèi)容,可利用應(yīng)用程序界面(API)對標準內(nèi)容執(zhí)行更加復雜的操作;
4級——完全機器可解析標準,機器能夠以復雜的操作方式處理或解析文件。文件中包含表示標準內(nèi)容及元素之間相互關(guān)系的信息模型,可實現(xiàn)無斷點、無歧義的數(shù)據(jù)流;甚至具有自主學習和驗證的能力,以及自主詢問、應(yīng)答、提供預測性內(nèi)容的能力(如可響應(yīng)產(chǎn)業(yè)鏈采購、銷售環(huán)節(jié)的需求),可以不斷優(yōu)化內(nèi)容的訪問和處理方式。
其中0~2級主要側(cè)重標準制定和呈現(xiàn)形式的結(jié)構(gòu)化、數(shù)字化和初級語義化檢索,3~4級主要側(cè)重語義解析、互相關(guān)聯(lián)的數(shù)據(jù)流,適于行業(yè)應(yīng)用。該模型已在眾多國際、區(qū)域和國家標準組織中達成共識。
2021年10月10日,國務(wù)院印發(fā)《國家標準化發(fā)展綱要》,明確提出“標準數(shù)字化程度不斷提高”,要求“提升標準化技術(shù)支撐水平。發(fā)展機器可讀標準、開源標準,推動標準化工作向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型”。
目前,我國國家標準、行業(yè)標準、團體標準等多以紙質(zhì)文本或電子版PDF格式進行發(fā)布,還沒有建立類似于ISO/IEC數(shù)據(jù)庫形式標準、標準圖等標準在線制修訂和發(fā)布的模式,但在技術(shù)研究、科研項目、企業(yè)應(yīng)用中進行了有益探索。
2021年9月,我國成立了機器可讀標準化工作組。該工作組委派專家積極參與ISO/IEC數(shù)字化轉(zhuǎn)型戰(zhàn)略研究工作,以及相關(guān)技術(shù)委員會機器可讀標準的研制工作,在優(yōu)先領(lǐng)域(如工業(yè)自動化領(lǐng)域、航空領(lǐng)域)開展試點項目,研制機器可讀國家標準或行業(yè)標準;與德國標準化學會(DIN)、德國電工委員會(DKE)等開展機器可讀標準方面的國際合作,籌備建立中德機器可讀標準工作組,共同推動ISO和IEC朝著機器可讀和智能標準的方向發(fā)展。
按照機器可讀標準成熟度分級,我國國家標準主要為1級標準,與ISO、IEC及有關(guān)國家已進入XML格式等內(nèi)容結(jié)構(gòu)化階段存在一定差距。例如,歐洲eCl@ss協(xié)會,以通過標準化的產(chǎn)品描述簡化跨行業(yè)的電子商務(wù)為目標,基于與IT服務(wù)商的合作,充分發(fā)揮eCl@ss標準的機器可讀優(yōu)勢,目前已實現(xiàn)3~4級水平。
標準數(shù)字化轉(zhuǎn)型是標準化工作適應(yīng)全球數(shù)字化發(fā)展的必然趨勢。我們需要整合政府及研究機構(gòu)的力量,深耕機器可讀標準關(guān)鍵共性技術(shù)研究,逐步建立相應(yīng)標準體系,并在特定領(lǐng)域(如航空、建筑、油氣、工業(yè)自動化等領(lǐng)域)內(nèi)開展試點應(yīng)用,形成意見反饋和改進措施,努力在標準數(shù)字化轉(zhuǎn)型全球化進程中實現(xiàn)并跑,甚至超越。