国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

標準數(shù)字化轉(zhuǎn)型中標準標簽集發(fā)展與應用分析

2024-04-29 22:25:26趙青青蔡焱
標準科學 2024年1期

趙青青 蔡焱

關(guān)鍵詞:標準數(shù)字化轉(zhuǎn)型,標準標簽集,機器可讀標準

0引言

當前標準數(shù)字化轉(zhuǎn)型正在如火如荼地進行中。標準標簽集(StandardsTagSuite,STS)作為標準數(shù)字化轉(zhuǎn)型的關(guān)鍵技術(shù)之一,是推動標準數(shù)字化轉(zhuǎn)型的基礎(chǔ)。標準標簽集通過定義一套XML元素和屬性,對標準的規(guī)范性和非規(guī)范性內(nèi)容、標準采用和類標準文檔進行XML編碼,使標準的知識內(nèi)容獨立于最初交付內(nèi)容的形式。因此,標準標簽集又被稱為“標準的標準”。

1標準標簽集發(fā)展歷程

1.1ISOSTS

2011年底,國際標準化組織ISO對其出版系統(tǒng)進行改進,并與Mulberry公司合作,共同開發(fā)了用于ISO標準出版的ISO標準標簽集(ISOSTS)。自2011年第一版發(fā)布以來,ISOSTS已經(jīng)經(jīng)過5個版本的修訂,最新版本ISOSTS1.1于2013年發(fā)布,以美國國家信息標準組織NISO發(fā)布的ANSI/NISOZ39.96《期刊文章標簽集》(JournalArticleTagSuite,JATS)的0.4版草案為基礎(chǔ)。

自ISOSTS發(fā)布以來,一些ISO成員如英國標準協(xié)會BSI、澳大利亞標準協(xié)會SA和部分分銷商已經(jīng)采用該STS[1]。但由于ISOSTS并非官方標準,無法與JATS保持耦合,因此美國的一些標準開發(fā)組織和發(fā)行商并未采用。此后,不同標準開發(fā)組織使用了不同的XML模型來標記標準和類標準文檔,眾多的非標準化XML模型使得標準組織之間的互操作變得困難,增加了開發(fā)成本。推動ISOSTS走向標準化并與JATS建立正式關(guān)系勢在必行。隨后,ISO與NISO討論創(chuàng)建基于ISOSTS1.1的“標準的標準”,2017年NISO發(fā)布NISOSTS標準,并正式命名為ANSI/NISOZ39.102-2017(NISOSTS1.0)[2]。2020年春季,ISO在其在線標準開發(fā)平臺(OnlineStandardsDevelopmentplatform,OSD)中正式采用NISOSTS。

1.2NISOSTS

1.2.1NISOSTS1.0

ISOSTS1.1和NISOSTS1.0均基于JATS進行開發(fā),前者基于JATS的0.4版,后者基于2015年發(fā)布的JATS1.1版。同時NISOSTS1.0還以ISOSTS1.1為基礎(chǔ),完全向后兼容ISOSTS1.1。

NISOSTS1.0包括兩個標簽集:交換標簽集和擴展標簽集,這兩個標簽集由定義的元素和屬性構(gòu)成,旨在為標準發(fā)布和互操作提供模型,不同之處在于交換標簽集中唯一的表模型是基于XHTML,而擴展標簽集還提供OASIS/CALS表模型,為每個包含MathML2或MathML3的標簽集提供了語法(DTD、XSD和RNG形式)。

截至2018年3月底,ISO、IEC、CEN、BSI、DIN、AS等國際和國家標準機構(gòu)已采用NISOSTS1.0,ASTM、ASME、IEEE、API和SAE等機構(gòu)或采用NISOSTS1.0,或采用與其結(jié)構(gòu)基本相同的模型[3]。因為JATS是期刊出版中的XML標準,而NISOSTS又基于JATS,因此JATS和NISOSTS共享一組通用模塊,這對IEEE、ASME等同時出版期刊和標準的組織非常有利。

1.2.2NISOSTS1.2

2022年11月14日,NISO宣布發(fā)布更新版本STS,即NISOSTS1.2①,該版本已被美國國家標準協(xié)會ANSI批準為正式標準ANSI/NISOZ39.102-2022[4]。

NISOSTS1.2擴展了元素和屬性描述,以及交換標簽集和擴展標簽集,它還包含了對JATS1.3(ANSI/NISOZ39.96-2021)所做的適用修改。新版本變化包括:描述XML文件本身的規(guī)定、增加/修改了元素和屬性、擴展NISOSTSTBX簡介和術(shù)語顯示結(jié)構(gòu)等[5]。此外,NISOSTS1.2是完全向后兼容的,任何對版本1.0有效的文檔也對版本1.2有效。

1.3NISOSTS與ISOSTS的關(guān)系

此處主要以ISOSTS1.1和NISOSTS1.0為例,進行具體分析。NISOSTS1.0中的一些關(guān)鍵改進使其比ISOSTS1.1更加靈活[6]。

(1)NISOSTS1.0擴展了元數(shù)據(jù)功能,通過新增,旨在滿足任何標準組織的需求,而不是局限于ISO及國家標準機構(gòu);

(2)NISOSTS1.0簡化了術(shù)語顯示模型,并添加了額外的語義標簽,從而允許進行更注重顯示的建模;

(3)NISOSTS1.0為標準采用提供了一種新的遞歸模型;

(4)NISOSTS1.0同時容納XHTML和CALS表,以及MathML2和MathML3。相比之下,ISOSTS

1.1僅支持XHTML和MathML2。

2NISOSTS的組成

2.1元素

元素是名詞,例如standard、paragraph和ICS,它們是標準本身、標準的組成部分以及元數(shù)據(jù)。在NISOSTS中,每個元素都有兩個名稱,一個是標簽名稱,一個是元素名稱。標簽名稱是在標記文檔、DTD片段和模式以及軟件中使用的較短的機器可讀名稱,元素名稱是較長的描述性名稱,例如是元素paragraph的標簽名稱。NISOSTS1.2定義了353種元素。

在NISOSTS中,描述元素以元素的標簽名稱開始,后面緊跟元素名稱,許多元素還帶有用法或備注,以便將該元素與其他類似元素區(qū)分開。NISOSTS還提供元素允許使用的屬性類型、元素的父元素類型以及以何種組合使用的描述等,同時大多數(shù)元素都包含如何使用的標記示例。

2.2屬性

屬性是與元素相關(guān)聯(lián)的名稱-值對,用于修改元素的某些特性。屬性保存有關(guān)元素的事實,例如:在使用元素時,可使用屬性@sec-type確定相應的章節(jié)類型(例如scope、foreword、normrefs)。屬性也有兩個名稱,一個是較短的機器可讀名稱(標簽名稱),另一個是較長的人類可讀的描述性名稱,例如@id是屬性DocumentInternalIdentifier的標簽名稱。NISOSTS1.2定義了190種屬性。

屬性的描述方式與元素非常相似,但因?qū)傩圆荒苡凶訉傩?,所以只描述該屬性可以應用于哪些元素、該屬性的性質(zhì),以及屬性允許的值和默認值。

3NISOSTS的主要內(nèi)容

3.1根元素

NISOSTS主要通過文檔層次圖展示層次結(jié)構(gòu)。每個層次都有一個根元素,可以說明其他幾個附屬元素的結(jié)構(gòu)。針對標準本身、采用標準這兩種文本的特點,NISOSTS1.2定義了兩個根元素、,任何一個都可用作包含標準文本的文檔元素。用于標準和諸如指南或手冊等其他類標準文檔;包含關(guān)于采用和原始標準的信息,采用可能包括采用標準的組織信息,并包括采用組織提供的前頁(如前言)和附屬信息??梢郧短撞捎茫虿捎靡粋€或多個。

3.2根元素

可以分為如下結(jié)構(gòu)部分(如圖1所示)。

(1)前頁內(nèi)容,描述標準的封面及前言(如圖2所示)。

(2)主體,描述標準的正文(如圖3所示)。

(3)附屬信息,描述標準的附錄和參考文獻(如圖4所示)。

(4)處理元數(shù)據(jù),描述有關(guān)XML文件本身的處理信息(不是由XML文件編碼的標準)。

3.3根元素

可以分為如下結(jié)構(gòu)部分(如圖5所示)。

(1)描述采用標準自己的前頁內(nèi)容,包括文檔級元數(shù)據(jù)及采用組織的元數(shù)據(jù)等;

(2)描述采用組織提供的可選附屬信息。模型允許在被采用標準之前或之后使用,但不能同時使用;

(3)描述被采用標準的內(nèi)容,可能包括嵌套使用一個或多個、;

(4)描述有關(guān)XML文件本身的處理信息(不是由XML文件編碼的采用)。

4國內(nèi)外應用情況分析

4.1國外應用情況

4.1.1ISO/IEC在線標準開發(fā)平臺OSD

在線標準開發(fā)平臺OSD由ISO和IEC聯(lián)合開發(fā),為標準開發(fā)人員提供了一個全新的數(shù)字化工具,以簡化起草和編輯國際標準的過程[7],提高了從標準準備到最終發(fā)布的整個過程的效率和協(xié)作。

OSD平臺旨在用用戶友好的XML編輯器(FontoXML編輯器)取代傳統(tǒng)的基于Word的內(nèi)容創(chuàng)建過程,幫助標準開發(fā)人員從源頭創(chuàng)建復雜的結(jié)構(gòu)化內(nèi)容。雖然標準內(nèi)容基于NISOSTS編碼,但是標準開發(fā)人員卻無需了解XML或結(jié)構(gòu)化內(nèi)容編寫。XML優(yōu)先流程不僅便于編輯處理,而且由于編輯指令規(guī)則嵌入到OSD中,因此在標準開發(fā)的早期階段還可以提高內(nèi)容質(zhì)量。高效的工具允許標準開發(fā)人員專注于內(nèi)容而不是格式,從而生成語義豐富和結(jié)構(gòu)化的標準。CEN和CENELEC也引進了該平臺。

4.1.2可互操作規(guī)范和標準的語義網(wǎng)SWISS

SWISS(TheSemanticWebforInteroperableSpecificationsandStandards)由美國XSB公司開發(fā),是用于互操作規(guī)范和標準的語義網(wǎng)平臺[8]。

4.2國內(nèi)應用情況

4.2.1中國標準出版社“標準在線起草系統(tǒng)”

SWISS通過建立在NISOSTSXML之上的關(guān)聯(lián)數(shù)據(jù)模型[9],將PDF文檔轉(zhuǎn)換為上下文相關(guān)、可操作的數(shù)字數(shù)據(jù)對象,通過工程知識圖譜技術(shù),建立和管理文檔和概念之間的聯(lián)系,同時可通過API自動將結(jié)果數(shù)據(jù)傳送到企業(yè)的內(nèi)部系統(tǒng)[10]。SWISS通過在內(nèi)部內(nèi)容和外部標準之間建立自動和實時連接,提高合規(guī)性并降低風險。

中國標準出版社將傳統(tǒng)的標準制修訂業(yè)務與NISOSTS相結(jié)合,從源頭對標準文件進行XML數(shù)據(jù)化處理,實現(xiàn)對標準的全生命周期管理。標準在線起草系統(tǒng)可提供起草階段的在線協(xié)同編制、可視化修改、在線溝通,出版階段的智能審校、排版精調(diào),發(fā)布階段的微信推送和動態(tài)提醒等功能,對于縮短標準制修訂周期、提高工作效率、提升標準編寫質(zhì)量等方面發(fā)揮重要作用。

4.2.2同方知網(wǎng)“數(shù)字標準智能應用平臺”

數(shù)字標準智能應用平臺基于機器可讀和可理解的數(shù)字標準模型,面向標準化工作上下游場景及企業(yè)內(nèi)部標準化業(yè)務,實現(xiàn)標準全過程數(shù)字化管理。該平臺包含3個子系統(tǒng),其中底層標準數(shù)字化加工系統(tǒng)按照ISOSTS的要求,實現(xiàn)了標準智能標引、指標抽取、知識圖譜、碎片化閱讀等功能,具備ISO/IEC機器可讀標準模型中二級水平。

5結(jié)語

實施標準標簽集是標準數(shù)字化轉(zhuǎn)型的重要一環(huán)。我國對標準標簽集的研究最早可見于2019年發(fā)布的國家標準GB/T37967-2019《基于XML的國家標準結(jié)構(gòu)化置標框架》[11],但GB/T37967-2019并未基于JATS,因此與ISOSTS、NISOSTS在結(jié)構(gòu)上存在較大差異,故未能和國際接軌。隨著ISO/IEC機器可讀標準分級模型的提出,標準標簽集成為描述基于XML編碼的機器可讀文件的關(guān)鍵技術(shù),但是ISOSTS、NISOSTS主要面向標準出版,因此包含許多格式元素。當對標準中表格、段落中關(guān)鍵技術(shù)指標進行標記時,一般用HTML呈現(xiàn),因此缺乏相應的語義和特定含義,故不能進行邏輯推理判斷。要想實現(xiàn)更高水平的機器可讀能力,還需進一步引入語義更豐富的元素,從而真正實現(xiàn)標準的機器可用、可讀、可解析。

平江县| 永福县| 崇文区| 民县| 屏南县| 高淳县| 禄丰县| 开原市| 湟源县| 思南县| 安福县| 石屏县| 卢龙县| 临清市| 科尔| 乌拉特中旗| 伊通| 休宁县| 内黄县| 榆中县| 宁河县| 乌拉特中旗| 万载县| 仪征市| 涿鹿县| 延庆县| 文登市| 若尔盖县| 库车县| 滕州市| 舒兰市| 四子王旗| 新平| 临颍县| 武清区| 华宁县| 江都市| 修文县| 习水县| 城固县| 扎赉特旗|