国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Elsevier文檔結(jié)構(gòu)規(guī)范的分析研究*

2015-10-13 06:31:22陸新民甘莉時(shí)華
數(shù)字圖書館論壇 2015年11期
關(guān)鍵詞:標(biāo)引表格文檔

陸新民,甘莉,時(shí)華

(中國(guó)科技出版?zhèn)髅焦煞萦邢薰?,北?100717)

Elsevier文檔結(jié)構(gòu)規(guī)范的分析研究*

陸新民,甘莉,時(shí)華

(中國(guó)科技出版?zhèn)髅焦煞萦邢薰?,北?100717)

結(jié)構(gòu)化的文檔格式規(guī)范是圖書和期刊等出版物實(shí)現(xiàn)數(shù)字化和按需出版、在線發(fā)布、全文數(shù)據(jù)庫(kù)建設(shè)、數(shù)據(jù)共享的基礎(chǔ)和支撐。文章介紹了Elsevier文檔結(jié)構(gòu)規(guī)范的基本內(nèi)容,描述了圖書和期刊元素結(jié)構(gòu),并基于Elsevier的文檔結(jié)構(gòu)規(guī)范完成了對(duì)國(guó)內(nèi)期刊出版物的標(biāo)引試驗(yàn)。實(shí)驗(yàn)結(jié)果表明Elsevier的DTD規(guī)范雖然并不能完全適合中文出版物,但作為領(lǐng)先數(shù)字出版公司的、已通過(guò)實(shí)踐生產(chǎn)檢驗(yàn)的企業(yè)標(biāo)準(zhǔn),對(duì)國(guó)內(nèi)企業(yè)甚至數(shù)字出版行業(yè)建立內(nèi)容資源結(jié)構(gòu)規(guī)范具有重要的參考和借鑒作用。

Elsevier;內(nèi)容結(jié)構(gòu)化;DTD;結(jié)構(gòu)化文檔;數(shù)據(jù)規(guī)范;XML

隨著數(shù)字技術(shù)和信息技術(shù)的興起和發(fā)展,傳統(tǒng)出版業(yè)正向數(shù)字出版轉(zhuǎn)型,各種出版物的出版形式、傳播手段、閱讀方式、市場(chǎng)主體以及商業(yè)模式都在不斷地發(fā)生變化,這些變化深刻的影響著出版物的內(nèi)容結(jié)構(gòu)。多樣化的數(shù)字資源是否具有統(tǒng)一的結(jié)構(gòu)屬性?對(duì)結(jié)構(gòu)屬性怎樣定義才能達(dá)到合適的顆粒度?對(duì)于這些問(wèn)題,國(guó)外大型出版機(jī)構(gòu)通過(guò)建立本公司的文檔結(jié)構(gòu)規(guī)范正逐步給出答案[1-3]。部分國(guó)外大型出版機(jī)構(gòu)也已完成本企業(yè)文檔結(jié)構(gòu)規(guī)范的制定,并成功應(yīng)用于企業(yè)出版物的數(shù)字化生產(chǎn)過(guò)程,如Elsevier的文檔結(jié)構(gòu)規(guī)范、NLM JATS標(biāo)簽集(美國(guó)國(guó)立醫(yī)學(xué)圖書館的期刊文檔標(biāo)簽集)。

Elsevier作為STM(科學(xué)、技術(shù)、醫(yī)學(xué))領(lǐng)域世界領(lǐng)先的產(chǎn)品和服務(wù)提供商,每年出版超過(guò)兩千種期刊和近兩萬(wàn)種圖書,其期刊和圖書均采用統(tǒng)一的文檔結(jié)構(gòu)規(guī)范進(jìn)行描述。本文對(duì)Elsevier的文檔結(jié)構(gòu)規(guī)范進(jìn)行了結(jié)構(gòu)分析和標(biāo)引試驗(yàn),以期為國(guó)內(nèi)企業(yè)和數(shù)字出版行業(yè)建立出版物文檔結(jié)構(gòu)規(guī)范提供參考和借鑒。

1 Elsevier文檔結(jié)構(gòu)規(guī)范分析

隨著計(jì)算機(jī)輔助生產(chǎn)(Computer-Aided Production,CAP)的發(fā)展,Elsevier超過(guò)兩千種STM期刊和越來(lái)越多的圖書實(shí)現(xiàn)了基于XML的數(shù)字資源生產(chǎn)。XML用于輸出成期刊和圖書的紙質(zhì)印刷版,同時(shí)用于Elsevier的數(shù)字產(chǎn)品如ScienceDirect平臺(tái),從XML中提取出來(lái)的摘要?jiǎng)t應(yīng)用于Scopus和PubMed平臺(tái)。

Elsevier的圖書和期刊內(nèi)容遵循XML優(yōu)先的原則,所有的文章和圖書都轉(zhuǎn)換為XML,作為所有紙質(zhì)或電子產(chǎn)品輸出格式的基礎(chǔ)。期刊和圖書的XML文件使用Elsevier的文檔結(jié)構(gòu)規(guī)范進(jìn)行描述;XML的文件結(jié)構(gòu)使用文件類型定義(DTD)進(jìn)行定義,Elsevier通過(guò)制定DTD系列標(biāo)準(zhǔn)來(lái)定義其文檔結(jié)構(gòu)規(guī)范。1992年,Elsevier制定了第一個(gè)版本的DTD用于描述期刊文章全文。此后不斷更新完善,從3.0版本到4.1、4.2、4.3版本,目前最新的為5.0版本。

1.1總體內(nèi)容結(jié)構(gòu)分析

Elsevier的整套DTD結(jié)構(gòu)圖見(jiàn)圖1,包括基本集CEP、期刊文章JA、期刊期次SI、圖書BK、增強(qiáng)片段EF等DTD模塊,同時(shí)CEP涵蓋了數(shù)學(xué)標(biāo)記語(yǔ)言MathML及CALS (Computer-Aided Logistics Support)table的內(nèi)容[4]。

圖1 Elsevier的DTD結(jié)構(gòu)圖

CEP為整套DTD的基本集,不同類型的出版物描述都是以此為基礎(chǔ)的。另外,Elsevier在實(shí)踐中發(fā)現(xiàn),對(duì)于其出版物中的一些復(fù)雜公式和表格,尚無(wú)法使用MathML和CALS完成描述。因此,Elsevier在CEP中也增加了一些對(duì)數(shù)學(xué)公式描述的標(biāo)簽,同時(shí)使用了1個(gè)Extend CALS(擴(kuò)展CALS表格模型),使得整套DTD能夠描述Elsevier出版物中的所有公式和表格。對(duì)于參考文獻(xiàn),Elsevier也單獨(dú)定義了結(jié)構(gòu)化參考文獻(xiàn)(Structured bibliographic references)。

結(jié)構(gòu)圖中各內(nèi)容的描述如下:

● CEP:Common Element Pool。該套DTD為基本集。

● MathML:Math Markup Language。在描述數(shù)學(xué)公式上,Elsevier采用了MathML標(biāo)準(zhǔn)。

● CALS table:Computer-Aided Logistics Support (SGML、XML顯示表格的標(biāo)準(zhǔn))。在描述表格上,Elsevier采用了CALS表格模型,并對(duì)其進(jìn)行了擴(kuò)展。

● JA:Journal Article。該套DTD用于描述期刊文章。

● SI:Serial Issue。該套DTD用于描述期刊期次。

● BK:Book。該套DTD用于描述圖書。

● EF:Enhancement Fragment。該套DTD用于描述添加到已在線出版的期刊和圖書的內(nèi)容,如exam元素。

1.2圖書內(nèi)容結(jié)構(gòu)分析

1.2.1圖書頂點(diǎn)元素

頂點(diǎn)元素可以作為XML文件的根元素。圖書頂點(diǎn)元素包括book、introduction、chapter、simplechapter、examination、fb-non-chapter、glossary、bibliography、index等。各元素描述圖書的不同內(nèi)容,詳見(jiàn)表1。

表1 圖書頂點(diǎn)元素

1.2.2book元素簡(jiǎn)介

在Elsevier的DTD中,圖書的主干結(jié)構(gòu)存儲(chǔ)為一個(gè)XML文件。該文件的根元素是book,用于描述圖書的主干結(jié)構(gòu),同時(shí)通過(guò)ce:include-item調(diào)用chapter、index等除book外的頂點(diǎn)元素,構(gòu)成對(duì)整本圖書的完整描述。

Book元素包括info、top、front、body(下含volume、part、section等子元素)、rear、ce:floats等子元素,必選的為info、top、body三個(gè)子元素。其中,info元素描述圖書的基本信息,如DOI、ISBN、版權(quán)、主題分類等。top元素描述圖書的標(biāo)題、版權(quán)頁(yè)、聲明頁(yè)內(nèi)容。圖書的文前部分(如序、前言)、正文部分、文后部分(如附錄)分別使用front、body、rear元素進(jìn)行描述。ce: floats作為圖書節(jié)點(diǎn)下可選的子元素,是圖片、表格等內(nèi)容的容器元素。圖書book頂點(diǎn)元素結(jié)構(gòu)圖見(jiàn)圖2。

1.2.3調(diào)用元素

圖書主干結(jié)構(gòu)文件的各元素通過(guò)ce:include-item元素調(diào)用包括CEP元素集下的其它元素,形成整個(gè)圖書的XML文件。下文詳細(xì)列出了book的子元素front、body、rear可調(diào)用元素的內(nèi)容。

front子元素可調(diào)用內(nèi)容包括contributing authors(作者)、reviewers(審稿人)、foreword (前言)、preface(序)、acknowledgement(致謝)、biography(作者簡(jiǎn)介)等。這些內(nèi)容放在fb-non-chapter下,front通過(guò)ce:include-item調(diào)用fb-non-chapter元素。

body、part、section元素可調(diào)用的元素包括chapter(章節(jié))、introduction(導(dǎo)論或介紹)、examination(問(wèn)答或測(cè)驗(yàn))、bibliography(書目或參考文獻(xiàn))等。

rearpart元素(rear的子元素)可調(diào)用的元素包括golssary(詞匯表)、bibliography(書目或參考文獻(xiàn))、index(索引)、fb-non-chapter(如附錄)等。

圖2 圖書頂點(diǎn)元素結(jié)構(gòu)圖

1.3期刊內(nèi)容結(jié)構(gòu)分析

1.3.1期刊頂點(diǎn)元素

用于描述期刊的包括兩個(gè)DTD:Journal Article DTD(JA)和Serial Issue DTD(SI),JA用于描述期刊文章,SI用于描述期刊期次,具體描述如表2所示。

表2 期刊頂點(diǎn)元素

1.3.2serial-issue元素簡(jiǎn)介

serial-issue元素包括issue-info、issue-data、issue-body三個(gè)子元素。issue-info描述期刊期次的唯一標(biāo)識(shí)信息,如DOI號(hào)、ISSN號(hào)、年卷期等。issuedata描述屬于期刊期次的數(shù)據(jù),如頁(yè)碼、封面圖片等。issue-body提供該刊期與其下屬內(nèi)容之間的關(guān)聯(lián),是對(duì)目錄的描述,下含ce:include-item元素或issue-sec元素。期刊期次的元素結(jié)構(gòu)圖見(jiàn)圖3。

圖3 期刊期次的元素結(jié)構(gòu)圖

JA下包括四個(gè)頂點(diǎn)元素,其中,article、simplearticle、book-review三個(gè)元素的結(jié)構(gòu)基本一致,下屬元素分別描述頂點(diǎn)元素的基本信息(item-info)、文前信息(head)、正文信息(body)、文后信息(tail)以及圖表的信息(ce:floats)。exam元素與上述三個(gè)元素的結(jié)構(gòu)不太相同,沒(méi)有描述正文信息和文后信息的元素,取而代之的是描述測(cè)驗(yàn)的問(wèn)題和答案的元素,分別為ce: exam-questions、ce:exam-answers元素,這兩個(gè)元素可以重復(fù)多次出現(xiàn)。

article的子元素item-info描述文章的基本信息,記錄期刊和文章在Elsevier系統(tǒng)里的編號(hào)、文章的pii和doi號(hào)等。head子元素描述文章的標(biāo)題、作者、關(guān)鍵詞、摘要以及時(shí)間信息等內(nèi)容。body子元素下含必選元素ce:sections,用于描述文章的段落內(nèi)容,其他四個(gè)元素均為可選元素。文章頂點(diǎn)元素的結(jié)構(gòu)圖見(jiàn)圖4。

圖4 文章頂點(diǎn)元素的結(jié)構(gòu)圖

2 國(guó)內(nèi)出版物標(biāo)引試驗(yàn)

經(jīng)過(guò)5.1版本到5.4版本的不斷改進(jìn),Elsevier的文檔結(jié)構(gòu)規(guī)范已經(jīng)較為完善。規(guī)范中的DTD結(jié)構(gòu)清晰、元素詳盡。通過(guò)分析圖書和期刊的頂點(diǎn)元素及其調(diào)用的元素可知,這些元素覆蓋了一本圖書或期刊文章的大部分內(nèi)容。

Elsevier作為荷蘭的圖書出版集團(tuán),其編寫的文檔結(jié)構(gòu)規(guī)范更適用于英文版的圖書和期刊。因此在用于中文出版物標(biāo)引過(guò)程中,要結(jié)合中文科技類期刊的特點(diǎn),對(duì)Elsevier的文檔結(jié)構(gòu)規(guī)范進(jìn)行擴(kuò)展,以適用于中文出版物的內(nèi)容結(jié)構(gòu),并為制定企業(yè)級(jí)文檔結(jié)構(gòu)規(guī)范打下良好基礎(chǔ)。

為此,選取《軟件學(xué)報(bào)》的一篇期刊文章《利用塊幾何約束及視差概率的立體匹配算法》進(jìn)行結(jié)構(gòu)標(biāo)引試驗(yàn)。對(duì)該文章全部?jī)?nèi)容進(jìn)行逐一查看、識(shí)別,找到Elsevier文檔結(jié)構(gòu)規(guī)范的相應(yīng)元素進(jìn)行標(biāo)引,形成XML文件。標(biāo)引文章的示意圖見(jiàn)圖5。

圖5 標(biāo)引文章示意圖

科技類圖書和期刊作為該領(lǐng)域研究成果的展現(xiàn)方式,充分體現(xiàn)了科技類知識(shí)的特點(diǎn)。為更好地實(shí)現(xiàn)科技類信息的交流和傳播,科技類圖書和期刊存在著大量的科技符號(hào)、表格和圖形,對(duì)此類內(nèi)容的標(biāo)引、結(jié)構(gòu)化存儲(chǔ),是研究科技類圖書期刊數(shù)字出版的重點(diǎn)方向。下文重點(diǎn)介紹使用Elsevier文檔結(jié)構(gòu)規(guī)范標(biāo)引期刊文章的公式、表格和圖片。標(biāo)引文章圖片和公式示意圖見(jiàn)圖6。

2.1公式

數(shù)學(xué)公式是科技類圖書和期刊中較常見(jiàn)的公式類型。數(shù)學(xué)公式表達(dá)方式對(duì)科技期刊文章被引用有極大影響,原因是其表達(dá)方式不規(guī)范容易導(dǎo)致讀者對(duì)公式產(chǎn)生恐懼感[5]。只有對(duì)數(shù)學(xué)公式進(jìn)行規(guī)范化的標(biāo)引和存儲(chǔ),才能在轉(zhuǎn)換和解析過(guò)程中正確地進(jìn)行表達(dá),不至于產(chǎn)生錯(cuò)誤或歧義。MathML作為國(guó)際通用的數(shù)學(xué)標(biāo)記語(yǔ)言,是一種基于XML的標(biāo)準(zhǔn),用來(lái)在互聯(lián)網(wǎng)上書寫數(shù)學(xué)符號(hào)和公式。在編制企業(yè)級(jí)文檔結(jié)構(gòu)規(guī)范中,將使用MathML作為描述數(shù)學(xué)公式的語(yǔ)言。

圖6 標(biāo)引文章圖片和公式示意圖

MathML由兩種基本獨(dú)立的標(biāo)記組成:一種是表現(xiàn)型標(biāo)記(Presentation Markup),用來(lái)描述數(shù)學(xué)公式的層次結(jié)構(gòu);另一種是內(nèi)容型標(biāo)記(Content Markup),用來(lái)描述數(shù)學(xué)公式的邏輯內(nèi)容。Elsevier的DTD傾向于使用表現(xiàn)型標(biāo)記,希望數(shù)學(xué)公式是由數(shù)學(xué)軟件生成,而不是由人工編寫的。當(dāng)按照規(guī)范的流程生成數(shù)學(xué)公式時(shí),文章將會(huì)包含表現(xiàn)型的數(shù)學(xué)標(biāo)記。表現(xiàn)型標(biāo)記可以精確地控制一個(gè)數(shù)學(xué)公式的外觀,如在網(wǎng)頁(yè)上的顯示,或在打印紙上的打印樣式等。

為了實(shí)現(xiàn)向后兼容性,Elsevier的文章和圖書目前不使用MathML版本2中的部分元素和屬性,Elsevier 的DTD規(guī)范中詳細(xì)列出了這些內(nèi)容。但是,Elsevier亦表示,隨著時(shí)間的推移和認(rèn)知的不斷變化,部分不使用的元素如mml:maction,未來(lái)也可能再次被使用。圖7展示了使用MathML表示的數(shù)學(xué)公式。

圖7 使用MathML表示的數(shù)學(xué)公式

2.2表格

表格同樣是科技類圖書和期刊中較常見(jiàn)的內(nèi)容,Elsevier對(duì)CALS表格模型進(jìn)行擴(kuò)展來(lái)完成對(duì)Elsevier文章和圖書中表格的描述。CALS表格模型作為SGML/ XML表示表格的事實(shí)標(biāo)準(zhǔn),由OASIS(結(jié)構(gòu)信息標(biāo)準(zhǔn)化促進(jìn)組織)發(fā)布,OASIS嚴(yán)格審查了CALS表格模型及支持它的軟件,以此形成了OASIS交換模型[6]。

Elsevier在實(shí)踐中發(fā)現(xiàn),盡管CALS表格模型定義了大量的參數(shù),但仍然無(wú)法滿足Elsevier的文章和圖書中表格的描述需求。因此,Elsevier的DTD擴(kuò)展了CALS表格模型中的border元素,并就column描述進(jìn)行了完善。圖8展示了使用CALS表格模型的表格。

圖8 使用CALS表格模型的表格

2.3圖片

Elsevier的DTD實(shí)現(xiàn)了對(duì)三種不同類型圖片的結(jié)構(gòu)化描述,其中,行內(nèi)圖片在ce:display元素內(nèi)描述,跨列圖片在ce:floats元素內(nèi)進(jìn)行描述,摘要內(nèi)的圖片則在ce: abstract元素內(nèi)描述。這三個(gè)元素的子元素ce:figure用于描述實(shí)際圖片的信息,而ce:figure的子元素ce:link實(shí)現(xiàn)對(duì)圖片資源的調(diào)用。

對(duì)于圖片資源或者其它外部資源文件(如mp3、video等),Elsevier是在XML中采用嵌入外部實(shí)體鏈接的方式完成的(使用ce:link元素)。目前Elsevier定義的資源類型有:TEXT(純文本文件)、IMAGE(GIF、JPEG、TIF格式文件)、VIDEO(AVI、MP4、MPEG格式文件)、APPLICATION(其它應(yīng)用程序文件、腳本、可執(zhí)行文件)、XML(外部XML文件,如矢量圖或者化學(xué)式等)。

3 Elsevier文檔結(jié)構(gòu)用于中文文檔的建議

通過(guò)利用Elsevier文檔結(jié)構(gòu)規(guī)范標(biāo)引國(guó)內(nèi)出版物的試驗(yàn),總結(jié)出Elsevier應(yīng)用于中文出版物的改進(jìn)建議。

3.1語(yǔ)言

在Elsevier的DTD中,語(yǔ)言屬性xml:lang只支持de|en|es|fr|it|pt|ru七種語(yǔ)言,并未包括中文zh。對(duì)于中國(guó)的大多數(shù)期刊來(lái)說(shuō),語(yǔ)言以中文為主,只有少部分為純英文期刊。在標(biāo)引過(guò)程中,將DTD語(yǔ)言的默認(rèn)值調(diào)整為中文。同時(shí),對(duì)于有中英文兩種語(yǔ)言的內(nèi)容,如作者、摘要、關(guān)鍵詞,通過(guò)語(yǔ)言屬性xml:lang進(jìn)行區(qū)分。

3.2具有中國(guó)特色的內(nèi)容

除了語(yǔ)言屬性外,國(guó)內(nèi)出版的期刊和文章的部分內(nèi)容,如期刊CN號(hào)、主管單位、中圖法分類號(hào)等具有中國(guó)國(guó)情的信息,在Elsevier的期刊DTD中未進(jìn)行描述。在設(shè)計(jì)企業(yè)文檔結(jié)構(gòu)規(guī)范時(shí),需增加元素描述該部分信息。

3.3增加的其他元素

由于DTD的內(nèi)容眾多,在實(shí)際生產(chǎn)過(guò)程中,可分別由作者、編輯、專家對(duì)各自擅長(zhǎng)的元素分別進(jìn)行標(biāo)引,確保各項(xiàng)標(biāo)引內(nèi)容的準(zhǔn)確性,提高數(shù)據(jù)生產(chǎn)加工的效率和質(zhì)量。在設(shè)計(jì)企業(yè)級(jí)的DTD時(shí),可增加屬性描述該信息。同時(shí),文檔結(jié)構(gòu)規(guī)范的設(shè)計(jì)還需考慮到系統(tǒng)間數(shù)據(jù)傳輸需要存儲(chǔ)的一些字段,如碎片化文件的大小、MD5碼、文件名等,需要擴(kuò)展新的元素進(jìn)行描述。

4 結(jié)語(yǔ)

本文對(duì)Elsevier圖書和期刊的文檔結(jié)構(gòu)規(guī)范進(jìn)行了詳細(xì)分析,并對(duì)國(guó)內(nèi)期刊出版物進(jìn)行了標(biāo)引實(shí)驗(yàn)。Elsevier的文檔結(jié)構(gòu)規(guī)范雖然并不能完全適合中文出版物的文字和內(nèi)容,但作為領(lǐng)先數(shù)字出版公司的、已通過(guò)實(shí)踐生產(chǎn)檢驗(yàn)的企業(yè)標(biāo)準(zhǔn),對(duì)國(guó)內(nèi)企業(yè)甚至數(shù)字出版行業(yè)建立內(nèi)容資源結(jié)構(gòu)規(guī)范具有重要的參考和借鑒作用[7]。為確保編制的規(guī)范成功應(yīng)用于企業(yè)的出版物,今后將在Elsevier文檔結(jié)構(gòu)規(guī)范分析的基礎(chǔ)上,制定適合于本企業(yè)出版物的企業(yè)文檔機(jī)構(gòu)規(guī)范,并使用測(cè)試檢驗(yàn)工具完成對(duì)文檔結(jié)構(gòu)規(guī)范的驗(yàn)證,并將研究成果應(yīng)用于內(nèi)容結(jié)構(gòu)化標(biāo)引與拆分系統(tǒng)的研制。

[1] 沈錫賓,李鵬,王紅劍,等. 中華醫(yī)學(xué)會(huì)系列期刊全文電子文檔交換和存儲(chǔ)標(biāo)準(zhǔn)初探[J]. 中國(guó)科技期刊研究,2015,16(5):475-479.

[2] 白杰,楊愛(ài)臣. XML結(jié)構(gòu)化數(shù)字出版的特點(diǎn)與流程[J]. 出版廣角,2015 (05):28-31.

[3] 沈錫賓,顧佳,包靖玲,等. 中國(guó)科技期刊文檔格式標(biāo)準(zhǔn)化任重道遠(yuǎn)[J].編輯學(xué)報(bào),2013,25(1):27-30.

[4] ELSEVIER[EB/OL].[2015-05-20].http://www.elsevier.com/wps/find/ authorsview.authors/dtds_htm.

[5] 謝文亮,張宜軍. 科技期刊中數(shù)學(xué)公式的規(guī)范表達(dá)[J]. 編輯學(xué)報(bào), 2013,25(3):240-242.

[6] CALS_Table_Model[EB/OL].[2015-05-29]. https://en.wikipedia.org/ wiki/CALS_Table_Model.

[7] 劉冰,游蘇寧. 我國(guó)科技期刊應(yīng)盡快實(shí)現(xiàn)基于結(jié)構(gòu)化排版的生產(chǎn)流程再造[J]. 編輯學(xué)報(bào),2010,22(3):262-266.

Analysis and Study on the Structural Standardization of Elsevier's Documentation

LU XinMin, GAN Li, SHI Hua
(China Science Publishing & Media Ltd., Beijing 100717, China)

Standardization of structuralized documentation format is the basis and support for publications such as books and journals to be digitalized, printed on demand, released online, data-banked in their entirety and to enjoy data sharing. This paper presents the fundamentals of the structural standardization of Elsevier' s documentation and describes in detail the elemental structures of books and journals, and based on the standardization of Elsevier's documentation structure, the indexing experiment on domestic journal publications has been completed. Although Elsevier's DTD Standardization cannot completely meet the characteristics of the language and content of the Chinese publications, this corporate standardization, created by the leading digital publishing corporation and having gone through the test of practice and production, can still be learned from or used as an important reference in setting the structural standardization of content resources for the whole digital publishing industry as well as this company.

Elsevier; Content Structuralization; DTD; Structuralized Documentation; Data Standardization; XML

G230.7

10.3772/j.issn.1673-2286.2015.11.007

陸新民,男,1971年生,碩士,中國(guó)科技出版?zhèn)髅焦煞萦邢薰靖本帉?,研究方向:信?hào)與信息處理,E-mail:luxinmin@mail.sciencep.com。

甘莉,女,1981年生,碩士,中國(guó)科技出版?zhèn)髅焦煞萦邢薰揪庉?,研究方向:?shù)字出版,E-mail:ganli@mail.sciencep.com。

時(shí)華,男,1981年生,碩士,中國(guó)科技出版?zhèn)髅焦煞萦邢薰靖吖?,研究方向:?xiàng)目管理、數(shù)字出版,E-mail:shihua@mail.sciencep.com。

2015-09-09)

* 本研究得到國(guó)家科技支撐項(xiàng)目“科技文獻(xiàn)動(dòng)態(tài)數(shù)字出版技術(shù)研發(fā)與應(yīng)用示范”(編號(hào):No.2012BAH90F00)資助。

猜你喜歡
標(biāo)引表格文檔
《現(xiàn)代臨床醫(yī)學(xué)》來(lái)稿表格要求
有人一聲不吭向你扔了個(gè)文檔
統(tǒng)計(jì)表格的要求
統(tǒng)計(jì)表格的要求
統(tǒng)計(jì)表格的要求
檔案主題標(biāo)引與分類標(biāo)引的比較分析
本刊對(duì)來(lái)稿中關(guān)鍵詞標(biāo)引的要求
基于RI碼計(jì)算的Word復(fù)制文檔鑒別
本刊對(duì)來(lái)稿中關(guān)鍵詞標(biāo)引的要求
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
武义县| 宿迁市| 乐陵市| 云阳县| 龙口市| 扶风县| 大安市| 永仁县| 竹山县| 延川县| 嘉义县| 邮箱| 泗阳县| 商丘市| 鹰潭市| 连城县| 乐安县| 肇源县| 达拉特旗| 益阳市| 莱芜市| 砚山县| 上林县| 建宁县| 承德县| 白银市| 东源县| 武川县| 贵阳市| 柏乡县| 庆云县| 岚皋县| 漳浦县| 壤塘县| 黎城县| 监利县| 达州市| 东乡| 呈贡县| 康定县| 祥云县|