国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

EPUB 3.1數(shù)字出版技術(shù)研究

2018-11-01 03:04:18遲亮
電腦知識(shí)與技術(shù) 2018年19期
關(guān)鍵詞:書卷出版物文檔

遲亮

摘要:本文了闡述EPUB 3.1數(shù)字出版標(biāo)準(zhǔn)的特點(diǎn)優(yōu)勢(shì),分析了EPUB數(shù)字出版物的文件結(jié)構(gòu),詳細(xì)分析了EPUB3.1標(biāo)準(zhǔn)的組成和關(guān)鍵文件的內(nèi)容。

關(guān)鍵詞:EPUB3.1;數(shù)字出版;文件結(jié)構(gòu)

中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)19-0239-04

EPUB(Electronic Publication)是免費(fèi)開放的數(shù)字出版物文檔格式標(biāo)準(zhǔn),以O(shè)EPS(Open EBook Publication Structure)開放式電子書出版結(jié)構(gòu)為前身發(fā)展至今,具有開放靈活等特點(diǎn),是國(guó)際數(shù)字出版論壇的正式標(biāo)準(zhǔn),也是當(dāng)前較為流行的數(shù)字出版技術(shù)。EPUB一個(gè)較為重要的版本規(guī)范EPUB 3.0是2011年10月推出的,之后于2013年進(jìn)行了微小的修訂,直至2017年國(guó)際數(shù)字出版論壇將EPUB 3.1版本批準(zhǔn)為標(biāo)準(zhǔn)推薦規(guī)范。本文對(duì)EPUB 3.1標(biāo)準(zhǔn)的優(yōu)勢(shì)、內(nèi)容組成、文件格式以及關(guān)鍵文件進(jìn)行了研究論述。

1 EPUB3.1標(biāo)準(zhǔn)的特點(diǎn)與優(yōu)勢(shì)

EPUB標(biāo)準(zhǔn)的最大特點(diǎn)是基于Web標(biāo)準(zhǔn),它實(shí)現(xiàn)了將包括XHTML(Extensible Hyper Text Markup Language)可擴(kuò)展超文本標(biāo)記語言、CSS層疊樣式表、SVG(Scalable Vector Graphics)可縮放矢量圖形、圖像文件及其他媒體資源在內(nèi)的多種格式的內(nèi)容結(jié)構(gòu)化地壓縮打包為一個(gè)單一文件,便于數(shù)字出版物的分發(fā)與交換,同時(shí)具有以下特點(diǎn):

1.1 可利用的媒體資源種類多

EPUB支持多種格式的媒體文件。在EPUB3.1標(biāo)準(zhǔn)新中增加了W3C萬維網(wǎng)聯(lián)盟公布的WOFF 2.0字體格式和起源于蘋果Macintosh的SNFT字體格式作為核心媒體類型。同時(shí)EUPB 3.1 動(dòng)態(tài)地將HTML 5和SVG的最新推薦版本作為使用標(biāo)準(zhǔn),放棄了EPUB 3.0.1版本中只針對(duì)HTML 5.0和SVG 1.1的過時(shí)參考。EPUB3.1定義核心媒體類型格式見表1。

1.2 格式開放,易于在線解析與生成

EPUB對(duì)開發(fā)人員友好,采用簡(jiǎn)單ZIP格式進(jìn)行壓縮打包,易于傳輸。內(nèi)部標(biāo)準(zhǔn)遵循XML和XHTML規(guī)范,易于解析與閱讀。同時(shí)EPUB標(biāo)準(zhǔn)是自由開放的,便于Web在線生成、處理和解析。

1.3 排版布局靈活,適用多種設(shè)備

EPUB標(biāo)準(zhǔn)充分體現(xiàn)了內(nèi)容適應(yīng)用戶的原則,使用它可以呈現(xiàn)固定布局排版的文檔,也可以現(xiàn)實(shí)內(nèi)容自動(dòng)重排。內(nèi)容重排的最大優(yōu)勢(shì)在于可以根據(jù)閱讀設(shè)備的性能用最適于用戶閱讀的方式呈現(xiàn)作品。EPUB3.1還提供多種功能樣式表,允許更改文字排列方向,允許用戶在日夜閱讀模式之間進(jìn)行選擇。

2 EPUB 3.1的文件格式結(jié)構(gòu)

EPUB標(biāo)準(zhǔn)發(fā)布的數(shù)字出版作品最終只呈現(xiàn)一個(gè)擴(kuò)展名為.epub的文件。EPUB在作品文件內(nèi)部劃分成“出版物”(Publication)、“書卷集”(Renditions)、“包”(Package)三級(jí)結(jié)構(gòu)來進(jìn)行管理。

1) EPUB出版物,即用EPUB規(guī)范最終生成的數(shù)字作品文件,它通過文件容器(EPUB Container)來進(jìn)行組織和呈現(xiàn)。即EPUB發(fā)布的數(shù)字作品中所有的內(nèi)容都存放在文件容器當(dāng)中,通過文件容器進(jìn)行壓縮打包后,可以對(duì)EPUB出版物進(jìn)行存儲(chǔ)和傳輸。

2) 書卷集。一個(gè)數(shù)字出版物中可以由一個(gè)或多個(gè)內(nèi)容獨(dú)立的作品來組成,EPUB標(biāo)準(zhǔn)將出版物中一個(gè)個(gè)獨(dú)立的作品稱內(nèi)容為“Rendition”,Rendition類似于傳統(tǒng)出版的一套書中多個(gè)獨(dú)立成冊(cè)的書卷,本文將“Rendition”譯作“書卷”。多個(gè)書卷即組成可用的書卷集(Renditions)。

3) EPUB包。一個(gè)書卷占用一個(gè)EPUB包。每個(gè)EPUB包內(nèi)都是由包文檔(Package Document)、導(dǎo)航文檔(Navigation Document)和內(nèi)容資源(Publication Resources)三部分組成。

包文檔是每個(gè)書卷內(nèi)必備的資源描述文件,它含有書卷的基礎(chǔ)元信息,提供書卷內(nèi)的資源清單,并定義默認(rèn)的閱讀順序。導(dǎo)航文檔是書卷內(nèi)專用必備文檔,提供了人機(jī)可讀的導(dǎo)航信息。內(nèi)容資源則是出版物要呈現(xiàn)的內(nèi)容的集合,包括有以XHTML、HTML或SVG文件形式出現(xiàn)的內(nèi)容文件、CSS樣式表、音頻、視頻、圖像、嵌入式字體和腳本等。

EPUB3.1標(biāo)準(zhǔn)下的三級(jí)格式結(jié)構(gòu),見圖1。

3 EPUB 3.1標(biāo)準(zhǔn)內(nèi)容的組成

EPUB標(biāo)準(zhǔn)具有模塊化的特點(diǎn),它把自身的核心特性和功能用一系列的子規(guī)范來進(jìn)行分別定義。EPUB 3.1標(biāo)準(zhǔn)較之前的版本,最重要的變化是啟用了多個(gè)新標(biāo)準(zhǔn)模塊,子規(guī)范由之前的4個(gè)變?yōu)榱?0個(gè)。這10個(gè)模塊中包括了核心標(biāo)準(zhǔn)和可選的補(bǔ)充規(guī)范兩大類。

同時(shí)從EPUB 3.1從版本開始,每個(gè)模塊均從EPUB格式和EPUB軟件應(yīng)用兩個(gè)方面來進(jìn)行描述,從而體現(xiàn)創(chuàng)作與呈現(xiàn)的一致性要求。EPUB軟件應(yīng)用指的是使用EPUB標(biāo)準(zhǔn)用來編輯發(fā)布或閱讀展示作品的應(yīng)用程序。

3.1 EPUB 3.1的核心標(biāo)準(zhǔn)

EPUB 3.1的核心標(biāo)準(zhǔn)主要有六個(gè)規(guī)范組成,它們分別是:

1) EPUB包規(guī)范(EPUB Packages 3.1)。該規(guī)范對(duì)書卷所包含的內(nèi)容以及與出版物資源相關(guān)聯(lián)的設(shè)置進(jìn)行描述,主要包括了包文檔、包的元數(shù)據(jù)和導(dǎo)航文檔內(nèi)容的規(guī)范。

2) EPUB內(nèi)容文件規(guī)范(EPUB Content Documents 3.1)。該規(guī)范定義了出版物中使用的XHTML,SVG、CSS文件以及其中含有的腳本、固定布局、詞匯發(fā)音的標(biāo)準(zhǔn)。

3) EPUB媒體覆蓋規(guī)范(Media Overlays 3.1)。本規(guī)范通過SMIL(Synchronized Multimedia Integration Language)同步多媒體集成語言定義了文本和音頻同步的格式和處理模型,對(duì)EPUB出版物中媒體層定議及媒體的建立和播放行為等內(nèi)容的描述,用于要求文字與媒體同步的數(shù)字出版物。

4) EPUB開放容器格式規(guī)范(Open Container Format 3.1),該規(guī)范簡(jiǎn)稱OCF,是EPUB標(biāo)準(zhǔn)中一個(gè)非常重要的容器技術(shù)規(guī)范,它定義了EPUB出版物的文件格式和處理模型,并將出版物所有相關(guān)內(nèi)容按規(guī)范打包封裝在單一的文檔容器中,同時(shí)還定義了一種出版物資源混淆嵌入的方法。本規(guī)范中定義的容器包括抽象容器和ZIP容器兩部分。

OCF抽象容器是一種文件系統(tǒng)模型,它要求EPUB出版物內(nèi)所有內(nèi)容使用一個(gè)共同的根目錄中,所有本地資源都位于根目錄所在的目錄樹中,但不強(qiáng)制資源目錄的結(jié)構(gòu)形式。抽象容器模型要求在根目錄下強(qiáng)制包含一個(gè)名為META-INF文件夾,用于存儲(chǔ)特殊的配置文件,相關(guān)配置文件的名稱和作用見表2。抽象容器模型在根目錄中的強(qiáng)制包含一個(gè)文件名“mimetype”的文件,保留供OCF ZIP容器使用。抽象容器模型對(duì)資源文件的要求較為寬松,理論上OCF抽象容器中所有資源文件可以位于根目錄下的任何位置,只要它們不在META-INF文件夾中即可,但是為方便對(duì)出版物的解析,建議將EPUB出版物的內(nèi)容存儲(chǔ)在根目錄下的一個(gè)專用文件夾中。

OCF ZIP容器規(guī)定了最終的出版物采用一個(gè)ZIP壓縮的文件來進(jìn)行發(fā)布,文件擴(kuò)展名為.epub。OCF允許使用“Deflate”算法或“不壓縮”兩種情況進(jìn)行文件壓縮,之外的算壓不支持,不能進(jìn)行加密壓縮,不允許分卷壓縮。

5) EPUB可訪問性規(guī)范(EPUB Accessibility)。該規(guī)范定義為了出版物定義了可訪問性、一致性和發(fā)現(xiàn)元數(shù)據(jù)(Discovery Metadata)的標(biāo)準(zhǔn)。本規(guī)范不針對(duì)單個(gè)版本的EPUB。它旨在適用于符合任何版本或配置文件(包括未來版本的標(biāo)準(zhǔn))的EPUB出版物。

6) 替代樣式標(biāo)簽規(guī)范(Alternate Style Tags)。定義了使用微格式標(biāo)記替代樣式表的模式。

3.2 EPUB 3.1可選規(guī)范

EPUB 3.1的可選規(guī)范主要有:EPUB規(guī)范片段標(biāo)識(shí)符(Canonical Fragment Identifiers)、EPUB詞典和詞匯表(Dictionaries and Glossaries)、EPUB索引(EPUB Indexes)、EPUB多書卷呈現(xiàn)(Multiple Renditions)、EPUB預(yù)覽(Previews)和EPUB區(qū)域?qū)Ш剑≧egion-Based Navigation)等,用于增強(qiáng)EPUB出版物的功能和用戶體驗(yàn)。

4 EPUB3.1標(biāo)準(zhǔn)中的關(guān)鍵文件

在EPUB 3.1標(biāo)準(zhǔn)中指定了EPUB出版物必備或重要的配置文件,這些文件對(duì)出版物的制作和閱讀起到了重要作用,要想在線生成或解析閱讀EPUB數(shù)字出版物,必對(duì)這些關(guān)鍵文件進(jìn)行準(zhǔn)確配置。其中幾個(gè)必要文件的文件格式分析如下:

4.1 Mimetype文件

在EPUB文件根目錄下必須存在一個(gè)名“mimetype”的文件,它內(nèi)容較為簡(jiǎn)單,僅對(duì)壓縮包的打開方式進(jìn)行了說明,其文件內(nèi)容為“application/epub+zip”,它表示出版物的壓縮包文檔可以用EUPB和ZIP兩種方式來進(jìn)行解析使用。實(shí)事上EPUB格式的出版物將擴(kuò)展名由.epub改為.zip后,可以使用相應(yīng)的解壓縮文件解壓或打開,并且不影響文件內(nèi)容。

4.2 OPF文件

EPUB出版物中的每個(gè)書卷都必須一個(gè)包文檔,包文檔的文件名稱不限定,但擴(kuò)展名必須為“.opf”,內(nèi)部文件格式采用XML標(biāo)準(zhǔn),通過包文檔可以準(zhǔn)確識(shí)別整個(gè)數(shù)字出版物的結(jié)構(gòu)及閱讀順序,是解析出版物及顯示EPUB出版物的主要信息來源。

包文檔內(nèi)部使用作為根標(biāo)簽。標(biāo)簽有“version”、“unique-identifier”、“dir”、“id”、“prefix”和“xml:lang”等六個(gè)屬性,其中“version”、“unique-identifier”是必須定義的?!皏ersion”屬性值表明一EPUB文件所采用EPUB規(guī)范的版本,“unique-identifier”屬性值設(shè)定了對(duì)文件內(nèi)標(biāo)簽的引用,以獲取作品的唯一標(biāo)識(shí)符,如UUID、DOI、ISBN或ISSN等。標(biāo)簽內(nèi)按照順序依次包含、等四個(gè)標(biāo)簽。其中、三個(gè)為必備的標(biāo)簽。標(biāo)簽提供書卷基本信息和內(nèi)容布局的顯示信息,便于檢索書目信息和訪問控制。標(biāo)簽提供書卷內(nèi)容資源的列表,每一個(gè)資源都由一個(gè)標(biāo)簽來表示。標(biāo)簽提供書書卷內(nèi)容資源的順序列表,通過子標(biāo)簽的順序定義默認(rèn)閱讀順序。

、可用的屬性和子標(biāo)簽的信息見表3。

表3 、標(biāo)簽的可用屬性和子標(biāo)簽表

[標(biāo)簽名 順序 可用屬性 可包含的子標(biāo)簽 必要性 metadata 1 無 標(biāo)識(shí)符 至少1項(xiàng),可多項(xiàng) 標(biāo)題 至少1項(xiàng),可多項(xiàng) 語言 至少1項(xiàng),可多項(xiàng) 可用的標(biāo)簽 可以省略,可多項(xiàng) 定義子標(biāo)簽變量的值 至少1項(xiàng),可多項(xiàng) 鏈接資源信息 可以省略,可多項(xiàng) manifest 2 "id" 內(nèi)容資源信息 至少1項(xiàng),可多項(xiàng) spine 3 "id"

"page-progression-direction"

猜你喜歡
書卷出版物文檔
書卷多情似故人
紅豆(2022年9期)2022-11-04 03:14:50
有人一聲不吭向你扔了個(gè)文檔
窗外
2017年出版物
基于RI碼計(jì)算的Word復(fù)制文檔鑒別
薛紹彭《雜書卷》
Global analyses of sea surface temperature, sea ice, and night marine air temperature since the latenineteenth century
Arctic sea ice decline: Faster than forecast
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
2015 年出版物
高阳县| 元朗区| 泾阳县| 沽源县| 吉水县| 南充市| 泾川县| 县级市| 年辖:市辖区| 通海县| 漳平市| 长武县| 海盐县| 临湘市| 花莲县| 建瓯市| 攀枝花市| 调兵山市| 翁源县| 博湖县| 绥中县| 镇康县| 卫辉市| 黄龙县| 中牟县| 云浮市| 安阳市| 监利县| 广饶县| 射洪县| 海门市| 安国市| 义马市| 乌拉特前旗| 凤城市| 琼结县| 桐庐县| 赤壁市| 高尔夫| 清河县| 丹阳市|