趙毓峰 叢磊
摘要:針對當前出版業(yè)普遍存在的對于數(shù)據(jù)交換的迫切需求,以及各種系統(tǒng)之間數(shù)據(jù)接口系統(tǒng)擴展性、開放性和兼容性差的問題,本文提出了構(gòu)建“出版業(yè)通用數(shù)據(jù)交換生態(tài)”的概念,并且闡述了構(gòu)建“出版業(yè)通用數(shù)據(jù)交換生態(tài)”的應用目標、構(gòu)建原則、體系架構(gòu)及運行模式,從而大幅降低產(chǎn)業(yè)鏈數(shù)據(jù)共享投入,解決產(chǎn)業(yè)鏈數(shù)據(jù)共享難題,為產(chǎn)業(yè)信息交換的規(guī)范性、科學性提供應用保障,實現(xiàn)出版業(yè)內(nèi)外無差別的數(shù)據(jù)交換。
關(guān)鍵詞:出版業(yè);通用;數(shù)據(jù)交換;生態(tài)構(gòu)建
在數(shù)字化、信息化大潮的引領(lǐng)下,各出版單位都根據(jù)自己的實際情況進行了數(shù)字化、信息化建設(shè)。從圖書的選題策劃到編輯加工、印制發(fā)行等各個環(huán)節(jié)都有相應的數(shù)字化、信息化產(chǎn)品在運行,并產(chǎn)生了海量數(shù)據(jù)。在出版業(yè)的各個環(huán)節(jié)中,利用以物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、5G網(wǎng)絡(luò)、區(qū)塊鏈為代表的現(xiàn)代信息技術(shù)使這些數(shù)據(jù)互聯(lián)互通,消除信息孤島,從而構(gòu)建全行業(yè)的通用數(shù)據(jù)交換生態(tài),為有力推進出版業(yè)信息化進程作出貢獻。
目前,出版企業(yè)存在大量數(shù)據(jù)交換、分析方面的迫切需求,不僅有企業(yè)內(nèi)部數(shù)據(jù)交換需求,同時還有大量企業(yè)對外數(shù)據(jù)交換需求。
當前,國內(nèi)外出版企業(yè)普遍采用“FTP+XML[1]”接口模式進行數(shù)據(jù)交換?;诖四J介_發(fā)的接口采用的是“軟件代碼與業(yè)務代碼交織在一起”的模式,任意節(jié)點業(yè)務規(guī)則的變化,都會導致所有接口需要重新開發(fā)。此種數(shù)據(jù)交換模式,無論是研發(fā)費用,還是后續(xù)的維護和修改都耗資巨大,大大超出了出版企業(yè)的承受能力。具體表現(xiàn)在:①投入費用高。交換接口需定制開發(fā),且是特定的一對一方案,開發(fā)及維護投入較高。②綁定規(guī)則死。交換接口中“軟件代碼與業(yè)務代碼交織在一起”,任意節(jié)點業(yè)務規(guī)則發(fā)生變化,所有接口都要重新開發(fā)。③應用標準難。企業(yè)既對標準的認知存在偏差,又缺少平臺去應用標準。交換接口品種繁多,對標準的應用水平參差不齊,造成“有標準不用、有標準難用”的困境。④保障安全少。企業(yè)無力投入大量資金去設(shè)計部署安全方面的硬件、軟件、網(wǎng)絡(luò)一體化架構(gòu),給數(shù)據(jù)安全帶來極大隱患。
針對上述問題,出版產(chǎn)業(yè)通用數(shù)據(jù)交換技術(shù)重點實驗室提出構(gòu)建“出版業(yè)通用數(shù)據(jù)交換生態(tài)”,實現(xiàn)技術(shù)應用平臺化,從而構(gòu)建“四用”新生態(tài)的概念。這里的“四用”是指:①通用。即信息互聯(lián),采用“邏輯分離、應用貼合”原則,不再需要另行開發(fā)交換接口,任意兩個信息系統(tǒng)之間均可實現(xiàn)數(shù)據(jù)交換,徹底消除“信息孤島”。②可用。降低投入,出版企業(yè)無須專門購買交換平臺(含軟件),僅用少量資金或免費的方式,即可滿足高安全性、高穩(wěn)定性、高實時性的數(shù)據(jù)交換需求。③好用。模式重組,采用“云平臺+客戶端”運行模式,用戶使用更加方便。④實用。改變交換接口只能由原廠商開發(fā)的弊端,讓更多單位(或個人)成為數(shù)據(jù)交換方案創(chuàng)作者。超額流量收費,定額流量免費,流量費與“端交換方案”創(chuàng)作者進行分成,構(gòu)建行業(yè)數(shù)據(jù)交換新的應用生態(tài)。
1.出版業(yè)通用數(shù)據(jù)交換生態(tài)構(gòu)建應用目標
出版業(yè)通用數(shù)據(jù)交換平臺旨在建立一個開放的、通用的信息交換生態(tài)環(huán)境,支持不同廠家、不同版本的出版業(yè)應用系統(tǒng)接入,以實現(xiàn)各種出版業(yè)應用系統(tǒng)進行數(shù)據(jù)和信息的交換,減少對特定系統(tǒng)開發(fā)廠商的依賴。同時,可利用通用數(shù)據(jù)交換自主拓展更多創(chuàng)新服務。
2.出版業(yè)通用數(shù)據(jù)交換生態(tài)構(gòu)建原則
出版業(yè)通用數(shù)據(jù)交換生態(tài)構(gòu)建體現(xiàn)標準化、通用性和開放性原則。
(1)標準化原則
嚴格融入并執(zhí)行國家標準、行業(yè)標準、企業(yè)標準等現(xiàn)行標準,推動標準的落地應用。有標準的,嚴格執(zhí)行基于標準的數(shù)據(jù)交換。無標準的,按創(chuàng)作規(guī)范創(chuàng)作“準中間標準”,用于數(shù)據(jù)交換。改變出版業(yè)“有標準不用、有標準難用”的現(xiàn)狀。
(2)通用性原則
出版業(yè)大數(shù)據(jù)包括七類數(shù)據(jù),分別是機構(gòu)數(shù)據(jù)、人員數(shù)據(jù)、產(chǎn)品數(shù)據(jù)、政務數(shù)據(jù)、商務數(shù)據(jù)、用戶數(shù)據(jù)和內(nèi)容數(shù)據(jù)。出版行業(yè)數(shù)據(jù)分散在不同的主體當中,這七類數(shù)據(jù)散落在黨和政府部門、出版單位、發(fā)行商、圖書館、科研院所、廣電商、電商平臺等。主體收入數(shù)據(jù)分散,導致主管部門與出版行業(yè)主體之間、產(chǎn)業(yè)鏈上中下游主體之間信息不暢,信息系統(tǒng)缺乏互聯(lián)互通,產(chǎn)業(yè)鏈數(shù)據(jù)不能真正融合[2]。平臺提供通用的解決方案,不同系統(tǒng)廠商開發(fā)的各種業(yè)務系統(tǒng)都可以根據(jù)接口規(guī)范完成數(shù)據(jù)和業(yè)務邏輯的無縫交互。
(3)開放性原則
提出“端交換方案”創(chuàng)作標準,用以規(guī)范技術(shù)廠商(或個人)根據(jù)不同交換需求及信息系統(tǒng)業(yè)務邏輯制作的“端交換方案”,使“端交換方案”制作簡單可循,邏輯嚴謹完整,交換順暢無誤。遵循“代碼分離、應用貼合”的應用規(guī)則,將“端交換方案”的創(chuàng)作權(quán)交還給技術(shù)廠商或?qū)π畔⑾到y(tǒng)業(yè)務規(guī)則有深入把握的第三方技術(shù)服務商(或個人),而不是由特定開發(fā)商進行定制開發(fā)。
3.出版業(yè)通用數(shù)據(jù)交換生態(tài)的體系架構(gòu)
出版業(yè)通用數(shù)據(jù)交換生態(tài)以“出版產(chǎn)業(yè)通用數(shù)據(jù)交換云平臺”的形式體現(xiàn),通過“端交換方案+中間標準庫”的模式提供服務,具體架構(gòu)包含三個層次,分別是中間標準層、數(shù)據(jù)交換層和應用層。(如圖1所示)
(1)中間標準層
中間標準層是構(gòu)建出版業(yè)通用數(shù)據(jù)交換生態(tài)的基石,整合與出版產(chǎn)業(yè)相關(guān)的60余種出版、發(fā)行、信息類標準,如2006年頒布的《圖書流通信息交換規(guī)則》[3],以及2013年頒布的《中國出版物在線信息交換(CNONIX)圖書產(chǎn)品信息格式》[4]等標準,將標準中規(guī)定的信息交換的內(nèi)容、類型、格式規(guī)范、技術(shù)規(guī)范等定義在出版業(yè)通用數(shù)據(jù)交換生態(tài)中,形成“中間標準庫”。在出版業(yè)通用數(shù)據(jù)交換生態(tài)中的所有數(shù)據(jù)交換行為,都以中間標準庫中的定義為藍本進行。
出版業(yè)通用數(shù)據(jù)交換生態(tài)是一套開放的、通用的系統(tǒng),中間標準庫的存在,只是為不同應用系統(tǒng)或同一系統(tǒng)的不同版本提供一套數(shù)據(jù)交換依據(jù),絕不是要求生態(tài)中的用戶根據(jù)中間標準庫的定義修改正在運行的業(yè)務系統(tǒng),而是在原有系統(tǒng)用戶不做任何修改的前提下進行無縫對接。中間標準庫是出版業(yè)通用數(shù)據(jù)交換生態(tài)構(gòu)建標準化原則的具體體現(xiàn)。
對于現(xiàn)實中有交換需求,但又無國家(或行業(yè)、企業(yè))標準的,可以由需求方按照中間標準庫”的設(shè)計規(guī)范,自行創(chuàng)作交換規(guī)范,形成“準中間標準”上傳至“中間標準庫”。
(2)數(shù)據(jù)交換層
數(shù)據(jù)交換層是出版業(yè)通用數(shù)據(jù)交換生態(tài)中通用性和開放性原則的體現(xiàn),生態(tài)中不同系統(tǒng)、不同版本的數(shù)據(jù),依據(jù)中間標準層的定義在這里完成交換。數(shù)據(jù)交換層由兩個部分組成,分別是開發(fā)及管理終端和端交換方案。
1)開發(fā)及管理終端
開發(fā)及管理終端是出版業(yè)通用數(shù)據(jù)交換生態(tài)中的一個通用的工具軟件,以C/S架構(gòu)中客戶端的形式免費提供給所有用戶,包括應用系統(tǒng)開發(fā)廠商、應用系統(tǒng)用戶、第三方開發(fā)者以及生態(tài)系統(tǒng)管理者。
對于應用系統(tǒng)開發(fā)廠商及第三方開發(fā)者,開發(fā)及管理終端可用于檢索中間標準庫中的各種定義格式,以此為依據(jù)開發(fā)應用系統(tǒng)的端交換方案和準中間標準庫。最后上傳到出版業(yè)通用數(shù)據(jù)交換生態(tài)中。
對于應用系統(tǒng)用戶,開發(fā)及管理終端用于選擇適合自己的端交換方案并進行配置。
對于生態(tài)系統(tǒng)管理者,開發(fā)及管理終端用于系統(tǒng)管理、權(quán)限管理等。
2)端交換方案
端交換方案將信息系統(tǒng)運作行為抽象為connect、select、insert、update、delete、up、down、import、export、execute等類型,開發(fā)者只需根據(jù)具體的業(yè)務系統(tǒng)的相應版本,以中間標準庫為依據(jù),按照創(chuàng)作規(guī)范標準將數(shù)據(jù)庫交換字段及業(yè)務邏輯進行編制,并經(jīng)過與中間標準庫的審核確認,即可形成該版本的端交換方案。在出版業(yè)通用數(shù)據(jù)交換生態(tài)中,任意一款應用任意版本的端交換方案,都不是唯一的,由于中間標準庫以及創(chuàng)作規(guī)范標準都是開放的,無論是系統(tǒng)的開發(fā)廠商、系統(tǒng)用戶甚至是與應用系統(tǒng)無關(guān)的第三方,只要愿意,都可以根據(jù)自己對應用系統(tǒng)的理解和使用習慣開發(fā)端交換方案,并提交到出版業(yè)通用數(shù)據(jù)交換生態(tài)中供用戶選用。端交換方案并不局限于不同實體間(如:出版社與渠道商之間)數(shù)據(jù)的交換,同樣適用于單個實體內(nèi)部不同應用系統(tǒng)之間(如出版社內(nèi)部ERP系統(tǒng)與官網(wǎng)之間)的數(shù)據(jù)交換。
端交換方案開發(fā)者能夠因“端交換方案”被用戶采用而獲得收益,從而促進更廣泛的參與,避免僅靠應用系統(tǒng)原廠商單打獨斗開發(fā)接口的局面,從而構(gòu)建起數(shù)據(jù)共享、數(shù)據(jù)交換新的應用生態(tài)。
(3)應用層
應用層是出版業(yè)通用數(shù)據(jù)交換生態(tài)中的最終用戶,他們只需要根據(jù)自己的實際情況,在出版業(yè)通用數(shù)據(jù)交換生態(tài)中選擇最適合自己的端交換方案進行部署。由于所有端交換方案都是以中間標準庫為依據(jù)進行編制且進行過審核確認,因此,只要用戶選擇了自己滿意的端交換方案并且正確部署,即可與出版業(yè)通用數(shù)據(jù)交換生態(tài)中的任意系統(tǒng)進行數(shù)據(jù)交換。
由于端交換方案部署在應用系統(tǒng)的服務器端,不與應用系統(tǒng)的實際使用者發(fā)生直接的聯(lián)系,對于實際使用者是完全透明的,只需按照原來的操作運行即可,無須針對端交換方案進行專門的適應和培訓。
4.出版業(yè)通用數(shù)據(jù)交換生態(tài)的運行模式
如圖2所示,出版業(yè)通用數(shù)據(jù)交換生態(tài)由數(shù)據(jù)交換云平臺、技術(shù)廠商以及企業(yè)用戶三種角色組成。
(1)數(shù)據(jù)交換云平臺
數(shù)據(jù)交換云平臺定位于出版業(yè)通用數(shù)據(jù)交換生態(tài)的中間標準層,承擔著生態(tài)系統(tǒng)維護管理、標準制定與存儲、規(guī)則制定、端方案管理與校準、資源調(diào)度、收益分配、爭議仲裁等作用。
數(shù)據(jù)交換云平臺需要保障整個通用數(shù)據(jù)交換生態(tài)正常運轉(zhuǎn),進行平臺內(nèi)部各種系統(tǒng)的維護與控制,維護信息安全,保障傳輸網(wǎng)絡(luò)高效流暢,處理各種突發(fā)事件。
數(shù)據(jù)交換云平臺整合與出版產(chǎn)業(yè)相關(guān)的60余種出版、發(fā)行、信息類標準,將標準中規(guī)定的信息交換的內(nèi)容、類型、格式規(guī)范、技術(shù)規(guī)范等定義在出版業(yè)通用數(shù)據(jù)交換生態(tài)中,形成 “中間標準庫”,并提供檢索服務。
數(shù)據(jù)交換云平臺免費提供開發(fā)及管理終端,用于技術(shù)廠商客戶端進行中間標準檢索并以此為依據(jù)編制端交換方案。
數(shù)據(jù)交換云平臺存儲各方編制的端交換方案,供需要進行數(shù)據(jù)交換的企業(yè)用戶選用。同時,對端交換方案的狀況進行評估,制定端交換方案的使用規(guī)則。
(2)技術(shù)廠商
技術(shù)廠商定位于出版業(yè)通用數(shù)據(jù)交換生態(tài)的數(shù)據(jù)交換層,主要職能是為出版業(yè)通用數(shù)據(jù)交換生態(tài)提供針對各種應用的端交換方案,具體工作流程是:
1)從數(shù)據(jù)交換云平臺獲取開發(fā)及管理終端,向平臺注冊并登錄;
2)選擇需要編制端交換方案應用系統(tǒng)及版本;
3)從數(shù)據(jù)交換云平臺中間標準庫檢索并下載對應的中間標準;
4)編制端交換方案;
5)將編制好的端交換方案上傳到數(shù)據(jù)交換云平臺;
6)經(jīng)過數(shù)據(jù)交換云平臺審核認證后,成為最終的端交換方案供企業(yè)用戶使用;
7)根據(jù)數(shù)據(jù)交換云平臺制定的規(guī)則獲取收益;
8)迭代升級。
技術(shù)廠商在出版業(yè)通用數(shù)據(jù)交換生態(tài)中并不局限于某個應用系統(tǒng)的實際開發(fā)者,而是一個開放的概念,可以是應用系統(tǒng)的開發(fā)企業(yè)自身,也可以是系統(tǒng)的應用者、第三方企業(yè)甚至個人。只要對需要編制端交換方案的應用系統(tǒng)有足夠的了解和使用經(jīng)驗,并且愿意參與其中,就可以以技術(shù)廠商的身份向數(shù)據(jù)交換云平臺注冊賬戶,提交自己編制的端交換方案并從中獲取收益。
(2)企業(yè)用戶
企業(yè)用戶定位于出版業(yè)通用數(shù)據(jù)交換生態(tài)中的應用層,是出版業(yè)通用數(shù)據(jù)交換生態(tài)的最終使用者。企業(yè)用戶在出版業(yè)通用數(shù)據(jù)交換生態(tài)中選擇、使用端交換方案,與各種應用系統(tǒng)進行無縫的數(shù)據(jù)交換,提出自己的端交換方案需求,并根據(jù)數(shù)據(jù)交換生態(tài)中的規(guī)則支付費用。具體工作流程是:
1)從數(shù)據(jù)交換云平臺獲取開發(fā)及管理終端,向平臺注冊并登錄;
2)選擇開發(fā)應用系統(tǒng)的廠商;
3)選擇應用系統(tǒng)及版本;
4)選擇需要進行數(shù)據(jù)交換的企業(yè)用戶;
5)選擇端交換方案;
6)選擇啟用的單據(jù);
7)設(shè)置必要的運行參數(shù);
8)啟動方案成功;
9)進行數(shù)據(jù)交換;
10)繳納方案使用費;
11)根據(jù)實際使用情況提交升級需求;
12)迭代升級。
企業(yè)用戶只選擇針對自己應用系統(tǒng)及版本的端交換方案,而無須選擇針對需要和自己進行數(shù)據(jù)交換對方編制的端交換方案。選擇需要進行數(shù)據(jù)交換的企業(yè),是為了通過本方選定的端交換方案向?qū)Ψ竭x定的端交換方案推送本方數(shù)據(jù)需求。由于雙方的端交換方案都是依據(jù)中間標準庫編制并經(jīng)過了中間標準庫的認證,雖然雙方的應用系統(tǒng)、數(shù)據(jù)表項的表達方式、數(shù)據(jù)結(jié)構(gòu)都各不相同,但是通過端交換方案的轉(zhuǎn)換,即可進行數(shù)據(jù)的有效對接和交換。
端交換方案使用費分為內(nèi)網(wǎng)交換和外網(wǎng)交換兩種情況。
端交換方案的內(nèi)網(wǎng)交換是指本企業(yè)內(nèi)部各種應用系統(tǒng)之間的數(shù)據(jù)交換,由于數(shù)據(jù)交換在企業(yè)局域網(wǎng)內(nèi)部進行,不通過數(shù)據(jù)交換云平臺,免費使用。
端交換方案的外網(wǎng)交換是指通過數(shù)據(jù)交換云平臺與本企業(yè)以外的其他應用系統(tǒng)進行數(shù)據(jù)交換,這種情況根據(jù)使用該方案交換的數(shù)據(jù)流量進行計費。每個企業(yè)在首次接入數(shù)據(jù)交換云平臺時,數(shù)據(jù)交換云平臺都會為這個企業(yè)設(shè)定一個流量閥值,交換的數(shù)據(jù)流量低于流量閥值時,免費使用;數(shù)據(jù)交換流量超過預設(shè)流量閥值時按照數(shù)據(jù)流量收費,并與企業(yè)所選定的端交換的編制者按照比例分成。
端交換方案使用費的收取一方面為出版業(yè)通用數(shù)據(jù)交換生態(tài)不斷注入資金,使之能夠穩(wěn)定流暢地運行并不斷提高發(fā)展;另一方面端交換方案的編制者獲得了實際收益,能夠吸引更多的技術(shù)廠商加入出版業(yè)通用數(shù)據(jù)交換生態(tài)中,并對已有的交換方案不斷改進提高;企業(yè)用戶雖然付出了少量資金,但是能夠流暢準確地與相關(guān)應用系統(tǒng)進行數(shù)據(jù)交換,大大提高工作效率。三方各取所需,形成良性循環(huán)。
出版業(yè)通用數(shù)據(jù)交換生態(tài)項目結(jié)合生產(chǎn)實際設(shè)計,為行業(yè)服務。由中國新聞出版研究院、新華文軒出版?zhèn)髅焦煞萦邢薰尽⒈本┯∷W院、北京理工大學出版社、北京南北天地科技股份有限公司建立聯(lián)合研究機構(gòu),該研究機構(gòu)已被國家新聞出版署批準成立“出版產(chǎn)業(yè)通用數(shù)據(jù)交換技術(shù)重點實驗室”,共同打造開放式研發(fā)平臺。項目設(shè)計緊跟國家發(fā)展戰(zhàn)略,服務大局,在媒體深度融合、產(chǎn)業(yè)數(shù)據(jù)交換方面發(fā)揮主力軍作用。
出版業(yè)通用數(shù)據(jù)交換生態(tài)項目的推進,將大幅降低產(chǎn)業(yè)鏈數(shù)據(jù)共享投入,解決產(chǎn)業(yè)鏈數(shù)據(jù)共享難題,推動標準的落地應用,為產(chǎn)業(yè)信息交換的規(guī)范性、科學性提供應用保障,實現(xiàn)企業(yè)對內(nèi)、對外無差別的數(shù)據(jù)交換,并通過大數(shù)據(jù)技術(shù)推進行業(yè)智慧決策、智慧生產(chǎn)、智慧服務。
[1] 葉枝平,李振坤,劉竹松,等.基于XML的數(shù)據(jù)交換平臺的研究與設(shè)計[ J ] .微計算機信息,2008(9):243-244.
[2] 劉成勇.樹立數(shù)據(jù)思維,建設(shè)新聞出版大數(shù)據(jù)體系[ J ] .出版參考,2016(7):5-8
[3] CY/T 39-2006,圖書流通信息交換規(guī)則 [ S ]
[4] GB/T 30330-2013,中國出版物在線信息交換(CNONIX)圖書產(chǎn)品信息格式 [S]
(作者單位:出版產(chǎn)業(yè)通用數(shù)據(jù)交換技術(shù)重點實驗室北京理工大學出版社有限責任公司)