国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新技術(shù)在科技期刊出版中的應(yīng)用

2019-01-16 07:10:40付洪韜趙婧黃萌肖云
出版與印刷 2018年4期
關(guān)鍵詞:方正出版單位結(jié)構(gòu)化

付洪韜 趙婧 黃萌 肖云

科技期刊作為學(xué)術(shù)傳播與交流的重要載體,在發(fā)布和記錄科研成果、推動學(xué)術(shù)爭鳴、激發(fā)創(chuàng)新思維、引領(lǐng)學(xué)科發(fā)展等方面長期發(fā)揮著非常重要的作用。2018年11月14日,國家主席習(xí)近平主持召開中央全面深化改革委員會第五次會議并發(fā)表重要講話,會議審議通過了《關(guān)于深化改革培育世界一流科技期刊的意見》(以下簡稱《意見》)。《意見》中強(qiáng)調(diào),科技期刊傳承人類文明,薈萃科學(xué)發(fā)現(xiàn),引領(lǐng)科技發(fā)展,直接體現(xiàn)國家科技競爭力和文化軟實(shí)力。要以建設(shè)世界一流科技期刊為目標(biāo),科學(xué)編制重點(diǎn)建設(shè)期刊目錄,做精做強(qiáng)一批基礎(chǔ)和傳統(tǒng)優(yōu)勢領(lǐng)域期刊。習(xí)主席的講話,為中國科技期刊的發(fā)展注入了推進(jìn)劑。

近年來,在互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展和帶動作用下,國內(nèi)外科技期刊出版領(lǐng)域在生產(chǎn)方式、傳播方法、內(nèi)容服務(wù)模式等方面都發(fā)生了巨變[1]。技術(shù)作為重要催化劑,對創(chuàng)造先進(jìn)生產(chǎn)力、變革生產(chǎn)方式、推動出版方式升級都起到重要的推動作用。

國際科學(xué)技術(shù)和醫(yī)學(xué) (Scientific, Technical and Medical, STM) 出版商協(xié)會自2011年起,每年4月份會發(fā)布一張技術(shù)對科技出版趨勢影響的預(yù)測圖,簡稱 STM 報(bào)告。2018年4月推出的最新版本《STM技術(shù)趨勢2022》(STM Tech Trends 2022),其口號為:“進(jìn)入人工智能時(shí)代,創(chuàng)新的人類和智能的機(jī)器(Entering the AI Era,Creative Humans &Smart Machines)?!庇纱丝梢钥闯?,國際學(xué)術(shù)出版領(lǐng)域非常重視技術(shù)對于行業(yè)發(fā)展的推動作用。中國科技期刊未來的發(fā)展,必然愈加重視通過技術(shù)手段轉(zhuǎn)變出版模式,提高服務(wù)能力。

中國科技期刊已經(jīng)在內(nèi)容采集、生產(chǎn)、加工、管理、發(fā)布和專業(yè)領(lǐng)域的知識服務(wù)等方面進(jìn)行了有益探索。但是我們必須要看到,目前我國科技期刊出版單位在新技術(shù)使用方面普遍還比較落后,通過技術(shù)手段改進(jìn)現(xiàn)有出版模式的意識也還不夠。我們對3438種科技期刊的官方網(wǎng)站進(jìn)行了調(diào)研,其中,有1807種期刊網(wǎng)站提供全文PDF閱讀形式;285種期刊網(wǎng)站提供全文HTML閱讀形式;274種期刊網(wǎng)站預(yù)留了優(yōu)先出版欄目,但其中只有68種在進(jìn)行內(nèi)容更新。期刊網(wǎng)站刊文的時(shí)效性普遍存在滯后現(xiàn)象,提供全文HTML閱讀的期刊,內(nèi)容更新的時(shí)間比紙質(zhì)期刊出版的時(shí)間滯后2至12個月。

從以上數(shù)據(jù)不難看出,雖然科技期刊出版單位有非常強(qiáng)烈的優(yōu)先出版、快速傳播的愿望,但由于絕大部分期刊出版單位仍然采用傳統(tǒng)紙刊生產(chǎn)的方式,一本期刊完成整期排版和印刷后,再將排版文件進(jìn)行后結(jié)構(gòu)化加工。在這種生產(chǎn)方式下,數(shù)據(jù)質(zhì)量無法保障,同時(shí)也極大地影響了傳播的時(shí)效性,網(wǎng)刊優(yōu)先發(fā)布形同虛設(shè)。傳統(tǒng)出版方式和新媒體傳播之間的技術(shù)壁壘急需打破。

北京北大方正電子有限公司(以下簡稱方正電子)依托其雄厚的技術(shù)實(shí)力,近年來加強(qiáng)了機(jī)器學(xué)習(xí)、自然語言識別、動態(tài)出版、基于領(lǐng)域本體的知識庫構(gòu)建等技術(shù)在學(xué)術(shù)出版領(lǐng)域的應(yīng)用研發(fā)。以下,我們從內(nèi)容生產(chǎn)方式、內(nèi)容的科學(xué)存儲和管理以及專業(yè)知識服務(wù)能力等幾個方面闡述相關(guān)新技術(shù)在科技期刊出版中的應(yīng)用。

一、新技術(shù)在科技期刊生產(chǎn)領(lǐng)域中的實(shí)踐

國際上科學(xué)技術(shù)和醫(yī)學(xué)出版商近十年以來在升級生產(chǎn)平臺方面的實(shí)踐經(jīng)驗(yàn)告訴我們,對科技期刊數(shù)字化生產(chǎn)流程的改造,最根本的措施是將文獻(xiàn)內(nèi)容的結(jié)構(gòu)化工作前置,從源頭實(shí)現(xiàn)文檔XML數(shù)據(jù)化,并以唯一的XML數(shù)據(jù)在文獻(xiàn)的整個生產(chǎn)周期中流轉(zhuǎn)[2]。

XML數(shù)據(jù)作為一種可擴(kuò)展的標(biāo)記語言,它的設(shè)計(jì)宗旨是用于傳輸和存儲數(shù)據(jù)。由于它出色的碎片化內(nèi)容的組織描述能力以及良好的擴(kuò)展性,使其在管理信息、跨介質(zhì)傳播以及交流與共享方面具有良好的表現(xiàn),這項(xiàng)技術(shù)也因此被廣泛地應(yīng)用于數(shù)字出版領(lǐng)域[3]。在學(xué)術(shù)出版領(lǐng)域,美國國家信息標(biāo)準(zhǔn)組織(NISO)發(fā)布的JATS XML數(shù)據(jù)標(biāo)準(zhǔn),是在該領(lǐng)域越來越被廣泛應(yīng)用的XML數(shù)據(jù)標(biāo)準(zhǔn)。JATS XML的前身是美國國家醫(yī)學(xué)圖書館定義的NLM DTD 3.0。目前,JATS已經(jīng)被廣泛地應(yīng)用于標(biāo)記全球出版商出版的數(shù)以千計(jì)的期刊中,在科技期刊的生產(chǎn)、存儲、傳播和交換過程中起到了非常積極的作用,代表了XML技術(shù)在學(xué)術(shù)出版領(lǐng)域的高水平應(yīng)用。近幾年,國內(nèi)期刊出版單位、技術(shù)廠商都積極嘗試在該領(lǐng)域進(jìn)行技術(shù)改造和實(shí)踐?,F(xiàn)以方正電子研發(fā)的“方正平臺”為例,介紹新技術(shù)在科技期刊生產(chǎn)領(lǐng)域的應(yīng)用。

1.學(xué)術(shù)期刊數(shù)字化生產(chǎn)流程技術(shù)原理

方正平臺基于國際上先進(jìn)的、被廣泛認(rèn)可的JATS XML數(shù)據(jù)標(biāo)準(zhǔn),同時(shí)引入人工智能等相關(guān)技術(shù),旨在為中國科技期刊實(shí)現(xiàn)數(shù)字出版流程的升級與再造、提升媒體融合的傳播能力提供一種可行的技術(shù)解決方案。

方正平臺的核心組件示意圖如圖1所示。

由圖1可以看到,方正平臺最核心的組件分別是“智能文檔結(jié)構(gòu)化引擎”“XML動態(tài)出版引擎”和“飛翔可視化版面精修工具”。

(1)智能文檔結(jié)構(gòu)化引擎

“智能文檔結(jié)構(gòu)化引擎”的核心能力是對錄用稿件進(jìn)行“稿件清洗”“稿件規(guī)范化檢查”和“文檔結(jié)構(gòu)化”?!案寮逑础笔窍到y(tǒng)對錄用稿件中的冗余無效信息進(jìn)行清理;“稿件規(guī)范化檢查”是對稿件中非法的內(nèi)容樣式,如浮動圖、表格的錯誤用法等進(jìn)行校驗(yàn)和規(guī)范。以上兩步操作完成后,系統(tǒng)會自動對稿件進(jìn)行細(xì)顆粒度結(jié)構(gòu)化拆分。

“智能文檔結(jié)構(gòu)化引擎”部署在云端,整個工作過程不需要人工介入。系統(tǒng)通過大數(shù)據(jù)、機(jī)器學(xué)習(xí)等相關(guān)技術(shù)對近10萬篇不同領(lǐng)域的稿件進(jìn)行了學(xué)習(xí)和訓(xùn)練,確保可正確識別稿件中的要素,并完整地建立起要素之間的關(guān)聯(lián)。目前,該結(jié)構(gòu)化引擎的稿件結(jié)構(gòu)化正確率可達(dá)95%以上,通過對越來越多稿件的解析和識別,正確率還會不斷提升。

圖1 方正平臺核心組件

(2)XML動態(tài)出版引擎

“XML動態(tài)出版引擎”是將“智能文檔結(jié)構(gòu)化引擎”生成的XML數(shù)據(jù)匹配不同的發(fā)布渠道模板,生成滿足不同渠道傳播的成品數(shù)據(jù)文件。該組件實(shí)現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)與不同發(fā)布模板樣式的自動匹配,包括各種不同呈現(xiàn)布局下內(nèi)容與模板容器的自適應(yīng)。通過對上萬篇稿件發(fā)布速度的評估,單篇稿件平均發(fā)布時(shí)間小于90秒,這為單篇稿件的優(yōu)先網(wǎng)絡(luò)出版提供了重要的技術(shù)手段。

(3)飛翔可視化版面精修工具

對于稿件生成版式文件后還可能需要對內(nèi)容進(jìn)行反復(fù)修改的情況,方正平臺還提供了“飛翔可視化版面精修工具”。即使是沒有任何排版基礎(chǔ)的人,也能非常直觀地對內(nèi)容進(jìn)行可視化修改。這種操作方式避免了傳統(tǒng)出版方式中出版單位和排版機(jī)構(gòu)之間要反復(fù)交互校次稿、等待返修結(jié)果的問題,優(yōu)化了出版流程,極大地縮短了出版周期,讓出版單位自主掌握出版時(shí)機(jī)。

上述幾個核心組件通過方正平臺提供的生產(chǎn)過程管理系統(tǒng)進(jìn)行連接,為出版單位提供了以單篇稿件生產(chǎn)為主線的新型生產(chǎn)流程。

2.學(xué)術(shù)期刊數(shù)字化生產(chǎn)流程簡介

方正平臺為用戶提供的主要應(yīng)用場景為稿件中心和組刊中心。稿件中心完成單篇稿件從生產(chǎn)、編校到單篇發(fā)布的流程;組刊中心實(shí)現(xiàn)期刊整期組稿合版。方正平臺提供的期刊生產(chǎn)流程如圖2所示。

由圖2可以看到,新型的科技期刊生產(chǎn)流程是以一個單篇稿件的生產(chǎn)過程為主線的。優(yōu)質(zhì)的單篇稿件一旦達(dá)到學(xué)術(shù)質(zhì)量和出版的要求,就可以隨時(shí)隨地優(yōu)先上網(wǎng),不需要受到整期期刊出版周期的影響。而整期期刊的組織環(huán)節(jié)相比傳統(tǒng)出版的時(shí)間也大大縮短。用戶僅需選擇本期需要上版的單篇稿件,調(diào)整好順序和欄目,通過一鍵操作智能實(shí)現(xiàn)整期組刊,中英文目錄、年卷期頁碼即刻完成,大大減少了人工操作的步驟,讓生產(chǎn)環(huán)節(jié)不再成為整個出版周期的瓶頸。

圖2 方正平臺生產(chǎn)流程

通過近半年的實(shí)踐,《含能材料》等期刊單篇優(yōu)先出版的時(shí)間平均縮短了50%以上,整期組刊環(huán)節(jié)的效率也大幅提升。以《2018中國紡織學(xué)術(shù)年會論文集》為例,該編輯部從收到稿件開始以單篇稿件為單位進(jìn)行編輯、排版、校對等工作任務(wù),最終,一本近300篇論文、頁碼數(shù)近2000頁的論文集,系統(tǒng)僅用了20分鐘左右的時(shí)間即完成了自動化合成,極大地提升了出版單位的生產(chǎn)效率。

打開微信,掃描圖3所示二維碼,可以觀看方正學(xué)術(shù)出版云服務(wù)平臺的操作演示。

圖3 方正學(xué)術(shù)出版云服務(wù)平臺操作視頻演示

3.新型數(shù)字化生產(chǎn)流程為行業(yè)帶來的價(jià)值

新型數(shù)字化生產(chǎn)流程通過重塑數(shù)字出版流程,從源頭生成高質(zhì)量的XML數(shù)據(jù),驅(qū)動科技期刊生產(chǎn)、發(fā)布和傳播,從根本上轉(zhuǎn)變了生產(chǎn)理念,提高了生產(chǎn)效率,保障了數(shù)據(jù)質(zhì)量,降低了技術(shù)革新成本,為媒體融合和開展知識服務(wù)創(chuàng)造了條件。

(1)生產(chǎn)理念轉(zhuǎn)變

傳統(tǒng)出版流程是為紙刊生產(chǎn)服務(wù)的。在媒體融合的時(shí)代背景下,傳統(tǒng)的生產(chǎn)流程已經(jīng)嚴(yán)重制約了內(nèi)容傳播的時(shí)效性。方正平臺改變傳統(tǒng)出版過程中整期紙刊生產(chǎn)和內(nèi)容數(shù)字化流程割裂的現(xiàn)狀,幫助期刊出版單位實(shí)現(xiàn)在滿足紙刊生產(chǎn)的基礎(chǔ)上,同時(shí)服務(wù)于多種渠道的傳播,改變了紙刊生產(chǎn)和數(shù)字出版串行工作的方式,節(jié)省了人力和物力的成本。

(2)生產(chǎn)效率提升

方正平臺基于單篇稿件進(jìn)行生產(chǎn)、編校和多格式輸出,滿足“生產(chǎn)即發(fā)布的愿景”,助力單篇文獻(xiàn)的PDF文件和全文Rich HTML的優(yōu)先出版,為期刊出版單位爭奪內(nèi)容首發(fā)權(quán)提供了有力的技術(shù)支撐。在傳統(tǒng)出版流程中,科技期刊基于整期出版的傳統(tǒng)生產(chǎn)流程,排版工作交由排版公司完成,造成編排分離的局面,增加了稿件處理的時(shí)間成本。方正平臺通過定制專業(yè)化的版面模板,實(shí)現(xiàn)自動化的排版工作,同時(shí)配備了同XML數(shù)據(jù)實(shí)現(xiàn)交互的所見即所得的版面精修工具,減輕了傳統(tǒng)出版流程的工作量,降低了編輯完成排版工作的技術(shù)門檻,提供了編排校一體化的可能性,使期刊出版單位優(yōu)化期刊生產(chǎn)流程,及時(shí)、實(shí)時(shí)甚至同時(shí)報(bào)道最新學(xué)術(shù)進(jìn)展。

(3)提供融媒體服務(wù)

期刊出版單位可以通過方正平臺,便捷地獲取滿足全文網(wǎng)刊發(fā)布所需要的Rich HTML數(shù)據(jù)。Rich HTML文件近年來已經(jīng)成為科技期刊廣泛采用的一種全文閱讀模式,通過文章內(nèi)容的結(jié)構(gòu)化處理,實(shí)現(xiàn)了多種形式的鏈接,如文章導(dǎo)航與文中相應(yīng)部分內(nèi)容的鏈接、文中引用內(nèi)容和參考文獻(xiàn)列表的鏈接、文中圖表符號與圖表內(nèi)容的相互鏈接、作者關(guān)鍵詞等附加信息的外部鏈接、參考文獻(xiàn)相應(yīng)的外部鏈接,不僅方便了文章內(nèi)容的閱讀,還方便進(jìn)行外部的延伸閱讀,提升了讀者的閱讀體驗(yàn)。Rich HTML 的全文閱讀方式,不僅滿足了讀者碎片化、可復(fù)用的閱讀需求,同時(shí)還便于網(wǎng)站搜索引擎的抓取,增大了文章被訪問的概率,提升了期刊內(nèi)容傳播效率[4]。Rich HTML 文件還可以滿足跨終端的移動閱讀需求,便于通過微信推送、分享等方式,擴(kuò)大傳播范圍,提供更加精準(zhǔn)的讀者服務(wù)。

(4)數(shù)據(jù)質(zhì)量提升

優(yōu)質(zhì)的數(shù)據(jù)是期刊出版單位未來進(jìn)行專業(yè)知識服務(wù)的基礎(chǔ)和保障。方正平臺提供的版面精修工具,采用了先進(jìn)的中文信息處理技術(shù)和基于機(jī)器學(xué)習(xí)的版面算法,是專業(yè)、標(biāo)準(zhǔn)、可滿足紙刊出版要求的生產(chǎn)工具。方正電子是中國科技期刊XML數(shù)據(jù)標(biāo)準(zhǔn)起草單位之一,緊跟國際技術(shù)發(fā)展的趨勢,為用戶提供標(biāo)準(zhǔn)、優(yōu)質(zhì)的符合JATS1.1標(biāo)準(zhǔn)全文XML數(shù)據(jù),可以實(shí)現(xiàn)與國際主流數(shù)據(jù)庫的內(nèi)容共享。方正平臺確保文獻(xiàn)內(nèi)容在整個生產(chǎn)周期中的唯一性、準(zhǔn)確性,避免了割裂的加工過程和不同加工廠商的人工干預(yù)導(dǎo)致的二次錯誤引入,為期刊出版單位進(jìn)行數(shù)據(jù)運(yùn)營提供了高質(zhì)量的數(shù)據(jù)保障。

(5)降低新技術(shù)革新成本

方正平臺的構(gòu)建基于云端,免除期刊出版單位本地化部署、維護(hù)系統(tǒng)的煩惱,降低了科技期刊應(yīng)用新技術(shù)的時(shí)間和資金成本,并可以隨著產(chǎn)品不斷地迭代,進(jìn)一步完善利用新的技術(shù)和功能。用戶通過在線注冊獲取賬號,可以隨時(shí)隨地登錄系統(tǒng)完成生產(chǎn)工作,并在平臺中對每一篇稿件、每一個生產(chǎn)節(jié)點(diǎn)、每一次生產(chǎn)操作進(jìn)行跟蹤記錄,通過版本管理實(shí)現(xiàn)專業(yè)化的生產(chǎn)過程管理,通過用戶角色界定和工作任務(wù)分發(fā)等功能實(shí)現(xiàn)多人協(xié)同的生產(chǎn)模式。在此基礎(chǔ)上,方正平臺通過底層高質(zhì)量的XML數(shù)據(jù)和自然語義識別技術(shù),進(jìn)一步實(shí)現(xiàn)了版本比對功能,直觀地體現(xiàn)版本之間內(nèi)容的增刪改、圖片的變化等,極大提升了編輯的工作效率。

方正平臺通過生產(chǎn)環(huán)節(jié)的技術(shù)革新和流程再造,改變了科技期刊傳統(tǒng)出版和數(shù)字出版“兩張皮”的現(xiàn)狀,生成的高質(zhì)量XML數(shù)據(jù)為期刊出版單位開展知識庫建設(shè)、語義出版知識服務(wù),實(shí)現(xiàn)自主運(yùn)營、提供知識服務(wù)和開展集群化發(fā)展提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。

二、新技術(shù)支撐內(nèi)容的科學(xué)化管理

期刊文本資源作為學(xué)術(shù)通訊的重要載體,從其誕生至今,便被不斷地優(yōu)化及完善,以便發(fā)揮其信息傳遞的最佳效果。隨著大數(shù)據(jù)概念的普及,一些科技期刊開始探索文本挖掘在期刊編輯工作中的應(yīng)用,其中就包含前文所述的文獻(xiàn)結(jié)構(gòu)化工作。經(jīng)過結(jié)構(gòu)化的文本通過重組和分析,可以產(chǎn)生大于文本本身的價(jià)值,這一點(diǎn)已經(jīng)得到普遍的認(rèn)同。國內(nèi)外不少大型數(shù)字出版機(jī)構(gòu)已經(jīng)通過提供此類數(shù)據(jù)服務(wù)實(shí)現(xiàn)了數(shù)據(jù)的增值,并探索出了新的商業(yè)模式,例如知名的Highwire平臺、Elsevier的Scopus數(shù)據(jù)庫等。

近年來,數(shù)據(jù)出版已成為出版界積極探索的領(lǐng)域。[5]學(xué)術(shù)論文作為學(xué)術(shù)研究的傳播載體,最終的文獻(xiàn)形式是整個學(xué)術(shù)工作的冰山一角,文本背后大量的支撐數(shù)據(jù),例如實(shí)驗(yàn)過程數(shù)據(jù)、代碼、表格、圖片、病例等內(nèi)容,無法通過傳統(tǒng)的傳播方式呈現(xiàn),使得學(xué)術(shù)傳播呈現(xiàn)出不完整性,基于此,對于數(shù)據(jù)的管理在學(xué)術(shù)出版活動中顯得尤為重要。

通過對方正平臺用戶的調(diào)研,筆者發(fā)現(xiàn),傳統(tǒng)的期刊出版單位在資源管理中存在的問題主要體現(xiàn)三個方面:第一,資源未實(shí)現(xiàn)科學(xué)管理。期刊出版單位內(nèi)部數(shù)據(jù)大多經(jīng)過多年積累,由于人員、設(shè)備等問題,文獻(xiàn)及其相關(guān)附件信息未能進(jìn)行科學(xué)有效的管理,大多是經(jīng)過簡單分類后存儲在編輯部本地服務(wù)器上,部分期刊出版單位的過刊數(shù)據(jù)甚至存在丟失的情況。第二,數(shù)據(jù)存儲形式過于單一。期刊出版單位只將文獻(xiàn)及其相關(guān)數(shù)據(jù)以文件的形式進(jìn)行存儲,作為獨(dú)立個體的資源以文件夾的形式分散在電腦硬盤的各個角落,數(shù)據(jù)之間無法形成有機(jī)的關(guān)聯(lián),這種存儲形式很難實(shí)現(xiàn)數(shù)據(jù)的再利用,也無法進(jìn)行數(shù)據(jù)關(guān)系的挖掘,資源增值、數(shù)據(jù)出版更無從談起。第三,資源統(tǒng)計(jì)方式過于陳舊。手工的統(tǒng)計(jì)方式無法實(shí)時(shí)獲得期刊工作量的評估及資源的統(tǒng)計(jì)信息,使得對期刊資源實(shí)現(xiàn)宏觀管控面臨一定的難度。

針對上述問題,方正平臺在數(shù)字資源的管理及存儲方面進(jìn)行了積極的探索,通過構(gòu)建新型的資源存儲模式,為期刊出版單位解決上述問題,即通過提供云端的數(shù)據(jù)多元化存儲服務(wù),實(shí)現(xiàn)文獻(xiàn)的結(jié)構(gòu)化存儲、實(shí)時(shí)的數(shù)據(jù)統(tǒng)計(jì)及資源的重組策劃,將資源的價(jià)值發(fā)揮到最大限度。

方正平臺資源中心能夠幫助用戶實(shí)現(xiàn)資源結(jié)構(gòu)化存儲、資源的實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì)和資源重組策劃功能。其架構(gòu)圖詳見圖4。

1.資源的結(jié)構(gòu)化存儲

在方正平臺提供的資源中心,每一篇文獻(xiàn)都將以結(jié)構(gòu)化的形式進(jìn)行存儲,系統(tǒng)會自動進(jìn)行文獻(xiàn)的數(shù)據(jù)解析,將文獻(xiàn)中的作者、關(guān)鍵詞、機(jī)構(gòu)、基金、圖片、表格等數(shù)據(jù)資源通過抽取進(jìn)行獨(dú)立存儲,并將這些數(shù)據(jù)獨(dú)立成庫。此外,平臺還將這些獨(dú)立的數(shù)據(jù)片段通過算法實(shí)現(xiàn)數(shù)據(jù)之間的有機(jī)關(guān)聯(lián),從而為期刊出版單位提供決策的輔助依據(jù)。如前文所述,數(shù)據(jù)資源的存儲和出版在學(xué)術(shù)傳播過程中變得更加重要,而這些數(shù)據(jù)資源的載體形式多樣,包括音頻、視頻、代碼、結(jié)構(gòu)化數(shù)據(jù)等,方正平臺的資源中心可支持文獻(xiàn)相關(guān)附件數(shù)據(jù)的存儲,同時(shí)支持?jǐn)?shù)據(jù)和文本之間關(guān)聯(lián)關(guān)系的建立,為數(shù)據(jù)出版打下基礎(chǔ)。期刊用戶通過使用該資源中心,可以有效管理、組織細(xì)顆粒度資源,包括每一篇論文、相關(guān)素材以及各種增值數(shù)據(jù),從而使期刊出版單位可以科學(xué)管理自有內(nèi)容資產(chǎn),并在未來發(fā)揮更大的數(shù)據(jù)價(jià)值。

圖4 方正平臺資源中心架構(gòu)圖

2.資源的實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì)

對于期刊出版單位來說,數(shù)據(jù)的統(tǒng)計(jì)至關(guān)重要。在沒有輔助手段的情況下,統(tǒng)計(jì)只能依靠人工,這項(xiàng)工作在一定程度上增加了期刊出版單位的工作量,且統(tǒng)計(jì)結(jié)果往往不夠精確。方正平臺的資源中心可實(shí)時(shí)統(tǒng)計(jì)期刊的各類數(shù)據(jù)信息,包括期刊生產(chǎn)加工信息、期刊出版數(shù)據(jù)信息等。在系統(tǒng)對接外部發(fā)布平臺的情況下,可統(tǒng)計(jì)外部讀者的使用行為等數(shù)據(jù)。

系統(tǒng)可通過入庫的稿件信息,自動統(tǒng)計(jì)期刊在一定周期內(nèi)的稿件生產(chǎn)量、文字和圖片處理量、稿件生產(chǎn)周期等數(shù)據(jù),并通過統(tǒng)計(jì)報(bào)表的形式直觀呈現(xiàn)。系統(tǒng)還可統(tǒng)計(jì)期刊的基金論文比、學(xué)科分布、作者分布、機(jī)構(gòu)分布等信息,使期刊出版單位對期刊的學(xué)術(shù)信息一目了然,從而對期刊的現(xiàn)狀有一個更加清晰的認(rèn)識和了解。出版學(xué)術(shù)期刊是為了及時(shí)發(fā)布、有效傳播學(xué)術(shù)成果,在學(xué)術(shù)出版日益互聯(lián)網(wǎng)化的語境下,針對互聯(lián)網(wǎng)用戶的行為分析有助于提升期刊的傳播力和影響力。資源中心支持期刊出版單位對接外網(wǎng)發(fā)布平臺,對接后,系統(tǒng)可實(shí)時(shí)反饋外部用戶的使用信息,幫助期刊出版單位根據(jù)讀者行為調(diào)整出版策略。

3.資源的重組策劃

隨著信息技術(shù)的發(fā)展,我們處在“信息爆炸”的時(shí)代,各種信息極為豐富,導(dǎo)致有效知識相對匱乏。為了從大量信息中迅速獲得有效知識,基于數(shù)據(jù)挖掘技術(shù)的文本挖掘變得至關(guān)重要,如何將碎片化的隱性資源轉(zhuǎn)化為顯性的更加有價(jià)值的資源?國內(nèi)一些期刊出版單位已經(jīng)開始了碎片化數(shù)據(jù)重組再利用的探索之路。然而,對于大部分期刊出版單位來說,資源的重組及匯編具備一定的難度。一方面,結(jié)構(gòu)化數(shù)據(jù)的處理需要具備專業(yè)的數(shù)據(jù)加工知識;另一方面,自主開發(fā)軟件項(xiàng)目的工具成本過高?;诖?,方正平臺資源中心為用戶提供了一種低成本、便捷的數(shù)據(jù)管理和重組服務(wù),幫助用戶充分發(fā)揮其資源的開發(fā)能力,支持期刊出版單位通過可視化的數(shù)據(jù)管理工具將文本中的數(shù)據(jù)進(jìn)行抽離,同時(shí)進(jìn)行標(biāo)引加工,實(shí)現(xiàn)數(shù)據(jù)的多維自動重組,可快速生成期刊出版單位自有的圖片庫、文章專題庫、各類知識庫等產(chǎn)品,推動期刊出版單位從資源服務(wù)向知識服務(wù)過渡。

三、充分利用新技術(shù),助力學(xué)術(shù)期刊開展知識服務(wù)

知識服務(wù)的目的是從各種顯性和隱形知識資源中有針對性地提煉知識,并在此基礎(chǔ)之上通過搭建知識網(wǎng)絡(luò)提供知識內(nèi)容、給出解決方案。在這一過程中,對于內(nèi)容的挖掘和組織是最關(guān)鍵的環(huán)節(jié),而這一環(huán)節(jié)的基礎(chǔ)便是底層的優(yōu)質(zhì)結(jié)構(gòu)化數(shù)據(jù),[6]XML數(shù)據(jù)作為期刊文本的結(jié)構(gòu)化載體,已經(jīng)廣泛應(yīng)用于期刊數(shù)字化傳播。然而,如何有效存儲并充分利用XML結(jié)構(gòu)化數(shù)據(jù),以及如何呈現(xiàn)多樣化的數(shù)據(jù)資源,依然是期刊數(shù)字化傳播亟待解決的痛點(diǎn)。此外,只有具備一定的數(shù)據(jù)量,才可以開展知識服務(wù),所以對于數(shù)據(jù)的積累至關(guān)重要。因此,建議期刊出版單位盡快開展期刊的XML數(shù)字化加工及存儲,以便適應(yīng)期刊的互聯(lián)網(wǎng)化趨勢。利用新的技術(shù)手段不僅可以優(yōu)化期刊傳統(tǒng)出版流程,提高生產(chǎn)效率,還能實(shí)現(xiàn)期刊的多渠道、多樣化傳播。全流程基于XML數(shù)據(jù)的出版模式可以從源頭上實(shí)現(xiàn)對數(shù)據(jù)的管控,并對科學(xué)研究過程中產(chǎn)生的各種過程數(shù)據(jù)進(jìn)行有效存儲和有機(jī)關(guān)聯(lián),提供給讀者更加豐富的閱讀體驗(yàn),實(shí)現(xiàn)文本的增值。

目前,知識服務(wù)已經(jīng)是國外數(shù)字出版的主流服務(wù),國內(nèi)期刊雖然有一定的差距,但是始終在進(jìn)行積極地探索,而新技術(shù)將賦予這個探索過程一個新的契機(jī)。未來的科技期刊將更加側(cè)重于垂直領(lǐng)域的數(shù)據(jù)挖掘及更加多樣化的數(shù)據(jù)呈現(xiàn),不同學(xué)科因呈現(xiàn)的數(shù)據(jù)形式不同而會擁有各自個性化的技術(shù)手段。追本溯源,呈現(xiàn)多樣化數(shù)據(jù)的基礎(chǔ)是對原始數(shù)據(jù)的有效加工及利用,如何進(jìn)一步提升資源及數(shù)據(jù)的規(guī)范性,保持?jǐn)?shù)據(jù)的完整性,同時(shí)賦予資源更加準(zhǔn)確及豐富的描述,將是學(xué)術(shù)期刊未來提供知識服務(wù)的基礎(chǔ)。

綜上所述,筆者認(rèn)為,中國科技期刊的發(fā)展已經(jīng)迎來了前所未有的好時(shí)機(jī),新技術(shù)有能力、也必將為傳統(tǒng)學(xué)術(shù)出版賦能,為中國科技期刊的發(fā)展帶來一場前所未有的革命。

猜你喜歡
方正出版單位結(jié)構(gòu)化
山西醫(yī)學(xué)期刊社榮獲我國新聞出版領(lǐng)域最高獎
——第五屆中國出版政府獎先進(jìn)出版單位獎
促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
劉慈欣科幻作品年表
淺析射陽大米的由來
關(guān)于鋼鐵廠車間動力自動化設(shè)備管理應(yīng)統(tǒng)籌管理的思考
中國最美的書
方正
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
Microwave Photonics for Modern Radar Systems*
郴州市| 长岛县| 云安县| 廉江市| 牡丹江市| 澳门| 策勒县| 南漳县| 松桃| 繁峙县| 苏尼特左旗| 桑植县| 祁东县| 建阳市| 诸暨市| 盘锦市| 台北县| 永仁县| 伊川县| 塘沽区| 梓潼县| 应城市| 阿尔山市| 温宿县| 阳谷县| 孟连| 梅州市| 宝坻区| 邻水| 正镶白旗| 商城县| 崇信县| 屯留县| 句容市| 襄城县| 宁南县| 新兴县| 铅山县| 杭锦后旗| 饶阳县| 库尔勒市|