謝文亮,溫優(yōu)華,鄭添尹
(1. 廣東財經(jīng)大學(xué) 學(xué)報編輯部,廣東 廣州 510320;2.韓山師范學(xué)院 學(xué)報編輯部,廣東 潮州 521041;3. 廣西師范大學(xué) 政治與公共管理學(xué)院,廣西 桂林 541004)
目前,我國高校學(xué)術(shù)期刊出版研究主要集中在媒介融合上.在學(xué)術(shù)期刊傳統(tǒng)媒體的網(wǎng)絡(luò)化、數(shù)字化和信息化上,程維紅[1]、游濱[2]、趙文義[3]等分析我國數(shù)字出版的發(fā)展現(xiàn)狀和存在的問題,提出我國科技期刊的數(shù)字出版策略和改革取向;李剛[4]、李新根[5]、劉英[6]等研究互聯(lián)網(wǎng)下學(xué)術(shù)不端行為以及學(xué)術(shù)期刊的防范對策;張科[7]、謝暄[8]研究網(wǎng)絡(luò)互動采編和網(wǎng)絡(luò)采編平臺優(yōu)化,深化內(nèi)容融合程度的策略;徐文娟[9]、張艷艷[10]、周海秋[11]等研究互聯(lián)網(wǎng)思維本質(zhì),創(chuàng)新學(xué)術(shù)期刊經(jīng)營模式以實現(xiàn)跨越式發(fā)展.從互聯(lián)網(wǎng)向移動互聯(lián)網(wǎng)和“互聯(lián)網(wǎng)+”應(yīng)用轉(zhuǎn)型研究上,史春薇[12]研究利用微信進行稿件的遠程校對;石婧[13]研究利用微信平臺構(gòu)建科技期刊影響力和傳播力評價指標(biāo)體系;吳彬[14]研究將微信平臺應(yīng)用于科技期刊審稿、組稿、定稿以及人性化讀者服務(wù)等;袁澤軼[15]研究利用微信公眾平臺實現(xiàn)科技期刊的多極傳播與精準(zhǔn)傳播;余溢文[16]研究將微信公眾平臺作為交流平臺,提供信息服務(wù)、互動交流等;周建森[17]探討“互聯(lián)網(wǎng)+”時代出版轉(zhuǎn)型升級路徑,實現(xiàn)從內(nèi)容提供商向服務(wù)提供商的轉(zhuǎn)變;鄧菁[18]提出以互聯(lián)網(wǎng)思維改革期刊發(fā)展模式,實現(xiàn)期刊出版與互聯(lián)網(wǎng)的全方位對接;嚴飛[19]提出重新定位期刊內(nèi)容,重新塑造傳播模式和構(gòu)建服務(wù)模式;劉成勇[20]指出大多數(shù)學(xué)術(shù)期刊還停留在粗放式出版階段,沒有真正實施互聯(lián)網(wǎng)出版及服務(wù)模式.
國內(nèi)開始研究5G在出版業(yè)的應(yīng)用,但尚未重視在學(xué)術(shù)期刊的應(yīng)用.在中國知網(wǎng)上,傳播領(lǐng)域的5G研究集中在新聞和傳媒.以“5G+傳媒”“5G+新聞”“5G+出版”為主題進行檢索,檢索到85、143和62篇中文文獻①注:檢索時間是2020-12-15.下同.;以“5G+學(xué)報”進行檢測,未發(fā)現(xiàn)有相關(guān)主題的文獻;以“5G+期刊”、“5G+學(xué)術(shù)期刊”為主題進行檢索,則分別檢索到9篇和5篇研究文獻.在已有的文獻中,蔣傳洋[21]以博庫集團為例,研究5G時代以圖書電商為基礎(chǔ)的出版生態(tài)系統(tǒng).劉允杰[22]、馮宏聲[23]分析5G時代出版業(yè)的發(fā)展變化規(guī)律和前景;李曉鹓[24]研究5G時代出版業(yè)與新技術(shù)融合發(fā)展,更好利用新技術(shù)實現(xiàn)傳承文化、服務(wù)社會的功能.從已有的中文文獻可以看到,對5G 在新聞傳媒方面的應(yīng)用研究尚屬起步階段,研究的層次、深度都較低,有待多層次、多方面進行系統(tǒng)、深入的研究;5G尚未引起學(xué)術(shù)期刊界的重視,對學(xué)術(shù)期刊的5G時代的資源融合與創(chuàng)新方面沒有相關(guān)的研究成果公開發(fā)表.
學(xué)術(shù)期刊出版隨著通信技術(shù)和信息技術(shù)的發(fā)展而發(fā)生變革和創(chuàng)新.早在2015年,我國就已經(jīng)發(fā)布《5G概念白皮書》[25],2017年8月國務(wù)院發(fā)布《關(guān)于進一步擴大和升級信息消費持續(xù)釋放內(nèi)需潛力的指導(dǎo)意見》中提到,要“推動信息基礎(chǔ)設(shè)施提速升級”.隨著第五代移動通信技術(shù)的實施,5G具有高數(shù)據(jù)速率、減少延遲、節(jié)省能源、降低成本、提高系統(tǒng)容量和大規(guī)模設(shè)備連接等特點,我國學(xué)術(shù)期刊在5G通信技術(shù)支撐下與物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等信息技術(shù)融合,將進入智能互聯(lián)出版時代.雖然4G時代已存在物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)技術(shù),但缺乏強大、高效的通信能力支撐,與學(xué)術(shù)期刊融合沒有取得突破性進展.5G時代通信能力將得到解決,形成強大的智能互聯(lián)網(wǎng).我國學(xué)術(shù)期刊要抓住政策機遇,加快與科技融合,真正推動學(xué)術(shù)期刊信息化建設(shè).學(xué)術(shù)期刊以“內(nèi)容為王”,內(nèi)容資源是學(xué)術(shù)期刊“寶藏”,傳統(tǒng)的學(xué)術(shù)期刊內(nèi)容資源缺乏技術(shù)支撐,無法做到有效的內(nèi)容資源整合.5G環(huán)境下智能互聯(lián)網(wǎng)出版將給內(nèi)容資源帶來整合技術(shù)和整合方式,如何更好整合學(xué)術(shù)期刊內(nèi)容資源“寶藏”將是本文研究的目標(biāo).
學(xué)術(shù)期刊內(nèi)容資源包括全文和元數(shù)據(jù)兩部分.全文包括題名、作者信息、摘要、關(guān)鍵詞、正文、參考文獻等,是學(xué)術(shù)論文的全部內(nèi)容;元數(shù)據(jù)包括刊名、刊號等版權(quán)頁信息、中英文目次、欄目、文章題名、作者信息、摘要、關(guān)鍵詞、中圖分類號、文獻標(biāo)識碼、文章編號、收稿日期、基金項目、參考文獻等,是學(xué)術(shù)論文的部分內(nèi)容.
學(xué)術(shù)期刊內(nèi)容資源整合經(jīng)常被辦刊者所忽視.我國學(xué)術(shù)期刊缺乏內(nèi)容資源的信息挖掘、數(shù)據(jù)分析、知識發(fā)現(xiàn)以及關(guān)聯(lián)等,使得內(nèi)容資源利用率不高,內(nèi)容重復(fù)現(xiàn)象嚴重,浪費了大量的辦刊資源;再者,學(xué)術(shù)期刊資源的關(guān)聯(lián)度不高,無法進一步挖掘出相關(guān)的、有用的信息,使得資源與資源之間形成一個個“孤島”.只有通過關(guān)聯(lián)挖掘,才能為這些資源“孤島”搭建起“橋梁”,實現(xiàn)信息資源之間的共享.內(nèi)容是立刊之本,是期刊競爭力強弱的主要因素之一,因此大多數(shù)學(xué)術(shù)期刊都采取“內(nèi)容為王”的策略,以策劃、組織高質(zhì)量的稿件為主.學(xué)術(shù)論文公開發(fā)表后,沒有對內(nèi)容作進一步處理,也很少有期刊對內(nèi)容資源的內(nèi)涵進行研究,導(dǎo)致內(nèi)容資源在整合上顯現(xiàn)一盤沙的狀態(tài),這對期刊內(nèi)容資源來說是極度浪費.我國學(xué)術(shù)期刊的內(nèi)容資源豐富,以最大的學(xué)術(shù)期刊數(shù)據(jù)庫中國知網(wǎng)為例,截止到2019 年9 月份,共收錄了8 730 多種期刊,全文文獻5 500 多萬篇論文(數(shù)據(jù)來源:中國知網(wǎng)).但是,龐大的學(xué)術(shù)期刊資源,缺乏有效的深度數(shù)字化加工、資源整合,使學(xué)術(shù)期刊內(nèi)容資源難以得到有效利用.早在2014年4月份,原國家新聞出版廣電總局《關(guān)于規(guī)范學(xué)術(shù)期刊出版秩序促進學(xué)術(shù)期刊健康發(fā)展的通知》[26]指出,當(dāng)前學(xué)術(shù)期刊的集約化水平較低,表示形態(tài)單一,對其內(nèi)容資源之間缺乏相關(guān)的深度挖掘、分析和關(guān)聯(lián),使得所出版的內(nèi)容互相獨立、互相割裂,相互之間成了“信息孤島”.雖然數(shù)據(jù)挖掘、分類、聚合等圖書情報和計算機網(wǎng)絡(luò)、大數(shù)據(jù)計算等技術(shù)使學(xué)術(shù)期刊資源整合取得了進步,然而,這些技術(shù)過于依賴人工制定的計算機程序,無法模擬人類的辨識能力,知識發(fā)現(xiàn)和知識推理能力有限,資源整合的程度不高,使資源無法得到充分的利用.3G和4G時代,雖然已存在物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)技術(shù),但缺乏強大、高效的通信能力支撐,學(xué)術(shù)期刊內(nèi)容資源的開發(fā)沒有取得突破性進展.5G時代高數(shù)據(jù)速率通信能力下將形成強大的智能互聯(lián)網(wǎng),為學(xué)術(shù)期刊利用人工智能進行內(nèi)容資源整合帶來機遇.
1.2.1 學(xué)術(shù)期刊內(nèi)容資源整合涵義
學(xué)術(shù)期刊內(nèi)容資源整合指的是將已出版的學(xué)術(shù)期刊元數(shù)據(jù)和內(nèi)容數(shù)據(jù)通過知識發(fā)現(xiàn)方法,將看似獨立、無聯(lián)系的數(shù)據(jù)有機結(jié)合起來,形成內(nèi)容資源數(shù)據(jù)庫;在此基礎(chǔ)上運用知識推理、聚類分析、關(guān)聯(lián)規(guī)則等知識發(fā)現(xiàn)技術(shù),通過時序推理、不確定推理、概率推理和主觀貝葉斯方法等人工智能方法,對內(nèi)容資源進行高級推理,推出各種可能性,并從概率上推出最大可能的知識關(guān)聯(lián);最后,通過人工智能系統(tǒng)建設(shè)各種專家系統(tǒng),深層次挖掘、高附加值、個性化的服務(wù)產(chǎn)品,形成智能決策支持系統(tǒng),為各種單位提供專家支持,達到有效的開發(fā)和利用學(xué)術(shù)期刊內(nèi)容資源的目的.
1.2.2 學(xué)術(shù)期刊內(nèi)容資源整合的重要性
(1)通過內(nèi)容資源整合形成大數(shù)據(jù)庫.數(shù)據(jù)庫是學(xué)術(shù)期刊數(shù)字化程度高低的體現(xiàn),通過內(nèi)容資源的整合,建立起期刊數(shù)據(jù)庫,提高學(xué)術(shù)期刊數(shù)字化水平.傳統(tǒng)數(shù)據(jù)庫僅有期刊論文資源,而內(nèi)容資源整合而成的數(shù)據(jù)庫則是全方位、多層次和寬領(lǐng)域,包括了各種期刊內(nèi)容數(shù)據(jù)庫,如元數(shù)據(jù)庫、作者信息數(shù)據(jù)庫、專家信息數(shù)據(jù)庫以及讀者數(shù)據(jù)庫等,為進一步建立起智庫系統(tǒng)提供支撐.
(2)通過內(nèi)容資源整合形成各種智庫應(yīng)用.內(nèi)容資源整合形成的數(shù)據(jù)庫,通過進一步的知識挖掘、關(guān)聯(lián)、分類、聚類等,形成一張互聯(lián)的知識網(wǎng),并從知識網(wǎng)中進一步挖掘信息,形成智庫.智庫能幫助出版單位發(fā)現(xiàn)作者人才、研究團隊、選題重點等;幫助讀者了解期刊選題新穎性、時效性以及重要性等,也為讀者提供選題的智能支持、期刊相關(guān)信息獲取等;對于政府、企業(yè)和社會各單位來說,智庫能提供咨詢功能,為各個單位提供支持,包括智力支撐、數(shù)據(jù)支撐、決策支撐等.
(3)內(nèi)容資源整合有利于擴大學(xué)術(shù)期刊傳播力.以內(nèi)容資源為支撐,以期刊出版過程中的各個對象、內(nèi)容資源以及互聯(lián)網(wǎng)平臺等形成互聯(lián)網(wǎng)出版平臺生態(tài)圈,促進以內(nèi)容資源為核心的平臺生態(tài)圈吸引用戶加入,在資源共享與信息互動中成長,通過平臺生態(tài)圈激發(fā)網(wǎng)絡(luò)效應(yīng),賦予用戶歸屬感,促進用戶規(guī)模不斷持續(xù)擴大,擴大學(xué)術(shù)期刊的傳播力,保持和增強學(xué)術(shù)期刊競爭力.
(4)通過內(nèi)容資源整合促進集約辦刊局面的形成.我國學(xué)術(shù)期刊由于歷史原因,形成了粗放式出版的模式.以高校學(xué)報為例,普遍形成一校辦一刊,或一校辦多刊的局面,根本就不必考慮出版的內(nèi)容是否與其它的刊物重復(fù),或是出版的內(nèi)容是否有價值.這種一盤散沙辦刊的方式,造成了極大的辦刊資源浪費.在國外,出版商利用網(wǎng)絡(luò)優(yōu)勢,形成以名刊為龍頭的出版集團,技術(shù)商提供技術(shù)支撐,出版經(jīng)營分開的大型出版集團模式,如Elsvier,Springer,在這些出版集團內(nèi)部,廣泛采用集約式的出版,將一切的出版要素投入到能產(chǎn)生最大效益的內(nèi)容資源獲取上,并通過出版集團的協(xié)調(diào),對期刊內(nèi)容資源進行整合,避免同一出版集團中不同刊物的內(nèi)容重復(fù)出版;利用整合將期刊里的資源連點成線,形成一系列有針對性、有連貫性的期刊,期刊之間是互補的、內(nèi)容資源無競爭性,各個期刊之間能滿足市場對某一方面的內(nèi)容的需求;而期刊又能充分利用出版集團的雄厚實力、傳播手段以及發(fā)行渠道,將內(nèi)容資源發(fā)送到讀者手中.
傳統(tǒng)的學(xué)術(shù)期刊資源整合是采用計算機數(shù)據(jù)挖掘的方法分三步實施:一是學(xué)術(shù)期刊檢索數(shù)據(jù)庫的建立,用于學(xué)術(shù)期刊資源的采集;二是挖掘發(fā)現(xiàn)數(shù)據(jù)庫中的各種關(guān)系,運用各種數(shù)據(jù)挖掘分析工具,發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的深層次聯(lián)系;三是決策系統(tǒng)的建立,根據(jù)分析的結(jié)果,為用戶提供決策建議.存在的問題是:首先,采取關(guān)鍵詞匹配算法,關(guān)鍵詞匹配方法是被動的,無法實現(xiàn)計算機程序與人之間的互動;其次,智能程度低,在匹配過程中,缺乏啟發(fā)式的知識發(fā)現(xiàn)和關(guān)聯(lián);第三,關(guān)鍵詞匹配提供的結(jié)果唯一,缺乏多方面的可選擇性結(jié)果.由于被動、非智能式數(shù)據(jù)挖掘方式,學(xué)術(shù)期刊內(nèi)容資源的整合無法達到更精確,也無法提供多個決策選擇或提供根據(jù)不同需求的人性化內(nèi)容資源整合.
5G環(huán)境下人工智能為學(xué)術(shù)期刊資源的有效整合和利用帶來了機遇.大數(shù)據(jù)和人工智能的結(jié)合得到5G高效通信能力支撐,形成了智能互聯(lián)網(wǎng).智能互聯(lián)網(wǎng)與學(xué)術(shù)期刊出版結(jié)合的重點之一就是基于“智能互聯(lián)網(wǎng)+出版”理論體系下學(xué)術(shù)期刊內(nèi)容融合.本文提出了依托5G+大數(shù)據(jù)技術(shù),建設(shè)“數(shù)據(jù)驅(qū)動”和“智能驅(qū)動”共同作用的學(xué)術(shù)期刊內(nèi)容挖掘與知識發(fā)現(xiàn)系統(tǒng),對內(nèi)容資源進行準(zhǔn)確、可靠、穩(wěn)定的挖掘、分類和聚類;利用人工智能出版多元化知識產(chǎn)品,將傳統(tǒng)學(xué)術(shù)期刊內(nèi)容資源進一步擴展為文獻產(chǎn)品、知識產(chǎn)品、知識資源、知識工具、知識服務(wù)等,以此實現(xiàn)智能互聯(lián)網(wǎng)下學(xué)術(shù)期刊內(nèi)容整合途徑.
內(nèi)容資源知識表示是知識處理的基礎(chǔ).學(xué)術(shù)期刊內(nèi)容資源的知識表示是將內(nèi)容以及內(nèi)容之間的關(guān)系用計算機能夠識別的方式表示出來.不同國家、不同期刊在不同時期采取了不同的知識表示,難以形成統(tǒng)一的標(biāo)準(zhǔn),而內(nèi)容資源的表示也關(guān)系到不同期刊數(shù)據(jù)庫之間的共享、互操作以及檢索等問題.學(xué)術(shù)期刊內(nèi)容資源是由元數(shù)據(jù)(mega data)組成,元數(shù)據(jù)是學(xué)術(shù)期刊數(shù)據(jù)表示的主要方法,如題名、摘要、關(guān)鍵詞等,是元數(shù)據(jù)的組成元素.目前國際上比較出名的元數(shù)據(jù)有DC(Dublin Core)、MARC等,國內(nèi)有CNMARC等,不同的元數(shù)據(jù)表示導(dǎo)致不同的數(shù)據(jù)庫之間的互操作性變?nèi)?,因此必須對元?shù)據(jù)進行深度加工.多種表示格式對整個學(xué)術(shù)期刊在開展數(shù)字化建設(shè)時,造成極大的資源(包括人力、財力和物力)浪費,又不利于學(xué)術(shù)期刊內(nèi)容資源的交換和整合.
5G下內(nèi)容資源的知識表示將以人工智能的本體資源描述得以解決.人工智能下學(xué)術(shù)期刊對本體的研究有了突破性的進展.不同的學(xué)術(shù)期刊數(shù)字化可因地制宜,采用多種數(shù)據(jù)格式,然后通過基于XML的RDF對資源進行描述,實現(xiàn)各期刊資源的信息映射.隨著語義出版研究的進一步深入,學(xué)術(shù)期刊開始構(gòu)建本學(xué)科的本體,如CSSCI本體[27]、醫(yī)學(xué)領(lǐng)域本體[28]、中醫(yī)藥領(lǐng)域本體[29]、農(nóng)業(yè)學(xué)本體[30]、地理本體[31]等.本體對期刊內(nèi)容資源進行自動重新標(biāo)引,形成新的知識庫,知識庫中各期刊的元數(shù)據(jù)都用統(tǒng)一的本體表示方法.本體技術(shù)通過語義映射,將用戶不同的語言表達查詢轉(zhuǎn)化為本體的表達,實現(xiàn)了語義查詢.
經(jīng)過人工智能本體表示后的學(xué)術(shù)期刊內(nèi)容,適合進行智能數(shù)據(jù)挖掘,以發(fā)現(xiàn)更多有價值的信息.智能互聯(lián)下學(xué)術(shù)期刊內(nèi)容資源的挖掘依托5G+大數(shù)據(jù)和人工智能技術(shù),建設(shè)“數(shù)據(jù)驅(qū)動”與“智能驅(qū)動”的學(xué)術(shù)期刊內(nèi)容挖掘與知識發(fā)現(xiàn)系統(tǒng),并對內(nèi)容資源進行準(zhǔn)確、可靠、穩(wěn)定地分類和聚類.
2.2.1 學(xué)術(shù)期刊內(nèi)容資源數(shù)據(jù)挖掘
基于“數(shù)據(jù)驅(qū)動”與“智能驅(qū)動”的學(xué)術(shù)期刊內(nèi)容資源數(shù)據(jù)挖掘分三步走:一是學(xué)術(shù)期刊檢索數(shù)據(jù)庫的建立;二是挖掘發(fā)現(xiàn)數(shù)據(jù)庫中的各種關(guān)系,運用各種數(shù)據(jù)挖掘分析工具,發(fā)現(xiàn)在數(shù)據(jù)與數(shù)據(jù)之間的深層次聯(lián)系;三是決策系統(tǒng)的建立,根據(jù)分析的結(jié)果,提供決策建議.人工智能在內(nèi)容資源挖掘中發(fā)揮了重要的作用.Agent(艾真體)是一種計算機智能體,在傳播過程中,具有自主和自適應(yīng)的能力,根據(jù)所遇到的情況調(diào)整自身的探索目標(biāo),如計算機爬蟲就是內(nèi)容挖掘中經(jīng)常使用的艾真體.計算機爬蟲在學(xué)術(shù)期刊內(nèi)容結(jié)構(gòu)發(fā)現(xiàn)中發(fā)揮了重要作用,爬蟲能從錯綜復(fù)雜的內(nèi)容資源中進行結(jié)點探索,理清出各個結(jié)點之間的關(guān)系和結(jié)構(gòu).
2.2.2 學(xué)術(shù)期刊內(nèi)容資源的知識關(guān)聯(lián)
基于“數(shù)據(jù)驅(qū)動”與“智能驅(qū)動”的學(xué)術(shù)期刊內(nèi)容資源知識發(fā)現(xiàn)是對由大數(shù)據(jù)挖掘出來的知識進行關(guān)聯(lián)分析.知識關(guān)聯(lián)是發(fā)現(xiàn)知識點與知識點之間的相互關(guān)系.通過不同時間期刊的研究熱點的變化,可得到學(xué)術(shù)研究趨勢;并發(fā)現(xiàn)核心作者群、期刊的欄目發(fā)展趨勢、作者學(xué)術(shù)領(lǐng)域、作者學(xué)術(shù)團隊、同類期刊的各種指標(biāo)對比等.國外先進的學(xué)術(shù)期刊通過聯(lián)機分析處理、數(shù)據(jù)倉庫、知識關(guān)聯(lián)、知識發(fā)現(xiàn)、云計算、大數(shù)據(jù)分析等數(shù)據(jù)挖掘與處理技術(shù),分析和獲取讀者偏好、刊物質(zhì)量反饋等信息,為選題策劃、作者發(fā)現(xiàn)、信息推送、辦刊方向等提供數(shù)據(jù)支撐,以便作戰(zhàn)略決策上的預(yù)測,及時調(diào)整辦刊方向,提高讀者服務(wù)水平,確??锏奈恼沦|(zhì)量、欄目的特色以及整個刊物的影響力.在國內(nèi),以中國知網(wǎng)為代表的出版集團已實現(xiàn)了全文數(shù)據(jù)庫的存儲,在此基礎(chǔ)上進行期刊的內(nèi)容加工和挖掘,從分類、聚類、索引、自動標(biāo)引等全方位、深層次地進行知識管理和知識挖掘,從傳統(tǒng)的內(nèi)容資源組織向內(nèi)容資源的檢索轉(zhuǎn)化,最終達到提供決策化、個性化內(nèi)容資源產(chǎn)品的轉(zhuǎn)變.通過中國知網(wǎng)、萬方數(shù)據(jù)以及超星發(fā)現(xiàn)的基本期刊信息和知識網(wǎng)絡(luò)進行研究,發(fā)現(xiàn)基本期刊信息越齊全,其通過知識發(fā)現(xiàn)而形成的知識網(wǎng)絡(luò)就越能發(fā)現(xiàn)各種知識關(guān)聯(lián),其推導(dǎo)出來的各種關(guān)系網(wǎng)絡(luò)就越有價值,起決策作用的準(zhǔn)確性就越強.中國知網(wǎng)目前的處理是由知識節(jié)點和知識網(wǎng)絡(luò)組成,其中,知識節(jié)點包括了期刊基本信息,用元數(shù)據(jù)表示,包括題名、作者姓名、作者單位、摘要、關(guān)鍵詞、分類號等.而知識網(wǎng)絡(luò)通過各種數(shù)據(jù)挖掘的方法,將知識節(jié)點形成知識網(wǎng)絡(luò),如引文網(wǎng)絡(luò)、關(guān)聯(lián)作者、相似文獻等.而萬方數(shù)據(jù)的期刊信息更齊全,基本信息還包括了中國知網(wǎng)所沒有的信息:年卷(期)、所屬期刊欄目、在線出版日期、頁數(shù)、頁碼等.其知識網(wǎng)絡(luò)除了引文網(wǎng)絡(luò)、關(guān)聯(lián)作者、相似文獻外,還包括了相關(guān)主題、相關(guān)機構(gòu)、相關(guān)學(xué)者等;超星發(fā)現(xiàn)的元數(shù)據(jù)也更加齊全,在萬方的基本信息之外,還添加了基金、分類導(dǎo)航等元數(shù)據(jù)信息,其知識網(wǎng)絡(luò)(知識圖譜)也有更多的發(fā)現(xiàn),包括主題指數(shù)、引文網(wǎng)絡(luò)、引證文獻、引文圖譜、影響因子趨勢、相似文獻、讀者推薦、基金文獻、全國館藏、關(guān)聯(lián)作者等.目前中國知網(wǎng)的內(nèi)容資源挖掘尚處于起步階段,要形成有真正決策意義的信息,還需要進一步的研發(fā)關(guān)聯(lián)挖掘技術(shù),才能實現(xiàn)對內(nèi)容資源的深度加工.
學(xué)術(shù)期刊內(nèi)容資源的知識增值是利用人工智能出版多元化知識產(chǎn)品,將傳統(tǒng)學(xué)術(shù)期刊內(nèi)容資源進一步擴展為文獻產(chǎn)品、知識產(chǎn)品、知識資源、知識工具、知識服務(wù)等,以此實現(xiàn)智能互聯(lián)網(wǎng)下學(xué)術(shù)期刊內(nèi)容整合途徑.
2.3.1 學(xué)術(shù)期刊二次文獻檢索系統(tǒng)的建立
學(xué)術(shù)期刊已發(fā)表的內(nèi)容為一次文獻,一次文獻的特點是分散、零亂、無序,難以從中發(fā)現(xiàn)文獻與文獻之間的關(guān)系,難以發(fā)揮一次文獻的最大應(yīng)用效益,因此,必須對文獻進行加工,進行整理、濃縮、提煉,按照一定的邏輯順序和科學(xué)體系編排存儲,使之系統(tǒng)化,以便于檢索利用.加工過程中經(jīng)過著錄、標(biāo)引、編目等,其優(yōu)化的結(jié)果是以題錄、目錄、索引、文摘等為主的二次文獻.國外出版集團重視學(xué)術(shù)期刊資源的優(yōu)化,形成了幾大著名的索引:SSCI、SCI、EI、A&HCI、CPCI-SSH、CP?CI-S,國內(nèi)有一些有名的索引,如CSSCI、CSCD等,并形成《高等學(xué)校文科學(xué)術(shù)文摘》《中國社會科學(xué)文摘》《新華文摘》以及人大復(fù)印報刊資料等文摘.這些二次文獻極大提高了一次文獻的利用率,給讀者研究、寫作、訂閱、信息檢索等帶來極大方便.另外,結(jié)合一次文獻和二次文獻再進一步的分析、綜合、總結(jié)等,可得到三次文獻,三次文獻便于系統(tǒng)掌握學(xué)科發(fā)展歷史、學(xué)科動態(tài)、研究成果、預(yù)測學(xué)科發(fā)展文獻,為各種策劃、課題研究、戰(zhàn)略研究等提供決策依據(jù).期刊編輯部可對一次文獻和二次文獻進行加工,得到三次文獻,概括本刊所刊發(fā)的某個欄目、學(xué)科的文章、思想論點、創(chuàng)新之處、選題意義、研究的現(xiàn)狀等,供讀者參考,有利于讀者更好地了解本刊,根據(jù)本刊所關(guān)注的選題寫文章,有的放矢,提高錄用的概率.
2.3.2 學(xué)術(shù)期刊專題庫及智庫的建立
(1)專題庫和知識庫等的建立.在已建立的學(xué)術(shù)期刊數(shù)據(jù)庫的基礎(chǔ)上,將相同或相近主題的文章從期刊數(shù)據(jù)庫中抽取出來,并根據(jù)主題進行分類,建立專題庫、知識庫、參考咨詢庫等,如黨的群眾路線專題文庫、《深化文化體制改革、推動社會主義文化大發(fā)展大繁榮》專題文庫、行業(yè)知識服務(wù)平臺等;在中國知網(wǎng)中,建立起一系列知識庫,如規(guī)范術(shù)語、中國林業(yè)科學(xué)數(shù)據(jù)檢索、表格搜索、圖形搜索、概念搜索、數(shù)字搜索等基于知識元的數(shù)據(jù)庫;還有參考咨詢庫,如黨政領(lǐng)導(dǎo)決策參考平臺、學(xué)術(shù)不端文獻檢測系統(tǒng);評價中心,包括中國學(xué)術(shù)期刊評價開放型定制服務(wù)系統(tǒng)(CAJES)、個刊影響力統(tǒng)計分析數(shù)據(jù)庫等.
(2)開發(fā)智庫,提供智庫決策.以知識庫為基礎(chǔ),通過知識增值,形成基于學(xué)術(shù)期刊知識發(fā)現(xiàn)的專家決策系統(tǒng).通過人工智能,達到高附加值的目標(biāo),實現(xiàn)知識的增值,形成服務(wù)產(chǎn)品,用于決策參考.利用內(nèi)容資源整合的結(jié)果建成不同的專家系統(tǒng),為不同的決策機構(gòu)提供專家決策支撐.對于學(xué)術(shù)期刊來說,根據(jù)專家系統(tǒng),對作者信息、基金項目、引文情況等內(nèi)容資源進行分析,得到各項評刊指標(biāo);對評刊指標(biāo)進行對比,可了解到自己的不足之處,以便改進.可通過專家系統(tǒng)分析和預(yù)測選題,用于選題策劃;對作者的團隊研究情況進行追蹤,可得到作者研究團隊動向,方便進行約稿.而對于政府機關(guān)和各行各業(yè),也可以從學(xué)術(shù)期刊內(nèi)容資源整合得到的智庫或?qū)<易稍兿到y(tǒng)獲取有價值的參考.
5G下的互聯(lián)網(wǎng)特點是智能和萬物互聯(lián),因此,要拓展多種內(nèi)容資源的出版形態(tài),使學(xué)術(shù)期刊內(nèi)容資源能以多種出版狀態(tài)呈現(xiàn)在互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)中,建立起學(xué)術(shù)期刊物聯(lián)網(wǎng).學(xué)術(shù)期刊的出版形態(tài)目前只有兩種最基本的形態(tài),即紙介質(zhì)和電子介質(zhì)(主要以中國知網(wǎng)、萬方數(shù)據(jù)、維普資訊和龍源期刊網(wǎng)為代表的數(shù)據(jù)庫出版物).紙質(zhì)期刊由于訂閱麻煩、讀者閱讀習(xí)慣的改變等原因,除了圖書館、資料室訂閱之外,讀者個人很少訂閱;數(shù)據(jù)庫出版期刊是目前讀者普通使用的方式,因此,數(shù)據(jù)庫出版形態(tài)占主流.然而,數(shù)據(jù)庫出版物有本身的不足,即電子期刊僅僅是紙介質(zhì)期刊的復(fù)制品,用掃描或由排版軟件導(dǎo)出的PDF、或CAJ 文件,與紙介質(zhì)的內(nèi)容完全一致.內(nèi)容沒有進行優(yōu)化、關(guān)聯(lián)等,這種形態(tài)只能適合在電腦上閱讀,也無法得到進一步的信息.在國外,學(xué)術(shù)期刊出版集團如Springerlink、Elsevier等基本上取消了紙介質(zhì)出版物,只提供預(yù)印本供讀者下載自行打?。浑娮映霭嫖镆彩侵饕某霭嫘螒B(tài),除了以上兩種之外,國外出版集團在互聯(lián)網(wǎng)出版和手機出版等已經(jīng)形成一定的規(guī)模.互聯(lián)網(wǎng)出版形態(tài)是網(wǎng)頁的形式的,由于網(wǎng)頁的可擴展功能,可對原文中的內(nèi)容添加一些注釋、備注、鏈接等,還可以加上視頻、聲頻、彩圖、3D模形等,使本來單一形態(tài)的內(nèi)容變得活潑起來,也方便讀者閱讀;手機出版是隨著近幾年來移動智能終端的普及而發(fā)展起來的,讀者閱讀習(xí)慣從電腦閱讀轉(zhuǎn)到手機閱讀,最主要的是,手機閱讀支持碎片化閱讀,以及從淺到深的閱讀,因此,手機出版在對內(nèi)容資源深度加工時,都需要進行淺深閱讀的編輯加工.和互聯(lián)網(wǎng)出版形態(tài)一樣,手機出版也可以對文章內(nèi)容添加一些元素,方便讀者閱讀.Springerlink、中國知網(wǎng)等已經(jīng)推出了手機出版形態(tài)的出版物,但目前學(xué)術(shù)期刊還沒對手機出版給予關(guān)注;另外,目前移動出版、富媒體出版、語義出版已經(jīng)開始在學(xué)術(shù)期刊中應(yīng)用,5G時代這幾種出版方式將得到進一步推廣,并與其它出版方式融合出版,使得5G下學(xué)術(shù)期刊資內(nèi)容資源出版形態(tài)多樣化.
學(xué)術(shù)期刊內(nèi)容資源的整合有利于改善版權(quán)管理.目前學(xué)術(shù)期刊內(nèi)容資源版權(quán)主要是向數(shù)據(jù)庫服務(wù)商提供期刊全文所得到的收益,資源整合擴大了學(xué)術(shù)期刊版權(quán)受益范圍,也增加了內(nèi)容資源版權(quán)管理難度.首先,由于知識表示的改變,學(xué)術(shù)期刊版權(quán)由全文擴大到元數(shù)據(jù),將元數(shù)據(jù)列入版權(quán)的范圍內(nèi).一些數(shù)據(jù)庫服務(wù)商由于期刊獨家代理沒有合作全文收錄,但期刊授權(quán)數(shù)據(jù)庫服務(wù)商對該刊元數(shù)據(jù)的使用,數(shù)據(jù)庫服務(wù)商也必須向期刊繳納相應(yīng)的版權(quán)費.其次,學(xué)術(shù)期刊內(nèi)容資源知識增值所帶來的二次文獻檢索數(shù)據(jù)庫以及專題數(shù)據(jù)庫,其數(shù)據(jù)庫的直接來源是學(xué)術(shù)期刊全文內(nèi)容資源,這方面的版權(quán)收益一般由數(shù)據(jù)庫服務(wù)商獨享.數(shù)據(jù)庫服務(wù)商在和期刊簽署合作協(xié)議時將數(shù)字化匯編權(quán)也列入相應(yīng)權(quán)利當(dāng)中去,但卻沒有將相應(yīng)匯編收益進行合理分配.隨著期刊內(nèi)容資源整合的深入進行,匯編產(chǎn)品如二次文獻檢索數(shù)據(jù)庫以及專題數(shù)據(jù)庫等價值越來越大,收益越來越多,而學(xué)術(shù)期刊卻依然忽視了這部分收益分配的合理性,沒有作相應(yīng)收益分配調(diào)整,必須引起注意.最后,由于學(xué)術(shù)期刊內(nèi)容資源出版形態(tài)多樣化,特別是移動出版的發(fā)展,移動出版受益所占的份額越來越大,學(xué)術(shù)期刊在與學(xué)術(shù)期刊簽署的協(xié)議上卻將移動出版版權(quán)當(dāng)作是網(wǎng)絡(luò)全文內(nèi)容出版的附贈品,沒有對其給予充分重視.因此,內(nèi)容資源整合后的版權(quán)管理要突破原有的分配模式,將元數(shù)據(jù)、二次文獻檢索數(shù)據(jù)庫、專題數(shù)據(jù)庫、移動出版等作為重要版權(quán)給予重視,與數(shù)據(jù)庫服務(wù)商協(xié)議這部分版權(quán)的二次分配事宜,以提高學(xué)術(shù)期刊整合后的內(nèi)容資源版權(quán)收益.
學(xué)術(shù)期刊的內(nèi)容資源是立刊之本,是期刊的生命線,同時,也要重視學(xué)術(shù)期刊的傳播能力與傳播效果.因此,除了要重視對高質(zhì)量的內(nèi)容資源的出版之外,還要對內(nèi)容資源進行有效的整合.5G下人工智能和大數(shù)據(jù)的興起和廣泛應(yīng)用為學(xué)術(shù)期刊的資源整合帶來了機遇,能否抓住機遇,并進行學(xué)術(shù)期刊內(nèi)容資源整合,可避免學(xué)術(shù)期刊內(nèi)容出版的資源浪費,并提高學(xué)術(shù)期刊內(nèi)容資源的利用率,為提高我國學(xué)術(shù)期刊的競爭力提供借鑒.存在的挑戰(zhàn)是,人工智能在學(xué)術(shù)期刊的利用尚未得到重視,也缺乏成熟的技術(shù)支持,目前僅處于探索與實踐階段.但是,從發(fā)展的角度來看,5G下大數(shù)據(jù)和人工智能在學(xué)術(shù)期刊資源整合中的應(yīng)用將受到各方面的重視,并廣泛應(yīng)用于各種信息決策中.