国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用VB讀取中國知網(wǎng)過刊數(shù)據(jù)提取元數(shù)據(jù)的研究

2016-05-18 10:40:40楊海亮林清華付示威
電腦知識與技術(shù) 2016年9期
關(guān)鍵詞:中國知網(wǎng)元數(shù)據(jù)

楊海亮++林清華++付示威

摘 要:元數(shù)據(jù)的提取和發(fā)布為網(wǎng)刊發(fā)布工作中的重要內(nèi)容。為實現(xiàn)自動提取元數(shù)據(jù)功能,該文以中國知網(wǎng)提供的自定義文本數(shù)據(jù)為對象,建立了提取元數(shù)據(jù)的數(shù)學(xué)模型,同時提出尾部分割算法。然后利用基于對象的VB編程軟件編寫了自動提取元數(shù)據(jù)程序。在分析了中國知網(wǎng)數(shù)據(jù)的特點之后,建立了分割關(guān)鍵詞的列表文件,最后將提取的元數(shù)據(jù)保存到Excel文件中。實際應(yīng)用表明,僅幾秒鐘就可以完成一次數(shù)據(jù)的提取工作,一次提取可以是1年的數(shù)據(jù)也可以使十幾年的數(shù)據(jù),在完善過刊信息的工作中提供了很大的作用。

關(guān)鍵詞:網(wǎng)刊發(fā)布系統(tǒng);元數(shù)據(jù);中國知網(wǎng);VB;自動提取

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)09-0090-03

在國內(nèi),絕大部分讀者是從期刊網(wǎng)站獲取期刊全文,進而進行引用的。因此,期刊建立自己的官方網(wǎng)站,為讀者提供論文檢索、數(shù)據(jù)核對、實現(xiàn)在線出版,對擴大期刊的影響力和傳播力至關(guān)重要[1]。網(wǎng)刊發(fā)布系統(tǒng)為期刊建立一個實現(xiàn)現(xiàn)刊和過刊的瀏覽、查詢等功能的網(wǎng)刊數(shù)據(jù)提供了技術(shù)平臺[2-3]。以此為基礎(chǔ),建設(shè)期刊自己的網(wǎng)站時,需要對期刊數(shù)據(jù)進行網(wǎng)刊發(fā)布,對于一般編輯部來說,歷史期刊,有的只是紙質(zhì)的,需要對歷史期刊電子化,轉(zhuǎn)化為電子版的期刊還需要進一步進行元數(shù)據(jù)的提取工作[4-8]。

一般來說,各個編輯部在發(fā)布網(wǎng)刊工作中都是采用手工粘貼拷貝的方式。這種方式不僅工作量很大,而且數(shù)據(jù)質(zhì)量很低。另外,由于手工制作的工作量[9],導(dǎo)致了網(wǎng)站建設(shè)要么耗時很長、要么需要大量人力或物力。因此本文基于對象的VB語言編程軟件,編寫了能夠批量提取元數(shù)據(jù)的程序,采用模式識別智能算法[10-11],從大型數(shù)據(jù)庫[12]提供的信息中準確提取本期所有文章的元數(shù)據(jù),并形成可直接發(fā)布到網(wǎng)刊系統(tǒng)上的Excel文件,大幅度提高工作效率。

5 結(jié)束語

在期刊數(shù)字化的工作中,對于很多新建網(wǎng)站的雜志社來說,有兩部分工作:最新1期的元數(shù)據(jù)提??;歷史期刊的元數(shù)據(jù)提取。對于很多期刊來說歷史期刊的數(shù)據(jù)都已經(jīng)不全了,因此通過大型數(shù)據(jù)庫來完善網(wǎng)站的過刊數(shù)據(jù)成為比較可行的途徑之一。通過本文實現(xiàn)的程序可以對1年的過刊數(shù)據(jù)甚至幾十年的過刊數(shù)據(jù)一次性進行提取操作,工作效率大幅提升。

但是中國知網(wǎng)上的數(shù)據(jù)更新比雜志社期刊出版要延時約2個月,而且網(wǎng)刊發(fā)布系統(tǒng)中要求有的元數(shù)據(jù)有32項,而中國知網(wǎng)提供的僅有12項,所以本文方法并不適合使用在最新一期的元數(shù)據(jù)提取工作上。下一步工作重點研究對最新一期的排版數(shù)據(jù)進行元數(shù)據(jù)的提取上。

參考文獻:

[1] 閆蓓,嚴謹,肖宏.搭建科學(xué)與大眾的橋梁:談科技期刊與大眾媒體的新聞報道合作實踐[J].編輯學(xué)報, 2009,21(4): 325-327

[2] 吉玉珠,胡兵.我國學(xué)術(shù)期刊數(shù)字化建設(shè)的分析與思考[J].圖書與情報,2003(3):33-35.

[3] 張科,王景發(fā).期刊網(wǎng)絡(luò)采編系統(tǒng)研發(fā)及系統(tǒng)功能分析[J].自動化數(shù)字化網(wǎng)絡(luò)化,2008(4):72-76.

[4] 洪鷗,姜春明,陳海清.上海市高??萍计诳瘮?shù)字出版現(xiàn)狀及分析[J].學(xué)報編輯論叢,2011:172-176.

[5] 丁巖,吳惠勤,龍秀芬等.科技期刊數(shù)字化出版轉(zhuǎn)型初探[J]. 編輯學(xué)報, 2011, 23 (sup1):3-6.

[6] 林有興.關(guān)于促進科技期刊高效傳播科技信息的思考[J].編輯學(xué)報, 2005,17(3): 165-166.

[7] 鄭筱梅, 楊小玲. 期刊網(wǎng)絡(luò)化趨勢及科技期刊應(yīng)對策略[J]. 編輯學(xué)報, 2009,21(1): 64-66.

[8] 孫遠,朱曉紅,喻偉.網(wǎng)絡(luò)環(huán)境下科技期刊數(shù)字化建設(shè)初探[J]. 人民長江,2009,40(4):102-103.

[9] 洪鷗,姜春明,王寧.高校學(xué)報自然科學(xué)版網(wǎng)絡(luò)出版現(xiàn)狀[J].調(diào)查與思考,2014,25(7):895-901.

[10] 劉曉華.非計算機專業(yè)VB程序設(shè)計教學(xué)探討[J]. 創(chuàng)新教育,2011(38):135-137.

[11] 劉杰華,楊雁.基于VB 界面的期刊數(shù)據(jù)庫管理系統(tǒng)設(shè)計[J].計算機與數(shù)字工程, 2005, 33(2):127-128.

[12] 孔毅.萬方數(shù)據(jù)資源系統(tǒng)與中國知網(wǎng)數(shù)據(jù)庫對比分析[J].圖書情報工作,2010(sup2):342-347.

猜你喜歡
中國知網(wǎng)元數(shù)據(jù)
基于來源的組織機構(gòu)元數(shù)據(jù)構(gòu)建研究
檔案管理(2017年1期)2017-01-17 19:09:04
元數(shù)據(jù)與社會化標簽在微視頻搜索中的應(yīng)用
高等院校智慧校園建設(shè)規(guī)劃與實現(xiàn)
媒介融合研究的特點與問題
歸檔網(wǎng)絡(luò)信息價值判斷的元數(shù)據(jù)描述研究綜述
中國知網(wǎng)數(shù)據(jù)庫漲價之對策分析
中國市場(2016年22期)2016-07-07 04:28:35
AMLC與PSDS檢測醫(yī)學(xué)論文重復(fù)率結(jié)果分析
今傳媒(2016年5期)2016-06-01 00:08:49
基于數(shù)據(jù)庫的咸陽職業(yè)技術(shù)學(xué)院科研論文統(tǒng)計分析
惠水县| 五家渠市| 玉溪市| 乐陵市| 友谊县| 钦州市| 松江区| 东明县| 湄潭县| 岳普湖县| 樟树市| 康马县| 衡水市| 呼玛县| 宁津县| 广东省| 宁强县| 松桃| 定日县| 堆龙德庆县| 西丰县| 阿鲁科尔沁旗| 潜江市| 汉川市| 东海县| 酒泉市| 邵东县| 乐清市| 兴海县| 白玉县| 罗源县| 五家渠市| 青岛市| 合阳县| 故城县| 象山县| 浦江县| 长汀县| 克什克腾旗| 湖州市| 如皋市|