国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

軌道交通知識服務(wù)平臺暨數(shù)字圖書館的設(shè)計與實現(xiàn)

2019-04-03 05:42:42李雪山郭肖肖姚冬冬
鐵路計算機應(yīng)用 2019年3期
關(guān)鍵詞:行業(yè)動態(tài)多語種檢索

李雪山,郭肖肖,姚冬冬

(中國鐵道科學(xué)研究院集團有限公司 科學(xué)技術(shù)信息研究所,北京 100081)

科技信息資源是支撐科技創(chuàng)新、提高創(chuàng)新能力的重要戰(zhàn)略性資源。近年來,中國鐵路技術(shù)的不斷發(fā)展、中國高鐵走出去步伐不斷加快,對科技創(chuàng)新和產(chǎn)業(yè)化發(fā)展的及時性、有效性、全面性提出了更高要求,需要快捷、系統(tǒng)地獲取各類國內(nèi)外行業(yè)科技信息,及時把握行業(yè)科技發(fā)展動向與趨勢,更好地了解市場競爭對手并洞察市場機會。

經(jīng)過多年的信息化建設(shè),圍繞鐵路科技信息資源建設(shè)工作,全路已建成數(shù)字圖書館和中國鐵路科技與經(jīng)濟信息網(wǎng),但隨著科技信息資源的膨脹式增長、大數(shù)據(jù)技術(shù)及網(wǎng)絡(luò)技術(shù)的快速發(fā)展以及人們對信息獲取利用要求的不斷提高,現(xiàn)有系統(tǒng)存在的問題也日益凸顯[1]。主要表現(xiàn)在:(1)資訊信息缺乏廣度和深度,用戶在查找資源時仍需逐個網(wǎng)站搜索、甄選有效信息;(2)缺乏對競爭對手行業(yè)動態(tài)和技術(shù)熱點等方面的信息匯聚;(3)受限于多語種,用戶無法及時了解國內(nèi)外行業(yè)動態(tài);(4)相較于到圖書館借閱文獻,用戶更傾向閱覽電子文獻;(5)因IP限制原因,用戶在外出差或在家查閱資料時不能及時獲取相關(guān)信息。

為解決上述關(guān)鍵問題,項目組以中國鐵路科技與經(jīng)濟信息網(wǎng)改版為背景,結(jié)合競爭情報思維、專題服務(wù)運行模式,設(shè)計并實現(xiàn)軌道交通知識服務(wù)平臺暨數(shù)字圖書館,旨在為用戶提供更加全面、個性化、精準化的科技資源信息服務(wù)。

1 方案設(shè)計

1.1 建設(shè)目標

平臺在設(shè)計和建設(shè)過程中基于鐵路科研創(chuàng)新的需要,堅持需求驅(qū)動、持續(xù)發(fā)展,通過有效的資源整合、高效便捷的資源獲取、個性化信息推送按需配置情報專題等方式,使目標用戶能有效地獲取所需信息,實現(xiàn)以資源服務(wù)為基礎(chǔ)的,專業(yè)化、個性化、專題化、精準化的情報服務(wù)體系。具體目標如下:

(1)借助自動采集技術(shù)對企業(yè)內(nèi)部信息、外部宏觀環(huán)境信息、外部競爭環(huán)境、外部行業(yè)動態(tài)、技術(shù)創(chuàng)新熱點等進行多維度監(jiān)測,實現(xiàn)網(wǎng)絡(luò)信息自動采編與發(fā)布;

(2)整合內(nèi)外部信息資源(自建、外購、網(wǎng)絡(luò)、內(nèi)部系統(tǒng)資源等),實現(xiàn)多源異構(gòu)資源的統(tǒng)一存儲和檢索展示[2];

(3)提供外文資源的在線翻譯,實現(xiàn)單一語種檢索詞入口的多語種資源統(tǒng)一檢索展示;

(4)提供情報專題定制服務(wù),實現(xiàn)對行業(yè)動態(tài)、技術(shù)前沿、競爭對手等的持續(xù)動態(tài)跟蹤;

(5)實現(xiàn)個性化推薦、智能推送等精準化情報應(yīng)用功能;

(6)培養(yǎng)和提升研究人員的情報利用意識和獲取能力,提高鐵路科技信息流轉(zhuǎn)和情報產(chǎn)出效率。

1.2 建設(shè)方案

根據(jù)軌道交通知識服務(wù)平臺設(shè)計目標,系統(tǒng)主要由資源收集整理、翻譯加工處理、資源存儲和資源服務(wù)等4部分構(gòu)成,如圖1所示。

圖1 系統(tǒng)整體建設(shè)方案

1.2.1 資源收集

針對不同資源采取不同的手段進行收集。

(1)對于國內(nèi)外相關(guān)資訊網(wǎng)站,主要包括國內(nèi)外軌道交通企業(yè)門戶、專業(yè)的行業(yè)資訊網(wǎng)站等。這些網(wǎng)站具有數(shù)量多、技術(shù)不一、風(fēng)格多樣、多語種、采集困難的特點,在此系統(tǒng)綜合利用商業(yè)采集軟件[3]和基于Python技術(shù)[4]自主開發(fā)的采集工具以及人工收集的方式進行數(shù)據(jù)采集,實現(xiàn)軌道交通行業(yè)動態(tài)、熱點資訊的及時獲?。?/p>

(2)對于自建數(shù)據(jù)庫資源,主要包括行業(yè)內(nèi)刊、圖書館館藏特色資源。這些資源大多以紙質(zhì)形式存在,需要耗費較多的人力來進行資源加工,在此系統(tǒng)通過建立數(shù)字化資源加工系統(tǒng)開展紙質(zhì)資源的掃描、OCR識別、元數(shù)據(jù)著錄、數(shù)據(jù)存儲發(fā)布等,實現(xiàn)紙質(zhì)資源電子化,提高館藏資源服務(wù)廣度;

(3)對于外購商業(yè)數(shù)據(jù)庫資源,主要包括知網(wǎng)、萬方、維普等數(shù)據(jù)庫,系統(tǒng)采用元數(shù)據(jù)級整合方式實現(xiàn)多來源數(shù)據(jù)庫的信息融合[5]。

1.2.2 資源加工

借助計算機輔助翻譯技術(shù)、自動標引分類技術(shù)、自然語言處理技術(shù)實現(xiàn)信息資源的自動翻譯、分詞斷句、實體提取、分類標引、實體關(guān)聯(lián)等標準化、規(guī)范化處理,以便于數(shù)據(jù)有效管理和利用。

1.2.3 資源存儲

系統(tǒng)借鑒dspace機構(gòu)知識庫[6]相關(guān)思想,實現(xiàn)專題內(nèi)容自定義及各類型資源元數(shù)據(jù)非編程性動態(tài)定制、擴展功能。即系統(tǒng)可預(yù)先建立元數(shù)據(jù)集,對各元數(shù)據(jù)字段類型、長度、格式、是否建立索引、是否顯示等特征進行設(shè)定,在添加不同資源類型(如期刊論文、資訊、報告、專利等)時,可以從元數(shù)據(jù)集中選擇相應(yīng)字段作為具體描述字段,進而實現(xiàn)多源異構(gòu)資源的統(tǒng)一存儲和檢索。

1.2.4 資源服務(wù)

(1)實現(xiàn)資源服務(wù)系統(tǒng)基本的功能,如簡單檢索、高級檢索、專業(yè)檢索、單庫及全庫檢索、資源下載等;

(2)實現(xiàn)專題化、個性化服務(wù),用戶可根據(jù)自身從事或關(guān)心的專業(yè)、研究方向、科研課題等,通過對知識點進行分解,配置專題,即可實現(xiàn)對競爭對手、熱點技術(shù)、行業(yè)動態(tài)等的自動跟蹤、精準個性化推送功能[7];

(3)基于用戶專業(yè)或行業(yè)需要實現(xiàn)個性化主題門戶網(wǎng)頁定制,提供企業(yè)級資源專題定制服務(wù);

(4)通過開發(fā)APP、微信公眾號、訂閱號等,拓展用戶信息獲取渠道,為用戶提供更加方便快捷的情報信息服務(wù)。

2 系統(tǒng)實現(xiàn)及資源特色

2.1 系統(tǒng)實現(xiàn)

系統(tǒng)在借鑒百度、淘寶等大型企業(yè)軟件系統(tǒng)結(jié)構(gòu)的基礎(chǔ)上,結(jié)合SOA業(yè)務(wù)模型采用Hadoop云計算架構(gòu),以Webservice的方式提供接口;采用HDFS大數(shù)據(jù)分布式文件存儲系統(tǒng)實現(xiàn)海量全文數(shù)據(jù)的管理;采用Nosql的Hbase非關(guān)系型數(shù)據(jù)庫實現(xiàn)元數(shù)據(jù)管理;采用SOLR檢索技術(shù)[8],支持多字段的組合查詢;基于Sql庫的用戶行為記錄和MR機器學(xué)習(xí)算法,以實現(xiàn)精準化個性化情報服務(wù)。

采用DotNet軟件開發(fā)平臺進行了開發(fā)實現(xiàn)。

2.2 系統(tǒng)資源及主要特色

2.2.1 系統(tǒng)數(shù)據(jù)資源概況

系統(tǒng)資源主要分為網(wǎng)絡(luò)資源、商業(yè)數(shù)據(jù)庫資源、自建數(shù)據(jù)庫資源3部分,如圖2所示。網(wǎng)絡(luò)資源主要包括國內(nèi)外軌道交通行業(yè)門戶網(wǎng)站資訊;商業(yè)數(shù)據(jù)庫資源主要包括知網(wǎng)、萬方、維普等商業(yè)數(shù)據(jù)庫的期刊、學(xué)位、會議等文獻資源;自建數(shù)據(jù)庫資源主要包括中外文文摘、中外文全文、鐵路熱點專題等。

2.2.2 主要特色

(1)實現(xiàn)了對軌道交通行業(yè)多來源網(wǎng)絡(luò)情報信息的實時獲取追蹤。

系統(tǒng)結(jié)合競爭情報思維,將情報規(guī)劃、信息收集、信息加工、信息分析、情報生產(chǎn)與傳播流程融入平臺,借助自動采集技術(shù)實現(xiàn)針對企業(yè)內(nèi)部信息資源、外部宏觀環(huán)境信息、外部競爭環(huán)境信息、外部行業(yè)動態(tài)信息、技術(shù)創(chuàng)新熱點信息等多維度的監(jiān)測,使用戶能及時獲知最新行業(yè)動態(tài)、技術(shù)前沿信息、市場變化等信息,輔助實現(xiàn)科研和管理決策[9]。

圖2 系統(tǒng)資源概況

(2)實現(xiàn)了多源異構(gòu)資源元數(shù)據(jù)級整合及一站式檢索。

平臺以資源建設(shè)為基礎(chǔ),在建立統(tǒng)一數(shù)據(jù)標準的基礎(chǔ)上實現(xiàn)了多來源各類型資源的融合,包括自建數(shù)據(jù)庫、商業(yè)數(shù)據(jù)庫、相關(guān)網(wǎng)絡(luò)資源等,涵蓋資訊、期刊、學(xué)位、會議、標準、成果、特色資源等多種文獻類型。平臺最終實現(xiàn)了上述多來源數(shù)據(jù)的統(tǒng)一存儲、檢索、展示,實現(xiàn)了同一資源的多渠道下載,從搜索范圍、搜索效率、搜索質(zhì)量3方面提高了檢索結(jié)果的準確性和全面性,提高了用戶體驗。

(3)實現(xiàn)了多語種資源統(tǒng)一檢索。

針對英、日、俄、德、法等多語種帶來的統(tǒng)一存儲和檢索問題,平臺通過嵌入自動翻譯軟件實現(xiàn)對資源的自動翻譯,為用戶提供了單一語種檢索詞入口的多語種文獻檢索服務(wù),并提供中外文對照展示。針對自動翻譯不準確、翻譯質(zhì)量不高等問題,平臺提供在線編輯、校對功能,以提高多語種資源的翻譯、檢索效果。

(4)開展了鐵路情報多樣化服務(wù)模式。

平臺以信息服務(wù)為核心,重點提供面向用戶專業(yè)、研究領(lǐng)域、熱點前沿技術(shù)等方面的專題服務(wù),提供面向用戶研究過程的場景化服務(wù),以及面向?qū)I(yè)領(lǐng)域的熱點和趨勢分析服務(wù)。為用戶提供諸如知識訂閱、個性化推薦、多終端智能推送、行業(yè)動態(tài)監(jiān)測簡報、行業(yè)熱點趨勢監(jiān)測簡報等信息服務(wù),滿足用戶個性化信息需求。專題服務(wù)界面,如圖3所示。

圖3 專題服務(wù)

3 結(jié)束語

鐵路科技文獻與創(chuàng)新服務(wù)平臺以鐵路科技資源整合為基礎(chǔ),以提供全面、專業(yè)、及時、高效的情報資源服務(wù)為核心,以提高鐵路科技創(chuàng)新能力和競爭力為目標[10],是轉(zhuǎn)變鐵路科技文獻服務(wù)模式的一項有益嘗試。

目前,軌道交通知識服務(wù)平臺暨數(shù)字圖書館基本功能已經(jīng)實現(xiàn),并已開始在鐵科院、軌道交通相關(guān)單位推廣使用。平臺提供的網(wǎng)絡(luò)信息動態(tài)采集監(jiān)測、多源異構(gòu)資源統(tǒng)一搜索、專題定制、信息推送等功能,可為用戶提供更加全面、專業(yè)的信息服務(wù),為鐵路行業(yè)提供全面權(quán)威的戰(zhàn)略決策支撐和業(yè)務(wù)情報支持。

未來,隨著平臺資源的豐富、功能的擴展、運行模式的變革,還需研究制定符合平臺發(fā)展的運行管理機制,規(guī)范資源采購、功能使用、服務(wù)模式、收費標準,并根據(jù)平臺未來跨系統(tǒng)、跨單位協(xié)調(diào)資源整合和服務(wù)的需要,建立健全文獻平臺統(tǒng)籌協(xié)調(diào)機制[11],促進平臺健康可持續(xù)發(fā)展。

猜你喜歡
行業(yè)動態(tài)多語種檢索
語聯(lián)世界,言通天下
行業(yè)動態(tài)
行業(yè)動態(tài)
行業(yè)動態(tài)
2019年第4-6期便捷檢索目錄
行業(yè)動態(tài)
中國化妝品(2018年3期)2018-06-28 06:21:20
多語種《中級軍事漢語》教材的編寫思路與指導(dǎo)思想
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
北美“新清史”研究的基石何在——是多語種史料考辨互證的實證學(xué)術(shù)還是意識形態(tài)化的應(yīng)時之學(xué)?(上)
從英語碩士到法國博士——我的留學(xué)規(guī)劃和多語種學(xué)習(xí)之路
新東方英語(2014年1期)2014-01-07 20:03:00
嘉鱼县| 边坝县| 仪陇县| 高清| 察隅县| 泰和县| 任丘市| 太保市| 陆良县| 如东县| 鄯善县| 禄丰县| 四子王旗| 连州市| 精河县| 城口县| 华坪县| 麦盖提县| 绍兴县| 临邑县| 张家港市| 尉氏县| 仪征市| 阳谷县| 台安县| 太保市| 信宜市| 文成县| 微博| 元阳县| 扬州市| 江安县| 赣榆县| 吐鲁番市| 澄江县| 宁夏| 扎鲁特旗| 股票| 宁河县| 高碑店市| 承德县|