李 宏
(張家口市科學(xué)技術(shù)信息研究所 河北 張家口 075000)
伴隨著我國(guó)科技的飛速發(fā)展,人類(lèi)開(kāi)始進(jìn)入了以云計(jì)算、大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng)為時(shí)代三大主題的大數(shù)據(jù)時(shí)代,推進(jìn)大數(shù)據(jù)技術(shù)發(fā)展作為國(guó)家戰(zhàn)略選擇是全面提升政府治理能力的重要手段。在大數(shù)據(jù)時(shí)代背景下,科技情報(bào)工作作為科學(xué)技術(shù)研究的重要組成部分,關(guān)乎著國(guó)家重大科技戰(zhàn)略的制定和重大核心技術(shù)的突破。科技情報(bào)工作如何在政府決策中發(fā)揮智囊作用,如何將科技情報(bào)工作的價(jià)值最大化,是廣大科技情報(bào)工作者所面臨的一個(gè)重要問(wèn)題。
“大數(shù)據(jù)”概念最早源于美國(guó),它是由威睿、思科、甲骨文和IBM等公司聯(lián)名倡議并發(fā)展而來(lái)。1998年美國(guó)高性能計(jì)算公司SGI的首席科學(xué)家約翰·馬西在一次國(guó)際會(huì)議中提到:伴隨著數(shù)據(jù)量的飛速增長(zhǎng),會(huì)出現(xiàn)4個(gè)難題,即數(shù)據(jù)難理解、難獲取、難處理和難組織,并用“Big Data(大數(shù)據(jù))”來(lái)描述這一挑戰(zhàn),在計(jì)算領(lǐng)域引發(fā)思考。從2009年開(kāi)始,“大數(shù)據(jù)”已成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞語(yǔ)和新型產(chǎn)物。大數(shù)據(jù)時(shí)代這一概念最早是由世界著名咨詢(xún)公司麥肯錫提出的,2011年麥肯錫在《海量數(shù)據(jù)、創(chuàng)新、競(jìng)爭(zhēng)和提高生成率的下一個(gè)新領(lǐng)域》一文中指出,數(shù)據(jù)已滲透到今天的每個(gè)行業(yè)和業(yè)務(wù)功能領(lǐng)域,并已成為重要的生產(chǎn)要素。而人們對(duì)海量數(shù)據(jù)的挖掘和使用預(yù)示著大數(shù)據(jù)已經(jīng)存在于各個(gè)學(xué)科領(lǐng)域,新一輪生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的大數(shù)據(jù)時(shí)代即將到來(lái)。
隨著信息技術(shù)的不斷更新,大數(shù)據(jù)的發(fā)展為我國(guó)經(jīng)濟(jì)發(fā)展提供了極大的便利優(yōu)勢(shì),而大數(shù)據(jù)國(guó)家戰(zhàn)略也由此而形成。我國(guó)2014年3月的《政府工作報(bào)告》指出要“設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺(tái),在新一代移動(dòng)通信、集成電路、大數(shù)據(jù)、先進(jìn)制造、新能源、新材料等方面趕超先進(jìn),引領(lǐng)未來(lái)產(chǎn)業(yè)發(fā)展?!?015年10月在中國(guó)共產(chǎn)黨第十八屆五中全會(huì)公報(bào)中首次提出“實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略”,為“十三五”發(fā)展規(guī)劃提供了創(chuàng)新理念,大數(shù)據(jù)已從新興產(chǎn)業(yè)創(chuàng)新平臺(tái)一躍上升為國(guó)家發(fā)展戰(zhàn)略和行動(dòng)綱要[1~2]。
大數(shù)據(jù)時(shí)代具有4個(gè)顯著的特點(diǎn),簡(jiǎn)稱(chēng)為4V,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)和Value(價(jià)值)。①大量。大數(shù)據(jù)時(shí)代的首要特征是大量,主要是指具有海量的、高增長(zhǎng)率和多樣化特征的信息資產(chǎn)。有資料顯示,我國(guó)互聯(lián)網(wǎng)搜索巨頭百度公司早在2013年就擁有EB(1 0244MB)級(jí)別的數(shù)據(jù)量。阿里和騰訊目前存儲(chǔ)數(shù)據(jù)總量都達(dá)到了100 PB(1 0243MB)以上。淘寶網(wǎng)近4億的會(huì)員每天產(chǎn)生的商品交易數(shù)據(jù)就有約20 TB(1 0242MB),而臉書(shū)近10億的全球用戶(hù)一天產(chǎn)生的日志數(shù)據(jù)總量超過(guò)300 TB。全球數(shù)據(jù)量以每2年翻倍的速度增長(zhǎng),這種背景下迫切需要智能的算法、強(qiáng)大的數(shù)據(jù)處理平臺(tái)以及新的數(shù)據(jù)分析處理技術(shù),來(lái)對(duì)如此大規(guī)模的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析、預(yù)測(cè)和實(shí)時(shí)處理。②多樣。數(shù)據(jù)來(lái)源的廣泛性決定了大數(shù)據(jù)的多樣性。在當(dāng)前應(yīng)用最廣泛的當(dāng)屬各種APP,如京東、抖音、快手和今日頭條等等。這些APP都會(huì)對(duì)用戶(hù)的日志數(shù)據(jù)進(jìn)行分析和評(píng)判,根據(jù)用戶(hù)的不同愛(ài)好從而推送一些用戶(hù)喜歡的內(nèi)容。日志數(shù)據(jù)屬于結(jié)構(gòu)化鮮明的數(shù)據(jù),其它一些諸如圖片、音頻和視頻等數(shù)據(jù)結(jié)構(gòu)化不明顯,這些數(shù)據(jù)因果關(guān)系比較弱,需要人為的方式對(duì)其進(jìn)行標(biāo)注。③高速。我們?cè)谏钪袔缀跆焯於紩?huì)產(chǎn)生海量大數(shù)據(jù)資料。然而對(duì)于這些數(shù)據(jù)來(lái)說(shuō)是需要我們及時(shí)處理的,因此,大數(shù)據(jù)時(shí)代對(duì)于數(shù)據(jù)處理速度有著非常嚴(yán)格的要求,誰(shuí)的處理速度更快,誰(shuí)就會(huì)占得先機(jī)。④價(jià)值。作為大數(shù)據(jù)時(shí)代的核心,海量的數(shù)據(jù)中有價(jià)值的數(shù)據(jù)只是很小的一部分。大數(shù)據(jù)最大的價(jià)值體現(xiàn)在通過(guò)從大量各種類(lèi)型的數(shù)據(jù)中來(lái)挖掘、篩選出對(duì)客戶(hù)有價(jià)值的數(shù)據(jù)資源,通過(guò)深度分析,總結(jié)出規(guī)律和特點(diǎn),運(yùn)用于各個(gè)領(lǐng)域,從而實(shí)現(xiàn)改善社會(huì)治理、提高生產(chǎn)效率以及推動(dòng)科學(xué)研究發(fā)展的目的[3]。
3.1 強(qiáng)化大數(shù)據(jù)觀(guān)念,建立良好的信息資源保障體系。在大數(shù)據(jù)時(shí)代背景下,科技情報(bào)服務(wù)中的信息保障被賦予了新的涵義。和以往對(duì)比,大數(shù)據(jù)技術(shù)條件下對(duì)于信息資源的利用和保障形式會(huì)變得日益便捷和開(kāi)放。此外,在大數(shù)據(jù)技術(shù)產(chǎn)生和應(yīng)用之前,各級(jí)科技情報(bào)服務(wù)部門(mén)之間的界限和對(duì)于信息資源的保護(hù),由此形成的信息資源之間的屏障是難以消除的。在大數(shù)據(jù)時(shí)代,信息資源之間的邊界是非常模糊的,在這種情況下,開(kāi)放性和協(xié)作性將逐步成為科技情報(bào)服務(wù)的主要特點(diǎn)。為了更好的適應(yīng)發(fā)展需求,必須強(qiáng)化大數(shù)據(jù)發(fā)展理念,積極完善信息資源保障體制,從而實(shí)現(xiàn)科技情報(bào)服務(wù)水平的提高[4]。
3.2 科學(xué)利用各種數(shù)據(jù)源??萍记閳?bào)研究會(huì)對(duì)社會(huì)產(chǎn)生各種深遠(yuǎn)的影響,因此,確保情報(bào)分析結(jié)果的準(zhǔn)確可靠顯得尤為重要。這就需要在源頭上做好工作,在數(shù)據(jù)分析過(guò)程中要不斷加以補(bǔ)充和完善??萍记閳?bào)的研究是一項(xiàng)復(fù)雜的工作,不同來(lái)源的信息特性也各不相同。因此,綜合利用各種信息源已成為大數(shù)據(jù)時(shí)代科技情報(bào)研究工作的主要趨勢(shì)。情報(bào)分析工作人員需要從問(wèn)題出發(fā),將全部信息資源進(jìn)行系統(tǒng)整理,用于情報(bào)分析研究。其中,信息源除了有論文、專(zhuān)利等文獻(xiàn)信息,還包括圖表、文本、數(shù)據(jù)以及各種正式或者非正式的出版物。
3.3 加強(qiáng)對(duì)情報(bào)數(shù)據(jù)的篩選和處理。在大數(shù)據(jù)時(shí)代科技情報(bào)研究人員面臨著海量的信息數(shù)據(jù),這些數(shù)據(jù)往往良莠不齊,可能會(huì)產(chǎn)生錯(cuò)誤的分析結(jié)果,從而降低決策的準(zhǔn)確性。大部分?jǐn)?shù)據(jù)庫(kù)具有動(dòng)態(tài)特征,有些數(shù)據(jù)是不完整的、冗余的,甚至是錯(cuò)誤的,從而給數(shù)據(jù)分析人員帶來(lái)識(shí)別上的困難。為此,當(dāng)進(jìn)行數(shù)據(jù)分析處理時(shí)應(yīng)先對(duì)數(shù)據(jù)信息進(jìn)行預(yù)處理,也就是數(shù)據(jù)的篩選和凈化,刪除無(wú)關(guān)數(shù)據(jù)。除此之外,還應(yīng)對(duì)數(shù)據(jù)質(zhì)量進(jìn)行管控,從而提升數(shù)據(jù)分析處理的準(zhǔn)確性,提升政府決策的工作效率[5]。
3.4 強(qiáng)化科技情報(bào)研究人才隊(duì)伍建設(shè)。為了更好的加強(qiáng)情報(bào)學(xué)學(xué)科建設(shè),在國(guó)內(nèi)高校和職業(yè)院校等增設(shè)情報(bào)學(xué)相關(guān)專(zhuān)業(yè),以形成系統(tǒng)化的人才培養(yǎng)體系,為情報(bào)行業(yè)儲(chǔ)備人才。鼓勵(lì)各級(jí)培訓(xùn)機(jī)構(gòu)依據(jù)市場(chǎng)導(dǎo)向新加一些產(chǎn)業(yè)技術(shù)情報(bào)等相關(guān)課程,對(duì)基層科技情報(bào)從業(yè)者進(jìn)行理論和實(shí)踐技能培訓(xùn),尤其是強(qiáng)化產(chǎn)業(yè)戰(zhàn)略和前沿技術(shù)的跟蹤和學(xué)習(xí),重點(diǎn)培養(yǎng)一批適應(yīng)大數(shù)據(jù)時(shí)代產(chǎn)業(yè)發(fā)展急需的專(zhuān)業(yè)情報(bào)人才,打造一支“專(zhuān)業(yè)知識(shí)+技術(shù)背景+情報(bào)評(píng)價(jià)”復(fù)合型人才隊(duì)伍。
3.5 加強(qiáng)科技情報(bào)研究的國(guó)際合作。在當(dāng)前科學(xué)技術(shù)日新月異的全球產(chǎn)業(yè)一體化時(shí)代,科技情報(bào)研究也應(yīng)該打破傳統(tǒng),實(shí)行走出去的戰(zhàn)略,加強(qiáng)與國(guó)外情報(bào)研究機(jī)構(gòu)之間的溝通、交流和合作,時(shí)刻關(guān)注并積極參與科技情報(bào)研究領(lǐng)域的國(guó)際會(huì)議,針對(duì)當(dāng)前一些戰(zhàn)略性產(chǎn)業(yè)技術(shù)發(fā)展面臨的共性問(wèn)題,積極開(kāi)展合作,讓中國(guó)情報(bào)智慧在全球新興產(chǎn)業(yè)技術(shù)發(fā)展中占據(jù)一席之地[6]。