羅立群 李廣建
摘 ? 要:近年來,認(rèn)知科學(xué)、復(fù)雜科學(xué)、計(jì)算社會(huì)科學(xué)等領(lǐng)域出現(xiàn)的新思潮和新理論,為情報(bào)學(xué)的發(fā)展帶來了新的機(jī)遇;大數(shù)據(jù)、人工智能的興起,為情報(bào)學(xué)提供了新方法和新技術(shù)。大數(shù)據(jù)環(huán)境下的情報(bào)學(xué)在思想、方法和技術(shù)上都發(fā)生了許多變革,文章在跟蹤近年情報(bào)學(xué)發(fā)展動(dòng)態(tài)的基礎(chǔ)上,歸納了大數(shù)據(jù)環(huán)境下情報(bào)學(xué)發(fā)展的十大特征,分別為計(jì)算化、模擬化、平臺(tái)化、知識(shí)化、智能化、一體化、多元數(shù)據(jù)融合、方法聯(lián)合化、結(jié)果聚合化和人機(jī)融合化。
關(guān)鍵詞:大數(shù)據(jù)環(huán)境;情報(bào)學(xué);發(fā)展特征
中圖分類號(hào):G350 ? 文獻(xiàn)標(biāo)識(shí)碼:A ? DOI:10.11968/tsyqb.1003-6938.2021011
Ten Characteristics of the Development of Information Science in Big Data Environment
Abstract In recent years, new trends and new theories in cognitive science, complex science, computational social science and other related fields have brought new opportunities for the development of information/intelligence studies; the rise of big data and artificial intelligence has provided new methods and new technologies for information/intelligence studies. Based on tracing recent developments of information/intelligence studies, the paper summarized ten characteristics of information/intelligence studies to show the full picture of information/intelligence studies in the big data environment, which are computerization, simulation, platformization, knowledge-based, intelligent, integration, multi-data fusion, methods combination, results aggregations, and human-machine integration.
Key words big data environment; information/intelligence studies; development characteristics
近年來,全球科學(xué)與技術(shù)界發(fā)生了重大的變革,認(rèn)知科學(xué)、復(fù)雜科學(xué)、計(jì)算社會(huì)科學(xué)等領(lǐng)域出現(xiàn)的新思潮和新理論,為情報(bào)學(xué)的發(fā)展帶來了新的機(jī)遇、注入了新的活力;大數(shù)據(jù)、人工智能的興起,特別是深度學(xué)習(xí)、知識(shí)融合、認(rèn)知計(jì)算等技術(shù)的成熟為情報(bào)學(xué)提供了新方法和新技術(shù)。情報(bào)學(xué)正在積極擁抱這些新的機(jī)遇與挑戰(zhàn),深度融合這些新的思想理論和方法技術(shù),大數(shù)據(jù)環(huán)境下的情報(bào)學(xué)在思想、方法和技術(shù)上都發(fā)生了許多變革。從國(guó)外研究看,以美國(guó)為首的西方國(guó)家近年來開展了大量的大數(shù)據(jù)環(huán)境下的情報(bào)學(xué)研究,如XDATA項(xiàng)目為大數(shù)據(jù)環(huán)境下開展大規(guī)模情報(bào)分析提供了彈性計(jì)算框架和計(jì)算工具[1];大機(jī)制(Big Mechanism)項(xiàng)目試圖解決大數(shù)據(jù)環(huán)境下情報(bào)因果關(guān)系的推理與自動(dòng)分析,從海量文獻(xiàn)自動(dòng)抽取因果片段,將它們組裝成完整因果模型,從而發(fā)現(xiàn)文獻(xiàn)中蘊(yùn)含的因果關(guān)系[2]。從國(guó)內(nèi)研究看,賀德方[3]提出了情報(bào)工程,即利用工程化思維將數(shù)據(jù)、分析方法、情報(bào)技術(shù)等情報(bào)研究工作的要素進(jìn)行組織,用工程化的模式實(shí)現(xiàn)情報(bào)分析的全過程;吳晨生等[4-5]針對(duì)情報(bào)3.0環(huán)境下情報(bào)機(jī)構(gòu)面臨互聯(lián)網(wǎng)信息過載挑戰(zhàn),將智能工具作為情報(bào)生產(chǎn)方式變革的核心內(nèi)容;李廣建和江信昱[6]提出了計(jì)算型情報(bào)分析,通過計(jì)算解決大數(shù)據(jù)情報(bào)分析問題。上述國(guó)內(nèi)外的研究和實(shí)踐表明,大數(shù)據(jù)環(huán)境下情報(bào)學(xué)的理論、方法發(fā)生了許多變化。筆者在跟蹤近年情報(bào)學(xué)發(fā)展動(dòng)態(tài)的基礎(chǔ)上,總結(jié)和歸納了大數(shù)據(jù)環(huán)境下情報(bào)學(xué)的十大特征。需要指出,有些特征之間存在著交叉,但強(qiáng)調(diào)的重點(diǎn)有所不同,揭示的情報(bào)學(xué)發(fā)展的方面有所不同,故筆者在本文中都盡量將它們列舉出來,以期能全面展示情報(bào)學(xué)近年的發(fā)展。
1 ? 計(jì)算化
計(jì)算化是計(jì)算思維和情報(bào)思維相結(jié)合的產(chǎn)物,強(qiáng)調(diào)通過將情報(bào)需求或情報(bào)課題轉(zhuǎn)換成可形式化表達(dá)和求解的問題,對(duì)情報(bào)研究的問題進(jìn)行數(shù)學(xué)建模,運(yùn)用計(jì)算的方式進(jìn)行大規(guī)模、自動(dòng)化的分析,從而獲得有價(jià)值的結(jié)論。情報(bào)計(jì)算化的核心主要包括兩個(gè)方面,即情報(bào)問題的模型化和情報(bào)過程的自動(dòng)化。
情報(bào)問題的模型化就是指利用系統(tǒng)化的符號(hào)和數(shù)學(xué)表達(dá)式對(duì)情報(bào)問題進(jìn)行抽象的描述,其本質(zhì)是對(duì)情報(bào)問題進(jìn)行數(shù)學(xué)建模,這個(gè)過程也是深入理解情報(bào)問題的過程。情報(bào)問題的模型化是實(shí)現(xiàn)情報(bào)計(jì)算化的重要途徑。如在科技情報(bào)分析中,傳統(tǒng)的基于計(jì)量的情報(bào)分析主要依賴于計(jì)量和計(jì)數(shù)的方法,對(duì)情報(bào)問題缺乏深入的洞察力。大數(shù)據(jù)環(huán)境下,海量的科技文獻(xiàn)、科技新聞等為情報(bào)建模提供了良好的數(shù)據(jù)基礎(chǔ),能夠幫助研究人員從科技文獻(xiàn)內(nèi)容/文本中提取有價(jià)值的信號(hào)以及重要的知識(shí),從而對(duì)文獻(xiàn)內(nèi)容進(jìn)行細(xì)粒度的建模,發(fā)現(xiàn)一些潛在的和隱藏的模式。這是傳統(tǒng)的計(jì)量型情報(bào)分析所不具備的優(yōu)勢(shì)和特征。Choi和Jun[7]開發(fā)了一種針對(duì)專利內(nèi)部特征分析的計(jì)算方法和模型——基于專利文本分析的貝葉斯模型——來預(yù)測(cè)技術(shù)空白點(diǎn),該模型通過文本預(yù)處理技術(shù)從海量的專利文件中提取關(guān)鍵的技術(shù)術(shù)語并用專利文檔技術(shù)矩陣進(jìn)行技術(shù)特征建模,使用貝葉斯聚類方法對(duì)結(jié)果進(jìn)行投票,從而確定未來技術(shù)的空白研究領(lǐng)域。Choi和Jun提出的這種計(jì)算和建模方法深入到了專利文本內(nèi)部,對(duì)技術(shù)細(xì)節(jié)進(jìn)行細(xì)粒度的表征,對(duì)技術(shù)領(lǐng)域做了更細(xì)致的區(qū)分,因此能夠有效地表征微觀層面的技術(shù)特征,可以對(duì)細(xì)分的技術(shù)領(lǐng)域做出預(yù)測(cè),這是傳統(tǒng)的計(jì)量分析方法很難做到的。
情報(bào)過程的自動(dòng)化就是指通過形式化的軟件指令,在不需要人工干預(yù)(或極少干預(yù))的情況下,按預(yù)期的情報(bào)目標(biāo)實(shí)現(xiàn)情報(bào)的采集、加工、分析、服務(wù)等各個(gè)環(huán)節(jié)的工作。大數(shù)據(jù)時(shí)代,情報(bào)工作面臨海量、高速、低價(jià)值密度的大數(shù)據(jù)的挑戰(zhàn),而情報(bào)活動(dòng)本身又是一個(gè)充滿競(jìng)爭(zhēng)、博弈的活動(dòng),這就需要通過自動(dòng)化賦能,使情報(bào)工作具備高效、準(zhǔn)確、持續(xù)的能力。情報(bào)過程的自動(dòng)化不是簡(jiǎn)單的將機(jī)器作為輔助工具,而是將其上升到了情報(bào)過程的主導(dǎo)地位,盡量減少人的主觀因素對(duì)情報(bào)過程的影響和干擾,從而最大限度地保證情報(bào)結(jié)果的客觀性和可靠性[8]。發(fā)現(xiàn)并識(shí)別未來有影響力的科學(xué)和研究概念可以幫助學(xué)者和科學(xué)家集中更多的精力聚焦有前景的研究領(lǐng)域。傳統(tǒng)上情報(bào)分析被認(rèn)為是一種藝術(shù)[9],以分析人員為主導(dǎo)的情報(bào)分析往往會(huì)受到人的認(rèn)知因素和外部環(huán)境因素的影響而產(chǎn)生發(fā)現(xiàn)和識(shí)別的偏差,為此,Kathy等[10]設(shè)計(jì)了一種自動(dòng)化的科技預(yù)測(cè)的情報(bào)流程,通過自動(dòng)化的處理單元將科技情報(bào)分析、預(yù)測(cè)劃分為四個(gè)階段,分別是碎片生成、文檔分層處理、碎片分層處理以及機(jī)器學(xué)習(xí),為了保障分析的客觀性,整個(gè)流程中研究人員只需對(duì)各個(gè)階段所必要的參數(shù)進(jìn)行設(shè)置,而無須干預(yù)中間的處理過程,情報(bào)分析系統(tǒng)將按照預(yù)設(shè)的分析模型(如概念識(shí)別、實(shí)體關(guān)系鏈接、引文情感分析和句子修辭分析等)實(shí)現(xiàn)大規(guī)模、實(shí)時(shí)的科技情報(bào)分析和預(yù)測(cè),通過對(duì)800萬篇全文文章和4800萬條元數(shù)據(jù)進(jìn)行分析,驗(yàn)證了該情報(bào)分析流程具有較高的準(zhǔn)確性和可靠性。
2 ? 模擬化
模擬化泛指以實(shí)驗(yàn)或訓(xùn)練為目的,將原本的系統(tǒng)、事物的關(guān)鍵特性或者行為功能予以系統(tǒng)化和公式化,對(duì)關(guān)鍵特征做模擬,從而實(shí)現(xiàn)對(duì)系統(tǒng)或事物的發(fā)展趨勢(shì)、發(fā)展結(jié)果等的預(yù)測(cè)。模擬不僅僅是一項(xiàng)技術(shù),也是一種解決問題的方法[11]。模擬一般要通過計(jì)算機(jī)進(jìn)行仿真,其實(shí)質(zhì)上是在計(jì)算機(jī)中構(gòu)造與現(xiàn)實(shí)世界相對(duì)應(yīng)的“人工世界”,建立起與真實(shí)系統(tǒng)相對(duì)應(yīng)的“平行系統(tǒng)”,在“人工世界”與 “平行系統(tǒng)”中對(duì)現(xiàn)實(shí)復(fù)雜系統(tǒng)進(jìn)行試驗(yàn)性研究[12]。情報(bào)學(xué)的模擬化是指通過復(fù)雜、動(dòng)態(tài)仿真方法和技術(shù)根據(jù)以往的情報(bào)現(xiàn)象演化的過程和規(guī)律,抽象并驗(yàn)證出情報(bào)現(xiàn)象演化的關(guān)鍵特征,從而發(fā)現(xiàn)情報(bào)現(xiàn)象發(fā)展的基本規(guī)律,并推斷研究對(duì)象未來可能出現(xiàn)的狀態(tài)。
傳統(tǒng)的情報(bào)研究中缺乏有效的途徑對(duì)復(fù)雜、動(dòng)態(tài)的情報(bào)研究對(duì)象進(jìn)行刻畫,情報(bào)的推理和預(yù)測(cè)能力非常有限。在大數(shù)據(jù)時(shí)代,情報(bào)源發(fā)生了巨大的變化,傳統(tǒng)情報(bào)源的數(shù)字化以及互聯(lián)網(wǎng)技術(shù)和物聯(lián)網(wǎng)技術(shù)的興起,使得情報(bào)研究對(duì)象的活動(dòng)和發(fā)生的事件等相關(guān)信息都會(huì)迅速地反映到各類數(shù)據(jù)庫(kù)、網(wǎng)站、網(wǎng)絡(luò)媒體之中,同時(shí),數(shù)字化和網(wǎng)絡(luò)化的數(shù)據(jù)資源又大大方便了情報(bào)的感知和采集,從而使得動(dòng)態(tài)研究情報(bào)對(duì)象成為可能。模擬為動(dòng)態(tài)情報(bào)研究提供了一種實(shí)現(xiàn)路徑,通過為情報(bào)研究對(duì)象的關(guān)鍵特征構(gòu)建仿真模型,將平行映射的數(shù)據(jù)作為輸入,對(duì)真實(shí)世界的運(yùn)行狀態(tài)進(jìn)行仿真計(jì)算,可以有效地進(jìn)行情報(bào)的推理。如在社會(huì)情報(bào)研究中,根據(jù)社會(huì)行為和情報(bào)的理論或經(jīng)驗(yàn),構(gòu)建一個(gè)關(guān)于現(xiàn)實(shí)社會(huì)系統(tǒng)的在計(jì)算機(jī)中運(yùn)行的人工社會(huì),然后模擬其動(dòng)態(tài)演變過程,以便獲得對(duì)社會(huì)結(jié)構(gòu)、功能及其變遷更好的理解,并解釋復(fù)雜的社會(huì)現(xiàn)象或情報(bào)現(xiàn)象,乃至預(yù)測(cè)社會(huì)發(fā)展演變的可能方向,從而針對(duì)特定的社會(huì)活動(dòng)獲取有價(jià)值的情報(bào)[13]。網(wǎng)絡(luò)輿情的演變就是一個(gè)典型的實(shí)時(shí)動(dòng)態(tài)變化的過程,傳統(tǒng)的分析方法對(duì)網(wǎng)絡(luò)輿情動(dòng)態(tài)傳播機(jī)制的解釋能力較弱,難以對(duì)網(wǎng)絡(luò)輿情未來的發(fā)展和演變進(jìn)行推理,往往需要借助仿真思想和方法對(duì)輿情的演變進(jìn)行模擬,從而為輿情的干預(yù)提供有效的預(yù)案。彭程等[14]基于傳統(tǒng)的SIR模型并引入信任系數(shù)變量來刻畫輿情傳播中,易感染類網(wǎng)民的動(dòng)態(tài)演化過程以及輿情演化趨勢(shì),通過模擬實(shí)際網(wǎng)絡(luò)輿情傳播的特征解釋了復(fù)雜網(wǎng)絡(luò)輿情的傳播機(jī)制,并通過易感染類網(wǎng)民占比與閾值間的大小關(guān)系發(fā)現(xiàn)了效用最大化的輿情防控點(diǎn),最后利用仿真計(jì)算來檢驗(yàn)政府輿論干預(yù)手段的有效性。
在科技情報(bào)研究中,論文、專利、報(bào)告等科技文獻(xiàn)真實(shí)地記錄了科學(xué)研究的成果、研究的過程、學(xué)者及研究機(jī)構(gòu)的情況、作者和機(jī)構(gòu)之間的合作關(guān)系、項(xiàng)目的受資助情況等諸多科研要素,海量的科技文獻(xiàn)就構(gòu)成了學(xué)術(shù)大數(shù)據(jù)。傳統(tǒng)的情報(bào)方法受制于技術(shù)因素對(duì)學(xué)術(shù)大數(shù)據(jù)的利用非常有限,往往借助簡(jiǎn)單的、靜態(tài)的計(jì)量方法對(duì)科技文獻(xiàn)的內(nèi)外部特征進(jìn)行分析。如基于引文的文獻(xiàn)計(jì)量方法是科技情報(bào)領(lǐng)域最為基礎(chǔ)和重要的量化手段和方法,引文分析方法有助于探索,組織和分析大量科技創(chuàng)新的歷史數(shù)據(jù),主要是幫助研究人員理解過去。大數(shù)據(jù)時(shí)代的科技情報(bào)研究不僅僅需要理解過去,更需要了解未來,諸如都有誰是未來有潛力的學(xué)者、將來可能有哪些顛覆性的研究領(lǐng)域、哪一類的團(tuán)隊(duì)組合更易產(chǎn)生創(chuàng)新成果等。這就需要利用微觀層面細(xì)粒度的學(xué)術(shù)數(shù)據(jù)對(duì)知識(shí)融合、科學(xué)創(chuàng)新的演變進(jìn)行仿真計(jì)算,模擬并推演可能的創(chuàng)新過程。如Dashun Wang等[15]通過海量的學(xué)術(shù)大數(shù)據(jù)對(duì)科學(xué)家的影響力的演變過程進(jìn)行擬合,加入了時(shí)間維度來量化科學(xué)家職業(yè)生涯中影響力和生產(chǎn)力的動(dòng)態(tài)變化過程,他們通過隨機(jī)影響力的規(guī)則構(gòu)建了一個(gè)隨機(jī)仿真模型,將發(fā)表產(chǎn)量、個(gè)人能力和運(yùn)氣的影響作為參數(shù),仿真模型能夠模擬出科學(xué)研究成功的普遍模式,用來推測(cè)出科學(xué)家未來影響力的演變軌跡,同時(shí),該研究還能利用學(xué)術(shù)大數(shù)據(jù)的模擬仿真,揭示出學(xué)術(shù)研究、知識(shí)創(chuàng)新過程中所蘊(yùn)含的規(guī)律、機(jī)制以及隱藏模式,以幫助加速科學(xué)發(fā)現(xiàn)和創(chuàng)新。
3 ? 平臺(tái)化
平臺(tái)化的概念最早來源于軟件開發(fā)領(lǐng)域,是指一套綜合的工具和一組實(shí)踐證明的共享的最佳平臺(tái),它形成了完整、久經(jīng)考驗(yàn)、開放和模塊化的解決方案,旨在隨需應(yīng)變開發(fā)軟件和基于軟件的服務(wù)。廣義的平臺(tái)化概念被定義為任何一種在其上可以構(gòu)建其他應(yīng)用(內(nèi)容)的技術(shù)基礎(chǔ),這種理念本質(zhì)上是一種更先進(jìn)的生產(chǎn)模式。在情報(bào)領(lǐng)域,將成熟的、共性的情報(bào)方法和技術(shù)進(jìn)行抽象、集成、封包成為“平臺(tái)”,基于平臺(tái)實(shí)現(xiàn)最大程度的重用,規(guī)模化的情報(bào)分析和情報(bào)服務(wù),這樣,一方面極大地提高了情報(bào)分析和情報(bào)服務(wù)的效率、降低了成本和代價(jià);另一方面能為情報(bào)用戶提供了基于平臺(tái)的個(gè)性化、多樣化的情報(bào)分析和服務(wù)的定制。這種理念,我們稱之為“平臺(tái)化”。
情報(bào)的業(yè)務(wù)需求有兩個(gè)特點(diǎn),一是情報(bào)需求多且繁雜;二是情報(bào)需求時(shí)效要求極高。在傳統(tǒng)的情報(bào)工作中,情報(bào)分析和情報(bào)服務(wù)是基于情報(bào)分析人員的“手工藝活”,往往需要分析人員耗費(fèi)大量的時(shí)間和精力根據(jù)不斷變化的情報(bào)需求進(jìn)行調(diào)整,情報(bào)工作的效率難以保障。如在科技情報(bào)研究中,科技數(shù)據(jù)的采集、存儲(chǔ)、科技情報(bào)的處理和分析等情報(bào)過程都需要情報(bào)人員根據(jù)實(shí)際的情報(bào)業(yè)務(wù)需求尋找不同的方法、工具并進(jìn)行不斷地調(diào)試,進(jìn)行針對(duì)性的開發(fā)。當(dāng)新的情報(bào)需求出現(xiàn)時(shí),由于原有的業(yè)務(wù)代碼與通用代碼的耦合性較差,已有的成果難以得到有效的復(fù)用。近年來,云計(jì)算技術(shù)和大數(shù)據(jù)技術(shù)的興起,為情報(bào)服務(wù)和情報(bào)分析提供了符合行業(yè)標(biāo)準(zhǔn)的開放平臺(tái),這類開放平臺(tái)能夠幫助情報(bào)人員快速定義、集成和自動(dòng)化地構(gòu)建情報(bào)系統(tǒng)的業(yè)務(wù)流程,最大化減少了重復(fù)開發(fā)和調(diào)試的工作量,使情報(bào)的分析能力、計(jì)算能力和存儲(chǔ)能力得以高效復(fù)用。如DARPA開展的XDATA項(xiàng)目就是一個(gè)廣泛的基于現(xiàn)在云計(jì)算和大數(shù)據(jù)行業(yè)標(biāo)準(zhǔn)的情報(bào)開放平臺(tái)[1],該項(xiàng)目開發(fā)了高度可復(fù)用的情報(bào)分析、計(jì)算和存儲(chǔ)的通用技術(shù)平臺(tái),包括資源采集、清洗與轉(zhuǎn)換、數(shù)據(jù)建模、數(shù)據(jù)分析、結(jié)果可視化、用戶交互、信息查詢等基礎(chǔ)功能,情報(bào)部門可以根據(jù)自身情報(bào)業(yè)務(wù)的實(shí)際需求在其基礎(chǔ)之上快速地搭建、個(gè)性化地配置面向具體領(lǐng)域情報(bào)工作的情報(bào)系統(tǒng)和服務(wù)平臺(tái)。另一方面,隨著情報(bào)技術(shù)和情報(bào)方法的成熟以及工作流技術(shù)在情報(bào)領(lǐng)域的應(yīng)用,將情報(bào)分析中的共性方法、技術(shù)按情報(bào)任務(wù)抽象、集成、封包成“情報(bào)技術(shù)平臺(tái)”和最佳的“情報(bào)解決方案”,通過可配置的方式根據(jù)情報(bào)分析業(yè)務(wù)的需求對(duì)分析方法、分析模型、分析的計(jì)算資源等進(jìn)行靈活的組合和配置,能夠快速的構(gòu)建面向特定情報(bào)任務(wù)的分析流程,從而實(shí)現(xiàn)情報(bào)分析和情報(bào)服務(wù)的規(guī)?;ㄖ啤H缤蹯o宜等[16]深入地研究各類型情報(bào)分析方法,提出了情報(bào)方法具有層次性,即“理論型方法指導(dǎo)思維邏輯、集合型方法集成研究流程、操作型方法實(shí)施任務(wù)解決、計(jì)算型方法實(shí)現(xiàn)測(cè)度計(jì)量”,揭示了情報(bào)分析方法在數(shù)據(jù)處理和任務(wù)解決中的應(yīng)用規(guī)律。這項(xiàng)研究對(duì)不同數(shù)據(jù)和不同情報(bào)任務(wù)中的情報(bào)方法的定制和組合提供了理論基礎(chǔ)。
4 ? 知識(shí)化
知識(shí)化是大數(shù)據(jù)時(shí)代情報(bào)學(xué)理念和思想的重大轉(zhuǎn)變之一,情報(bào)學(xué)正從過去的強(qiáng)調(diào)知識(shí)組織和知識(shí)體系構(gòu)建的研究即解決“是什么”的模式,朝著強(qiáng)調(diào)深層次知識(shí)發(fā)現(xiàn)與知識(shí)利用研究即發(fā)現(xiàn)情報(bào)現(xiàn)象背后所蘊(yùn)含的規(guī)律和模式的“為什么”以及提出理性解決方案的“如何做”的方向發(fā)展。知識(shí)一直以來是情報(bào)學(xué)研究的核心問題,著名情報(bào)學(xué)家布魯克斯[17]曾指出情報(bào)學(xué)研究對(duì)象是客觀知識(shí)世界,只是受制于不同時(shí)期的認(rèn)知水平和技術(shù)水平,不同時(shí)期組織、利用知識(shí)的方式方法及其效果也不盡相同。傳統(tǒng)上情報(bào)學(xué)都是通過間接的方式對(duì)知識(shí)進(jìn)行處理,更多的是基于對(duì)信息、數(shù)據(jù)的分析和處理來實(shí)現(xiàn)對(duì)知識(shí)的組織和定位,高階的分析和處理往往還需要分析人員根據(jù)自身的經(jīng)驗(yàn)和知識(shí)以及對(duì)情報(bào)問題的理解來進(jìn)行。在大數(shù)據(jù)環(huán)境下,情報(bào)人員有限的腦力難以對(duì)海量的信息和知識(shí)進(jìn)行轉(zhuǎn)化和利用,知識(shí)化的本質(zhì)在于用機(jī)器逐漸替代情報(bào)人員在情報(bào)問題的解決過程中成為知識(shí)轉(zhuǎn)化和利用的主體,機(jī)器借助于知識(shí)驅(qū)動(dòng)的計(jì)算模式直接、高效地利用可表征、可計(jì)算的知識(shí)參與到情報(bào)采集、情報(bào)分析、情報(bào)服務(wù)中需要使用到知識(shí)的環(huán)節(jié),協(xié)同其它的情報(bào)方法實(shí)現(xiàn)與情報(bào)分析人員相似的知識(shí)轉(zhuǎn)化、知識(shí)利用的認(rèn)知功能。知識(shí)化的核心在于情報(bào)/知識(shí)的可計(jì)算化,這就需要知識(shí)驅(qū)動(dòng)的計(jì)算模式來加以支撐[18],這些知識(shí)計(jì)算模式包括概念推理、語義計(jì)算、知識(shí)圖譜、因果關(guān)系分析、反事實(shí)預(yù)測(cè)等,而且,隨著對(duì)知識(shí)化的深入研究,還會(huì)誕生新的知識(shí)驅(qū)動(dòng)的計(jì)算模式。
當(dāng)前情報(bào)學(xué)中的知識(shí)化研究呈現(xiàn)出兩個(gè)主要的特征和趨勢(shì):
(1)利用領(lǐng)域知識(shí)指導(dǎo)面向特定任務(wù)的情報(bào)過程,優(yōu)化情報(bào)結(jié)果。具體地說,就是領(lǐng)域知識(shí)的融合貫穿于信息采集、預(yù)處理、模型選擇與數(shù)據(jù)分析及結(jié)果解讀整個(gè)情報(bào)過程。在這個(gè)過程中,領(lǐng)域知識(shí)的融合有助于消除存在歧義或不確定性的數(shù)據(jù)、降低數(shù)據(jù)的冗余度、降低算法計(jì)算的難度和模型構(gòu)建的復(fù)雜度。同時(shí),將領(lǐng)域知識(shí)融合與情報(bào)分析結(jié)果相互印證,提高情報(bào)結(jié)果解讀的質(zhì)量,從而增強(qiáng)情報(bào)分析的可靠性和準(zhǔn)確性。如王萍等[19]提出了領(lǐng)域知識(shí)融合驅(qū)動(dòng)下的醫(yī)學(xué)情報(bào)分析模型構(gòu)建與優(yōu)化的思想和方法,以冠心病患者的臨床資料為分析對(duì)象,將醫(yī)學(xué)領(lǐng)域知識(shí)融合嵌入機(jī)器學(xué)習(xí)全過程,優(yōu)化領(lǐng)域知識(shí)驅(qū)動(dòng)數(shù)據(jù)挖掘模型構(gòu)建策略,促進(jìn)數(shù)據(jù)的知識(shí)發(fā)現(xiàn)從傳統(tǒng)型的算法驅(qū)動(dòng)向新型的領(lǐng)域知識(shí)指導(dǎo)轉(zhuǎn)型,提高了數(shù)據(jù)挖掘結(jié)果的置信度。
(2)發(fā)現(xiàn)蘊(yùn)含在大數(shù)據(jù)中隱藏的模式、規(guī)律、因果關(guān)系等高階知識(shí),這類知識(shí)一般具有較高的使用價(jià)值或其本身已經(jīng)是情報(bào)產(chǎn)品了。在傳統(tǒng)的情報(bào)工作中,單一孤立的知識(shí)和事實(shí)是需要人工去交叉驗(yàn)證的并分析其中的因果關(guān)系,但是,大數(shù)據(jù)時(shí)代的海量數(shù)據(jù)信息中隱藏的因果關(guān)系結(jié)構(gòu)一般都比較復(fù)雜、因果鏈冗長(zhǎng),其中往往會(huì)包含數(shù)量巨大的相關(guān)的、不相關(guān)的、顯性的和隱性的多種因素,因果關(guān)系的構(gòu)建需要將分散在不同數(shù)據(jù)中的多個(gè)單一知識(shí)點(diǎn)融合起來才能形成一個(gè)完整的鏈條,傳統(tǒng)的情報(bào)方法很難實(shí)現(xiàn),需要新的思路和方法,知識(shí)計(jì)算就是一種解決方案。如Valenzuela-Escárcega 等[20]提出了一種面向生物醫(yī)學(xué)的文獻(xiàn)自動(dòng)閱讀思想和方法,該方法能夠?qū)Π┌Y生物學(xué)科技文獻(xiàn)進(jìn)行大規(guī)模的分析,能夠從有關(guān)文獻(xiàn)中抽取出Ras基因家族的癌癥生物信息傳導(dǎo)途徑和機(jī)理,進(jìn)而將它們?nèi)趨R成大型的因果模型,利用這些模型識(shí)別出并解釋了大量先前并不明確的癌癥信息傳導(dǎo)途徑。
5 ? 智能化
智能化是大數(shù)據(jù)時(shí)代情報(bào)學(xué)最核心的特征之一,也是未來情報(bào)學(xué)發(fā)展的重要趨勢(shì)。智能化是指以情報(bào)思想為指導(dǎo),以解決情報(bào)問題為目標(biāo),借助大數(shù)據(jù)、機(jī)器學(xué)習(xí)、云計(jì)算、物聯(lián)網(wǎng)等智能技術(shù)賦能情報(bào)獲取、處理、分析、分發(fā)等情報(bào)全流程,實(shí)現(xiàn)數(shù)據(jù)、信息、知識(shí)、情報(bào)、智慧的轉(zhuǎn)化、管理與應(yīng)用。對(duì)于情報(bào)工作而言,智能技術(shù)帶來的影響是全局性和根本性的,情報(bào)工作已經(jīng)從“數(shù)據(jù)世界”的獲取和管理發(fā)展到了“知識(shí)世界”的知識(shí)發(fā)現(xiàn)和情報(bào)知識(shí)轉(zhuǎn)化這樣的層次。智能技術(shù)在情報(bào)領(lǐng)域的應(yīng)用可以提升情報(bào)全流程各階段的能力,因此日益成為世界主要國(guó)家情報(bào)競(jìng)爭(zhēng)的制高點(diǎn)[21]。正如美國(guó)中央情報(bào)局前副局長(zhǎng)兼首席學(xué)習(xí)官Joseph Gartin[22]所言,情報(bào)領(lǐng)域正處于重大的轉(zhuǎn)折點(diǎn),未來將受到人工智能,大數(shù)據(jù)和機(jī)器學(xué)習(xí)潛在的強(qiáng)大破壞性影響,人工智能和機(jī)器學(xué)習(xí)正迅速成為情報(bào)中重要的組成部分。
在情報(bào)獲取過程中,智能化使情報(bào)從被動(dòng)采集轉(zhuǎn)向主動(dòng)監(jiān)測(cè),情報(bào)處理的部分功能被前置到了情報(bào)獲取階段,情報(bào)獲取的效率和規(guī)模得到了極大的提升。傳統(tǒng)的情報(bào)流程屬于線性的模式,情報(bào)的采集往往是基于情報(bào)的需求和情報(bào)計(jì)劃來執(zhí)行的。大數(shù)據(jù)時(shí)代的情報(bào)環(huán)境存在深度不確定性,情報(bào)源的數(shù)據(jù)和信息更新快、規(guī)模大、來源多等特性決定了傳統(tǒng)的線性情報(bào)獲取模式已經(jīng)不再有效,智能化技術(shù)賦能情報(bào)獲取則改變了傳統(tǒng)的情報(bào)模式,能夠?qū)崿F(xiàn)跨時(shí)空、立體、多點(diǎn)、主動(dòng)的監(jiān)測(cè),通過智能感知從海量信息中主動(dòng)獲取微弱信號(hào),提前預(yù)警預(yù)測(cè)可能發(fā)生的危機(jī)。如Compton R等[23]提出了一種用社交媒體進(jìn)行智能感知的情報(bào)獲取思想和方法,該方法通過智能過濾器動(dòng)態(tài)地從推特上公開可用的數(shù)據(jù)中提取推文,快速收集有關(guān)即將發(fā)生的事件的時(shí)間、地理位置等關(guān)鍵信息,有效避免了大量獲取的無關(guān)信息對(duì)情報(bào)分析帶來的負(fù)擔(dān),對(duì)拉丁美洲可能發(fā)生的社會(huì)動(dòng)蕩事件進(jìn)行高效預(yù)測(cè)。
在情報(bào)處理和分析過程中,智能化使情報(bào)分析主體從分析人員轉(zhuǎn)變?yōu)橹悄軝C(jī)器代理,智能機(jī)器代理承擔(dān)了更多的情報(bào)分析和處理任務(wù)。在傳統(tǒng)的情報(bào)工作中,情報(bào)分析人員要花費(fèi)大量的時(shí)間和精力對(duì)圖像、視頻、文本、社交媒體等全源情報(bào)進(jìn)行分析,從時(shí)空、事物、人物、事件等多維度去發(fā)現(xiàn)特定的聯(lián)系或模式,這種方式已不再適用新的大數(shù)據(jù)情報(bào)環(huán)境。大數(shù)據(jù)時(shí)代的情報(bào)處理和分析,智能機(jī)器代理通過模擬情報(bào)人員的情報(bào)分析認(rèn)知模式,以便理解復(fù)雜的現(xiàn)象世界,并對(duì)關(guān)鍵的對(duì)象、事件進(jìn)行提取和抽象,協(xié)助情報(bào)人員發(fā)現(xiàn)動(dòng)態(tài)變化的情報(bào)環(huán)境中復(fù)雜事件所蘊(yùn)含的模式和趨勢(shì)。如美國(guó)伊利諾伊大學(xué)的研究團(tuán)隊(duì)在研究人類對(duì)復(fù)雜事件如何進(jìn)行組織的認(rèn)知規(guī)律的基礎(chǔ)上,提出了基于事件理解的抽象模式和事件組織結(jié)構(gòu),借助自然語言處理、圖像識(shí)別等智能技術(shù)從多源異構(gòu)情報(bào)源中識(shí)別對(duì)國(guó)家安全產(chǎn)生重大影響的動(dòng)態(tài),并對(duì)復(fù)雜事件及所有參與者按時(shí)間順序進(jìn)行鏈接和組織,進(jìn)而識(shí)別和繪制出看似無關(guān)的事件或數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,從而對(duì)國(guó)家安全與影響國(guó)家利益的事件進(jìn)行預(yù)警[24-25]。
6 ? 一體化
情報(bào)的一體化是新時(shí)期情報(bào)思想、情報(bào)體系和情報(bào)工作的一種轉(zhuǎn)變。從國(guó)外看,美國(guó)情報(bào)部門認(rèn)為當(dāng)今世界充滿復(fù)雜性和不確定性,美國(guó)面臨的戰(zhàn)略環(huán)境急劇變化,其受到的來自國(guó)際與國(guó)內(nèi)的威脅與挑戰(zhàn)日趨多樣且相互關(guān)聯(lián),情報(bào)一體化是應(yīng)對(duì)上述挑戰(zhàn)的一種明智的情報(bào)戰(zhàn)略轉(zhuǎn)變。美國(guó)歷來就非常重視情報(bào)一體化的建設(shè),不論是戰(zhàn)略目標(biāo)制定上還是戰(zhàn)略實(shí)施方法,情報(bào)一體化都是核心內(nèi)容[26]。一體化就是通過情報(bào)體系整合化、情報(bào)流程協(xié)同化、情報(bào)資源集中化,整合情報(bào)界各部分力量,使整體力量大于各部分之和[27]。從國(guó)內(nèi)看,新時(shí)期我國(guó)情報(bào)工作的外部環(huán)境發(fā)生了重大轉(zhuǎn)變,情報(bào)工作正面臨“百年未有之大變局”,國(guó)際形勢(shì)正處在新的轉(zhuǎn)折點(diǎn)上,世界多極化、經(jīng)濟(jì)全球化、社會(huì)信息化、文化多樣化深入發(fā)展,各國(guó)相互關(guān)聯(lián)、相互依存度前所未有,國(guó)際形勢(shì)進(jìn)入了加速演變和深刻調(diào)整的時(shí)期[28]。情報(bào)體系所面臨的外部環(huán)境是一個(gè)相互關(guān)聯(lián)、相互影響、非線性的復(fù)雜系統(tǒng),牽一發(fā)而動(dòng)全身。如近年來,以美國(guó)為首的國(guó)家發(fā)起的貿(mào)易爭(zhēng)端,這背后涉及到國(guó)家的科技安全、經(jīng)濟(jì)安全、產(chǎn)業(yè)安全等問題,這些問題錯(cuò)綜復(fù)雜、相互交織,這就需要一體化的情報(bào)思想、情報(bào)體系應(yīng)對(duì)新的挑戰(zhàn)、化解重大危機(jī)。情報(bào)的一體化經(jīng)歷了兩個(gè)發(fā)展階段,第一個(gè)階段是在全球化的背景下,情報(bào)工作強(qiáng)調(diào)跨部門或跨國(guó)的同類情報(bào)和信息的共享與交互。全球化促進(jìn)了國(guó)際貿(mào)易和投資、技術(shù)進(jìn)步和經(jīng)濟(jì)改革,創(chuàng)造了一個(gè)無國(guó)界的世界。但越來越多的邊界滲透、流動(dòng)人口以及全球金融和通訊帶來了許多新的安全挑戰(zhàn),包括政權(quán)顛覆、內(nèi)戰(zhàn)、傳染病、恐怖主義、叛亂、族裔沖突、非法販運(yùn)人口、毒品、武器、走私等[29]。上述安全挑戰(zhàn)具有跨國(guó)、跨地區(qū)的特點(diǎn),這就需要情報(bào)工作加強(qiáng)國(guó)家間情報(bào)機(jī)構(gòu)、國(guó)際組織、私營(yíng)機(jī)構(gòu)之間的合作,通過情報(bào)的共享與交換應(yīng)對(duì)這些安全挑戰(zhàn)。特別是在金融情報(bào)、公共衛(wèi)生情報(bào)、反恐情報(bào)等領(lǐng)域開展情報(bào)共享與交換尤為重要。如歐盟國(guó)家為加強(qiáng)打擊國(guó)際金融犯罪的力度,荷蘭、英國(guó)、法國(guó)、盧森堡等國(guó)于2002年聯(lián)合建立了歐盟的金融情報(bào)體系—金融情報(bào)網(wǎng)絡(luò)(FIU.NET),開展歐盟金融情報(bào)部門之間的信息交換,取得了一定效果。
上述信息共享是在單一類型情報(bào)系統(tǒng)內(nèi),不同類型機(jī)構(gòu)間并不存在橫向上的情報(bào)共享機(jī)制,逐漸形成煙囪式體制,無法產(chǎn)生更高價(jià)值的情報(bào)產(chǎn)品為預(yù)警、決策服務(wù)[30]。特別是近年來國(guó)際情報(bào)戰(zhàn)略重心已從全球反恐情報(bào)轉(zhuǎn)向地緣政治情報(bào),情報(bào)一體化發(fā)展跨入了第二個(gè)階段,即向情報(bào)深度全域融合的一體化方向發(fā)展。深度全域融合是指情報(bào)工作已不再局限于特定領(lǐng)域、特定類型的機(jī)構(gòu)、特定區(qū)域或國(guó)家,而是重視全領(lǐng)域的、全類型的情報(bào)共享,從以往強(qiáng)調(diào)專業(yè)化的垂直情報(bào),轉(zhuǎn)向強(qiáng)調(diào)全局化的多領(lǐng)域橫向融合的情報(bào),打通分散在各個(gè)領(lǐng)域、各個(gè)層次的情報(bào)孤島。深度全域融合主要體現(xiàn)在兩個(gè)方面:一方面是在情報(bào)的體系架構(gòu)上實(shí)現(xiàn)情報(bào)的融合,建立類似于大腦中樞機(jī)制的情報(bào)中樞,通過情報(bào)中樞將不同區(qū)域、不同機(jī)構(gòu)、不同來源的信息、情報(bào)匯聚到中心節(jié)點(diǎn)、集中統(tǒng)一進(jìn)行分析和處理,為不同的情報(bào)機(jī)構(gòu)提供統(tǒng)一的、全局的情報(bào),從根源上有效的解決了情報(bào)共享的問題。最典型的例子是美國(guó)在2003年開展的情報(bào)融合中心項(xiàng)目,主要目的是提升聯(lián)邦政府層面上如聯(lián)邦調(diào)查局、中央情報(bào)局、司法部、美國(guó)軍隊(duì)等與州級(jí)、地方政府之間相互分享信息能力[31];另一方面是在情報(bào)服務(wù)國(guó)家重大決策上,往往涉及的領(lǐng)域和層面較多,更加強(qiáng)調(diào)從全局多領(lǐng)域視角洞察隱藏的重要模式和重要因素之間相互的影響。傳統(tǒng)的情報(bào)工作模式都是不同領(lǐng)域、不同層次的情報(bào)機(jī)構(gòu)為重大決策分別提供情報(bào)參考,這種情報(bào)是割裂的,難以產(chǎn)生情報(bào)的協(xié)同效應(yīng),情報(bào)的輔助決策功能大打折扣。這就需要系統(tǒng)的、全局的將軍事情報(bào)、經(jīng)濟(jì)情報(bào)、社會(huì)情報(bào)、產(chǎn)業(yè)情報(bào)、科技情報(bào)等情報(bào)領(lǐng)域統(tǒng)一協(xié)調(diào),從總體的角度為決策層提供的全局的、跨領(lǐng)域的全面態(tài)勢(shì)感知,為決策的各個(gè)方面、各個(gè)環(huán)節(jié)提供全面的情報(bào)。如在供應(yīng)鏈安全情報(bào)領(lǐng)域,一般會(huì)涉及眾多的產(chǎn)業(yè)公司、情報(bào)組織、政府部門和非政府組織,供應(yīng)鏈特別是ICT領(lǐng)域的供應(yīng)鏈往往鏈條較長(zhǎng),影響輻射面較廣,供應(yīng)鏈的多層次性質(zhì)掩蓋了家庭、汽車、航空運(yùn)輸以及至關(guān)重要的政府武器系統(tǒng)和關(guān)鍵基礎(chǔ)設(shè)施中使用的產(chǎn)品和技術(shù)服務(wù)的安全性,這就需要一體化的情報(bào)保障供應(yīng)鏈安全[32]。2018年,美國(guó)政府通過了《安全技術(shù)法案》,在情報(bào)組織體系上由聯(lián)邦采購(gòu)安全委員會(huì)(FASC)開展供應(yīng)鏈安全的情報(bào)工作,其采取了“全行業(yè)”和 “全政府 ”的策略,聯(lián)合了聯(lián)邦部門和機(jī)構(gòu)、州和地方政府以及私營(yíng)部門,在情報(bào)資源和情報(bào)服務(wù)上,通過為眾多情報(bào)合作機(jī)構(gòu)和組織提供統(tǒng)一的平臺(tái)來實(shí)現(xiàn)供應(yīng)鏈情報(bào)的共享和一體化情報(bào)決策服務(wù),進(jìn)而減輕對(duì)手對(duì)美國(guó)供應(yīng)鏈的不對(duì)稱攻擊[33]。
7 ? 多元數(shù)據(jù)融合
多元數(shù)據(jù)融合是指在情報(bào)工作重視多來源、多類型的數(shù)據(jù),并在情報(bào)工作中注重這些數(shù)據(jù)的整合與融合。如在科技情報(bào)領(lǐng)域,多元數(shù)據(jù)一般包括論文數(shù)據(jù)、專利數(shù)據(jù)、科技新聞、學(xué)術(shù)網(wǎng)站、實(shí)驗(yàn)數(shù)據(jù)等,多類型的數(shù)據(jù)包括數(shù)值型數(shù)據(jù)、文本型數(shù)據(jù)、流媒體類數(shù)據(jù)等。多元化的數(shù)據(jù)可以從不同的角度刻畫出情報(bào)對(duì)象的特征,多元數(shù)據(jù)融合綜合利用情報(bào)對(duì)象相關(guān)的各種信息,以更加全面、系統(tǒng)的方式刻畫和描述出情報(bào)對(duì)象的發(fā)展?fàn)顟B(tài)和趨勢(shì)。美國(guó)國(guó)防部資助的 “科學(xué)和技術(shù)預(yù)測(cè)的回顧性研究”項(xiàng)目中指出,最好的預(yù)測(cè)不是從單個(gè)數(shù)據(jù)流中構(gòu)建的,而是從數(shù)百或數(shù)千個(gè)數(shù)據(jù)流的平均值中得出的[34]。由此我們可以看到,多元數(shù)據(jù)融合不僅提升了分析的全面性,還提升了分析結(jié)果的準(zhǔn)確性。
多元數(shù)據(jù)融合是現(xiàn)代情報(bào)領(lǐng)域中非常重要的一個(gè)特征和方法論,多元數(shù)據(jù)融合的第一次飛躍是在2000年左右,信息技術(shù)的不斷發(fā)展和成熟,在金融消費(fèi)、個(gè)人出行、移動(dòng)通信等領(lǐng)域得到了廣泛的應(yīng)用,社會(huì)組織和個(gè)人的活動(dòng)都可以被其產(chǎn)生的數(shù)字足跡追蹤到。另一方面,受911恐怖襲擊的影響,面向社會(huì)情報(bào)的多元數(shù)據(jù)融合和情報(bào)獲取愈發(fā)受到國(guó)內(nèi)外情報(bào)界的重視。如2003年美國(guó)情報(bào)界開始重視公民多元數(shù)據(jù)的獲取和融合化工作,通過持續(xù)的自動(dòng)監(jiān)測(cè)與分析來識(shí)別并預(yù)警可能的高風(fēng)險(xiǎn)恐怖活動(dòng)[35]。美國(guó)國(guó)防高級(jí)研究計(jì)劃局DARPA開展的完全掌握情報(bào)項(xiàng)目(Total Information Awareness),通過開發(fā)超大型全源信息存儲(chǔ)庫(kù)技術(shù)創(chuàng)建虛擬、集中式的大型數(shù)據(jù)庫(kù),實(shí)現(xiàn)對(duì)多來源信息融合[36],其中多元數(shù)據(jù)包括:財(cái)務(wù)記錄、醫(yī)療記錄、通訊記錄和旅行記錄以及新的信息來源。該項(xiàng)目開發(fā)的數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)工具能夠?qū)Υ罅啃畔⑦M(jìn)行分類以識(shí)別和發(fā)現(xiàn)特定的恐怖活動(dòng)模式。多元數(shù)據(jù)融合的第二次飛躍是在2010年以后,Web2.0技術(shù)、大數(shù)據(jù)技術(shù)、傳感技術(shù)等新一代信息革命推動(dòng)了全球社會(huì)、經(jīng)濟(jì)、生活與數(shù)字技術(shù)的深度融合,可供情報(bào)工作使用的數(shù)據(jù)在數(shù)據(jù)量、多樣性、豐富性、可訪問性等方面都有大幅的提升,面向Web的、面向開源數(shù)據(jù)的情報(bào)采集與獲取成為這一時(shí)期情報(bào)界研究的重點(diǎn)。如韓國(guó)首爾國(guó)立大學(xué)的Heyeol Kwon[37]提出了一種基于多元數(shù)據(jù)融合的新興科技情報(bào)分析框架,該框架通過不僅獲取了傳統(tǒng)科學(xué)出版物的數(shù)據(jù),還融合了多個(gè)開源的科技數(shù)據(jù)源,包括了Web學(xué)術(shù)數(shù)據(jù)、Wikipedia數(shù)據(jù)等,通過潛在語義分析、知識(shí)提取、實(shí)現(xiàn)了對(duì)新興技術(shù)的分析和預(yù)測(cè)。該研究發(fā)現(xiàn),不同數(shù)據(jù)源對(duì)科技預(yù)測(cè)起到的作用是不同的,而且,相同的內(nèi)容在不同數(shù)據(jù)源中出現(xiàn)時(shí)所代表的含義也是不同的。如當(dāng)科學(xué)研究產(chǎn)生成果時(shí),最先會(huì)以學(xué)術(shù)論文的形式出現(xiàn),相關(guān)內(nèi)容會(huì)出現(xiàn)在論文數(shù)據(jù)源中,表明有可能出現(xiàn)科技變革;當(dāng)某個(gè)研究成果已經(jīng)達(dá)到一定的成熟度時(shí),專利就會(huì)開始引用相關(guān)文獻(xiàn),相關(guān)內(nèi)容會(huì)出現(xiàn)在專利數(shù)據(jù)源中,預(yù)示著未來技術(shù)變革的可能性進(jìn)一步增大;而當(dāng)相關(guān)內(nèi)容被新聞轉(zhuǎn)載時(shí),說明這些內(nèi)容已經(jīng)不局限在學(xué)術(shù)圈之內(nèi)了,這些內(nèi)容已經(jīng)引起社會(huì)的高度關(guān)注,意味著該研究成果已經(jīng)成熟或者即將成熟。由此通過多元數(shù)據(jù)的融合就能判斷出新技術(shù)的發(fā)展趨勢(shì)以及當(dāng)前的發(fā)展階段。
8 ? 方法聯(lián)合化
方法聯(lián)合化是指通過融合多種情報(bào)方法、情報(bào)模型的優(yōu)勢(shì)對(duì)情報(bào)問題進(jìn)行求解,以獲得最優(yōu)的情報(bào)決策、推斷、預(yù)測(cè)等結(jié)果。任何單一的分析方法和模型都是從某一個(gè)維度或角度對(duì)分析對(duì)象的一種反映和呈現(xiàn),各種分析方法和模型都有自身的優(yōu)勢(shì)和劣勢(shì),為了最大化避免分析方法和模型的不確定性和盡量減少分析誤差,充分利用各種分析方法和模型的優(yōu)點(diǎn),就要通過多種分析模型和方法的混合、組合、整合等融合手段來抵消各自的系統(tǒng)不同偏差,從而取得準(zhǔn)確的分析結(jié)果[38]。
大數(shù)據(jù)時(shí)代,情報(bào)任務(wù)呈現(xiàn)出兩個(gè)突出的特點(diǎn):(1)情報(bào)需求更加復(fù)雜化、模糊化,深度不確定的情報(bào)環(huán)境造成了情報(bào)用戶對(duì)情報(bào)需求和情報(bào)問題難以清晰定義,存在“走一步看一步”的情況,明確情報(bào)任務(wù)和問題本身就成為一個(gè)情報(bào)問題,需要從情報(bào)需求的不確定性中探索確實(shí)性;(2)情報(bào)對(duì)象更加多元化、隱蔽化,情報(bào)對(duì)象的真實(shí)面貌往往被大量數(shù)據(jù)和信息所掩蓋,真實(shí)的情報(bào)需要多方法聯(lián)合化來融合大量的“信息碎片”以發(fā)現(xiàn)“全貌”。上述特點(diǎn)強(qiáng)化了情報(bào)工作中多方法、多模型聯(lián)合使用。具體地說,首先,需要聯(lián)合多種分析模型和方法提高情報(bào)工作的準(zhǔn)確性、全面性和可靠性。如在情報(bào)分析中,單一的情報(bào)方法很難達(dá)到較為理想的準(zhǔn)確率,相對(duì)于選擇最佳情報(bào)模型而言,多種情報(bào)模型和方法的融合是提高分析的準(zhǔn)確性的一種手段[39]。美國(guó)著名的技術(shù)情報(bào)專家Tugrul.U Daim曾指出,新興技術(shù)識(shí)別是非常困難的,特別是在缺乏可用歷史數(shù)據(jù)的情況下,復(fù)雜的商業(yè)技術(shù)如芯片技術(shù)、動(dòng)力電池技術(shù)、食品安全技術(shù)等通常會(huì)有多種因素(政治,文化等)影響商業(yè)技術(shù)的普及,僅靠技術(shù)趨勢(shì)的分析是無法考慮到這些因素對(duì)技術(shù)的影響。他提出的解決辦法就是將文獻(xiàn)計(jì)量法、專利分析法、系統(tǒng)動(dòng)力學(xué)等多種方法進(jìn)行組合,對(duì)新興技術(shù)進(jìn)行融合分析。使用文獻(xiàn)計(jì)量方法和專利趨勢(shì)曲線擬合方法從技術(shù)視角對(duì)新興技術(shù)進(jìn)行分析,使用多選項(xiàng)分析和組織影響力分析從組織視角對(duì)新興技術(shù)進(jìn)行分析,使用市場(chǎng)分析和競(jìng)爭(zhēng)力分析通過校準(zhǔn)代表消費(fèi)者偏好的變量來合并個(gè)人觀點(diǎn)從消費(fèi)者視角對(duì)新興技術(shù)進(jìn)行分析,最終通過系統(tǒng)動(dòng)力學(xué)將所有這些變量合并到一個(gè)模型中,以便表示復(fù)雜的反饋回路,并生成表示市場(chǎng)滲透率的預(yù)計(jì)S曲線,實(shí)現(xiàn)對(duì)商業(yè)技術(shù)的精準(zhǔn)分析和判斷[40]。其次,數(shù)據(jù)驅(qū)動(dòng)型和知識(shí)驅(qū)動(dòng)型方法的聯(lián)合化。本文提到知識(shí)化是當(dāng)前情報(bào)學(xué)的一個(gè)重要特征,而知識(shí)驅(qū)動(dòng)的方法往往會(huì)與數(shù)據(jù)驅(qū)動(dòng)的方法一同使用。在大數(shù)據(jù)環(huán)境下,一方面,海量的數(shù)據(jù)流動(dòng)和離散多元的信息嚴(yán)重影響了情報(bào)分析的效率和效果,所以還需要相關(guān)領(lǐng)域的知識(shí)來支撐數(shù)據(jù)驅(qū)動(dòng)的分析;另一方面,大數(shù)據(jù)環(huán)境下的情報(bào)需求具有不確定性,這就需要情報(bào)分析方法對(duì)復(fù)雜情報(bào)環(huán)境和分析對(duì)象具有深入的洞察力。數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)相融合的方法非常適合在問題邊界定義模糊的情報(bào)分析場(chǎng)景中發(fā)現(xiàn)一些隱藏的模式。如在輿情分析中,知識(shí)技術(shù)的應(yīng)用主要對(duì)特定領(lǐng)域、特定需求的輿情信息進(jìn)行組織,從而對(duì)輿情數(shù)據(jù)的采集、分析進(jìn)行過程性指導(dǎo)和監(jiān)督,甚至可以直接用于輿情服務(wù),提高大數(shù)據(jù)輿情分析系統(tǒng)的準(zhǔn)確性和實(shí)用性。張思龍和王蘭成[41]提出了一種知識(shí)和數(shù)據(jù)雙輪驅(qū)動(dòng)的網(wǎng)絡(luò)輿情分析技術(shù),它既能發(fā)揮大數(shù)據(jù)處理技術(shù)在智能信息處理和深度語義挖掘方面的優(yōu)勢(shì),又結(jié)合了知識(shí)技術(shù)構(gòu)建一系列的輿情知識(shí)庫(kù)和案例庫(kù),從而完善輿情知識(shí)服務(wù)體系。
9 ? 結(jié)果聚合化
結(jié)果聚合化是指在情報(bào)領(lǐng)域利用群體智慧效應(yīng)獲得相對(duì)最優(yōu)的情報(bào)問題解決方案或情報(bào)分析結(jié)果,一般包括針對(duì)特定情報(bào)任務(wù)或問題的推斷、決策或預(yù)測(cè)。群體智慧是從許多個(gè)體的合作與競(jìng)爭(zhēng)中涌現(xiàn)出來的,具有優(yōu)于個(gè)體的智慧與能力的特點(diǎn)。著名的科學(xué)家弗朗西斯·高爾頓曾通過實(shí)驗(yàn)發(fā)現(xiàn)聚合眾人智慧優(yōu)于個(gè)人的智慧。他讓787個(gè)不同職業(yè)的人根據(jù)自己經(jīng)驗(yàn)去猜測(cè)一頭牛的體重,盡管每個(gè)人的答案與實(shí)際重量(1197磅)相差甚遠(yuǎn),但最終答案聚合后的平均值卻十分接近正確答案,誤差不到一磅[42]。美國(guó)科學(xué)院院士斯科特·佩奇[43]進(jìn)一步從多樣性的視角驗(yàn)證了在復(fù)雜環(huán)境中多樣性在決策上的優(yōu)勢(shì),證實(shí)了聚合具有多樣性的認(rèn)知、多樣性職業(yè)背景、多樣性教育背景的群體智慧,在進(jìn)行分析、決策、預(yù)測(cè)時(shí)往往優(yōu)于能力較強(qiáng)的個(gè)人或單一背景的團(tuán)隊(duì)。
近年來,研究表明,領(lǐng)域?qū)<以诜治龊蜎Q策中普遍存在一定程度的認(rèn)知偏差,諾貝爾獎(jiǎng)獲得者丹尼卡尼曼[44]指出,認(rèn)知偏差會(huì)影響預(yù)測(cè)者做出理性的推理。在情報(bào)分析領(lǐng)域,美國(guó)著名的情報(bào)科學(xué)家菲利普·泰洛克曾受IARPA的資助進(jìn)行過長(zhǎng)達(dá)數(shù)十年的實(shí)證研究,其研究結(jié)果表明,單一領(lǐng)域或單一背景的專家(組)在情報(bào)分析中做出的推斷、預(yù)測(cè)的準(zhǔn)確性要落后于具多樣性背景的團(tuán)隊(duì)[45]。針對(duì)情報(bào)分析和決策中單一的分析結(jié)果可能存在的認(rèn)知偏差問題,情報(bào)結(jié)果的聚合是一種有效的解決途徑,通過充分發(fā)揮群體的智慧、聚合來自不同分析團(tuán)隊(duì)對(duì)同一情報(bào)問題的分析結(jié)果,可以使分析結(jié)論更加全面、客觀、理性。菲利普·泰洛克[46]提出了一種全新的聚合群體智慧進(jìn)行情報(bào)預(yù)測(cè)的思想和理論方法體系,并將該方法應(yīng)用于地緣政治“宜居帶”問題的預(yù)測(cè)(即難度適中,即不能特別容易,也不能難到世界上無人可以回答)。首先,從全美招募了2700多名志愿者,他們的教育背景、職業(yè)、年齡各異,通過均化的方法將他們?nèi)康念A(yù)測(cè)結(jié)果進(jìn)行聚合,第一年團(tuán)隊(duì)的準(zhǔn)確率比個(gè)人高23%。之后,遴選出準(zhǔn)確性較高的預(yù)測(cè)者組成超級(jí)預(yù)測(cè)者團(tuán)隊(duì),通過在線預(yù)測(cè)平臺(tái)向眾多分布在各地的預(yù)測(cè)者發(fā)布相關(guān)的預(yù)測(cè)問題并及時(shí)推送與預(yù)測(cè)相關(guān)的各種信息,在交互的過程中完成預(yù)測(cè)結(jié)果的收集并通過聚合全部預(yù)測(cè)者的結(jié)果進(jìn)行平均。結(jié)果顯示預(yù)測(cè)平均準(zhǔn)確率高達(dá)80%以上,遠(yuǎn)遠(yuǎn)超過了掌握機(jī)密資料的專業(yè)分析人員的預(yù)測(cè)。除此之外,信息市場(chǎng)也被認(rèn)為是一種比較有效的結(jié)果聚合模式,信息市場(chǎng)是交易特定合同的市場(chǎng),該種合同基于不確定的未來事件的結(jié)果,以此確定贏虧,現(xiàn)在被用于預(yù)測(cè)各類事件包括國(guó)際事件、社會(huì)事件、科技預(yù)測(cè)等領(lǐng)域[47]。信息市場(chǎng)的機(jī)制是增加準(zhǔn)確預(yù)測(cè)者的資產(chǎn),并使最不準(zhǔn)確預(yù)測(cè)者的資產(chǎn)趨于零。那些具有較強(qiáng)預(yù)測(cè)能力的人則傾向于將更多的資產(chǎn)進(jìn)行投資,因此會(huì)對(duì)市場(chǎng)價(jià)格產(chǎn)生更大的影響[48]。其本質(zhì)就是將分析者的智慧、知識(shí)、信息通過網(wǎng)絡(luò)平臺(tái)進(jìn)行聚合通過市場(chǎng)行為形成最優(yōu)化的決策、預(yù)測(cè)結(jié)果。
10 ? 人機(jī)融合化
人機(jī)融合化是指在情報(bào)工作中使機(jī)器概率化的智能與情報(bào)分析人員有機(jī)化的智能相互融合、互為補(bǔ)充,共同協(xié)作完成復(fù)雜的情報(bào)任務(wù)。情報(bào)工作往往涉及到社會(huì)、文化、道德、宗教、價(jià)值取向等多種因素,人之所以有人的用處,主要在于人有區(qū)別與其他物體和生物的道德、人格、靈魂、精神、記憶等精神活動(dòng)[49],這是在情報(bào)工作中機(jī)器和人工智能技術(shù)不能替代人的重要原因。在情報(bào)工作中,將情報(bào)組織在決策、預(yù)測(cè)、干預(yù)中體現(xiàn)的價(jià)值效應(yīng)(社會(huì)價(jià)值、文化價(jià)值)和國(guó)家利益融入機(jī)器的算法和模型之中并相互匹配,形成有機(jī)化與形式化相互協(xié)調(diào)的、理性的、智慧的情報(bào)結(jié)果。情報(bào)的人機(jī)融合化是一個(gè)遞歸循環(huán)的過程,一方面情報(bào)組織通過充分發(fā)揮人在反省、歸納、預(yù)期等認(rèn)知能力,將基于自身發(fā)展目標(biāo)、戰(zhàn)略意圖等隱性的情報(bào)預(yù)期與機(jī)器進(jìn)行融合,而機(jī)器則充分發(fā)揮其在搜索、分析、計(jì)算、優(yōu)化等方面的能力。人機(jī)融合就是人處理其擅長(zhǎng)的“應(yīng)該”(should)等價(jià)值取向的主觀信息,而機(jī)器不僅處理其擅長(zhǎng)的“是”(being)等規(guī)則概率的客觀數(shù)據(jù),同時(shí)也將從人處理“應(yīng)該”(should)信息中優(yōu)化自己的算法,從而產(chǎn)生人+機(jī)器既大于人也大于機(jī)器的效果[50]。
傳統(tǒng)的情報(bào)工作中,機(jī)器處于輔助地位,主要承擔(dān)了信息的存儲(chǔ)、組織與計(jì)算;人的分析處于主導(dǎo)地位,依賴于大量的分析人員直接干預(yù)分析的方法、分析的過程以及對(duì)分析的結(jié)果進(jìn)行解釋,這就使得需要一定的分析周期才能最終形成情報(bào)產(chǎn)品以輔助高層決策。近年來,一方面,情報(bào)工作發(fā)生根本性轉(zhuǎn)變,情報(bào)環(huán)境更加復(fù)雜多變,競(jìng)爭(zhēng)對(duì)手更加狡詐敏捷,情報(bào)任務(wù)具有影響要素眾多、抽象層次較高、時(shí)間更加緊迫、不確實(shí)性更強(qiáng)的特性;另一方面,隨著人工智能技術(shù)特別是態(tài)勢(shì)感知、人機(jī)協(xié)同認(rèn)知、智能決策等認(rèn)知智能技術(shù)的成熟,人機(jī)融合化正逐漸成為情報(bào)領(lǐng)域重要的特征和發(fā)展趨勢(shì)。人機(jī)融合化使機(jī)器成為情報(bào)分析中解決問題的合作伙伴,在網(wǎng)絡(luò)安全、數(shù)據(jù)分析、災(zāi)難援助等情報(bào)工作中與人類分析人員共同完成較為復(fù)雜和高級(jí)的情報(bào)任務(wù)。這就要求機(jī)器要像情報(bào)分析專家一樣承擔(dān)更多的、更高級(jí)的情報(bào)分析任務(wù),解決機(jī)器和人類在情報(bào)處理等“思考”方式上的基本差異,促進(jìn)情報(bào)領(lǐng)域的人機(jī)融合化。如2017年DARPA確立了全新的情報(bào)發(fā)展戰(zhàn)略——將機(jī)器作為合作伙伴,從認(rèn)知層次解決情報(bào)問題(Transform cognitive problems using machines-as-partners)[51],這一發(fā)展戰(zhàn)略背后蘊(yùn)含三層含義:(1)機(jī)器與人共同協(xié)作、融合承擔(dān)更高級(jí)別的情報(bào)分析任務(wù);(2)將人的情報(bào)分析思維和認(rèn)知機(jī)制向機(jī)器遷移,使機(jī)器模仿人的情報(bào)、知識(shí)的轉(zhuǎn)化、融合機(jī)制;(3)機(jī)器要具有一種更適合機(jī)器的情報(bào)決策、預(yù)測(cè)、干預(yù)的認(rèn)知能力,最終超越人類情報(bào)認(rèn)知能力。目前,機(jī)器正在認(rèn)知上學(xué)習(xí)和模仿人類的情報(bào)分析策略和機(jī)制,在某些分析能力方面已超越人類的現(xiàn)有分析能力,人機(jī)融合將在未來的情報(bào)工作和復(fù)雜決策中發(fā)揮重要作用。如南加州大學(xué)的研究人員研發(fā)了一種用于地緣政治預(yù)測(cè)的人機(jī)融合的系統(tǒng)SAGE[52],該系統(tǒng)不僅融合人類分析員的預(yù)測(cè),還包括了一系列基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器模型。機(jī)器模型可以預(yù)測(cè)事件的結(jié)果,或者作為工具幫助人類分析員梳理大量的數(shù)據(jù),尋找歷史事件的證據(jù),而人類分析員對(duì)定性數(shù)據(jù)進(jìn)行推理,結(jié)合機(jī)器對(duì)數(shù)據(jù)聚合、處理的能力,實(shí)現(xiàn)更加精準(zhǔn)的預(yù)測(cè)。該平臺(tái)融合人類洞察力和機(jī)器學(xué)習(xí)模型,允許數(shù)據(jù)驅(qū)動(dòng)平臺(tái)針對(duì)缺乏歷史先例的新興問題“實(shí)時(shí)”整合人為的反饋。在2019年,SAGE已與另外兩個(gè)預(yù)測(cè)系統(tǒng)進(jìn)行了對(duì)比測(cè)試,對(duì)相同的400多個(gè)地緣政治問題進(jìn)行了預(yù)測(cè),SAGE系統(tǒng)生成的預(yù)測(cè)結(jié)果比其它兩個(gè)系統(tǒng)更加準(zhǔn)確。
參考文獻(xiàn):
[1] ?XDATA.Defense Advanced Research Projects Agency[EB/OL].[2020-10-14].https://www.darpa.mil/program/xdata.
[2] ?DARPA.DARPA Big Mechanism[EB/OL].[2020-10-14].https://www.darpa.mil/program/big-mechanism.
[3] ?賀德方.情報(bào)工程學(xué)的探索與踐行[M].北京:科學(xué)出版社,2016.
[4] ?吳晨生,張惠娜,劉如,等.追本溯源:情報(bào)3.0時(shí)代對(duì)情報(bào)定義的思考[J].情報(bào)學(xué)報(bào),2017,36(1):1-4.
[5] ?吳晨生,陳雪飛,李佳娛,等.情報(bào)3.0環(huán)境下的情報(bào)生產(chǎn)要素特征與情報(bào)生產(chǎn)方式變革[J].情報(bào)理論與實(shí)踐,2018,41(1):1-4.
[6] ?李廣建,江信昱.論計(jì)算型情報(bào)分析[J].中國(guó)圖書館學(xué)報(bào),2018,44(2):4-16.
[7] ?Choi S,Jun S.Vacant technology forecasting using new Bayesian patent clustering[J].Technology Analysis & Strategic Management,2014,26(3):241-251.
[8] ?李廣建,羅立群.計(jì)算型情報(bào)分析的進(jìn)展[J].中國(guó)圖書館學(xué)報(bào),2019,45(4):29-43.
[9] ?Khalsa S. The Intelligence Community Debate over Intuition versus Structured Technique:: Implications for Improving Intelligence Warning and Analysis[J/OL].[2020-10-13].https://journals.lib.unb.ca/index.php/jcs/article/view/15234/20838.
[10] ?McKeown K,Daume III H,Chaturvedi S,et al.Predicting the impact of scientific concepts using full‐text features[J].Journal of the Association for Information Science and Technology,2016,67(11): 2684-2696.
[11] ?Cioffi-Revilla C.A methodology for complex social simulations[J].Journal of Artificial Societies and Social Simulation,2010,13(1): 7.
[12] ?王飛躍.人工社會(huì)、計(jì)算實(shí)驗(yàn)、平行系統(tǒng)——關(guān)于復(fù)雜社會(huì)經(jīng)濟(jì)系統(tǒng)計(jì)算研究的討論[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2004(4):25-35.
[13] ?羅俊.計(jì)算·模擬·實(shí)驗(yàn):計(jì)算社會(huì)科學(xué)的三大研究方法[J].學(xué)術(shù)論壇,2020,43(1):35-49.
[14] ?彭程,祁凱,黎冰雪.基于SIR-EGM模型的復(fù)雜網(wǎng)絡(luò)輿情傳播與預(yù)警機(jī)制研究[J].情報(bào)科學(xué),2020,38(3):145-153.
[15] ?Sinatra R,Wang D,Deville P,et al.Quantifying the evolution of individual scientific impact[J].Science,2016,354(6312): aaf5239.
[16] ?王靜宜,徐敏,祝振媛,等.情報(bào)分析中的方法應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2020,43(1):33-41.
[17] ?Brookes B C.The Foundation of Informatiom Science,PartⅢ,Quantitative aspects[J].Journal of Information Science,1980,2(6):269-275.
[18] ?邱韻霏,李春旺.智能情報(bào)分析模式:數(shù)據(jù)驅(qū)動(dòng)型與知識(shí)驅(qū)動(dòng)型[J].情報(bào)理論與實(shí)踐,2020,43(2):28-34.
[19] ?王萍,牟冬梅,石琳,等.領(lǐng)域知識(shí)融合驅(qū)動(dòng)下的數(shù)據(jù)挖掘模型構(gòu)建與優(yōu)化[J].情報(bào)理論與實(shí)踐,2018,41(9):114-117,153.
[20] ?Valenzuela-Escárcega M A,Babur ?觟,Hahn-Powell G,et al.Large-scale automated machine reading discovers new cancer-driving mechanisms[J/OL].[2020-10-13].https://academic.oup.com/database/article/doi/10.1093/database/bay098/5107029#129405514.
[21] ?栗琳,孫敏.數(shù)據(jù)智能技術(shù)驅(qū)動(dòng)的情報(bào)全流程變革及發(fā)展[J].情報(bào)理論與實(shí)踐,2020,43(10):7-12.
[22] ?Gartin J W.The Future of Analysis[J].Studies in Intelligence,2019,63(2):2.
[23] ?Compton R,Lee C,Lu T C,et al.Detecting future social unrest in unprocessed twitter data:“emerging phenomena and big data”[C].2013 IEEE International Conference on Intelligence and Security Informatics.IEEE,2013: 56-60.
[24] ?Li M,Zareian A,Zeng Q,et al.Cross-media Structured Common Space for Multimedia Event Extraction[J].arXiv preprint arXiv:2005.02472,2020.
[25] ?Li M,Zareian A,Lin Y,et al.GAIA: A Fine-grained Multimedia Knowledge Extraction System[C].Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: System Demonstrations,2020:77-86.
[26] ?賴金輝.構(gòu)建一體融合的情報(bào)界——2019年版《美國(guó)國(guó)家情報(bào)戰(zhàn)略》解讀[J].情報(bào)雜志,2019,38(12):48-53.
[27] ?Office of the director of national intelligence: National intelligence strategy of the United States of America 2019[EB/OL].[2020-10-14].https://www.dni.gov/files/ODNI/documents/National Intelligence Strategy 2019.pdf.
[28] ?中共中央黨史和文獻(xiàn)研究院.習(xí)近平關(guān)于總體國(guó)家安全觀論述摘編[M].北京:中央文獻(xiàn)出版社,2018.
[29] ?Heine Jorge,Thakur Ramesh.The Dark Side of Globalization[M].New York: United Nations University Press,2011.
[30] ?張家年.情報(bào)融合中心:美國(guó)情報(bào)共享實(shí)踐及啟示[J].圖書情報(bào)工作,2015,59(13):87-95.
[31] ?Intelligent Fusion Center[EB/OL].[2020-10-13].https://www.dhs.gov/fusion-centers.
[32] ?Supply Chain Risk Management A Framework for Assessing Risk[EB/OL].[2020-10-13].https://www.dni.gov/files/NCSC/documents/supplychain/20190422-SCRM-Framework-for-Assessing-Risk.pdf.
[33] ?NCSCNewsletter[EB/OL].[2020-10-13].https://www.dni.gov/files/NCSC/documents/supplychain/20190422-NCSCNewsletter.pdf.
[34] ?Charbonneau S,F(xiàn)ye S,Hay J,et al.A retrospective analysis of technology forecasting[C].AIAA SPACE 2013 Conference and Exposition,2013: 5519.
[35] ?United States.Office of Homeland Security.National strategy for homeland security[M].Office of Homeland Security,2002.
[36] ?Murray N.Profiling in the age of total information awareness[J].Race & Class,2010,52(2): 3-24.
[37] ?Heyeol Kwon.Data-driven Technology Foresight:Text Analysis of Emerging Technologies[D].Seoul:Seoul National University,2018.
[38] ?Thomson M E,Pollock A C,?魻nkal D,et al.Combining forecasts:Performance and coherence[J].International Journal of Forecasting,2019,35(2):474-484.
[39] ?Bates J M,Granger C W J.The combination of forecasts[J].Journal of the Operational Research Society,1969,20(4):451-468.
[40] ?Daim T U,Rueda G,Martin H,et al.Forecasting emerging technologies: Use of bibliometrics and patent analysis[J].Technological Forecasting and Social Change,2006,73(8):981-1012.
[41] ?張思龍,王蘭成.知識(shí)和數(shù)據(jù)雙輪驅(qū)動(dòng)的網(wǎng)絡(luò)輿情分析技術(shù)研究[J].現(xiàn)代情報(bào),2018,38(4):106-111.
[42] ?Surowiecki J.The wisdom of crowds[M].Anchor,2005.
[43] ?Page S E.The difference: How the power of diversity creates better groups,firms,schools,and societies-new edition[M].Princeton University Press,2008.
[44] ?Kahneman D.Thinking,fast and slow[M].Macmillan,2011.
[45] ?Tetlock P E.Expert political judgment:How good is it?How can we know?-New edition[M].Princeton University Press,2017.
[46] ?Tetlock P E,Gardner D.Superforecasting:The art and science of prediction[M].Random House,2016.
[47] ?Hahn R W,Tetlock P C.Introduction to information markets[J].Information Markets: A New Way of Making Decisions,2006:1-12.
[48] ?Laskey K B,Hanson R,Twardy C.Combinatorial prediction markets for fusing information from distributed experts and models[C].2015 18th International Conference on Information Fusion(Fusion).IEEE,2015:1892-1898.
[49] ?(美)維納.陳步,譯.人有人的用處:控制論與社會(huì)[M].北京:北京大學(xué)出版社,2010.
[50] ?劉偉.人機(jī)融合智能的現(xiàn)狀與展望[J].國(guó)家治理,2019(4):7-15.
[51] ?DARPA and Data:A Portfolio Overview[EB/OL].[2020-10-13].https://www.nitrd.gov/nitrdgroups/images/3/31/DARPA-and-DATA.pdf.
[52] ?Morstatter F,Galstyan A,Satyukov G,et al.SAGE:a hybrid geopolitical event forecasting system[C].Proceedings of the 28th International Joint Conference on Artificial Intelligence.AAAI Press,2019:6557-6559.
作者簡(jiǎn)介:羅立群,男,北京大學(xué)信息管理系博士后,研究員;李廣建,男,北京大學(xué)信息管理系教授,博士生導(dǎo)師。
本文系國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“大數(shù)據(jù)時(shí)代知識(shí)融合的體系架構(gòu)、實(shí)現(xiàn)模式及實(shí)證研究”(項(xiàng)目編號(hào): 15ZDB129)研究成果之一。
收稿日期:2020-12-17;責(zé)任編輯:柴若熔;通訊作者:李廣建(ligj@pku.edu.cn)