王向鋒 蔡鴻宇 張偉等
關(guān)鍵詞: 構(gòu)件; 情報(bào)工程; 情報(bào)分析; 情報(bào)流程
DOI:10.3969 / j.issn.1008-0821.2024.01.013
〔中圖分類號(hào)〕G250 2 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821 (2024) 01-0143-10
隨著信息技術(shù)與計(jì)算機(jī)科學(xué)的飛速發(fā)展, 信息依存的介質(zhì)、場(chǎng)景與空間發(fā)生了根本變化[1] , 以信息為基礎(chǔ)的情報(bào)分析不斷地向外拓展研究領(lǐng)域, 并與其他學(xué)科的分析方法互相借鑒[2] 。從文獻(xiàn)傳遞到智能服務(wù)[3] , 大數(shù)據(jù)環(huán)境下的智能化信息技術(shù)不僅為情報(bào)分析提供了新的支持, 還提出了新的發(fā)展要求。
大數(shù)據(jù)時(shí)代, 以數(shù)據(jù)挖掘[4] 和人工智能[5] 等新興技術(shù)為基礎(chǔ)的情報(bào)分析方法使得情報(bào)人員需要持續(xù)性補(bǔ)充自身的知識(shí)結(jié)構(gòu)[6] 。面對(duì)海量的領(lǐng)域知識(shí)與復(fù)雜的技術(shù)原理, 情報(bào)人員的知識(shí)結(jié)構(gòu)廣度需要向外延伸。同時(shí), 為了規(guī)避技術(shù)依賴帶來的“自動(dòng)化偏見”[7] , 知識(shí)結(jié)構(gòu)深度也需在專業(yè)領(lǐng)域持續(xù)深耕。在情報(bào)工作中, 不同廣度與深度的知識(shí)結(jié)構(gòu)形成了人與人之間、人與技術(shù)工具之間的知識(shí)距離,阻礙了其中的知識(shí)轉(zhuǎn)化和流動(dòng)[8] 。由于人類的知識(shí)儲(chǔ)備量存在一定的局限性, 知識(shí)結(jié)構(gòu)深度與廣度的發(fā)展促使情報(bào)人員要進(jìn)一步明確工作職責(zé)。
同時(shí), 大數(shù)據(jù)環(huán)境下數(shù)據(jù)密集型的研究范式[9]與個(gè)性化的情報(bào)需求對(duì)傳統(tǒng)情報(bào)流程提出了挑戰(zhàn)。新時(shí)代下, 情報(bào)工作的每個(gè)環(huán)節(jié)之間并非是簡(jiǎn)單的單向線性關(guān)系, 各環(huán)節(jié)的情報(bào)資料需要自由流動(dòng),包括用戶和情報(bào)人員在內(nèi)的情報(bào)主體之間需要充分溝通。因此, 有學(xué)者引入了構(gòu)件化思維, 主張將情報(bào)工作的所有參與要素以構(gòu)件的形式封裝并在同一平臺(tái)上組裝和使用[10] 。但由于大數(shù)據(jù)環(huán)境下情報(bào)工作的參與要素較多, 因此主體之間的溝通和工作流程的協(xié)調(diào)成為了情報(bào)流程優(yōu)化的新目標(biāo)[11] 。
針對(duì)以上挑戰(zhàn), 本文提出基于組合的情報(bào)分析構(gòu)件化研究, 核心目標(biāo)是解決復(fù)雜信息環(huán)境下情報(bào)分析工作的劃分問題, 并提高計(jì)算機(jī)等輔助分析工具對(duì)情報(bào)人員的支持作用。具體來講, 本文采用了軟件構(gòu)件[12] 的經(jīng)典模型和設(shè)計(jì)理論, 將情報(bào)工作中的情報(bào)分析人員、分析工具以及兩者之間的交互方式進(jìn)行了封裝, 使其成為自主獨(dú)立且可重復(fù)使用的構(gòu)件。這些構(gòu)件在外部接口和內(nèi)部功能的支持下進(jìn)行組合, 在組合過程中, 各構(gòu)件需遵循規(guī)范的流程設(shè)計(jì)和組合原則, 按需在同一層次組裝, 從而減輕情報(bào)人員的知識(shí)負(fù)荷并提高情報(bào)分析效率。
1 相關(guān)研究
1.1 情報(bào)分析構(gòu)件化
大數(shù)據(jù)時(shí)代下, 人類社會(huì)中的數(shù)據(jù)規(guī)模產(chǎn)生了質(zhì)的飛躍, 海量數(shù)據(jù)中蘊(yùn)含著大量的高價(jià)值信息以待發(fā)掘, 情報(bào)分析工作已離不開計(jì)算機(jī)技術(shù)的支持[13]。
首 先, 大數(shù)據(jù)包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù), 表現(xiàn)形式涵蓋圖片、文字、音頻、視頻等多種方式[2] 。這些具有復(fù)雜結(jié)構(gòu)的信息為后續(xù)的分析工作帶來了不小的困難, 所以異構(gòu)信息融合成為了情報(bào)分析的首要挑戰(zhàn)[14] , 情報(bào)人員需要將信息轉(zhuǎn)化為機(jī)器可讀的形式以實(shí)現(xiàn)大規(guī)模信息融合[15] ;其次, 大數(shù)據(jù)極快的生成速度構(gòu)成了瞬息萬(wàn)變的信息環(huán)境, 因此需要網(wǎng)絡(luò)爬蟲等[16] 自動(dòng)化數(shù)據(jù)搜集技術(shù)來應(yīng)對(duì)復(fù)雜繁瑣的信息搜集任務(wù); 最后, 大數(shù)據(jù)價(jià)值密度低的特性促使情報(bào)工作者需要借助智能化技術(shù)方法來挖掘其中蘊(yùn)含的高價(jià)值信息[17] 。
因此, 在大數(shù)據(jù)的影響下, 基于計(jì)算機(jī)的智能化分析方法成為情報(bào)工作中不可或缺的參與要素。但大量涌現(xiàn)的新興信息技術(shù)在豐富了情報(bào)要素的同時(shí), 也對(duì)傳統(tǒng)的情報(bào)工作流程提出了挑戰(zhàn)。
針對(duì)這一問題, 賀德方[10] 提出了“情報(bào)工程”的概念, 認(rèn)為情報(bào)工作中的各要素需要以構(gòu)件的形式集成到同一平臺(tái), 情報(bào)分析需要系統(tǒng)化、層次化的流程設(shè)計(jì), 以此實(shí)現(xiàn)情報(bào)工作的自動(dòng)化、規(guī)范化、系統(tǒng)化。此后, 張家年等[18] 從學(xué)科建設(shè)的角度對(duì)情報(bào)工程理論進(jìn)行了探討, 認(rèn)為情報(bào)工程的核心在于情報(bào)流程與工程思維的融合; 同時(shí)還辨析了大數(shù)據(jù)思維、工程思維與情報(bào)思維之間的關(guān)系[19] ,認(rèn)為大數(shù)據(jù)思維是對(duì)情報(bào)思維的有益補(bǔ)充, 工程思維是實(shí)現(xiàn)情報(bào)分析自動(dòng)化、規(guī)范化、系統(tǒng)化的必然選擇。
此外, 汪雅君等[8] 將情報(bào)工作中的人與計(jì)算機(jī)工具以構(gòu)件的形式封裝, 提出了情報(bào)構(gòu)件的概念。情報(bào)構(gòu)件分為以情報(bào)人員為主的人力構(gòu)件與以計(jì)算機(jī)工具為主的計(jì)算機(jī)構(gòu)件兩類。不同的情報(bào)構(gòu)件通過組合形成完整的分析系統(tǒng)以完成情報(bào)分析工作。構(gòu)件在組合時(shí)以知識(shí)距離來衡量情報(bào)構(gòu)件之間的適配程度, 在各自獨(dú)立的前提下達(dá)到人機(jī)優(yōu)勢(shì)互補(bǔ)的效果。在此基礎(chǔ)上, 汪雅君等[20] 進(jìn)一步提出了基于構(gòu)件的情報(bào)分析模型, 通過“原子化” 分解的情報(bào)流程來規(guī)范情報(bào)構(gòu)件的粒度大小, 以此降低人工操作的難度。
根據(jù)情報(bào)工程的相關(guān)研究, 要提高智能技術(shù)在情報(bào)工作中的使用效率, 情報(bào)分析流程需要結(jié)合工程化思維進(jìn)行規(guī)范化設(shè)計(jì), 即情報(bào)要素需要在同一層次下組合, 并且情報(bào)資源在組合中流動(dòng)時(shí), 各組合要遵循規(guī)范的工作模式。雖然已有學(xué)者提出了“情報(bào)構(gòu)件” 的概念并以此為基礎(chǔ)構(gòu)建分析模型,但構(gòu)件之間的連接方式尚未明確。為進(jìn)一步實(shí)現(xiàn)情報(bào)分析的自動(dòng)化, 本文將在已有研究的基礎(chǔ)上細(xì)化情報(bào)構(gòu)件的模型設(shè)計(jì), 并細(xì)化情報(bào)構(gòu)件的組合原則。
1.2 理論基礎(chǔ)
“構(gòu)件” 這一概念起源于建筑工程行業(yè), 其主要含義為在系統(tǒng)中承擔(dān)部分功能實(shí)現(xiàn)的可重復(fù)使用的功能單元[8] 。此后, 構(gòu)件被引申到軟件領(lǐng)域用以支持軟件復(fù)用[12] 。近年來, 構(gòu)件概念被引入情報(bào)分析領(lǐng)域, 在軟件構(gòu)件的基礎(chǔ)上增添了人力構(gòu)件, 用以處理復(fù)雜的情報(bào)分析任務(wù)[8] 。所以, 本文借鑒了軟件領(lǐng)域的構(gòu)件模型和架構(gòu)設(shè)計(jì)來進(jìn)一步完善情報(bào)構(gòu)件的體系設(shè)計(jì)。
作為經(jīng)典軟件構(gòu)件模型之一, CORBA 構(gòu)件模型樹立了軟件構(gòu)件外部接口設(shè)計(jì)的行業(yè)典范, 實(shí)現(xiàn)了環(huán)境兼容性和功能獨(dú)立性[21] 。通過外部接口的規(guī)范化, CORBA 構(gòu)件模型在自身可重用的基礎(chǔ)上打破了系統(tǒng)中各要素之間一一對(duì)應(yīng)的關(guān)系, 使得要素之間的組裝變得更加靈活多變。同時(shí), CORBA構(gòu)件模型封裝了內(nèi)部功能的實(shí)現(xiàn)細(xì)節(jié), 用戶只需要關(guān)注目標(biāo)構(gòu)件的接口信息便可調(diào)用該對(duì)象[22] 。構(gòu)件的外部接口主要分為3 類[23] : ①定義構(gòu)件所提供的功能; ②規(guī)范構(gòu)件之間的連接關(guān)系; ③調(diào)整構(gòu)件運(yùn)行時(shí)的工作特性。
但是以構(gòu)件為主的簡(jiǎn)單復(fù)用無法應(yīng)對(duì)復(fù)雜需求, 構(gòu)件化的系統(tǒng)開發(fā)需要規(guī)范的架構(gòu)設(shè)計(jì)。在眾多設(shè)計(jì)模式中, MVC(Model-View-Controller)模式以其設(shè)計(jì)清晰且易拓展的特點(diǎn)得到了廣泛的應(yīng)用[24] 。如圖1 所示, MVC 包含模型(Model)、視圖(View)和控制器(Controller)3 個(gè)模塊[25] 。模型模塊負(fù)責(zé)數(shù)據(jù)處理以及封裝數(shù)據(jù)對(duì)象; 視圖模塊負(fù)責(zé)數(shù)據(jù)表示, 是系統(tǒng)內(nèi)部與外界的交互接口; 控制器模塊負(fù)責(zé)管理數(shù)據(jù)流動(dòng), 保持其他兩個(gè)模塊數(shù)據(jù)操作的一致性。
2 面向組合的情報(bào)構(gòu)件體系設(shè)計(jì)
2.1 情報(bào)構(gòu)件抽象模型
隨著社會(huì)信息化建設(shè)程度的不斷加深與技術(shù)環(huán)境的大幅度變革, 計(jì)算機(jī)技術(shù)在情報(bào)分析中得到了廣泛應(yīng)用。但是, 純自動(dòng)化的計(jì)算機(jī)技術(shù)難以應(yīng)對(duì)情報(bào)分析中復(fù)雜的邏輯判斷和假設(shè)推演, 情報(bào)工作仍需要擁有長(zhǎng)期知識(shí)積累和專業(yè)領(lǐng)域經(jīng)驗(yàn)的情報(bào)專家對(duì)情報(bào)工作進(jìn)行綜合把控和細(xì)節(jié)處理[26] 。因此,這兩個(gè)要素均在情報(bào)工作中扮演著不可或缺的角色,但兩者之間的協(xié)作還需要人機(jī)交互技術(shù)提供支持。
因此, 情報(bào)構(gòu)件主要包含計(jì)算機(jī)構(gòu)件、人機(jī)交互構(gòu)件與人力構(gòu)件3 種類型。三者之間的關(guān)系如圖2 所示。計(jì)算機(jī)構(gòu)件主要負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行處理、計(jì)算、分析。人力構(gòu)件的主要任務(wù)為分解外部傳入的情報(bào)需求, 其中包含選取分析方法、設(shè)計(jì)局部分析流程及判斷分析結(jié)果等。此外, 人力構(gòu)件還需要輔助計(jì)算機(jī)構(gòu)件完成半自動(dòng)化的分析過程, 例如參數(shù)調(diào)整、結(jié)果檢驗(yàn)等, 以此來保證情報(bào)服務(wù)的質(zhì)量。人機(jī)交互構(gòu)件承擔(dān)著其他兩類構(gòu)件之間的信息傳輸任務(wù), 計(jì)算機(jī)處理結(jié)果經(jīng)可視化處理形成人力構(gòu)件可以理解的信息界面, 人力構(gòu)件分解后的需求內(nèi)容經(jīng)格式轉(zhuǎn)換成計(jì)算機(jī)可讀取的內(nèi)容。
計(jì)算機(jī)構(gòu)件主要為分析過程中所需的計(jì)算機(jī)軟件或代碼。人力構(gòu)件指的是承擔(dān)不同情報(bào)工作的人員, 例如情報(bào)采集員、情報(bào)分析員等。而交互構(gòu)件是能夠?qū)崿F(xiàn)人機(jī)交互的工具, 主要以顯示器、鍵盤、鼠標(biāo)及計(jì)算機(jī)底層的操作系統(tǒng)為主。所有的情報(bào)構(gòu)件會(huì)被存儲(chǔ)在構(gòu)件庫(kù)中, 以便取用。
根據(jù)3 類情報(bào)構(gòu)件之間的關(guān)系以及每類構(gòu)件負(fù)責(zé)的工作內(nèi)容, 本文將情報(bào)構(gòu)件的內(nèi)部功能分為數(shù)據(jù)處理、需求迭代、格式轉(zhuǎn)換及構(gòu)件管理模塊4 個(gè)部分。其中, 構(gòu)件管理模塊負(fù)責(zé)處理構(gòu)件庫(kù)傳入的管理信息。根據(jù)內(nèi)部功能的分類, 本文進(jìn)行了對(duì)應(yīng)的外部接口設(shè)計(jì), 如圖3 所示。
如圖3 所示, 內(nèi)部的功能模塊與外部的接口類型的對(duì)應(yīng)關(guān)系如表1 所示。情報(bào)構(gòu)件的外部接口有6 種類型, 數(shù)據(jù)處理功能模塊包含3 種: 功能服務(wù)接口負(fù)責(zé)向外部提供信息處理功能; 功能需求接口負(fù)責(zé)構(gòu)件內(nèi)部進(jìn)行信息處理時(shí)接受其他構(gòu)件提供的必要服務(wù); 構(gòu)件屬性是情報(bào)構(gòu)件在處理數(shù)據(jù)時(shí)的功能特性, 接口參數(shù)決定了情報(bào)構(gòu)件的工作模式。需求迭代功能模塊包括兩種: 需求監(jiān)聽接口負(fù)責(zé)監(jiān)聽和接收外部傳入的需求內(nèi)容; 需求輸出接口負(fù)責(zé)傳出構(gòu)件的需求分解內(nèi)容。最后一類是情報(bào)構(gòu)件庫(kù)的管理接口, 用于創(chuàng)建、調(diào)用和銷毀情報(bào)構(gòu)件。格式轉(zhuǎn)換模塊不包含接口, 只負(fù)責(zé)情報(bào)構(gòu)件內(nèi)部的情報(bào)需求轉(zhuǎn)化為特定的數(shù)據(jù)格式。
同時(shí), 情報(bào)構(gòu)件的外部接口也是實(shí)現(xiàn)不同構(gòu)件之間組合連接的關(guān)鍵要素。在構(gòu)件連接方式設(shè)計(jì)中, 本文參照CORBA 構(gòu)件模型的設(shè)計(jì)將情報(bào)構(gòu)件模型接口分為功能定義、構(gòu)件組合和構(gòu)件運(yùn)行特性3 類。其中, 功能定義接口包含需求輸出接口和功能服務(wù)接口; 構(gòu)件組合接口包含功能需求接口和需求監(jiān)聽接口; 構(gòu)件運(yùn)行特性包含構(gòu)件屬性接口和構(gòu)件管理接口。
情報(bào)構(gòu)件具有軟件構(gòu)件的一般性質(zhì)[12] :
1) 功能有用性: 向外提供的功能服務(wù)和傳出的需求迭代內(nèi)容必須對(duì)情報(bào)工作有用。
2) 易用性: 構(gòu)件的功能描述簡(jiǎn)潔易懂, 外部接口易于使用。
3) 獨(dú)立性: 構(gòu)件內(nèi)部能夠保證自身的正確運(yùn)行。
4) 環(huán)境適應(yīng)性: 通過對(duì)構(gòu)件內(nèi)部屬性的設(shè)置可以適應(yīng)不同情境下的工作。
5) 可移植性: 不同環(huán)境中的情報(bào)構(gòu)件可以互相移植。
但區(qū)別于軟件構(gòu)件, 情報(bào)構(gòu)件具有一些特質(zhì)。
首先, 情報(bào)人員也作為一種新的構(gòu)件類型納入情報(bào)構(gòu)件體系中; 其次, 除計(jì)算機(jī)的輸入輸出設(shè)備以外, 人的五官等身體器官也可以作為接口用于連接, 拓展了接口形式; 最后, 人具備計(jì)算機(jī)無法比擬的邏輯思維能力, 可以完成更復(fù)雜的任務(wù), 豐富了構(gòu)件的功能類型。
2.2 情報(bào)構(gòu)件工作規(guī)范
2.2.1 組合原則
情報(bào)構(gòu)件組合原則是用以保障情報(bào)需求有序傳遞和構(gòu)件組合功能完整的規(guī)范, 主要涉及情報(bào)構(gòu)件的功能需求接口和需求監(jiān)聽接口。當(dāng)數(shù)據(jù)資源和情報(bào)需求在構(gòu)件組合中進(jìn)行流動(dòng)時(shí), 必須保證該組合中所有的情報(bào)構(gòu)件的功能需求接口都與對(duì)應(yīng)的功能服務(wù)接口相連接, 需求監(jiān)聽接口也與對(duì)應(yīng)的需求輸出接口相連接。
2.2.2 工作模式
大數(shù)據(jù)環(huán)境下, 用戶需求的不斷變化推動(dòng)了情報(bào)產(chǎn)品的持續(xù)更新。針對(duì)這種動(dòng)態(tài)的工作特點(diǎn), 以目標(biāo)為中心的情報(bào)流程模型[27] 將用戶和情報(bào)人員共同納入目標(biāo)情景的建設(shè)中。各方的充分溝通使得情報(bào)人員能夠及時(shí)捕捉到動(dòng)態(tài)變化的用戶需求, 最終的情報(bào)產(chǎn)品更能滿足用戶需求[28] 。
在“以目標(biāo)為中心” 的基礎(chǔ)上, 本文將情報(bào)目標(biāo)轉(zhuǎn)化為情報(bào)需求, 與數(shù)據(jù)一起作為情報(bào)工作中的資源基礎(chǔ)在不同工作環(huán)節(jié)中流動(dòng)。同時(shí), 目標(biāo)共享情景也轉(zhuǎn)換為需求文檔, 作為需求傳遞的載體。
情報(bào)需求在3 類情報(bào)構(gòu)件中的流向?yàn)椤叭肆?gòu)件→交互構(gòu)件→計(jì)算機(jī)構(gòu)件→交互構(gòu)件→人力構(gòu)件”。其中, 人力構(gòu)件輸出的需求分解信息控制了計(jì)算機(jī)構(gòu)件的數(shù)據(jù)處理方式, 交互構(gòu)件不僅負(fù)責(zé)消息傳遞, 還需要可視化處理計(jì)算機(jī)構(gòu)件的分析結(jié)果。該流向與MVC 設(shè)計(jì)模式中的數(shù)據(jù)流向存在一定的相似性。因此, 本文依照MVC 設(shè)計(jì)模式將情報(bào)工作的工作模式定義為功能控制(控制構(gòu)件組合)、信息交互(中樞構(gòu)件組合)、功能實(shí)現(xiàn)(功能構(gòu)件組合)3 個(gè)部分, 每部分的功能都由多個(gè)情報(bào)構(gòu)件在組合之后進(jìn)行完成。各部分的工作模式如圖4 所示。
構(gòu)件化的情報(bào)工作起始于初始需求文檔和初始數(shù)據(jù)輸入, 兩者經(jīng)中樞構(gòu)件組合處理后傳入控制構(gòu)件組合??刂茦?gòu)件組合中的構(gòu)件會(huì)針對(duì)文檔中的需求內(nèi)容, 再結(jié)合初始數(shù)據(jù)特征進(jìn)行需求分解, 包括選用方法、設(shè)計(jì)流程和預(yù)期結(jié)果等。分解內(nèi)容經(jīng)中樞構(gòu)件格式轉(zhuǎn)換后交由功能構(gòu)件庫(kù)完成功能構(gòu)件的選取和組合。組合完成后, 初始數(shù)據(jù)會(huì)傳入功能構(gòu)件組合中進(jìn)行處理, 結(jié)果生成后會(huì)傳入中樞構(gòu)件組合中生成信息界面, 再交由控制構(gòu)件組合完成可行性判斷。如果可行, 中樞構(gòu)件組合將向外輸出記錄著需求分解信息的迭代需求文檔和最終的數(shù)據(jù)處理結(jié)果; 若不可行, 則進(jìn)行新一輪的需求分解、數(shù)據(jù)處理和可行性判斷。
其中, 控制構(gòu)件組合主要以人力構(gòu)件為主, 中樞構(gòu)件組合是以人機(jī)交互構(gòu)件為主, 功能構(gòu)件組合則需要3 類構(gòu)件按需搭配。控制構(gòu)件組合的工作是通過人力構(gòu)件操作人機(jī)交互構(gòu)件來完成, 多個(gè)構(gòu)件共同分解情報(bào)需求并得出需要完成的情報(bào)任務(wù)。中樞構(gòu)件組合的傳遞功能則是由人機(jī)交互構(gòu)件自動(dòng)化實(shí)現(xiàn), 需求分解內(nèi)容將會(huì)轉(zhuǎn)化為特定功能的、參數(shù)已設(shè)置的、外部接口已連接的功能構(gòu)件組合。功能構(gòu)件組合的工作則是一次小范圍的分析過程, 范圍大小與整個(gè)構(gòu)件組合的功能范圍保持一致。
3 基于構(gòu)件組合的情報(bào)分析模型開發(fā)案例
根據(jù)抽象層次的不同, 本文將構(gòu)件化思想下的情報(bào)分析模型定義為3 層結(jié)構(gòu), 如圖5 所示, 按抽象程度由高到低分別為概念層、邏輯層、支撐層。
概念層是對(duì)情報(bào)分析的工作流分解, 是整個(gè)情報(bào)工作的頂層設(shè)計(jì), 用于指導(dǎo)情報(bào)構(gòu)件下的情報(bào)工作。邏輯層則描述了情報(bào)分析過程中的各情報(bào)構(gòu)件組合內(nèi)部的運(yùn)行邏輯, 根據(jù)不同構(gòu)件的特點(diǎn)進(jìn)一步細(xì)化構(gòu)件的職責(zé)邊界和功能實(shí)現(xiàn)。支撐層表示了構(gòu)件化的情報(bào)工作所需的現(xiàn)實(shí)支撐, 即模型中的每個(gè)構(gòu)件所對(duì)應(yīng)的實(shí)體。
3.1 概念層
3.1.1 信息鏈與情報(bào)分析
概念層是本文情報(bào)分析模型中工作劃分的宏觀指導(dǎo), 該層需要明確情報(bào)分析過程中所涉及到的基本概念, 并根據(jù)這些概念初步設(shè)計(jì)工作流程。
“信息鏈” 是一種用以辨析信息、知識(shí)等概念的模型[29] , 其簡(jiǎn)單揭示了情報(bào)學(xué)中5 個(gè)基礎(chǔ)概念間的復(fù)雜關(guān)系, 并以物理屬性和知識(shí)屬性的強(qiáng)弱加以區(qū)分。物理屬性較強(qiáng)的計(jì)算機(jī)構(gòu)件與知識(shí)屬性較強(qiáng)的人力構(gòu)件在構(gòu)件組合中的占比經(jīng)調(diào)整后可以有效完成信息鏈中各概念間的有序轉(zhuǎn)化, 進(jìn)而滿足絕大部分的情報(bào)需求。
構(gòu)件化思想下的情報(bào)分析涵蓋了信息鏈中的全部概念。多種構(gòu)件組合首先從復(fù)雜信息環(huán)境中獲取海量數(shù)據(jù), 經(jīng)過濾整理后形成存放著有序信息的信息資源庫(kù), 再根據(jù)經(jīng)驗(yàn)和邏輯在信息庫(kù)的基礎(chǔ)上提出假設(shè)并驗(yàn)證, 最后將得出的結(jié)論、預(yù)測(cè)等情報(bào)產(chǎn)品通過智能化方式服務(wù)于情報(bào)用戶。
根據(jù)信息鏈中不同概念之間轉(zhuǎn)化流程, 本文初步設(shè)計(jì)了概念層的基本工作環(huán)節(jié), 如圖6 所示。其中, 數(shù)據(jù)搜集是指從復(fù)雜信息環(huán)境中的多種信息源收集有關(guān)用戶需求的數(shù)據(jù)。信息加工是指對(duì)搜集得到的數(shù)據(jù)進(jìn)行抽取和過濾, 經(jīng)真?zhèn)舞b別后再進(jìn)行分類和挖掘, 最后形成存放著多組關(guān)聯(lián)信息的資源庫(kù)。情報(bào)分析是對(duì)加工后信息的進(jìn)一步分析, 該環(huán)節(jié)針對(duì)用戶需求提出相關(guān)假設(shè), 然后根據(jù)領(lǐng)域知識(shí)與邏輯判斷對(duì)信息庫(kù)中的信息進(jìn)行分解、重組和綜合, 以此構(gòu)建相應(yīng)假設(shè)的證據(jù)鏈并得出相應(yīng)的結(jié)論或預(yù)測(cè)結(jié)果。智能服務(wù)這一環(huán)節(jié)是根據(jù)用戶特征對(duì)上一環(huán)節(jié)中分析得出的結(jié)論或預(yù)測(cè)進(jìn)行智能化處理, 最終向用戶提供所需的情報(bào)產(chǎn)品。
總之, 構(gòu)件化下的情報(bào)工作完成了從海量數(shù)據(jù)向情報(bào)產(chǎn)品的轉(zhuǎn)化, 并且是針對(duì)特定的用戶需求展開的一種問題求解過程。其始于用戶需求, 終于情報(bào)產(chǎn)品, 根本目的是為用戶提供實(shí)際問題的決策依據(jù)。
但在大數(shù)據(jù)環(huán)境下, 大量的、生成速度極快的數(shù)據(jù)信息需要及時(shí)處理, 個(gè)性化的用戶需求需要得到滿足。所以單向的情報(bào)流程無法適應(yīng)當(dāng)下的信息環(huán)境和情報(bào)需求, 每個(gè)工作環(huán)節(jié)需圍繞用戶需求進(jìn)行展開, 各情報(bào)要素之間需要緊密協(xié)作來實(shí)現(xiàn)高效的情報(bào)生產(chǎn)。此外, 關(guān)鍵信息會(huì)對(duì)最終的情報(bào)產(chǎn)品產(chǎn)生巨大影響, 情報(bào)生產(chǎn)需要多環(huán)節(jié)多循環(huán)的流程設(shè)計(jì)來實(shí)現(xiàn)不同信息源的交叉驗(yàn)證。因此, 綜合以目標(biāo)為中心和螺旋上升的情報(bào)思想將其改造為一種以構(gòu)件組合為基礎(chǔ)的情報(bào)工作流程, 以適應(yīng)新時(shí)代的情報(bào)工作。
3.1.2 基于信息鏈的情報(bào)構(gòu)件化分析流程
在情報(bào)構(gòu)件的體系設(shè)計(jì)中, 本文借鑒了以目標(biāo)為中心的情報(bào)思想, 將需求與數(shù)據(jù)信息共同作為情報(bào)工作的資源基礎(chǔ)。所以, 基于構(gòu)件的情報(bào)工作流程不僅包含從數(shù)據(jù)到情報(bào)的轉(zhuǎn)化, 也存在著情報(bào)需求的更迭。根據(jù)情報(bào)構(gòu)件的模型設(shè)計(jì)可知需求的每一次更迭即情報(bào)產(chǎn)品的一次增量, 因此, 本文將螺旋上升模型應(yīng)用于需求更迭的過程中, 以此提高情報(bào)產(chǎn)品與用戶需求的契合度。
如圖7 所示, 在基于構(gòu)件的情報(bào)工作流程中,情報(bào)分析人員首先需要對(duì)用戶的需求進(jìn)行歸納總結(jié),形成初始需求文檔后傳入傳遞流中。此后, 信息鏈中事實(shí)鏈環(huán)所對(duì)應(yīng)的數(shù)據(jù)源和初始需求文檔將傳至負(fù)責(zé)數(shù)據(jù)搜集的中樞構(gòu)件組合中, 經(jīng)處理后再交由控制構(gòu)件組合進(jìn)行需求迭代, 完成功能構(gòu)件的組合。在功能構(gòu)件組合中, 情報(bào)人員和計(jì)算機(jī)工具協(xié)作完成數(shù)據(jù)采集的工作, 然后將結(jié)果交由控制構(gòu)件組合進(jìn)行質(zhì)量檢驗(yàn)。達(dá)標(biāo)后, 中樞構(gòu)件組合將迭代需求文檔和搜集到的數(shù)據(jù)向外輸出至目標(biāo)構(gòu)件組合。以此類推, 數(shù)據(jù)、信息等在不同的情報(bào)構(gòu)件組合中進(jìn)行轉(zhuǎn)化, 最終形成用戶所需的情報(bào)產(chǎn)品。需求信息也在每個(gè)環(huán)節(jié)下的構(gòu)件組合中依次傳遞, 使得情報(bào)產(chǎn)品的生產(chǎn)得到了全過程的記錄。
區(qū)別于傳統(tǒng)的情報(bào)流程, 需求傳遞并非是單向的過程。在傳遞時(shí), 無關(guān)的中間環(huán)節(jié)可以跳過, 整個(gè)流程可以無限次循環(huán)。因此, 在出現(xiàn)以下3 種情形時(shí), 原有的傳遞流程需要做出調(diào)整: ①用戶對(duì)某一環(huán)節(jié)提出新的需求: 新需求經(jīng)由情報(bào)人員轉(zhuǎn)化為文檔, 直接傳入該環(huán)節(jié)中進(jìn)行新一輪的需求迭代;②先前環(huán)節(jié)中的需求迭代出現(xiàn)問題: 由當(dāng)前環(huán)節(jié)中的控制構(gòu)件組合在文檔中指出問題, 形成新的文檔傳入問題環(huán)節(jié); ③最終的情報(bào)產(chǎn)品不符合用戶需求:情報(bào)人員根據(jù)用戶意見對(duì)比最終的需求文檔信息,研討后在需求文檔中指出問題環(huán)節(jié)中的錯(cuò)誤操作及修正意見, 然后傳入認(rèn)知屬性最低的工作環(huán)節(jié)進(jìn)行新一輪的迭代。
從需求傳遞上看, 在數(shù)據(jù)源到情報(bào)產(chǎn)品的轉(zhuǎn)化過程中, 情報(bào)工作呈現(xiàn)螺旋上升態(tài)勢(shì)。在內(nèi)部的結(jié)果判斷與外部的用戶溝通下, 需求文檔一次次的更迭對(duì)應(yīng)著最終的情報(bào)產(chǎn)品的不斷增量, 在保證了情報(bào)產(chǎn)品高質(zhì)量的同時(shí), 完成了用戶需求與情報(bào)工作的動(dòng)態(tài)交互。
3.2 邏輯層
如圖8 所示, 邏輯層是構(gòu)件化方式下針對(duì)概念層中每個(gè)工作環(huán)節(jié)下的情報(bào)構(gòu)件組合實(shí)現(xiàn)邏輯的展開。在概念層中, 需求的不斷更迭對(duì)應(yīng)著數(shù)據(jù)到情報(bào)的增量式轉(zhuǎn)化。所以, 本文將從需求文檔的傳遞與數(shù)據(jù)源到情報(bào)服務(wù)內(nèi)容的轉(zhuǎn)化兩個(gè)方向描述圖中情報(bào)構(gòu)件組合的工作邏輯。
3.2.1 需求文檔的傳遞流程
如圖8 中菱形與V 型接口的連接方向所示:傳遞流中的需求文檔傳入中樞構(gòu)件組合中, 首先會(huì)被需求可視化處理構(gòu)件所接收, 文檔中的信息與數(shù)據(jù)文件的特征信息會(huì)傳入控制構(gòu)件組合的信息界面中。需求分析構(gòu)件需要根據(jù)自身職責(zé)對(duì)信息界面中所記錄的需求內(nèi)容進(jìn)行專業(yè)化的拆解。拆解完成后,方法選取構(gòu)件根據(jù)功能構(gòu)件庫(kù)傳來的構(gòu)件描述信息進(jìn)行分析方法的選取, 然后再交由流程設(shè)計(jì)構(gòu)件按照組合原則對(duì)所選取的功能構(gòu)件進(jìn)行組合并設(shè)置各功能構(gòu)件的運(yùn)行參數(shù)。所有控制構(gòu)件的操作都會(huì)被記錄在信息界面中。
此后, 記錄著迭代需求的界面信息會(huì)繼續(xù)以文檔的方式向兩個(gè)方向傳遞: ①中樞構(gòu)件組合中的需求讀取構(gòu)件負(fù)責(zé)解析需求信息, 以此控制功能構(gòu)件庫(kù)中功能構(gòu)件的調(diào)用、設(shè)置及組合; ②控制構(gòu)件組合中的結(jié)果判斷構(gòu)件根據(jù)需求信息對(duì)功能構(gòu)件組合的處理結(jié)果進(jìn)行可行性判斷, 并將判斷信息寫入文檔中, 傳入需求文檔式轉(zhuǎn)化構(gòu)件中形成特定格式的計(jì)算機(jī)可讀的文件。
經(jīng)格式轉(zhuǎn)化后的需求文檔將傳入需求文檔輸出構(gòu)件中進(jìn)行讀取。該構(gòu)件需要根據(jù)判斷信息控制迭代需求文檔的輸出方向和處理結(jié)果是否向外輸出。如果判斷為可行, 則將需求文檔傳入下一環(huán)節(jié), 并將該信息傳入結(jié)果輸出構(gòu)件。如果判斷為不可行,則僅將文檔傳入本環(huán)節(jié), 再進(jìn)行新一輪的需求迭代。
需要注意的是, 在本環(huán)節(jié)中的控制構(gòu)件進(jìn)行需求迭代時(shí), 如若發(fā)現(xiàn)前面各環(huán)節(jié)的需求分解有誤,則直接將錯(cuò)誤原因記錄, 經(jīng)文檔格式轉(zhuǎn)換后將文檔向問題環(huán)節(jié)輸出。同時(shí), 如果接收到的需求文檔的目標(biāo)環(huán)節(jié)并非本環(huán)節(jié), 則直接將數(shù)據(jù)文件和需求文檔傳至下一環(huán)節(jié)。
3.2.2 傳入數(shù)據(jù)的轉(zhuǎn)化流程
如圖8 中圓形與弧型接口的連接方向所示: 首先, 傳入的數(shù)據(jù)文件在可視化處理構(gòu)件的處理下,其數(shù)據(jù)特征將傳入信息界面構(gòu)件中, 形成可視化界面后傳入控制構(gòu)件組合中的需求分析構(gòu)件。同時(shí),數(shù)據(jù)文件也會(huì)被數(shù)據(jù)存儲(chǔ)構(gòu)件所讀取, 待功能構(gòu)件組合完成后對(duì)其進(jìn)行處理、計(jì)算和分析。
在組裝功能構(gòu)件時(shí), 不同類型的功能構(gòu)件需要根據(jù)需求文檔中的內(nèi)容進(jìn)行設(shè)置。功能構(gòu)件庫(kù)首先將流程設(shè)計(jì)信息傳入信息界面構(gòu)件中生成相應(yīng)的可視化界面, 然后按照所選用的情報(bào)分析方法轉(zhuǎn)化為交互界面構(gòu)件的人工輔助操作界面和模型計(jì)算構(gòu)件中的業(yè)務(wù)邏輯。在交互界面構(gòu)件的支持下, 模型計(jì)算構(gòu)件中的計(jì)算結(jié)果與人工輔助構(gòu)件所接收的交互界面中的信息保持自動(dòng)同步, 人工輔助構(gòu)件無需進(jìn)行復(fù)雜操作便可以獲取到模型計(jì)算構(gòu)件中的分析結(jié)果, 并根據(jù)需求信息在交互界面中傳入調(diào)整信息。模型計(jì)算構(gòu)件再根據(jù)不斷更迭的調(diào)整信息完成后續(xù)的分析過程或調(diào)整原有的分析結(jié)果。
組裝完成后, 其中的數(shù)據(jù)管理構(gòu)件將會(huì)從數(shù)據(jù)存儲(chǔ)構(gòu)件中讀取整個(gè)分析過程中所需的全部數(shù)據(jù)。人工輔助構(gòu)件在情報(bào)分析流程的指導(dǎo)下協(xié)助計(jì)算模型構(gòu)件完成半自動(dòng)化的情報(bào)分析工作, 最終得出的數(shù)據(jù)處理結(jié)果將由計(jì)算模型構(gòu)件傳入中樞構(gòu)件組合中的可視化處理構(gòu)件中, 處理后交由控制構(gòu)件組合中的結(jié)果判斷構(gòu)件完成結(jié)果判斷。如果結(jié)果可行則由中樞構(gòu)件組合中的結(jié)果輸出構(gòu)件將結(jié)果傳入下一環(huán)節(jié), 不可行則銷毀結(jié)果。
3.3 支撐層
支撐層是邏輯層實(shí)現(xiàn)的現(xiàn)實(shí)保障, 主要由數(shù)據(jù)源和情報(bào)構(gòu)件庫(kù)中的各類構(gòu)件組成。數(shù)據(jù)源是進(jìn)行情報(bào)分析工作的數(shù)據(jù)來源, 主要包含大數(shù)據(jù)時(shí)代下的公開數(shù)據(jù)資源庫(kù)(政府機(jī)關(guān)、行業(yè)協(xié)會(huì)、大眾傳媒等)和存放著組織機(jī)構(gòu)內(nèi)部的信息系統(tǒng)所產(chǎn)生的事務(wù)數(shù)據(jù)的機(jī)構(gòu)數(shù)據(jù)資源庫(kù)[30] 。情報(bào)構(gòu)件庫(kù)中存儲(chǔ)著各種計(jì)算機(jī)構(gòu)件、人力構(gòu)件、人機(jī)交互構(gòu)件。其中, 人機(jī)交互構(gòu)件的類型以計(jì)算機(jī)設(shè)備為主, 主要用于情報(bào)數(shù)據(jù)的收集、處理、存儲(chǔ)、分析和決策,通常需要配備顯示器、鍵盤、鼠標(biāo)等外接設(shè)備以提高操作效率。計(jì)算機(jī)構(gòu)件和人力構(gòu)件介紹如表2、表3 所示。
如表2 所示, 計(jì)算機(jī)構(gòu)件可以按照所提供的功能分為數(shù)據(jù)庫(kù)管理構(gòu)件、數(shù)據(jù)挖掘構(gòu)件、情報(bào)分析構(gòu)件和可視化構(gòu)件4 類[2,31] 。數(shù)據(jù)庫(kù)管理構(gòu)件主要負(fù)責(zé)構(gòu)件間數(shù)據(jù)資源的資源傳遞, 將數(shù)據(jù)按一定的規(guī)則進(jìn)行存放和使用; 數(shù)據(jù)挖掘構(gòu)件則是負(fù)責(zé)信息加工, 使用數(shù)理統(tǒng)計(jì)、人工智能等方法挖掘大量數(shù)據(jù)中的高價(jià)值信息; 情報(bào)分析構(gòu)件用于輔助專業(yè)人員針對(duì)高價(jià)值信息提出對(duì)應(yīng)的決策建議; 可視化構(gòu)件負(fù)責(zé)數(shù)據(jù)信息的可視化展示, 幫助情報(bào)人員進(jìn)一步凝練高價(jià)值信息, 為用戶提供更加直觀的情報(bào)報(bào)告。
如表3 所示, 人力構(gòu)件可以根據(jù)其知識(shí)背景分為情報(bào)采集員、數(shù)據(jù)分析員、情報(bào)分析員和情報(bào)管理員4 類[32] 。情報(bào)采集員需要篩選不同的情報(bào)源獲取其中的數(shù)據(jù)以供后續(xù)加工; 數(shù)據(jù)分析員需要根據(jù)情報(bào)需求選取計(jì)算機(jī)分析工具和算法, 并且在分析過程中調(diào)整相關(guān)參數(shù); 情報(bào)分析員需要根據(jù)高價(jià)值信息進(jìn)行經(jīng)驗(yàn)推斷并提出決策和建議; 情報(bào)管理員則需要安排每一環(huán)節(jié)下的分析流程, 保證數(shù)據(jù)資源與需求信息的有序流動(dòng)。
4 總結(jié)與展望
為實(shí)現(xiàn)人力構(gòu)件和計(jì)算機(jī)構(gòu)件[8] 的有機(jī)結(jié)合,本文提出了人機(jī)交互構(gòu)件來補(bǔ)充現(xiàn)有的情報(bào)構(gòu)件類型。結(jié)合3 類構(gòu)件的特點(diǎn), 本文根據(jù)CORBA 構(gòu)件模型的外部接口設(shè)計(jì)進(jìn)一步細(xì)化了情報(bào)構(gòu)件的內(nèi)部功能和外部接口。在以目標(biāo)為中心情報(bào)思想的指導(dǎo)下, 本文根據(jù)MVC 架構(gòu)設(shè)計(jì)了情報(bào)構(gòu)件的組合原則和工作模式, 以此規(guī)范構(gòu)件的組合過程并劃分不同構(gòu)件的工作職責(zé)。為進(jìn)一步解釋情報(bào)構(gòu)件在情報(bào)分析中所承擔(dān)的功能角色, 本文在構(gòu)件組合的基礎(chǔ)上開發(fā)了層次性、規(guī)范性的情報(bào)分析模型。其中,根據(jù)信息鏈與情報(bào)分析的密切聯(lián)系得出了可以滿足大部分需求的情報(bào)工作流程, 然后再綜合以目標(biāo)為中心的情報(bào)思想, 將其改造為面向構(gòu)件組合的情報(bào)工作流程。然后根據(jù)情報(bào)構(gòu)件的工作模式對(duì)該流程中的每一環(huán)節(jié)的運(yùn)行邏輯進(jìn)行了展開說明。最后根據(jù)該模型中構(gòu)件的工作特點(diǎn)明確了可以支撐系統(tǒng)運(yùn)行的實(shí)體。
本文提出的情報(bào)構(gòu)件體系具有情報(bào)人員職責(zé)規(guī)范化、情報(bào)工作開展快速化和情報(bào)產(chǎn)品質(zhì)量可控化等優(yōu)點(diǎn)。首先, 情報(bào)人員經(jīng)過構(gòu)件化封裝后, 構(gòu)件內(nèi)部功能與外部接口的規(guī)范設(shè)計(jì)可以為不同情報(bào)工作中情報(bào)人員職責(zé)的劃分提供參考; 其次, 在基于構(gòu)件的情報(bào)分析流程的指導(dǎo)下, 各情報(bào)要素所對(duì)應(yīng)的構(gòu)件通過外部接口在同一層次有序組裝可以實(shí)現(xiàn)情報(bào)分析工作模型快速開發(fā); 最后, 情報(bào)需求的每一次更迭對(duì)應(yīng)著情報(bào)產(chǎn)品的每一次增量, 也意味著對(duì)情報(bào)產(chǎn)品質(zhì)量的每一次把控, 使得最終的情報(bào)產(chǎn)品更貼近用戶需求。
情報(bào)構(gòu)件最大的特點(diǎn)是將“人” 進(jìn)行構(gòu)件化表示, 如何連接人力構(gòu)件和其他構(gòu)件是組合構(gòu)件的關(guān)鍵。而本文的接口設(shè)計(jì)面向所有類型的情報(bào)構(gòu)件,所以未來需要進(jìn)一步細(xì)化人力構(gòu)件的接口類型和功能來完善情報(bào)構(gòu)件體系。此外, 僅將情報(bào)要素劃分為3 種類型致使本文開發(fā)的情報(bào)分析模型中的構(gòu)件粒度較大, 未來需要進(jìn)一步分解情報(bào)分析工作中的各要素, 完成更細(xì)粒度的情報(bào)構(gòu)件分析模型開發(fā)。