摘? 要:檔案信息大數(shù)據(jù)平臺(tái)在實(shí)際的應(yīng)用過程中,會(huì)產(chǎn)生大量的價(jià)值數(shù)據(jù)包括用戶行為特征數(shù)據(jù),合理開發(fā)利用現(xiàn)有的數(shù)據(jù),可以更加精準(zhǔn)提升平臺(tái)服務(wù)體驗(yàn)。本文利用大數(shù)據(jù)分析相關(guān)技術(shù),對(duì)平臺(tái)數(shù)據(jù)維度進(jìn)行深入分析,利用ABP技術(shù)對(duì)平臺(tái)進(jìn)行搭建,設(shè)計(jì)出可以提供多維度、多指標(biāo)的交叉分析能力的智能可視化分析系統(tǒng)。智慧檔案信息服務(wù)平臺(tái)利用該智能分析系統(tǒng),可以滿足用戶個(gè)性化數(shù)據(jù)分析的需求,從而提升了平臺(tái)用戶的滿意度,進(jìn)而為平臺(tái)服務(wù)效率的提升提供了依據(jù)。
關(guān)鍵詞:檔案數(shù)據(jù);檔案信息資源;共享平臺(tái);智能分析;系統(tǒng)設(shè)計(jì)
Abstract:? In the actual application process of the archival information big data platform, a large amount of valuable data will be generated, including user behavior characteristic data. Rational development and utilization of the existing data can more accurately improve the platform service experience. This paper uses big data analysis related technologies to conduct in-depth analysis of the platform data dimensions, using ABP technology to build the platform, and design an intelligent visual analysis system that can provide multi-dimensional and multi-index cross-analysis capabilities. The intelligent archives information service platform utilizes the intelligent analysis system to meet the needs of users for personalized data analysis, thereby improving the satisfaction of platform users, and thus providing a basis for the improvement of platform service efficiency.
Keywords:? Archive data; Archive information resources; Sharing platform; Intelligent analysis; System design
大數(shù)據(jù)時(shí)代,物聯(lián)網(wǎng)、大數(shù)據(jù)、移動(dòng)通訊、云計(jì)算等新一代信息技術(shù)在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,催生了更多的數(shù)字化信息。智慧檔案信息服務(wù)平臺(tái)的構(gòu)建就是以“用戶為本,利用至上”為宗旨,以“智能管理”為手段,以“智慧服務(wù)”為目標(biāo),通過研究基于微服務(wù)架構(gòu)的新一代檔案信息服務(wù)管理平臺(tái)為核心,構(gòu)建大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái),實(shí)現(xiàn)檔案線上線下服務(wù)的全網(wǎng)絡(luò)、全終端、全資源的深度融合,實(shí)現(xiàn)檔案信息資源的共享共用,推進(jìn)檔案信息化建設(shè)的進(jìn)程。設(shè)計(jì)智慧檔案信息服務(wù)平臺(tái)的智能分析系統(tǒng),能夠合理配置檔案資源,全面實(shí)現(xiàn)個(gè)性化、精準(zhǔn)化的智慧服務(wù),提高檔案信息資源的利用率。通過對(duì)檔案信息資源數(shù)據(jù)深度分析,挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,利用數(shù)據(jù)之間的關(guān)系得出合理的推論。對(duì)于用戶而言,可視化的圖表操作,可以幫助其挖掘更多的價(jià)值信息,通過圖表化的分析,讓數(shù)據(jù)朝著用戶設(shè)定的方向進(jìn)行。檔案信息資源數(shù)據(jù)不同于一般的移動(dòng)互聯(lián)網(wǎng)社交信息數(shù)據(jù),在數(shù)據(jù)分析的過程中要加強(qiáng)信息的保護(hù),數(shù)據(jù)的可視化訪問權(quán)限需要提前做好策略管理。[1]設(shè)計(jì)平臺(tái)的智能分析系統(tǒng),能夠?qū)崿F(xiàn)個(gè)性化數(shù)據(jù)分析可視化展示,[2]及時(shí)調(diào)整平臺(tái)服務(wù)的相關(guān)舉措,使平臺(tái)在大數(shù)據(jù)時(shí)代得到充分的應(yīng)用。
1 智能分析系統(tǒng)概述
智慧檔案信息服務(wù)平臺(tái)智能分析系統(tǒng)主要利用平臺(tái)中不斷增加的檔案信息資源數(shù)據(jù),對(duì)數(shù)據(jù)使用的用戶行為進(jìn)行挖掘并做關(guān)聯(lián)分析,進(jìn)而分析平臺(tái)運(yùn)行狀態(tài)與檔案服務(wù)質(zhì)量,提供面向用戶和面向檔案管理者的數(shù)據(jù)決策支持。為了更好地利用檔案信息資源數(shù)據(jù),在數(shù)據(jù)處理過程中需要重視待分析數(shù)據(jù)的清洗工作,以確保待分析數(shù)據(jù)的正確性,[3]在智能分析系統(tǒng)實(shí)際使用過程中,由于移動(dòng)互聯(lián)網(wǎng)技術(shù)的成熟,移動(dòng)智能設(shè)備的普及,除了可以在傳統(tǒng)的PC端進(jìn)行數(shù)據(jù)分析,還可以在移動(dòng)端,如手機(jī)、pad端進(jìn)行查看,讓最終用戶可以不通過PC就方便地用手指觸摸的方式查看各種可視化報(bào)告。移動(dòng)智能設(shè)備的利用,還可以挖掘出更多的用戶特性,進(jìn)而為平臺(tái)的優(yōu)化提供客觀的數(shù)據(jù)參考。
在系統(tǒng)的實(shí)現(xiàn)過程中,對(duì)數(shù)據(jù)的描述性分析、線性回歸分析、方差分析、主成分分析等數(shù)據(jù)分析方法進(jìn)行了綜合研究,按照需求分析、概念結(jié)構(gòu)分析、邏輯結(jié)構(gòu)分析、物理結(jié)構(gòu)分析等步驟建立了數(shù)據(jù)分析模型,系統(tǒng)主要提供如下幾方面的分析功能[4]:(1)建立面向檔案管理人員的分析模式;(2)建立面向檔案業(yè)務(wù)的分析模式;(3)建立面向檔案管理系統(tǒng)的分析模式。
2 智能分析系統(tǒng)設(shè)計(jì)
在前期數(shù)據(jù)調(diào)研的基礎(chǔ)上,從系統(tǒng)的設(shè)計(jì)目標(biāo)、系統(tǒng)的總體架構(gòu)、系統(tǒng)實(shí)現(xiàn)的關(guān)鍵技術(shù)以及系統(tǒng)功能幾個(gè)方面對(duì)智能分析系統(tǒng)進(jìn)行設(shè)計(jì)。[5]
2.1 系統(tǒng)總體設(shè)計(jì)目標(biāo)。智能分析系統(tǒng)最終目的是滿足不同類型用戶對(duì)智慧檔案信息服務(wù)平臺(tái)進(jìn)行數(shù)據(jù)分析,系統(tǒng)無法從現(xiàn)有的平臺(tái)中分析出高價(jià)值信息,可以通過合并不同領(lǐng)域不同年份的平臺(tái)數(shù)據(jù)。大體量的信息分析出來的報(bào)告更具有參考價(jià)值,最終形成個(gè)性化的圖表可視化界面。[6]在具體實(shí)現(xiàn)過程中,需要綜合考慮平臺(tái)用戶群體的特性,考慮在用戶角色、角色權(quán)限管理方面具有友好的設(shè)置頁面,在用戶進(jìn)入平臺(tái)進(jìn)行數(shù)據(jù)分析時(shí),需要做好不同類型數(shù)據(jù)進(jìn)入系統(tǒng)進(jìn)行綜合分析,選擇不同的模板與不同的外觀進(jìn)行展示。在移動(dòng)互聯(lián)網(wǎng)技術(shù)不斷發(fā)展的背景下,平臺(tái)的設(shè)計(jì)需要考慮智能終端移動(dòng)設(shè)備的兼容,由于用戶來源的多樣性,在系統(tǒng)安全性方面需要加強(qiáng)配置控制。具體的目標(biāo)主要體現(xiàn)在以下幾方面。
2.1.1 安全認(rèn)證。檔案具有私密屬性,安全認(rèn)證是保障檔案文件不被泄露、竊取、盜用的首要保護(hù)機(jī)制。在檔案智能分析系統(tǒng)安全風(fēng)險(xiǎn)防護(hù)設(shè)計(jì)中,既要科學(xué)設(shè)置服務(wù)器規(guī)則、路由協(xié)議、防火墻安全參數(shù),也要注重軟件層面的安全防護(hù),配置系統(tǒng)文件加密機(jī)制、管理員賬戶加密機(jī)制、用戶檔案加密機(jī)制,詳細(xì)記錄管理員權(quán)限設(shè)置、檔案修改、檔案上傳、檔案刪除、檔案審核、檔案檢索,用戶上傳檔案、用戶檢索檔案、用戶瀏覽檔案,系統(tǒng)自動(dòng)編輯修改檔案與文件的日期、時(shí)間、操作員工號(hào)等信息。
2.1.2 檔案信息的存儲(chǔ)。針對(duì)檔案信息存儲(chǔ)制定規(guī)范的制度和標(biāo)準(zhǔn)有助于提高檔案信息資源存儲(chǔ)質(zhì)量。在該方面,構(gòu)建快捷高效的檔案上傳接口,設(shè)置檔案批量高速上傳、檔案資源外部導(dǎo)入、元數(shù)據(jù)導(dǎo)入、數(shù)字檔案與文字檔案轉(zhuǎn)換、多類型檔案批量載入、檔案資源安全性鑒別、檔案使用權(quán)屬管理等功能能夠大幅提升檔案存儲(chǔ)管理的便捷性,加強(qiáng)檔案信息存儲(chǔ)安全。
2.1.3 檔案信息的組織。檔案信息組織的目的主要是編排資源庫中的檔案序列,根據(jù)不同檔案的邏輯關(guān)系構(gòu)建一個(gè)層次分明、關(guān)系邏輯清晰的系統(tǒng)知識(shí)體系。智能分析系統(tǒng)在信息資源組織方面需要針對(duì)不同部門、主體、領(lǐng)域、責(zé)任者的關(guān)聯(lián)檔案進(jìn)行分類,用關(guān)聯(lián)詞組描述不同檔案的上下位類聯(lián)系、語義聯(lián)系,為同類型檔案的聚類組織管理創(chuàng)造便利條件。
2.1.4 檔案信息的檢索與傳播。關(guān)鍵詞檢索與分類檢索在多系統(tǒng)資源檢索中的應(yīng)用非常廣泛,檢索中得到的檔案資源信息具有一定的內(nèi)在關(guān)聯(lián),能夠使用戶更加高效地查找與自身需求相符的檔案信息。為確保檔案信息的安全性,有必要在為各類系統(tǒng)檔案設(shè)置專用權(quán)限字段的基礎(chǔ)上,通過針對(duì)性開放模式使不同機(jī)構(gòu)的保密檔案在特定時(shí)段內(nèi)有限制地開放,以提高針對(duì)性信息與共享性信息的可用性。
2.1.5 用戶評(píng)介與互操作服務(wù)。智慧檔案管理系統(tǒng)配置用戶評(píng)價(jià)功能與互操作功能的目的主要是為了給用戶之間、不同系統(tǒng)之間、用戶與系統(tǒng)之間的信息共享交互提供一個(gè)高效的互動(dòng)平臺(tái)。其中,用戶在與系統(tǒng)交互的過程中的身份為系統(tǒng)幫助者,可提出系統(tǒng)操作問題、運(yùn)行問題、使用感受,或?qū)Ω鞣N系統(tǒng)問題進(jìn)行解答,而系統(tǒng)會(huì)自動(dòng)收納相關(guān)問題和答案,并生成系統(tǒng)問題解決提示,使用戶在遇到系統(tǒng)問題時(shí)可通過檢索的形式快速找到解決方法。此外,用戶評(píng)價(jià)功能與互操作服務(wù)功能還能幫助檔案信息平臺(tái)更加及時(shí)準(zhǔn)確地掌握檔案信息使用情況,并根據(jù)用戶的檔案信息檢索偏好生成快捷檢索詞,使用戶在無需輸入所有檔案信息的情況下,僅需要通過特定詞匯即可查找目標(biāo)檔案,但該程序的實(shí)現(xiàn)以多系統(tǒng)互聯(lián)為前提。
2.2 系統(tǒng)總體架構(gòu)。智能分析系統(tǒng)在總體架構(gòu)設(shè)計(jì)上,考慮了檔案管理人員、平臺(tái)用戶、平臺(tái)系統(tǒng)管理員等角色,同時(shí)需要考慮移動(dòng)智能設(shè)備的數(shù)據(jù)分析功能的兼容性,在數(shù)據(jù)庫兼容性上需要考慮關(guān)系型數(shù)據(jù)庫,非關(guān)系型數(shù)據(jù)庫也需要做到兼容,平臺(tái)最終呈現(xiàn)給用戶豐富的可視化界面應(yīng)用。分析系統(tǒng)是屬于智慧檔案信息服務(wù)平臺(tái)的數(shù)據(jù)分析模塊,需要實(shí)現(xiàn)平臺(tái)之間數(shù)據(jù)集成,這方面采用單點(diǎn)登錄的方式實(shí)現(xiàn)平臺(tái)之間的身份驗(yàn)證互通,對(duì)于用戶角色權(quán)限方面,需要建立統(tǒng)一管理中心,系統(tǒng)總體架構(gòu)如圖1所示。
2.3 系統(tǒng)實(shí)現(xiàn)關(guān)鍵技術(shù)。智能分析系統(tǒng)關(guān)鍵技術(shù)主要體現(xiàn)在數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析挖掘以及數(shù)據(jù)分析結(jié)果預(yù)測。[7]技術(shù)維度方面需要采用知識(shí)獲取技術(shù)、知識(shí)表示與組織技術(shù)、自然語言處理技術(shù)、人機(jī)交互技術(shù)、新型計(jì)算機(jī)技術(shù)與深度學(xué)習(xí)技術(shù)。[8]在系統(tǒng)實(shí)現(xiàn)過程中,商業(yè)智能技術(shù)勢必不可缺少,商業(yè)智能技術(shù)通常被理解為將現(xiàn)有的數(shù)據(jù)預(yù)處理為知識(shí),對(duì)檔案信息資源數(shù)據(jù)預(yù)處理后得到的倒排索引文件進(jìn)行特征選擇,實(shí)現(xiàn)特征降維,[9]得到的數(shù)據(jù)特征集合為輔助決策者做出決定的依據(jù)。
2.4 系統(tǒng)功能設(shè)計(jì)。從功能結(jié)構(gòu)上分為數(shù)據(jù)服務(wù)層、應(yīng)用層、展示層。
數(shù)據(jù)服務(wù)層主要用于檔案信息資源數(shù)據(jù)的讀取、操作及統(tǒng)計(jì)匯總;檔案信息資源數(shù)據(jù)的數(shù)據(jù)層面的應(yīng)用均通過API進(jìn)行,應(yīng)用層實(shí)現(xiàn)管理用戶配置和權(quán)限體系,同時(shí)將系統(tǒng)的角色權(quán)限、訪問控制、運(yùn)行監(jiān)控的服務(wù)放在這一層進(jìn)行處理;個(gè)性化可視報(bào)告的展示,包括頁面展示、圖表及數(shù)據(jù)導(dǎo)出等功能在展示層得到處理,展示層作為對(duì)外服務(wù)的核心應(yīng)用,主要用于檔案信息資源數(shù)據(jù)在前端展示。系統(tǒng)功能結(jié)構(gòu)如圖2所示。
3 智能分析系統(tǒng)實(shí)現(xiàn)
3.1 系統(tǒng)實(shí)現(xiàn)過程。系統(tǒng)實(shí)現(xiàn)包括兩個(gè)部分,第一部分是智能分析系統(tǒng)自身的構(gòu)建,系統(tǒng)將采用ASP.NET Core技術(shù)構(gòu)建,ASP.NET Core是一個(gè)跨平臺(tái),高性能,開放源代碼框架,用于構(gòu)建現(xiàn)代的,支持云的、互聯(lián)網(wǎng)連接的應(yīng)用程序,在前端展示方面,將采用HTML5與CSS3技術(shù),結(jié)合Bootstrap框架技術(shù),[10]這樣可以兼容傳統(tǒng)的PC和移動(dòng)智能設(shè)備,后端數(shù)據(jù)庫支持將采用SQL Server 2016,該數(shù)據(jù)庫將提供更好的數(shù)據(jù)安全性能,事務(wù)性能方面有較大的提升,分析系統(tǒng)數(shù)據(jù)操作采用存儲(chǔ)過程以確保性能與數(shù)據(jù)安全性。[11]第二部分是系統(tǒng)模型框架的構(gòu)建,為了支持系統(tǒng)靈活配置數(shù)據(jù)分析條件及展示數(shù)據(jù),需要對(duì)后端數(shù)據(jù)分析進(jìn)行合理的監(jiān)控,包括服務(wù)器自身的硬件狀態(tài),如內(nèi)存、CPU等,個(gè)性化的應(yīng)用越強(qiáng),對(duì)不同的配置信息進(jìn)行備份還原操作也需要支持頁面層級(jí)的維護(hù),另外對(duì)日志相關(guān)的數(shù)據(jù)也需要進(jìn)行完善,如用戶訪問平臺(tái)數(shù)據(jù)、用戶行為數(shù)據(jù)、性能監(jiān)控?cái)?shù)據(jù)、系統(tǒng)出錯(cuò)數(shù)據(jù)等都需要納入系統(tǒng)的實(shí)現(xiàn)當(dāng)中。
3.2 數(shù)據(jù)分析系統(tǒng)技術(shù)實(shí)現(xiàn)。數(shù)據(jù)分析系統(tǒng)在技術(shù)框架上采用ABP,它是“ASP.NET Boilerplate Project(ASP.NET樣板項(xiàng)目)”的簡稱,該框架是一個(gè)開源應(yīng)用程序框架,[12]專注于基于ASP.NET Core的Web應(yīng)用程序開發(fā),使用該框架可以便捷地架構(gòu)智慧檔案信息服務(wù)平臺(tái)智能分析系統(tǒng),基礎(chǔ)框架通過在程序包管理控制臺(tái)輸入ABP提供的創(chuàng)建項(xiàng)目命令,即可自動(dòng)生成智能分析系統(tǒng)的解決方案,生成的解決方案已為系統(tǒng)構(gòu)建了展現(xiàn)層、應(yīng)用層、領(lǐng)域?qū)?、基礎(chǔ)設(shè)施層、分布式服務(wù)層,其中展現(xiàn)層主要用來提供用戶界面,實(shí)現(xiàn)用戶交互操作,應(yīng)用層主要是進(jìn)行展現(xiàn)層與領(lǐng)域?qū)又g的協(xié)調(diào),該層不包含具體的業(yè)務(wù)邏輯,領(lǐng)域?qū)影I(yè)務(wù)對(duì)象和業(yè)務(wù)規(guī)則,這是分析系統(tǒng)程序的核心層,基礎(chǔ)設(shè)施層主要用來提供通用技術(shù)來支持更高的層,例如數(shù)據(jù)倉儲(chǔ)可通過 ORM 來實(shí)現(xiàn)數(shù)據(jù)庫交互,為了使系統(tǒng)的實(shí)現(xiàn)更具有靈活性,該解決方案提供了分布式服務(wù)層,它用于公開應(yīng)用程序接口供遠(yuǎn)程客戶端調(diào)用,采用 ASP.NET Web API 來實(shí)現(xiàn),這樣確保每一次服務(wù)調(diào)用都是統(tǒng)一的,保證數(shù)據(jù)分析操作的一致性。[13]ABP框架技術(shù)支持Redis選項(xiàng),可以利用緩存技術(shù)來提升數(shù)據(jù)分析效率,[14]因?yàn)樵摽蚣懿捎昧祟I(lǐng)域驅(qū)動(dòng)設(shè)計(jì)的思想,在此基礎(chǔ)上可以快速地根據(jù)用戶進(jìn)行個(gè)性化定制數(shù)據(jù)分析報(bào)告。圖表分析功能展示借助了Highcharts相關(guān)圖表功能,它是一個(gè)用純JavaScript編寫的圖表庫,能夠很簡單便捷地在智慧檔案信息服務(wù)平臺(tái)的智能分析模塊添加有交互性功能的圖表。
3.3 數(shù)據(jù)分析模型構(gòu)建。在進(jìn)行檔案信息數(shù)據(jù)智能分析之前,需要先準(zhǔn)備好數(shù)據(jù),就數(shù)據(jù)本身而言,除了現(xiàn)有內(nèi)容本身,還有數(shù)據(jù)的擴(kuò)展標(biāo)簽,以便于后續(xù)實(shí)現(xiàn)數(shù)據(jù)可視化分析的選項(xiàng)更加豐富,[15][16]這項(xiàng)工作一般由檔案管理人員提出要求,由系統(tǒng)管理員進(jìn)行創(chuàng)建,需要在智慧檔案信息服務(wù)平臺(tái)與智能分析系統(tǒng)之間創(chuàng)建數(shù)據(jù)連接橋梁,以便于對(duì)平臺(tái)數(shù)據(jù)做數(shù)據(jù)分析,這相當(dāng)于平臺(tái)數(shù)據(jù)映射,智能分析系統(tǒng)智能利用智慧檔案信息服務(wù)平臺(tái)的現(xiàn)有數(shù)據(jù)而不能修改其中的信息。在數(shù)據(jù)準(zhǔn)備好之后,需要對(duì)數(shù)據(jù)進(jìn)行權(quán)限分配,主要包括目錄權(quán)限、數(shù)據(jù)權(quán)限、分級(jí)權(quán)限、管理系統(tǒng)權(quán)限、人員權(quán)限等。為檔案管理人員以及用戶分配好權(quán)限后,平臺(tái)用戶可以創(chuàng)建數(shù)據(jù)權(quán)限分配范圍內(nèi)的數(shù)據(jù)集,根據(jù)業(yè)務(wù)需求對(duì)原數(shù)據(jù)進(jìn)行再加工處理,再處理的操作包括選擇指定字段、過濾指定條件數(shù)據(jù)、分組匯總、新增邏輯列、字段名稱設(shè)置、排序等。在用戶數(shù)據(jù)集創(chuàng)建以后,平臺(tái)用戶就可以利用數(shù)據(jù)進(jìn)行可視化分析了,數(shù)據(jù)可視化包含了數(shù)據(jù)創(chuàng)建表格組件、圖表組件、過濾組件等等,有了這些待分析的檔案信息資源數(shù)據(jù)之后,在此業(yè)務(wù)基礎(chǔ)之上建立分析模型,并結(jié)合模型采用多種分析手段對(duì)數(shù)據(jù)進(jìn)行分析,[17]還可以對(duì)數(shù)據(jù)分析結(jié)構(gòu)展示一系列的設(shè)計(jì)優(yōu)化,使之更美觀。
3.4 數(shù)據(jù)分析效果展示。智能分析系統(tǒng)可以根據(jù)用戶的需求,配置出各種可視化圖表信息與個(gè)性化儀表面板,圖3以某智慧檔案信息服務(wù)平臺(tái)2021年的用戶行為數(shù)據(jù)作為源頭數(shù)據(jù),來設(shè)計(jì)可視化的看板信息。源頭數(shù)據(jù)中包含如下信息:用戶訪問地點(diǎn)、訪問時(shí)間、訪問時(shí)長、訪問頁面、頁面停留時(shí)長等平臺(tái)使用信息,同時(shí)可以監(jiān)控平臺(tái)當(dāng)前使用的客戶端樣本信息,最終可以設(shè)計(jì)成首頁大數(shù)據(jù)分析看板頁面。
4 數(shù)據(jù)分析系統(tǒng)測試
4.1 測試環(huán)境準(zhǔn)備。為了更好地模擬檔案信息資源數(shù)據(jù)分析效果,需要準(zhǔn)備兩臺(tái)服務(wù)器,一臺(tái)用戶存放檔案信息資源數(shù)據(jù)以及源頭數(shù)據(jù)檢索用戶行為數(shù)據(jù),服務(wù)器硬件采用華為(HUAWEI)2288H V5 服務(wù)器主機(jī),操作系統(tǒng)采用Windows Server2016,智能分析系統(tǒng)數(shù)據(jù)庫采用SQL Server 2016,另一臺(tái)用于共享平臺(tái)智能分析系統(tǒng)的應(yīng)用程序的部署,硬件服務(wù)器同數(shù)據(jù)庫服務(wù)配置,需要安裝Microsoft Visual Studio 2019,并配置好IIS(Internet Information Services 互聯(lián)網(wǎng)信息服務(wù))信息。
4.2 數(shù)據(jù)準(zhǔn)備。智能分析系統(tǒng)待分析的數(shù)據(jù)包含的信息如表1所示。
以上信息將根據(jù)用戶的個(gè)性化要求配置。系統(tǒng)可以根據(jù)用戶的需求,配置出各種可視化圖表信息與個(gè)性化儀表面板,通過智能分析系統(tǒng)WebAPI自動(dòng)拉取到可視化分析平臺(tái)中,利用某智慧檔案信息服務(wù)平臺(tái)2021年的用戶行為數(shù)據(jù)作為源頭數(shù)據(jù),形成用戶易于理解的各種圖表分析報(bào)告,相關(guān)效果如圖4、圖5所示。
4.3 數(shù)據(jù)測試結(jié)果。通過數(shù)據(jù)智能分析系統(tǒng)的部署以及系統(tǒng)自定義分析需求的構(gòu)建,可以順利拉取出動(dòng)態(tài)可視化圖表分析報(bào)告。在分析用戶信息訪問行為方面,通過統(tǒng)計(jì)分析模塊可以了解到平臺(tái)頁面的使用頻率,有助于智慧檔案信息服務(wù)平臺(tái)研究方向和科研需求,更好地開展檔案信息知識(shí)化服務(wù)工作。另一方面,通過訪問地域信息的統(tǒng)計(jì),可以發(fā)現(xiàn)平臺(tái)用戶群體的區(qū)域信息,這樣便于制定針對(duì)性用戶服務(wù)需求。[18]通過效果展示,分析系統(tǒng)在實(shí)際的易用性、可靠性與可維護(hù)性方面具有較高的質(zhì)量。
*本文系2017年國家社科基金年度項(xiàng)目《大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái)構(gòu)建與創(chuàng)新研究》(項(xiàng)目批準(zhǔn)號(hào):17BTQ074)研究成果之一。
參考文獻(xiàn):
[1]Cheung Ming,James She.An analytic system for user gender identification through user shared images.ACM Transactions on Multimedia Computing,Communications,and Applications,2017,13(03):30.
[2]冉波.大數(shù)據(jù)下視頻智能分析系統(tǒng)的應(yīng)用[J].通訊世界,2019(09):173-174.
[3]卞咸杰.智慧檔案信息服務(wù)平臺(tái)數(shù)據(jù)處理流程研究[J].檔案管理,2018(06):33-35.
[4]郭孔梁.網(wǎng)絡(luò)智能分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2013(04):29-32.
[5]王智鵬.基于移動(dòng)教學(xué)APP的學(xué)習(xí)狀態(tài)預(yù)警系統(tǒng)的研究與實(shí)現(xiàn)[D].沈陽:遼寧大學(xué),2019.
[6]Tom Krenzke,Jane F.Gentleman,Jianzhu Li,and Chris Moriarity.Addressing Disclosure Concerns and Analysis Demands in a Real-Time Online Analytic System[J].Journal of Offcial Statistics,2013,29(01):99-124.
[7]翁俊河,李湘麗,林燕斌等.基于大數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情智能分析系統(tǒng)關(guān)鍵技術(shù)研究[J].通訊世界,2019(09):116-118.
[8]化柏林,李廣建.智能情報(bào)分析系統(tǒng)的架構(gòu)設(shè)計(jì)與關(guān)鍵技術(shù)研究[J].圖書與情報(bào),2017(06):74-83.
[9]馬梅,劉東蘇,李慧.基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析系統(tǒng)模型研究[J].情報(bào)科學(xué),2016,34(03):25-28+33.
[10]卞咸杰.大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái)前端框架的構(gòu)建[J].檔案與建設(shè),2017(10):11-15.
[11]卞咸杰.大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái)性能優(yōu)化的研究[J].檔案管理,2016(06):18-20.
[12]金秀鳳.基于ABP框架的智慧檔案信息服務(wù)平臺(tái)模型構(gòu)建[J].檔案管理,2020(04):64-65.
[13]卞咸杰.大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái)數(shù)據(jù)交互服務(wù)的研究[J].浙江檔案,2018(11):15-17.
[14]金秀鳳.大數(shù)據(jù)時(shí)代智慧檔案信息服務(wù)平臺(tái)數(shù)據(jù)處理的優(yōu)化[J].檔案管理,2018(06):29-32.
[15]Richard Gruss,Alan S.Abrahams,Weiguo Fan,G.Alan Wang.By the numbers:The magic of numerical intelligence in text analytic systems.Decision Support Systems,2018,113:86-98.
[16]James S.Walker,Mark W.Jones,Robert S.Laramee,Owen R.Bidder,Hannah J.Williams,Rebecca Scott,Emily L.C.Shepard,Rory P.Wilson.TimeClassifier:a visual analytic system for the classification of multi-dimensional time series data.The Visual Computer,2015,31:1067-1078.
[17]王衛(wèi)鋒,楊林.基于Hadoop的郵政寄遞大數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].中國科學(xué)院大學(xué)學(xué)報(bào),2017,34(03):395-400.
[18]陳廣.基于Fiddler代理程序的電子資源使用統(tǒng)計(jì)分析系統(tǒng)的設(shè)計(jì)與應(yīng)用[J].圖書情報(bào)工作,2018,62(13):30-36.