国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的信息化整合方法及建議

2021-04-11 05:29:45趙昕暉郭智強(qiáng)
甘肅科技 2021年17期
關(guān)鍵詞:結(jié)構(gòu)化數(shù)據(jù)挖掘決策

趙昕暉,郭智強(qiáng)

(1.甘肅省科學(xué)技術(shù)情報研究所,2 甘肅省物產(chǎn)集團(tuán)有限責(zé)任公司,甘肅 蘭州 730000)

在全球信息化這一時代大背景下,各個應(yīng)用系統(tǒng)產(chǎn)生了大量的數(shù)據(jù)資源,由此整合數(shù)據(jù)資源及提升數(shù)據(jù)價值的需求也日益增長,并進(jìn)一步推動了大數(shù)據(jù)和云計(jì)算技術(shù)的快速發(fā)展。大數(shù)據(jù)是信息化建設(shè)中產(chǎn)生的各類數(shù)據(jù)的總稱,從數(shù)據(jù)結(jié)構(gòu)方面來說,分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);其中結(jié)構(gòu)化數(shù)據(jù)易于分析處理,而非結(jié)構(gòu)化數(shù)據(jù)分析處理是大數(shù)據(jù)應(yīng)用中面臨的難題之一。因此,系統(tǒng)應(yīng)用分布式計(jì)算、非結(jié)構(gòu)化數(shù)據(jù)存儲、垂直型數(shù)據(jù)庫應(yīng)用等是基于大數(shù)據(jù)信息化整合的重點(diǎn)研究領(lǐng)域[1]。

1 大數(shù)據(jù)與云計(jì)算的關(guān)系

近年來,大數(shù)據(jù)和云計(jì)算等名詞頻頻登上計(jì)算機(jī)領(lǐng)域的技術(shù)熱搜榜首。但大數(shù)據(jù)和云計(jì)算之間的關(guān)系人們普遍缺乏系統(tǒng)的認(rèn)識。大數(shù)據(jù)是指在信息化建設(shè)過程中產(chǎn)生的一系列圍繞信息化系統(tǒng)的數(shù)據(jù)總集,這些數(shù)據(jù)包含了信息化系統(tǒng)本身的基本結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),以及系統(tǒng)和用戶產(chǎn)生的相關(guān)日志等文本類型的數(shù)據(jù)。但想要通過單一的計(jì)算并分析這些數(shù)據(jù),用來提供一定的決策支撐顯然是耗時耗力的,因此必須使用到云計(jì)算技術(shù)對大數(shù)據(jù)進(jìn)行分析和存儲。云計(jì)算的前身就是分布式計(jì)算,將復(fù)雜的計(jì)算任務(wù)由單一的服務(wù)器計(jì)算通過云計(jì)算軟件調(diào)度,拆分成并行的多個計(jì)算線程,由服務(wù)器集群分別計(jì)算后再匯總結(jié)果。因此,大數(shù)據(jù)與云計(jì)算是相輔相成的,想要用好大數(shù)據(jù),必須從信息化底層整合計(jì)算資源和數(shù)據(jù)資源。

2 大數(shù)據(jù)技術(shù)對打通信息化孤島的作用

大數(shù)據(jù)技術(shù)是由一系列處理數(shù)據(jù)有關(guān)的單獨(dú)技術(shù)綜合而成,其包含了數(shù)據(jù)獲取技術(shù)、數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)檢索技術(shù)和數(shù)據(jù)挖掘技術(shù),運(yùn)用以上四種技術(shù)組建數(shù)據(jù)資源池,并基于各信息化系統(tǒng)的元數(shù)據(jù)標(biāo)準(zhǔn),可有效打破各信息系統(tǒng)之間互不關(guān)聯(lián)的信息資源孤島,形成大數(shù)據(jù)資源的綜合運(yùn)用。

2.1 數(shù)據(jù)資源采集獲取技術(shù)

數(shù)據(jù)資源采集獲取技術(shù)分為針對結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)導(dǎo)入導(dǎo)出工具、SQL 腳本、軟件接口、和數(shù)據(jù)爬蟲等定時推送技術(shù)。非結(jié)構(gòu)化信息的獲取需要批量采集非結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)信息,通過元數(shù)據(jù)信息來對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行描述,來達(dá)到大數(shù)據(jù)平臺的獲取需求。

2.2 數(shù)據(jù)存儲技術(shù)

大數(shù)據(jù)的存儲主要采用分布式存儲技術(shù),比較成熟的技術(shù)包括Hadoop 的HDFS 集群以及由HDFS 集群和結(jié)構(gòu)化數(shù)據(jù)庫MySQL 集群共同組成大數(shù)據(jù)存儲平臺。采用這種數(shù)據(jù)存儲方法既保證了多種數(shù)據(jù)的存儲,并且可以有效的利用Hive、Spark、MapReduce 等技術(shù)對大數(shù)據(jù)進(jìn)行離線計(jì)算。從而可以有效地提高大數(shù)據(jù)的計(jì)算處理效率和處理質(zhì)量,縮短處理時間,提升數(shù)據(jù)利用率。

2.3 大數(shù)據(jù)檢索技術(shù)

大數(shù)據(jù)搜索技術(shù)是大數(shù)據(jù)的典型應(yīng)用場景之一,在搜索領(lǐng)域也出現(xiàn)了一些成熟的技術(shù),這類技術(shù)主要是基于分布式的全文搜索引擎與數(shù)據(jù)分析引擎。該技術(shù)能實(shí)現(xiàn)大數(shù)據(jù)平臺的數(shù)據(jù)搜索、分析和探索能力,具備良好的可擴(kuò)展性和二次開發(fā)程序接口,可以為大數(shù)據(jù)整合提供完整的搜索解決方案。

2.4 大數(shù)據(jù)挖掘技術(shù)

大數(shù)據(jù)之所以產(chǎn)生價值,就在于對大數(shù)據(jù)的挖掘分析?;贠LAP(聯(lián)機(jī)分析)技術(shù)可以使用大數(shù)據(jù)方便的形成數(shù)據(jù)畫像、各類報表。通過深入的數(shù)據(jù)挖掘可以形成針對訪問用戶的精準(zhǔn)數(shù)據(jù)畫像,典型的應(yīng)用包括各類電商平臺的推薦系統(tǒng)和保險營銷的營銷系統(tǒng)。

3 基于大數(shù)據(jù)技術(shù)的應(yīng)用研究領(lǐng)域

基于大數(shù)據(jù)技術(shù)的信息化整合應(yīng)從軟件和硬件兩個方面著手。軟件方面,通過使用ETL(數(shù)據(jù)倉儲)工具,將一個個孤立的業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換之后,整合存儲到大數(shù)據(jù)平臺資源池以備使用。軟件方面,通過使用Hadoop集群可以很好地解決大數(shù)據(jù)分布式存儲和數(shù)據(jù)挖掘計(jì)算。硬件方面,采用流行的軟件定義網(wǎng)絡(luò)產(chǎn)品,將多臺高性能服務(wù)器使用虛擬化技術(shù)進(jìn)行資源管理和分配,這樣能夠做到計(jì)算和存儲資源的有效利用。并且通過部署Hadoop 集群,做到大數(shù)據(jù)的分布式存儲、分發(fā)、計(jì)算,有效節(jié)約了時間成本和運(yùn)維成本,數(shù)據(jù)處理效率得到了高可靠的保證。在信息安全方面,大數(shù)據(jù)中的應(yīng)用數(shù)據(jù)始終處于流動狀態(tài),因此可以采用https 數(shù)字證書加密等方式,保障系統(tǒng)數(shù)據(jù)的加密傳輸。在硬件安全方面,應(yīng)盡量采用安全審計(jì)設(shè)備,對各類信息進(jìn)行監(jiān)測,由專業(yè)安全人員根據(jù)數(shù)據(jù)的重要性采用不同的監(jiān)測和加密方式進(jìn)行傳輸和使用[1]。

通過大數(shù)據(jù)技術(shù)將傳統(tǒng)的信息化業(yè)務(wù)系統(tǒng)整合成為了一個統(tǒng)一的應(yīng)用平臺,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的交互,在數(shù)據(jù)挖掘方面和數(shù)據(jù)搜索方面提升了數(shù)據(jù)的利用率,為決策支持提供有效的數(shù)字支撐。例如,采用綜合統(tǒng)計(jì)報表等方式,通過數(shù)據(jù)分析大屏直觀地展示,從而提供決策支持依據(jù),提升業(yè)務(wù)流轉(zhuǎn)效率,優(yōu)化各業(yè)務(wù)部門的協(xié)同作業(yè)。

使用大數(shù)據(jù)平臺整合了信息化業(yè)務(wù)系統(tǒng)后,還可以有效的加強(qiáng)內(nèi)部輔助系統(tǒng)的應(yīng)用研發(fā),例如可以在考核、財(cái)務(wù)、信息資源共享等方面拓展大數(shù)據(jù)平臺的應(yīng)用范圍[2]。在考核方面,有關(guān)人員考核的數(shù)據(jù)可以經(jīng)由大數(shù)據(jù)平臺匯總,大數(shù)據(jù)平臺可以直觀的反映人員的出勤、產(chǎn)出等方面的數(shù)據(jù),加強(qiáng)對人員的管理把控;在財(cái)務(wù)管理方面,有支付需求的業(yè)務(wù)可以采用統(tǒng)一的支付平臺,通過支付平臺的應(yīng)用可以減少財(cái)務(wù)對賬流程,杜絕財(cái)務(wù)錯賬壞賬的發(fā)生,并對合同進(jìn)行有效的追蹤和使用。在信息資源共享方面,可以通過大數(shù)據(jù)平臺輕松實(shí)現(xiàn)內(nèi)部資源共享,并做到相關(guān)性資料一鍵搜索。

4 數(shù)據(jù)價值體現(xiàn)和發(fā)展方向

4.1 大數(shù)據(jù)推動決策

大數(shù)據(jù)整合后,用好大數(shù)據(jù)的主要方向就是向決策主體服務(wù)[2],通過各個業(yè)務(wù)系統(tǒng)匯聚而來的數(shù)據(jù),經(jīng)過大數(shù)據(jù)平臺的分析挖掘,形成的數(shù)據(jù)分析結(jié)果可以在不同的決策主體之間進(jìn)行共享流轉(zhuǎn),進(jìn)而方便各決策主體單位及時掌握大數(shù)據(jù)平臺的分析數(shù)據(jù)和關(guān)聯(lián)因素,加快決策進(jìn)程。

4.2 大數(shù)據(jù)推動智慧城市發(fā)展

智慧城市是典型的大數(shù)據(jù)應(yīng)用,通過打通城市政府各業(yè)務(wù)系統(tǒng),可以實(shí)現(xiàn)智慧城市智能大數(shù)據(jù)應(yīng)用[3]。例如通過交通信號攝像大數(shù)據(jù)實(shí)現(xiàn)智慧交通,動態(tài)調(diào)節(jié)城市交通;通過對城市常住人口的大數(shù)據(jù)分析,使社區(qū)部門掌握人口變化信息和養(yǎng)老信息,從而推動社區(qū)精細(xì)化管理。

4.3 大數(shù)據(jù)推動輿情監(jiān)控

社交媒體大數(shù)據(jù)在輿情監(jiān)控方面獨(dú)有價值,通過對社交媒體產(chǎn)生的大數(shù)據(jù)進(jìn)行挖掘分析,做到對社交人員的學(xué)習(xí)畫像[4],及時掌握輿情信息,促進(jìn)政府對輿情的正確研判和正確引導(dǎo),及時介入解決糾紛。

5 結(jié)語

大數(shù)據(jù)的信息化整合,不僅僅是從技術(shù)上打通信息孤島,更是要用好大數(shù)據(jù)。通過對大數(shù)據(jù)的分析、加工、挖掘,使數(shù)據(jù)產(chǎn)生更高的使用價值,從而提高數(shù)據(jù)的利用率,發(fā)揮大數(shù)據(jù)在決策中的應(yīng)有作用。本文簡單地探討了大數(shù)據(jù)的基本整合思路和常用的整合技術(shù),希望能對推動各行業(yè)大數(shù)據(jù)平臺落地實(shí)施有所幫助。

猜你喜歡
結(jié)構(gòu)化數(shù)據(jù)挖掘決策
為可持續(xù)決策提供依據(jù)
促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
決策為什么失誤了
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
莲花县| 石家庄市| 泰安市| 嘉禾县| 潜江市| 容城县| 仁怀市| 白城市| 麻城市| 乌兰县| 灌南县| 普宁市| 西吉县| 唐山市| 正蓝旗| 章丘市| 红河县| 保德县| 扎赉特旗| 桂阳县| 缙云县| 四子王旗| 兴海县| 电白县| 青州市| 遂川县| 西青区| 始兴县| 吴江市| 临潭县| 淅川县| 黄浦区| 黔东| 昌图县| 聂荣县| 灵寿县| 砀山县| 邹平县| 林口县| 读书| 仁寿县|