龍虎 王振龍 楊建菊
摘要:擬態(tài)計算的本質是實現(xiàn)高效能計算,將擬態(tài)計算與大數(shù)據(jù)技術相結合,建立具有靈活和可拓展的體系結構,能夠充分發(fā)揮系統(tǒng)整體執(zhí)行效率,對提高效能比有著十分重要的作用。大數(shù)據(jù)應用平臺是一個以數(shù)據(jù)分析與預測以及展現(xiàn)等為目的平臺。在梳理擬態(tài)計算概念的基礎上,對大數(shù)據(jù)應用平臺進行了闡述,構建了基于擬態(tài)計算的高效能大數(shù)據(jù)應用平臺,并對擬態(tài)計算未來研究方向進行了展望。
關鍵詞:擬態(tài)計算;高效能;大數(shù)據(jù);應用平臺
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)01-0036-02
Abstract: Mimic computing can deeply integrate various heterogeneous components, and combine mimic computing with big data technology to establish a flexible and extensible architecture, which can give full play to the overall execution efficiency of the system and play a very important role in improving the efficiency ratio. Big data application platform is a platform for data analysis, prediction and presentation. On the basis of combing the concept of mimic computing, this paper expounds the big data application platform, constructs an efficient big data application platform based on mimic computing, and prospects the future research direction of mimic computing.
Key words: mimic computing; high efficiency; big data; application platform
大數(shù)據(jù)是現(xiàn)有數(shù)據(jù)庫管理工具和傳統(tǒng)數(shù)據(jù)處理應用方法很難處理的大型及復雜的數(shù)據(jù)集,大數(shù)據(jù)的一個主要方面是數(shù)據(jù)的可用性,用以分析的數(shù)據(jù)越全面,分析的結果就越接近真實,就更具有可用性。大數(shù)據(jù)的另一個重要方面是數(shù)據(jù)的復雜性,海量的非結構化和半結構化數(shù)據(jù)是數(shù)據(jù)結構不規(guī)則或不完整,也沒有預定義的數(shù)據(jù)模型,不方便利用二維邏輯數(shù)據(jù)庫來表現(xiàn)的數(shù)據(jù)。擬態(tài)計算的概念最初是由中國工程院院士鄔江興提出的。2013年9月,世界首臺擬態(tài)計算機原理樣機由中國科學家研制成功。2018年,國內首個擬態(tài)域名服務器問世,并上線應用,在“大數(shù)據(jù)和實體經濟深度融合高峰論壇暨2018大數(shù)據(jù)產業(yè)發(fā)展試點示范項目發(fā)布會”中,上海的多家公司和復旦大學共同開展關于通用擬態(tài)大數(shù)據(jù)平臺,為擬態(tài)計算在大數(shù)據(jù)分析處理和數(shù)據(jù)挖掘領域實現(xiàn)高效能和高安全提供原創(chuàng)性技術路徑[1]。當前,大數(shù)據(jù)應用平臺主要是將通用處理器作為計算核心,效能比較低且系統(tǒng)結構較為單一,無法滿足大數(shù)據(jù)的計算需求。如何有效地進行高效能計算且能滿足高安全性的需求是當前大數(shù)據(jù)領域研究的重點問題。因此,有必要構建一個基于擬態(tài)計算的高效能大數(shù)據(jù)應用平臺,擬態(tài)計算能夠深度融合各異構部件,將擬態(tài)計算與大數(shù)據(jù)技術相結合,建立具有靈活和可拓展的體系結構,能夠充分發(fā)揮系統(tǒng)整體執(zhí)行效率,對降低功耗和提高效能比有著十分重要的作用。
1擬態(tài)計算概述
擬態(tài)計算的本質是計算結構的函數(shù)化,其根本目的是實現(xiàn)高效能計算。擬態(tài)計算(Mimic Computing,MC)的概念是由中國工程院院士鄔江興提出的。2013年9月,世界上首臺擬態(tài)計算機原型樣機由中國科學家研制成功,運算速度可提升數(shù)百倍,其原理驗證采用了Web服務(輸入輸出密集)和N-body(計算密集)以及圖像識別(存儲密集)等進行了驗證,應用后其效能比提升了幾十到幾百倍,高效能特點顯著。擬態(tài)計算與其他計算有很大的不同,如表1所示。
擬態(tài)計算也被稱之為擬態(tài)架構計算,主要是依靠動態(tài)變結構以及軟硬件結合實現(xiàn)基于效能的計算,其適用領域主要在高性能和高效能計算處理方面。擬態(tài)計算與虛擬計算不同,擬態(tài)計算著重體現(xiàn)在物理和邏輯結構同時變換,而虛擬計算則體現(xiàn)在邏輯結構的變換,擬態(tài)計算與其他一般的計算也不同,一般計算主要體現(xiàn)在硬件執(zhí)行體的物理基本結構不變。擬態(tài)計算機是指按照擬態(tài)原理來構造的計算機,其最大特點是通過計算機結構技術實現(xiàn)高效能。2020年7月,英特爾中國研究院院長宋繼強在第十五屆“開源中國開源世界”高峰論壇中提出了“神經擬態(tài)計算,探索智能互聯(lián)時代的計算創(chuàng)新”,指出了英特爾在神經擬態(tài)計算領域的發(fā)展。
2大數(shù)據(jù)應用平臺
大數(shù)據(jù)平臺是一個集數(shù)據(jù)接入、數(shù)據(jù)存儲、數(shù)據(jù)分析與處理、數(shù)據(jù)查詢與檢索、數(shù)據(jù)挖掘和數(shù)據(jù)可視化等功能于一體的平臺[2]。大數(shù)據(jù)平臺主要由大數(shù)據(jù)基礎設施、數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)處理、大數(shù)據(jù)應用、大數(shù)據(jù)安全管理和大數(shù)據(jù)運營管理等多個部分組成,基礎設施可為大數(shù)據(jù)平臺的底層提供必要的基礎設施支持,數(shù)據(jù)源是指數(shù)據(jù)來源種類繁多,既包括結構化和半結構化數(shù)據(jù),也包括非結構化數(shù)據(jù)。數(shù)據(jù)采集是進行數(shù)據(jù)存儲之前必須要進行的步驟之一,是實現(xiàn)大數(shù)據(jù)價值挖掘的關鍵。數(shù)據(jù)存儲(Data storage)是大數(shù)據(jù)平臺架構中一個重要部分,主要有結構化數(shù)據(jù)存儲以及非結構化數(shù)據(jù)存儲等,傳統(tǒng)的關系型數(shù)據(jù)庫存儲的都是結構化數(shù)據(jù),如Oracle Database和MySQL以及SQL Server等,非結構化數(shù)據(jù)如HTML、各類報表以及圖像和視頻等。數(shù)據(jù)處理主要體現(xiàn)在數(shù)據(jù)挖掘、深度學習、社交計算等多個方面,數(shù)據(jù)挖掘又稱為從數(shù)據(jù)庫中發(fā)現(xiàn)知識、數(shù)據(jù)分析和數(shù)據(jù)融合以及決策支持。深度學習是機器學習研究中的一個新領域,社交網絡每天都會產生海量的用戶數(shù)據(jù),吸引著無數(shù)研究者從無序的數(shù)據(jù)中挖掘有價值的信息。大數(shù)據(jù)應用主要體現(xiàn)在互聯(lián)網和金融以及教育等多個領域。大數(shù)據(jù)平臺的安全管理主要是考慮物理安全、網絡安全、應用安全以及數(shù)據(jù)安全等多個方面。大數(shù)據(jù)運營管理主要體現(xiàn)在監(jiān)控、告警、備份和恢復以及優(yōu)化等方面。大數(shù)據(jù)平臺是大數(shù)據(jù)管理的技術基礎,也是有效地將大數(shù)據(jù)經過清洗、梳理、轉換、再進行加工和深度利用,能夠形成數(shù)據(jù)資產和產生數(shù)據(jù)價值的基礎處理架構和工具。大數(shù)據(jù)應用平臺是一個以數(shù)據(jù)分析與預測以及展現(xiàn)等為目的平臺。數(shù)據(jù)分析是對海量數(shù)據(jù)的分析,通過分析預測以及展現(xiàn)加強大數(shù)據(jù)的價值利用。
3基于擬態(tài)計算的高效能大數(shù)據(jù)應用平臺構建
擬態(tài)計算是一種基于認知的主動重構計算技術(Proactive Reconfigurable computing Architecture,PRCA),其根本目的是實現(xiàn)高效能計算[3]。大數(shù)據(jù)應用平臺是一個包含前臺和中臺以及后臺等多個部分的平臺,其前臺主要是用戶應用方面,中臺主要數(shù)據(jù)服務方面,后臺主要是存儲與計算方面?;跀M態(tài)計算的高效能大數(shù)據(jù)應用平臺構建如圖1所示。
基于擬態(tài)計算的高效能大數(shù)據(jù)應用平臺主要包括數(shù)據(jù)源和擬態(tài)設備、擬態(tài)計算以及數(shù)據(jù)應用服務等多個部分,數(shù)據(jù)源部分主要包括結構化數(shù)據(jù)、非結構化數(shù)據(jù)和半結構化數(shù)據(jù),擬態(tài)設備主要包括擬態(tài)計算機、擬態(tài)路由器、擬態(tài)文件存儲器、擬態(tài)DNS服務和擬態(tài)WEB服務器等,其中,擬態(tài)計算機主要是指依據(jù)擬態(tài)原理構造的計算機,擬態(tài)計算機主要依靠的是動態(tài)變結構,將軟硬件結合,實現(xiàn)基于效能的計算。擬態(tài)計算機的主要特點是通過計算機結構技術實現(xiàn)高效能,其效能比一般的計算機效能可提升幾十到幾百倍。擬態(tài)路由器是基于擬態(tài)防御機理研制的網絡基礎設施設備,具有豐富的路由性能,其具備擬態(tài)防御特性,可提供高可靠、高可性和高可用的三位一體的廣義魯棒性服務,路由協(xié)議的異構執(zhí)行體具有冗余性和動態(tài)性,動態(tài)異構冗余特性決定了其不依賴于特征進行威脅檢測與阻斷,既可以減少具有同等功能的其他安全防護的部署成本,同時也可以降低不停打補丁堵漏洞的維護成本,最終可以降低用戶的總體成本。擬態(tài)文件存儲服務可為大數(shù)據(jù)應用平臺提供高魯棒性的文件存儲服務,能夠在保障用戶數(shù)據(jù)的完整性和可用性的前提下,有效解決數(shù)據(jù)的安全性和私密性等問題。擬態(tài)DNS服務可以在不改變現(xiàn)有域名協(xié)議和地址解析設施的基礎上,通過擬態(tài)防御設備的增量部署,能夠有效防御多種攻擊,可以提供安全可靠的域名解析服務。擬態(tài)WEB服務器是一個基于網絡空間擬態(tài)防御理論,以動態(tài)異構冗余架構為指導構建的由內生機理保證的高可靠和高可信以及高可用的三位一體的具有廣義魯棒性的WEB服務器。擬態(tài)計算的本質是實現(xiàn)高效能計算,以服務于高效能大數(shù)據(jù)應用平臺。
4結束語
大數(shù)據(jù)時代背景下,隨著海量異構數(shù)據(jù)的不斷增加,海量數(shù)據(jù)處理的復雜性和系統(tǒng)能耗以及數(shù)據(jù)安全等問題挑戰(zhàn)也隨之顯現(xiàn)出來,通過擬態(tài)計算結合大數(shù)據(jù)平臺,將軟硬件深度融合,來構建一個基于擬態(tài)計算的高效能大數(shù)據(jù)應用平臺,可有效提升效能,為未來大數(shù)據(jù)應用服務個性化和精準化以及一體化提供精準的方案。
參考文獻:
[1] 龍虎. 基于擬態(tài)計算的大數(shù)據(jù)精準服務架構研究[J].信息與電腦,2020,32(5):147-149.
[2] 龍虎. 大數(shù)據(jù)計算模式與平臺架構研究[J].凱里學院學報,2019,37(3):73-76.
[3] 成平廣,等. 基于擬態(tài)計算的社會網絡劃分算法[J].計算機科學,2015,42(8):136-156.
[4] 李斌,等.基于擬態(tài)計算的大數(shù)據(jù)高效能平臺設計方法[J].計算機應用研究,2019,36(7):2059-2064.
[5] 崔冰萌,等.基于FPGA的擬態(tài)服務器設計[J].計算機系統(tǒng)應用,2018,27(4):219-225.
[6] 徐婧,等.基于大數(shù)據(jù)的重大工程智能群體決策支持系統(tǒng)研究[J].河南科學,2019(6):1014-1019.
[7] 林子雨.大數(shù)據(jù)導論[M].北京:高等教育出版社,2020.
[8] Neshatpour K, Malik M, Ghodrat M A, et al. Energy-efficient accele-ration of big data analytics applications using FPGAs[C]/ /Proc of IEEE International Conference on Big Data. Washington DC: IEEE Computer Society,2015:115-123.
【通聯(lián)編輯:王力】