黃 飛,黃孝斌,蔣 輝,王國金,孫希法,司博章
(北京時代凌宇科技股份有限公司,北京 100012)
架構(gòu)在實踐中,通過分層按照場景構(gòu)建需要和南北東西向?qū)υ磾?shù)據(jù)、特征數(shù)據(jù)、決策數(shù)據(jù),科學(xué)進(jìn)行治理規(guī)整、重混重構(gòu)、分析控制、預(yù)測決策,實現(xiàn)了物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析技術(shù)和人工智能技術(shù)的高度協(xié)同統(tǒng)一和完美結(jié)合,擴展了物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能的應(yīng)用范圍,提升了應(yīng)用質(zhì)量,發(fā)揮和升華了數(shù)據(jù)價值,為有效驅(qū)動技術(shù)進(jìn)步和產(chǎn)業(yè)發(fā)展注入了新動力。
IBA(Internet of things,Big data,Artificial intelligence)融合技術(shù)架構(gòu)即物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能融合技術(shù)架構(gòu),是基于全量數(shù)據(jù)并采用分層認(rèn)知和四向協(xié)同的新型技術(shù)架構(gòu),是按照一定的規(guī)則,運用物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析技術(shù)、人工智能技術(shù)實現(xiàn)目標(biāo)設(shè)定所需的檢測,控制、協(xié)同、預(yù)測、決策的多維數(shù)據(jù)深度關(guān)聯(lián),挖掘分析和智能算法綜合運用的數(shù)據(jù)處理過程的表述。
它的含義是運用現(xiàn)代信息技術(shù)對物聯(lián)網(wǎng)獲得的時序感知數(shù)據(jù)、互聯(lián)網(wǎng)獲得的人機數(shù)據(jù),在一定的規(guī)則下,綜合運用物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析技術(shù)、人工智能技術(shù)實現(xiàn)完成目標(biāo)設(shè)定所需的監(jiān)測、控制、協(xié)同、預(yù)測、決策的數(shù)據(jù)處理過程的表述。本質(zhì)是對架構(gòu)體系內(nèi)所包含的全量、多維、多源、異構(gòu)、時變數(shù)據(jù)進(jìn)行橫向縱向的協(xié)同、科學(xué)的關(guān)聯(lián)與綜合分析,選取適當(dāng)?shù)娜诤夏J胶吞幚硭惴?,實現(xiàn)對物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能技術(shù)在架構(gòu)內(nèi)的表達(dá)方式互補、結(jié)構(gòu)互補、功能互補、層次互補。它的內(nèi)在運行規(guī)律是系統(tǒng)動態(tài)過程中的一種數(shù)據(jù)綜合加工處理過程,是物聯(lián)網(wǎng)、互聯(lián)網(wǎng)技術(shù)融合發(fā)展到一定階段的產(chǎn)物,是傳統(tǒng)物聯(lián)網(wǎng)架構(gòu)的完善和延伸,是萬物智能、萬物互聯(lián)的基礎(chǔ)。
本質(zhì)特征:(1)系統(tǒng)內(nèi)全量數(shù)據(jù)按照一定的規(guī)則治理規(guī)整、重混重構(gòu),即將數(shù)據(jù)單元和業(yè)務(wù)元素縱向進(jìn)行拆分,橫向進(jìn)行組合、整合、聚合,實現(xiàn)IBA 技術(shù)和應(yīng)用中的“你中有我,我中有你”;(2)架構(gòu)內(nèi)多層級的數(shù)據(jù)分析集建立與認(rèn)知優(yōu)化、反復(fù)迭代的融合模式選擇以及多類型的算法處理,實現(xiàn)按需配置,多維智能分析控制,預(yù)測決策。
依照規(guī)則對大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能的業(yè)務(wù)元素進(jìn)行橫向重構(gòu)和縱向拆分,進(jìn)行整合、聚合、組合,讓數(shù)據(jù)的融合重混、業(yè)務(wù)的創(chuàng)建、應(yīng)用的創(chuàng)新得到實現(xiàn)。
對物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能通過場景構(gòu)建實現(xiàn)各類技術(shù)在同一應(yīng)用中的“我中有你,你中有我”的融合,提升應(yīng)用層級,滿足用戶體驗。
IBA 融合架構(gòu)繼承了傳統(tǒng)的物聯(lián)網(wǎng)架構(gòu)的一般理念,引入了互聯(lián)網(wǎng)人機數(shù)據(jù),綜合運用了大數(shù)據(jù)技術(shù)和人工智能技術(shù),實現(xiàn)了物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能的完美融合。較傳統(tǒng)物聯(lián)網(wǎng)架構(gòu)而言,IBA融合架構(gòu)數(shù)據(jù)價值和應(yīng)用范圍發(fā)生了質(zhì)的變化,其圍繞“全面感知,縱橫協(xié)同,分層認(rèn)知,多維智能,按需配置,安全可控”的核心思想進(jìn)行構(gòu)建,全面實現(xiàn)了對萬物的感知,即人機物相連;打通東西向數(shù)據(jù)流,實現(xiàn)邊緣協(xié)同,端邊云協(xié)同;抓住認(rèn)知事物的本質(zhì),通過分層認(rèn)知探索事物的運行規(guī)律,實現(xiàn)科學(xué)決策;在架構(gòu)的不同維度,按需實現(xiàn)等級智能化、架構(gòu)功能彈性配置和安全管理自主可控。
IBA 融合架構(gòu)的實質(zhì)是系統(tǒng)內(nèi)全量數(shù)據(jù)按照一定的規(guī)則治理規(guī)整、重混重構(gòu)的過程,目標(biāo)數(shù)據(jù)復(fù)雜跨域,多源多維,融合過程需要面對結(jié)構(gòu)、半結(jié)構(gòu)、非結(jié)構(gòu)化數(shù)據(jù),面對全空間的子空間的、同步的異步的、數(shù)字的非數(shù)字的復(fù)雜環(huán)境,面對確定的模糊的甚至是動態(tài)變化的場景,進(jìn)行一系列的目標(biāo)數(shù)據(jù)格式轉(zhuǎn)換加工治理、深度的關(guān)聯(lián)分析、多層次的數(shù)據(jù)分析集優(yōu)化、反復(fù)迭代的融合模式選擇以及算法處理,實現(xiàn)科學(xué)決策和最優(yōu)控制。
數(shù)據(jù)采集要把目標(biāo)對象的狀態(tài)、人機界面觀測事實信息形成的數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)一采集,再把場景需要向上傳至網(wǎng)關(guān)、大數(shù)據(jù)平臺或服務(wù)器,依照多維智能的理念,在前端實現(xiàn)微閉環(huán)智能控制。
進(jìn)行數(shù)據(jù)融合要把由南向北的目標(biāo)數(shù)據(jù)分層融合,把再邊緣認(rèn)知層數(shù)據(jù)進(jìn)行重新混合。在分布式服務(wù)器層的數(shù)據(jù)進(jìn)行重混時,要使用調(diào)度型特征,在大數(shù)據(jù)平臺層進(jìn)行決策型數(shù)據(jù)重混。工作原理:先把不同傳感器組合輸出的數(shù)據(jù),對各種數(shù)據(jù)源的、不同量綱、不同量級、不同表現(xiàn)形式的數(shù)據(jù)做第一次規(guī)整;其次,一級處理是對各種數(shù)據(jù)集的操作,包括校對、相關(guān)分析、識別、變量或數(shù)據(jù)的綜合等,按照場景需要選擇數(shù)據(jù)融合的節(jié)點,創(chuàng)建多源數(shù)據(jù)庫,使用彈性路由技術(shù)通過路由協(xié)議建立路由回路數(shù)據(jù),貫通東西向數(shù)據(jù)流。通過自讀取、自操作技術(shù)按需提取特征關(guān)聯(lián)數(shù)據(jù)進(jìn)行數(shù)據(jù)治理,數(shù)據(jù)一致性描述得到實現(xiàn),再對控制型數(shù)據(jù)實施重混或者創(chuàng)建數(shù)據(jù)分析集,通過相關(guān)算法在邊緣層實現(xiàn)更高效率的智能應(yīng)用和控制。
對全量數(shù)據(jù)再次進(jìn)行融合,其中包含物聯(lián)網(wǎng)感知域數(shù)據(jù)、分布式認(rèn)知域匯聚及分析衍生數(shù)據(jù)中的可供預(yù)測和決策的數(shù)據(jù)、邊緣認(rèn)知域匯聚分析計算的衍生數(shù)據(jù)、相關(guān)個人的消費數(shù)據(jù)中可對目標(biāo)狀態(tài)產(chǎn)生影響的可供預(yù)測決策的數(shù)據(jù)、相關(guān)企業(yè)的CRM與ERP 數(shù)據(jù),經(jīng)過對數(shù)據(jù)的理解、研究、轉(zhuǎn)化、清理,并對數(shù)據(jù)按照規(guī)則組合和重混,創(chuàng)建分析數(shù)據(jù)庫,綜合應(yīng)用概率統(tǒng)計、模糊數(shù)學(xué)、Data Mining Algorithms、神經(jīng)網(wǎng)絡(luò)、Rapid Miner、決策樹等多學(xué)科,實現(xiàn)科學(xué)決策和預(yù)測。
在數(shù)據(jù)采集邊緣側(cè),對來自同一目標(biāo)物不同層次、不同維度通過多傳感器對多源數(shù)據(jù)進(jìn)行監(jiān)測互聯(lián)、相關(guān)組合、分析計算、預(yù)測決策,得到目標(biāo)物被測對象數(shù)據(jù)的最佳一致的統(tǒng)一描述。它與單獨的傳感器數(shù)據(jù)相比可以獲得更準(zhǔn)確、更全面的信息,更有利于數(shù)據(jù)的分析挖掘利用,有利于邊緣側(cè)人工智能技術(shù)的應(yīng)用。模型如圖1 所示。
圖1 邊緣側(cè)感知數(shù)據(jù)融合模型
在IBA 融合結(jié)構(gòu)下,邊緣側(cè)數(shù)據(jù)匯聚層貫通東西向數(shù)據(jù)是實現(xiàn)數(shù)據(jù)縱向分拆、橫向重混的關(guān)鍵。通過新一代網(wǎng)絡(luò)技術(shù)的持續(xù)演進(jìn),邊緣側(cè)數(shù)據(jù)匯聚節(jié)點存儲處理能力的指數(shù)化提高,輕量級OS 的迭代推出,加之彈性路由技術(shù)和多線程訪問技術(shù)優(yōu)化,使其成為可能,模型如圖2 所示。
圖2 邊緣側(cè)數(shù)據(jù)匯聚層融合模型
分布式認(rèn)知層是更高層級的大數(shù)據(jù)人工智能的融合應(yīng)用,其數(shù)據(jù)來源跨越了物聯(lián)網(wǎng)數(shù)據(jù)范疇,海量的人機對話數(shù)據(jù)和海量的物聯(lián)網(wǎng)數(shù)據(jù)在此進(jìn)一步交匯、治理、抽取、加工、關(guān)聯(lián),按需重混、重構(gòu),學(xué)習(xí)、訓(xùn)練、實現(xiàn)更深入的數(shù)據(jù)挖掘分析和人工智能應(yīng)用。模型如圖3 所示。
跨域多維數(shù)據(jù)融合應(yīng)用,目標(biāo)數(shù)據(jù)包含子空間和全空間的數(shù)據(jù)、模糊數(shù)據(jù)和所有已確定的數(shù)據(jù)、異部數(shù)據(jù)和同步數(shù)據(jù)、非數(shù)字的數(shù)據(jù)和數(shù)字的數(shù)據(jù)。所述的這些數(shù)據(jù)是多維多源復(fù)雜的數(shù)據(jù)。系統(tǒng)動態(tài)過程中的一種數(shù)據(jù)綜合加工處理是它的特征,數(shù)據(jù)互補是其本質(zhì),即“結(jié)構(gòu)、功能、表達(dá)方式、不同層次”互補,實現(xiàn)系統(tǒng)產(chǎn)生質(zhì)的變化的方式是互補數(shù)據(jù)得到融合[1]。此種融合和以往數(shù)據(jù)融合的變化存在很大不同,這種主要對多維數(shù)據(jù)進(jìn)行綜合分析和關(guān)聯(lián),提高數(shù)據(jù)質(zhì)量是通過構(gòu)建科學(xué)的分析集合相對應(yīng)的算法實現(xiàn)科學(xué)決策。融合模型如圖4 所示。
圖3 分布式認(rèn)知層融合模型
圖4 數(shù)據(jù)決策層融合模型
根據(jù)融合目的,在不同的認(rèn)知層選擇恰當(dāng)?shù)娜诤瞎?jié)點外,同時應(yīng)重視科學(xué)選擇實現(xiàn)最優(yōu)決策的算法。
在隨機類方法中[2],加權(quán)平均法是數(shù)據(jù)融合中最簡單和最直觀的方法。此法的工作原理是將一組傳感器收集到的冗余數(shù)據(jù)加權(quán)平均,處理后的結(jié)果即為融合信息,一般用于處理動態(tài)低水平的數(shù)據(jù)。卡爾曼濾波法主要融合低層次實時動態(tài)多傳感器冗余信息。此法對系統(tǒng)噪聲和觀測噪聲都有要求,即它們都要為高斯白噪聲,且只適用于線性系統(tǒng)模型。多貝葉斯估計法是融合靜態(tài)環(huán)境中多傳感器低層數(shù)據(jù)的常用方法。D-S 證據(jù)推理方法用于融合前提條件不完整的信息,將局部成立的前提與全局成立的前提分離開來,具有直接表達(dá)“不確定”和“不知道”的能力。
在分布式認(rèn)知層和大數(shù)據(jù)平臺層,IBA 融合技術(shù)架構(gòu)較傳統(tǒng)物聯(lián)網(wǎng)架構(gòu)的物與物的互聯(lián)外,融入了更高級別的“人”與“物”的互聯(lián),突出特點是任何“物”都將具有語境感知的功能、更強的計算能力和感知能力[3]。用于預(yù)測決策的大數(shù)據(jù)挖掘分析算法常用的有邏輯回歸算法、K-Means 聚類算法、支持向量機SVM、最大期望(Expectation Maximization,EM)算法以及樸素貝葉斯(Naive Bayes)等。
邏輯回歸算法是解決工業(yè)問題中比較受青睞的一種分類算法,實現(xiàn)簡單,分類時的計算量非常小,速度很快且所需要的存儲資源低,但是當(dāng)特征空間很大時,邏輯回歸的性能不是很好,模型容易出現(xiàn)欠擬合現(xiàn)象,從而導(dǎo)致準(zhǔn)確度下降[4]。K-Means 算法用于解決聚類問題,處理大數(shù)據(jù)集的可伸縮性和效率較高,但是需要隨機選擇初值。初值的選擇會決定聚類的結(jié)果,從而使得算法不穩(wěn)定且會出現(xiàn)局部最優(yōu)情況[5]。支持向量機SVM 是一種適合小樣本的學(xué)習(xí)方法,全局最優(yōu)解可以利用已知的有效算法計算得出,但其對大規(guī)模的訓(xùn)練樣本實施難度較大,訓(xùn)練時間較長,且模型對參數(shù)和和函數(shù)的選擇較為敏感。
由于IBA 融合技術(shù)架構(gòu)是一個全新的概念,形成成熟的理論還要進(jìn)行深入的探索和研究,但是IBA 融合技術(shù)架構(gòu)的出現(xiàn),為繼C/S、B/S 物聯(lián)網(wǎng)架構(gòu)后的創(chuàng)新帶來了新的曙光。相信對IBA 融合架構(gòu)下技術(shù)實現(xiàn)路徑和融合模型的建立探索,一定會促進(jìn)和帶動新一輪應(yīng)用的創(chuàng)新和產(chǎn)業(yè)的發(fā)展,為推動物聯(lián)網(wǎng)智能化和萬物互聯(lián)打下牢固的基礎(chǔ)。