(中國聯(lián)合網(wǎng)絡(luò)通信有限公司研究院,北京100176)
當(dāng)前,人類已進(jìn)入智能化時代的新經(jīng)濟(jì)周期,人工智能技術(shù)迅速提升全社會全要素生產(chǎn)率和生活便捷性,尤其在產(chǎn)業(yè)領(lǐng)域,工業(yè)互聯(lián)網(wǎng)與人工智能技術(shù)的交叉學(xué)科與技術(shù)應(yīng)用成為了研究熱點,并且伴隨著工業(yè)數(shù)據(jù)的海量匯聚與實時演算分析,工業(yè)know-how知識的算法化沉淀,算力在設(shè)備側(cè)、邊緣側(cè)、平臺側(cè)的分布與協(xié)同,使得人工智能技術(shù)在工業(yè)互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用復(fù)雜度提升。一是海量工業(yè)現(xiàn)場設(shè)備智能化需求的提升,使得邊緣計算快速興起,分布式智能的應(yīng)用速度加快;二是智能設(shè)備被賦予從識別、認(rèn)知、監(jiān)測、預(yù)測性分析的基礎(chǔ)智能,向更大自主權(quán)的自適應(yīng)決策的過渡;三是單智能體(agent)[1]向可交互協(xié)作的多智能體(multi-agent)復(fù)雜系統(tǒng)的演進(jìn)。
毫無疑問,總的趨勢是從分布式智能到協(xié)作式智能,從單點智能向多智能體系統(tǒng)發(fā)展。多智能體技術(shù)作為人工智能技術(shù)的重要領(lǐng)域,其主要目標(biāo)是通過具有一定自主能力的智能體間相互協(xié)作實現(xiàn)復(fù)雜智能,尤其是面向?qū)嶋H生產(chǎn)過程中往往是時間、效率、成本的博弈問題的現(xiàn)狀,可以在降低系統(tǒng)總體建模復(fù)雜性的同時,達(dá)到最優(yōu)化解,是工業(yè)互聯(lián)網(wǎng)浪潮下實現(xiàn)機器人協(xié)作,海量物聯(lián)網(wǎng)網(wǎng)絡(luò)自治,自適應(yīng)排產(chǎn),多任務(wù)生產(chǎn)調(diào)度,物流快速匹配等多種任務(wù)場景的有力工具。
單智能體理論起源于20世紀(jì)70年代的人工智能范疇概念,是指具有一定自主行為能力的實體,它的出現(xiàn)成為了分布式智能、分布式計算、群體智能等一系列人工智能領(lǐng)域技術(shù)的基礎(chǔ)理論支撐和基本工具。但是隨著人工智能技術(shù)應(yīng)用復(fù)雜度的提升,單點智能在一個完整的系統(tǒng)中解決全局問題會出現(xiàn)盲目性,對環(huán)境的反應(yīng)也存在一定的偏差,為了解決單點智能無法解決的復(fù)雜問題,人們從蟻群、蜂群等自然界多個體組成的社會群體解決復(fù)雜問題的案例中得到啟發(fā),探索單智能體向多智能體系統(tǒng)的發(fā)展。
多智能體在不同的領(lǐng)域具有不同的定義,但總的來說應(yīng)該是一類具有自主能力的,能夠執(zhí)行一定指令的,可以進(jìn)行通信的,對外界環(huán)境可以進(jìn)行反應(yīng)的,并且在一定約束條件下具有一致性的多個智能體的系統(tǒng)。由于多智能體系統(tǒng)(multi-agent system)[2]中的智能體需要共同完成一個復(fù)雜任務(wù),所以多智能體系統(tǒng)中的智能體需要交互和協(xié)同。由于各智能體成員的活動是獨立和自治的, 需要一定的一致性手段來解決各個智能體成員在達(dá)到自身目標(biāo)任務(wù)時的矛盾和沖突。
工業(yè)互聯(lián)網(wǎng)的發(fā)展疊加了數(shù)字化轉(zhuǎn)型與智能化升級,多智能體技術(shù)在解決產(chǎn)業(yè)實際復(fù)雜問題時具有獨特優(yōu)勢,主要表現(xiàn)在以下方面。
一是多智能體系統(tǒng)的單智能體與全局系統(tǒng)的一致性:在一個由多個智能體組成的系統(tǒng)中,每個智能體都具有獨立性和自主性,可以在一定范圍內(nèi)解決一組子問題,自主選擇合適的策略,以達(dá)到目標(biāo)解。在設(shè)計多智能體系統(tǒng)的過程中,由于采用了分層分類管理的方案,在多個層面上配置各種智能體,降低單個智能體解決問題的復(fù)雜性,可有效兼容具有不同能力智能體的異質(zhì)性。多智能體系統(tǒng)支持分布式應(yīng)用,具有良好的模塊化、易擴展性和靈活性,可以克服構(gòu)建龐大系統(tǒng)帶來的管理和擴展困難,有效降低系統(tǒng)的復(fù)雜度。
二是多智能體系統(tǒng)的協(xié)作性:在多智能體系統(tǒng)中,各智能體之間設(shè)計協(xié)商與通信機制,并行地求解問題,因此能有效地提高問題的求解能力。多智能體系統(tǒng)也是集成系統(tǒng),各個智能體作為子系統(tǒng),通過一定算法約束規(guī)則完成復(fù)雜系統(tǒng)集成,各智能體通過協(xié)作式群體智能解決大規(guī)模的復(fù)雜問題。
三是多智能體系統(tǒng)的分布式智能與天然異構(gòu)性:各智能體可以來源于不同系統(tǒng)和環(huán)境實例,可以是人、軟件、機械臂、飛行器等各種具有自主能力的實體,因此具有天然的完全異質(zhì)性。當(dāng)進(jìn)行智能化升級時,采用多智能體技術(shù)可對當(dāng)前生產(chǎn)系統(tǒng)產(chǎn)生最小化擾動。
由于多智能體技術(shù)具有諸多優(yōu)勢,從20世紀(jì)90年代起在社會的經(jīng)濟(jì)、公共管理、交通、工業(yè)各個方面得到了應(yīng)用。近年來,在工業(yè)互聯(lián)網(wǎng)領(lǐng)域,已在物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)自適應(yīng)、多機械臂協(xié)同裝配、無人機編隊、交通管制、生產(chǎn)調(diào)度分配等領(lǐng)域產(chǎn)生應(yīng)用價值。
生產(chǎn)調(diào)度或者排產(chǎn)是產(chǎn)線控制與企業(yè)管理相結(jié)合的紐帶,它是企業(yè)管理和生產(chǎn)加工計劃層面的決策依據(jù),在傳統(tǒng)生產(chǎn)中是依靠原材料系統(tǒng)或者訂單系統(tǒng)的正反饋或負(fù)反饋形成閉環(huán)來進(jìn)行調(diào)度管理的。但是,隨著生產(chǎn)制造的定制化與個性化產(chǎn)業(yè)模式的形成,生產(chǎn)調(diào)度面臨的多樣化和不確定性增加,要實現(xiàn)按需生產(chǎn),企業(yè)必須有快速、靈活的生產(chǎn)調(diào)度,以滿足客戶及時變化的需求。
通過利用多智能體系統(tǒng)的分布式求解能力,將復(fù)雜的生產(chǎn)調(diào)度任務(wù)劃分為具有特定功能的智能體,并通過協(xié)商機制共同完成任務(wù),降低了設(shè)計單一調(diào)度系統(tǒng)的復(fù)雜性。例如文獻(xiàn)[3]針對靈活的庫存調(diào)度功能,提出了一種基于多智能體技術(shù)的柔性車間調(diào)度系統(tǒng)。調(diào)度系統(tǒng)將涉及到的調(diào)度實體設(shè)計為智能體,由工件智能體,生產(chǎn)單元智能體和全局智能體組成,形成了基于多智能體的靈活的調(diào)度方法。結(jié)果證明,基于多智能體技術(shù)的調(diào)度系統(tǒng)明顯優(yōu)于傳統(tǒng)分配規(guī)則。
在調(diào)度問題中采用多智能體技術(shù)應(yīng)用還表現(xiàn)在以下方面。一是輸入為訂單系統(tǒng)的動態(tài)調(diào)度:調(diào)度系統(tǒng)的輸入為訂單系統(tǒng)時,輸入的不確定性使得調(diào)度系統(tǒng)的設(shè)計難以采用基于多項式的數(shù)學(xué)建模方法, 而基于多智能體技術(shù)則可降低動態(tài)調(diào)度系統(tǒng)的設(shè)計復(fù)雜度, 提高調(diào)度效率。二是調(diào)度系統(tǒng)的沖突消解:當(dāng)調(diào)度系統(tǒng)內(nèi)設(shè)定為智能體的資源、產(chǎn)品、物料等產(chǎn)生沖突時,可以利用多智能體技術(shù)的沖突消解進(jìn)行調(diào)整。所以基于多智能體技術(shù)的生產(chǎn)調(diào)度系統(tǒng)能夠在系統(tǒng)內(nèi)部約束條件發(fā)生變化時, 更迅速地調(diào)整調(diào)度策略,從這個角度來看,多智能體系統(tǒng)所具有的敏捷性增強了基于多智能體技術(shù)設(shè)計的調(diào)度系統(tǒng)的穩(wěn)定性。三是與工藝和裝配流程的對接與集成:生產(chǎn)調(diào)度與工藝密切相關(guān),調(diào)度系統(tǒng)將各加工資源構(gòu)造為智能體,通過智能體間的通信與協(xié)商,可以完成工藝優(yōu)化并與裝配流程協(xié)同。
傳統(tǒng)生產(chǎn)線一般屬于固定產(chǎn)線,由DCS等控制系統(tǒng)控制,使用工業(yè)通信協(xié)議。進(jìn)入工業(yè)互聯(lián)網(wǎng)時代,機器人、機械臂等在產(chǎn)線的大量使用,以及諸多環(huán)境監(jiān)測、生產(chǎn)監(jiān)測、燈光照明等物聯(lián)網(wǎng)智能終端設(shè)備使得產(chǎn)線設(shè)計更加復(fù)雜,如果企業(yè)進(jìn)行產(chǎn)線智能化升級,更換產(chǎn)線或升級產(chǎn)線的成本巨大。面向生產(chǎn)過程,采用多智能體技術(shù)構(gòu)建基于所有智能體狀態(tài)的分布式控制系統(tǒng),以使處于產(chǎn)線中的機械臂、智能終端等所有智能體的狀態(tài)信息達(dá)到一致,即使用多智能體技術(shù)的一致性機制可在對生產(chǎn)狀態(tài)最小擾動下進(jìn)行產(chǎn)線的智能化升級。多智能體系統(tǒng)的一致性問題在產(chǎn)業(yè)的應(yīng)用廣泛,在無人飛行器協(xié)作追蹤、空中交通的管制、機械臂協(xié)作裝配,無人車巡檢中均有應(yīng)用。
基于多智能體一致性機制的控制系統(tǒng)研究工作主要包括以下三個方面。一是組織形式的構(gòu)建或編隊隊形的設(shè)計:在生產(chǎn)系統(tǒng)中,每個傳感器、機械臂等具有一定功能的自主實體都可看作智能體,在既定的工作目標(biāo)下,通過多智能體技術(shù)基于代數(shù)圖論和矩陣分析原理的二階一致性[4]等可形成高效的組織形式,得到最佳優(yōu)化產(chǎn)線設(shè)計。在多個無人車或無人機編隊?wèi)?yīng)用中體現(xiàn)在實現(xiàn)既定的編隊形態(tài),并通過多智能體間的傳感網(wǎng)絡(luò)與通信機制保證無人車、無人機間信息交換的冗余度和避障機制。二是產(chǎn)線柔性變換或編隊隊形的變換:在機械臂、無人車或無人機在工作或行進(jìn)過程中,能夠適應(yīng)來自系統(tǒng)內(nèi)部或外在環(huán)境干擾,做出適當(dāng)且合理的改變。三是針對外部環(huán)境變化的共識決策:在目標(biāo)或外部環(huán)境改變后,由于最優(yōu)目標(biāo)解的偏移,多智能體系統(tǒng)對通過一致性協(xié)議、完成環(huán)境變化后狀態(tài)全局目標(biāo)再優(yōu)化決策,并達(dá)成任務(wù)分工或資源分配共識,使多智能體系統(tǒng)最終仍能完成后給定的目標(biāo)任務(wù)。
文獻(xiàn)[5]針對無人機編隊飛行的場景,提出了一種基于多智能體技術(shù)的編隊飛行組織形式和一致性算法,并利用多智能體系統(tǒng)的交互作用實現(xiàn)多架無人機的自主編隊飛行。
2.3.1 供應(yīng)鏈以及上下游集群協(xié)同管理
隨著定制化制造的興起,多品種、小批量的生產(chǎn)需求逐漸增多,尤其是在服裝、小商品等快消品行業(yè),定制化已成為常態(tài),但是這種模式混合排產(chǎn)難度大,由于供應(yīng)鏈協(xié)同較差,庫存難以預(yù)測,關(guān)鍵物料的上下游訂單接合常常需要“救火式”加班。在供應(yīng)鏈管理中采用多智能體技術(shù),尤其是針對個性化產(chǎn)品供應(yīng)鏈上下游協(xié)同,將具有自主學(xué)習(xí)能力多智能體技術(shù)引入供應(yīng)鏈報價和物料協(xié)商中,構(gòu)建基于多智能體系統(tǒng)的單目標(biāo)和多目標(biāo)協(xié)商模型,優(yōu)化上下游連接企業(yè)的長供應(yīng)鏈,實現(xiàn)物料、庫存、物流、訂單等的動態(tài)管理, 增強產(chǎn)業(yè)集群對市場的反應(yīng)能力。
2.3.2 多重網(wǎng)絡(luò)的自適應(yīng)管理
多重網(wǎng)絡(luò)協(xié)議在工業(yè)生產(chǎn)中屢見不鮮,利用多智能體技術(shù)一致性協(xié)議、智能體間通信機制等, 通過把網(wǎng)絡(luò)中設(shè)備或功能定義為智能體,可實現(xiàn)多重網(wǎng)絡(luò)的自適應(yīng)管理[6]。
基于智能體的多重網(wǎng)絡(luò)自適應(yīng)管理具有以下特點。一是網(wǎng)絡(luò)具有自主分析和決策能力,對擾動以及擁塞具有較快反應(yīng)能力; 二是智能體間的通信機制使得不同工業(yè)協(xié)議可以在網(wǎng)絡(luò)中進(jìn)行語義交互; 三是可靈活進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)和功能的增刪或規(guī)模的增減。
2.3.3 經(jīng)濟(jì)成本與效益分析
多智能體技術(shù)還可用于實際生產(chǎn)過程中的經(jīng)濟(jì)效益的研究和分析。例如,在政策研究模型中建立市場、企業(yè)、政府等若干類智能體,充分利用了智能體的協(xié)作、交互功能,從微觀企業(yè)以及宏觀市場約束等方面,研究作用于政策后的經(jīng)濟(jì)運行效果。文獻(xiàn)[7]以復(fù)雜自適應(yīng)理論為基礎(chǔ),基于多智能體技術(shù)將可再生能源領(lǐng)域的各方設(shè)定為智能體(用戶、企業(yè)、政府等),對風(fēng)電、光伏發(fā)電電力市場進(jìn)行多智能體系統(tǒng)建模,設(shè)計引入補貼政策,通過分析補貼力度對于風(fēng)力與光伏發(fā)電的競價上網(wǎng)率的影響,得到了可再生能源發(fā)電的最大可發(fā)展的規(guī)模。
當(dāng)前,越來越多的企業(yè)已經(jīng)普遍認(rèn)同數(shù)字化轉(zhuǎn)型的重要性和迫切性。智能化、數(shù)字化讓生產(chǎn)和管理更加敏捷,加快了企業(yè)之間、產(chǎn)業(yè)之間的協(xié)同,提升了企業(yè)的效率和全社會全要素生產(chǎn)率。根據(jù)國家互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)字中國發(fā)展報告(2020年)》[8],我國規(guī)模以上工業(yè)企業(yè)生產(chǎn)設(shè)備數(shù)字化率已經(jīng)達(dá)到了49.4%。隨著工業(yè)數(shù)字化程度的深入,人工智能技術(shù)在企業(yè)生產(chǎn)、管理中的應(yīng)用越來越廣泛,多智能體技術(shù)的規(guī)劃、學(xué)習(xí)、推理、協(xié)商、交互等機制與方法,以及多智能體系統(tǒng)中各智能體間緊密協(xié)同合作又單獨自治的特點,在解決企業(yè)優(yōu)化生產(chǎn)調(diào)度、資源配置、產(chǎn)業(yè)鏈區(qū)域協(xié)同等復(fù)雜實際問題中具有巨大優(yōu)勢。相信未來五到十年,多智能體技術(shù)融合工業(yè)互聯(lián)網(wǎng)的發(fā)展,將在企業(yè)生產(chǎn)管理,服務(wù)型產(chǎn)業(yè)集群高效架構(gòu)組織,物流物資管理等規(guī)模型、集群型復(fù)雜場景中大放異彩。人工智能與工業(yè)互聯(lián)網(wǎng)的融合將會帶動更多的工業(yè)企業(yè)、信息通信企業(yè)、交通物流企業(yè)以及獨立開發(fā)者等形成社會群體式的集群創(chuàng)新,促進(jìn)工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)智能化方向的繁榮發(fā)展,加速全社會的數(shù)字化、網(wǎng)絡(luò)化、智能化的實現(xiàn)。