李若塵,李夢薇
(1.龍崗智能視聽研究院,深圳 518116;2.中國科學技術(shù)信息研究所,北京 100038)
“人工智能”一詞初見于1956年達特茅斯學院夏季研討會,后又經(jīng)歷了邏輯推理、專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、深度學習等幾個重要階段[1]。2012年AlexNet首次擊敗傳統(tǒng)人為特征圖像識別,人工智能的發(fā)展進入了算法、數(shù)據(jù)、算力三輪驅(qū)動的新時代。在海量數(shù)據(jù)和強勁算力的支撐下,人工智能開始賦能各個領(lǐng)域,提升了產(chǎn)業(yè)智能化水平,并為經(jīng)濟高質(zhì)量發(fā)展提供了源源不斷的動力。世界主要國家都在加緊布局人工智能技術(shù)與產(chǎn)業(yè)發(fā)展方向,然而由于人工智能技術(shù)現(xiàn)有的理論、技術(shù)瓶頸,人們距離達到真正意義上的強人工智能還有很長的距離,人工智能的下一個十年去向如何,成為備受矚目的焦點。
人工智能發(fā)展至今歷經(jīng)了三次浪潮,基本思想大致可分為符號主義、聯(lián)結(jié)主義、行為主義,其中符號主義和聯(lián)結(jié)主義的競爭最為激烈。符號主義的代表是邏輯推理、專家系統(tǒng)和知識工程,這一技術(shù)路線統(tǒng)治了早期的人工智能學術(shù)圈。而20世紀80年代,隨著神經(jīng)網(wǎng)絡(luò)的興起,聯(lián)結(jié)主義開始占據(jù)上風。行為主義主要起源于維納等人的控制論學說[2],影響了仿生機器人、強化學習等產(chǎn)品和算法設(shè)計理念。
符號主義理論的發(fā)展誕生了語義網(wǎng)絡(luò)、知識表示、本體論、知識圖譜、認知圖譜等一系列成就。語義網(wǎng)絡(luò)由圖靈獎獲得者蒂姆·伯納斯-李[3]提出,旨在用三元組標簽描述網(wǎng)頁本身,便于被當時的搜索引擎索引。語義網(wǎng)絡(luò)理論的出現(xiàn)引發(fā)了研究人員對知識圖譜的探索。早期知識圖譜將關(guān)系局限為幾種特殊的基本關(guān)系,如“屬性”“導致”“屬于”等,并定義一系列在圖譜上推理的規(guī)則,期望通過在知識圖譜上進行邏輯推理實現(xiàn)智能[4]。然而,早期知識圖譜的思路遇到了許多實際的困難,比如結(jié)構(gòu)解析困難、知識圖譜編輯過程需要大量人工參與、推理規(guī)則無法窮舉等,這些瓶頸一定程度上導致以知識圖譜為代表的符號主義發(fā)展陷入困境。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,2007年Metaweb公司發(fā)布Freebase大型合作知識庫,知識庫中包含大量“機器可讀”的數(shù)據(jù)信息;2010年谷歌收購Freebase,在谷歌的運營下Freebase知識庫得到進一步發(fā)展,并于2016年更名為“谷歌知識圖譜API”,現(xiàn)已成為谷歌搜索引擎的核心知識系統(tǒng)。符號主義的發(fā)展由于結(jié)構(gòu)化的知識難以獲取和復雜問題推理難以實現(xiàn)而一度中斷,但符號主義的最新進展卻為實現(xiàn)知識加數(shù)據(jù)“雙輪驅(qū)動”以及人工智能的可解釋性奠定了基礎(chǔ)。
聯(lián)結(jié)主義理論誕生了感知機模型,進一步演化出神經(jīng)網(wǎng)絡(luò)模型、BP神經(jīng)網(wǎng)絡(luò)。現(xiàn)如今備受矚目的深度學習技術(shù)也源自聯(lián)結(jié)主義。為了證明深度學習的潛力,多倫多大學Hinton課題組于2012年參加ImageNet圖像識別比賽[5],其通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(CNN)AlexNet一舉奪得冠軍[6],且性能遠超第二名支持向量機方法(SVM)。正是由于該比賽,卷積神經(jīng)網(wǎng)絡(luò)進入大眾視野,吸引了眾多研究者的注意。2013、2014、2015、2016年,通過ImageNet圖像識別比賽,深度學習網(wǎng)絡(luò)結(jié)構(gòu)、訓練方法、芯片硬件不斷進步,促使深度學習性能出現(xiàn)爆炸式增長,誕生了ResNet、RNN、LSTM、VGG等眾多網(wǎng)絡(luò)模型。得益于移動端芯片等硬件設(shè)備性能不斷增強,深度學習的產(chǎn)業(yè)化程度得到了前所未有的發(fā)展,成為時下應用最廣的人工智能技術(shù)。
行為主義最早來源于20世紀初的一個心理學流派,行為主義人工智能強調(diào)智能體與周圍環(huán)境的交互與反饋。對行為主義的研究產(chǎn)生了仿生機器人、自主行走機器人等應用,并影響了強化學習理論[7]。強化學習理論與行為主義人工智能有著密不可分的關(guān)系,強化學習的核心是智能體在環(huán)境中怎樣執(zhí)行動作以獲得最大的累計獎勵,也是處理物體與環(huán)境間交互的問題。早在維納的控制論提出之前,研究人員就通過多巴胺的作用機理認識到了獎勵信號與試錯學習的關(guān)系。2013年DeepMind提出DQN深度強化學習算法,2016年基于DQN算法的Alpha Go以4∶1的比分戰(zhàn)勝世界圍棋冠軍李世石。強化學習在圍棋以及游戲競技中取得引人注目的成果,并且在自動駕駛、機器人控制等領(lǐng)域嶄露頭角。行為主義人工智能不僅在各種游戲競技中大放異彩,也影響了擬人機器人訓練、進化算法等領(lǐng)域[8]。
自2015年以來世界各國頻頻出臺與人工智能相關(guān)的國家級戰(zhàn)略,各國政府均對人工智能發(fā)展有著獨特的布局。本章通過探討不同國家的人工智能戰(zhàn)略,試圖厘清人工智能未來的發(fā)展方向。
美國國防高級研究計劃局(DARPA)曾對人工智能發(fā)展歷程從技術(shù)角度進行了詳盡的梳理,并對人工智能發(fā)展的三個階段進行了界定[9]:初代的人工智能基于格式化的規(guī)則和形式,對狹義的任務有較好的推理能力,但由于沒有自我學習或是算法進化的能力,其處理開放性問題時效果較差,因此導致其應用范圍非常有限(典型代表如專家系統(tǒng));第二代人工智能主要基于統(tǒng)計學,這一代的人工智能學者多數(shù)具有較強的統(tǒng)計學背景,如大衛(wèi)·曼福德等人,此時的人工智能系統(tǒng)經(jīng)過大量高質(zhì)量格式化的數(shù)據(jù)訓練,但仍然缺乏可解釋性和基于環(huán)境場景的推理能力,無法適應不斷變化的復雜環(huán)境;第三代人工智能系統(tǒng)將重點突破第一代和第二代人工智能系統(tǒng)的局限性[10],能夠利用情境模型來感知、學習、抽象和推理,并具有很強的適應不同情境的能力[11]。同時美國國防高級研究計劃局還在2018年提出“下一代人工智能計劃”[12],下一代人工智能主要有三個目標:一是增強第二代人工智能技術(shù)的穩(wěn)健性;二是積極將第二代人工智能系統(tǒng)應用于新領(lǐng)域;三是進一步研究第三代人工智能技術(shù)。對此,美國國防高級研究計劃局通過設(shè)立項目加強對“下一代人工智能”的研究,相關(guān)項目包括:“機器常識” “終身學習機”“可解釋人工智能”“可靠自主性”“不同來源主動詮釋”“自動知識提取”“機器通用感知”“利用更少數(shù)據(jù)學習”“以知識為導向的人工智能推理模式”“高級建模仿真工具”“復雜混合系統(tǒng)”“人機交流”“人機共生”等。
2018年,韓國第四次工業(yè)革命委員會審議并通過《人工智能研發(fā)戰(zhàn)略》,旨在重點推廣人工智能技術(shù)進步,并加快人工智能在各領(lǐng)域的創(chuàng)新發(fā)展,打造世界領(lǐng)先的人工智能研發(fā)生態(tài),構(gòu)建可持續(xù)的人工智能技術(shù)能力。2019年12月,韓國發(fā)布《韓國人工智能國家戰(zhàn)略》,繼續(xù)加大對“DNA產(chǎn)業(yè)”即數(shù)據(jù)(Data)、網(wǎng)絡(luò)(Net work)、人工智能(AI)產(chǎn)業(yè)的支持?!稇?zhàn)略》在第4部分行動指南中公布了3個領(lǐng)域的9大戰(zhàn)略與100項任務,分別是“打造世界領(lǐng)先的人工智能技術(shù)能力”“培養(yǎng)人工智能領(lǐng)域高端人才”“構(gòu)建開放合作型人工智能研發(fā)基礎(chǔ)”。其中明確了韓國將要促進機器學習、計算機視覺和智能語音等通用技術(shù)研發(fā),并在10年內(nèi)(2020—2029年)投資1萬億韓元用于人工智能芯片研發(fā)[13]。同時在項目具體實施中會參考借鑒美國國防高級研究計劃局的項目組織方式,根據(jù)技術(shù)與環(huán)境等的變化適時調(diào)整項目目標?!稇?zhàn)略》還明確了加強知識表示與推理、機器學習算法、認知科學等人工智能技術(shù)的研究。
日本政府為確保其在機器人領(lǐng)域的長期優(yōu)勢地位,于2015年發(fā)布《新一代機器人戰(zhàn)略》,該戰(zhàn)略旨在研發(fā)出能夠替代人類甚至超越人類能力水平的人工智能和機器人技術(shù)[14]。《戰(zhàn)略》提出,要加強對“數(shù)據(jù)驅(qū)動與知識驅(qū)動融合型人工智能”以及“類腦智能”的研究,同時指出要研究新型信息處理理論和程序設(shè)計方法,探索兼顧隱私保護和數(shù)據(jù)安全的數(shù)據(jù)獲取方式,進而提出復雜場景下多模態(tài)融合的新一代人工智能框架?!稇?zhàn)略》發(fā)布實施以來,安倍政府不斷增加對機器人及人工智能領(lǐng)域的研發(fā)支持力度,在日本政府公布的2020年預算中,科技振興費同比增加187億日元(1.4%),達到1.356 5萬億日元,人工智能及機器人是該項預算的重點支持內(nèi)容,同年日本發(fā)布《人工智能戰(zhàn)略2019》,強調(diào)了將教育體系的改革和研發(fā)體系的重組放在首位??梢钥闯鋈毡緦θ斯ぶ悄艿牟季质且詸C器人技術(shù)作為依托的,日本曾在20世紀末引領(lǐng)了人工智能“五代機”技術(shù)的發(fā)展,但“五代機”研制失敗,使得日本一度脫離了世界人工智能發(fā)展隊伍。從日本政府近期公布的幾大戰(zhàn)略中可以看出,日本仍然在為沖擊人工智能領(lǐng)軍地位做著準備。
2017年中國政府發(fā)布《新一代人工智能發(fā)展規(guī)劃》[15],《規(guī)劃》明確了中國人工智能技術(shù)發(fā)展的基本原則和戰(zhàn)略目標,指出要加強對大數(shù)據(jù)智能理論、跨媒體感知計算理論、混合增強智能理論、群體智能理論、高級機器學習理論、自主協(xié)同控制與優(yōu)化決策理論、類腦智能計算理論、量子智能計算理論等基礎(chǔ)理論的研究,并重點對知識計算引擎與知識服務技術(shù)、跨媒體分析推理技術(shù)、群體智能關(guān)鍵技術(shù)、混合增強智能新架構(gòu)和新技術(shù)、自主無人系統(tǒng)的智能技術(shù)、虛擬現(xiàn)實智能建模技術(shù)、智能計算芯片與系統(tǒng)、自然語言處理技術(shù)等關(guān)鍵共性技術(shù)加強研究[16]。
日本政府于2015年發(fā)布《新一代機器人戰(zhàn)略》,2017年中國發(fā)布《新一代人工智能發(fā)展規(guī)劃》,2018年美國國防高級研究計劃局發(fā)布“AI Next”計劃,2019年韓國發(fā)布《韓國人工智能國家戰(zhàn)略》。通過提取中美日韓四國發(fā)布的關(guān)于人工智能的戰(zhàn)略文件中與人工智能技術(shù)密切相關(guān)的內(nèi)容,形成表1。
根據(jù)表1所示的內(nèi)容可以看出,中美兩國更加注重對前沿人工智能理論和算法的研發(fā),而日韓更注重利用已有的產(chǎn)業(yè)優(yōu)勢發(fā)展獨具特色的人工智能技術(shù)。中國在人工智能技術(shù)布局上涉及范圍較廣,對新概念芯片、知識推理、自然語言處理等技術(shù)都有所關(guān)注;美國則側(cè)重人工智能的情景推理、可解釋性以及人機互動;日本重點關(guān)注人工智能技術(shù)與機器人技術(shù)融合;韓國傾向于發(fā)展服務于人工智能的半導體產(chǎn)業(yè)。同時可以看出,雖然各國在人工智能技術(shù)布局上的側(cè)重點各不相同,但“知識驅(qū)動”“類腦智能”“可解釋人工智能”卻是各國共同關(guān)注的。
表1 中美日韓人工智能技術(shù)布局
人工智能技術(shù)正在從感知走向認知,從人工編輯特征轉(zhuǎn)向自動理解模式。上一個十年人工智能技術(shù)在智能算法、大規(guī)模算力和海量數(shù)據(jù)的共同驅(qū)動下,完成了波瀾壯闊的發(fā)展。然而,在各項驅(qū)動力趨于瓶頸的今天,人工智能將走向何處?通過上一節(jié)對比各國在人工智能戰(zhàn)略中對技術(shù)發(fā)展的布局可以看出,“知識驅(qū)動”“類腦智能”“可解釋人工智能”是各國普遍關(guān)注的三個人工智能技術(shù)方向。
大數(shù)據(jù)驅(qū)動的深度學習雖然在產(chǎn)業(yè)上取得了較大的發(fā)展,但是其技術(shù)本身已不具備較大的發(fā)展空間。同時,深度學習技術(shù)并不是人工智能研究的全部,張鈸院士指出,未來的人工智能范式應當將知識驅(qū)動與數(shù)據(jù)驅(qū)動二者進行融合。數(shù)據(jù)驅(qū)動的人工智能技術(shù)(暨深度學習技術(shù))往往非常缺乏常識和推理能力,以圖像識別為例,大部分的深度學習系統(tǒng)僅僅只做到了“感”(機械的分類器),而沒有實現(xiàn)“知”即邏輯推理,而人類的智能卻是體現(xiàn)在邏輯推理上[17]。人的智能無法通過單純的大數(shù)據(jù)學習習得,必須要加上知識,使其具有推理能力、決策能力,這樣才能解決“感”而無“知”的問題。通過為人工智能系統(tǒng)構(gòu)建知識庫,增加邏輯推理能力,可以使人工智能系統(tǒng)產(chǎn)生出比單純使用數(shù)據(jù)驅(qū)動更強大的智能。
雖然現(xiàn)有的人工智能技術(shù)在應用上取得了巨大的成功,但是目前人工智能模型下的機器人或智能體仍不具備類似人腦的思維。計算機下圍棋、下國際象棋、玩電子游戲,看似是在模擬人的行為,但事實上機器本身并未具有主動思維的能力,由此可見數(shù)據(jù)智能與機械智能并不是真正的智能,它們只是看上去很像智能的信息處理,與真正的智能還相去甚遠[18]。因此基于深度學習的這一類人工智能技術(shù)只能局限性地解決某一個問題或者某一類問題,它們解決問題的能力完全依賴于人類編寫的程序與數(shù)據(jù)庫。而未來人工智能的發(fā)展不應僅僅停留在數(shù)據(jù)智能層面,而是應該用機器模擬人的大腦與思維,讓機器像人一樣擁有主動性思維。
時下大熱的人工智能模型所采用的人工神經(jīng)網(wǎng)絡(luò)被稱作第二代神經(jīng)網(wǎng)絡(luò),來源于聯(lián)結(jié)主義的感知機模型(第一代)。盡管這種神經(jīng)網(wǎng)絡(luò)已經(jīng)讓我們在很多領(lǐng)域的應用中實現(xiàn)了突破,但它們在生物學上是不精確的,尤其是尚不能模仿正常生物體大腦中神經(jīng)元的運作機制。更加接近神經(jīng)元模型的是第三代神經(jīng)網(wǎng)絡(luò)——脈沖神經(jīng)網(wǎng)絡(luò)[19],脈沖神經(jīng)網(wǎng)絡(luò)與目前流行的機器學習方法以及神經(jīng)網(wǎng)絡(luò)有很大不同,它具有更加扎實的生物基礎(chǔ),對人腦的模擬程度更高。
脈沖神經(jīng)網(wǎng)絡(luò)技術(shù)是實現(xiàn)類腦智能的方法之一,同時,類腦智能也可以使用基于硬件芯片的方式進行模擬,這種芯片稱為擬態(tài)神經(jīng)芯片。2017年,IBM開發(fā)的TureNorth芯片可以完成對640萬神經(jīng)元的模擬;2019年,Intel開發(fā)的Loihi將這一數(shù)據(jù)提高到800萬。人類的大腦皮質(zhì)中包含有約140~160億神經(jīng)元,小腦中包含大約550~700億神經(jīng)元,芯片對大腦的模擬還遠遠不足,然而脈沖神經(jīng)網(wǎng)絡(luò)和擬態(tài)神經(jīng)芯片的出現(xiàn)已經(jīng)為未來人工智能的發(fā)展指出了新的方向。
隨著人工智能技術(shù)的廣泛應用,其中所包含的缺陷與不足也逐漸顯露出來,復雜算法、模型以及系統(tǒng)普遍缺乏決策邏輯和透明度,算法對產(chǎn)生的結(jié)果缺乏有力的解釋與證明,種種問題導致人工智能技術(shù)難以在國防、金融、醫(yī)療等關(guān)鍵領(lǐng)域深入應用。
要實現(xiàn)人工智能的可解釋性,可以從人工智能早期符號主義學派的知識工程理論著手。知識工程包括知識的獲取、表達和推理,其本質(zhì)是對數(shù)據(jù)的結(jié)構(gòu)化,將數(shù)據(jù)轉(zhuǎn)化為利于計算機處理的結(jié)構(gòu)化知識。通過知識工程構(gòu)建知識庫,再結(jié)合推理機,就可以構(gòu)建出一個專家系統(tǒng)。專家系統(tǒng)對問題的解答以及其本身的決策行為遵守嚴格的演繹推理邏輯,具有較強的可解釋性。
基于知識工程的邏輯推理對人工智能的可解釋性有一定幫助,但并不適用于基于數(shù)據(jù)驅(qū)動的深度學習系統(tǒng)。對此,加州大學洛杉磯分校(UCLA)朱松純教授提出以人為本的人工智能模型(Human-Centric Model,HCM)[20],該模型旨在令人工智能的決策和推理可解釋、值得信任。HCM借鑒了人類學習和推理中的幾種主要解釋方法,早期研究表明,解釋性可以來自功能角度(即目標)和機制角度(即過程)。朱教授的研究組合了來自兩種不同角度的解釋性,他在一項訓練機器人打開一個擁有多個安全鎖機制的藥瓶的實驗中,設(shè)計了一個符號規(guī)劃器和一個觸覺預測器,符號規(guī)劃器通過可視化學習人類打開藥瓶的過程,從動機上給出每一次決策的解釋性;觸覺感受器基于上一步操作的結(jié)果,從功能角度給出解釋性。該實驗給出了產(chǎn)生解釋性的另一種方法,即模擬人的行為方式。但由于當時并不存在可解釋性的統(tǒng)一標準,這種方法是否適用于更加廣泛的領(lǐng)域還有待進一步研究。
2020年8月,美國國家標準與技術(shù)研究院發(fā)布了《可解釋人工智能四項原則草案》[21],給出了人工智能可解釋性的官方定義,《草案》包括解釋原則、有意義原則、解釋準確性原則和知識局限性原則,同時針對不同的場景給出了五類解釋:一是闡述與用戶相關(guān)的人工智能系統(tǒng)的輸出信息的用戶有益解釋,二是提高社會對人工智能系統(tǒng)的信任和接受程度的社會可接受解釋,三是用來協(xié)助審核人工智能系統(tǒng)是否符合相關(guān)的法規(guī)和安全標準的監(jiān)管合規(guī)解釋,四是用來幫助和提升人工智能算法和系統(tǒng)的開發(fā)、改進、調(diào)試和維護的系統(tǒng)開發(fā)解釋,五是用于使人工智能系統(tǒng)運營者獲益的所有者有益解釋?!恫莅浮窞樘剿魅斯ぶ悄芸山忉屝蕴峁┝艘惶捉y(tǒng)一的標準,為在關(guān)鍵領(lǐng)域應用人工智能提供了檢驗和評判標準。
人工智能的發(fā)展自達特茅斯會議后歷經(jīng)70余年,這70余年間人工智能有過高潮也遇到過低谷。隨著深度學習技術(shù)的出現(xiàn)以及數(shù)據(jù)、芯片等外部支撐的不斷發(fā)展,人工智能技術(shù)在最近10年中再次展現(xiàn)出它驚人的一面。然而數(shù)據(jù)和算力資源的發(fā)展終將接近頂峰,人工智能也會再一次走到十字路口。人工智能未來的技術(shù)布局關(guān)乎本輪人工智能的發(fā)展前景,也關(guān)乎我國人工智能發(fā)展戰(zhàn)略目標的實現(xiàn)。
習近平總書記在《關(guān)于〈中共中央關(guān)于堅持和完善中國特色社會主義制度 推進國家治理體系和治理能力現(xiàn)代化若干重大問題的決定〉的說明》中強調(diào),要更加重視運用人工智能大數(shù)據(jù)等現(xiàn)代信息技術(shù)手段提升治理能力和治理現(xiàn)代化水平。人工智能技術(shù)已成為治國理政的重要手段,因此發(fā)展好人工智能要統(tǒng)籌考慮以下幾個方面。
一是要兼收并蓄,充分吸收他國經(jīng)驗作為我國發(fā)展人工智能的重要參考。我國人工智能雖然近些年發(fā)展快速,但是起步晚于美日英等國,參考歐美發(fā)達國家在人工智能領(lǐng)域的先進經(jīng)驗有助于我國明確人工智能技術(shù)路線選擇,在進一步發(fā)展人工智能產(chǎn)業(yè)時少走彎路。
二是加強企業(yè)聯(lián)系,形成人工智能攻堅克難的一股合力。中國人工智能企業(yè)眾多,但相對分散,應大力支持現(xiàn)有的人工智能產(chǎn)業(yè)聯(lián)盟,以聯(lián)盟為紐帶加強企業(yè)間的聯(lián)系,制定統(tǒng)一的標準,構(gòu)建開源開放數(shù)據(jù)庫,形成協(xié)同共享的發(fā)展局面,以此來強化人工智能領(lǐng)域的核心力量。
三是加大開放力度,吸引海內(nèi)外人才。歐美等國普遍在海外設(shè)立有人工智能研究機構(gòu),且本土吸引海外人工智能人才的能力較高。我國應當進一步增強開放力度,吸引海外人才來華從事人工智能研發(fā)工作;鼓勵企業(yè)設(shè)立海外研發(fā)中心,網(wǎng)羅海內(nèi)外人才。
四是要發(fā)展與治理并重。要積極編制人工智能倫理準則,嚴格遵守現(xiàn)行法律法規(guī),杜絕人工智能技術(shù)對社會發(fā)展可能產(chǎn)生的負面影響。在國際社會積極發(fā)出中國聲音,為中國人工智能企業(yè)出海打好基礎(chǔ)。抵制西方媒體對中國人工智能的肆意抹黑和“妖魔化”,讓西方國家了解中國人工智能發(fā)展理念是發(fā)展與治理并重。