張勤
如果將達特茅斯會議作為人工智能(AI)誕生的標志的話,我正好與AI 同歲。但是,迄今為止,國際上對AI 是什么仍眾說紛紜。比較有共識的似乎是對AI 的代際劃分,即第一代AI 是基于知識的,第二代AI 是基于數(shù)據(jù)的。而現(xiàn)在,大家正在開啟對第三代或新一代AI 的研究。但要弄清楚新一代AI 的特征,首先必須搞清楚第一代和第二代AI 存在的問題。
我認為,第一代AI 之所以不夠成功,主要問題有三個:第一,其知識是以規(guī)則的形式表達的,因而是碎片化的,盡管有一套格式,但很難說是一個嚴謹?shù)目茖W體系,更像是一種實用技術。然而,沒有嚴謹?shù)目茖W理論支撐的技術是走不遠的。第二,缺乏嚴謹?shù)牟淮_定性表達和推理算法?,F(xiàn)實世界絕大多數(shù)都有不確定性,只有證明數(shù)學定理等少數(shù)情況無不確定性。顯然,沒有嚴謹?shù)奶幚聿淮_定性的算法限制了第一代AI 的應用。第三,追求通用AI(AGI),將目標定得過于寬泛,要求其像人一樣能夠學習、識別、分析、歸納、推理、感知等,是不現(xiàn)實的。
第二代AI基于大數(shù)據(jù)機器學習,能夠有效應對不確定性,其代表是深度學習(DL)模型。主要問題也有三個:第一,由于DL 的本質是數(shù)據(jù)擬合,模型缺乏可解釋性。對很多應用而言,沒有可解釋性就難以可信和應用。例如疾病診斷,要綜合患者的癥狀、體征、實驗室檢查、影像學檢查,以及性別、年齡、病史等各種信息,根據(jù)彼此的關系才能下診斷結論,而且結論只能由作為用戶的醫(yī)生下,由醫(yī)生承擔責任,否則會出現(xiàn)很多法律問題。這就需要AI 可解釋,包括計算結果可解釋(怎么算出來的)、計算模型可解釋(能理解)、計算方法可解釋(物理意義清晰)。然而數(shù)據(jù)擬合是一種黑箱方法,從原理上就不具備可解釋性。第二,依賴數(shù)據(jù)獨立同分布假設。這里的同分布不僅指訓練集與測試集之間,而且指訓練和測試集與真實應用場景之間,都要同分布。但很多情況不符合這一假設。例如基層醫(yī)療機構診病的數(shù)據(jù)樣本空間與用于DL 模型訓練和測試的數(shù)據(jù)集(三甲醫(yī)院病歷)的樣本空間就不同,導致泛化問題。第三,與第一代AI 一樣,追求AGI,想用一個模型解決所有問題,但結果往往不佳。事實上,由于開放式問題的模式不可窮盡,總有擬合不到的。這就為其應用懸了一把達摩克利斯之劍。這也是當前自動駕駛所面臨的困境。至于數(shù)據(jù)獲取難、清洗加工難、保護隱私難、數(shù)據(jù)產(chǎn)權難、訓練能耗大等非技術問題,就不在這里討論了。
事實上,計算機只能執(zhí)行人事先設定的程序(包括算法和數(shù)據(jù)),不具有真正意義上的智能,至少目前如此。就某個具體問題而言,用人設定的計算機程序來代替人解決問題是完全可能的,并且其表現(xiàn)往往超過人(例如AlphaGo 戰(zhàn)勝李世石)。一旦應用超越了事先設定的計算機程序所要解決的問題的邊界(例如用AlphaGo 下以前沒有見過的半個棋盤或兩倍棋盤的圍棋),就很難保證AI 仍有上佳表現(xiàn),但人卻可以舉一反三。在當前人們對生物腦知之甚少的情況下,在尚未解決自我意識是什么和怎樣產(chǎn)生的情況下,用計算機模擬人這樣的生物腦很難,因為要模擬的對象是什么不清楚。一個顯著的區(qū)別是:人能夠通過自我意識理解事物,而計算機沒有自我意識,也理解不了事物(缺少理解主體)。從這個意義上講,學習(Learning)這個詞用在計算機上是不恰當?shù)?。擬合(Fitting)更準確,但不夠吸睛。
我的看法是:當前AI 應著力研究兩個領域:第一,研究生物腦的工作機理,這主要是醫(yī)學和生物學的事情,以及相關學科的事情(例如生物電鏡)。第二,研究能解決具體問題的AI 模型,無論其基于知識還是基于數(shù)據(jù),不一味追求AGI。不同領域有不同需求,從而適用不同模型。例如人臉識別,無所謂可解釋還是黑箱,即使有一定錯誤率也問題不大,這時用深度學習模型就很好。當然還要在現(xiàn)有基礎上精進。對于診?。ú恢皇强雌蚣膊『Y查)和工業(yè)系統(tǒng)故障診斷來說,沒有可解釋性的模型是不可信,因而也不宜用的;基于知識的模型(當然要系統(tǒng)化和具備處理不確定性的能力)才是可信和可用的,大數(shù)據(jù)學習并非必由之路。事實上,核電站幾乎沒有可供學習的故障數(shù)據(jù),但要求AI 能夠診斷從來沒有出現(xiàn)過的故障。對核電站操作員的要求也相同,所以這一要求并不過分。
歸納一下:新一代AI 要有可解釋性,不依賴或少依賴數(shù)據(jù)獨立同分布,知識應系統(tǒng)化,能夠處理不確定性,基于數(shù)據(jù)或知識或兩者均可,但未必通用。
我對AI 的定義是:AI 是一門科學技術,將由人類智能解決的問題轉化為由人造機器來解決。這里首先要明確所解決的問題是不是智能問題。如果是,且由機器來解決,就是AI。適合于解決本領域智能問題的模型就是強AI 模型,與其是否通用無關。