楊雪
近日,由北京大學(xué)人工智能研究院和北京通用人工智能研究院聯(lián)合組成的科研團(tuán)隊(duì)完成最新研究成果——“人類水平的小樣本概念學(xué)習(xí)”,并在國際頂級學(xué)術(shù)期刊《科學(xué)·進(jìn)展》發(fā)表論文。這一成果首次讓AI系統(tǒng)在沒有大數(shù)據(jù)訓(xùn)練的情況下,像人類一樣通過概念學(xué)習(xí)和邏輯推理的方式完成任務(wù),并在經(jīng)典智商測試中戰(zhàn)勝了高智商人類選手。這是由我國科學(xué)家獨(dú)立完成,并在國內(nèi)實(shí)現(xiàn)的AI高水平研究成果,標(biāo)志著中國在邁向通用AI的道路上更進(jìn)一步。
那么,與當(dāng)前主流AI相比,小樣本AI有何不同與優(yōu)勢?
當(dāng)前,廣泛應(yīng)用的AI系統(tǒng)主要以海量數(shù)據(jù)為基礎(chǔ),利用大量算力和存力資源進(jìn)行數(shù)據(jù)搜索,其核心范式是深度學(xué)習(xí)。這類AI在數(shù)據(jù)擬合和感知層面取得了顯著進(jìn)展,催生了ChatGPT等一批生成式AI應(yīng)用。它們能寫詩作畫、為人答疑解惑,甚至可以協(xié)助藥物開發(fā)。
然而,在擁有這些能力的同時,AI卻無法準(zhǔn)確理解因果關(guān)系等邏輯問題。這是因?yàn)槟壳昂芏郃I以大數(shù)據(jù)和深度學(xué)習(xí)為核心范式,十分依賴數(shù)據(jù)數(shù)量和標(biāo)注質(zhì)量,無法對問題進(jìn)行快速、準(zhǔn)確、細(xì)致的推理。尤其是面對數(shù)據(jù)匱乏或僅有少量數(shù)據(jù)和抽象概念等情況,目前的AI更是無能為力。
北京大學(xué)人工智能研究院助理教授朱毅鑫解釋,目前很多AI大模型是對數(shù)據(jù)的擬合,其“記憶力”很強(qiáng),但遷移泛化能力有限?!熬秃帽日f,如果它之前見過A、B,那么下次再見到A、B,它能認(rèn)識,甚至見到與之類似的A′、B′它也能認(rèn)識。但如果見到的是C,它就認(rèn)不出來了。”朱毅鑫說。
北京通用人工智能研究院研究員張馳認(rèn)為,目前大多數(shù)AI以大數(shù)據(jù)和深度學(xué)習(xí)為核心范式,效率較低、成本較高。出于成本考量,在算力和高質(zhì)量數(shù)據(jù)緊缺的背景下,這種范式難以真正實(shí)現(xiàn)通用AI。
那么,是否存在另外一種人工智能范式,較好地解決上述問題?聯(lián)合科研團(tuán)隊(duì)另辟蹊徑,借鑒了北京大學(xué)人工智能研究院教授朱松純在20世紀(jì)90年代提出的最大最小熵思路。他們將問題化為易于求解的優(yōu)化問題,并將其描述為概率條件下的熵限制問題。利用這種思路,聯(lián)合科研團(tuán)隊(duì)讓機(jī)器快速迭代和建模,獲得了既容易得到又具可解釋性的問題解決模型。
在朱毅鑫看來,小樣本是邁向通用AI的另一路徑。小樣本的“小”并不是不需要數(shù)據(jù),而是希望通過提高數(shù)據(jù)利用率,實(shí)現(xiàn)舉一反三?!熬秃妥隹谒阋粯樱悴豢赡馨阉械念}都練一遍。但學(xué)會基本原理后,就能觸類旁通?!敝煲泠握f,小樣本AI有著較為廣泛的應(yīng)用前景,如可應(yīng)用于醫(yī)療、航空航天等樣本較少或幾乎沒有樣本的場景。