郭毅可
人們對(duì)人工智能的發(fā)展抱有很大期望,實(shí)際上人工智能的發(fā)展才剛剛開(kāi)始,有許多重要的問(wèn)題需要研究。從這個(gè)意義上來(lái)說(shuō),更需要用冷靜的頭腦思考它的發(fā)展方向,來(lái)考慮一些根本性的問(wèn)題。
人工智能的發(fā)展必須有三個(gè)方向的合力支撐,一是高質(zhì)量的數(shù)據(jù)資源,即通常所說(shuō)的大數(shù)據(jù)為基礎(chǔ);二是處理數(shù)據(jù)非常好的學(xué)習(xí)算法;三是支撐算法的強(qiáng)大算力。
那么,怎么獲得所需大數(shù)據(jù),就需要有一個(gè)很好的基礎(chǔ)架構(gòu),也就是需要有一個(gè)很好的數(shù)據(jù)生態(tài)環(huán)境,數(shù)據(jù)資產(chǎn)化技術(shù),以及飛速發(fā)展的區(qū)塊鏈技術(shù)。
如何把人工智能運(yùn)用到實(shí)際過(guò)程中去,用到生活中去?中間則需要一個(gè)非常重要的能力——交互能力。在人和機(jī)器交互的時(shí)候,不同于人與人的交流,需要有新的形式,這也是支撐人工智能發(fā)展的一個(gè)重要因素。如果不重視這個(gè)因素,那么人工智能的發(fā)展就不可能健康,也很難取得進(jìn)步。
從認(rèn)知學(xué)角度看機(jī)器學(xué)習(xí)
所謂的機(jī)器學(xué)習(xí)就是機(jī)器獲得知識(shí)的能力,談到機(jī)器學(xué)習(xí)的進(jìn)步與演變,前面說(shuō)了三個(gè)方向,數(shù)據(jù)量、算法越來(lái)越豐富,還有就是算力越來(lái)越強(qiáng)大。這三個(gè)方向同時(shí)作用,導(dǎo)致了今天獲取知識(shí)的方式,從手工獲取不需要數(shù)據(jù)量,到可以向機(jī)器描述一些邏輯規(guī)則,把知識(shí)直接告訴它們。還有一方面是中數(shù)據(jù)量,來(lái)進(jìn)行機(jī)器學(xué)習(xí),建立一些中等數(shù)據(jù)量的模型。最后是數(shù)據(jù)挖掘,一直到深度學(xué)習(xí),主要是靠大數(shù)據(jù)量、一個(gè)比較復(fù)雜的算法、超強(qiáng)的計(jì)算能力來(lái)支撐的。其中很重要的一點(diǎn),就是知識(shí)獲取的自動(dòng)化程度越來(lái)越高。
對(duì)于機(jī)器學(xué)習(xí)有很多說(shuō)法,也有很多數(shù)學(xué)模型,但是說(shuō)到底,機(jī)器學(xué)習(xí)和人腦學(xué)習(xí)的基本邏輯和基本過(guò)程是類(lèi)似的。首先通過(guò)觀察來(lái)獲得信息,也就是觀察結(jié)果數(shù)據(jù),知識(shí)是通過(guò)模型來(lái)表達(dá)的。人腦里的知識(shí)也是一種模型,對(duì)世界的看法,通過(guò)觀察獲得抽象看法。在這樣的模型中,做什么事情呢?對(duì)這個(gè)世界要做學(xué)習(xí)判斷。如果說(shuō)我們觀察到的和大腦得出的判斷或者說(shuō)某種預(yù)測(cè)相一致的話,這個(gè)時(shí)候就認(rèn)為模型是正確的,不需要做太多的動(dòng)作,只是得到一些驗(yàn)證。但是如果說(shuō)這個(gè)模型和觀察不準(zhǔn)確,就會(huì)出現(xiàn)所謂的預(yù)測(cè)誤差,這個(gè)預(yù)測(cè)誤差會(huì)導(dǎo)致人做出幾件事情。第一件事情要改變模型:相信觀察是正確的,于是就要對(duì)模型做一些變化。還有一種可能,就是認(rèn)為模型是怎么樣的,要做什么改變,這個(gè)不一致就導(dǎo)致了我們對(duì)這個(gè)世界要做一些改變,改變認(rèn)知是學(xué)習(xí),改變世界是行動(dòng),這就是認(rèn)知學(xué)對(duì)機(jī)器學(xué)習(xí)的理解。
機(jī)器學(xué)習(xí)的表達(dá)形式找到效用函數(shù)
我們?cè)诖竽X當(dāng)中有表達(dá)形式,在現(xiàn)在的機(jī)器學(xué)習(xí)上,表達(dá)模型的形式基本上就是一個(gè)函數(shù),也就是說(shuō)學(xué)習(xí)的目的是找到這樣一種函數(shù)。這個(gè)函數(shù)使得結(jié)果和觀察比較一致,這就表達(dá)為一個(gè)公式,誤差最小化。學(xué)習(xí)的目的一個(gè)是找到函數(shù)的形式,一個(gè)是找到函數(shù)的參數(shù)。不管學(xué)習(xí)是什么樣的,工作的目標(biāo)都是一致的,就是找到這樣一個(gè)模型。所以說(shuō),學(xué)習(xí)是一種過(guò)程。
現(xiàn)在,我們就要問(wèn)幾個(gè)問(wèn)題,在這樣的學(xué)習(xí)框架下,如何向機(jī)器表達(dá),反過(guò)來(lái)講就是剛才所說(shuō)的一個(gè)很重要的前提,要用機(jī)器表達(dá)學(xué)習(xí)的目的,可以用一個(gè)效用函數(shù)來(lái)表達(dá),要么最大化要么最小化。一個(gè)函數(shù)A可能是一個(gè)參數(shù),或者說(shuō)是一種行為,或者說(shuō)是強(qiáng)化學(xué)習(xí),如果是一般性就是一個(gè)參數(shù)。在已獲取這個(gè)參數(shù)的情況下,確定一個(gè)X概率,要求平均的損失是最大或最小。如果收益最大,首先要去確定一些參數(shù),目標(biāo)參數(shù)體現(xiàn)平均損失和平均收益是最大還是最小。如果損失最小,則收益最大。這個(gè)時(shí)候要求函數(shù)和觀察之間的誤差最小,強(qiáng)化學(xué)習(xí)就要求最大,強(qiáng)度最高,對(duì)于不同的行為要求平均的獎(jiǎng)勵(lì)是最高的。這就是效率。
人如果要求機(jī)器做得更多的話,不僅要達(dá)到最好的結(jié)果,同時(shí)要滿足一定的倫理要求,這樣的話用這樣的效率函數(shù)來(lái)表達(dá)是非常不容易的。
效用函數(shù)求優(yōu)
找到最大或者最小的參數(shù),先不講求優(yōu)的過(guò)程,未必能找到最優(yōu)的結(jié)果,可以用算法來(lái)保證。第二個(gè)問(wèn)題在于這樣的模型,因?yàn)閿?shù)據(jù)觀察的弊端改變,實(shí)際上這種模型需要遷移,也就是說(shuō)模型本身需要不斷變化,這個(gè)時(shí)候就有一個(gè)很大的問(wèn)題,就是模型的進(jìn)化,數(shù)據(jù)變化之后能不能優(yōu)化。還有一個(gè)很大的問(wèn)題,求優(yōu)的過(guò)程是學(xué)習(xí)的過(guò)程,這樣的過(guò)程往往是很難理解的,求優(yōu)時(shí)候的含義我們并不清晰,所以怎么辦,為了求優(yōu),必須調(diào)整參數(shù)。這些調(diào)參,怎么樣改變,有點(diǎn)像煉金術(shù),我們并不知道,這些都是會(huì)導(dǎo)致很大的問(wèn)題,首先第一個(gè)模型是不是可以進(jìn)化,第二個(gè)這個(gè)學(xué)習(xí)過(guò)程是不是能夠被解釋?zhuān)@些都是很重要的問(wèn)題。
機(jī)器行為
這個(gè)行為是指人對(duì)機(jī)器的感知,這時(shí)就有很多問(wèn)題,比如說(shuō)機(jī)器和人一起診斷看病,這是對(duì)行為的一個(gè)很大的要求,要行為能夠解釋?zhuān)覀兡軌蝌?yàn)證正確性。行為與決斷是不是正確,為什么我要相信你,還有一個(gè)很重要又特殊的軍事應(yīng)用,怎么樣保證整個(gè)操作,什么時(shí)候可以開(kāi)槍?zhuān)裁磿r(shí)候必須考慮到平民傷亡等,這些都是非常重要的行為準(zhǔn)則。
講到機(jī)器行為,我們可以稍微做一個(gè)抽象的解釋?zhuān)葱袨樗囊亍?/p>
一是行為的目的。是不是能夠按照人的意圖去改變周?chē)沫h(huán)境,這個(gè)非常重要。也就是說(shuō)你的目的是好的還是壞的,是合理的還是不合理的。
二是行為的原則。做事情的基本原則,你知道什么是錯(cuò)的,什么是不能做的,是不能違背人類(lèi)倫理和規(guī)范的。
三是行為的結(jié)果。結(jié)果是不是你應(yīng)該做的事情。
四是行為的依據(jù)。你得出來(lái)的結(jié)果是為什么得出這樣的結(jié)果,根據(jù)是什么。
機(jī)器學(xué)習(xí)應(yīng)用的倫理思考
政治。撰寫(xiě)一個(gè)新聞,原則是不是可以被理解,這個(gè)原則是不是合理的,怎么對(duì)新聞的生成算法有可靠性。還有就是法律,如果機(jī)器人對(duì)一些案例做一些機(jī)器判斷,有沒(méi)有偏見(jiàn),是否有不可預(yù)測(cè)的后果,也就是說(shuō)實(shí)際上這樣的投放會(huì)導(dǎo)致什么問(wèn)題,原來(lái)犯罪率很低的問(wèn)題犯罪率高起來(lái)怎么辦?
營(yíng)銷(xiāo)。推薦系統(tǒng)要考慮對(duì)消費(fèi)者的損害。有一個(gè)說(shuō)法是過(guò)于泡沫。一直向我推薦我喜歡的,于是乎就形成了一個(gè)泡沫,我只喜歡原來(lái)喜歡的東西,我自己給自己構(gòu)造了一個(gè)局限,這種事情是不是合理。
金融。算法定價(jià)的原則是什么,是價(jià)格公平嗎?還是說(shuō)競(jìng)爭(zhēng),是否會(huì)造成惡性競(jìng)爭(zhēng)或者價(jià)格戰(zhàn)?我們都知道買(mǎi)飛機(jī)票都有一個(gè)算法定價(jià)問(wèn)題,因?yàn)樗惴ǘ▋r(jià)常常會(huì)造成一個(gè)很大的矛盾,看到下雨了需要打車(chē),某種程度上來(lái)講,是商業(yè)利益最大化,倫理上是不是正確?這些都是很重要的必須考慮的問(wèn)題。
智能汽車(chē)。真正要投入使用,倒不是技術(shù)難點(diǎn),加上自動(dòng)駕駛最大的問(wèn)題是路權(quán)選擇,誰(shuí)有權(quán)用這個(gè)道路。如果兩輛車(chē)一起開(kāi),必須保證對(duì)人的傷害最小,如果說(shuō)人和機(jī)器在同一個(gè)路上的話,人知道有一個(gè)基本原理,可以惡性和機(jī)器進(jìn)行較量,這樣的話車(chē)永遠(yuǎn)開(kāi)不了。這種情況下怎么解決路權(quán)選擇的問(wèn)題,人開(kāi)的車(chē)和機(jī)器開(kāi)的車(chē)怎么做路權(quán)選擇。城市管理不可能缺少道路交通管理,這些方面的平衡,人工智能怎么來(lái)做,也是一個(gè)非常重要的話題。
機(jī)器診斷。診斷是否可以驗(yàn)證,健康監(jiān)護(hù),各種錯(cuò)誤的代價(jià),對(duì)于緊急情況如何做應(yīng)對(duì),這些都是很大的問(wèn)題。
社會(huì)信用體系與社會(huì)交流。信用低的人被剝奪權(quán)利,是不是在管理中是真正合法的?如果說(shuō)真的做交流的話,未必改變社會(huì)關(guān)系的組成架構(gòu)。聊天及其對(duì)聊天者的心理影響、機(jī)器人是否會(huì)改變?nèi)祟?lèi)的自然感情,這些問(wèn)題都是我們理解機(jī)器行為的非常重要的一些例子。
機(jī)器學(xué)習(xí)的對(duì)與錯(cuò)
這可以從兩個(gè)方面來(lái)看。一是如何向機(jī)器表達(dá)對(duì)的目的,也是未來(lái)的重要問(wèn)題。未來(lái)的人工智能,我們不求讓機(jī)器做得多,而是要求機(jī)器做得對(duì)。做得多應(yīng)該是相對(duì)容易的,但是要機(jī)器做得對(duì),就不那么容易了。什么是要遵守的行為原則,如何向機(jī)器表達(dá)對(duì)的目的,告訴他怎么去做事情,怎么準(zhǔn)確有效告訴,怎么清晰告訴,也就是如何傳達(dá)真實(shí)意圖,這是一個(gè)方面的問(wèn)題。二是如何判斷機(jī)器做得對(duì)不對(duì)。假定說(shuō)已經(jīng)做到清楚表達(dá),以前的結(jié)果和現(xiàn)在的結(jié)果會(huì)有一個(gè)驗(yàn)證。理解機(jī)器做得對(duì)的緣由,機(jī)器行為的解釋和驗(yàn)證,都需要論證。
那么,如何從兩個(gè)方面去理解呢?這需要做以下判斷。
什么是對(duì)
這是最困難的,它涉及人工智能的倫理問(wèn)題,或者說(shuō)是一個(gè)哲學(xué)問(wèn)題。這其中有很多的原則,因?yàn)閷?duì)于什么是對(duì)的,在不同的社會(huì)環(huán)境和價(jià)值體系中是不一樣的。但原則上,首先是要有利他主義,什么意思呢?不是利己,是幫助人類(lèi),而不是有益于自己;第二是謙遜法則,這需要把人類(lèi)價(jià)值最大化,人類(lèi)價(jià)值到底是什么可以有不同理解,但底線是不能夠凌駕于人類(lèi)之上;第三是學(xué)習(xí)能力,不僅是自身學(xué)習(xí),也可以觀察人類(lèi)來(lái)進(jìn)行學(xué)習(xí),或者說(shuō)用機(jī)器語(yǔ)言來(lái)間接學(xué)習(xí)知識(shí)和數(shù)據(jù)。
如何表達(dá)對(duì)
什么樣的效用函數(shù)可以表達(dá)我們的目的,這是指模型形態(tài),而不是指控制行為方式。效用函數(shù)是合理的或者說(shuō)有效的方式嗎?用一個(gè)效用函數(shù)來(lái)做人工智能,怎么衡量一個(gè)行為,怎么定義這個(gè)行為,人工智能是怎樣理解的?通常所說(shuō)的最大自由化是好現(xiàn)象嗎?每個(gè)個(gè)體的最大自由化就是無(wú)政府主義了。驗(yàn)證相關(guān)函數(shù)的證據(jù)是什么?機(jī)器行為可以用效用函數(shù)來(lái)完全確定嗎?經(jīng)濟(jì)學(xué)有兩個(gè)重要研究:一個(gè)是代理人原則。機(jī)器人代理了我們的事情,找任何代理人的時(shí)候都碰到一個(gè)矛盾,要確定這個(gè)代理人是以你的利益最大化為原則,還是以自己的利益最大化為原則。比如說(shuō)我們找律師,這個(gè)律師到底是為我打官司,還是想把問(wèn)題搞的更復(fù)雜一點(diǎn)。另有一個(gè)是不可預(yù)知原則,你表達(dá)的事情是好事情,但是往往得到不想要的結(jié)果。這兩個(gè)原則都使得我們要認(rèn)真思考,如何向機(jī)器表達(dá)我們的真實(shí)意圖。
如何判斷機(jī)器的正確度
第一個(gè)驗(yàn)證方法就是看目標(biāo)是否一致,另一個(gè)是求得最優(yōu)。
這其中存在兩個(gè)場(chǎng)景,如果以?xún)蓷l曲線來(lái)表達(dá),一個(gè)是更精確,另一個(gè)是敏感度更高。這兩個(gè)并不是一個(gè)事情,有一個(gè)是假定模型。這個(gè)模型很有意思,有哮喘的肺炎患者,死于肺炎的可能性較小,這合理嗎?不合理。如果有哮喘應(yīng)該死亡率高,為什么反而低了。因?yàn)橛邢芸炀蜁?huì)受到正常的照顧,這樣的話反而容易生存,所以說(shuō)數(shù)據(jù)不足。這就可以解釋?zhuān)瑸槭裁?0%的AI結(jié)構(gòu)都是沒(méi)有經(jīng)過(guò)驗(yàn)證的。
現(xiàn)有的深度學(xué)習(xí)模型不能向用戶(hù)解釋其行為,設(shè)計(jì)者也無(wú)法理解其行為過(guò)程。其中有很多研究,有一些早期的工作,比如說(shuō)現(xiàn)在要應(yīng)用一個(gè)深度神經(jīng)網(wǎng)絡(luò),去判斷這是什么動(dòng)物。但是有一個(gè)很大問(wèn)題,在學(xué)習(xí)一個(gè)模型之后,給出斑馬圖形,可能就判斷出行分布。這個(gè)時(shí)候怎么來(lái)學(xué)習(xí),把一些圖片特征編碼,明確每一段編碼或者數(shù)字代表了什么含義,這樣就可以通過(guò)一個(gè)學(xué)習(xí)方法,把人的特征一起進(jìn)行學(xué)習(xí)。這就有一個(gè)很大的好處,等于做了人的標(biāo)注。如果說(shuō)這些過(guò)程最重要的原則是用空間來(lái)解釋?zhuān)覀冋谧龅墓ぷ骶褪前堰@樣的概念再擴(kuò)大一些。
在人機(jī)共生的社會(huì)中,人和機(jī)器的互相交流是最重要的,人要理解機(jī)器的行為,機(jī)器要理解人的意圖。對(duì)機(jī)器行為的解釋、理解和驗(yàn)證,以及機(jī)器行為的倫理性是人工智能研究的核心課題。學(xué)習(xí)的可解釋性是一個(gè)方向,還有一個(gè)方向就是向機(jī)器表達(dá),對(duì)機(jī)器行為的解釋和驗(yàn)證,以及機(jī)器行為的倫理性是核心問(wèn)題。在沒(méi)有解決這些問(wèn)題之前,或者說(shuō)這些問(wèn)題沒(méi)有被深入理解之前,奢談人工智能將會(huì)怎樣,人工智能會(huì)不會(huì)導(dǎo)致機(jī)器統(tǒng)治人類(lèi),目前來(lái)討論尚為時(shí)過(guò)早。
我們不要神話人工智能,它是實(shí)實(shí)在在的算法;不要害怕人工智能,它是不可避免的未來(lái);不要輕視人工智能,它會(huì)改變我們的社會(huì);不要忽悠人工智能,它不是靠錢(qián)可以堆出來(lái)的。
我們要以東方文明特有的包容來(lái)研究和應(yīng)用它,把它作為社會(huì)新的存在,想清楚如何和它共處。
(根據(jù)作者在第三屆上海人工智能大會(huì)上的主旨演講整理)