楊小彥
1950年,心理學(xué)家吉布森(James Jerome Gibson, 1904-1979)出版了他的劃時(shí)代著作《視覺世界的知覺》(The Perception of the Visual World)。今天來(lái)看,或許這是視覺研究的一個(gè)轉(zhuǎn)折,對(duì)知覺的描述從傳統(tǒng)方式轉(zhuǎn)向了現(xiàn)代體系,并為最終走向人工智能與大腦活動(dòng)分析打開了一條路徑。
在專著的“導(dǎo)論”中,吉布森提出了一個(gè)關(guān)于視知覺的“總體理論”(Ground Theory)。他描述了與之相關(guān)的五項(xiàng)原則:1.表面和輪廓是構(gòu)成視覺世界的印象之因素。2.刺激變量(從中發(fā)現(xiàn)與分離是有困難的)相對(duì)應(yīng)于空間世界的相關(guān)屬性。3.視網(wǎng)膜圖像中對(duì)應(yīng)于視覺空間的相關(guān)屬性之刺激變量,僅僅與該屬性有關(guān)聯(lián),而不是一種復(fù)制。4.可以采用數(shù)論和現(xiàn)代幾何學(xué)的方法,把視網(wǎng)膜圖像的非均質(zhì)分析為一種相類似的物理變量。這等于說(shuō),可以把視網(wǎng)膜圖像的秩序或圖式視為刺激本身。5.我們?nèi)绾慰创澜缈梢苑殖蓛蓚€(gè)問(wèn)題來(lái)考慮,首先是對(duì)實(shí)體或空間世界的感知,其次是對(duì)我們?nèi)粘KM(jìn)入的世界的感知[1]。
吉布林一開始就指出:就視覺而言,我們要區(qū)別“視覺領(lǐng)域(visual field,視域)”和“視覺世界(visual world)”的不同,前者指構(gòu)成視覺觀看的諸種因素,直接關(guān)系到眼睛這一器官及其工作原理,后者則指我們所面對(duì)的物理世界。沿著這一思路,視覺領(lǐng)域還可以細(xì)分為,感受質(zhì)感、空間、表皮、形狀、色彩、陡坡等“抽象因素”,以及因這些感受綜合而在視域中所形成的“物像”。這一“物像”就是我們關(guān)于世界的總體認(rèn)識(shí)。更重要的是:所謂視覺,其實(shí)指的是一種具有整體性質(zhì)的“刺激”,而我們對(duì)于世界的認(rèn)識(shí),在“刺激”水平上看,其實(shí)僅僅是一系列“刺激變量”的結(jié)果而已。因此,就視覺本身而言,“刺激”就是一切,“刺激”不能拆分。而且,按照格式塔的原則,尤其是按照考夫卡關(guān)于“物理世界”與“行動(dòng)世界”的劃分這一原則,視覺主要指的是“行動(dòng)世界”,并把觀看落實(shí)為一種實(shí)踐。從這一點(diǎn)看,所謂“感覺”并不存在,一開始就是“知覺”,就是視覺把握世界的總體模式。把認(rèn)知分為從“感覺”到“知覺”的傳統(tǒng)概念,并不符合心理實(shí)驗(yàn)的一系列結(jié)果。
就認(rèn)知領(lǐng)域而言,吉布森最重要的一個(gè)成果是他發(fā)現(xiàn)了“視覺懸崖”(Visual Cliff)這一現(xiàn)象的存在[2],從而為“恐高癥”尋找到了生理上的依據(jù)。之所以有這樣的成果,顯然和吉布森一開始就以探討知覺對(duì)于深度和空間判斷為目標(biāo)的這一理論設(shè)置有關(guān)。他關(guān)心的是人類如何判斷三維的存在,如何建立一個(gè)深度的知覺世界。在自動(dòng)駕駛系統(tǒng)沒有建立起來(lái)以前,飛行員憑肉眼如何在空中定位,這在二戰(zhàn)前后是一個(gè)相當(dāng)急迫的需要解決的問(wèn)題。處于浩瀚的空中,飛行員究竟是以地平線為坐標(biāo),還是以地面物體為標(biāo)志?為此,吉布森設(shè)計(jì)了一個(gè)實(shí)驗(yàn),把人置于一只碩大的灰色圓球中,人在這個(gè)圓球里將無(wú)法找到任何有效的參照物。結(jié)果是:人的空間與深度判斷基本失靈,還出現(xiàn)了不少錯(cuò)誤的判斷。這說(shuō)明,我們對(duì)于空間的認(rèn)知其實(shí)是一種尋找差異化的過(guò)程,知覺世界正是由一系列有效的差異化存在而構(gòu)成。
深度判斷,就原理而言,無(wú)疑和幾何學(xué)有關(guān)。這時(shí),我們?cè)僖淮伟l(fā)現(xiàn),就知覺而言,人的眼睛就是幾何學(xué)的化身。表面上看,幾何學(xué)屬于數(shù)學(xué),和視知覺經(jīng)驗(yàn)沒有關(guān)系??墒钦驹谏疃扰c空間認(rèn)知這一立場(chǎng)上,幾何學(xué)也就是視覺。歐幾里得幾何學(xué)探討的是光線的折射規(guī)律,以此為基點(diǎn)統(tǒng)一了我們的世界。牛頓則把世界簡(jiǎn)化為時(shí)間、空間和物質(zhì)。對(duì)于牛頓來(lái)說(shuō),他的一切判斷都是空間化的,時(shí)間只不過(guò)是物體在空間中的勻速位移而已。所以,世界在他眼里就是一只巨大無(wú)比的容器,所有物體均嚴(yán)格按照他所發(fā)現(xiàn)的力學(xué)原則準(zhǔn)確無(wú)誤地運(yùn)行,時(shí)間并不存在,或者說(shuō),時(shí)間無(wú)須被定義。17世紀(jì),笛卡爾發(fā)展了與三維有關(guān)的立體幾何,世界經(jīng)過(guò)微調(diào)進(jìn)入到他的體系之中。到了20世紀(jì),首先是愛因斯坦把時(shí)間與空間視為一體,第一次定義了時(shí)間本身;接著,笛卡爾的立體幾何就完全讓位給了黎曼的空間幾何。我們終于認(rèn)識(shí)到,空間具有曲面效應(yīng),平行線和直線并不存在。
所以,吉布森嚴(yán)厲地駁斥了這樣一種流行的觀念:我們的眼睛只不過(guò)是一只接收光線的器官,關(guān)于物體的表象只是視網(wǎng)膜對(duì)應(yīng)于對(duì)象時(shí)的一種法定的轉(zhuǎn)換而已。更進(jìn)一步說(shuō),我們總是以為,視網(wǎng)膜圖像是大腦光感應(yīng)神經(jīng)的一種轉(zhuǎn)換。也就是說(shuō),吉布森既反對(duì)把視網(wǎng)膜視為某種生理意義上的“底片”,更反對(duì)大腦皮質(zhì)區(qū)所形成的表象等同于我們所以為的物體外觀。進(jìn)一步說(shuō),關(guān)于物體外觀的表象,其實(shí)是一種類似于詞語(yǔ)的描述,經(jīng)驗(yàn)使我們相信這一描述就是真實(shí)本身。也就是說(shuō),經(jīng)驗(yàn)往往是一種“誤導(dǎo)”、一種“錯(cuò)覺”。
克服“誤導(dǎo)”和“錯(cuò)覺”的最佳辦法不是觀看,而是對(duì)觀看原理的探索,是幾何學(xué),以及與之相關(guān)的數(shù)論!我們這里可以再重讀一下本文開始所引用的吉布森的原話。他說(shuō):所謂表象并不是圖像,而僅僅是刺激,這一刺激完全可以用數(shù)論與幾何學(xué)的體系加以準(zhǔn)確地描述,也只能用這一語(yǔ)言加以分析。
這不就是現(xiàn)在流行的“一切都是編程”“一切都是算法”的20世紀(jì)版嗎?今天我們驚訝地看到人工智能的大規(guī)模開發(fā),看到機(jī)器之眼所創(chuàng)造的日新月異的視覺奇跡,而忘記了,早在人工智能之前,類似吉布森這樣的學(xué)者,就已經(jīng)在默默地為這一趨勢(shì)打造武器。就方法論而言,是觀看的原理塑造了我們的觀看世界,而不是相反。從這一方法論出發(fā),視覺世界將與物理學(xué)、生理學(xué)、心理學(xué)乃至數(shù)學(xué)建立起血肉般的關(guān)系。要知道,原理趨于一致,原理不可推翻,表象反而脆弱不堪,經(jīng)驗(yàn)式的世界在原理的塑造下上升為一種完全人為的概念,上升為所謂的文化,從而深刻地締造了今天的視覺世界。
原來(lái),人類對(duì)于視覺的認(rèn)知,一直都是用原理去反復(fù)觀看,而不是相反。
注釋:
[1] Gibson: The Perception of the Visual World, Greenwood Press, 1950,pp.8-10.
[2]關(guān)于“視覺懸崖”,是吉布森與他夫人共同完成,而主要由從事兒童心理學(xué)研究的吉布森夫人沃克·吉布森在1961年提出,并為此設(shè)計(jì)了相關(guān)的實(shí)驗(yàn)程序。
責(zé)任編輯:姜 姝