国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能代替人進(jìn)行審美評(píng)估的可能性探究

2024-01-01 00:00:00謝崇橋譚漪淇
藝術(shù)學(xué)研究 2024年4期
關(guān)鍵詞:深度學(xué)習(xí)人工智能

【關(guān)鍵詞】人工智能;審美評(píng)估;技術(shù)倫理;深度學(xué)習(xí)

引言

“美和審美”從古至今都是哲學(xué)和藝術(shù)中的重要課題,然而關(guān)于美在主客觀問題上的爭論,一直制約著審美判斷理論的進(jìn)一步發(fā)展。例如,休謨認(rèn)為美是主觀的,是個(gè)體情感和情緒的表達(dá)或激發(fā),藝術(shù)作品的價(jià)值在于引起觀者內(nèi)心的情感共鳴。與此相反,亞里士多德認(rèn)為,美是客觀的存在,可以通過分析其結(jié)構(gòu)和布局等多種屬性,客觀地分析和評(píng)判藝術(shù)作品的美。

隨著計(jì)算機(jī)技術(shù)的發(fā)展,人類的數(shù)據(jù)搜集和計(jì)算能力得到了飛躍性的提升,在人工智能(AI)技術(shù)走向成熟之后,利用AI進(jìn)行審美評(píng)估也就順理成章地成為一種構(gòu)建審美判斷體系的新方案。然而,由于審美的主觀因素眾多且復(fù)雜,導(dǎo)致模型并不容易獲取、識(shí)別和分析與藝術(shù)相關(guān)的數(shù)據(jù),AI在審美評(píng)估的準(zhǔn)確性與可靠性方面表現(xiàn)仍不盡如人意。目前,已經(jīng)有許多研究者嘗試從不同渠道采集與用戶主觀感受更為貼近的數(shù)據(jù),使AI模型能更真實(shí)地模擬和學(xué)習(xí)人類的主觀審美判斷,以期得出更精確的審美評(píng)估結(jié)果。

未來,AI是否能擁有與人類相似的審美能力,甚至代替人完成審美評(píng)估?

一、AI代替人進(jìn)行審美評(píng)估的多種嘗試

(一)依賴專家的專業(yè)性審美

深度學(xué)習(xí)技術(shù)的突破與圖像處理算法的進(jìn)步,使各種基于AI的設(shè)計(jì)輔助工具不斷被開發(fā)和應(yīng)用。早期,AI主要依據(jù)領(lǐng)域?qū)<姨岢龅睦碚摶蛑贫ǖ囊?guī)則為“標(biāo)準(zhǔn)”參與審美評(píng)估,根據(jù)“結(jié)晶平衡”或“強(qiáng)調(diào)”等理論原則來評(píng)估某個(gè)版式設(shè)計(jì)是否具有視覺吸引力[1]。

雖然專家提供的標(biāo)準(zhǔn)讓AI參與審美評(píng)估“有法可依”,能增強(qiáng)評(píng)估結(jié)果的權(quán)威性,但同時(shí)也有其局限性。依據(jù)抽象的理論對(duì)具體對(duì)象進(jìn)行審美評(píng)估時(shí),往往會(huì)忽略很多超出理論解釋范圍的細(xì)節(jié)問題。再者,不同領(lǐng)域?qū)<乙蜃陨淼闹饔^性,對(duì)同一審美標(biāo)準(zhǔn)的定義也存在差異,而且專家對(duì)“美”的解讀與普通人對(duì)“美”的理解還常存在錯(cuò)位,導(dǎo)致AI無法作出相對(duì)準(zhǔn)確的審美決策。

(二)重視大眾意見的群體性審美

互聯(lián)網(wǎng)與社交媒體的興起,為AI能更廣泛地收集大眾對(duì)藝術(shù)作品的評(píng)判提供了便利。例如,從在線圖片和視頻分享平臺(tái)Flickr的1075幅倍受大眾喜愛的平面設(shè)計(jì)作品中,AI可以知曉更受大眾喜愛的視覺元素[2],從而理解大眾的審美偏好。

然而,大眾意見也不一定完全真實(shí),因?yàn)榇蟊娨庖娙菀资艿健耙庖婎I(lǐng)袖”的影響。保羅·拉扎斯菲爾德(PaulLazarsfeld)和伊萊休·卡茨(ElihuKatz)在20世紀(jì)40至50年代提出兩級(jí)傳播理論(TwoStepFlowofCommunication),“信息首先通過大眾媒體傳遞給意見領(lǐng)袖,然后這些意見領(lǐng)袖再將信息傳遞給他們的追隨者。意見領(lǐng)袖在信息傳播過程中起到過濾和解釋的作用,顯著影響大眾的意見和行為”[3]。德國政治學(xué)家伊麗莎白·諾埃勒—諾依曼(ElisabethNoelle-Neumann)提出的“沉默螺旋理論”則表明,很多人出于害怕被孤立或與主流意見不符的原因而選擇沉默,但這并不代表他們沒有自己的意見[4]。因此,即使AI廣泛收集大量的大眾意見,也難以真實(shí)反映大眾的審美觀。

(三)收集用戶個(gè)人意見的個(gè)性化審美

隨著深度學(xué)習(xí)技術(shù)和人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,生成對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,簡稱GAN)和卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,簡稱CNN)在藝術(shù)與設(shè)計(jì)領(lǐng)域逐漸得到廣泛應(yīng)用[5],研究者在此基礎(chǔ)上嘗試讓AI模型深入學(xué)習(xí)用戶個(gè)人的個(gè)性化審美偏好,以期實(shí)現(xiàn)更智能的審美評(píng)估[6]。例如,在線獲取用戶的審美反饋信息,并結(jié)合不同的主觀特征和圖像的視覺特征來學(xué)習(xí)用戶的個(gè)性化審美,這似乎能讓AI在審美評(píng)估方面有所突破[7]。然而,直到當(dāng)前,這類探究仍然未能取得實(shí)質(zhì)性進(jìn)步,因?yàn)槿说膹?fù)雜性和人類審美的高度主觀性(甚至有很大隨機(jī)性),讓AI準(zhǔn)確理解和模擬用戶個(gè)人獨(dú)特、復(fù)雜的審美偏好并不容易。這也導(dǎo)致了目前還未達(dá)到“通用人工智能”(ArtificialGeneralIntelligence,簡稱AGI)階段的AI,尚顯力不從心。

可見,人類試圖讓AI擁有與人相同的審美能力,從借助專家觀點(diǎn),到通過收集海量數(shù)據(jù)學(xué)習(xí)大眾審美意見,及至進(jìn)一步獲取用戶個(gè)人相關(guān)的審美偏好信息進(jìn)行審美評(píng)估,其進(jìn)步是顯而易見的。但時(shí)至今日,AI完全代替人進(jìn)行審美評(píng)估仍然困難重重,人的復(fù)雜性似乎令A(yù)I很難走完這段征程。

二、人類復(fù)雜性的表現(xiàn)

(一)人腦結(jié)構(gòu)與機(jī)能的復(fù)雜性

審美判斷來源于人腦的活動(dòng),而人類僅僅認(rèn)識(shí)大腦這一控制人的行動(dòng)、情感的生理系統(tǒng)就經(jīng)歷了漫長的歷史過程。大腦的生理結(jié)構(gòu)和神經(jīng)元之間的連接方式、化學(xué)物質(zhì)在神經(jīng)系統(tǒng)中的作用,以及感知、思維和情感等運(yùn)作過程,至今仍未完全解明。20世紀(jì)的科學(xué)界曾將布羅德曼(Brodmann)于1909年提出的“大腦皮層分區(qū)學(xué)說”作為理解人類大腦作用機(jī)制的重要原則,該學(xué)說將人類大腦皮層分為52個(gè)區(qū)域[1]。但21世紀(jì)以來的腦科學(xué)研究表明,大腦在處理信息時(shí)并非簡單地通過“固定分區(qū)”對(duì)身體各部位實(shí)施行為控制,而是涉及整個(gè)神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)交互[2],甚至具有某種程度上的“可塑性”。也正是由于大腦處理信息具有“可塑性”,人類才能夠執(zhí)行高級(jí)和復(fù)雜的認(rèn)知任務(wù),包括審美評(píng)估這一復(fù)雜的認(rèn)知過程。

盡管目前的腦轉(zhuǎn)錄組學(xué)(研究基因在大腦中的表達(dá))和連接組學(xué)(研究神經(jīng)元之間的連接)技術(shù)已經(jīng)取得很多突破性進(jìn)展,可以在完整的腦組織中獲取數(shù)百萬個(gè)神經(jīng)元的信息,但是電信號(hào)的記錄仍然受到限制,只能映射到數(shù)千個(gè)神經(jīng)元[3]。這意味著目前的腦機(jī)接口技術(shù)雖然可以了解人類大腦的基本結(jié)構(gòu)和連接方式,但對(duì)大腦神經(jīng)元如何協(xié)同工作,以及這種工作如何控制特定的行為或認(rèn)知功能等相關(guān)問題,仍未建立起較為嚴(yán)謹(jǐn)?shù)睦碚摗?/p>

人類至今仍未徹底弄清大腦的運(yùn)作機(jī)制,讓AI模型了解影響其主觀審美的復(fù)雜神經(jīng)活動(dòng)更加困難,模仿人類對(duì)藝術(shù)作品的審美體驗(yàn)就更是難上加難。因此,盡管AI在某些方面展示了潛力,但在全面和準(zhǔn)確地模仿人類審美評(píng)估方面仍有很長的路要走。

(二)社會(huì)文化的多樣性

人的審美不僅僅是個(gè)體對(duì)審美對(duì)象的生理和心理反應(yīng),更是個(gè)體身心與復(fù)雜多樣的社會(huì)文化互動(dòng)的過程,這種帶有變化的過程進(jìn)一步增加了AI識(shí)別、理解和模擬人類審美的難度。

社會(huì)環(huán)境、文化背景等多種因素會(huì)潛移默化地塑造人的審美觀,而且這些因素通常是相互交織的,受此影響,不同社群的人對(duì)同一事物的審美判斷也會(huì)產(chǎn)生差異。例如,一些研究通過收集不同國籍的人對(duì)同一汽車廣告(圖1)的理解來探索跨文化在理解廣告隱喻中造成的差異,使用UAM語料庫工具處理與分析數(shù)據(jù),得出以下結(jié)論:中國人傾向于將速度表的形象解讀為數(shù)字的缺失,他們認(rèn)為這是為了凸顯汽車的“無限可能性”,是一種開放和不受限制的象征;西班牙人通過速度表的形象聯(lián)想到汽車的親和力,因?yàn)樗麄儗⑦@種汽車視為“友好”的汽車,速度表看起來更像一雙微笑的眼睛;英國人的關(guān)注點(diǎn)側(cè)重于汽車的燃油效率和經(jīng)濟(jì)性,認(rèn)為速度表代表駕駛者不必?fù)?dān)心燃油消耗[1]。這項(xiàng)研究凸顯了文化差異對(duì)人的審美理解所產(chǎn)生的影響,以及證明了同一元素在不同文化中會(huì)出現(xiàn)多樣解讀。

人類的倫理認(rèn)知差異也是社會(huì)文化多樣性的重要體現(xiàn),這種差異導(dǎo)致AI更難識(shí)別、理解與模擬人類的審美。已有研究發(fā)現(xiàn),廣告會(huì)因?yàn)槠鋬?nèi)容所傳遞的價(jià)值觀而受到推崇或批評(píng)。因?yàn)閷徝乐黧w不僅關(guān)注審美對(duì)象外在的形式,還關(guān)注審美內(nèi)容所傳達(dá)的倫理立場和社會(huì)意義等深層次的價(jià)值觀。而且,大眾會(huì)受到自身的價(jià)值觀、道德標(biāo)準(zhǔn)以及文化認(rèn)同等多方面因素的影響。這些因素也是造成人與人之間在倫理認(rèn)知方面形成差異的重要原因[2]。更麻煩的是,人類的倫理認(rèn)知并非固定不變[3],而是會(huì)伴隨社會(huì)文化的變遷而改變。

人的復(fù)雜性還表現(xiàn)在個(gè)體之間的明顯差異上,這種差異會(huì)比社會(huì)文化造成的差異更為多樣而且令人難以捉摸。以語言的使用和解讀為例,語言是人類審美表達(dá)與共享的主要媒介,美國社會(huì)學(xué)家哈羅德·加芬克爾(HaroldGarfinkel)通過對(duì)日常生活中語言實(shí)踐的詳細(xì)研究和微觀分析,揭示了人與人之間形成的“共享語境和默契假設(shè)”[4]。加芬克爾將其解釋為一種索引性表達(dá),強(qiáng)調(diào)個(gè)體在實(shí)際生活中形成的一種理性而靈活的互動(dòng)方式。然而,這種互動(dòng)方式也會(huì)使得個(gè)體對(duì)相同的語句產(chǎn)生多種解讀,從而形成理解差異。因?yàn)閭€(gè)體的語言選擇、表達(dá)方式及交互模式會(huì)受到其自身獨(dú)特的觀點(diǎn)、感知與認(rèn)知模式等多種因素影響,甚至被當(dāng)下的情感狀態(tài)、突發(fā)事件所左右,從而形成一種“個(gè)人化”“即時(shí)性”的語言交流模式。此外,個(gè)體表現(xiàn)出微觀的語言特征,如音調(diào)、語速、強(qiáng)調(diào)等細(xì)微變化,以及肢體動(dòng)作、面部微表情等非語言元素也會(huì)影響聽者對(duì)語言行為的解讀。

這些微妙的個(gè)體差異數(shù)據(jù)對(duì)于AI模型來說,并不容易獲取與識(shí)別,想要學(xué)習(xí)和模仿就更加困難。

(三)情感落差

個(gè)體在不同的情景中和不同時(shí)刻有不同的情感反應(yīng),這種反應(yīng)可能是明顯的,也可能是隱含的、微妙的,表現(xiàn)為“情感落差”[1]。而且這種落差還具有隨機(jī)性、動(dòng)態(tài)性的特點(diǎn),不僅受到內(nèi)在心理變化和自我調(diào)節(jié)的影響,同時(shí)還受到與外界互動(dòng)的影響[2]。外界因素包括周圍的物理環(huán)境和社會(huì)環(huán)境,個(gè)體因素包括內(nèi)在心理活動(dòng)及調(diào)節(jié)和管理情緒與行為的能力,這些因素會(huì)共同影響著個(gè)體的情感感知與變化,形成“情感落差”,從而造成同一個(gè)體在不同時(shí)間段有不同的審美判斷。已有研究證明,人在欣賞抽象藝術(shù)作品時(shí),如果突然聯(lián)想到與死亡有關(guān)的事物,會(huì)降低對(duì)“無意義”的作品的喜好程度。對(duì)于注重邏輯、秩序的人來說,這一點(diǎn)會(huì)表現(xiàn)得更加明顯。但當(dāng)提供關(guān)于作品的合理解釋時(shí),如作品說明或創(chuàng)作背景,這種影響會(huì)隨之減弱[3]。

已有研究嘗試通過考察個(gè)體情感狀態(tài)預(yù)測同一個(gè)體在一段時(shí)間內(nèi)的情感變化。但影響情感變化的因素非常多,且以AI目前的計(jì)算資源和運(yùn)算能力,想要長時(shí)間內(nèi)深入觀察并預(yù)測人的情感變化,進(jìn)行動(dòng)態(tài)性的審美評(píng)估,是極難完成的任務(wù)。事實(shí)證明,用AI采集文本如社交評(píng)論、圖像標(biāo)簽等數(shù)據(jù),甚至獲取個(gè)人的社交群體和聯(lián)系人列表等方式,均難以準(zhǔn)確地預(yù)測人的情感微妙變化[4]。因?yàn)榍楦新洳畹膯栴}及采集到的文本還會(huì)受到社會(huì)文化、語言學(xué)上的影響,會(huì)造成一定程度的數(shù)據(jù)污染,從而影響審美評(píng)估的準(zhǔn)確性。

總體而言,人類想要研究出一種使AI代替人進(jìn)行審美評(píng)估的方法,就必須讓AI識(shí)別、理解和模擬人的復(fù)雜性。理解大腦的工作模式和神經(jīng)活動(dòng)是最基本的,還需要用數(shù)據(jù)量化影響人類審美的多種因素。正如前文所述,當(dāng)前的AI技術(shù)顯然未能達(dá)到這一目標(biāo),而且目前AI在數(shù)據(jù)采集方面也存在著諸多挑戰(zhàn)。

三、AI代替人進(jìn)行審美評(píng)估的主要挑戰(zhàn)

AI模擬人的審美,面臨的主要障礙是“數(shù)據(jù)偏差”問題、“審美邏輯”流程化及追求“結(jié)果準(zhǔn)確”的不合理目標(biāo)三大難點(diǎn),這三大難點(diǎn)分布在對(duì)審美對(duì)象和用戶的數(shù)據(jù)采集、數(shù)據(jù)分析及輸出結(jié)果等階段性任務(wù)之中。

(一)數(shù)據(jù)采集中的“偏差”

人類審美具有高度主觀性,因此基于人類審美活動(dòng)而采集的數(shù)據(jù)存在不確定性,這會(huì)導(dǎo)致數(shù)據(jù)的注釋存在“偏差”[5]。以這類數(shù)據(jù)為基礎(chǔ)建立的現(xiàn)有審美評(píng)估模型在進(jìn)行審美評(píng)估時(shí)會(huì)出現(xiàn)評(píng)分交錯(cuò)和異常值[6]。

為了解決上述問題,一些研究者嘗試從多種不同渠道采集數(shù)據(jù),獲取來自不同背景和視角的樣本,以增強(qiáng)數(shù)據(jù)的豐富性和代表性。最常用的收集渠道是從社交網(wǎng)絡(luò)中采集大量與審美或情感有關(guān)的圖像數(shù)據(jù)[1],或者進(jìn)一步收集如人格特征[2]等“主觀性”更強(qiáng)且對(duì)人類審美影響更大的數(shù)據(jù)。一些研究者早前曾開發(fā)過個(gè)性化圖像審美數(shù)據(jù)庫(PersonalizedImageAestheticsDatabasewithRichAttributes,簡稱PARA),并從實(shí)驗(yàn)室收集了438名受試者對(duì)31220張圖像的主觀審美數(shù)據(jù)注釋[3],但對(duì)于“用AI進(jìn)行審美評(píng)判”目標(biāo)而言,這種規(guī)模的數(shù)據(jù)仍然遠(yuǎn)遠(yuǎn)不足以讓經(jīng)過訓(xùn)練的AI達(dá)到“接近大眾認(rèn)知”的水平。例如,在情感數(shù)據(jù)的注釋方面,受試者僅能選擇其中一個(gè)最能描述圖像情感的類別。單一維度顯然無法清晰闡釋人類復(fù)雜的情感。面對(duì)經(jīng)常變化的情緒狀態(tài),此類數(shù)據(jù)庫更加無能為力??梢?,現(xiàn)實(shí)操作中無法確保囊括所有與審美相關(guān)的數(shù)據(jù),導(dǎo)致數(shù)據(jù)的種類和數(shù)量始終難以得到“質(zhì)”的突破。因?yàn)橛绊懼饔^審美的因素不僅有人格特征,還有文化背景、個(gè)人經(jīng)歷(體驗(yàn))、認(rèn)知能力、世界觀、人生觀、社會(huì)階層、審美立場等。這些因素都涉及不同的、相互交織的維度和層面。

要收集那些最能直接反映人的情緒及其微妙變化的生理信號(hào)數(shù)據(jù),比收集一般數(shù)據(jù)更為費(fèi)時(shí)費(fèi)力,難度大且成本高[4]。其中,生理信號(hào)的采集需要佩戴相應(yīng)的傳感器進(jìn)行測量,目前先進(jìn)的AR技術(shù)能結(jié)合專用的傳感器采集人類微妙的生理信號(hào)與運(yùn)動(dòng)數(shù)據(jù)。例如,七通道EMG(肌電圖)、PPG(光學(xué)脈搏檢測)、IMU(慣性測量單元),分別能夠監(jiān)測人類肌肉的收縮和松弛狀態(tài)、皮膚表面的微小血管脈搏變化及人類運(yùn)動(dòng)和姿態(tài)等,其目的是更準(zhǔn)確地理解情感的微妙變化。盡管如此,采集面部微表情數(shù)據(jù)目前仍存在挑戰(zhàn),因?yàn)槊娌课⒈砬樗矔r(shí)而微妙,往往在幾秒鐘內(nèi)就會(huì)消失,需要高靈敏度的傳感器才有可能準(zhǔn)確地捕捉到。而且,對(duì)于有些人來說,面部表情能較充分地反映內(nèi)心情感、情緒的變化,但對(duì)另一些人來說并非如此。

不僅收集海量數(shù)據(jù)會(huì)面臨巨大困難,處理海量數(shù)據(jù)并將它們量化更難。由于數(shù)據(jù)采集過程中難免存在輸入錯(cuò)誤、傳感器故障或其他異常情況,處理海量數(shù)據(jù)時(shí),錯(cuò)誤、重復(fù)項(xiàng)或無效數(shù)據(jù)也相應(yīng)增加,需要手工或利用算法對(duì)大批量的數(shù)據(jù)進(jìn)行清洗。一些數(shù)據(jù)還需要進(jìn)行人工注釋,因?yàn)樽⑨層刹煌瑯?biāo)注者完成—標(biāo)注者既可能是外包的專業(yè)數(shù)據(jù)標(biāo)注者,也可能是被邀請的特定行業(yè)專家,他們之間的審美差異也會(huì)影響到數(shù)據(jù)標(biāo)記工作。此外,個(gè)體情感落差也可能會(huì)造成“數(shù)據(jù)污染”等問題,這些也同樣會(huì)影響AI模仿人類進(jìn)行審美的能力。

克服數(shù)據(jù)采集中的“偏差”問題,不僅需要解決不同時(shí)間、不同環(huán)境下會(huì)出現(xiàn)審美偏差的問題,還存在保護(hù)用戶數(shù)據(jù)隱私等多種復(fù)雜的考量。例如,采集面部特征涉及肖像權(quán)等個(gè)人隱私信息和權(quán)利,需要經(jīng)過嚴(yán)格的倫理審查和真實(shí)參與者的知情同意。一旦我們?nèi)ナ占脩舻乃邢嚓P(guān)數(shù)據(jù),那么全球用戶的隱私都可能會(huì)受到嚴(yán)重侵犯,因?yàn)樗麄兊膫€(gè)人信息將被完全暴露在公眾視野之中,這顯然是不被許可的。

(二)“審美邏輯”流程化的局限

AI模型的審美邏輯通常是基于特定的規(guī)則和數(shù)據(jù)集而建立的,人類的審美則大部分基于隨機(jī)的主觀感受。在構(gòu)建AI模型時(shí),研究者通常會(huì)經(jīng)過收集數(shù)據(jù)、訓(xùn)練模型和調(diào)整參數(shù)等多個(gè)步驟,因此相關(guān)模型是遵循人類設(shè)定好的“審美邏輯”進(jìn)行審美評(píng)估活動(dòng)的,所得出的結(jié)果也將是流程化的產(chǎn)物。

盡管流程化的模型在某種程度上能夠完成簡單且易于識(shí)別的審美評(píng)估任務(wù),但在面對(duì)一些復(fù)雜且抽象的任務(wù)時(shí),其表現(xiàn)卻不盡如人意。例如,一些抽象的藝術(shù)圖像具有不規(guī)則的線條或形狀、紋理等復(fù)雜的視覺元素,模型難以僅僅依靠“將明亮的顏色和平滑的線條劃分為積極情感,將深色和混亂的紋理劃分為消極情感”(圖2)這類明確規(guī)則[1]進(jìn)行審美評(píng)估。這最終會(huì)導(dǎo)致模型得出與人類審美評(píng)估不一致的結(jié)果。此外,模型特定的審美邏輯還會(huì)帶來“審美偏見”,因?yàn)橛?xùn)練數(shù)據(jù)的不均衡,模型會(huì)更傾向于將圖像的審美評(píng)分落在某個(gè)特定范圍內(nèi)。當(dāng)模型面對(duì)沒學(xué)習(xí)過的數(shù)據(jù)時(shí),其適應(yīng)變化的能力較低,審美評(píng)估的準(zhǔn)確性也明顯下降[2]。這表明,模型的“審美邏輯”是固定的,面對(duì)更為復(fù)雜的情境時(shí),模型輸出的結(jié)果與人的主觀判斷難以保持一致。

相比圖像,視頻的AI審美評(píng)估會(huì)更為復(fù)雜與困難,因?yàn)橐曨l不僅包含聲音的音調(diào)、音量、節(jié)奏、字幕和彈幕等語言特征,還有眼神、面部表情、手勢、姿勢等非語言特征。這些特征使得AI模型需要對(duì)不同層面的信息進(jìn)行綜合分析和理解,其評(píng)估過程也顯然比圖像的審美評(píng)估更為復(fù)雜和具有挑戰(zhàn)性。例如,解讀視頻中的文本信息需要模型理解語義的細(xì)微差異。因?yàn)槲谋颈旧砭痛嬖谡Z言模糊、隱喻、引申等現(xiàn)象,而且互聯(lián)網(wǎng)上的流行新詞時(shí)刻在發(fā)生變化,如自創(chuàng)詞、縮略語、互動(dòng)詞等,使得模型對(duì)文本信息和文本中傳達(dá)的情感理解變得更為復(fù)雜[4]。此外,視頻中的圖像內(nèi)容復(fù)雜多變,從簡單的靜態(tài)畫面轉(zhuǎn)換到動(dòng)態(tài)的場景,模型還需要識(shí)別理解多張不同圖像中的細(xì)節(jié)信息。更麻煩的是,從視頻中識(shí)別人的情感狀態(tài),還會(huì)遇到面部微表情相似性的問題,從而阻礙模型進(jìn)行邏輯精確的審美評(píng)估。已有研究發(fā)現(xiàn),模型會(huì)經(jīng)常將“恐懼和快樂”這兩種情感混淆[1]??梢?,語義理解、圖像處理及情感識(shí)別的復(fù)雜性問題,共同影響著模型能否作出準(zhǔn)確的審美評(píng)估。

(三)過于追求“結(jié)果準(zhǔn)確”的不合理目標(biāo)

AI模型在參與審美過程中,目標(biāo)之一就是追求準(zhǔn)確的結(jié)果,而人的審美是動(dòng)態(tài)變化的。在過去的研究中,AI模型通常簡單地將評(píng)估結(jié)果取平均值或?qū)⑵錃w類為“好”或“壞”。一些研究者嘗試采用審美評(píng)分分布圖來取代傳統(tǒng)的審美評(píng)分量化方式,通過收集不同用戶對(duì)同一圖像的審美評(píng)分,并將評(píng)分繪制成分布圖來呈現(xiàn)。這種方法能夠展現(xiàn)用戶對(duì)圖像進(jìn)行審美的多樣性和分歧,提供深入的審美分析。然而,這種方法仍只是追求一個(gè)準(zhǔn)確的數(shù)字或更大可能性的概率,依然是基于固定的規(guī)則和規(guī)律進(jìn)行計(jì)算和推理的。即使模型可能會(huì)被訓(xùn)練以適應(yīng)不同的數(shù)據(jù)集或情境,它針對(duì)同一對(duì)象的審美結(jié)果在不同時(shí)間點(diǎn)上通常是一致的,除非人為更新模型或數(shù)據(jù)。相比之下,人的審美是動(dòng)態(tài)變化的,個(gè)人的審美經(jīng)驗(yàn)和偏好會(huì)隨著時(shí)間、經(jīng)歷和環(huán)境的變化而變化,很難對(duì)其進(jìn)行精確刻畫。

人的審美還具有模糊性,不是任何情境下都非常清晰、確定或具有一致性的,這與AI模型追求準(zhǔn)確的結(jié)果很不一樣。人的審美涉及情緒、感知和認(rèn)知等多個(gè)層面,還可能涉及無法言說的感受,難以用語言充分表達(dá)出來。有研究者為了讓模型能夠?qū)W習(xí)人類審美的模糊性,處理不精確和模糊的審美數(shù)據(jù),引入模糊邏輯系統(tǒng)(FuzzyLogicSystem),來推斷用戶的個(gè)性化審美偏好。盡管模糊邏輯(如藝術(shù)作品的“色彩豐富度”“情感表達(dá)力”等)在處理模糊性和不確定性方面表現(xiàn)出色,但將這種方法應(yīng)用于審美判斷工作時(shí)仍然有很強(qiáng)的局限性。例如模糊邏輯難以處理大量的、復(fù)雜的數(shù)據(jù),面對(duì)多維度數(shù)色彩、構(gòu)圖、主題,難以有效地整合和權(quán)衡各個(gè)因素,尤其是在屬性之間存在復(fù)雜相互作用的情況下。因此,當(dāng)前的研究傾向于使用表現(xiàn)更為出色的神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)具有多層結(jié)構(gòu)和大量參數(shù),能夠自動(dòng)學(xué)習(xí)數(shù)據(jù)中的復(fù)雜模式,具有更強(qiáng)大的表達(dá)能力。

盡管人類試圖用AI模型從不同角度識(shí)別、理解人的審美感知、理解和體驗(yàn),但實(shí)際上還需要克服上述諸多難題。當(dāng)然,AI技術(shù)的發(fā)展日新月異,模型繼續(xù)“進(jìn)化”完善的可能性很大。但關(guān)鍵是,人類會(huì)允許AI無限進(jìn)化嗎?

四、AI是否會(huì)代替人進(jìn)行審美評(píng)估

當(dāng)下,AI技術(shù)正以驚人的速度不斷進(jìn)步和發(fā)展,但在涉及人類主觀意識(shí)和情感的領(lǐng)域,人類對(duì)發(fā)展AI技術(shù)的態(tài)度又變得極為謹(jǐn)慎。在探索AI代替人進(jìn)行審美評(píng)估的路徑上,這些技術(shù)限制構(gòu)成了無法逾越的障礙。艾薩克·阿西莫夫(IsaacAsimov)提出的著名“機(jī)器人三大定律”,是以防止AI對(duì)人類產(chǎn)生傷害為目的而建立的。后來,研究者考慮到人機(jī)互動(dòng)過程中的復(fù)雜問題,如語境的多義性、人類行為的復(fù)雜性及情感表達(dá)的變化等因素導(dǎo)致機(jī)器人難以準(zhǔn)確理解人類的真實(shí)意圖,而做出一些與人類倫理規(guī)范相違背的決策,對(duì)人類造成生理或物理傷害。于是,又補(bǔ)充了一些更詳細(xì)的執(zhí)行方案[1]。

為進(jìn)一步預(yù)防AI會(huì)超出人類預(yù)知,掙脫人類的控制,甚至帶來無法預(yù)計(jì)的災(zāi)難性后果。許多防范性方法被陸續(xù)提出,如預(yù)測AI在多種不同的特定情境下可能產(chǎn)生的行為傾向,尤其是那些涉及權(quán)力、道德和倫理等復(fù)雜的情境[2]。不僅研究者,多個(gè)國家的政府、地區(qū)性組織和聯(lián)合國等國際組織也已經(jīng)制定了明確規(guī)則,以防范AI可能給人類帶來的危害。2023年12月8日,歐盟達(dá)成一項(xiàng)重要的政治協(xié)議,該協(xié)議覆蓋了一系列議題,包括政府在生物識(shí)別監(jiān)控中使用AI系統(tǒng)的規(guī)定,以及對(duì)ChatGPT等AI系統(tǒng)的監(jiān)管。該協(xié)議規(guī)定:“必須對(duì)容易引發(fā)風(fēng)險(xiǎn)的基礎(chǔ)模型進(jìn)行系統(tǒng)風(fēng)險(xiǎn)評(píng)估、開展對(duì)抗性測試。重要事項(xiàng)應(yīng)向歐盟委員會(huì)報(bào)告,確保網(wǎng)絡(luò)安全并提供能源效率報(bào)告。”[3]為了增強(qiáng)AI系統(tǒng)設(shè)計(jì)和應(yīng)用的可靠性和透明性,減少系統(tǒng)發(fā)生意外或“錯(cuò)誤”行為的可能性,以保障人類免受AI系統(tǒng)可能帶來的傷害,2022年美國白宮科技政策辦公室發(fā)布的《人工智能權(quán)利法案藍(lán)圖》(BlueprintforanAIBillofRight)第一原則明確指出:“自動(dòng)化系統(tǒng)的開發(fā)應(yīng)廣泛咨詢各類社群、利益相關(guān)方和相關(guān)專家,以便弄清系統(tǒng)所牽涉的各種事項(xiàng)、風(fēng)險(xiǎn)及潛在影響?!盵4]中國、日本、加拿大、英國、新加坡等多個(gè)國家也已經(jīng)或正在持續(xù)討論制定AI技術(shù)的發(fā)展指導(dǎo)方針和監(jiān)管規(guī)章制度。

可見,各國政府和國際組織的一系列提議及規(guī)定的一致底線是:AI的“進(jìn)化”必須在人類的掌控范圍內(nèi),而且必須往友好的方向發(fā)展。假如AI要代替人進(jìn)行審美評(píng)估,那就意味著它要像人一樣復(fù)雜多樣甚至動(dòng)態(tài)隨機(jī),但在這種情況下AI極有可能脫離人類的控制,而這超出了人類對(duì)AI發(fā)展的容忍底線。因?yàn)橐坏┏搅巳祟惖恼瓶?,AI就可能反過來控制人類甚至成為人類的敵人,比如欺騙與操縱關(guān)鍵人類決策者來獲取經(jīng)濟(jì)資源,利用安全漏洞控制關(guān)鍵計(jì)算機(jī)系統(tǒng),甚至威脅人類或自主使用生物武器,等等[5]。這種風(fēng)險(xiǎn)極端危險(xiǎn),甚至可能導(dǎo)致人類滅絕或邊緣化,這個(gè)后果無論如何都令人無法接受。

總體而言,人類不會(huì)為了讓AI代替人進(jìn)行審美評(píng)估而無限拓展其“智能化”的程度,無論從法規(guī)還是科學(xué)倫理上,人類都不允許AI無限靠近人類。因此,AI代替人進(jìn)行審美評(píng)估即便能夠保證一定的“客觀性”,最多也只能停留在“輔助判斷”這一層面。

猜你喜歡
深度學(xué)習(xí)人工智能
我校新增“人工智能”本科專業(yè)
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
江门市| 侯马市| 甘谷县| 北京市| 玉山县| 新源县| 柳江县| 鄱阳县| 玉屏| 连山| 柳河县| 抚宁县| 清新县| 湟中县| 平潭县| 河南省| 北海市| 正宁县| 五常市| 双城市| 莱西市| 古田县| 平阳县| 新绛县| 彭水| 蒲江县| 武山县| 永年县| 天等县| 白城市| 玛曲县| 南城县| 伊春市| 双桥区| 娱乐| 蛟河市| 东方市| 贵南县| 开江县| 杂多县| 彰化市|