邱野
2023年年初,讀研一下的我選修了一門叫“圖像處理與機器學習”的課程,課上,老師為我們展示了AI在圖像處理方面的驚人能力。其中有一項應(yīng)用是圖像修復。
AI的驚人能力
老師找來一張破舊不堪的老照片,圖上不僅有一塊明顯的損壞區(qū)域,其顏色也因年代久遠變得泛黃又失真。他先用傳統(tǒng)方法進行了圖像修復:采用圖像編輯軟件的手動工具對圖片的破損處一點點進行填補、克隆或修飾。大約過了半個多小時,圖片才基本修復好,即便是經(jīng)過老師的專業(yè)處理,對于如此大面積的損壞,其效果也不盡如人意,放大圖片后,我們?nèi)钥吹搅瞬簧勹Υ谩?/p>
之后,老師切換到了AI圖像修復技術(shù)的演示。他打開Photoshop軟件,加載了同一張老照片,但與我們熟悉的PS版本不同,此時軟件中添加了一項AI創(chuàng)作生成按鈕。只見他簡單地點擊了幾個按鈕,軟件便開始了自動修復過程。不到1分鐘,屏幕上就跳出了一張令人驚艷的照片:所有損壞部位和色彩都被完美地修復,且與周圍背景完美融合,仿佛從未受損過一樣。
看到我們?nèi)俭@得張大了嘴巴,老師笑著解釋,這是AI模型經(jīng)過大量訓練后學習到的能力。它們能夠快速理解圖像中的復雜模式和結(jié)構(gòu),并生成與周圍內(nèi)容相協(xié)調(diào)的新內(nèi)容來填充損壞部分。所以,無論是老照片中的損壞,還是照片中的不必要元素,AI圖像修復技術(shù)都能夠應(yīng)對自如。
我沒想到,曾經(jīng)需要耗費大量時間和精力的復雜任務(wù),在AI的助力下竟變得如此輕而易舉。雖然,課上主要介紹的是AI如何進行圖像處理,但我不由對AI在繪畫領(lǐng)域的潛力展開了遐想:或許,它不僅能解決技術(shù)問題,也能成為實現(xiàn)想象力的重要工具,為人類提供一種全新的創(chuàng)作方式。
隨著課程的深入,我對AI處理圖像和機器學習的基礎(chǔ)知識掌握得越來越多。2024年3月的一天,我無意間在《人民日報》官微上看到了一段視頻,它用一種全新的AI視角讓網(wǎng)友欣賞到祖國壯美的山河??粗聊簧辖k麗的畫面,我的心再一次被AI撥動:是時候付諸行動了。
南審專屬的風格模型
來南京審計大學讀書的這兩年里,我對校園產(chǎn)生了深厚的感情,校園里許多熟悉的場景總能讓我想到和同學相處的溫馨瞬間。一個想法在我心中閃過:何不將AI技術(shù)與校園風景相結(jié)合,或許能形成一種獨特的藝術(shù)風格。
查看了眾多學習平臺,又參照網(wǎng)友們的測評意見,我選定了Stable?Diffusion軟件作為這次創(chuàng)作的主要工具。不光因為它能免費供用戶使用,還因為它的技術(shù)是一種潛在擴散模型,通俗來說,就是只要基于深度學習,它就能生成高像素、高逼真的圖像。
那怎樣才能創(chuàng)作出專屬南審的模型呢?翻閱了相關(guān)資料后,得知我校的主要建筑是由2010年上海世博會中國館總設(shè)計師何鏡堂院士設(shè)計完成。學校的設(shè)計高度重視山水氣韻的營造,總體布局為山水相依,樹石相融。圍繞“對自然的神往與親近”,我從自己喜愛的藝術(shù)家作品中汲取靈感。比如,借鑒后印象派大師梵高的向日葵、星空等元素;融合日本動畫師宮崎駿清新浪漫的繪圖風格;再比如,中國傳統(tǒng)水墨山水畫的意境似乎也與學校的設(shè)計風格很契合。
我清楚,只有盡可能選擇具有多樣性、代表性的圖片,才能確保模型學習到更廣泛的視覺信息。于是,我走遍校園的每一個角落,用鏡頭捕捉校園最具獨特性的風景。從個人拍攝和多方搜集來的上百張原圖中,我挑選了20張最有代表性的照片作為這次AI繪圖的原片,通過輸入引導詞,引導模型創(chuàng)作出符合我想法的藝術(shù)圖。
為了達到理想的創(chuàng)作效果,我不斷地嘗試各種組合和搭配,基本上每張原片都嘗試了近30種不同的風格。
俏皮的玩笑
每嘗試一種風格,除了輸入不同的引導詞,我還需要調(diào)整模型的各種設(shè)定,比如模型的學習速度、迭代步數(shù)等,以期望得到更好的效果。
調(diào)參數(shù)的過程堪比在烹飪食物的過程中添加調(diào)料,每改變一個參數(shù),都要等待幾分鐘甚至更長的時間才能查看效果。訓練模型的過程中充滿了各種不確定性,就像做菜,哪怕你完全按照食譜操作,也可能做不出美味佳肴。有時我信心滿滿地調(diào)整了參數(shù),生成的效果卻令人大跌眼鏡,有一次,我想繪制一幅和梵高向日葵風格相融合的校園藝術(shù)圖,明明引導詞中沒有和人物有關(guān)的詞,可生成的圖片中雖然也有向日葵元素,卻莫名其妙多出了一個可愛的卡通男孩,仿佛AI和我開了個俏皮的玩笑,真叫人又好氣又好笑。可轉(zhuǎn)念一想,或許正因為這些“玩笑”,才讓AI訓練的過程沒那么枯燥乏味,這大概就是AI的魅力所在吧!
經(jīng)過一個星期的努力,我終于在生成的500多張樣稿中挑選出十幾張最具獨特性和表現(xiàn)力的成稿。這些以全新方式呈現(xiàn)的學校美景的圖片,經(jīng)過編輯后,被發(fā)布在學校的官方微信公眾號平臺,后又被其他媒體轉(zhuǎn)載,獲得了不錯的社會影響。
這次獨特的創(chuàng)作體驗不僅讓我收獲了在論文寫作和研究算法之外的樂趣,更讓我發(fā)現(xiàn)人工智能在藝術(shù)和設(shè)計領(lǐng)域潛藏著巨大潛力,還給我未來的職業(yè)規(guī)劃提供了參考。比如,我發(fā)現(xiàn)在音樂創(chuàng)作中,AI可以分析大量的音樂數(shù)據(jù),生成新的旋律和節(jié)奏,它能為創(chuàng)作提供全新的靈感來源。還有在虛擬現(xiàn)實和增強現(xiàn)實領(lǐng)域,多模態(tài)學習技術(shù)的應(yīng)用,能使用戶通過視覺、聽覺和觸覺等多種感官融入到虛擬世界中,為沉浸式體驗帶來更多可能性。
責任編輯:刁雅琴