日前,OpenAI 發(fā)布了全球首個(gè)文(圖)生視頻模型Sora,一夜之間刷屏全球網(wǎng)絡(luò)。
通過(guò)Sora,用戶(hù)可以通過(guò)使用自然語(yǔ)言提示詞,生成長(zhǎng)達(dá)1 分鐘的視頻,并包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。這意味著,在繼文本、圖像之后,OpenAI 將人工智能技術(shù)拓展到視頻領(lǐng)域。雖然Sora 模型目前尚未向公眾開(kāi)放,但是已經(jīng)有人感嘆:視頻生產(chǎn)顛覆性革命來(lái)了。
OpenAI 官網(wǎng)展現(xiàn)了多段Sora 制作的視頻,身著黑色皮衣、紅色裙子的女子在雨后的夜晚行走在東京市區(qū)街道上,女子皮膚上的毛孔清晰可見(jiàn),路面積水映出路燈倒影。視頻十分真實(shí)。
Sora 不僅能夠生成完整的60 秒視頻,還能延長(zhǎng)已生成的視頻。更重要的是,Sora 可以生成不同機(jī)位、不同景別的視頻,并進(jìn)行剪輯。這不禁讓人感嘆:“真實(shí)和虛幻的差別,到底還有多大距離?”
同時(shí),Sora 也帶有世界模型的特質(zhì)。所謂世界模型,簡(jiǎn)單點(diǎn)說(shuō),是要對(duì)真實(shí)的物理世界進(jìn)行建模,讓機(jī)器像人類(lèi)一樣,對(duì)世界有一個(gè)全面而準(zhǔn)確的認(rèn)知,讓AI 視頻更流暢,更符合邏輯。
從AI 制作視頻的流程來(lái)看,當(dāng)前的Sora 需要先輸入一段文字,隨后再生成視頻,視頻的原創(chuàng)性還是依賴(lài)創(chuàng)作者的審美,Sora 的工具屬性更加突出。比起原創(chuàng)內(nèi)容,Sora 的優(yōu)勢(shì)更在于, 可以節(jié)省特效片段耗費(fèi)的大量人力物力。
所以,也有網(wǎng)友預(yù)測(cè), 雖然未來(lái)視頻制作流程中的剪輯師、特效師等后期崗位會(huì)面臨更為嚴(yán)峻的處境,但Sora 未來(lái)能夠代替更多機(jī)械、重復(fù)的工作,使得創(chuàng)作者可以集中精力于創(chuàng)新的、深度的解讀,給文化消費(fèi)者提供更優(yōu)質(zhì)的內(nèi)容。
如果說(shuō)ChatGPT 是語(yǔ)言的大師,那么Sora 則是一個(gè)多模態(tài)數(shù)據(jù)的通才,它通過(guò)視頻、圖片等多種數(shù)據(jù)形式更全面地理解世界。Sora 又有哪些應(yīng)用場(chǎng)景?
借助Sora 模型,新聞機(jī)構(gòu)可以在幾分鐘內(nèi)生成一段生動(dòng)的現(xiàn)場(chǎng)視頻,讓觀眾即刻了解事件全貌。這種快速、準(zhǔn)確的報(bào)道方式,大大提高了新聞報(bào)道的時(shí)效。
借助Sora 模型,廣告商可以快速生成多個(gè)廣告預(yù)覽視頻,使廣告商能夠迅速找到最吸引觀眾的創(chuàng)意方向,打造令人難忘的廣告作品。
Sora 模型為歷史紀(jì)錄片的制作提供了全新的解決方案。通過(guò)模型重建戰(zhàn)爭(zhēng)時(shí)期的城市、戰(zhàn)場(chǎng)和人物,制作團(tuán)隊(duì)可以讓觀眾仿佛置身于那個(gè)戰(zhàn)火紛飛的年代。這種沉浸式的觀影體驗(yàn),讓歷史紀(jì)錄片煥發(fā)新的生命力。
借助Sora 模型,體育賽事主辦方可以生成虛擬的球場(chǎng)、球員和觀眾,為球迷打造一場(chǎng)身臨其境的虛擬賽事盛宴。
如果Sora 能夠持續(xù)優(yōu)化,那么未來(lái)的電影制作可能就像搭積木一樣簡(jiǎn)單。你只需要將這些60 秒的片段巧妙地組合起來(lái),加上一個(gè)吸引人的劇本,一個(gè)小團(tuán)隊(duì)就能打造出與《熊出沒(méi)》《流浪地球》等大片相媲美的作品。
目前的Sora 仍處于1.0 階段,仍然存在一定缺陷,在處理精細(xì)的背景時(shí)常常出現(xiàn)力不從心的情況,但沒(méi)人會(huì)否認(rèn)Sora 在通用人工智能實(shí)現(xiàn)路程上的里程碑地位。
(摘自“看電視”微信公眾號(hào),蘿卜葉子圖)