OpenAI公司推出了最新人工智能(AI)模型——文本—視頻程序Sora。這款工具可根據(jù)簡單的文本描述,生成類似好萊塢電影般逼真而又充滿想象力的視頻。
這是OpenAI首次進(jìn)軍人工智能視頻生成領(lǐng)域。據(jù)公司介紹,Sora使用Transformer架構(gòu),可根據(jù)文本指令創(chuàng)建近似現(xiàn)實(shí)且富有想象力的場景,生成多種風(fēng)格、不同畫幅、最長為一分鐘的高清視頻。該模型還能夠根據(jù)靜態(tài)圖像生成視頻,或?qū)ΜF(xiàn)有視頻進(jìn)行擴(kuò)展或填充缺失的幀。
Sora意為“天空”,其背后的團(tuán)隊(duì)之所以選擇這個(gè)名字,是因?yàn)樗白屓寺?lián)想到無限的創(chuàng)造潛力”。Sora目前可單獨(dú)使用文本指令,或?qū)⑽谋九c圖像相結(jié)合,來創(chuàng)建長達(dá)60秒的視頻,而且是一鏡到底。目前OpenAI官網(wǎng)上已更新了48個(gè)視頻,包括一只狗在雪地里嬉戲,車輛在路上行駛,以及更奇幻的場景,如鯊魚在城市摩天大樓之間游泳等。有專家認(rèn)為,Sora的表現(xiàn)優(yōu)于其他類似模型,標(biāo)志著文本—視頻技術(shù)的巨大飛躍。(來源:人民網(wǎng))