陳春風(fēng)
當(dāng)下的AI領(lǐng)域,可能沒(méi)什麼比AIGC更熱了。各種AIGC應(yīng)用,包括自動(dòng)生成文字、圖片、視頻、代碼的「AI打工天團(tuán)」相繼登場(chǎng),文案、插畫(huà)師、視頻製作人,甚至程式員都陷入「被AI替代」的恐慌。
那麼,AIGC浪潮迭起的背後蘊(yùn)含著哪些商機(jī)?
2022年12月16日,《科學(xué)》雜誌發(fā)佈了2022年度科學(xué)十大突破,AIGC赫然在列。AIGC,全稱為Al-Generated Content,指基於生成對(duì)抗網(wǎng)路GAN、大型預(yù)訓(xùn)練模型等人工智能技術(shù),根據(jù)已有數(shù)據(jù)尋找規(guī)律,並通過(guò)適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的生產(chǎn)方式。
隨著國(guó)家政策的傾斜和5G等相關(guān)基礎(chǔ)技術(shù)的發(fā)展,中國(guó)人工智能產(chǎn)業(yè)在各方的共同推動(dòng)下進(jìn)入爆發(fā)式增長(zhǎng)階段,市場(chǎng)發(fā)展?jié)摿薮?。?shù)據(jù)顯示,2020年中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模就已達(dá)1500億元(人民幣,下同),預(yù)計(jì)在2025年將達(dá)到4000億元,未來(lái)有望發(fā)展為全球最大的人工智能市場(chǎng)。而AIGC的存在,將會(huì)極大釋放人類的想像力,掀起屬於這個(gè)時(shí)代的「新藝術(shù)浪潮」。
風(fēng)口上的 AIGC
這兩年的AI領(lǐng)域,可能沒(méi)什麼比AIGC更熱了。
2022年是浪潮兇猛的AIGC元年,尤其是下半年,AIGC概念突然升溫。有這麼幾個(gè)標(biāo)誌性的事件把AIGC推到了風(fēng)口浪尖之上,其一是文生圖模型 Stable Diffusion 的開(kāi)源,其二是ChatGPT的爆火出圈。
◆ AI繪畫(huà)神器 Stable Diffusion橫空出世
有人將Stable Diffusion形容為AI界的「神筆馬良」,這可能並不誇張。
Stable Diffusion是一個(gè)文本至圖像的模型,於2022年8月22日公開(kāi)發(fā)佈,它能讓數(shù)十億人在幾秒鐘內(nèi)創(chuàng)建出令人讚歎的藝術(shù)品。用戶隨意輸入自己想要的文字描述,就能得到相應(yīng)的圖像結(jié)果。
兩個(gè)月後,伴隨著Stable Diffusion的開(kāi)源,它所具備的潛力瞬間得到了極大釋放。開(kāi)源讓Stable Diffusion將無(wú)過(guò)濾圖像生成的門(mén)檻下放到歷史最低,任何具備一點(diǎn)點(diǎn)技術(shù)知識(shí)的電腦用戶都能輕鬆上手,可以說(shuō)是一項(xiàng)老少鹹宜的AI圖像生成工具。
儘管此前,藝術(shù)創(chuàng)作AI已經(jīng)歷了一段時(shí)間的發(fā)展,但Stable Diffusion的出現(xiàn)才真正讓這項(xiàng)技術(shù)得到了騰飛式的發(fā)展。因?yàn)樗梢悦赓M(fèi)使用、上手快捷,大大減少了用戶生成內(nèi)容的障礙。
Stable Diffusion掀起了文生圖模型的熱潮。2022年 10 月,百度發(fā)佈了首個(gè)知識(shí)增強(qiáng)的AI作畫(huà)大模型 ERNIE-ViLG 2.0;11月初,阿里達(dá)摩院在魔搭社區(qū)ModelScope上開(kāi)放了通義文生圖大模型;11月底,智源研究院大模型研究團(tuán)隊(duì)開(kāi)源最新雙語(yǔ)AltDiffusion模型,中文世界有了專業(yè)級(jí)AI文圖創(chuàng)作工具,其在視效上媲美Stable Diffusion。
◆ ChatGPT火爆出圈
ChatGPT引爆AIGC奇點(diǎn)。2022年11月30日,OpenAI發(fā)佈免費(fèi)機(jī)器人對(duì)話模型ChatGPT(GPT-3.5系列),引發(fā)AIGC界廣泛關(guān)注。該模型中首次採(cǎi)用RLHF(從人類回饋中強(qiáng)化學(xué)習(xí))方式,用戶與ChatGPT之間的對(duì)話互動(dòng)內(nèi)容包括日常聊天、信息諮詢、撰寫(xiě)文章、修改代碼等,對(duì)人類語(yǔ)言的理解能力更強(qiáng),測(cè)試版發(fā)佈5天後就擁有超過(guò)100萬(wàn)用戶使用,截至2023年1月末,ChatGPT的月活用戶突破1億,成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。ChatGPT的橫空出世,讓全世界看到了AIGC的強(qiáng)大。
ChatGPT就像是一個(gè)無(wú)所不知的虛擬體,它能回答各種問(wèn)題,而且總能給到讓人滿意,甚至超過(guò)預(yù)期的答案,因此引起了極高的關(guān)注度。
ChatGPT展示出的強(qiáng)大的能力和無(wú)限可能,讓人們看到,通過(guò)ChatGPT這樣的技術(shù)方案解決很多任務(wù)的潛力。大家感到驚奇的是,在一個(gè)模型裏面就可以完成各種任務(wù),而且是很難的任務(wù)。在過(guò)去一些看似比較困難的任務(wù)(比如問(wèn)倫理道德方面),ChatGPT也能解決得很好。
清華大學(xué)教授黃民烈認(rèn)為,ChatGPT出現(xiàn)對(duì)AI界來(lái)說(shuō),有著十分重要的意義:「它宣示著無(wú)縫人機(jī)交互時(shí)代的來(lái)臨?!?。
從信息檢索的角度看,ChatGPT也取得了很大突破。達(dá)摩院基礎(chǔ)視覺(jué)負(fù)責(zé)人趙德麗表示,以前穀歌等搜索引擎做搜索和檢索,只是找已經(jīng)存在的信息,ChatGPT的應(yīng)用,實(shí)現(xiàn)了從信息的搜索到信息的創(chuàng)造這樣一個(gè)範(fàn)式的轉(zhuǎn)變,從演算法能力上看,它取得了一個(gè)質(zhì)的飛躍。
雖然現(xiàn)階段的 ChatGPT並不完美,但整體而言,ChatGPT的出現(xiàn),從長(zhǎng)遠(yuǎn)來(lái)看的影響力,其實(shí)不亞於阿爾法狗曾經(jīng)在人工智能界帶來(lái)的影響力,它將會(huì)是一個(gè)影響非常深遠(yuǎn)的技術(shù)和應(yīng)用。
AIGC為什麼突然火了?
AIGC並不是一個(gè)新概念。AIGC,通常還有另一種叫法—AI Creation(人工智能創(chuàng)造),大致從2016年—2017年開(kāi)始,其應(yīng)用不斷增加,尤其是在自然語(yǔ)言領(lǐng)域,廣泛應(yīng)用在生成文本、作詩(shī)句、寫(xiě)對(duì)聯(lián)等方向,近幾年,逐漸延伸到作畫(huà)、作曲等領(lǐng)域。
◆ 技術(shù)上的關(guān)鍵突破
AIGC突然在全球躥紅,成為人人口中的流行詞。究其原因,主要由多項(xiàng)技術(shù)上的關(guān)鍵突破推動(dòng),總結(jié)來(lái)說(shuō):
一,演算法上:從2022年4月開(kāi)始,在文生圖視覺(jué)方向上,視覺(jué)效果生成的效果取得了突破性的進(jìn)展,文生圖的品質(zhì)得到了很大改善。OpenAI的文本生成圖像模型DALL·E 2演算法發(fā)佈後,在演算法效果上取得了和以往相比實(shí)質(zhì)性的突破,成為一個(gè)現(xiàn)象級(jí)的演算法,其在文本生成圖像生成的效果、真實(shí)度表現(xiàn)上,讓大家看到了大規(guī)模商用的前景。AI作畫(huà)任務(wù)十分直觀,給人的視覺(jué)衝擊強(qiáng)烈,使得AIGC逐漸破圈,快速傳播。
二,預(yù)訓(xùn)練大模型是AIGC的底座,沒(méi)有大模型學(xué)到的豐富知識(shí),就無(wú)法實(shí)現(xiàn)如此豐富的AI內(nèi)容生成能力。AIGC最重要的是一種融會(huì)貫通的能力,要做領(lǐng)域的泛化,需要學(xué)習(xí)海量的數(shù)據(jù),大模型的規(guī)模直接決定了AIGC創(chuàng)作力的廣度。多模態(tài)大模型的應(yīng)用,使得AIGC的品質(zhì)得到了較為明顯的進(jìn)步。
三,擴(kuò)散模型的發(fā)展。擴(kuò)散生成的演算法取得了突破,這個(gè)演算法能夠?qū)D像做像素級(jí)別的建模,學(xué)習(xí)效率更高。Stable Diffusion是文本生成圖像模型完全開(kāi)源的第一個(gè)演算法,它跑起來(lái)的效率相當(dāng)高,其開(kāi)源也帶動(dòng)了相關(guān)生態(tài)快速的發(fā)展,讓人們看到,基於這種生成式基礎(chǔ)模型,能夠帶來(lái)無(wú)限的創(chuàng)造和想像空間。特別是在一些國(guó)外社區(qū)裏,基於Stable Diffusion做的各種創(chuàng)新式的應(yīng)用發(fā)展快速,展現(xiàn)了商業(yè)化潛力。
四,算力降低。深度學(xué)習(xí)計(jì)算能力的快速發(fā)展。在大算力的基礎(chǔ)上,AI作畫(huà)能夠?qū)崿F(xiàn)在海量數(shù)據(jù)上進(jìn)行大參數(shù)模型的訓(xùn)練。相比之前的AIGC演算法,算力上有了很大降低。要訓(xùn)練一個(gè)基礎(chǔ)的預(yù)訓(xùn)練模型,需要很多算力。一些專注於基礎(chǔ)的大模型的機(jī)構(gòu),將模型訓(xùn)練好後,可以供很多小企業(yè)使用,只需用消費(fèi)級(jí)的網(wǎng)卡就可以做微調(diào),也可以直接基於API調(diào)用。預(yù)訓(xùn)練大模型加上微調(diào)可以很好地進(jìn)行文生圖生成風(fēng)格的改變,派生出了大量的二次開(kāi)發(fā)者,屢屢破圈。
◆ AIGC相關(guān)技術(shù)逐步發(fā)展成熟
AIGC包括多種內(nèi)容形式,按照黃民烈的分類方法,分為感知智能和認(rèn)知智能。(感知類:文生圖、語(yǔ)音生成、音樂(lè)生成等;認(rèn)知類:續(xù)寫(xiě)、改錯(cuò)、小說(shuō)故事創(chuàng)作、對(duì)話生成等)
從技術(shù)上看,寫(xiě)作相關(guān)和圖像生成這兩個(gè)方向表現(xiàn)比較成熟,對(duì)話最難。
其中在文本生成方面,例如在金融文本摘要生成領(lǐng)域,其技術(shù)早已成熟到可以落地的程度。ChatGPT在內(nèi)容的創(chuàng)作能力、問(wèn)答流暢度上表現(xiàn)不錯(cuò),但要深究其真實(shí)性、正確性和時(shí)效性,還存在不少問(wèn)題。如何保證內(nèi)容的真實(shí)性、正確性和時(shí)效性,是現(xiàn)在AIGC尤其是文字類的生成需要重點(diǎn)考慮的問(wèn)題。
圖像生成方面,AI繪畫(huà)格外火熱。百度ERNIE-ViLG團(tuán)隊(duì)認(rèn)為,今年以來(lái),AI作畫(huà)發(fā)展迅速,很大程度來(lái)自於技術(shù)的突破,使得效果有了質(zhì)的飛躍,甚至有些AI圖像作品十分驚豔。
不過(guò),雖然AI繪畫(huà)已經(jīng)進(jìn)入實(shí)用階段,但在技術(shù)角度,生成的可控性和細(xì)節(jié)描述能力依然有很大的優(yōu)化空間。
AI生成視頻,是AI生成圖像的一種延伸。從技術(shù)本質(zhì)上看,視頻可以認(rèn)為是多張「圖片」,即視頻幀構(gòu)成的序列,且序列上各幀之間有畫(huà)面、邏輯等層面的關(guān)聯(lián)。因此,從生成品質(zhì)上來(lái)說(shuō),AI生成視頻相對(duì)更難。
當(dāng)前文生圖技術(shù)可以通過(guò)簡(jiǎn)單的技術(shù)組合,例如分步驟擴(kuò)散生成等方式,將生成圖像擴(kuò)展到生成視頻,但效果還不能令人滿意。此外,受限於數(shù)據(jù)規(guī)模和品質(zhì),AI生成視頻的生成效果和現(xiàn)在的文本生成圖像的效果相比,有較大差距。
總結(jié)來(lái)說(shuō),AI按照生成圖像的方式生成視頻,仍處?kù)肚把靥剿麟A段。
商業(yè)想像力幾何?
現(xiàn)階段,AIGC的生成效果已經(jīng)非常驚豔了,大家看到,這項(xiàng)目技術(shù)已經(jīng)具備了大規(guī)模應(yīng)用和商業(yè)化的潛力和性能,具備了從只能在窄領(lǐng)域到更普遍場(chǎng)景下應(yīng)用的可能性,雖然在使用上還有較大門(mén)檻,但通過(guò)大模型的開(kāi)源開(kāi)放等,有助於將門(mén)檻降下來(lái)。
而且可喜的是,現(xiàn)在,AIGC已經(jīng)有不少可行的商業(yè)模式發(fā)生了。
◆ 「數(shù)字人 +AIGC」
AI技術(shù)在消費(fèi)領(lǐng)域的運(yùn)用已非常普遍,最近幾年,「數(shù)字人 +AIGC」成為不少企業(yè)的探索方向。在2022的世界AI會(huì)議上,「元宇宙」新聞主播、 AI數(shù)字人、VR探索遊戲等現(xiàn)身無(wú)疑昭示著這個(gè)行業(yè)正欣欣向榮。
艾媒數(shù)據(jù)顯示,虛擬人產(chǎn)業(yè)保持穩(wěn)定增長(zhǎng)態(tài)勢(shì),2021年,中國(guó)虛擬人帶動(dòng)產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模分別為1074.9億元和62.2億元,預(yù)計(jì)2025年分別達(dá)到6402.7億元和480.6億元。在市場(chǎng)紅利的驅(qū)使下,玩家紛至遝來(lái)。
2022年12月16日,「新華社AI合成主播首次對(duì)話虛擬人」沖上微博熱搜,新華社AI合成主播受邀加盟江蘇衛(wèi)視2060,「新小浩」「新小萌」和虛擬動(dòng)漫人「電視雞」「無(wú)限少女」進(jìn)行了一場(chǎng)史無(wú)前例的新聞連線;在2022年北京冬奧會(huì)上名聲大噪的冬冬,隸屬阿里巴巴旗下,以冬奧宣推官的身份做「帶貨主播」,協(xié)助天貓奧林匹克中國(guó)旗艦店推廣奧運(yùn)特許商品;而百度推出的虛擬人林開(kāi)開(kāi)、葉悠悠則作為「暖心」弟弟、姐姐的形象,在百度輸入法中陪網(wǎng)友聊天、「談戀愛(ài)」等,給予網(wǎng)友們情感慰藉。
艾媒諮詢CEO兼首席分析師張毅稱,「AI合成人物或者說(shuō)虛擬人這種業(yè)態(tài)的出現(xiàn),主要有以下幾個(gè)方面的原因。」 首先是人工智能技術(shù)已經(jīng)比較成熟,可以支撐的方向非常多;其次,不少場(chǎng)景因?yàn)橐恍┮蛩匾呀?jīng)到了需要使用虛擬人的階段,比如商業(yè)代言、電商直播、電視臺(tái)主持等,線民對(duì)虛擬人的認(rèn)可度普遍較高並願(yuàn)意支持其發(fā)展。
◆ 實(shí)體經(jīng)濟(jì)領(lǐng)域蘊(yùn)含商機(jī)
在互聯(lián)網(wǎng)應(yīng)用之外,AIGC在實(shí)體經(jīng)濟(jì)領(lǐng)域,也蘊(yùn)含著不少機(jī)會(huì)。
實(shí)體經(jīng)濟(jì)對(duì)內(nèi)容生產(chǎn)的需求很大。「我們以前認(rèn)為實(shí)體經(jīng)濟(jì)的瓶頸在於生產(chǎn)、產(chǎn)能,其實(shí)不是,實(shí)體經(jīng)濟(jì)的很多瓶頸在於設(shè)計(jì),在於內(nèi)容?!?小冰公司 CEO 李笛說(shuō)。以小冰為例,小冰的AIGC內(nèi)容很早就應(yīng)用在紡織設(shè)計(jì)領(lǐng)域。小冰與中國(guó)紡織信息中心、國(guó)家紡織產(chǎn)品開(kāi)發(fā)中心推出的AI圖案設(shè)計(jì)平臺(tái),可按需定制 100% 原創(chuàng)的圖案紋樣,目前已有超過(guò) 400 家企業(yè)註冊(cè),並在生產(chǎn)中使用。
北京智源人工智能研究院總工程師林詠華談到,工業(yè)生產(chǎn)、製造、倉(cāng)儲(chǔ)、物流等實(shí)體行業(yè),近幾年一直在探索如何用電腦視覺(jué)來(lái)進(jìn)行智能化升級(jí),但實(shí)際落地並不容易。原因在於,現(xiàn)有的模型品質(zhì)還未能滿足產(chǎn)業(yè)落地的品質(zhì)要求。其中一個(gè)重要原因是,訓(xùn)練模型時(shí)所用的訓(xùn)練數(shù)據(jù)十分局限。因此,可以考慮通過(guò)AIGC的方式來(lái)產(chǎn)生這些場(chǎng)景裏的訓(xùn)練數(shù)據(jù)。例如在倉(cāng)儲(chǔ)、物流或更多的工業(yè)場(chǎng)景,用AI來(lái)輔助產(chǎn)生一些少見(jiàn)的場(chǎng)景數(shù)據(jù),作為訓(xùn)練數(shù)據(jù)的補(bǔ)充,提升整個(gè)模型的品質(zhì)。但這需要更精準(zhǔn)的圖片生成的控制能力,比較起現(xiàn)有的AIGC模型能力,其可控性需要大大提升。
AIGC在自動(dòng)駕駛場(chǎng)景下也有著不錯(cuò)的應(yīng)用潛力?,F(xiàn)在自動(dòng)駕駛場(chǎng)景存在訓(xùn)練數(shù)據(jù)不足的問(wèn)題,例如針對(duì)惡劣天氣、事故等突發(fā)狀況,視覺(jué)模型在真實(shí)場(chǎng)景中很難捕捉,也難以進(jìn)行模擬,因此,目前業(yè)內(nèi)在嘗試用數(shù)字孿生和仿真的方式來(lái)模擬。也可以嘗試用大模型的方式,通過(guò)給出描述,生成相應(yīng)的精確場(chǎng)景,緩解某些場(chǎng)景下自動(dòng)駕駛數(shù)據(jù)難獲得的問(wèn)題。
「整體來(lái)看,AIGC現(xiàn)在已經(jīng)開(kāi)始在探索向?qū)嶓w經(jīng)濟(jì)的應(yīng)用發(fā)展,但目前還在一個(gè)比較早期的階段」 林詠華判斷。
小結(jié)
隨著技術(shù)日益成熟,產(chǎn)業(yè)鏈不斷形成和豐富,人工智能業(yè)務(wù)模型也將朝著多元化的方向發(fā)展,AIGC不斷助力產(chǎn)業(yè)升級(jí)。目前,虛擬人的應(yīng)用商業(yè)模式雖處?kù)短剿麟A段,但商業(yè)應(yīng)用場(chǎng)景已由最初的數(shù)字娛樂(lè)場(chǎng)景迅速擴(kuò)大到各行各業(yè),紅利仍然存在。從B端到C端,從虛擬直播到虛擬偶像,再到虛實(shí)結(jié)合的多點(diǎn)進(jìn)發(fā),AI創(chuàng)作的商業(yè)價(jià)值正被不斷挖掘釋放。在AI技術(shù)大發(fā)展的當(dāng)下,人工智能走向何處,又能帶來(lái)怎樣的能量,將成為行業(yè)下一步的看點(diǎn)。
除此之外,人工智能技術(shù)正在快速「進(jìn)化」,其在人類社會(huì)發(fā)展道路上的分量也越來(lái)越重,隨之而來(lái)的,人類與人工智能的和諧共處也成為科技大佬們關(guān)注的議題,就如同馬斯克在談及OpenAI的創(chuàng)始初衷所說(shuō):「我們要怎樣做才能保證人工智能帶給我們的未來(lái)是友好的?」這個(gè)問(wèn)題的答案或許就藏在每個(gè)科學(xué)家的努力之中。