千億市場(chǎng)大有可為頂流「AIGC」的瘋狂與爭(zhēng)議

2023-09-27 18:26陳春風(fēng)

臺(tái)商 2023年3期

陳春風(fēng)

當(dāng)下的AI領(lǐng)域，可能沒(méi)什麼比AIGC更熱了。各種AIGC應(yīng)用，包括自動(dòng)生成文字、圖片、視頻、代碼的「AI打工天團(tuán)」相繼登場(chǎng)，文案、插畫(huà)師、視頻製作人，甚至程式員都陷入「被AI替代」的恐慌。

那麼，AIGC浪潮迭起的背後蘊(yùn)含著哪些商機(jī)？

2022年12月16日，《科學(xué)》雜誌發(fā)佈了2022年度科學(xué)十大突破，AIGC赫然在列。AIGC，全稱為Al-Generated Content，指基於生成對(duì)抗網(wǎng)路GAN、大型預(yù)訓(xùn)練模型等人工智能技術(shù)，根據(jù)已有數(shù)據(jù)尋找規(guī)律，並通過(guò)適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的生產(chǎn)方式。

隨著國(guó)家政策的傾斜和5G等相關(guān)基礎(chǔ)技術(shù)的發(fā)展，中國(guó)人工智能產(chǎn)業(yè)在各方的共同推動(dòng)下進(jìn)入爆發(fā)式增長(zhǎng)階段，市場(chǎng)發(fā)展?jié)摿薮?。?shù)據(jù)顯示，2020年中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模就已達(dá)1500億元（人民幣，下同），預(yù)計(jì)在2025年將達(dá)到4000億元，未來(lái)有望發(fā)展為全球最大的人工智能市場(chǎng)。而AIGC的存在，將會(huì)極大釋放人類的想像力，掀起屬於這個(gè)時(shí)代的「新藝術(shù)浪潮」。

風(fēng)口上的 AIGC

這兩年的AI領(lǐng)域，可能沒(méi)什麼比AIGC更熱了。

2022年是浪潮兇猛的AIGC元年，尤其是下半年，AIGC概念突然升溫。有這麼幾個(gè)標(biāo)誌性的事件把AIGC推到了風(fēng)口浪尖之上，其一是文生圖模型 Stable Diffusion 的開(kāi)源，其二是ChatGPT的爆火出圈。

◆ AI繪畫(huà)神器 Stable Diffusion橫空出世

有人將Stable Diffusion形容為AI界的「神筆馬良」，這可能並不誇張。

Stable Diffusion是一個(gè)文本至圖像的模型，於2022年8月22日公開(kāi)發(fā)佈，它能讓數(shù)十億人在幾秒鐘內(nèi)創(chuàng)建出令人讚歎的藝術(shù)品。用戶隨意輸入自己想要的文字描述，就能得到相應(yīng)的圖像結(jié)果。

兩個(gè)月後，伴隨著Stable Diffusion的開(kāi)源，它所具備的潛力瞬間得到了極大釋放。開(kāi)源讓Stable Diffusion將無(wú)過(guò)濾圖像生成的門(mén)檻下放到歷史最低，任何具備一點(diǎn)點(diǎn)技術(shù)知識(shí)的電腦用戶都能輕鬆上手，可以說(shuō)是一項(xiàng)老少鹹宜的AI圖像生成工具。

儘管此前，藝術(shù)創(chuàng)作AI已經(jīng)歷了一段時(shí)間的發(fā)展，但Stable Diffusion的出現(xiàn)才真正讓這項(xiàng)技術(shù)得到了騰飛式的發(fā)展。因?yàn)樗梢悦赓M(fèi)使用、上手快捷，大大減少了用戶生成內(nèi)容的障礙。

Stable Diffusion掀起了文生圖模型的熱潮。2022年 10 月，百度發(fā)佈了首個(gè)知識(shí)增強(qiáng)的AI作畫(huà)大模型 ERNIE-ViLG 2.0；11月初，阿里達(dá)摩院在魔搭社區(qū)ModelScope上開(kāi)放了通義文生圖大模型；11月底，智源研究院大模型研究團(tuán)隊(duì)開(kāi)源最新雙語(yǔ)AltDiffusion模型，中文世界有了專業(yè)級(jí)AI文圖創(chuàng)作工具，其在視效上媲美Stable Diffusion。

◆ ChatGPT火爆出圈

ChatGPT引爆AIGC奇點(diǎn)。2022年11月30日，OpenAI發(fā)佈免費(fèi)機(jī)器人對(duì)話模型ChatGPT（GPT-3.5系列），引發(fā)AIGC界廣泛關(guān)注。該模型中首次採(cǎi)用RLHF（從人類回饋中強(qiáng)化學(xué)習(xí)）方式，用戶與ChatGPT之間的對(duì)話互動(dòng)內(nèi)容包括日常聊天、信息諮詢、撰寫(xiě)文章、修改代碼等，對(duì)人類語(yǔ)言的理解能力更強(qiáng)，測(cè)試版發(fā)佈5天後就擁有超過(guò)100萬(wàn)用戶使用，截至2023年1月末，ChatGPT的月活用戶突破1億，成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。ChatGPT的橫空出世，讓全世界看到了AIGC的強(qiáng)大。

ChatGPT就像是一個(gè)無(wú)所不知的虛擬體，它能回答各種問(wèn)題，而且總能給到讓人滿意，甚至超過(guò)預(yù)期的答案，因此引起了極高的關(guān)注度。

ChatGPT展示出的強(qiáng)大的能力和無(wú)限可能，讓人們看到，通過(guò)ChatGPT這樣的技術(shù)方案解決很多任務(wù)的潛力。大家感到驚奇的是，在一個(gè)模型裏面就可以完成各種任務(wù)，而且是很難的任務(wù)。在過(guò)去一些看似比較困難的任務(wù)（比如問(wèn)倫理道德方面），ChatGPT也能解決得很好。

清華大學(xué)教授黃民烈認(rèn)為，ChatGPT出現(xiàn)對(duì)AI界來(lái)說(shuō)，有著十分重要的意義：「它宣示著無(wú)縫人機(jī)交互時(shí)代的來(lái)臨?！?。

從信息檢索的角度看，ChatGPT也取得了很大突破。達(dá)摩院基礎(chǔ)視覺(jué)負(fù)責(zé)人趙德麗表示，以前穀歌等搜索引擎做搜索和檢索，只是找已經(jīng)存在的信息，ChatGPT的應(yīng)用，實(shí)現(xiàn)了從信息的搜索到信息的創(chuàng)造這樣一個(gè)範(fàn)式的轉(zhuǎn)變，從演算法能力上看，它取得了一個(gè)質(zhì)的飛躍。

雖然現(xiàn)階段的 ChatGPT並不完美，但整體而言，ChatGPT的出現(xiàn)，從長(zhǎng)遠(yuǎn)來(lái)看的影響力，其實(shí)不亞於阿爾法狗曾經(jīng)在人工智能界帶來(lái)的影響力，它將會(huì)是一個(gè)影響非常深遠(yuǎn)的技術(shù)和應(yīng)用。

AIGC為什麼突然火了？

AIGC並不是一個(gè)新概念。AIGC，通常還有另一種叫法—AI Creation（人工智能創(chuàng)造），大致從2016年—2017年開(kāi)始，其應(yīng)用不斷增加，尤其是在自然語(yǔ)言領(lǐng)域，廣泛應(yīng)用在生成文本、作詩(shī)句、寫(xiě)對(duì)聯(lián)等方向，近幾年，逐漸延伸到作畫(huà)、作曲等領(lǐng)域。

◆ 技術(shù)上的關(guān)鍵突破

AIGC突然在全球躥紅，成為人人口中的流行詞。究其原因，主要由多項(xiàng)技術(shù)上的關(guān)鍵突破推動(dòng)，總結(jié)來(lái)說(shuō)：

一，演算法上：從2022年4月開(kāi)始，在文生圖視覺(jué)方向上，視覺(jué)效果生成的效果取得了突破性的進(jìn)展，文生圖的品質(zhì)得到了很大改善。OpenAI的文本生成圖像模型DALL·E 2演算法發(fā)佈後，在演算法效果上取得了和以往相比實(shí)質(zhì)性的突破，成為一個(gè)現(xiàn)象級(jí)的演算法，其在文本生成圖像生成的效果、真實(shí)度表現(xiàn)上，讓大家看到了大規(guī)模商用的前景。AI作畫(huà)任務(wù)十分直觀，給人的視覺(jué)衝擊強(qiáng)烈，使得AIGC逐漸破圈，快速傳播。

二，預(yù)訓(xùn)練大模型是AIGC的底座，沒(méi)有大模型學(xué)到的豐富知識(shí)，就無(wú)法實(shí)現(xiàn)如此豐富的AI內(nèi)容生成能力。AIGC最重要的是一種融會(huì)貫通的能力，要做領(lǐng)域的泛化，需要學(xué)習(xí)海量的數(shù)據(jù)，大模型的規(guī)模直接決定了AIGC創(chuàng)作力的廣度。多模態(tài)大模型的應(yīng)用，使得AIGC的品質(zhì)得到了較為明顯的進(jìn)步。

三，擴(kuò)散模型的發(fā)展。擴(kuò)散生成的演算法取得了突破，這個(gè)演算法能夠?qū)D像做像素級(jí)別的建模，學(xué)習(xí)效率更高。Stable Diffusion是文本生成圖像模型完全開(kāi)源的第一個(gè)演算法，它跑起來(lái)的效率相當(dāng)高，其開(kāi)源也帶動(dòng)了相關(guān)生態(tài)快速的發(fā)展，讓人們看到，基於這種生成式基礎(chǔ)模型，能夠帶來(lái)無(wú)限的創(chuàng)造和想像空間。特別是在一些國(guó)外社區(qū)裏，基於Stable Diffusion做的各種創(chuàng)新式的應(yīng)用發(fā)展快速，展現(xiàn)了商業(yè)化潛力。

四，算力降低。深度學(xué)習(xí)計(jì)算能力的快速發(fā)展。在大算力的基礎(chǔ)上，AI作畫(huà)能夠?qū)崿F(xiàn)在海量數(shù)據(jù)上進(jìn)行大參數(shù)模型的訓(xùn)練。相比之前的AIGC演算法，算力上有了很大降低。要訓(xùn)練一個(gè)基礎(chǔ)的預(yù)訓(xùn)練模型，需要很多算力。一些專注於基礎(chǔ)的大模型的機(jī)構(gòu)，將模型訓(xùn)練好後，可以供很多小企業(yè)使用，只需用消費(fèi)級(jí)的網(wǎng)卡就可以做微調(diào)，也可以直接基於API調(diào)用。預(yù)訓(xùn)練大模型加上微調(diào)可以很好地進(jìn)行文生圖生成風(fēng)格的改變，派生出了大量的二次開(kāi)發(fā)者，屢屢破圈。

◆ AIGC相關(guān)技術(shù)逐步發(fā)展成熟

AIGC包括多種內(nèi)容形式，按照黃民烈的分類方法，分為感知智能和認(rèn)知智能。（感知類：文生圖、語(yǔ)音生成、音樂(lè)生成等；認(rèn)知類：續(xù)寫(xiě)、改錯(cuò)、小說(shuō)故事創(chuàng)作、對(duì)話生成等）

從技術(shù)上看，寫(xiě)作相關(guān)和圖像生成這兩個(gè)方向表現(xiàn)比較成熟，對(duì)話最難。

其中在文本生成方面，例如在金融文本摘要生成領(lǐng)域，其技術(shù)早已成熟到可以落地的程度。ChatGPT在內(nèi)容的創(chuàng)作能力、問(wèn)答流暢度上表現(xiàn)不錯(cuò)，但要深究其真實(shí)性、正確性和時(shí)效性，還存在不少問(wèn)題。如何保證內(nèi)容的真實(shí)性、正確性和時(shí)效性，是現(xiàn)在AIGC尤其是文字類的生成需要重點(diǎn)考慮的問(wèn)題。

圖像生成方面，AI繪畫(huà)格外火熱。百度ERNIE-ViLG團(tuán)隊(duì)認(rèn)為，今年以來(lái)，AI作畫(huà)發(fā)展迅速，很大程度來(lái)自於技術(shù)的突破，使得效果有了質(zhì)的飛躍，甚至有些AI圖像作品十分驚豔。

不過(guò)，雖然AI繪畫(huà)已經(jīng)進(jìn)入實(shí)用階段，但在技術(shù)角度，生成的可控性和細(xì)節(jié)描述能力依然有很大的優(yōu)化空間。

AI生成視頻，是AI生成圖像的一種延伸。從技術(shù)本質(zhì)上看，視頻可以認(rèn)為是多張「圖片」，即視頻幀構(gòu)成的序列，且序列上各幀之間有畫(huà)面、邏輯等層面的關(guān)聯(lián)。因此，從生成品質(zhì)上來(lái)說(shuō)，AI生成視頻相對(duì)更難。

當(dāng)前文生圖技術(shù)可以通過(guò)簡(jiǎn)單的技術(shù)組合，例如分步驟擴(kuò)散生成等方式，將生成圖像擴(kuò)展到生成視頻，但效果還不能令人滿意。此外，受限於數(shù)據(jù)規(guī)模和品質(zhì)，AI生成視頻的生成效果和現(xiàn)在的文本生成圖像的效果相比，有較大差距。

總結(jié)來(lái)說(shuō)，AI按照生成圖像的方式生成視頻，仍處?kù)肚把靥剿麟A段。

商業(yè)想像力幾何？

現(xiàn)階段，AIGC的生成效果已經(jīng)非常驚豔了，大家看到，這項(xiàng)目技術(shù)已經(jīng)具備了大規(guī)模應(yīng)用和商業(yè)化的潛力和性能，具備了從只能在窄領(lǐng)域到更普遍場(chǎng)景下應(yīng)用的可能性，雖然在使用上還有較大門(mén)檻，但通過(guò)大模型的開(kāi)源開(kāi)放等，有助於將門(mén)檻降下來(lái)。

而且可喜的是，現(xiàn)在，AIGC已經(jīng)有不少可行的商業(yè)模式發(fā)生了。

◆ 「數(shù)字人 +AIGC」

AI技術(shù)在消費(fèi)領(lǐng)域的運(yùn)用已非常普遍，最近幾年，「數(shù)字人 +AIGC」成為不少企業(yè)的探索方向。在2022的世界AI會(huì)議上，「元宇宙」新聞主播、 AI數(shù)字人、VR探索遊戲等現(xiàn)身無(wú)疑昭示著這個(gè)行業(yè)正欣欣向榮。

艾媒數(shù)據(jù)顯示，虛擬人產(chǎn)業(yè)保持穩(wěn)定增長(zhǎng)態(tài)勢(shì)，2021年，中國(guó)虛擬人帶動(dòng)產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模分別為1074.9億元和62.2億元，預(yù)計(jì)2025年分別達(dá)到6402.7億元和480.6億元。在市場(chǎng)紅利的驅(qū)使下，玩家紛至遝來(lái)。

2022年12月16日，「新華社AI合成主播首次對(duì)話虛擬人」沖上微博熱搜，新華社AI合成主播受邀加盟江蘇衛(wèi)視2060，「新小浩」「新小萌」和虛擬動(dòng)漫人「電視雞」「無(wú)限少女」進(jìn)行了一場(chǎng)史無(wú)前例的新聞連線；在2022年北京冬奧會(huì)上名聲大噪的冬冬，隸屬阿里巴巴旗下，以冬奧宣推官的身份做「帶貨主播」，協(xié)助天貓奧林匹克中國(guó)旗艦店推廣奧運(yùn)特許商品；而百度推出的虛擬人林開(kāi)開(kāi)、葉悠悠則作為「暖心」弟弟、姐姐的形象，在百度輸入法中陪網(wǎng)友聊天、「談戀愛(ài)」等，給予網(wǎng)友們情感慰藉。

艾媒諮詢CEO兼首席分析師張毅稱，「AI合成人物或者說(shuō)虛擬人這種業(yè)態(tài)的出現(xiàn)，主要有以下幾個(gè)方面的原因。」首先是人工智能技術(shù)已經(jīng)比較成熟，可以支撐的方向非常多；其次，不少場(chǎng)景因?yàn)橐恍┮蛩匾呀?jīng)到了需要使用虛擬人的階段，比如商業(yè)代言、電商直播、電視臺(tái)主持等，線民對(duì)虛擬人的認(rèn)可度普遍較高並願(yuàn)意支持其發(fā)展。

◆ 實(shí)體經(jīng)濟(jì)領(lǐng)域蘊(yùn)含商機(jī)

在互聯(lián)網(wǎng)應(yīng)用之外，AIGC在實(shí)體經(jīng)濟(jì)領(lǐng)域，也蘊(yùn)含著不少機(jī)會(huì)。

實(shí)體經(jīng)濟(jì)對(duì)內(nèi)容生產(chǎn)的需求很大。「我們以前認(rèn)為實(shí)體經(jīng)濟(jì)的瓶頸在於生產(chǎn)、產(chǎn)能，其實(shí)不是，實(shí)體經(jīng)濟(jì)的很多瓶頸在於設(shè)計(jì)，在於內(nèi)容?！?小冰公司 CEO 李笛說(shuō)。以小冰為例，小冰的AIGC內(nèi)容很早就應(yīng)用在紡織設(shè)計(jì)領(lǐng)域。小冰與中國(guó)紡織信息中心、國(guó)家紡織產(chǎn)品開(kāi)發(fā)中心推出的AI圖案設(shè)計(jì)平臺(tái)，可按需定制 100% 原創(chuàng)的圖案紋樣，目前已有超過(guò) 400 家企業(yè)註冊(cè)，並在生產(chǎn)中使用。

北京智源人工智能研究院總工程師林詠華談到，工業(yè)生產(chǎn)、製造、倉(cāng)儲(chǔ)、物流等實(shí)體行業(yè)，近幾年一直在探索如何用電腦視覺(jué)來(lái)進(jìn)行智能化升級(jí)，但實(shí)際落地並不容易。原因在於，現(xiàn)有的模型品質(zhì)還未能滿足產(chǎn)業(yè)落地的品質(zhì)要求。其中一個(gè)重要原因是，訓(xùn)練模型時(shí)所用的訓(xùn)練數(shù)據(jù)十分局限。因此，可以考慮通過(guò)AIGC的方式來(lái)產(chǎn)生這些場(chǎng)景裏的訓(xùn)練數(shù)據(jù)。例如在倉(cāng)儲(chǔ)、物流或更多的工業(yè)場(chǎng)景，用AI來(lái)輔助產(chǎn)生一些少見(jiàn)的場(chǎng)景數(shù)據(jù)，作為訓(xùn)練數(shù)據(jù)的補(bǔ)充，提升整個(gè)模型的品質(zhì)。但這需要更精準(zhǔn)的圖片生成的控制能力，比較起現(xiàn)有的AIGC模型能力，其可控性需要大大提升。

AIGC在自動(dòng)駕駛場(chǎng)景下也有著不錯(cuò)的應(yīng)用潛力?，F(xiàn)在自動(dòng)駕駛場(chǎng)景存在訓(xùn)練數(shù)據(jù)不足的問(wèn)題，例如針對(duì)惡劣天氣、事故等突發(fā)狀況，視覺(jué)模型在真實(shí)場(chǎng)景中很難捕捉，也難以進(jìn)行模擬，因此，目前業(yè)內(nèi)在嘗試用數(shù)字孿生和仿真的方式來(lái)模擬。也可以嘗試用大模型的方式，通過(guò)給出描述，生成相應(yīng)的精確場(chǎng)景，緩解某些場(chǎng)景下自動(dòng)駕駛數(shù)據(jù)難獲得的問(wèn)題。

「整體來(lái)看，AIGC現(xiàn)在已經(jīng)開(kāi)始在探索向?qū)嶓w經(jīng)濟(jì)的應(yīng)用發(fā)展，但目前還在一個(gè)比較早期的階段」林詠華判斷。

小結(jié)

隨著技術(shù)日益成熟，產(chǎn)業(yè)鏈不斷形成和豐富，人工智能業(yè)務(wù)模型也將朝著多元化的方向發(fā)展，AIGC不斷助力產(chǎn)業(yè)升級(jí)。目前，虛擬人的應(yīng)用商業(yè)模式雖處?kù)短剿麟A段，但商業(yè)應(yīng)用場(chǎng)景已由最初的數(shù)字娛樂(lè)場(chǎng)景迅速擴(kuò)大到各行各業(yè)，紅利仍然存在。從B端到C端，從虛擬直播到虛擬偶像，再到虛實(shí)結(jié)合的多點(diǎn)進(jìn)發(fā)，AI創(chuàng)作的商業(yè)價(jià)值正被不斷挖掘釋放。在AI技術(shù)大發(fā)展的當(dāng)下，人工智能走向何處，又能帶來(lái)怎樣的能量，將成為行業(yè)下一步的看點(diǎn)。

除此之外，人工智能技術(shù)正在快速「進(jìn)化」，其在人類社會(huì)發(fā)展道路上的分量也越來(lái)越重，隨之而來(lái)的，人類與人工智能的和諧共處也成為科技大佬們關(guān)注的議題，就如同馬斯克在談及OpenAI的創(chuàng)始初衷所說(shuō)：「我們要怎樣做才能保證人工智能帶給我們的未來(lái)是友好的？」這個(gè)問(wèn)題的答案或許就藏在每個(gè)科學(xué)家的努力之中。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

千億市場(chǎng)大有可為 頂流「AIGC」的瘋狂與爭(zhēng)議

千億市場(chǎng)大有可為頂流「AIGC」的瘋狂與爭(zhēng)議