張知白
2023年,數(shù)字人直播徹底火了。根據(jù)艾媒咨詢的統(tǒng)計(jì),2022年虛擬主播(數(shù)字人)企業(yè)注冊(cè)增加數(shù)就高達(dá)948家,增速達(dá)68 %。
而數(shù)字人直播的成效也非常誘人:月薪2萬元的真人主播,換上一個(gè)數(shù)字人主播,一年就能省10萬元的成本;不用休息的數(shù)字人主播,甚至可以一頭扎在直播間里,連續(xù)24小時(shí)不間斷直播。
財(cái)經(jīng)作家吳曉波在跨年演講中更是直言:2023年每家公司可能都需要一個(gè)數(shù)字人,可以用它來做本地生活、做客服、做品牌直播、做短視頻等。
那么數(shù)字人到底是什么?真的這么好用嗎?商家、企業(yè)又該如何使用數(shù)字人直播?
逛直播間的時(shí)候,不知道大家有沒有發(fā)現(xiàn),有不少主播已經(jīng)被數(shù)字人“取代”了。這些數(shù)字人,長得和真人幾乎一模一樣,口型也和所要說的內(nèi)容保持一致,不仔細(xì)看,很難辨出主播是不是數(shù)字人。
只有粉絲在多次提出問題,主播卻始終熟視無睹后,粉絲才會(huì)在直播間提出問題:主播是AI嗎?
可能有的用戶還不清楚什么是數(shù)字人。根據(jù)百度百科的定義,數(shù)字人是運(yùn)用數(shù)字技術(shù)創(chuàng)造出來的、與人類形象接近的數(shù)字化人物形象。數(shù)字人技術(shù)發(fā)展其實(shí)有一段時(shí)間,早在 2001 年中國就啟動(dòng)了數(shù)字人領(lǐng)域的研究工作。而數(shù)字人直播,則是將這項(xiàng)技術(shù)引入直播間,為商家經(jīng)營賦能。
尤其是最近兩年,數(shù)字人涌入直播,讓普通大眾對(duì)其有了了解,而ChatGPT的大爆發(fā),則讓其發(fā)展速度有了質(zhì)的飛躍。
國內(nèi)用戶最早了解到數(shù)字人,應(yīng)該是從虛擬偶像開始:2021 年萬圣節(jié)當(dāng)天,虛擬偶像@柳夜熙以一條“捉鬼”的視頻漲粉130萬沖上熱搜,數(shù)字人技術(shù)快速地破圈,進(jìn)入不少用戶的視野。但是這個(gè)階段的數(shù)字人,樣貌與真人質(zhì)地還是有一定的差距,能明顯地看出來并非真人。到了2022年,越來越卷的直播賽道中,商家和企業(yè)為了更好地?fù)屨加脩魰r(shí)間,開始采用學(xué)名叫“2D超寫實(shí)數(shù)字人”技術(shù)。這項(xiàng)技術(shù)是以真人為基礎(chǔ)數(shù)字復(fù)刻而成模型,和真人的語言、動(dòng)作、表情幾乎一模一樣。而且操作設(shè)備也不復(fù)雜,一臺(tái)電腦、一張桌子,即可實(shí)現(xiàn)24小時(shí)直播。
2023年,數(shù)字人技術(shù)成本下降,從過去的動(dòng)輒幾十萬元,下降到幾千元,中小商家也可以用得起數(shù)字人直播了,所以今年以來數(shù)字人直播肉眼可見地增多。
同時(shí),以ChatGPT為首的AI大模型爆發(fā),接入AI后,數(shù)字人在生成直播腳本、智能應(yīng)答提問等方面有了更加迅猛的發(fā)展,讓數(shù)字人變得越來越像真人。
通過技術(shù)不斷發(fā)展、成本不斷優(yōu)化,質(zhì)優(yōu)價(jià)廉的數(shù)字人逐漸成為2023年直播界最火熱的現(xiàn)象之一。
艾媒咨詢調(diào)研顯示,目前的數(shù)字人主播分為三類:媒體型、娛樂型、電商型。
媒體型虛擬主播面向新聞媒體,替代真人主持,以播出資訊類內(nèi)容為主;娛樂型以B站活躍的大量虛擬UP主為代表,一般以二次元畫風(fēng)的“皮膚”為主要特征; 電商型主播則主要以非常接近真人主播的形象為主要特征。
2022年知名MCN遙望科技,就為旗下達(dá)人@瑜大公子打造了一款數(shù)字人模型,還將數(shù)字人和真人一起搬到直播間進(jìn)行PK。
同時(shí),用戶對(duì)數(shù)字人的接受程度也在不斷提高,艾媒咨詢調(diào)研顯示,在未來有36.7%的受訪者對(duì)虛擬主播的消費(fèi)意愿將增加。
筆者觀察下來,覺得數(shù)字人直播有兩大優(yōu)勢:
第一,節(jié)省成本。根據(jù)@Tech星球的報(bào)道,一名采用數(shù)字人直播的企業(yè)負(fù)責(zé)人提到:“數(shù)字人主要是省人力成本,一個(gè)主播平均月薪2萬元,一年也要24萬元。一個(gè)AI主播定制費(fèi)用8000元,一年系統(tǒng)使用費(fèi)8萬多元,可以省下來不少費(fèi)用。”
第二,能用好“閑時(shí)流量”。目前不少商家和企業(yè)的直播,采用的是真人和數(shù)字人搭配的直播形式。在流量更好的黃金時(shí)間段由真人負(fù)責(zé)直播,因?yàn)檎嫒酥辈ジ哂腥饲槲?,也能更及時(shí)地回答直播間里的問題,總體來說,直播間的氣氛更好。
等到真人主播下播后,數(shù)字人主播就開始上場,它們填補(bǔ)了商家和企業(yè)無真人主播直播時(shí)的時(shí)間空當(dāng),搶占更多真人主播難以覆蓋的用戶。
目前小紅書、視頻號(hào)等內(nèi)容平臺(tái)上,早已涌現(xiàn)大量數(shù)字人相關(guān)內(nèi)容,并向粉絲出售數(shù)字人的軟件包,最便宜的甚至299元就能買一套教程。但這些博主低價(jià)兜售的數(shù)字人軟件,往往質(zhì)量比較粗糙,根本無法滿足定制化服務(wù)。
而另一邊還有不少做自主研發(fā)數(shù)字人模型的公司,它們的模型質(zhì)量更優(yōu),但在價(jià)格上也會(huì)更高,根據(jù)@電商在線的調(diào)查:如果不需要定制主播形象,收費(fèi)在2500—3500元/月,包年會(huì)更加便宜,只要5980—9980元。如果要定制,就要每年額外增加2萬—3.5萬元的費(fèi)用。
數(shù)字人直播雖然話題火熱,但畢竟還是一門新技術(shù),很多商家和企業(yè)還是不會(huì)用,甚至不敢用,怕投入了時(shí)間和成本,最后還是竹籃打水一場空,什么收益都沒有。
對(duì)此,筆者采訪了已經(jīng)開始做數(shù)字人直播的商家@1號(hào)職場將其使用數(shù)字人直播的經(jīng)驗(yàn)分享給大家。
@1號(hào)職場是一家做在線招聘的商家,目前主要在支付寶上做招聘直播,黃金段時(shí)間一般由真人主播進(jìn)行,到了深夜、凌晨的時(shí)間就會(huì)由數(shù)字人代替真人主播。
1.輕成本入局?jǐn)?shù)字人直播
據(jù)創(chuàng)始人Jacky介紹,@1號(hào)職場2021年開始關(guān)注到了數(shù)字人直播,2022年6月開始引入數(shù)字人技術(shù)。
剛選擇使用數(shù)字人技術(shù)時(shí),成本比較高,一個(gè)中小企業(yè)入局就要一二十萬元,還不算后面的運(yùn)營成本。而且操作設(shè)備的成本也比較高,因?yàn)閿?shù)字人對(duì)硬件設(shè)備的要求比較高。
為了讓數(shù)字人能流暢直播,@1號(hào)職場將直播所需的所有電子設(shè)備,尤其是電腦進(jìn)行了全面升級(jí),其中所花的成本不小。
但即使花了這么多成本,他們還是遇到了不少問題,包括數(shù)字人的卡頓、難以做到真實(shí)效果的在線回答、聲音驅(qū)動(dòng)腳本也存在音畫不同步的現(xiàn)象。
幸好這些問題都在數(shù)字人技術(shù)的不斷發(fā)展中被一一解決,還有些目前沒有被解決的,Jacky也認(rèn)為,這些是肉眼可見在將來能被解決的問題,不存在技術(shù)上的難點(diǎn)。
目前數(shù)字人模型的成本大大降低,平均下來約8000元就可以配置一個(gè)可靠、可用的數(shù)字人模型。但是想要用好數(shù)字人,后續(xù)的人力及運(yùn)營成本還是不低的。
因此,@1號(hào)職場對(duì)中小商家的建議是,如果想要入局,初期可以考慮找服務(wù)商提供數(shù)字人服務(wù),降低運(yùn)營成本,等到覺得數(shù)字直播合適自己的時(shí)候,再考慮企業(yè)搭建全套數(shù)字人配套設(shè)施。
2.引入AI技術(shù),賦能直播間,降低運(yùn)營成本
在ChatGPT火了之后,@1號(hào)職場先是接入了ChatGPT,發(fā)現(xiàn)和@1號(hào)職場的需求很匹配,現(xiàn)在正在對(duì)接國內(nèi)的一些大模型。
引入AI大模型的好處是,不僅能大幅度降低運(yùn)營成本,更重要的是還能提高直播間的運(yùn)營效率。
第一,體現(xiàn)在直播腳本。以前的文字稿都是人寫的,現(xiàn)在基本上就是用AI大模型寫,用大模型把你想要的東西輸入之后,它會(huì)快速出來一段文字稿,原本需要人工一天甚至好幾天才能寫出來的腳本,用AI大模型幾個(gè)小時(shí)就能出來好幾十個(gè)不同版本。企業(yè)和商家只需要選擇合適的聲音去驅(qū)動(dòng)文本就可以進(jìn)行數(shù)字人直播。比如,像“外貿(mào)行業(yè)招聘專場”的臺(tái)詞里就有“為推動(dòng)物流業(yè)向數(shù)字化、智能化升級(jí),為全球消費(fèi)者提升全新物流體驗(yàn),為全球商家提供智能供應(yīng)鏈解決辦法……”,筆者觀察后發(fā)現(xiàn),雖然直播內(nèi)容中的臺(tái)詞有些像官方發(fā)言人所說,并不如主播那樣比較口語化、親近地講話,但數(shù)字人主播在口播崗位要求的時(shí)候非常清晰,觀眾可以清晰地聽見崗位要求,沒有吐詞不清的現(xiàn)象。
第二,體現(xiàn)在智能場控。@1號(hào)職場提到去年的時(shí)候,數(shù)字人直播還是需要一個(gè)場控來對(duì)直播內(nèi)容進(jìn)行監(jiān)控和回答提問。但是今年AI的大爆發(fā),讓數(shù)字人直播運(yùn)營只要提前在后臺(tái)配置好相應(yīng)問題的回答,只要粉絲觸發(fā)了相關(guān)問題,數(shù)字人主播就能智能應(yīng)答。現(xiàn)在的數(shù)字人直播,幾乎不需要真人場控在就可完成。
3.數(shù)字人解決效率問題,真人解決流量問題
不少用過數(shù)字人的企業(yè)和商家,說數(shù)字人技術(shù)并沒有給他們帶來想要的流量增長。
關(guān)于這個(gè)問題,@1號(hào)職場認(rèn)為,數(shù)字人只解決了效率問題,流量問題還是得需要人來解決。@1號(hào)職場認(rèn)為,不能覺得采用了數(shù)字人直播,就能一勞永逸地解決所有的直播問題。直播運(yùn)營人員還是需要花精力去研究如何獲取流量,如何制訂更好的直播內(nèi)容,并把這些輸入小模型,生成更好的直播腳本。
目前,數(shù)字人直播除了技術(shù)上的問題,還存在一些平臺(tái)政策上的問題。不少平臺(tái)對(duì)于數(shù)字人直播采取了不少限制措施,包括抖音在內(nèi)的內(nèi)容平臺(tái),還是更傾向于將流量投放給真人主播,甚至有時(shí)候數(shù)字人直播間還會(huì)被平臺(tái)封禁。
@1號(hào)職場Jacky認(rèn)為,首先數(shù)字人直播是在迅速迭代的,甚至現(xiàn)在1周就有很多次迭代。不少采用最新數(shù)字人直播技術(shù)的企業(yè),已經(jīng)很難被平臺(tái)識(shí)別并判斷出來。除了技術(shù)以外,商家和企業(yè)需要做的是不斷迭代和訓(xùn)練直播腳本內(nèi)容,讓直播腳本內(nèi)容不斷優(yōu)化,更符合粉絲的觀看習(xí)慣,這樣就不太容易被平臺(tái)封禁直播間。
其次,從長期發(fā)展規(guī)律來講的話,大家陸續(xù)都會(huì)接受,慢慢地用戶可以接受數(shù)字人和真人主播之間的這種均衡。想看真人主播的用戶可以去找真人主播,想看數(shù)字人主播內(nèi)容的粉絲就看數(shù)字人主播。
@1號(hào)職場認(rèn)為,不同行業(yè)之間數(shù)字人直播的發(fā)展是不均衡的,其主要區(qū)別在于行業(yè)數(shù)據(jù)模型訓(xùn)練。有些行業(yè)發(fā)展得快,是因?yàn)闀?huì)拿出大量的內(nèi)容訓(xùn)練模型,訓(xùn)練得越多越快,生成的內(nèi)容也越好,這對(duì)整個(gè)行業(yè)的發(fā)展其實(shí)是有推動(dòng)的。而有些行業(yè)接觸新技術(shù)的意愿不強(qiáng),模型的訓(xùn)練程度不夠高,那樣生成的內(nèi)容自然會(huì)出現(xiàn)不少問題,還需要一個(gè)很長的時(shí)間才能讓內(nèi)容符合使用標(biāo)準(zhǔn)。
數(shù)字人直播作為2023年最火熱的現(xiàn)象之一,正在如火如荼地開展。AI大模型的爆發(fā),更是讓數(shù)字人主播越來越逼真。但目前數(shù)字人直播還存在不少問題,并不能完全替代真人主播。當(dāng)下,不少內(nèi)容平臺(tái)上炒作的數(shù)字人直播風(fēng)口,也需要謹(jǐn)慎看待,仔細(xì)調(diào)研,看看適不適合自己所在的行業(yè)。
而很多適合投身數(shù)字人浪潮的企業(yè),或許該像Jacky說的那樣:面對(duì)時(shí)代的變化,最好的方式就是參與進(jìn)去,讓行業(yè)更好地發(fā)展,享受到變化的紅利。
本文來自微信公眾號(hào)運(yùn)營研究社