文/王姝雅
2019年央視網(wǎng)絡(luò)春晚,AI虛擬主播“小小撒”首次上崗,中國(guó)中央電視臺(tái)與真人撒貝寧同臺(tái)合作?!靶⌒∪觥贝蚱屏舜蟊妼?duì)機(jī)器人主持“提前輸入好固定文本”的刻板印象。在節(jié)目進(jìn)行過程中,小小撒隨機(jī)應(yīng)變參與控場(chǎng),與撒貝寧和觀眾互動(dòng)、打趣。背后的技術(shù)方表示,打造一個(gè)這樣的AI仿生主播,僅僅需要30分鐘。
所謂的AI技術(shù)就是人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。 人工智能從誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域不斷擴(kuò)大。?
近年來,隨著人工智能概念的推出,語音交互成了一個(gè)熱點(diǎn),智能助手、智能客服等應(yīng)用層出不窮。在語音交互中,主要有三個(gè)關(guān)鍵技術(shù),即語音識(shí)別、語音合成和語義理解,語音合成在其中的作用顯而易見。大眾相對(duì)了解的“聲音轉(zhuǎn)文字”的技術(shù),稱為ASR技術(shù)(Automatic Speech Recognition,語音識(shí)別)。而所謂的TTS技術(shù)(Text-To-Speech,語音合成)就是“文字轉(zhuǎn)化為聲音”再播讀出來,如今在很多手機(jī)和智能產(chǎn)品中應(yīng)用,例如蘋果的Siri、三星的Bixby、小米的小愛同學(xué)、Vivo的Jovi等聲音都是應(yīng)用TTS技術(shù)生成的。
語音合成就是以一種靈活的方式,只用極少數(shù)的基礎(chǔ)數(shù)據(jù),將語音波形文件重現(xiàn)。當(dāng)前,語音合成研究已經(jīng)進(jìn)入“文字-語音轉(zhuǎn)換(TTS)階段”,它的功能主要模塊可以劃分3大板塊:數(shù)據(jù)分析、聲音模型建立以及語音合成調(diào)整。概括起來說,語音合成的主要功能是:從語料庫中提取適合的語音元素,用TTS技術(shù)對(duì)語音元素進(jìn)行符合人類語言習(xí)慣的修改和整合,最終輸出符合人類聽覺習(xí)慣的語音。
人工智能語音合成技術(shù)在新聞播報(bào)領(lǐng)域運(yùn)用時(shí)間更長(zhǎng)、范圍更廣。在文本信息轉(zhuǎn)音頻方面,最早為了解放人們的雙眼,2016年,央視新聞客戶端、新華社客戶端率先推出智能語音播報(bào),用戶只要在界面旁邊的小按鈕一點(diǎn)就可以完整順暢地聽完所選擇的新聞播報(bào)。這樣新媒體客戶端的廣泛應(yīng)用對(duì)于受眾而言提供了更多的便捷。首先,用戶對(duì)這類有聲語言表達(dá)有非常大的寬容度。試想,在碎片時(shí)間獲取核心新聞資訊,雖然聲音整體表達(dá)美感不及真實(shí)主播,但誰又會(huì)在獲取信息之后再花費(fèi)時(shí)間去聽主播進(jìn)行播讀呢?其次,也是對(duì)用戶私人定制化內(nèi)容乃至聲音類型的滿足。以往的新聞音頻節(jié)目,用戶處于一個(gè)被動(dòng)接收的地位,釋放雙眼做事情和聽感興趣的新聞成為二選一的選項(xiàng)。對(duì)于新媒體客戶端而言,低成本、高效率、無限長(zhǎng)的工作時(shí)間、零失誤率,這顯然是現(xiàn)在乃至不久將來人工智能大施拳腳的空間。
在文本信息轉(zhuǎn)視頻方面,在2018年第五屆世界互聯(lián)網(wǎng)大會(huì)上,搜狗和新華社聯(lián)合推出全球第一個(gè)AI合成男主播“新小浩”,到2019年2月19日推出首個(gè)AI女主播“新小萌”。這一項(xiàng)技術(shù)充分運(yùn)用尖端人工智能,是進(jìn)一步推進(jìn)從媒介融合向媒體縱深發(fā)展的最新成果。新推出的AI合成主播采用了搜狗公司的“分身”技術(shù),打造出聲音更具情感、表情以及唇動(dòng)效果更加逼真自然、副語言運(yùn)用更加恰當(dāng)?shù)闹鞑バ蜗?,讓AI主播更有溫度、更加貼合真人的播講習(xí)慣。同時(shí),還可以適用于坐播或者站播等多樣播講方式,極大地豐富了AI主播的主持樣態(tài),拓展了應(yīng)用領(lǐng)域。在工作效率方面,不僅可以每天24小時(shí)不停歇地提供服務(wù),還掌握多國(guó)語言,只需后臺(tái)輸入所需播出文字內(nèi)容就可以在短時(shí)間內(nèi)高質(zhì)量生成相應(yīng)播讀視頻,展現(xiàn)與真人主播姿態(tài)、表情、聲音無異的信息傳達(dá)效果。AI合成主播上線后立即投入到新聞報(bào)道中并實(shí)現(xiàn)量產(chǎn),參與了包括第五屆世界互聯(lián)網(wǎng)大會(huì)、2019年的春運(yùn)等重要報(bào)道。這些報(bào)道憑借人工智能高度的信息整合優(yōu)勢(shì),充分結(jié)合圖片、視頻、文字等各個(gè)元素,形成一系列擁有較強(qiáng)可讀性的融媒體新聞產(chǎn)品。
2018年,中央電視臺(tái)制作了世界上第一部全片運(yùn)用人工智能和智能語音技術(shù)配音的紀(jì)錄片——《創(chuàng)新中國(guó)》,讓已逝著名配音家李易老師的聲音重現(xiàn)熒屏,并且將李易老師低沉磁性的音色模仿得淋漓盡致。這是運(yùn)用精準(zhǔn)的算法和量化手段, 將過去配音的紀(jì)錄片中聲音素材進(jìn)行提取和重組, 并且使更加貼合原聲對(duì)字、句的停連變化的相關(guān)技術(shù)算法實(shí)現(xiàn)突破。
人工智能語音合成技術(shù)對(duì)人類聲音的模擬和再塑造,在《創(chuàng)新中國(guó)》之前就已經(jīng)得到普及應(yīng)用, 比如高德地圖運(yùn)用林志玲、楊洋等明星的聲音素材進(jìn)行導(dǎo)航;Angela baby(楊穎)聲音版本的天氣播報(bào);有聲小說解放使讀者看書不再枯燥……這一系列的AI配音充分體現(xiàn)了人工智能在配音領(lǐng)域的廣泛運(yùn)用。
在一些成本預(yù)算較低的低端廣告配音市場(chǎng),由于語言生硬、腔調(diào)固定的特點(diǎn)與語音合成在建立聲紋模型之后不斷復(fù)刻所產(chǎn)生的效果特征相似。人工智能利用語音合成技術(shù),可以大大降低配音的成本和周期,并且通過算法調(diào)整完美達(dá)到廣告商的個(gè)性化需求,甚至可以通過調(diào)整聲紋模型,形成該品牌獨(dú)有的聲音標(biāo)志。由此可見,人工智能在不久的將來可能會(huì)觸動(dòng)低端廣告配音工作者的奶酪。
AI的一些衍生技術(shù)應(yīng)用于媒體傳播領(lǐng)域,在美國(guó)天氣頻道(The Weather Channel),利用AR和MR技術(shù)的結(jié)合制造出逼真的場(chǎng)景,并把這種技術(shù)稱為IMR(Immersive Mixed Reality,沉浸式混合現(xiàn)實(shí))。它把360度高清視頻、基于實(shí)時(shí)數(shù)據(jù)的增強(qiáng)和虛擬現(xiàn)實(shí)元素以及經(jīng)驗(yàn)豐富的實(shí)況播報(bào)員有機(jī)結(jié)合起來,帶領(lǐng)觀眾體驗(yàn)真實(shí)的天氣狀況,?從而使觀眾可以想象,如果自身處于這種情況,該如何自我保護(hù)。完美的視覺效果配合主持人的演技和講解,讓觀眾仿佛身臨其境于惡劣天氣的中央,所產(chǎn)生的播出效果不僅沒有那么死板無聊,反而像VR游戲、災(zāi)難類影片一樣引人入勝。在介紹美國(guó)大颶風(fēng)時(shí),隨著“洪水”效果的變化,主持人站在洪水中央,表演與講解結(jié)合向觀眾展示天氣局勢(shì),然后提供自我保護(hù)的建議。
結(jié)果顯示,干預(yù)1學(xué)年后,兒童進(jìn)行休閑性體力活動(dòng)時(shí)間明顯增加(469.31±345.89 min vs 563.10±345.88 min,P=0.005)。體力活動(dòng)水平不足(<180 min/周)的比例明顯下降(P=0.003)。尤其是每周體力活動(dòng)時(shí)間≥300min的比例明顯增加(P=0.029)。見表2。但干預(yù)前后屏幕時(shí)間差異無顯著性,7.00±50419 vs 6.13±5.838, P=0.085。
沉浸式混合現(xiàn)實(shí)技術(shù)在媒體領(lǐng)域的充分運(yùn)用,讓觀眾在直觀獲取信息的同時(shí)給予視覺上的享受與互動(dòng)。通過觀眾的一致好評(píng)以及技術(shù)的不斷進(jìn)步,可以看出“一個(gè)更好的(天氣)故事講述者”不僅是天氣預(yù)報(bào)節(jié)目的未來,更是媒體行業(yè)進(jìn)步的一個(gè)方向。在這類技術(shù)的推動(dòng)下,主持人身臨其境的演技顯得尤為重要。
人工智能技術(shù)雖然憑借高效率低成本,以及可以打破時(shí)空局限讓場(chǎng)景和聲音再現(xiàn)等獨(dú)特優(yōu)勢(shì)替代了播音一部分領(lǐng)域的工作,但由于它們過于“理性”而“感性”不足,這很大程度決定了其在具有藝術(shù)性的播音主持領(lǐng)域很難全面取代人類主持。面對(duì)人工智能這個(gè)潛在的競(jìng)爭(zhēng)“對(duì)手”,我們更應(yīng)該尋找自身不可替代的獨(dú)特優(yōu)勢(shì)加以發(fā)揚(yáng)。
鳳凰衛(wèi)視主持人吳小莉曾說:“機(jī)器人會(huì)替代我的體溫、但不會(huì)替代我說話的溫度。”的確,人工智能主持人雖“智”而不“能”,就算其再智能歸根到底是機(jī)器以及背后的程序代碼,想要達(dá)到人類的情感高度還需要更久的時(shí)間。
相比人工智能,主持人的不可替代之處在于他們的主持是有溫度的,飽含濃濃的人文情懷。在2017年的《開學(xué)第一課》上,董卿在采訪著名翻譯家許淵沖老先生時(shí),因?yàn)槔舷壬饶_不便只能坐在輪椅上。董卿在主持過程中數(shù)次為老人蹲下,甚至跪得更低。這樣的一個(gè)細(xì)節(jié)不僅照顧了輪椅上的老人而且還表達(dá)了對(duì)老人的尊重,贏得觀眾的一致好評(píng)。
在人工智能迅速發(fā)展的背景下,“做一個(gè)更有溫度的主持人”是播音主持行業(yè)和學(xué)校學(xué)習(xí)需更加注重的一項(xiàng)。微笑、點(diǎn)頭、姿態(tài)、眼神及身體接觸等副語言的表達(dá)都是一個(gè)優(yōu)秀主持人必不可少的素質(zhì)。如何讓主持人植根內(nèi)心的人文情懷帶給觀眾更加溫暖的觀感體驗(yàn),是提高當(dāng)代主持人核心競(jìng)爭(zhēng)力的要素之一。
如今,AI主播后期所有的表情動(dòng)作都依賴最開始錄制模擬的真人主播的動(dòng)作素材,再后期進(jìn)行自我整合而成的。可以想象,動(dòng)作素材的單一化可能適用于一些肢體語言并不豐富的節(jié)目類型,帶有很大程度的局限性。
因此,在主持人表演元素的融合和培養(yǎng)方面,我們可以發(fā)現(xiàn),如今表演元素不僅在綜藝節(jié)目中廣泛運(yùn)用,甚至在新聞播報(bào)、天氣預(yù)報(bào)等在大眾觀念上較嚴(yán)肅的節(jié)目類型中出現(xiàn)?!把胍暥巫邮帧敝鞆V權(quán),將新聞通過精心設(shè)計(jì)的押韻的語句講出,觀眾網(wǎng)友對(duì)此熱烈反響,可以引發(fā)我們關(guān)于“主持人表演性”的思考。
互聯(lián)網(wǎng)核心的思維是在一體化環(huán)境下,由傳統(tǒng)宣傳思維轉(zhuǎn)變?yōu)橐龑?dǎo)思維、對(duì)話思維、服務(wù)思維等大互聯(lián)網(wǎng)思維。的確,人工智能時(shí)代我們更應(yīng)該做到的就是思維的轉(zhuǎn)變升級(jí)。從美國(guó)的TWC運(yùn)用的沉浸式混合現(xiàn)實(shí)技術(shù)與主持人的演技呈現(xiàn)的天氣預(yù)報(bào),到如今江蘇衛(wèi)視等各大衛(wèi)視先后引進(jìn)“融媒體新聞演播室”,再至“一帶一路”紀(jì)錄片歐陽夏丹互動(dòng)式講解等一系列舉措,我們可以看到播音主持領(lǐng)域的新風(fēng)向——只會(huì)坐著的“念稿機(jī)器”隨時(shí)有被替代的可能性。根據(jù)節(jié)目類型適當(dāng)融入表演元素以及高校開設(shè)播音主持專業(yè)表演課程,更好地應(yīng)對(duì)當(dāng)下乃至未來的節(jié)目形態(tài)升級(jí)是非常有必要的。
如今,開發(fā)者仍在不斷嘗試訓(xùn)練和提高人工智能的自學(xué)能力,但由于其抽象能力較差往往需要更多的訓(xùn)練樣本,即使擁有較高的自學(xué)能力人工智能也很難具備記者型主持人和突發(fā)事件的主持的相關(guān)能力。例如,對(duì)現(xiàn)場(chǎng)的敏感、語言的接地氣、出鏡地點(diǎn)的選擇、道具的妥善運(yùn)用,等等。
就像在主持直播現(xiàn)場(chǎng)時(shí)經(jīng)常會(huì)遇到各種突發(fā)情況,而主持人最大的功能就是讓節(jié)目完整銜接、順利進(jìn)行。湖南衛(wèi)視主持人汪涵在《我是歌手》總決賽時(shí)遭遇孫楠意外退賽,在所有人不知所措時(shí),汪涵短暫的幾秒鐘的準(zhǔn)備,應(yīng)急說了一段入情入理的主持詞,讓湖南衛(wèi)視、孫楠和觀眾各方都釋然,讓現(xiàn)場(chǎng)氣氛繼續(xù)高漲,成為主持界的范本。而對(duì)于人工智能,即使有再多的訓(xùn)練樣本、再高的自學(xué)能力,也很難完美、有人文關(guān)懷地應(yīng)對(duì)突如其來的現(xiàn)場(chǎng)事故。
同樣,對(duì)于同一個(gè)新聞話題而言,不同的切入角度就會(huì)產(chǎn)生不同的效果。雖然人工智能在未來會(huì)改善提高自學(xué)能力,但就邏輯角度的靈活度而言很難達(dá)到人類這樣能隨著易變因素而改變策略的策劃分析。在如今通信工具極為方便的時(shí)代,角度切入引人入勝的重要性可見一斑。
因此,在人工智能時(shí)代的媒體行業(yè)中,對(duì)從業(yè)者的報(bào)道角度、邏輯線條、融媒體意識(shí)等方面有了更高的要求。白巖松在接受人民網(wǎng)專訪時(shí)曾談道:好的記者都是啄木鳥,而不是喜鵲,不是天天讓人開心,應(yīng)該從“小我”中能有所跳離,去關(guān)注一個(gè)時(shí)代,憂心忡忡地看到很多問題,并希望它改變。的確,主持人既可以從同一新聞的不同角度進(jìn)行切入,形成不同的播出效果;也可以對(duì)新聞報(bào)道背后的事實(shí)進(jìn)行挖掘,增強(qiáng)新聞的深度、多維結(jié)合的沖擊力,給觀眾帶來另一種思維和角度的分析及解讀。而這時(shí)候強(qiáng)調(diào)的就是“新”“深”,如何做到“內(nèi)容為王”,更需要主持人不斷提高自身對(duì)內(nèi)容發(fā)現(xiàn)、分析、挖掘的能力。
AI主持人如今還處于努力模仿真人主播的階段。對(duì)于一些社教節(jié)目、娛樂節(jié)目等節(jié)目類別而言,人工智能很難取代主持人在用戶大眾心中的地位,也很難完全逼真模仿再創(chuàng)新其主持風(fēng)格與人文情懷。在生活中,說起娛樂綜藝節(jié)目女主持,可能第一反應(yīng)是謝娜;說起文化類節(jié)目女主持,可能第一反應(yīng)是董卿;說起新聞評(píng)論節(jié)目,可能第一反應(yīng)是白巖松;說起紀(jì)錄片聲音,可能第一反應(yīng)是趙忠祥。所謂的“第一反應(yīng)”就是一種主持人多年形成的特有主持風(fēng)格和主持特色。
著名主持人汪涵曾經(jīng)用3句話總結(jié)自己多年的主持生涯:“學(xué)會(huì)聽話;不要迷戀掌聲;甘為綠葉,襯托嘉賓”??梢钥闯鲆粋€(gè)優(yōu)秀的主持人,他們的人格魅力、語言溫度和功力往往是一個(gè)品牌,甚至代表著一個(gè)城市乃至國(guó)家形象,再先進(jìn)的人工智能也無法替代其軟實(shí)力。而風(fēng)格千篇一律甚至采、編、播不能三位一體的主持人,他們播讀內(nèi)容的機(jī)械性、不靈活性的特點(diǎn)恰好與人工智能的優(yōu)點(diǎn)相吻合。因此,當(dāng)代主持人想提高自身核心競(jìng)爭(zhēng)力,更應(yīng)該形成自身特色風(fēng)格,打造品牌。
在人工智能時(shí)代大背景下,人工智能新技術(shù)的引入給播音主持領(lǐng)域帶來了更多新的機(jī)遇與挑戰(zhàn)。面對(duì)挑戰(zhàn),播音主持從業(yè)者以及人才培養(yǎng)更應(yīng)該堅(jiān)定信心,認(rèn)識(shí)到自身在一些領(lǐng)域的不可替代性,積極投入到藝術(shù)創(chuàng)作之中,在人工智能不能做到的地方繼續(xù)深挖自己的潛力,通過謀求自身的獨(dú)特優(yōu)勢(shì)更好地應(yīng)對(duì)挑戰(zhàn)。
在提高自身核心競(jìng)爭(zhēng)力的同時(shí),更需要順應(yīng)時(shí)代發(fā)展趨勢(shì),以一個(gè)開放包容的姿態(tài)、兼收并蓄的胸懷正確面對(duì)人工智能技術(shù)在行業(yè)內(nèi)的推廣應(yīng)用,加強(qiáng)主持人與人工智能的各方面配合,形成優(yōu)勢(shì)互補(bǔ)。發(fā)揮其在數(shù)據(jù)匯總、融媒體展示等方面的優(yōu)勢(shì),才可以“人盡其才,物盡其用,用當(dāng)其時(shí)”。