人工智能在播音主持領(lǐng)域的應(yīng)用現(xiàn)狀與啟示

2019-01-29 04:14王姝雅

中國(guó)傳媒科技 2019年5期

文/王姝雅

1.人工智能及語音合成技術(shù)概述

1.1 何為人工智能

2019年央視網(wǎng)絡(luò)春晚，AI虛擬主播“小小撒”首次上崗，中國(guó)中央電視臺(tái)與真人撒貝寧同臺(tái)合作?！靶⌒∪觥贝蚱屏舜蟊妼?duì)機(jī)器人主持“提前輸入好固定文本”的刻板印象。在節(jié)目進(jìn)行過程中，小小撒隨機(jī)應(yīng)變參與控場(chǎng)，與撒貝寧和觀眾互動(dòng)、打趣。背后的技術(shù)方表示，打造一個(gè)這樣的AI仿生主播，僅僅需要30分鐘。

所謂的AI技術(shù)就是人工智能（Artificial Intelligence），英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能從誕生以來，理論和技術(shù)日益成熟，應(yīng)用領(lǐng)域不斷擴(kuò)大。?

1.2 語音交互與語音合成技術(shù)的突破進(jìn)展

近年來，隨著人工智能概念的推出，語音交互成了一個(gè)熱點(diǎn)，智能助手、智能客服等應(yīng)用層出不窮。在語音交互中，主要有三個(gè)關(guān)鍵技術(shù)，即語音識(shí)別、語音合成和語義理解，語音合成在其中的作用顯而易見。大眾相對(duì)了解的“聲音轉(zhuǎn)文字”的技術(shù)，稱為ASR技術(shù)（Automatic Speech Recognition，語音識(shí)別）。而所謂的TTS技術(shù)（Text-To-Speech，語音合成）就是“文字轉(zhuǎn)化為聲音”再播讀出來，如今在很多手機(jī)和智能產(chǎn)品中應(yīng)用，例如蘋果的Siri、三星的Bixby、小米的小愛同學(xué)、Vivo的Jovi等聲音都是應(yīng)用TTS技術(shù)生成的。

語音合成就是以一種靈活的方式，只用極少數(shù)的基礎(chǔ)數(shù)據(jù)，將語音波形文件重現(xiàn)。當(dāng)前，語音合成研究已經(jīng)進(jìn)入“文字-語音轉(zhuǎn)換（TTS）階段”，它的功能主要模塊可以劃分3大板塊：數(shù)據(jù)分析、聲音模型建立以及語音合成調(diào)整。概括起來說，語音合成的主要功能是：從語料庫中提取適合的語音元素，用TTS技術(shù)對(duì)語音元素進(jìn)行符合人類語言習(xí)慣的修改和整合，最終輸出符合人類聽覺習(xí)慣的語音。

2.人工智能及語音合成技術(shù)在播音主持行業(yè)的應(yīng)用現(xiàn)狀

2.1 新聞播報(bào)——極高工作效率、極低工作成本

人工智能語音合成技術(shù)在新聞播報(bào)領(lǐng)域運(yùn)用時(shí)間更長(zhǎng)、范圍更廣。在文本信息轉(zhuǎn)音頻方面，最早為了解放人們的雙眼，2016年，央視新聞客戶端、新華社客戶端率先推出智能語音播報(bào)，用戶只要在界面旁邊的小按鈕一點(diǎn)就可以完整順暢地聽完所選擇的新聞播報(bào)。這樣新媒體客戶端的廣泛應(yīng)用對(duì)于受眾而言提供了更多的便捷。首先，用戶對(duì)這類有聲語言表達(dá)有非常大的寬容度。試想，在碎片時(shí)間獲取核心新聞資訊，雖然聲音整體表達(dá)美感不及真實(shí)主播，但誰又會(huì)在獲取信息之后再花費(fèi)時(shí)間去聽主播進(jìn)行播讀呢？其次，也是對(duì)用戶私人定制化內(nèi)容乃至聲音類型的滿足。以往的新聞音頻節(jié)目，用戶處于一個(gè)被動(dòng)接收的地位，釋放雙眼做事情和聽感興趣的新聞成為二選一的選項(xiàng)。對(duì)于新媒體客戶端而言，低成本、高效率、無限長(zhǎng)的工作時(shí)間、零失誤率，這顯然是現(xiàn)在乃至不久將來人工智能大施拳腳的空間。

在文本信息轉(zhuǎn)視頻方面，在2018年第五屆世界互聯(lián)網(wǎng)大會(huì)上，搜狗和新華社聯(lián)合推出全球第一個(gè)AI合成男主播“新小浩”，到2019年2月19日推出首個(gè)AI女主播“新小萌”。這一項(xiàng)技術(shù)充分運(yùn)用尖端人工智能，是進(jìn)一步推進(jìn)從媒介融合向媒體縱深發(fā)展的最新成果。新推出的AI合成主播采用了搜狗公司的“分身”技術(shù)，打造出聲音更具情感、表情以及唇動(dòng)效果更加逼真自然、副語言運(yùn)用更加恰當(dāng)?shù)闹鞑バ蜗?，讓AI主播更有溫度、更加貼合真人的播講習(xí)慣。同時(shí)，還可以適用于坐播或者站播等多樣播講方式，極大地豐富了AI主播的主持樣態(tài)，拓展了應(yīng)用領(lǐng)域。在工作效率方面，不僅可以每天24小時(shí)不停歇地提供服務(wù)，還掌握多國(guó)語言，只需后臺(tái)輸入所需播出文字內(nèi)容就可以在短時(shí)間內(nèi)高質(zhì)量生成相應(yīng)播讀視頻，展現(xiàn)與真人主播姿態(tài)、表情、聲音無異的信息傳達(dá)效果。AI合成主播上線后立即投入到新聞報(bào)道中并實(shí)現(xiàn)量產(chǎn)，參與了包括第五屆世界互聯(lián)網(wǎng)大會(huì)、2019年的春運(yùn)等重要報(bào)道。這些報(bào)道憑借人工智能高度的信息整合優(yōu)勢(shì)，充分結(jié)合圖片、視頻、文字等各個(gè)元素，形成一系列擁有較強(qiáng)可讀性的融媒體新聞產(chǎn)品。

2.2 配音行業(yè)——復(fù)原已逝優(yōu)質(zhì)聲音

2018年，中央電視臺(tái)制作了世界上第一部全片運(yùn)用人工智能和智能語音技術(shù)配音的紀(jì)錄片——《創(chuàng)新中國(guó)》，讓已逝著名配音家李易老師的聲音重現(xiàn)熒屏，并且將李易老師低沉磁性的音色模仿得淋漓盡致。這是運(yùn)用精準(zhǔn)的算法和量化手段, 將過去配音的紀(jì)錄片中聲音素材進(jìn)行提取和重組, 并且使更加貼合原聲對(duì)字、句的停連變化的相關(guān)技術(shù)算法實(shí)現(xiàn)突破。

人工智能語音合成技術(shù)對(duì)人類聲音的模擬和再塑造,在《創(chuàng)新中國(guó)》之前就已經(jīng)得到普及應(yīng)用, 比如高德地圖運(yùn)用林志玲、楊洋等明星的聲音素材進(jìn)行導(dǎo)航；Angela baby（楊穎）聲音版本的天氣播報(bào)；有聲小說解放使讀者看書不再枯燥……這一系列的AI配音充分體現(xiàn)了人工智能在配音領(lǐng)域的廣泛運(yùn)用。

在一些成本預(yù)算較低的低端廣告配音市場(chǎng)，由于語言生硬、腔調(diào)固定的特點(diǎn)與語音合成在建立聲紋模型之后不斷復(fù)刻所產(chǎn)生的效果特征相似。人工智能利用語音合成技術(shù)，可以大大降低配音的成本和周期，并且通過算法調(diào)整完美達(dá)到廣告商的個(gè)性化需求，甚至可以通過調(diào)整聲紋模型，形成該品牌獨(dú)有的聲音標(biāo)志。由此可見，人工智能在不久的將來可能會(huì)觸動(dòng)低端廣告配音工作者的奶酪。

2.3 沉浸式混合現(xiàn)實(shí)——重塑場(chǎng)景完成不可能的主持

AI的一些衍生技術(shù)應(yīng)用于媒體傳播領(lǐng)域，在美國(guó)天氣頻道（The Weather Channel），利用AR和MR技術(shù)的結(jié)合制造出逼真的場(chǎng)景，并把這種技術(shù)稱為IMR（Immersive Mixed Reality，沉浸式混合現(xiàn)實(shí)）。它把360度高清視頻、基于實(shí)時(shí)數(shù)據(jù)的增強(qiáng)和虛擬現(xiàn)實(shí)元素以及經(jīng)驗(yàn)豐富的實(shí)況播報(bào)員有機(jī)結(jié)合起來，帶領(lǐng)觀眾體驗(yàn)真實(shí)的天氣狀況,?從而使觀眾可以想象，如果自身處于這種情況，該如何自我保護(hù)。完美的視覺效果配合主持人的演技和講解，讓觀眾仿佛身臨其境于惡劣天氣的中央，所產(chǎn)生的播出效果不僅沒有那么死板無聊，反而像VR游戲、災(zāi)難類影片一樣引人入勝。在介紹美國(guó)大颶風(fēng)時(shí)，隨著“洪水”效果的變化，主持人站在洪水中央，表演與講解結(jié)合向觀眾展示天氣局勢(shì)，然后提供自我保護(hù)的建議。

結(jié)果顯示，干預(yù)1學(xué)年后，兒童進(jìn)行休閑性體力活動(dòng)時(shí)間明顯增加(469.31±345.89 min vs 563.10±345.88 min，P=0.005)。體力活動(dòng)水平不足(<180 min/周)的比例明顯下降(P=0.003)。尤其是每周體力活動(dòng)時(shí)間≥300min的比例明顯增加(P=0.029)。見表2。但干預(yù)前后屏幕時(shí)間差異無顯著性，7.00±50419 vs 6.13±5.838, P=0.085。

沉浸式混合現(xiàn)實(shí)技術(shù)在媒體領(lǐng)域的充分運(yùn)用，讓觀眾在直觀獲取信息的同時(shí)給予視覺上的享受與互動(dòng)。通過觀眾的一致好評(píng)以及技術(shù)的不斷進(jìn)步，可以看出“一個(gè)更好的（天氣）故事講述者”不僅是天氣預(yù)報(bào)節(jié)目的未來，更是媒體行業(yè)進(jìn)步的一個(gè)方向。在這類技術(shù)的推動(dòng)下，主持人身臨其境的演技顯得尤為重要。

3.人工智能背景下播音員主持人的應(yīng)對(duì)思路

人工智能技術(shù)雖然憑借高效率低成本，以及可以打破時(shí)空局限讓場(chǎng)景和聲音再現(xiàn)等獨(dú)特優(yōu)勢(shì)替代了播音一部分領(lǐng)域的工作，但由于它們過于“理性”而“感性”不足，這很大程度決定了其在具有藝術(shù)性的播音主持領(lǐng)域很難全面取代人類主持。面對(duì)人工智能這個(gè)潛在的競(jìng)爭(zhēng)“對(duì)手”，我們更應(yīng)該尋找自身不可替代的獨(dú)特優(yōu)勢(shì)加以發(fā)揚(yáng)。

3.1 感情恰切，形成共鳴

鳳凰衛(wèi)視主持人吳小莉曾說：“機(jī)器人會(huì)替代我的體溫、但不會(huì)替代我說話的溫度。”的確，人工智能主持人雖“智”而不“能”，就算其再智能歸根到底是機(jī)器以及背后的程序代碼，想要達(dá)到人類的情感高度還需要更久的時(shí)間。

相比人工智能，主持人的不可替代之處在于他們的主持是有溫度的，飽含濃濃的人文情懷。在2017年的《開學(xué)第一課》上，董卿在采訪著名翻譯家許淵沖老先生時(shí)，因?yàn)槔舷壬饶_不便只能坐在輪椅上。董卿在主持過程中數(shù)次為老人蹲下，甚至跪得更低。這樣的一個(gè)細(xì)節(jié)不僅照顧了輪椅上的老人而且還表達(dá)了對(duì)老人的尊重，贏得觀眾的一致好評(píng)。

在人工智能迅速發(fā)展的背景下，“做一個(gè)更有溫度的主持人”是播音主持行業(yè)和學(xué)校學(xué)習(xí)需更加注重的一項(xiàng)。微笑、點(diǎn)頭、姿態(tài)、眼神及身體接觸等副語言的表達(dá)都是一個(gè)優(yōu)秀主持人必不可少的素質(zhì)。如何讓主持人植根內(nèi)心的人文情懷帶給觀眾更加溫暖的觀感體驗(yàn)，是提高當(dāng)代主持人核心競(jìng)爭(zhēng)力的要素之一。

3.2 表演自然，創(chuàng)新表達(dá)

如今，AI主播后期所有的表情動(dòng)作都依賴最開始錄制模擬的真人主播的動(dòng)作素材，再后期進(jìn)行自我整合而成的。可以想象，動(dòng)作素材的單一化可能適用于一些肢體語言并不豐富的節(jié)目類型，帶有很大程度的局限性。

因此，在主持人表演元素的融合和培養(yǎng)方面，我們可以發(fā)現(xiàn)，如今表演元素不僅在綜藝節(jié)目中廣泛運(yùn)用，甚至在新聞播報(bào)、天氣預(yù)報(bào)等在大眾觀念上較嚴(yán)肅的節(jié)目類型中出現(xiàn)?！把胍暥巫邮帧敝鞆V權(quán)，將新聞通過精心設(shè)計(jì)的押韻的語句講出，觀眾網(wǎng)友對(duì)此熱烈反響，可以引發(fā)我們關(guān)于“主持人表演性”的思考。

互聯(lián)網(wǎng)核心的思維是在一體化環(huán)境下，由傳統(tǒng)宣傳思維轉(zhuǎn)變?yōu)橐龑?dǎo)思維、對(duì)話思維、服務(wù)思維等大互聯(lián)網(wǎng)思維。的確，人工智能時(shí)代我們更應(yīng)該做到的就是思維的轉(zhuǎn)變升級(jí)。從美國(guó)的TWC運(yùn)用的沉浸式混合現(xiàn)實(shí)技術(shù)與主持人的演技呈現(xiàn)的天氣預(yù)報(bào)，到如今江蘇衛(wèi)視等各大衛(wèi)視先后引進(jìn)“融媒體新聞演播室”，再至“一帶一路”紀(jì)錄片歐陽夏丹互動(dòng)式講解等一系列舉措，我們可以看到播音主持領(lǐng)域的新風(fēng)向——只會(huì)坐著的“念稿機(jī)器”隨時(shí)有被替代的可能性。根據(jù)節(jié)目類型適當(dāng)融入表演元素以及高校開設(shè)播音主持專業(yè)表演課程，更好地應(yīng)對(duì)當(dāng)下乃至未來的節(jié)目形態(tài)升級(jí)是非常有必要的。

3.3 應(yīng)變救場(chǎng)，靈活應(yīng)對(duì)

如今，開發(fā)者仍在不斷嘗試訓(xùn)練和提高人工智能的自學(xué)能力，但由于其抽象能力較差往往需要更多的訓(xùn)練樣本，即使擁有較高的自學(xué)能力人工智能也很難具備記者型主持人和突發(fā)事件的主持的相關(guān)能力。例如，對(duì)現(xiàn)場(chǎng)的敏感、語言的接地氣、出鏡地點(diǎn)的選擇、道具的妥善運(yùn)用，等等。

就像在主持直播現(xiàn)場(chǎng)時(shí)經(jīng)常會(huì)遇到各種突發(fā)情況，而主持人最大的功能就是讓節(jié)目完整銜接、順利進(jìn)行。湖南衛(wèi)視主持人汪涵在《我是歌手》總決賽時(shí)遭遇孫楠意外退賽，在所有人不知所措時(shí)，汪涵短暫的幾秒鐘的準(zhǔn)備，應(yīng)急說了一段入情入理的主持詞，讓湖南衛(wèi)視、孫楠和觀眾各方都釋然，讓現(xiàn)場(chǎng)氣氛繼續(xù)高漲，成為主持界的范本。而對(duì)于人工智能，即使有再多的訓(xùn)練樣本、再高的自學(xué)能力，也很難完美、有人文關(guān)懷地應(yīng)對(duì)突如其來的現(xiàn)場(chǎng)事故。

3.4 角度新穎，邏輯縝密

同樣，對(duì)于同一個(gè)新聞話題而言，不同的切入角度就會(huì)產(chǎn)生不同的效果。雖然人工智能在未來會(huì)改善提高自學(xué)能力，但就邏輯角度的靈活度而言很難達(dá)到人類這樣能隨著易變因素而改變策略的策劃分析。在如今通信工具極為方便的時(shí)代，角度切入引人入勝的重要性可見一斑。

因此，在人工智能時(shí)代的媒體行業(yè)中，對(duì)從業(yè)者的報(bào)道角度、邏輯線條、融媒體意識(shí)等方面有了更高的要求。白巖松在接受人民網(wǎng)專訪時(shí)曾談道：好的記者都是啄木鳥，而不是喜鵲，不是天天讓人開心，應(yīng)該從“小我”中能有所跳離，去關(guān)注一個(gè)時(shí)代，憂心忡忡地看到很多問題，并希望它改變。的確，主持人既可以從同一新聞的不同角度進(jìn)行切入，形成不同的播出效果；也可以對(duì)新聞報(bào)道背后的事實(shí)進(jìn)行挖掘，增強(qiáng)新聞的深度、多維結(jié)合的沖擊力，給觀眾帶來另一種思維和角度的分析及解讀。而這時(shí)候強(qiáng)調(diào)的就是“新”“深”，如何做到“內(nèi)容為王”，更需要主持人不斷提高自身對(duì)內(nèi)容發(fā)現(xiàn)、分析、挖掘的能力。

3.5 形成風(fēng)格，打造品牌

AI主持人如今還處于努力模仿真人主播的階段。對(duì)于一些社教節(jié)目、娛樂節(jié)目等節(jié)目類別而言，人工智能很難取代主持人在用戶大眾心中的地位，也很難完全逼真模仿再創(chuàng)新其主持風(fēng)格與人文情懷。在生活中，說起娛樂綜藝節(jié)目女主持，可能第一反應(yīng)是謝娜；說起文化類節(jié)目女主持，可能第一反應(yīng)是董卿；說起新聞評(píng)論節(jié)目，可能第一反應(yīng)是白巖松；說起紀(jì)錄片聲音，可能第一反應(yīng)是趙忠祥。所謂的“第一反應(yīng)”就是一種主持人多年形成的特有主持風(fēng)格和主持特色。

著名主持人汪涵曾經(jīng)用3句話總結(jié)自己多年的主持生涯：“學(xué)會(huì)聽話；不要迷戀掌聲；甘為綠葉，襯托嘉賓”?？梢钥闯鲆粋€(gè)優(yōu)秀的主持人，他們的人格魅力、語言溫度和功力往往是一個(gè)品牌，甚至代表著一個(gè)城市乃至國(guó)家形象，再先進(jìn)的人工智能也無法替代其軟實(shí)力。而風(fēng)格千篇一律甚至采、編、播不能三位一體的主持人，他們播讀內(nèi)容的機(jī)械性、不靈活性的特點(diǎn)恰好與人工智能的優(yōu)點(diǎn)相吻合。因此，當(dāng)代主持人想提高自身核心競(jìng)爭(zhēng)力，更應(yīng)該形成自身特色風(fēng)格，打造品牌。

結(jié)語

在人工智能時(shí)代大背景下，人工智能新技術(shù)的引入給播音主持領(lǐng)域帶來了更多新的機(jī)遇與挑戰(zhàn)。面對(duì)挑戰(zhàn)，播音主持從業(yè)者以及人才培養(yǎng)更應(yīng)該堅(jiān)定信心，認(rèn)識(shí)到自身在一些領(lǐng)域的不可替代性，積極投入到藝術(shù)創(chuàng)作之中，在人工智能不能做到的地方繼續(xù)深挖自己的潛力，通過謀求自身的獨(dú)特優(yōu)勢(shì)更好地應(yīng)對(duì)挑戰(zhàn)。

在提高自身核心競(jìng)爭(zhēng)力的同時(shí)，更需要順應(yīng)時(shí)代發(fā)展趨勢(shì)，以一個(gè)開放包容的姿態(tài)、兼收并蓄的胸懷正確面對(duì)人工智能技術(shù)在行業(yè)內(nèi)的推廣應(yīng)用，加強(qiáng)主持人與人工智能的各方面配合，形成優(yōu)勢(shì)互補(bǔ)。發(fā)揮其在數(shù)據(jù)匯總、融媒體展示等方面的優(yōu)勢(shì)，才可以“人盡其才，物盡其用，用當(dāng)其時(shí)”。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡