孫海洋
摘 要:當(dāng)下,隨著5G技術(shù)的不斷進(jìn)步與發(fā)展,產(chǎn)業(yè)不斷變革與完善,人工智能技術(shù)也更加完備與成熟,并逐漸滲透至各個(gè)領(lǐng)域。在此背景下,智能語音合成技術(shù)也逐漸向影視配音領(lǐng)域進(jìn)軍。無論是低成本、高效率的工作模式,還是高精度的語言語料庫,智能語音技術(shù)無不給影視配音行業(yè)的真人配音員施加了壓力。真人配音員作為配音行業(yè)的主體,更應(yīng)把握自身特有優(yōu)勢,以人類特有的情感創(chuàng)作表達(dá),不斷豐富屬于自身的品牌化標(biāo)志,迎接人工智能帶來的機(jī)遇與挑戰(zhàn),不斷優(yōu)化創(chuàng)作表達(dá)方式,為創(chuàng)作出更加優(yōu)質(zhì)的影視作品貢獻(xiàn)力量。
關(guān)鍵詞:人工智能;智能語音;情感;品牌化
一、智能語音的發(fā)展背景及現(xiàn)狀
隨著一輪輪產(chǎn)業(yè)的變革,人工智能技術(shù)慢慢趨于成熟,也逐漸融入傳媒行業(yè),并深刻地影響著內(nèi)容的生成、傳播的形式及敘事的模式等。5G技術(shù)的廣泛應(yīng)用,更是推動(dòng)了人工智能技術(shù)的運(yùn)用。在影視配音行業(yè)當(dāng)中,人工智能技術(shù)也得到了運(yùn)用和發(fā)展,比如科技類紀(jì)錄片《創(chuàng)新中國》,第一集講述了由創(chuàng)新引導(dǎo)的數(shù)字化變革及在技術(shù)發(fā)展下的未來景觀。節(jié)目中運(yùn)用人工智能語音合成技術(shù),讓觀眾重新聽到配音員李易的聲音。李易作為我國著名配音員,為許多紀(jì)錄片、影視劇獻(xiàn)聲,他的聲音被深深地印入觀眾的腦海之中。李易2013年因病去世,如今,通過一系列技術(shù)手段,在發(fā)音音色、吐字習(xí)慣、創(chuàng)作方式等方面將配音員李易的聲音模擬得淋漓盡致,甚至無法分辨人機(jī)之別。該節(jié)目問世后,可謂震驚了業(yè)界的眾多人士?,F(xiàn)階段,無論是播音行業(yè)還是配音行業(yè),智能語音的發(fā)展逐漸成熟,并慢慢開始推廣運(yùn)用。起初人工語音配音只為簡單內(nèi)容配音,例如,手機(jī)的天氣信息、車站機(jī)場的客運(yùn)信息、醫(yī)院餐館的排號信息等;如今,人們逐漸通過合成技術(shù)與編碼嘗試讓智能語音配音紀(jì)錄片、廣告、影視劇等。人工智能在配音行業(yè)的應(yīng)用,雖然可以使眾多配音員從單一且繁重的工作中解放出來,但作為新興技術(shù),智能語音在影視配音行業(yè)的發(fā)展仍存在著諸多問題,智能合成音頻仍處于讀字階段,于技術(shù)而言,將來還有非常大的發(fā)展和進(jìn)步空間。
二、人工智能配音的優(yōu)勢與不足
(一)運(yùn)行成本低,可應(yīng)對實(shí)時(shí)工作安排
當(dāng)前來看,所謂人工智能配音,即通過人為輸入相關(guān)程序及設(shè)置,主要依托于對人類語言的采集及對中文語言表達(dá)的編碼,根據(jù)不同的配音題材、不同的角色設(shè)定進(jìn)行有選擇性的合成,最后配合著畫面而產(chǎn)生一系列作品。
相對于傳統(tǒng)配音的工作方式,人工智能配音成本大大降低。客戶可根據(jù)自身需求對語音庫中的語音進(jìn)行一鍵合成?,F(xiàn)如今的影視配音領(lǐng)域,配音員需在甲方需求下依次進(jìn)行備稿、試音、錄制、修改及最后的修補(bǔ)出音,從配音員的時(shí)間成本及甲方的酬資成本來說,都比人工智能合成語音高。同時(shí),對于一個(gè)可以任意操控的機(jī)器來說,人們更會(huì)毫不猶豫地根據(jù)自身需要來要求它做出許多語氣及節(jié)奏等配音風(fēng)格上的修改,甚至音色的更換,這就大大節(jié)省了挑選真人配音員的時(shí)間。只要程序設(shè)置無漏洞,就必然不會(huì)出現(xiàn)錯(cuò)字、加字、漏字等問題。而對于真人配音員來說,難免會(huì)有口誤,而這些口誤的產(chǎn)生必然會(huì)影響整個(gè)工作的效率。除此之外,真人配音員最需要協(xié)調(diào)的便是錄制時(shí)間。人工智能語音本質(zhì)上是可被人類操作的機(jī)器,因此它完全可以實(shí)現(xiàn)全時(shí)工作,例如在播音行業(yè),廣西衛(wèi)視的智能AI主播“小晴”,負(fù)責(zé)《戰(zhàn)疫進(jìn)行時(shí)》節(jié)目,可以做到實(shí)時(shí)對消息進(jìn)行播讀,且可24小時(shí)全時(shí)工作。智能語音技術(shù)的前期編程與運(yùn)營或許需要幾小時(shí)、幾天的時(shí)間,設(shè)置成功后的智能語音系統(tǒng)可以實(shí)現(xiàn)24小時(shí)全時(shí)工作。對于配音行業(yè)來說,擁有一個(gè)可以24小時(shí)全時(shí)工作的智能語音機(jī)器人可以大大節(jié)約各方面的成本,提高工作效率。
(二)語料資源庫豐富,能夠適應(yīng)不同語境需求
作為集眾多新興科技為一體的AI智能語音合成技術(shù),豐富的語料資源庫可謂其顯著特色。豐富的語料資源庫是人工智能語音合成技術(shù)的前提,因?yàn)橹挥姓Z料庫足夠豐富并且精準(zhǔn),才能使機(jī)器不斷貼合真人的音色與真人所特有的表達(dá)方式。目前,人工智能語音也可以做到中外文的互相轉(zhuǎn)化,且支持多國語言混讀錄制,例如普通話、英語、日語、韓語等,不僅能為甲方完成節(jié)目制作及滿足錄音需求提供捷徑,也為我國對外的本土節(jié)目文化傳播提供了便利。生成對抗網(wǎng)絡(luò)發(fā)展至今,對智能語音這種由甲數(shù)據(jù)生成乙數(shù)據(jù)的方式不會(huì)有過多的技術(shù)問題。從通過人工智能合成配音員李易的聲音可以看到,只要語料資源庫收錄了完整且豐富的人類聲音,就可以通過高精度的在線合成技術(shù)做出與人類音色極度相似的聲音,并且表達(dá)方式中的語句停連、重音的擺放均可以實(shí)現(xiàn)高度相似。由此可見,人工智能語音合成技術(shù)可以解決許多問題,例如,配音員本人因突發(fā)情況無法錄音,這時(shí)人工智能便可以應(yīng)急來“上崗”,替人們完成節(jié)目的錄制工作。在內(nèi)容多元化發(fā)展的現(xiàn)在,受眾對于配音員所展現(xiàn)的聲音期待越來越高,各種類型的影視劇需要各種聲線甚至不同語言表達(dá)形式的配音員,例如配音行業(yè)常說的各種音色,老年音、少年音、御姐音以及蘿莉音等,而智能語音技術(shù)有望使其得到滿足。相比傳統(tǒng)的配音方式,不同性別、年齡、職業(yè)以及境遇的角色可以由同一個(gè)智能語音系統(tǒng)來完成,語料庫的不斷豐富,相比由多人共同配音制作的作品,可以更加體現(xiàn)語料資源庫的優(yōu)勢。
(三)語言表達(dá)創(chuàng)作缺乏美感
如今,隨著人工智能技術(shù)的飛速發(fā)展,智能語音技術(shù)正在不斷運(yùn)用于各種各樣的影視劇,但就目前來看,智能語音技術(shù)在語言表達(dá)方面存在著諸多問題。對于影視劇受眾而言,其不希望出現(xiàn)人工智能配音影視劇的出戲現(xiàn)象。因此,語言過硬并且沒有情感的投入是目前智能語音技術(shù)要解決的首要問題。首先,作為真人配音員來說,拿到稿件后通常需要諸多備稿的步驟,例如,播音主持當(dāng)中的備稿六步,及內(nèi)部三個(gè)技巧、外部四個(gè)技巧的把握等,從而很好地結(jié)合當(dāng)下語境、環(huán)境進(jìn)行創(chuàng)作和表達(dá);其次,把握戲劇表演中的臺(tái)詞技巧,加以平時(shí)生活中的生活經(jīng)歷與思想情感,結(jié)合即將配音的語段,將作品中人物角色的內(nèi)涵表達(dá)出來。然而,對于無思想情感的智能語音機(jī)器來說,其本身便缺少獨(dú)立的思考能力,它的運(yùn)行方式只能依附于人類為其提前設(shè)定的編碼程序,再通過一系列運(yùn)行手段進(jìn)行工作。例如:若需要其要求計(jì)劃1,則運(yùn)行聲音選項(xiàng)A;若是需要要求計(jì)劃2,則運(yùn)行聲音選項(xiàng)B等。作為機(jī)器,它只能承載簡單的關(guān)聯(lián)性運(yùn)行,而對于稿件的情感化處理則極為缺乏。人工智能配音往往聲音生硬,無法與畫面或角色相對應(yīng),使觀看或收聽的受眾容易跳脫且游離于作品或畫面之外。因此需要不斷地?cái)U(kuò)充智能語音的語料庫,無論是喜怒哀樂等基本情感,還是猶豫、陰險(xiǎn)、果敢、驚恐等情緒,如何使人工智能通過自己的“思考”而進(jìn)行表達(dá)創(chuàng)作是當(dāng)前急需解決的問題。通過智能語音合成進(jìn)行角色的配音固然會(huì)節(jié)約時(shí)間成本及后期制作成本,但就現(xiàn)在來看,智能語音合成技術(shù)尚未達(dá)到一個(gè)令人滿意的效果,仍有諸多問題需要進(jìn)一步處理。78706666-FB7D-47FD-BDDD-02E0794693A7
(四)版權(quán)倫理問題亟待解決
自有機(jī)器的概念以來,人與機(jī)器的倫理問題便開始頻頻出現(xiàn)在大眾視野當(dāng)中,例如,在當(dāng)前的廣播電視領(lǐng)域,許多AI主播都擁有了自己的名字,例如,“小晴”“果果”“小冰”等,具有名稱的它們勢必會(huì)面臨人倫方面的問題。在語音技術(shù)逐漸滲透的配音行業(yè),諸如此類的問題發(fā)人深省。首先,智能語音合成技術(shù)成本低,僅需要錄入聲音便可操作輸出。基于此,此項(xiàng)工作的門檻相對較低,勢必將會(huì)吸引許多對聲音版權(quán)問題并不熟知的人們進(jìn)入該領(lǐng)域。這里不得不再次提到復(fù)原配音員李易的聲音這個(gè)案例。即使這位配音員已于2013年離世,但人們依舊可以通過該配音員以往的聲音資料、播出的節(jié)目及訪談錄像提取聲音,通過技術(shù)化手段,一步步賦予智能語音以鮮活的、相似度極高的聲音表達(dá),并呈現(xiàn)出震驚受眾的配音作品。不妨試想,當(dāng)該技術(shù)發(fā)展成熟后,版權(quán)問題是否會(huì)更加棘手,私自使用他人聲音且令人無法辨別時(shí),更是為執(zhí)法過程增加了時(shí)間成本。其次,倫理問題。若是不法分子利用此項(xiàng)技術(shù)而合成語音錄音,敲詐甚至勒索他人,更是無法判定裁決。然而,一味地禁止平民使用智能語音技術(shù)又不夠人性化,如何讓其在合法合規(guī)的情況下運(yùn)行,是值得深思的問題。研究人工智能的初衷,是源于在市場經(jīng)濟(jì)推動(dòng)下,人們希望通過人工智能提高工作效率與經(jīng)濟(jì)效益,人們對于人工智能的存在應(yīng)保持理性的態(tài)度。待智能語音技術(shù)成熟后,若有不法分子利用語音合成去踏足法律灰色地帶,于情于理都無法容忍。因此,在當(dāng)下,智能語音合成技術(shù)的版權(quán)、人倫等問題尚未解決,需要不斷地探尋與思考。
三、影視配音行業(yè)傳播主體的創(chuàng)作策略優(yōu)化
(一)更具溫度的情感交互
從理論層面來說,現(xiàn)階段,智能語音技術(shù)只要不斷完善機(jī)器在程序上的語言學(xué)、社會(huì)學(xué)、心理學(xué)等學(xué)科樣本,就能夠逐漸實(shí)現(xiàn)對文本的情感分析進(jìn)而進(jìn)行語音的表達(dá)創(chuàng)作。但該項(xiàng)技術(shù)在發(fā)展中仍存在諸多壁壘,無法通過文本自行分析,無法表達(dá)出真正有溫度的聲音及對話。因此,在影視配音領(lǐng)域,作為真人配音員應(yīng)更具情感地進(jìn)行創(chuàng)作。
首先,在使自身聲音與畫面進(jìn)一步貼合的同時(shí),通過機(jī)器所不具備的思維處理,使語言表達(dá)打動(dòng)受眾。舉個(gè)簡單的例子,在兩人吵架時(shí),甲方說道:“你還生氣嗎?”乙方回答道:“沒?!痹谶@樣一個(gè)語境中,作為乙方,或許意思實(shí)則為生氣,但這種簡單的語氣中卻包含著豐富的社會(huì)經(jīng)驗(yàn)及心理博弈。前文提到,作為真人配音員,配音工作開始前往往要經(jīng)過許多步驟,從與導(dǎo)演溝通開始,到備稿、練習(xí)、錄制成品,再到觀看琢磨成品并接受修改意見和補(bǔ)錄,每一個(gè)步驟都需要一次次思維情感的碰撞磨合,都體現(xiàn)著人聲與畫面、思維與情感的無限交融匯通。人工智能語音合成雖然在人類的編碼和程序中能做到普通話發(fā)聲標(biāo)準(zhǔn),但對于語言表達(dá)創(chuàng)作中的停連、重音、語氣、節(jié)奏卻無法精準(zhǔn)把握,而作為具有多次創(chuàng)作能力和溝通能力的人類而言,可以通過感悟文本及畫面的內(nèi)容,進(jìn)一步通過有情感的語言將其二度創(chuàng)作出來,凸顯導(dǎo)演想要表達(dá)的意思。除此之外,作為觀看作品或節(jié)目的受眾,都具有一定的審美期待,期待的是劇情的串聯(lián)和發(fā)展,期待的是角色生動(dòng)形象的語言藝術(shù),而不是僅僅聽到標(biāo)準(zhǔn)的語音發(fā)聲。因此作為配音員,在表達(dá)過程中如何注入真實(shí)的情感,如何才能讓觀眾產(chǎn)生共鳴,如何才能更好地實(shí)現(xiàn)與觀眾的情感交流,仍是需要不斷探索與攻克的問題,更加要求真人配音員要在創(chuàng)作中以情動(dòng)人。
(二)更具個(gè)性化的品牌標(biāo)志
作為一名合格的影視配音演員,應(yīng)該具有個(gè)性化的品牌標(biāo)志,也就是說每個(gè)配音員要擁有獨(dú)特的聲線及表達(dá)方式。例如:每當(dāng)聽到由阿鯤創(chuàng)作的《舌尖上的中國》的配樂,熟悉的旋律便會(huì)讓受眾的腦海中出現(xiàn)配音員李立宏渾厚的聲音;每當(dāng)聽到國窖1573的廣告詞,便會(huì)想起配音員孫悅斌那渾厚且具有歷史感、空間感的聲音;每當(dāng)看到宮廷劇、穿越劇等,或想到“甄嬛”“羋月”,也會(huì)想起配音員季冠霖犀利明快、落落大方的聲音。
諸如此類,每一位真人配音員都具有自己的聲線特點(diǎn)和表達(dá)方式。節(jié)目的播出和人們之間的互相傳達(dá),逐漸為節(jié)目及角色冠以個(gè)性化的品牌標(biāo)志,使人們提到名字便會(huì)想起角色。智能語音合成的配音作品在無數(shù)次采集和編碼中,或許可以無限接近于原配音員本身的聲線和定位,但由于配音內(nèi)容屬于機(jī)器合成,即使擁有豐富的音色資料庫和多種語言語調(diào),仍會(huì)缺少個(gè)人所具備的特點(diǎn)及象征,即使完全一致,也無法與真人配音員相比。
當(dāng)受眾在觀看節(jié)目或作品時(shí),會(huì)常常被配音員的個(gè)人特色所吸引,例如電影“葉問”系列中的主人公葉問,是由配音員陳浩配音,同時(shí)他也配音了電影《哪吒之魔童降世》中的李靖,《海綿寶寶》國語配音中的海綿寶寶,以及手機(jī)游戲《王者榮耀》中的英雄瀾。配音員陳浩特有的豐富音色及配音風(fēng)格深受大家喜歡。許多人會(huì)因?yàn)槟澄慌湟魡T的參與而去了解一部作品,從而為作品的傳播提供助力。這是智能語音合成技術(shù)所不具備的能力。因此,現(xiàn)階段配音員更應(yīng)該在配音工作中不斷發(fā)掘自我風(fēng)格,不斷形成更具個(gè)性化的品牌標(biāo)志,從而更好地為作品的完備打好堅(jiān)實(shí)基礎(chǔ)。
四、結(jié)語
現(xiàn)階段來看,隨著智能技術(shù)的逐漸完備,智能語音合成技術(shù)確實(shí)能為配音員緩解工作壓力,提升影視藝術(shù)作品制作的工作效率,并且能進(jìn)一步開拓人機(jī)合作的未來發(fā)展前景。但是,在人工智能技術(shù)尚未完善之前,仍有諸多問題亟待解決。在此契機(jī)下,影視劇配音員更應(yīng)把握當(dāng)下,不斷提升業(yè)務(wù)水平,發(fā)揮人類特有的思維優(yōu)勢和情感優(yōu)勢,抓住眼前的機(jī)遇,勇于迎接身后的挑戰(zhàn),而不是一味地抵制和抗拒。智能語音的未來不應(yīng)僅僅是對配音稿件的二次創(chuàng)作。希望在不久的將來,人類可以通過一系列合理的方式方法,使人與機(jī)器能夠更好地合作,向著期望的方向,共同助力影視配音行業(yè)蓬勃發(fā)展。
參考文獻(xiàn):
[1]郭雨輝,張宇瑩.紀(jì)錄片創(chuàng)作中AI配音的功能性探析:以《創(chuàng)新中國》為例[J].聲屏世界,2021(11):73-74.
[2]劉倩.人工智能技術(shù)在影視傳媒領(lǐng)域的應(yīng)用[J].現(xiàn)代視聽,2018(11):25-29.
[3]郭棟,肖愛云.“互聯(lián)網(wǎng)+”趨勢下人工智能在配音中的應(yīng)用[J].西部廣播電視,2018(20):186,188.
[4]胡郁,袁春杰,王瑋.人工智能技術(shù)在傳媒領(lǐng)域的應(yīng)用:以智能語音技術(shù)為例[J].新聞與寫作,2016(11):15-17.
作者單位:
新疆藝術(shù)學(xué)院78706666-FB7D-47FD-BDDD-02E0794693A7