彭婷婷
[摘要]隨著人工智能技術(shù)不斷成熟,人工智能語音被廣泛應(yīng)用于各個領(lǐng)域。文章從翻譯的視角對人工智能配音技術(shù)在影視領(lǐng)域的發(fā)展進(jìn)行探討,從人工智能配音的優(yōu)勢與劣勢著手,分析人工智能配音在影視方面的優(yōu)勢及其新進(jìn)展,從而提出人工智能影視配音的發(fā)展方向,以期未來人工智能配音在翻譯和影視領(lǐng)域發(fā)揮更加重要的作用。
[關(guān)鍵詞]人工智能配音;影視配音;翻譯;情感
一、人工智能配音的歷史
人工智能配音的歷史可以追溯到早期的語音合成技術(shù),語音合成又稱文語轉(zhuǎn)換(Text To Speech,以下簡稱TTS)技術(shù),語音合成是一種由計算機(jī)將文本轉(zhuǎn)換為語音的技術(shù)[1],旨在讓機(jī)器生成自然、動聽的人類語音。最早的TTS技術(shù)在20世紀(jì)50年代開始出現(xiàn),但當(dāng)時的聲音合成效果相對較差,聲音質(zhì)量和自然度都受到限制。而隨著計算機(jī)性能提升和語音處理算法不斷完善,TTS技術(shù)變得更加成熟。
人工智能的發(fā)展給語音合成帶來了顛覆性的變革?;谏窠?jīng)網(wǎng)絡(luò)的TTS可以將文本轉(zhuǎn)換成更加近似于真實的語音。神經(jīng)網(wǎng)絡(luò)TTS技術(shù)通過搜集大量的數(shù)據(jù),應(yīng)用深度學(xué)習(xí)技術(shù),采用數(shù)據(jù)驅(qū)動的方式對文本進(jìn)行細(xì)節(jié)分析和語音合成,從而生成更加自然的人類語音。經(jīng)過人工智能調(diào)節(jié)的TTS技術(shù)給傳統(tǒng)的TTS技術(shù)帶來了顛覆性的改變[2],其可以實現(xiàn)更加自然和準(zhǔn)確的語言表達(dá),實現(xiàn)了真正意義上的語音擬人化。隨著深度學(xué)習(xí)算法嶄露頭角,人工智能配音迎來了新的發(fā)展。深度學(xué)習(xí)算法通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),使計算機(jī)能夠處理更加復(fù)雜的語音數(shù)據(jù),使語音合成變得更加智能。通過深度學(xué)習(xí),TTS技術(shù)能夠更好地理解文本的語境和情感,生成更加自然、流暢的語音。
二、人工智能配音在翻譯方面的應(yīng)用
(一)人工智能配音在翻譯方面的優(yōu)勢
第一,人工智能配音可以實現(xiàn)實時、快速的口譯,這對需要迅速理解外語內(nèi)容或進(jìn)行基本翻譯的情境非常有用,如旅行、會議等。筆者曾對高職院校在校學(xué)生做過關(guān)于“人工智能翻譯與人工翻譯”的問卷調(diào)查,根據(jù)收集的505份有效調(diào)查問卷,發(fā)現(xiàn)80.21%的受調(diào)查者認(rèn)為人工智能翻譯比人工翻譯更加方便快捷。第二,作為工作者的“人”始終要面對來自工作時間的生理限制,而人工智能卻可以克服人類生理限制[3],實現(xiàn)24小時全天候、不間歇地處理大量的文本或語音內(nèi)容。這使得它在大規(guī)模翻譯任務(wù)中具有優(yōu)勢。第三,人工智能配音可以支持多種語言,滿足使用者多語種翻譯的需求,這在跨國際和跨文化交流中作用顯著。第四,與人工智能技術(shù)在新聞寫作中起到降低經(jīng)濟(jì)成本的作用一樣[4],
人工智能配音也能降低配音的成本,其通常比雇傭譯員更加經(jīng)濟(jì)高效。第五,人工智能配音可以與譯員合作,加快翻譯流程,具體體現(xiàn)為人工智能配音整體進(jìn)行翻譯之后由譯員加以編輯審核。有關(guān)資料顯示,人工智能配音與譯員合作翻譯的正確性和時效性都遠(yuǎn)高于人工翻譯,在翻譯同一任務(wù)時,人工智能配音與譯員合作翻譯比人工翻譯用時少了近30%[5]。第六,人工智能配音允許用戶自定義語音風(fēng)格和聲音特點,以滿足特定行業(yè)或領(lǐng)域的術(shù)語和要求,這使得它在專業(yè)化領(lǐng)域的翻譯中發(fā)揮重要作用,如醫(yī)學(xué)、法律、科學(xué)等領(lǐng)域。
(二)人工智能配音在翻譯方面的不足
1.人工智能配音在情感表達(dá)方面仍然存在限制
根據(jù)筆者收集的505份調(diào)查問卷,有85.77%的受調(diào)查者會選擇觀看人工翻譯的電影。情感表達(dá)是電影的關(guān)鍵要素之一,真人配音員通常能夠更好地表達(dá)這些情感,他們可以根據(jù)源語和目的語之間的文化差異,在不改變源語語意的情況下,做出更貼切的翻譯,同時,真人配音員還可以根據(jù)電影情節(jié)和場景融入情感進(jìn)行表演。而人工智能配音在這方面可能會出現(xiàn)語音的不自然或機(jī)械感,同時難以捕捉和傳達(dá)電影中復(fù)雜的情感,在情感方面無法引起觀眾的共鳴,從而影響觀眾的觀影體驗。此外,人工智能配音缺乏創(chuàng)造力和自主性。它們只能執(zhí)行被編程和訓(xùn)練過的任務(wù),無法自行創(chuàng)造新的聲音或角色。現(xiàn)在部分公司采用的“一鍵生成”人工智能配音系統(tǒng),通過人工智能技術(shù)將文字直接轉(zhuǎn)化為聲音[6],這種方式因為成本低廉且高效,而主要用于批量化的低成本短視頻制作。
2.人工智能配音翻譯系統(tǒng)存在多個內(nèi)在缺陷
基于姜澤瑋的研究[7],筆者總結(jié)了人工智能配音在翻譯方面存在的問題。第一,人工智能配音翻譯系統(tǒng)存在語音錯誤,包括字音準(zhǔn)確性和聲調(diào)錯誤。這些錯誤可能導(dǎo)致聽者對文本的整體理解出現(xiàn)偏差,特別是在涉及多音字或多義詞的情況下。第二,人工智能配音翻譯系統(tǒng)存在同質(zhì)化問題,即在語速和重音方面缺乏多樣性。這可能導(dǎo)致翻譯內(nèi)容聽起來較為機(jī)械,缺乏個性化和表現(xiàn)力。第三,人工智能配音翻譯系統(tǒng)在句子重音的使用頻率和表達(dá)方式上存在問題。這可能導(dǎo)致聽者在聽覺上感受到重音薄弱或缺失,從而影響翻譯的質(zhì)量。第四,人工智能配音翻譯系統(tǒng)的停頓點在某些情況下會出現(xiàn)錯誤,導(dǎo)致文意的改變,影響聽者對翻譯內(nèi)容的理解。這些內(nèi)在缺陷限制了人工智能配音在翻譯方面的應(yīng)用,使得人工智能配音在當(dāng)下仍無法完全替代真人翻譯,特別是在涉及復(fù)雜語音特性和語音表達(dá)的情況下。
三、人工智能配音在影視方面的應(yīng)用
(一)人工智能配音在影視方面的優(yōu)勢
在影視配音領(lǐng)域,人工智能配音具有顯著的優(yōu)勢。第一,人工智能配音在音頻還原方面取得了巨大進(jìn)展。通過復(fù)雜的算法和大量的聲音樣本分析,人工智能配音能夠生成高度還原的音頻,幾乎媲美真人配音,并且聲音的質(zhì)量、語音合成的準(zhǔn)確性以及情感表達(dá)的細(xì)膩度都得到了顯著提升。例如,2018年,中央電視臺聯(lián)合深圳市委宣傳部推出的紀(jì)錄片《創(chuàng)新中國》全程使用人工智能配音,還原了已故播音員李易的聲音。這一技術(shù)展示了高度還原的配音效果,人工智能配音的質(zhì)量正在不斷接近真人配音員的水平,其精準(zhǔn)的字音、流暢的語速和自然的節(jié)奏都使觀眾驚嘆科技的進(jìn)步[8]。事實上,該紀(jì)錄片也因為其出色的人工智能配音效果被評選為2018年度中國最具影響力的十大紀(jì)錄片之一[9]。第二,人工智能配音具備高效、便捷的特點,且成本相對較低。它可以實現(xiàn)全天候、高質(zhì)量的配音服務(wù),不受時間和個體的生理限制。相比之下,真人配音員可能會受到連續(xù)配音對聲帶的傷害,而影響配音的效率和質(zhì)量。當(dāng)前的視頻剪輯軟件和配音軟件已廣泛應(yīng)用人工智能配音,用戶可以輕松實現(xiàn)從文字到語音的轉(zhuǎn)換,解決了配音難、配音費用高的問題。所有這些因素使得人工智能配音在影視配音領(lǐng)域擁有巨大的優(yōu)勢,人工智能配音為電影、紀(jì)錄片等影視作品的制作提供了更高效、更多樣化的選擇。
(二)人工智能配音在影視方面的發(fā)展
好萊塢導(dǎo)演斯科特·曼以及Flawless AI首席行政官在接受美國有線電視新聞網(wǎng)采訪時提到了兩個成功案例,這些案例展示了人工智能配音在影視配音領(lǐng)域的新進(jìn)展。首先,斯科特·曼提到,在2022年北美上映的生存驚悚電影《墜落》[10]的后期制作中,后期工作人員通過人工智能配音來替換演員的一些配音,從而成功地將電影的評級從受限制的R級降低到了更適合家庭觀看的PG-13級。這一案例突顯了人工智能配音在電影后期制作中的潛力,可以快速而有效地進(jìn)行內(nèi)容編輯,以滿足不同觀眾的需求,同時降低制作成本。其次,斯科特·曼舉提到的另一個成功案例則涉及電影《阿甘正傳》[11]。在這部電影中,后期工作人員通過人工智能配音使主演湯姆·漢克斯能夠使用不同國家的語言完成獨白,包括德語、日語和西班牙語。這種技術(shù)不僅保持了演員的表演風(fēng)格,還通過人工智能的聲音合成技術(shù)實現(xiàn)了發(fā)音唇形與語言種類的完美匹配。這為不同地區(qū)的觀眾創(chuàng)造了一種前所未有的沉浸式體驗,使他們能夠更好地融入電影故事中。最后,斯科特·曼在采訪中還介紹了Flawless AI的技術(shù),他解釋了Flawless AI的真實同步修復(fù)程序的工作原理,該程序使用生成式人工智能技術(shù)進(jìn)行電影配音的修復(fù),使演員能夠使用不同語言進(jìn)行表演,而無須進(jìn)行重拍。該程序能夠?qū)θ四樳M(jìn)行深度學(xué)習(xí)和理解,重新輸出不同的語言版本,同時保留所有情感表演的基礎(chǔ)配音。這一技術(shù)使電影制作變得更加全球化,能夠吸引更廣泛的全球觀眾,這對流媒體平臺和娛樂行業(yè)來說都具有巨大的吸引力。
四、人工智能配音在影視領(lǐng)域的發(fā)展方向
筆者從翻譯學(xué)的角度來探討人工智能配音在影視領(lǐng)域的未來發(fā)展方向,主要包括以下幾個方面。
(一)人工智能配音與譯員配音相結(jié)合
在影視配音領(lǐng)域,筆者提出了一種創(chuàng)新的配音方法,即將人工智能配音與譯員配音相結(jié)合。這種融合充分利用了人工智能配音的高效性和譯員的專業(yè)知識。人工智能配音能夠快速、準(zhǔn)確地將文本轉(zhuǎn)換為語音,而譯員則具備深厚的語言和文化背景知識。人工智能配音與譯員配音的巧妙結(jié)合,能夠?qū)崿F(xiàn)更高質(zhì)量的配音效果。在該創(chuàng)新模式中,人工智能配音負(fù)責(zé)語音合成,而譯員則專注于情感的表達(dá)、角色的深度理解以及語境的把握。這種分工合作使得配音作品更加細(xì)膩、真實,觀眾更容易被情節(jié)吸引,更能夠沉浸在影視世界中。
(二)促進(jìn)人工智能影視配音的本地化
人工智能影視配音在實現(xiàn)多語種配音時,特別需要注意不同語言的語音特點和源語特點。特別是在中國這樣一個多民族、多方言的國家,理解各種語言和文化的差異至關(guān)重要。以《錫蘭公主》為例,這部人物紀(jì)錄片以泉州閩南文化為背景,是福建故事紀(jì)錄片展播活動中獲獎的代表作。在這部紀(jì)錄片中,旁白配音扮演非常重要的角色,它需要將泉州閩南文化的獨特魅力傳遞給觀眾[12]。這種本土化的理念意味著人工智能影視配音需要根據(jù)不同的文化背景進(jìn)行定制化的配音,以確保觀眾在聽到配音時能夠更好地融入故事情節(jié),理解角色的內(nèi)心世界。只有深入了解每種語言的特色,人工智能影視配音才能夠做到情感的精準(zhǔn)傳達(dá),從而引起觀眾的情感共鳴。
通過結(jié)合人工智能配音的高效性和譯員的專業(yè)知識,影視作品不僅能夠滿足多語種配音的需求,還可以為本土文化的傳承提供強大支持。以《錫蘭公主》為例,它成功地將福建的文化內(nèi)涵與現(xiàn)代影視技術(shù)相結(jié)合,為觀眾呈現(xiàn)了一幅泉州閩南文化的生動畫卷。這種融合方法不僅是技術(shù)的結(jié)合,更是文化的傳承。這種本土化發(fā)展的趨勢將為影視作品注入更多地道的文化元素,使觀眾加深對影片的理解和喜愛。在這個發(fā)展方向下,人工智能配音不再是簡單的工具,而是成為文化傳承的助力。通過結(jié)合人工智能配音和譯員的專業(yè)知識,影視創(chuàng)作者可以創(chuàng)造出更加引人入勝、更具文化深度的影視作品。這種創(chuàng)新模式不僅是對技術(shù)的應(yīng)用,更是對文化的尊重和傳承。
(三)影視角色的再現(xiàn)與情感共鳴
通過結(jié)合人工智能配音和譯員的專業(yè)知識,影視創(chuàng)作者不僅能夠還原已故演員的聲音,甚至可以重新呈現(xiàn)這些演員在影視作品中的形象。這種技術(shù)創(chuàng)新不僅代表了藝術(shù)傳承的延續(xù),而且能夠引發(fā)觀眾強烈的情感共鳴。例如,以粵語為主要語言的電視系列短劇《外來媳婦本地郎》在廣大觀眾中取得了巨大的成功。然而,該劇中的兩位資深演員相繼去世,觀眾因此失去了與角色建立深厚情感聯(lián)系的機(jī)會。而影視創(chuàng)作者在后期制作過程中結(jié)合人工智能配音還原已故演員的音容笑貌,不僅僅是在致敬這些演員,更是在為觀眾提供重新體驗角色魅力的機(jī)會。這種情感的聯(lián)結(jié)不僅加深了觀眾對角色和演員的喜愛,也將這些角色的獨特魅力傳承給新一代觀眾。這種融合創(chuàng)新不僅是科技與藝術(shù)的結(jié)合,更是文化與情感的共鳴,為影視行業(yè)帶來新的機(jī)遇。
五、人工智能配音的隱憂
隨著人工智能配音的廣泛應(yīng)用和人工智能配音產(chǎn)品的多元化,其存在被濫用的可能,這需要引起社會各界對其潛在風(fēng)險的關(guān)注。人工智能配音可以低成本地制作虛假的音頻,使人們難以辨別聲音的真實性,導(dǎo)致在新聞報道和錄音證據(jù)中存在傳播虛假信息、誤導(dǎo)觀眾的風(fēng)險。此外,因為聲音可以被復(fù)制和合成,所以人工智能配音也可能被用于欺騙或詐騙等不法行為中,對個人隱私和財產(chǎn)安全構(gòu)成威脅。
盡管存在這些擔(dān)憂,但人工智能配音也帶來了創(chuàng)新的可能性。在影視領(lǐng)域,它為電影制作提供了更大的靈活性,在降低成本的同時拓寬了創(chuàng)作者的創(chuàng)作空間。并且,隨著技術(shù)的發(fā)展,對如何合理使用這項技術(shù),以及如何應(yīng)對其帶來的倫理和法律挑戰(zhàn),社會和法律體系需要做出相應(yīng)的調(diào)整。在這個問題上,公眾的知情權(quán)和法律監(jiān)管起著至關(guān)重要的作用。相關(guān)立法部門需要制定更加明確的法律法規(guī),規(guī)范人工智能配音的使用范圍,明確人工智能配音用戶的法律責(zé)任,以及對濫用行為進(jìn)行懲罰。同時,公眾也需要加強對人工智能配音的了解,提高識別虛假信息的能力。
六、結(jié)語
人工智能配音在影視領(lǐng)域展現(xiàn)了顯著的優(yōu)勢,其高度還原的音頻質(zhì)量、廣泛的應(yīng)用領(lǐng)域、高效便捷的特點以及較低的使用成本,使其成為現(xiàn)代電影制作和翻譯學(xué)領(lǐng)域的重要工具。然而,我們也要認(rèn)識到人工智能配音的應(yīng)用仍然面臨一些挑戰(zhàn),特別是在涉及情感表達(dá)和復(fù)雜語境的翻譯任務(wù)中。因此,在影視領(lǐng)域,最佳的翻譯實踐往往是人工智能配音與譯員配音相結(jié)合,譯員可以用自身的文化理解和情感智慧來調(diào)整人工智能配音的表現(xiàn),使其更貼近角色的情感狀態(tài)。未來,隨著人工智能技術(shù)不斷發(fā)展,人工智能配音將繼續(xù)推動電影制作和跨文化交流領(lǐng)域邁向新的階段。
[參考文獻(xiàn)]
[1]張斌,全昌勤,任福繼.語音合成方法和發(fā)展綜述[J].小型微型計算機(jī)系統(tǒng),2016(01):186-192.
[2]第43次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].(2019-02-28)[2023-10-20].http://www.cac.gov.cn/2019-02/28/c_1124175677.htm.
[3]王湘玲,王婷婷.人工翻譯與機(jī)器翻譯譯后編輯對比實證研究[J].外國語言與文化,2019(04):83-93.
[4]李凌,陳昌鳳.媒介技術(shù)的社會選擇及價值維度[J]. 編輯之友,2021(04):53-60.
[5]陳昌鳳,霍婕.以人為本:人工智能技術(shù)在新聞傳播領(lǐng)域的應(yīng)用[J].新聞與寫作,2018(08):54-59.
[6]王宇明,劉坤.紀(jì)錄片《創(chuàng)新中國》的敘事策略與價值內(nèi)涵[J].當(dāng)代電視,2019(04):77-80.
[7]姜澤瑋.人工智能語音新聞:現(xiàn)狀、效果、缺陷與前景[D].西安:西北大學(xué),2023.
[8]劉慧君.AI配音的優(yōu)勢與劣勢探究:以《創(chuàng)新中國》中解說詞配音的功能為例[J].新聞研究導(dǎo)刊,2023(07):7-9.
[9]2018年度中國最具影響力紀(jì)錄片發(fā)布,這十部作品榜上有名[EB/OL].(2019-01-29)[2023-10-20].http://www.docuchina.cn/2019/01/29/ARTI7NwDLzpccU2FKRxSr7xx190129.shtml.
[10]人工智能如何終結(jié)糟糕的外語配音[EB/OL].[2023-10-20].https://edition.cnn.com/videos/business/2023/03/09/exp-flawless-ai-movie-dubbing-fst-030909aseg1-cnni-business.cnn.
[11]湯姆·漢克斯在說日語嗎?不,這只是人工智能[EB/OL].[2023-10-20].https://www.reuters.com/technology/is-that-tom-hanks-speaking-japanese-no-its-just-ai-2021-05-19/.
[12]杜丹心.“情”投“意”合:電視人物紀(jì)錄片解說詞配音的情感表達(dá):以《錫蘭公主》為例[J].東南傳播,2020(05):110-111.