播音主持領(lǐng)域人工智能技術(shù)的應(yīng)用

2024-08-21 00:00:00王曉燕

衛(wèi)星電視與寬帶多媒體 2024年15期

【摘要】在當(dāng)今數(shù)字化浪潮的推動下，人工智能技術(shù)以其卓越的數(shù)據(jù)處理能力和學(xué)習(xí)機制，正逐步滲透至傳媒行業(yè)的各個角落，播音主持領(lǐng)域亦然。人工智能（Artificial Intelligence，AI）技術(shù)通過仿真的語音合成、情感分析以及深度內(nèi)容理解承擔(dān)起新聞播報、節(jié)目主持等任務(wù)，并能根據(jù)觀眾反饋實時調(diào)整內(nèi)容以提升傳播效果。本文旨在分析AI技術(shù)在播音主持領(lǐng)域的應(yīng)用優(yōu)勢與表現(xiàn)的機遇，及人工智能技術(shù)在播音主持領(lǐng)域的具體應(yīng)用，以期為播音主持行業(yè)的可持續(xù)發(fā)展提供理論支撐與實踐指導(dǎo)。

【關(guān)鍵詞】播音主持；人工智能技術(shù)；語音合成；虛擬主播

中圖分類號：J9 文獻(xiàn)標(biāo)識碼：A   DOI：10.12246/j.issn.1673-0348.2024.15.033

在當(dāng)今科技飛速發(fā)展的時代背景下，人工智能技術(shù)（AI）已經(jīng)滲透到社會生活的方方面面，而播音主持領(lǐng)域作為信息傳播的重要窗口也正在經(jīng)歷著由AI引領(lǐng)的深刻變革。從智能語音合成到情感識別，再到虛擬主播的誕生，AI技術(shù)的應(yīng)用正重塑大眾對播音主持藝術(shù)的認(rèn)知。本文將探討AI技術(shù)在播音主持領(lǐng)域的具體應(yīng)用，并分析其對行業(yè)產(chǎn)生的深遠(yuǎn)影響。

1. 人工智能如何影響播音主持行業(yè)

在近幾年來，互聯(lián)網(wǎng)技術(shù)的飛速進(jìn)步重塑了全球媒體領(lǐng)域，而人工智能技術(shù)的融入則催生了前所未有的內(nèi)容創(chuàng)作與傳播模式，這些創(chuàng)新正在深刻影響著播音與主持行業(yè)的敘述手法和思維邏輯。播音主持行業(yè)正在經(jīng)歷一場變革，移動化、可視化、智能化和互動化成為其主要發(fā)展趨勢[1]。當(dāng)前，移動化趨勢愈發(fā)明顯，5G時代的到來使得人們更傾向于通過移動設(shè)備獲取信息，智能手機和平板電腦早已深深融入我們的日常生活，這凸顯了移動設(shè)備在現(xiàn)代社會中的普及程度，也預(yù)示著移動化將成為未來發(fā)展的重要趨勢。且短視頻崛起已成為人們獲取新聞信息的新寵，新媒體與傳統(tǒng)媒體競相涉足短視頻市場以迎合觀眾日益增長的觀看偏好。據(jù)某美國知名設(shè)備公司預(yù)測，在未來五年里，全球移動視頻數(shù)量將迎來爆炸性增長，飆升近九倍，這反映了人們對高質(zhì)量、便捷視頻內(nèi)容的不斷追求，也預(yù)示著移動設(shè)備和網(wǎng)絡(luò)技術(shù)的快速發(fā)展將繼續(xù)推動視頻行業(yè)的繁榮。

2. 人工智能技術(shù)的播音主持應(yīng)用優(yōu)勢

2.1 信息播報規(guī)范

播音主持作為傳播學(xué)視角下的媒介傳播形式，致力于實現(xiàn)信息的有效傳遞與接收。播音員或主持人在接收到當(dāng)天的稿件后，首要任務(wù)是確保以精確無誤且自然流暢的語調(diào)進(jìn)行朗讀。然而在這一過程中或許會遭遇諸多挑戰(zhàn)與突發(fā)狀況，如信息傳遞的誤差或發(fā)音上的瑕疵等問題。在當(dāng)今融媒體時代，可借助尖端的人工智能技術(shù)對海量信息進(jìn)行深度加工，經(jīng)過精心處理后，以清晰流暢的語音形式完美呈現(xiàn)，確保播音文稿的每個細(xì)節(jié)都得以精準(zhǔn)傳達(dá)。人工智能技術(shù)能夠精準(zhǔn)調(diào)控聲音的響度、速率及音質(zhì)，這些關(guān)鍵參數(shù)均通過計算機程序預(yù)設(shè)，并以語音技術(shù)原型為基礎(chǔ)，通過樣本數(shù)據(jù)實現(xiàn)語音的合成[2]。人工智能合成語音以其精確無誤的詞匯運用、嚴(yán)謹(jǐn)?shù)恼Z法結(jié)構(gòu)、清晰的發(fā)音以及流暢的表達(dá)能力，在播音主持領(lǐng)域展現(xiàn)出顯著的應(yīng)用優(yōu)勢，成為播報信息的標(biāo)準(zhǔn)化工具。

2.2 表現(xiàn)形式創(chuàng)新

人工智能技術(shù)所催生的虛擬人物現(xiàn)已在播音主持領(lǐng)域大放異彩，這些虛擬角色擁有與真人主持人相媲美的各項主持技能，能通過高度逼真的面部表情、目光交流和肢體語言，為觀眾帶來身臨其境的觀看體驗。人工智能技術(shù)在播音主持領(lǐng)域展現(xiàn)出驚人的靈活性，能輕松切換男女聲音并根據(jù)需求塑造出各式各樣的形象——從逼真的人類形象到可愛的卡通角色，應(yīng)有盡有。這種創(chuàng)新的應(yīng)用方式為播音主持工作注入了前所未有的活力，并不斷激發(fā)觀眾的好奇心，因此人工智能在播音主持領(lǐng)域的運用憑借其獨特且富有創(chuàng)意的表達(dá)形式脫穎而出，成為行業(yè)的一大亮點。

2.3 具備高效學(xué)習(xí)技巧

人工智能展現(xiàn)出卓越的學(xué)習(xí)天賦，其核心在于構(gòu)建深層的智能學(xué)習(xí)網(wǎng)絡(luò)，并通過不斷地對巨量數(shù)據(jù)進(jìn)行深度挖掘和學(xué)習(xí)，提煉出最具價值的特征信息，從而實現(xiàn)高效的特征學(xué)習(xí)。借助人工智能技術(shù)的獨特優(yōu)勢，可實現(xiàn)播音主持在情感對話和知識解答方面的高效執(zhí)行[3]。如人工智能機器人“微軟小冰”在收到用戶提問后，能迅速檢索其龐大的應(yīng)答語料庫，并據(jù)此給出精確答案。該人工智能機器人通過持續(xù)的數(shù)據(jù)采集和深度學(xué)習(xí)技術(shù)可逐漸提升其解答觀眾問題的精準(zhǔn)度和速度。

3. 人工智能技術(shù)提升播音主持表現(xiàn)的機遇

3.1 自動剪輯技術(shù)對播音主持表現(xiàn)的影響

自動剪輯技術(shù)可利用先進(jìn)的計算機視覺和圖像處理技術(shù)自動識別視頻中的關(guān)鍵幀、人物動作、情感表達(dá)等元素，并根據(jù)預(yù)設(shè)的規(guī)則或算法進(jìn)行快速剪輯，以提高剪輯效率，降低人工成本。在視頻圖像處理過程中，自動剪輯能夠?qū)崟r地對畫面質(zhì)量進(jìn)行增強，包括去噪、穩(wěn)定化和色彩校正等，使得主持人的表現(xiàn)即使在光線不足或動態(tài)變化的環(huán)境中仍能保持最佳效果[4]；或通過綠幕技術(shù)和AR在虛擬的環(huán)境中進(jìn)行播報，為觀眾提供新穎的觀看體驗。如在新聞報道中自動剪輯系統(tǒng)可以自動識別出主持人的口型和表情變化，從而選擇最合適的鏡頭進(jìn)行切換，使得播報更加自然流暢。在剪輯中，深度學(xué)習(xí)算法可分析視頻內(nèi)容，自動選擇最佳的鏡頭來展示主持人的表現(xiàn)，減少人工選擇的時間和主觀因素；或通過分析主持人的語音和面部表情識別出主持人的情緒狀態(tài)，并據(jù)此調(diào)整剪輯點使節(jié)目的情感表達(dá)更加自然和連貫。

3.2 基于用戶數(shù)據(jù)挖掘的個性化主持服務(wù)

隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術(shù)的發(fā)展，用戶需求的多樣性和個性化特征日益凸顯。而為滿足用戶的個性化需求，播音主持人需不斷地調(diào)整自己的主持風(fēng)格和內(nèi)容，其中基于用戶數(shù)據(jù)挖掘的個性化主持服務(wù)正是實現(xiàn)這一目標(biāo)的有效途徑。用戶興趣模型是個性化主持服務(wù)的基礎(chǔ)，其通過收集用戶的觀看歷史、點贊記錄、評論內(nèi)容等信息構(gòu)建出用戶的興趣模型，并根據(jù)模型的變化動態(tài)地調(diào)整主持內(nèi)容和風(fēng)格，且為保持用戶興趣模型的時效性和準(zhǔn)確性，還需要定期對模型進(jìn)行更新和優(yōu)化。目前，常用的推薦算法包括協(xié)同過濾、內(nèi)容推薦、混合推薦等，其中協(xié)同過濾通過分析用戶的歷史行為數(shù)據(jù)找出用戶之間的相似性，從而預(yù)測用戶可能感興趣的內(nèi)容；而矩陣分解則試圖找到用戶和商品之間的潛在關(guān)系，通過這種關(guān)系來預(yù)測用戶的評分或偏好[5]。

在實際應(yīng)用中，可根據(jù)具體需求選擇合適的推薦算法進(jìn)行實現(xiàn)：①上下文感知推薦。結(jié)合用戶的當(dāng)前上下文信息（如時間、地點、設(shè)備類型）來調(diào)整推薦結(jié)果，以提高推薦的相關(guān)性和及時性；②多模態(tài)推薦系統(tǒng)。利用文本、圖像和視頻等多種模態(tài)的數(shù)據(jù)，通過深度學(xué)習(xí)模型來理解用戶的復(fù)雜偏好，實現(xiàn)更加精細(xì)的個性化推薦；③強化學(xué)習(xí)。在推薦系統(tǒng)中應(yīng)用強化學(xué)習(xí)讓系統(tǒng)通過試錯來學(xué)習(xí)如何優(yōu)化推薦策略，以最大化用戶滿意度和長期參與度。

4. 人工智能技術(shù)在播音主持領(lǐng)域的應(yīng)用

4.1 語音合成技術(shù)的應(yīng)用

語音合成技術(shù)，又稱為文本到語音技術(shù)（Text-to-Speech，TTS）能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然流暢語音的技術(shù)。近年來，基于深度學(xué)習(xí)的語音合成模型如循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）、長短期記憶網(wǎng)絡(luò)（LSTM）和生成對抗網(wǎng)絡(luò)（GAN）等取得了顯著的突破，尤其是Transformer模型的提出為語音合成技術(shù)的進(jìn)一步發(fā)展奠定了基礎(chǔ)，其通過大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)語音的深層特征使得生成的語音更加自然、流暢[6]?；谏疃葘W(xué)習(xí)的語音合成模型主要包括文本分析模塊和語音生成模塊，前者負(fù)責(zé)將輸入的文本信息轉(zhuǎn)化為語音合成所需的特征表示，如音素、音調(diào)、節(jié)奏等；而后者則根據(jù)這些特征表示，利用深度學(xué)習(xí)模型生成對應(yīng)的語音信號。比如，谷歌的Tacotron系列模型和百度的Deep Voice系列模型都是基于深度學(xué)習(xí)的語音合成技術(shù)的“代表”，其能生成高質(zhì)量的語音并根據(jù)不同的語言、口音和情感等要求進(jìn)行定制化的語音合成。

其中，科大訊飛作為國內(nèi)領(lǐng)先的人工智能企業(yè)，其語音合成技術(shù)在播音主持領(lǐng)域的應(yīng)用尤為突出。央視紀(jì)錄片《創(chuàng)新中國》全片采用科大訊飛的人工智能配音技術(shù)，成功復(fù)刻已故配音大師李易老師的聲音，這是對李易老師的致敬，同時也標(biāo)志著個性化人工智能語音合成技術(shù)在影視領(lǐng)域的嶄新里程碑[7]。此外，科大訊飛的語音合成技術(shù)還被廣泛應(yīng)用于新聞播報、有聲讀物、虛擬助手等多種場景，如在一些新聞節(jié)目中由于時間緊迫或播音員臨時缺席等原因，制作人員會選擇使用語音合成技術(shù)來生成新聞稿的旁白部分，以確保節(jié)目的正常播出并能在一定程度上節(jié)省人力和時間成本。自2024年1月1日起，新疆阿克蘇地區(qū)的AI主播“小芮”成為該地區(qū)首個常態(tài)化播報地方新聞的AI主播，以解決傳統(tǒng)播音員數(shù)量不足的問題，提高新聞播報的準(zhǔn)確性和時效性。且“小芮”利用先進(jìn)的語音合成技術(shù)將新聞稿件轉(zhuǎn)化為流暢自然的語音輸出，其聲音甜美、清晰且深受觀眾喜愛。

4.2 語音識別技術(shù)的應(yīng)用

傳統(tǒng)的語音識別方法主要基于特征工程和統(tǒng)計模型，如隱馬爾可夫模型（HMM）和高斯混合模型（GMM），其方法需要手工設(shè)計復(fù)雜的特征提取器并對聲學(xué)模型和語言模型的參數(shù)調(diào)整非常敏感，這限制了其性能。而深度學(xué)習(xí)的興起為語音識別帶來了革命性的變化，特別是RNN和LSTM的提出為處理序列數(shù)據(jù)提供了強大的工具。隨后，Transformer模型的出現(xiàn)以其自注意力機制（self-attention）徹底改變了語音識別的面貌，其可捕捉長距離依賴關(guān)系以提高語音識別的準(zhǔn)確率[8]。目前，基于Transformer的語音識別系統(tǒng)，如WaveNet、Baidu's Deep Speech 2和Google的Speech-Trans演示了前所未有的性能，其在公開的語音識別基準(zhǔn)測試中取得了驚人的成績，接近甚至超越了人類的識別水平。

在電視新聞、體育比賽和在線會議等場合，實時字幕可以幫助聽力障礙人士或非母語觀眾更好地理解內(nèi)容，如CNN和BBC等新聞頻道在實時報道中提供自動生成的字幕，其基于先進(jìn)的語音識別技術(shù)在嘈雜的環(huán)境中可保持較高的準(zhǔn)確率，且蘋果的Siri和亞馬遜的Alexa亦是基于TTS技術(shù)的智能助手的典范。同時，語音識別技術(shù)還被用于自動生成播客和音頻書籍，將文本文件轉(zhuǎn)換為音頻文件為用戶提供隨時隨地的聽書體驗，如Audible和Google Play Books等音頻書平臺允許用戶下載由真人朗讀或TTS系統(tǒng)生成的書籍。2018年新華社聯(lián)合搜狗推出了首個AI合成主播“新小浩”采用先進(jìn)的語音識別技術(shù)和深度學(xué)習(xí)算法實時將用戶的語音轉(zhuǎn)換為標(biāo)準(zhǔn)的播音腔，并通過合成技術(shù)生成逼真的人臉圖像和口唇動作實現(xiàn)虛擬主播的功能，以降低新聞播報的成本和難度為觀眾帶來全新的視覺體驗，且“新小浩”還具備智能對話和互動功能，可根據(jù)觀眾的提問和反饋進(jìn)行實時回應(yīng)和互動，增強觀眾的參與感和沉浸感。

4.3 自然語言處理技術(shù)的應(yīng)用

自然語言處理（Natural Language Processing， NLP）技術(shù)可以使計算機理解、解釋、生成和操作人類語言以簡化內(nèi)容創(chuàng)作過程，在主持稿件的生成中NLP的應(yīng)用體現(xiàn)在：①自動化寫作。利用NLP中的模板生成和NLG技術(shù)自動生成新聞稿件、體育比賽報告和財經(jīng)資訊等，這通常需要大量的數(shù)據(jù)訓(xùn)練以便學(xué)會如何構(gòu)造符合語法和語義規(guī)則的句子；②個性化內(nèi)容。NLP可通過分析聽眾的歷史數(shù)據(jù)和偏好幫助生成個性化的新聞簡報和推薦內(nèi)容，如流媒體服務(wù)平臺使用NLP技術(shù)來分析用戶的觀看習(xí)慣，從而推薦用戶可能感興趣的新節(jié)目；③實時更新。NLP可針對體育賽事和新聞報道等需要快速更新信息的場景，實現(xiàn)對最新數(shù)據(jù)的自動整合和語言表達(dá)以確保信息的及時傳遞；④多語言支持。NLP技術(shù)使得自動生成的內(nèi)容可支持多種語言，這對于國際新聞和多語言市場尤為重要。比如，湖南衛(wèi)視的數(shù)字主播“小漾”基于智能對話系統(tǒng)而構(gòu)建，其擁有充滿朝氣的形象且具備高度智能化的交互能力，能實時感知觀眾的情感和需求并根據(jù)不同的情境做出相應(yīng)的回應(yīng)?！靶⊙笨梢蕴峁┒ㄖ苹牟蠓?wù)，與觀眾進(jìn)行趣味橫生的對話以豐富節(jié)目的內(nèi)容形式，從而贏得年輕觀眾的喜愛與追捧。2024年1月10日，正值長沙市兩會隆重舉行之際，長沙廣電推出《兩會AI回答》互動平臺，其中名為“常小星”的AI虛擬主播驚艷亮相，與廣大網(wǎng)友展開了熱烈的交流和互動，而長沙廣電通過這一新穎的形式成功地將兩會的精神和內(nèi)容以更加生動、形象的方式傳遞給了廣大市民，引發(fā)了社會各界的廣泛關(guān)注和熱議。

5. 結(jié)束語

人工智能技術(shù)的應(yīng)用正在深刻地改變播音主持領(lǐng)域的現(xiàn)狀，從語音合成到自然語言處理，再到增強學(xué)習(xí)和推薦系統(tǒng)的應(yīng)用，AI技術(shù)的發(fā)展可以提高播音主持的工作效率，為觀眾帶來更為沉浸及個性化的聽覺體驗。且隨著AI在播音主持中的應(yīng)用越來越廣泛，有理由相信未來的播音主持行業(yè)將會變得更加智能化、個性化和多元化。因此需不斷關(guān)注AI技術(shù)的發(fā)展動態(tài)，積極探索其在播音主持領(lǐng)域的應(yīng)用前景和發(fā)展方向。

參考文獻(xiàn)：

[1]王欣.基于人工智能背景下播音主持的發(fā)展趨勢研究[J].數(shù)字通信世界，2020（10）：168-169.

[2]鄭爽悅.人工智能對播音主持工作的影響及應(yīng)對舉措研究[J].傳媒論壇，2023，6（20）：64-66.

[3]魏寧.人工智能技術(shù)環(huán)境下播音主持現(xiàn)狀分析[J].中國報業(yè)，2020（06）：90-91.

[4]邢煜婷.融媒體時代人工智能技術(shù)在播音主持工作的應(yīng)用[J].黃河.黃土.黃種人，2022（11）：38-40.

[5]莊皓瀛.人工智能技術(shù)與播音主持協(xié)同創(chuàng)新研究[J].新聞文化建設(shè)，2022（03）：77-79.

[6]賈斐然.人工智能技術(shù)沖擊背景下播音主持的價值堅守與發(fā)展路徑研究[J].西部廣播電視，2023，44（13）：207-209.

[7]王立元，王小宇.人工智能技術(shù)在播音主持領(lǐng)域的應(yīng)用概述[J].傳媒論壇，2020，3（19）：40.

[8]王一民.融媒體語境下以人工智能技術(shù)推動播音主持工作[J].華東科技，2022（09）：119-121.

作者簡介：王曉燕（1985—），女，河南安陽人，編輯，研究方向：主持人與編輯。

衛(wèi)星電視與寬帶多媒體2024年15期

衛(wèi)星電視與寬帶多媒體的其它文章: 關(guān)于電視新聞采編工作與新媒體融合的思考; 媒體融合背景下攝像記者的業(yè)務(wù)能力探究; 基于“內(nèi)容+”提升媒體新生產(chǎn)力; 新媒體視域下河南衛(wèi)視“中國節(jié)日”系列節(jié)目的創(chuàng)新路徑; 大型電視交響詩《碧水長歌頌端陽》的創(chuàng)新探索; 融媒體時代播音主持發(fā)展的轉(zhuǎn)型探索

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

播音主持領(lǐng)域人工智能技術(shù)的應(yīng)用