国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

播音主持領(lǐng)域人工智能技術(shù)的應(yīng)用

2024-08-21 00:00:00王曉燕
衛(wèi)星電視與寬帶多媒體 2024年15期

【摘要】在當(dāng)今數(shù)字化浪潮的推動下,人工智能技術(shù)以其卓越的數(shù)據(jù)處理能力和學(xué)習(xí)機制,正逐步滲透至傳媒行業(yè)的各個角落,播音主持領(lǐng)域亦然。人工智能(Artificial Intelligence,AI)技術(shù)通過仿真的語音合成、情感分析以及深度內(nèi)容理解承擔(dān)起新聞播報、節(jié)目主持等任務(wù),并能根據(jù)觀眾反饋實時調(diào)整內(nèi)容以提升傳播效果。本文旨在分析AI技術(shù)在播音主持領(lǐng)域的應(yīng)用優(yōu)勢與表現(xiàn)的機遇,及人工智能技術(shù)在播音主持領(lǐng)域的具體應(yīng)用,以期為播音主持行業(yè)的可持續(xù)發(fā)展提供理論支撐與實踐指導(dǎo)。

【關(guān)鍵詞】播音主持;人工智能技術(shù);語音合成;虛擬主播

中圖分類號:J9 文獻(xiàn)標(biāo)識碼:A   DOI:10.12246/j.issn.1673-0348.2024.15.033

在當(dāng)今科技飛速發(fā)展的時代背景下,人工智能技術(shù)(AI)已經(jīng)滲透到社會生活的方方面面,而播音主持領(lǐng)域作為信息傳播的重要窗口也正在經(jīng)歷著由AI引領(lǐng)的深刻變革。從智能語音合成到情感識別,再到虛擬主播的誕生,AI技術(shù)的應(yīng)用正重塑大眾對播音主持藝術(shù)的認(rèn)知。本文將探討AI技術(shù)在播音主持領(lǐng)域的具體應(yīng)用,并分析其對行業(yè)產(chǎn)生的深遠(yuǎn)影響。

1. 人工智能如何影響播音主持行業(yè)

在近幾年來,互聯(lián)網(wǎng)技術(shù)的飛速進(jìn)步重塑了全球媒體領(lǐng)域,而人工智能技術(shù)的融入則催生了前所未有的內(nèi)容創(chuàng)作與傳播模式,這些創(chuàng)新正在深刻影響著播音與主持行業(yè)的敘述手法和思維邏輯。播音主持行業(yè)正在經(jīng)歷一場變革,移動化、可視化、智能化和互動化成為其主要發(fā)展趨勢[1]。當(dāng)前,移動化趨勢愈發(fā)明顯,5G時代的到來使得人們更傾向于通過移動設(shè)備獲取信息,智能手機和平板電腦早已深深融入我們的日常生活,這凸顯了移動設(shè)備在現(xiàn)代社會中的普及程度,也預(yù)示著移動化將成為未來發(fā)展的重要趨勢。且短視頻崛起已成為人們獲取新聞信息的新寵,新媒體與傳統(tǒng)媒體競相涉足短視頻市場以迎合觀眾日益增長的觀看偏好。據(jù)某美國知名設(shè)備公司預(yù)測,在未來五年里,全球移動視頻數(shù)量將迎來爆炸性增長,飆升近九倍,這反映了人們對高質(zhì)量、便捷視頻內(nèi)容的不斷追求,也預(yù)示著移動設(shè)備和網(wǎng)絡(luò)技術(shù)的快速發(fā)展將繼續(xù)推動視頻行業(yè)的繁榮。

2. 人工智能技術(shù)的播音主持應(yīng)用優(yōu)勢

2.1 信息播報規(guī)范

播音主持作為傳播學(xué)視角下的媒介傳播形式,致力于實現(xiàn)信息的有效傳遞與接收。播音員或主持人在接收到當(dāng)天的稿件后,首要任務(wù)是確保以精確無誤且自然流暢的語調(diào)進(jìn)行朗讀。然而在這一過程中或許會遭遇諸多挑戰(zhàn)與突發(fā)狀況,如信息傳遞的誤差或發(fā)音上的瑕疵等問題。在當(dāng)今融媒體時代,可借助尖端的人工智能技術(shù)對海量信息進(jìn)行深度加工,經(jīng)過精心處理后,以清晰流暢的語音形式完美呈現(xiàn),確保播音文稿的每個細(xì)節(jié)都得以精準(zhǔn)傳達(dá)。人工智能技術(shù)能夠精準(zhǔn)調(diào)控聲音的響度、速率及音質(zhì),這些關(guān)鍵參數(shù)均通過計算機程序預(yù)設(shè),并以語音技術(shù)原型為基礎(chǔ),通過樣本數(shù)據(jù)實現(xiàn)語音的合成[2]。人工智能合成語音以其精確無誤的詞匯運用、嚴(yán)謹(jǐn)?shù)恼Z法結(jié)構(gòu)、清晰的發(fā)音以及流暢的表達(dá)能力,在播音主持領(lǐng)域展現(xiàn)出顯著的應(yīng)用優(yōu)勢,成為播報信息的標(biāo)準(zhǔn)化工具。

2.2 表現(xiàn)形式創(chuàng)新

人工智能技術(shù)所催生的虛擬人物現(xiàn)已在播音主持領(lǐng)域大放異彩,這些虛擬角色擁有與真人主持人相媲美的各項主持技能,能通過高度逼真的面部表情、目光交流和肢體語言,為觀眾帶來身臨其境的觀看體驗。人工智能技術(shù)在播音主持領(lǐng)域展現(xiàn)出驚人的靈活性,能輕松切換男女聲音并根據(jù)需求塑造出各式各樣的形象——從逼真的人類形象到可愛的卡通角色,應(yīng)有盡有。這種創(chuàng)新的應(yīng)用方式為播音主持工作注入了前所未有的活力,并不斷激發(fā)觀眾的好奇心,因此人工智能在播音主持領(lǐng)域的運用憑借其獨特且富有創(chuàng)意的表達(dá)形式脫穎而出,成為行業(yè)的一大亮點。

2.3 具備高效學(xué)習(xí)技巧

人工智能展現(xiàn)出卓越的學(xué)習(xí)天賦,其核心在于構(gòu)建深層的智能學(xué)習(xí)網(wǎng)絡(luò),并通過不斷地對巨量數(shù)據(jù)進(jìn)行深度挖掘和學(xué)習(xí),提煉出最具價值的特征信息,從而實現(xiàn)高效的特征學(xué)習(xí)。借助人工智能技術(shù)的獨特優(yōu)勢,可實現(xiàn)播音主持在情感對話和知識解答方面的高效執(zhí)行[3]。如人工智能機器人“微軟小冰”在收到用戶提問后,能迅速檢索其龐大的應(yīng)答語料庫,并據(jù)此給出精確答案。該人工智能機器人通過持續(xù)的數(shù)據(jù)采集和深度學(xué)習(xí)技術(shù)可逐漸提升其解答觀眾問題的精準(zhǔn)度和速度。

3. 人工智能技術(shù)提升播音主持表現(xiàn)的機遇

3.1 自動剪輯技術(shù)對播音主持表現(xiàn)的影響

自動剪輯技術(shù)可利用先進(jìn)的計算機視覺和圖像處理技術(shù)自動識別視頻中的關(guān)鍵幀、人物動作、情感表達(dá)等元素,并根據(jù)預(yù)設(shè)的規(guī)則或算法進(jìn)行快速剪輯,以提高剪輯效率,降低人工成本。在視頻圖像處理過程中,自動剪輯能夠?qū)崟r地對畫面質(zhì)量進(jìn)行增強,包括去噪、穩(wěn)定化和色彩校正等,使得主持人的表現(xiàn)即使在光線不足或動態(tài)變化的環(huán)境中仍能保持最佳效果[4];或通過綠幕技術(shù)和AR在虛擬的環(huán)境中進(jìn)行播報,為觀眾提供新穎的觀看體驗。如在新聞報道中自動剪輯系統(tǒng)可以自動識別出主持人的口型和表情變化,從而選擇最合適的鏡頭進(jìn)行切換,使得播報更加自然流暢。在剪輯中,深度學(xué)習(xí)算法可分析視頻內(nèi)容,自動選擇最佳的鏡頭來展示主持人的表現(xiàn),減少人工選擇的時間和主觀因素;或通過分析主持人的語音和面部表情識別出主持人的情緒狀態(tài),并據(jù)此調(diào)整剪輯點使節(jié)目的情感表達(dá)更加自然和連貫。

3.2 基于用戶數(shù)據(jù)挖掘的個性化主持服務(wù)

隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術(shù)的發(fā)展,用戶需求的多樣性和個性化特征日益凸顯。而為滿足用戶的個性化需求,播音主持人需不斷地調(diào)整自己的主持風(fēng)格和內(nèi)容,其中基于用戶數(shù)據(jù)挖掘的個性化主持服務(wù)正是實現(xiàn)這一目標(biāo)的有效途徑。用戶興趣模型是個性化主持服務(wù)的基礎(chǔ),其通過收集用戶的觀看歷史、點贊記錄、評論內(nèi)容等信息構(gòu)建出用戶的興趣模型,并根據(jù)模型的變化動態(tài)地調(diào)整主持內(nèi)容和風(fēng)格,且為保持用戶興趣模型的時效性和準(zhǔn)確性,還需要定期對模型進(jìn)行更新和優(yōu)化。目前,常用的推薦算法包括協(xié)同過濾、內(nèi)容推薦、混合推薦等,其中協(xié)同過濾通過分析用戶的歷史行為數(shù)據(jù)找出用戶之間的相似性,從而預(yù)測用戶可能感興趣的內(nèi)容;而矩陣分解則試圖找到用戶和商品之間的潛在關(guān)系,通過這種關(guān)系來預(yù)測用戶的評分或偏好[5]。

在實際應(yīng)用中,可根據(jù)具體需求選擇合適的推薦算法進(jìn)行實現(xiàn):①上下文感知推薦。結(jié)合用戶的當(dāng)前上下文信息(如時間、地點、設(shè)備類型)來調(diào)整推薦結(jié)果,以提高推薦的相關(guān)性和及時性;②多模態(tài)推薦系統(tǒng)。利用文本、圖像和視頻等多種模態(tài)的數(shù)據(jù),通過深度學(xué)習(xí)模型來理解用戶的復(fù)雜偏好,實現(xiàn)更加精細(xì)的個性化推薦;③強化學(xué)習(xí)。在推薦系統(tǒng)中應(yīng)用強化學(xué)習(xí)讓系統(tǒng)通過試錯來學(xué)習(xí)如何優(yōu)化推薦策略,以最大化用戶滿意度和長期參與度。

4. 人工智能技術(shù)在播音主持領(lǐng)域的應(yīng)用

4.1 語音合成技術(shù)的應(yīng)用

語音合成技術(shù),又稱為文本到語音技術(shù)(Text-to-Speech,TTS)能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然流暢語音的技術(shù)。近年來,基于深度學(xué)習(xí)的語音合成模型如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短期記憶網(wǎng)絡(luò)(LSTM)和生成對抗網(wǎng)絡(luò)(GAN)等取得了顯著的突破,尤其是Transformer模型的提出為語音合成技術(shù)的進(jìn)一步發(fā)展奠定了基礎(chǔ),其通過大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)語音的深層特征使得生成的語音更加自然、流暢[6]?;谏疃葘W(xué)習(xí)的語音合成模型主要包括文本分析模塊和語音生成模塊,前者負(fù)責(zé)將輸入的文本信息轉(zhuǎn)化為語音合成所需的特征表示,如音素、音調(diào)、節(jié)奏等;而后者則根據(jù)這些特征表示,利用深度學(xué)習(xí)模型生成對應(yīng)的語音信號。比如,谷歌的Tacotron系列模型和百度的Deep Voice系列模型都是基于深度學(xué)習(xí)的語音合成技術(shù)的“代表”,其能生成高質(zhì)量的語音并根據(jù)不同的語言、口音和情感等要求進(jìn)行定制化的語音合成。

其中,科大訊飛作為國內(nèi)領(lǐng)先的人工智能企業(yè),其語音合成技術(shù)在播音主持領(lǐng)域的應(yīng)用尤為突出。央視紀(jì)錄片《創(chuàng)新中國》全片采用科大訊飛的人工智能配音技術(shù),成功復(fù)刻已故配音大師李易老師的聲音,這是對李易老師的致敬,同時也標(biāo)志著個性化人工智能語音合成技術(shù)在影視領(lǐng)域的嶄新里程碑[7]。此外,科大訊飛的語音合成技術(shù)還被廣泛應(yīng)用于新聞播報、有聲讀物、虛擬助手等多種場景,如在一些新聞節(jié)目中由于時間緊迫或播音員臨時缺席等原因,制作人員會選擇使用語音合成技術(shù)來生成新聞稿的旁白部分,以確保節(jié)目的正常播出并能在一定程度上節(jié)省人力和時間成本。自2024年1月1日起,新疆阿克蘇地區(qū)的AI主播“小芮”成為該地區(qū)首個常態(tài)化播報地方新聞的AI主播,以解決傳統(tǒng)播音員數(shù)量不足的問題,提高新聞播報的準(zhǔn)確性和時效性。且“小芮”利用先進(jìn)的語音合成技術(shù)將新聞稿件轉(zhuǎn)化為流暢自然的語音輸出,其聲音甜美、清晰且深受觀眾喜愛。

4.2 語音識別技術(shù)的應(yīng)用

傳統(tǒng)的語音識別方法主要基于特征工程和統(tǒng)計模型,如隱馬爾可夫模型(HMM)和高斯混合模型(GMM),其方法需要手工設(shè)計復(fù)雜的特征提取器并對聲學(xué)模型和語言模型的參數(shù)調(diào)整非常敏感,這限制了其性能。而深度學(xué)習(xí)的興起為語音識別帶來了革命性的變化,特別是RNN和LSTM的提出為處理序列數(shù)據(jù)提供了強大的工具。隨后,Transformer模型的出現(xiàn)以其自注意力機制(self-attention)徹底改變了語音識別的面貌,其可捕捉長距離依賴關(guān)系以提高語音識別的準(zhǔn)確率[8]。目前,基于Transformer的語音識別系統(tǒng),如WaveNet、Baidu's Deep Speech 2和Google的Speech-Trans演示了前所未有的性能,其在公開的語音識別基準(zhǔn)測試中取得了驚人的成績,接近甚至超越了人類的識別水平。

在電視新聞、體育比賽和在線會議等場合,實時字幕可以幫助聽力障礙人士或非母語觀眾更好地理解內(nèi)容,如CNN和BBC等新聞頻道在實時報道中提供自動生成的字幕,其基于先進(jìn)的語音識別技術(shù)在嘈雜的環(huán)境中可保持較高的準(zhǔn)確率,且蘋果的Siri和亞馬遜的Alexa亦是基于TTS技術(shù)的智能助手的典范。同時,語音識別技術(shù)還被用于自動生成播客和音頻書籍,將文本文件轉(zhuǎn)換為音頻文件為用戶提供隨時隨地的聽書體驗,如Audible和Google Play Books等音頻書平臺允許用戶下載由真人朗讀或TTS系統(tǒng)生成的書籍。2018年新華社聯(lián)合搜狗推出了首個AI合成主播“新小浩”采用先進(jìn)的語音識別技術(shù)和深度學(xué)習(xí)算法實時將用戶的語音轉(zhuǎn)換為標(biāo)準(zhǔn)的播音腔,并通過合成技術(shù)生成逼真的人臉圖像和口唇動作實現(xiàn)虛擬主播的功能,以降低新聞播報的成本和難度為觀眾帶來全新的視覺體驗,且“新小浩”還具備智能對話和互動功能,可根據(jù)觀眾的提問和反饋進(jìn)行實時回應(yīng)和互動,增強觀眾的參與感和沉浸感。

4.3 自然語言處理技術(shù)的應(yīng)用

自然語言處理(Natural Language Processing, NLP)技術(shù)可以使計算機理解、解釋、生成和操作人類語言以簡化內(nèi)容創(chuàng)作過程,在主持稿件的生成中NLP的應(yīng)用體現(xiàn)在:①自動化寫作。利用NLP中的模板生成和NLG技術(shù)自動生成新聞稿件、體育比賽報告和財經(jīng)資訊等,這通常需要大量的數(shù)據(jù)訓(xùn)練以便學(xué)會如何構(gòu)造符合語法和語義規(guī)則的句子;②個性化內(nèi)容。NLP可通過分析聽眾的歷史數(shù)據(jù)和偏好幫助生成個性化的新聞簡報和推薦內(nèi)容,如流媒體服務(wù)平臺使用NLP技術(shù)來分析用戶的觀看習(xí)慣,從而推薦用戶可能感興趣的新節(jié)目;③實時更新。NLP可針對體育賽事和新聞報道等需要快速更新信息的場景,實現(xiàn)對最新數(shù)據(jù)的自動整合和語言表達(dá)以確保信息的及時傳遞;④多語言支持。NLP技術(shù)使得自動生成的內(nèi)容可支持多種語言,這對于國際新聞和多語言市場尤為重要。比如,湖南衛(wèi)視的數(shù)字主播“小漾”基于智能對話系統(tǒng)而構(gòu)建,其擁有充滿朝氣的形象且具備高度智能化的交互能力,能實時感知觀眾的情感和需求并根據(jù)不同的情境做出相應(yīng)的回應(yīng)?!靶⊙笨梢蕴峁┒ㄖ苹牟蠓?wù),與觀眾進(jìn)行趣味橫生的對話以豐富節(jié)目的內(nèi)容形式,從而贏得年輕觀眾的喜愛與追捧。2024年1月10日,正值長沙市兩會隆重舉行之際,長沙廣電推出《兩會AI回答》互動平臺,其中名為“常小星”的AI虛擬主播驚艷亮相,與廣大網(wǎng)友展開了熱烈的交流和互動,而長沙廣電通過這一新穎的形式成功地將兩會的精神和內(nèi)容以更加生動、形象的方式傳遞給了廣大市民,引發(fā)了社會各界的廣泛關(guān)注和熱議。

5. 結(jié)束語

人工智能技術(shù)的應(yīng)用正在深刻地改變播音主持領(lǐng)域的現(xiàn)狀,從語音合成到自然語言處理,再到增強學(xué)習(xí)和推薦系統(tǒng)的應(yīng)用,AI技術(shù)的發(fā)展可以提高播音主持的工作效率,為觀眾帶來更為沉浸及個性化的聽覺體驗。且隨著AI在播音主持中的應(yīng)用越來越廣泛,有理由相信未來的播音主持行業(yè)將會變得更加智能化、個性化和多元化。因此需不斷關(guān)注AI技術(shù)的發(fā)展動態(tài),積極探索其在播音主持領(lǐng)域的應(yīng)用前景和發(fā)展方向。

參考文獻(xiàn):

[1]王欣.基于人工智能背景下播音主持的發(fā)展趨勢研究[J].數(shù)字通信世界,2020(10):168-169.

[2]鄭爽悅.人工智能對播音主持工作的影響及應(yīng)對舉措研究[J].傳媒論壇,2023,6(20):64-66.

[3]魏寧.人工智能技術(shù)環(huán)境下播音主持現(xiàn)狀分析[J].中國報業(yè),2020(06):90-91.

[4]邢煜婷.融媒體時代人工智能技術(shù)在播音主持工作的應(yīng)用[J].黃河.黃土.黃種人,2022(11):38-40.

[5]莊皓瀛.人工智能技術(shù)與播音主持協(xié)同創(chuàng)新研究[J].新聞文化建設(shè),2022(03):77-79.

[6]賈斐然.人工智能技術(shù)沖擊背景下播音主持的價值堅守與發(fā)展路徑研究[J].西部廣播電視,2023,44(13):207-209.

[7]王立元,王小宇.人工智能技術(shù)在播音主持領(lǐng)域的應(yīng)用概述[J].傳媒論壇,2020,3(19):40.

[8]王一民.融媒體語境下以人工智能技術(shù)推動播音主持工作[J].華東科技,2022(09):119-121.

作者簡介:王曉燕(1985—),女,河南安陽人,編輯,研究方向:主持人與編輯。

措美县| 枝江市| 柳江县| 长宁县| 庆元县| 张北县| 萨迦县| 湘乡市| 海原县| 浙江省| 象州县| 津南区| 墨竹工卡县| 建水县| 大石桥市| 南部县| 和静县| 辽阳县| 通山县| 黄冈市| 祁东县| 微山县| 双辽市| 浮山县| 姚安县| 嘉鱼县| 龙井市| 湟中县| 开远市| 宿松县| 大同市| 九龙坡区| 睢宁县| 威信县| 绩溪县| 贡觉县| 巴里| 天津市| 综艺| 汽车| 玉屏|