謝鐘揚(yáng)
摘要:現(xiàn)階段人工智能應(yīng)用越來越加廣泛,人工智能的優(yōu)勢被廣為人知,很多企業(yè)以及科研機(jī)構(gòu)都加強(qiáng)了對人工智能方面的研究,想通過人工智能為行業(yè)帶來更快的發(fā)展動力。將人工智能技術(shù)應(yīng)用在光電媒體當(dāng)中,針對傳統(tǒng)音頻處理中不足的地方實(shí)施改進(jìn),唱詞系統(tǒng)、播報系統(tǒng)、檢索系統(tǒng)和會議系統(tǒng)都實(shí)現(xiàn)了智能化,按照人機(jī)呼叫的方法來提升廣電制作的效率和質(zhì)量。鑒于此,本文對廣電媒體中的人工智能語音技術(shù)的有效運(yùn)用進(jìn)行分析,以供參考。
關(guān)鍵詞:光電媒體;人工智能;語音技術(shù);運(yùn)用
中圖分類號:U463? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)22-0217-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
將人工智能施工在廣電媒體當(dāng)中,改變了以往節(jié)目制作過程中的處理方法,把人工智能技術(shù)施工到其中,能夠?qū)崿F(xiàn)了智能文稿唱詞系統(tǒng)、智能虛擬播報系統(tǒng)、智能編目檢索系統(tǒng)和智能會議系統(tǒng)等功能。全新的人機(jī)交互機(jī)制,全面提升了廣播電視節(jié)目制作的效率和質(zhì)量。
1 人工智能環(huán)境下廣電媒體的重新定義
人工智能應(yīng)用研發(fā)在廣電傳媒界的趨勢越來越差,傳統(tǒng)的廣電傳媒集團(tuán)面對著非常嚴(yán)峻的問題,同時通過智能媒體的不斷推陳出新,推出了書本內(nèi)容的音頻化以及收聽便捷化,廣播移動性和伴隨性都較為突出,信息的分享度也特別高;當(dāng)前社會,人們生活節(jié)奏變快,時間分布不規(guī)律,學(xué)習(xí)、生活和工作之間相互影響,人們在聽廣播的時候,都想要收聽到的有用的語音播報變成文字形式傳播出來,也想要用語言輸入來檢查有用的信息,這都是傳統(tǒng)的廣播傳播媒體沒有辦法做到的,但是,人工智能卻能夠完成。傳統(tǒng)的廣播傳媒主要依靠無線電波和導(dǎo)線,其收聽人群主要是家庭集體等,伴隨著信息時代的發(fā)展趨勢,使得收聽更加的依靠手機(jī),讓收聽廣播更加的私人化、空間自由化,語言文字之間可相互轉(zhuǎn)化,音頻信息也可轉(zhuǎn)發(fā)、保存和下載等。
2 智能語音技術(shù)分類
2.1語音識別技術(shù)
語音識別技術(shù)是把說出來的語音內(nèi)容轉(zhuǎn)化成相應(yīng)的文字進(jìn)行錄入。語音識別技術(shù),第一步,就是要檢查音頻的端點(diǎn),確認(rèn)說話的位置,然后再對其進(jìn)行識別。怎樣對輸進(jìn)去的信息實(shí)時判別同時標(biāo)點(diǎn),這就要觀察語言的語境。在系統(tǒng)輸入的時候,針對識別客戶自定義的語句實(shí)施優(yōu)先選擇。
2.2語音轉(zhuǎn)寫技術(shù)
語音轉(zhuǎn)寫技術(shù)是指把識別或者理解過的語音信號,把這個語音信號再轉(zhuǎn)化為文字內(nèi)容。同時可以用一些大的數(shù)據(jù)庫和用戶的歷史數(shù)據(jù)去進(jìn)行語音轉(zhuǎn)寫,再去把上下文的相關(guān)語義、停頓、語氣等內(nèi)容概括出來,然后對句子和段落進(jìn)行區(qū)分和分析,解決遠(yuǎn)處的噪音等問題。
2.3語音合成技術(shù)
語音合成指輸出文字,這些文字是經(jīng)過計算機(jī)處理過的,抓變成為流暢的文字和句子,還可以使用此階段的語言進(jìn)行播放、語言導(dǎo)航以及語音提示很多的應(yīng)用當(dāng)中。語言組合的主要內(nèi)容是將判斷文字的順序,將文字?jǐn)?shù)據(jù)化處理,導(dǎo)出語言波方式的信號,最后把單元序列進(jìn)行波形串列,最后以完整的信號輸出出去。
3 人工智能語音識別技術(shù)的技術(shù)架構(gòu)
3.1系統(tǒng)架構(gòu)
通過分析人工智能語音識別平臺系統(tǒng)架構(gòu)的構(gòu)成,可以得知它主要由五個部分構(gòu)成,主要為是基礎(chǔ)支撐層、核心能力層、應(yīng)用服務(wù)層、應(yīng)用接入層和服務(wù)應(yīng)用平臺?;A(chǔ)支撐層,其重點(diǎn)是為了將云計算平臺對平臺內(nèi)部進(jìn)行分析和資源的存儲。核心能力層,主要是對資源進(jìn)行優(yōu)化管理,為廣電媒體的實(shí)際市場應(yīng)用提供語音合成和語音識別等服務(wù),應(yīng)用服務(wù)層,主要是可以把最新的語音技術(shù)結(jié)合到一起,為平臺的管理模式以及平臺的服務(wù)強(qiáng)有力的與原服務(wù)。使用到入階層,主要是運(yùn)用應(yīng)用接入層實(shí)現(xiàn)服務(wù)接口和語音的處理,在業(yè)務(wù)層面給予只能語言服務(wù)。服務(wù)應(yīng)用平臺,主要是可以實(shí)現(xiàn)文稿唱詞、虛擬播報、內(nèi)容轉(zhuǎn)寫等功能,支撐第三方的對接工作。
3.2軟件架構(gòu)
軟件架構(gòu)的構(gòu)成——第一種要讓這個架構(gòu)擁有可移植性,其主要就是采用的J2EE組成的Java規(guī)范架構(gòu)。讓這個架構(gòu)分布在各個相應(yīng)的服務(wù)器上,對設(shè)計工作進(jìn)行高效靈活的擴(kuò)展系統(tǒng)。第二種是專門提供交互界面并方便業(yè)務(wù)人員使用的,便于管理員可以隨時隨地的查看使用情況的,這就是客戶端所采用的Node-Web kit應(yīng)用程序。第三種主要是采用REST設(shè)計的接口,這個接口大大提高了響應(yīng)速度并且擁有較好的易用性。另外一種主要是使用閱讀以及編寫語言文字格式的,這屬于JSON設(shè)計的數(shù)據(jù)交換格式。此種格式能夠跨越平臺、跨越語言英語,擁有非常強(qiáng)大的通用性。第五種可以有效實(shí)現(xiàn)部署便利和配置便利,同時也可以提供XML配置和準(zhǔn)生產(chǎn)應(yīng)用監(jiān)控等功能,這就是Spring Boot框架。所說的這五種軟件架構(gòu)就是人工智能語音識別技術(shù)的主要構(gòu)成部分。
4 人工智能在廣播領(lǐng)域的應(yīng)用方式探索
4.1內(nèi)容層面
人工智能在現(xiàn)代社會占據(jù)很重要的位置,因此,在廣播領(lǐng)域人工智能也很受歡迎,在大數(shù)據(jù)時代對廣播傳播內(nèi)容進(jìn)行有效的利用有利于大數(shù)據(jù)的發(fā)展和挖掘。同時,也為廣播領(lǐng)域提供了便利,人們對大數(shù)據(jù)時代的信息獲取很快,因此,廣播傳播也很快使大眾所接受。比如,在廣播領(lǐng)域中交通信息占據(jù)很重要的地位,同時,人們都對交通方面的內(nèi)容非常重視,對不同工作的人會對交通信息的獲取通道有不同的意見,大多數(shù)司機(jī)在開車時既要專心開車保障人身安全,又要對交通方面的信息內(nèi)容進(jìn)行獲取,因此,會選擇比較傳統(tǒng)的方式,這時,人工智能就派上用場了,人工智能可以通過交通攝像頭對出現(xiàn)的一些交通問題進(jìn)行識別,從而將這些問題反饋給人民群眾,使大眾司機(jī)有效對這些交通事故進(jìn)行有效避免,從而保護(hù)了自身的安全?;蛘呷斯ぶ悄芡ㄟ^對廣播傳播的方式對交通的內(nèi)容進(jìn)行有效的廣播,使大數(shù)據(jù)挖掘廣播傳播內(nèi)容進(jìn)行深入的了解,為了保障智能在電臺的熱度,電臺工作人員和設(shè)計人員可以對人工智能進(jìn)行一些形象設(shè)計,進(jìn)而提升人工智能在人們心中的映象。
4.2形式層面
企業(yè)為了保障新媒體的可持續(xù)發(fā)展,需要工作人員和管理人員對用戶和平臺之間的互動進(jìn)行深入了解和分析,因?yàn)樵谟脩舻捏w驗(yàn)過程中互動是必不可少的一項(xiàng)活動,廣播傳播領(lǐng)域也是由于互動才發(fā)展的。所以,在廣播電臺中人工智能的使用可以有效地提升廣播的效率和速率,工作人員和技術(shù)人員可以進(jìn)行定期培訓(xùn),進(jìn)而提升對人工智能技術(shù)的合理使用,廣播電臺的管理人員可以進(jìn)行會議討論和分析,利用人工智能技術(shù)對廣播電臺創(chuàng)造一個虛擬的主持人,進(jìn)而有效增加了人們對廣播電臺的關(guān)注,同時為廣播電臺的發(fā)展提供了良好的基礎(chǔ)條件。比如,設(shè)計人員和技術(shù)人員可以運(yùn)用人工智能技術(shù)使主持人與虛擬主持人進(jìn)行合理的互動,增添節(jié)目的精彩性,從而保障了廣播電臺的可持續(xù)發(fā)展,設(shè)定項(xiàng)目使客戶能夠與虛擬主持人進(jìn)行語音交流,提高群眾的積極性,提升了廣播電臺的形式化。
5 人工智能語音識別技術(shù)在廣電媒體中的具體運(yùn)用
5.1融媒體會議系統(tǒng)
在廣電媒體中,人工智能語音識別技術(shù)越來越精確,進(jìn)而,融媒體會議系統(tǒng)也隨之發(fā)展起來,其大多數(shù)會被技術(shù)人員融到廣電媒體人員進(jìn)行會議時的記錄當(dāng)中,因此可知,管理人員和工作人員需要對廣電媒體相應(yīng)的工作完成,同時,會議工作人員可以將會議當(dāng)中需要根據(jù)會議內(nèi)容轉(zhuǎn)化成最直接的模式,從而使用戶能夠清晰地了解重點(diǎn)。工作人員還可以將音頻內(nèi)容轉(zhuǎn)化成文字的形式,便于人們進(jìn)行理解,因此可知,人工智能技術(shù)對廣播電臺和會議內(nèi)容討論都具有重要影響。
5.2虛擬播報系統(tǒng)
在虛擬播報系統(tǒng)中,由于虛擬主持人和智能語音機(jī)器人的相互配合,進(jìn)而為工作人員進(jìn)行配音時提供了相應(yīng)的文稿,為我國天氣新聞的報道進(jìn)行了一定的改善,可以進(jìn)行自動播報,為人們的生活提供了便利,同時,也為工作人員減輕了壓力。技術(shù)人員通過利用人工智能技術(shù)從而有效提升了播報的聲音的響亮程度、清晰程度以及發(fā)聲的速度等功能。企業(yè)對廣播電臺的相關(guān)工作人員進(jìn)行一定的培訓(xùn),進(jìn)而有效的提升工作人員對虛擬主持人的有效操控,提升工作人員對播報形式上的建立,經(jīng)過企業(yè)高層人員的會議討論,進(jìn)而對節(jié)目進(jìn)行創(chuàng)新,為虛擬播報系統(tǒng)的運(yùn)行提供了保障。
5.3實(shí)現(xiàn)語音和文字的轉(zhuǎn)化
由于我國經(jīng)濟(jì)的發(fā)展迅猛,為科研提供了經(jīng)濟(jì)基礎(chǔ),從而研究人員對人工智能技術(shù)進(jìn)行了深入了解,從而發(fā)現(xiàn)人工智能技術(shù)可以有效地將廣播傳播中的語音轉(zhuǎn)換成文字的形式,同時,為了保障語音轉(zhuǎn)換成文字的準(zhǔn)確性,企業(yè)需要對工作人員進(jìn)行普通話培訓(xùn),進(jìn)而保障了轉(zhuǎn)換的精確性。同時,人們最常接觸的廣電媒體的信息內(nèi)容的獲取方式為“聲音”,在科技不是最發(fā)達(dá)的時代,廣播電臺的內(nèi)容很容易被損壞或丟失。由于,時代在變化,社會在進(jìn)步,所以,廣電媒體中的“聲音”也可以變換成各個領(lǐng)域所需要的形式。比如,企業(yè)在進(jìn)行會議時,可以通過對人工智能技術(shù)的運(yùn)用,將所需要的“聲音”轉(zhuǎn)換成文字、圖片、視頻等形式,從而提升企業(yè)會議的進(jìn)度。人工智能技術(shù)的合理利用,有效地提升了語音轉(zhuǎn)換成文字形式的水平。
6 結(jié)束語
綜上所述,隨著科技水平的不斷提升,研究人員對人工智能技術(shù)的研究越來越深入,進(jìn)而提升了人工智能的發(fā)展。因此,企業(yè)為了提升廣播領(lǐng)域的發(fā)展,將人工智能與廣播電臺進(jìn)行嚴(yán)格有效的融合,一些企業(yè)也實(shí)施了計劃,從而為以后企業(yè)對廣播領(lǐng)域的發(fā)展提供了良好的基礎(chǔ)。設(shè)計人員和技術(shù)人員通過對人工智能技術(shù)的合理利用,進(jìn)而有效地提升了電臺的發(fā)展,為節(jié)目增添了趣味,通過對虛擬主持人的合理分配,激發(fā)了用戶的積極性和活躍性。因此,我國在新科技的研發(fā)中,也在不斷地提升我國各項(xiàng)領(lǐng)域的發(fā)展。
參考文獻(xiàn):
[1] 馬曉梅.人工智能對廣播媒體的“再造”[J].新媒體研究,2018,4(24):42-43.
[2] 黃小紅.互聯(lián)網(wǎng)時代廣電媒體轉(zhuǎn)型發(fā)展研究[J].傳媒論壇,2019,2(1):51+54.
[3] 蘇金喆.基于全媒體條件下廣電媒體新聞傳播規(guī)律的研究[J].傳播力研究,2019,3(2):63+65.
[4] 趙剛,孫萌,姚瑩.人工智能與廣電新聞業(yè)態(tài)發(fā)展探析[J].中國廣播電視學(xué)刊,2018(12):57-59.
[5] 趙剛,孫萌,姚瑩.人工智能時代,廣電媒體新聞業(yè)態(tài)的變革與重塑[J].中國廣播影視,2018(17):72-75.
[6] 唐百慧,曹三省.人工智能在廣播電視行業(yè)中的應(yīng)用研究[J].廣播電視信息,2018(8):24-26.
[7] 何杰.廣電媒體融合內(nèi)容庫設(shè)計[J].廣播與電視技術(shù),2018,45(8):31-35.
【通聯(lián)編輯:張薇】