兩年前的經(jīng)歷讓孫濤至今難以忘懷。“有一位抗美援朝的老戰(zhàn)士,很懷念已經(jīng)過世的老排長。” 語音合成架構(gòu)師孫濤就和同事錄制了一些老排長在世時的聲音,并通過語音合成技術(shù)把老排長留給老戰(zhàn)士的信讀給他聽,老人頓時淚流滿面。
語音合成廣泛應(yīng)用于播報、客服、導(dǎo)航、虛擬主播、虛擬主持人等等。語音合成有三大關(guān)鍵因素:文本內(nèi)容、發(fā)音人音色和說話的韻律節(jié)奏。發(fā)音人音色的不同在于喉嚨。每個人的喉嚨結(jié)構(gòu)比較固定,如果把它比喻成一個樂器,文本內(nèi)容和韻律節(jié)奏更像是樂譜。語音合成相當(dāng)于只要掌握了樂器(喉嚨)的基本結(jié)構(gòu),想要合成什么樣的語句,只要提供樂譜(文本內(nèi)容和韻律節(jié)奏)就可以了?!爸灰占阏f的9句話,就能復(fù)刻你的聲音”。語音合成架構(gòu)師孫濤自信地對中工網(wǎng)記者說。每天,孫濤要處理大量采集來的聲音??粗叩筒黄降穆暡ǎ拖窨粗磳⒘料嗟臉纷V,人工智能是“演奏家”,而他,就是那個“作曲家”。
“以前客戶服務(wù)電話的拒接率很高,大家一聽就知道這不是真人,從情感上就不想交流。” 人工智能的快速發(fā)展,語音合成也搭上了這趟順風(fēng)車。“語音合成的效果提升以后,已經(jīng)無法分辨接客服電話的是真人還是機(jī)器,與客戶溝通的效率也提升了?!睂O濤對記者說,語音合成發(fā)展到現(xiàn)在已經(jīng)進(jìn)步為個性化的合成,會帶上情感表現(xiàn),甚至還有一些人文關(guān)懷的成分?!罢Z音合成發(fā)展的大方向是交互,讓人與人工智能自如地對話。不僅能傳遞信息,也能傳遞情感?!睂O濤滿懷憧憬地說。(據(jù)中工網(wǎng) 10.9訊)