王南陽
TTS技術又稱文本-語音轉(zhuǎn)發(fā)處理技術,它是以大規(guī)模真實錄音的語音庫為基礎,增加音庫壓縮算法和聲色變換算法所形成的一項重大核心技術。TTS技術具有以下特點:1、可直接將任意文本信息轉(zhuǎn)化為語音輸出,即動態(tài)合成語音信息,實現(xiàn)真正意義上的實時語音播放;2、達到自然語調(diào)合成、字詞間平滑過渡、音色可調(diào)節(jié)的高音質(zhì)水準。具有音色統(tǒng)一、語音清晰流利、自然度高的特點;3、以真實錄音的大容量語音庫為基礎,且音庫大小可調(diào)節(jié),一次性語音錄入永久享用。當信息內(nèi)容變動時,無需重新錄音,只要更改相應的文本信息即可。這樣既節(jié)省人工成本,又省卻錄制時間;4、非常適合信息量異常龐大的海量查詢以及查詢內(nèi)容經(jīng)常變化的動態(tài)查詢服務系統(tǒng),如傳呼服務/故障服務/秘書服務/多媒體綜合信息服務系統(tǒng);5、可廣泛應用于計算機和通訊等許多領域,如呼叫中心、電子商務、自動錄音系統(tǒng)、自動語音信箱、綜合語音數(shù)據(jù)服務系統(tǒng)、自然語音識別系統(tǒng)、有線/無線計費系統(tǒng)等。
下面以XFTS721為例,介紹嵌入式文本轉(zhuǎn)發(fā)語音處理電路的原理以及應用。XFTS721是高質(zhì)量、高度集成的文本-語音轉(zhuǎn)發(fā)芯片,它是一種能把ASCII文本轉(zhuǎn)化為自然人聲音的大規(guī)模文本轉(zhuǎn)發(fā)語音處理器,可廣泛應用于車載信息終端音像播報播放、智能儀表儀器、高檔益智玩具、自動語音售貨機、公交車及電梯等音響報站(層)器、自助查詢系統(tǒng)、短消息播放、電子地圖、電子導游、電子詞典、電子圖書、智能電教產(chǎn)品、海量語音考勤系統(tǒng)等。