摘要:漢語(yǔ)發(fā)音的唇形可視化方法研究中,關(guān)鍵要將語(yǔ)音的聲學(xué)特征與視覺特征聯(lián)系起來(lái),形成統(tǒng)一的可視語(yǔ)音,即使語(yǔ)音和唇形同步,并取得自然真實(shí)的視覺效果。該文研究了發(fā)音時(shí)唇部運(yùn)動(dòng)參數(shù)建模方法,提出了使用三次曲面來(lái)模擬靜態(tài)唇形和計(jì)算動(dòng)態(tài)唇形參數(shù)。實(shí)驗(yàn)結(jié)果表明用此方法建模速度更快,模型表面平滑連接。
關(guān)鍵詞:唇部參數(shù);三次曲面建模;口型動(dòng)畫
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)01-0180-03
在人類相互交流過(guò)程中,人們?cè)诶斫馑酥v話內(nèi)容時(shí),不僅通過(guò)聲音獲得信息,而且通過(guò)眼睛觀察對(duì)方的口形、表情等的變化更準(zhǔn)確地理解對(duì)方所講的內(nèi)容。D.Reisberg通過(guò)實(shí)驗(yàn)證明正常人即使在非噪聲環(huán)境下,通過(guò)對(duì)說(shuō)話者的臉部表情和口型的觀察,可以更好地感知語(yǔ)言[1]。對(duì)于一部分聾啞人而言,他們本身的發(fā)音器官是正常的,但無(wú)法通過(guò)聽覺反饋校正自己的發(fā)音,所以存在有嚴(yán)重的語(yǔ)音問題。由于語(yǔ)音具有聲覺和視覺兩種形態(tài),我們可以通過(guò)可視語(yǔ)音系統(tǒng),讓聾啞人進(jìn)行輔助的發(fā)音訓(xùn)練。在可視語(yǔ)音研究中,嘴唇生理解剖結(jié)構(gòu)復(fù)雜,再加上人們對(duì)其運(yùn)動(dòng)的敏感性,嘴唇的有效數(shù)學(xué)建模就顯得十分重要了。
1 插值法動(dòng)畫原理
插值技術(shù)是指在兩幅圖像中插入過(guò)渡的圖像。當(dāng)有四幅靜態(tài)唇形圖像時(shí),就可以使用雙線性插值來(lái)產(chǎn)生更多的唇部動(dòng)作[2]。我們可以對(duì)插值函數(shù)引入?yún)?shù),通過(guò)更改參數(shù)來(lái)間接地移動(dòng)定點(diǎn)位置。