謝凌云,劉 靖
(中國傳媒大學 媒介音視頻教育部重點實驗室,北京 100024)
樂器的發(fā)聲是一個復雜的問題,聲學家、音頻工程師、音樂家以及樂器制造者都非常重視這一難題,他們有的采用數(shù)學物理方法,有的用信號處理手段,還有的利用測振儀或全息干涉成像技術對樂器的發(fā)聲原理進行分析,并試圖掌握發(fā)聲的全貌.
樂器振動發(fā)聲的物理原理已經(jīng)在西方樂器上完成了較系統(tǒng)的研究,大多數(shù)振動系統(tǒng)原理的闡述都是在簡化的線性系統(tǒng)上運用數(shù)學物理方法展開的[1].但是,樂器的振動遠不止這些,振動的非線性部分更為復雜且是樂器本身所固有的[1].另一方面的研究中,西方樂器的測量內(nèi)容主要包括振動測量、音色相關特征和指向性[2],測量的西方樂器涵蓋了常見的銅管樂器、木管樂器、弦樂器和打擊樂器,但是針對中國民族樂器的測量[3-4]無論是測量內(nèi)容還是樂器種類都不足以與西方樂器相比.近年來,物理建模技術的提出,有助于理解音色感知和檢索音樂信息,其中,一些信號處理手段被用于處理非線性問題,能更精確地模擬樂器發(fā)聲,在這些處理手段中,數(shù)字波導方法是現(xiàn)在最流行的建模技術[5].至今使用的信號處理手段都更傾向于合成或分離聲源,而不是解釋樂器發(fā)出音樂聲的方式.
共振模式是描述樂器振動發(fā)聲的本質(zhì)特征,測量時能夠得到的面板、背板或空腔振動模態(tài),但在樂器整體的共振或共鳴系統(tǒng)描述上還很匱乏,尤其是中國民族樂器.研究中發(fā)現(xiàn)[2],在演奏同一樂器的不同音符時,能量集中的頻率位置不隨諧波的次數(shù)而改變,這種頻譜能量的集中相對固定的性質(zhì)反映了一部分樂器的特點,使得同一樂器在不同的音高下表現(xiàn)出相同或是相似的音色,所以提出用共振峰來描述樂器的共鳴或共振情況.然而,由于樂器的箱體共振模態(tài)與振動的激勵點有關,對于弦樂器,不同弦激發(fā)的箱體振動模態(tài)是不同的,對應的共振峰也是不同的,所以僅用一個共振峰難以全面地描述樂器的共振情況.因此,本文提出使用共振頻段來描述樂器的整體共振情況,共振頻段指的是樂器演奏過程中共振峰集中出現(xiàn)的頻率區(qū)域.
語音信號處理中的共振峰估計方法主要包括帶通濾波器組法、線性預測分析方法和倒譜法.實驗顯示,雖然倒譜法的運算量很大,但該方法在共振峰估計中具有頻譜包絡穩(wěn)定和能夠減少第一次諧波影響的優(yōu)點[6].在針對音樂內(nèi)容的研究中,有學者進一步提出能夠有效消除基頻影響的頻譜包絡估計算法(True Amplitude Envelope, TAE)[7],該方法是一種迭代的倒譜分析方法,已在音樂信號的處理中被證明優(yōu)于其他的方法[8].
因此,本文在TAE算法的基礎上,提出一種倒譜分析算法,分析中國彈撥樂器的共振情況.下一部分介紹提出的分析方法框架,框架中包含兩個主要部分,共振峰估計和共振峰的后處理.然后,分別闡述共振峰估計算法和對不同單音的共振峰進行的后處理,后處理時采用共振譜法和頻帶法,最后整合兩種處理結(jié)果得到單件樂器的主要共振頻段,用于表征樂器的整體共振情況.文中的分析素材包括琵琶、箏、柳琴和中阮,它們的共振模式為解釋樂器演奏時明亮甚至尖銳的音色起到重要作用.
圖1 共振頻段估計算法Fig.1 Resonance frequency region estimation algorithm
為了消除信號基頻的影響,在倒譜分析中運用時間窗進行同態(tài)解卷積,因為倒譜運用對數(shù)運算和2次變換能將第1次諧波和共振系統(tǒng)的頻譜包絡區(qū)分開,選擇合適長度的時間窗從倒譜中截取出來的部分,就能夠較精確地反映共振系統(tǒng)的響應[6,9].從加窗的倒譜中變換而來的頻譜就是目標頻譜包絡,該頻譜包絡反映了樂器的共振情況.然后用峰值估計算法就能從中得到共振峰.
信號x(n)的倒譜C(l)是其N點頻譜X(k)的對數(shù)的傅里葉反變換,所以,信號的倒譜可以表示為:
(1)
對信號倒譜C(l)加時間窗h(n)后進行離散傅里葉變換(Discrete Fourier Transform, DFT)即可得到所需的平滑頻譜包絡,如下:
(2)
圖2 改進的倒譜法估計頻譜包絡Fig.2 Estimation of spectrum envelope using improved cespstral method
式中: 窗函數(shù)的長度n0由信號基頻f0和和采樣頻率fs決定,即n0=fs/f0[10].因為在倒譜中,C(l)(l≥n0)反映的是聲音的激勵部分(基頻及其以下的頻率),C(l)(l 圖3 中國彈撥樂器共振譜Fig.3 Resonance graph of Chinese plucked string musical instruments 共振譜能夠直觀地在頻域上描繪樂器的共振模式,它是同一樂器的單音共振譜的均值,圖3是本文分析樂器的共振譜圖. 采用爬山算法檢測樂器共振譜上的峰值,并將其直接視為樂器的共振峰,檢測過程中為得到至少10個共振峰,檢測精度不斷增加,從動態(tài)范圍的1%變化到0.2%,然后計算共振峰帶寬等信息,從而得到樂器的共振峰信息.共振譜的共振峰信息作為共振譜法的輸出,用于后面的整合中. 只要頻帶設置合理,單音共振峰估計結(jié)果就可以根據(jù)其共振峰的頻率位置按頻帶劃分,然后與其他單音在頻帶內(nèi)的共振峰進行平均,得到各頻帶內(nèi)的平均共振峰,對相應的幅值和帶寬等也進行平均,最終取得各頻帶內(nèi)的共振峰信息.由于頻帶的劃分是為了具有普適性,所以對于每件樂器,劃分的頻帶可能是過多的,有必要針對各樂器的共振峰頻帶做進一步處理.將不同的頻帶視為不同的類,類的屬性為二值類型,即用0和1表示是否出現(xiàn)共振峰,以此計算類間的距離,距離歸一化為[0,1]范圍內(nèi),距離大于等于0.9時表示兩頻帶相斥,說明對于該樂器任意單音,這兩個頻帶內(nèi)不會同時出現(xiàn)共振峰,若相鄰頻帶互斥,則可以將兩頻帶合并為一個頻帶.頻帶合并后,計算各頻帶內(nèi)共振峰的出現(xiàn)概率,在各頻帶中,當某頻帶的共振峰出現(xiàn)概率大于所有頻帶的出現(xiàn)概率均值時,表示共振峰在該頻帶是“常見”的,可以認為該頻帶在該樂器的共振模式中較為突出,稱該頻帶為顯著頻帶.顯著頻帶的共振峰信息作為頻帶法的輸出,用于最后的整合中. 無論是共振譜法還是頻帶法,取得的樂器共振峰都存在各自的缺陷.采用共振譜法雖然能直觀地從共振譜中得到共振峰,但由于樂器共振譜是由單音共振譜求平均得到,該過程可能導致單音中相近的共振峰被削弱而未在共振譜中顯示出來;頻帶法為保證反映所有共振峰,劃分的頻帶數(shù)往往遠大于實際的樂器共振峰的數(shù)量,即劃分過細,使得頻帶過多,平均的共振頻帶寬度亦受到劃分的頻帶寬度限制.因此,這兩種后處理方法都無法獨立且全面地反映樂器的整體共振情況,需要整合兩者的結(jié)果,才能得到較合理的樂器的共振頻段. 整合兩種方法的結(jié)果時,首先,必須保證兩方法得到的共振峰在幅值上不低于背景噪聲;其次,只有當兩方法得到的共振峰相近時,才認為兩方法得到的是同一個共振頻帶;最后,共振譜法的結(jié)果中允許出現(xiàn)共振峰信息中沒有的共振頻段,即可參照共振譜.以下為兩種方法的整合原則: 1) 兩種方法的共振峰頻帶中心都不得比最大共振峰低40dB; 2) 共振譜法或頻帶法中相鄰頻帶重疊或相近時,共振譜法參照共振譜圖,若較平坦,則合并這些鄰近頻帶,頻帶法則視共振譜法而定,若相鄰頻帶在共振譜中為同一頻帶或高幅值的平坦區(qū)域,則合并,合并時用鄰近頻帶中的最低下限作為合并后頻帶的下限,最高上限作為合并后頻帶的上限,合并中心為鄰近頻帶中心的均值; 3) 當兩種方法求得的共振峰中心相近時,即任一方法的共振峰中心都處于另一方法的共振峰頻帶內(nèi)時,兩者的共振峰頻帶重疊區(qū)域為樂器共振頻段; 4) 當頻帶法的共振頻帶未出現(xiàn)在共振譜法的結(jié)果中時,共振譜法的共振峰頻帶可由共振峰帶寬和譜上高幅值的平坦區(qū)域組成,然后參照原則2),3)進行整合. 由于在西方樂器的研究中已廣泛使用振動測量探討樂器各部分的振動模態(tài),因此,借助這部分研究的數(shù)據(jù)可以大致估計西方樂器的共振頻率范圍,所以可以采用西方彈撥樂器素材驗證共振頻段估計算法的有效性.驗證算法有效性的過程中使用古典吉他、豎琴、倍大提琴和大提琴4種樂器的單音,這些單音均涵蓋了各樂器的常用音高. 表1為西方彈撥樂器的主要共振頻段估計結(jié)果,和文獻中的測量數(shù)據(jù)摘要.分析素材和測量中使用的樂器均為單件樂器,共振頻率可能由于樂器材質(zhì)和構造的不同出現(xiàn)一定的差異,但從表1中不難看出,估計的主要共振頻段的大部分區(qū)域均出現(xiàn)在測量結(jié)果中,即估計的主要共振頻段基本符合樂器共振模態(tài)的測量或耦合分析結(jié)果,說明利用樂器單音素材和信號處理手段,本文提出的共振頻段估計算法能有效地估計出樂器的主要共振頻段. 表1 西方彈撥樂器的主要共振頻段和共振測量數(shù)據(jù)對照 彈撥樂器的聲音在不同音高時會發(fā)生變化,即使演奏的是相同音高,在不同弦上彈奏時,聲音也會不一樣[1,3-4].本文中使用的樂器單音樣本包括了各樂器所有弦上的常用音區(qū),錄音時采樣頻率為44.1kHz,使用樂器包括琵琶、箏、柳琴和中阮.表2為文中用于共振分析的單音樣本,按聲學中使用的音名演奏單音,調(diào)音標準為國際標準音高A4=440Hz. 表2 分析中使用的單音樣本 表3 中國彈撥樂器的主要共振頻段 將共振頻段分析方法應用于各樂器,得到各樂器的主要共振頻段如表3所示.主要共振頻段反映了樂器演奏中會發(fā)生強烈共振的頻率位置,表3顯示了中國彈撥樂器的共振模式具有以下兩個顯著特點: 1) 除中阮外,民族彈撥樂器在500Hz以下較少出現(xiàn)共振頻段; 2) 不同樂器的共振頻段在中高頻區(qū)間多出現(xiàn)重疊,尤其在600~1200Hz和3~4kHz這兩個區(qū)間內(nèi)出現(xiàn)了至少3種樂器的共振頻段. 綜合來看,除了中阮,其他樂器在500Hz以下較少發(fā)生共振,這與樂器振動測量的結(jié)果[3-4]和頻譜特征分析的結(jié)果[13]相符.多數(shù)樂器在較高的頻率上出現(xiàn)共振頻段,從客觀參數(shù)上支持了中國樂器音色較明亮的觀點.另外,一些樂器的共振頻段間存在重疊相交的情況,而該情況在中高頻區(qū)域較常見,這為解釋樂器合奏時聲音過于尖銳的現(xiàn)象提供了一種客觀解釋. 本文提出一種迭代的倒譜分析方法獲取樂器的共振頻段,該分析方法包括結(jié)合了基頻與改進的TAE方法,經(jīng)過3次迭代得到頻譜包絡,從平滑的頻譜包絡中檢測出峰值作為單音共振峰,來自同一樂器的單音共振峰經(jīng)過共振譜法和頻帶法兩種后處理方法,整合得到該樂器的共振頻段.文中計算了4種中國彈撥樂器的共振頻段,并發(fā)現(xiàn)中國彈撥樂器的共振頻率集中在較高的頻率上,不同樂器間的共振頻段有多處重疊且多出現(xiàn)在中高頻區(qū)域,所以中國彈撥樂器合奏時容易產(chǎn)生尖銳甚至刺耳的聽感. 致謝: 本文為中國傳媒大學理工科規(guī)劃重點項目(3132016XNG1603)的部分結(jié)果.3 共振峰后處理
3.1 共振譜法
3.2 頻帶法
3.3 整合原則
3.4 算法的有效性
4 結(jié)果及分析
5 結(jié) 語