楊文華
(渭南職業(yè)技術(shù)學院 師范學院, 陜西 渭南 714026)
隨著計算機技術(shù)的不斷成熟,信號處理的能力得到提升,其在音樂生成領(lǐng)域得到了成功應(yīng)用,產(chǎn)生了大量的電子音樂。由于大多數(shù)人都喜歡聽音樂,但是電子音樂的種類繁多,每一個人喜歡的電子音樂類型不同,如果事先對電子音樂信號類型進行分類和辨識,聽眾可以從電子音樂信號標簽中選擇自己想聽的電子音樂,這樣能夠大幅度提升電子音樂的管理水平,因此電子音樂信號的分類和辨識成為人工智能領(lǐng)域的一個重要研究方向[1-3]。
多年以來,人們對電子音樂信號辨識問題進行研究,電子音樂信號辨識包括多個因素[4],如風格、音量、音調(diào)、旋律、音色、和聲等,是一個十分復(fù)雜的過程,與多種技術(shù)有關(guān),如信號處理、人工智能、電子技術(shù)等,起初采用人工方式進行電子音樂信號辨識研究,它們根據(jù)自己對電子音樂信號的經(jīng)驗實現(xiàn),因為存在太多的主觀意識,不僅人工方式辨識效率低,而且電子音樂信號辨識誤差比較大,不能滿足現(xiàn)代電子音樂發(fā)展的速度[5-6]。隨后出現(xiàn)了人工智能的電子音樂信號辨識方法,如線性判別分析的電子音樂信號辨識方法、人工神經(jīng)網(wǎng)絡(luò)的電子音樂信號辨識方法、支持向量機的電子音樂信號辨識方法,它們獲得比人工方式更好的電子音樂信號辨識結(jié)果[7-9],但是在實際應(yīng)用中,這些方法存在一定的不足:線性判別分析的電子音樂信號辨識正確率低,其認為特征向量和電子音樂信號類型之間是一種固定的線性變化關(guān)系,無法反映電子音樂信號的變化趨勢;支持向量機的電子音樂信號辨識效率低;人工神經(jīng)網(wǎng)絡(luò)對噪聲的干擾魯棒性弱,因此電子音樂信號辨識有待進一步研究[10]。
為了提高音樂信號辨識正確率,提出了一種基于機器學習算法的電子音樂信號辨識方法,采用最小二乘支持向量機建立電子音樂信號辨識模型,并采用Matlab 2018編程實現(xiàn)電子音樂信號辨識的仿真實驗,驗證了本文電子音樂信號辨識方法的有效性和優(yōu)越性。
機器學習算法的電子音樂信號辨識方法。首先對電子音樂信號進行采集,并引入去噪方法對其進行預(yù)處理,抑制噪聲對音樂信號辨識的干擾,提高抗噪魯棒性,然后從去噪后的電子音樂信號中提取能夠描述其類型的特征向量,其與電子音樂信號類型組成學習樣本,最后通過采用機器學習算法的最小二乘支持向量機對學習樣本進行訓(xùn)練構(gòu)建電子音樂信號辨識模型,如圖1所示。
圖1 電子音樂信號辨識原理
由于電子音樂信號的采集環(huán)境比較復(fù)雜,通常在室內(nèi),由于回波、信號折射、人員走動以及技術(shù)人員自身的水平等因素影響,得到的電子音樂信號含有一定的噪聲,這樣對電子音樂信號辨識結(jié)果會產(chǎn)生干擾,一個帶有噪聲的電子音樂信號y(n),如式(1)。
y(n)=x(n)+e(n)
(1)
式中,x(n)表示無噪聲的電子音樂信信號;e(n)表示噪聲。
采用小波包方法對電子音樂信號去噪,基本思想為:采用小波包對電子音樂信號進行分解,產(chǎn)生高頻和低頻兩種電子音樂信號,對低頻電子音樂信號進行進一步分解,不斷分解下去,直到滿足要求為止。電子音樂信號的正交尺度函數(shù)為φ(x),其小波函數(shù)為ψ(x),如式(2)、式(3)。
(2)
當μ0=φ(x),μ1=ψ(x),得到:
(3)
不同的電子音樂信號,具有不同的特征向量,建立電子音樂信號辨識模型主要用于描述特征向量和電子音樂信號類型之間的映射關(guān)系。電子音樂信號特征主要包括3類:時域特征、頻域特征和Mel 倒譜系數(shù),因此本文提取這3類特征進行電子音樂信號辨識。
1.3.1 提取電子音樂信號的時域特征
電子音樂信號的時域特征很多,本文選擇短時能量特征、短時平均過零率特征,對于電子音樂信號{x(n)},其短時能量的計算,如式(4)。
(4)
式中,h(n)=w2(n)表示電子音樂信號的單位沖擊響應(yīng)。
短時平均過零率的計算,如式(5)。
(5)
式中,sgn表示符號函數(shù)。
1.3.2 提取電子音樂信號的頻域特征
電子音樂信號的頻域特征選擇譜質(zhì)心、子帶能量和帶寬,先對電子音樂信號進行傅里葉變換,得到F(w),然后得到譜質(zhì)心、子帶能量和帶寬的計算,如式(6)—式(8)。
(6)
(7)
(8)
式中,w0表示信號電子音樂采樣頻率的1/2;Hj和Lj分別表示傅里葉變換子帶的上下邊界頻率。
1.3.3 提取電子音樂信號的Mel倒譜系數(shù)
Mel倒譜系數(shù)是一種關(guān)鍵電子音樂信號辨識特征,建立在傅里葉變換和倒譜分析基礎(chǔ)上,電子音樂信號的每個子帶寬度,如式(9)。
Mel(f)=2 595lg(1+f/700)
(9)
電子音樂信號的Mel倒譜系數(shù)特征提取步驟具體如下。
Step1:采用傅里葉變換對電子音樂信號進行處理,得到頻譜X(k),如式(10)。
(10)
Step2:建立Mel倒譜的濾波器組,采用Mel濾波器組對X(k)進行處理,得到信號的功率譜Sk。
Step3:采用離散余弦逆變換計算Mel倒譜系數(shù),如式(11)。
(11)
式中,K表示濾波器的數(shù)量。
最小二乘支持向量機是最近流行起來的一種機器學習算法,其學習速度要快于支持向量機,學習效果要優(yōu)于人工神經(jīng)網(wǎng)絡(luò),因此選擇其建立電子音樂信號辨識模型。設(shè)電子音樂信號辨識特征和信號類型組成訓(xùn)練樣本集合:{(xi,yi)},i=1,2,…n,xi∈Rn,yi∈R,xi和yi分別為電子音樂信號辨識特征和類型,如式(12)。
f(x)=wTφ(x)+b
(12)
對式(12)進行變換求解,如式(13)。
s.t.
yi-wTφ(x)+b=ei
(13)
式中,γ表示最小二乘支持向量機的參數(shù)。
由于式(13)的計算過程十分復(fù)雜,建立其等價形式,如式(14)。
(14)
根據(jù)最優(yōu)化理論,如式(15)。
wTφ(xi)+b+ξi-yi=0
(15)
根據(jù)K(xi,xj)=φ(xi)Tφ(xj),得到最小二乘支持向量機的電子音樂信號辨識模型形式,如式(16)。
(16)
K(xi,xj)定義,如式(17)。
(17)
式中,σ為徑向基寬度。
選擇Matlab 2018作為仿真實驗的工具,并編寫了電子音樂信號辨識程序。采用6種電子音樂信號仿真測試對象,它們分別是古典、迪斯科、流行音樂、搖滾、爵士、鄉(xiāng)村,電子音樂信號辨識結(jié)果采用交叉驗證進行。電子音樂信號的訓(xùn)練、驗證樣本的數(shù)量,如表1所示。
表1 電子音樂信號仿真實驗的數(shù)據(jù)
采用支持向量機、BP神經(jīng)網(wǎng)絡(luò)的電子音樂信號辨識方法作為對比方法,統(tǒng)計它們對6種類型的電子音樂信號驗證樣本集合辨識正確率,如圖2所示。
圖2 電子音樂信號辨識正確率
對圖2的電子音樂信號驗證樣本集合辨識正確率進行對比和分析,可以得出結(jié)論:機器學習算法的電子音樂信號辨識正確率要高于支持向量機、BP神經(jīng)網(wǎng)絡(luò)的辨識正確率,減少了電子音樂信號辨識錯誤率,解決了當前電子音樂信號辨識結(jié)果不理想的問題,證明了本文方法的電子音樂信號辨識結(jié)果的優(yōu)越性。
由于當前電子音樂數(shù)量不斷增加,向大規(guī)模方向進行發(fā)展,為了適應(yīng)現(xiàn)代電子音樂信號發(fā)展要求,電子音樂信號辨識的時間亦十分重要,統(tǒng)計3種方法對6類電子音樂信號辨識時間(秒,s),如表2所示。
表2 電子音樂信號辨識時間(s)
從表2可以看出,機器學習算法的電子音樂信號辨識時間要明顯少于支持向量機、BP神經(jīng)網(wǎng)絡(luò),加快了電子音樂信號辨識速度,在相同時間內(nèi),可以辨識更多的電子音樂信號。
電子音樂信號的辨識具有重要的實際應(yīng)用價值,成為人們的關(guān)注焦點,為了提高電子音樂信號的辨識正確率、減少電子音樂信號的辨識誤差,提出機器學習算法的電子音樂信號辨識方法,在相同條件下,與經(jīng)典方法進行了辨識仿真實驗,機器學習算法的電子音樂信號辨識正確率遠遠高于實際應(yīng)用的要求,信號辨識誤差低于經(jīng)典方法,為解決電子音樂信號辨識問題提供了一種新的研究思路。