崔峰
渭南師范學院 絲綢之路藝術學院,陜西 渭南 714000
智能音樂作曲是指通過某種形式化的過程,使得曲作者借助于計算機實現(xiàn)音樂創(chuàng)作,保證人為介入程度最低?,F(xiàn)階段,國外在計算機作曲方面研究非?;钴S[1],而國內外由于這方面人才和技術的欠缺,導致智能音樂作曲還處于起步階段。通過研究智能音樂作曲有助于我們理解和模擬作曲人進行創(chuàng)作的思維方式,同時有助于輔助作曲人進行音樂創(chuàng)作,此外還能娛樂于人。
粒子群算法(Particle Swarm Optimization Algorithm,PSO)是受鳥群覓食行為啟發(fā)所提出的群智能算法,通過群體間的協(xié)作和競爭實現(xiàn)最優(yōu)化搜索,粒子通過公式(1)和公式(2)實現(xiàn)粒子位置和速度的更新[2]:
公式(1)和公式(2)中,vid(t)和xid(t)分別表示在t時刻時第i粒子的速度和位置;rand1和rand2表示隨機數,處于[0 1]之間;c1、c2表示學習因子,為非負常數。
針對粒子群算法在優(yōu)化搜索后期存在搜索能力下降和收斂速度緩慢的缺點,結合文獻[2]的研究結果,提出一種修正的粒子群算法(MPSO),其迭代公式如下:
其中,公式(4)用來保證粒子搜索的方向,確保算法可以在有效區(qū)域內進行搜索。公式(5)用來提高算法初期粒子的全局搜索能力和后期的算法局部搜索能力。a為改進粒子算法的控制參數,其大小決定粒子的分布。
音樂特征主要包括三類,分別為整體特征、基本特征和復雜特征[3]。開始階段,通過提取音樂中的基本特征,在此基礎上分析得到復雜特征,之后結合基本特征和復雜特征識別出音樂的整體特征,主要有音樂的風格、曲式結構和情感內涵,結構圖如圖1所示。
圖1 音樂特征結構圖Fig.1 Music characteristic structure diagram
通常,音樂信息記錄格式主要為WAVE格式和MIDI格式。其中,WAVE格式主要用于實時播放音樂信號的采樣和數字編碼,同時記錄音樂的實際演奏效果。MIDI格式是音樂信號的傳輸標準,該格式主要用于音樂的演奏和全部樂譜的全過程的記錄。絕大多數智能作曲均采用MIDI格式,因此本文智能作曲采用MIDI格式。
調號為(1=C、1=G等),拍號為(2/4、4/4、6/8等)、調式選擇方式主要有民族調式、小調式和大調式以及小節(jié)個數。
音級主要包括基本音級和變化音級,所謂音級即樂音體系中的各音。樂音體系中,7個具有獨立的音級被稱為基本音級。通過升高或降低基本音級實現(xiàn)的音被稱為變化音級[4]。
將低音1編碼表示為11,中音1編碼表示為12,高音1編碼表示為12,音級由低到高,每增加一個音級,編碼數值增加10。為了方便計算,本文的樂曲曲調定為C調。部分音級的編碼如表1所示,其中,偏移半音數表示偏移中音1的半音個數。
表1 部分音級編碼表Table 1 Partial scale degree encode
拍數類時值型主要有1/2、1/4、1/8、1/16等多種類型,將拍數1/16為參考標準,標記為0,其它拍數的編碼如表2所示:
表2 拍數時值編碼表Table 2 Beat duration encode
音符編碼采用三位十進制編碼方式進行實現(xiàn),前兩位為音級,第三位為時值。選擇歌曲《得民心者得天下》中的一小節(jié)簡譜為研究對象[5]:4336
結合表1、表2的編碼規(guī)則,該小節(jié)簡譜可編碼為:423,320,320,615
智能音樂作曲的主要問題就是作曲質量的評價,為了使得生成的音樂質量能最大限度地符合絕大多數人的審美和聽覺習慣,需要多個不同類型的人群的參加,使得音樂質量的評估結果更加準確和合適。為了便于計算和操作,本文選擇非對口組、對口組和專業(yè)組為評價對象,其評價的權重分別為15%、40%和45%。
其中,Ru、Rf、Rm分別表示非對口組、對口組和專業(yè)組的評估分數,F(xiàn)itness(i)表示樂段個體的適應度值。
為了更好地客觀地評價智能音樂作曲效果,本文采用區(qū)域內部均勻性測度(Uniformity Measure,UM)、區(qū)域間對比度(Regional contrast,RC)以及綜合測度等三個指標評價智能音樂作曲效果[6]。
1)RC通過區(qū)域間的對比度實現(xiàn)智能音樂作曲結果的評價,其公式如下:
其中,f1,f2分別表示區(qū)域1和區(qū)域2的適應度值。
2)UM評價指標公式如下:
其中,Ri,Ai分別第i個區(qū)域的適應度值;f(x,y)表點(x,y)出的適應度值;C表示歸一化參數。
3)綜合測度
其中,α,β表示權值,且α+β=1。M越大,則音樂作曲效果越好;反之,效果差。
為了驗證本文算法的有效性和可靠性,將本文算法(MPSO)和遺傳算法(GA)、人工神經網絡(ANN)和粒子群算法(PSO)等進行智能音樂作曲結果進行對比,對比結果如表3、表4和圖2所示。
圖2 修正型粒子群算法作曲結果Fig.2 Composed result from MPSO
表3 不同方法的區(qū)域間對比度Table 3 Interregional contrast of different methods
表4 不同方法的均勻性測度Table4 Uniformity measure of different methods
圖3 不同方法的作曲速度Fig.3 Composing speed of different methods
實際應用中,作曲速度也是一個關鍵指標,其快慢決定了方法的應用和推廣。將作曲時間作為衡量其速度快慢的指標,單位為ms,對比結果如圖3所示。由圖3可知,GA進行智能作曲耗費的時間最多,MPSO具有作曲速度快、質量高的優(yōu)點,同時能夠滿足實際應用的實時性要求。
針對傳統(tǒng)作曲算法存在速度慢、工作量的缺點,提出一種基于修正型粒子群算法的智能音樂作曲算法。選擇非對口組、對口組和專業(yè)組的加權評價結果為適應度函數,通過音級、拍數時值和音符的編碼實現(xiàn)音樂的數值編碼。實驗結果表明,提出的算法具有作曲速度快、質量高的優(yōu)點,有助于作曲人進行音樂創(chuàng)作,極大地降低工作量,為后續(xù)研究工作奠定了較好的基礎。
[1]Jones GA,Copley P.The suitability of genetic algorithms for musical composition[J].Contemporary Music Review,2003,22(3):43-55
[2]崔 嘉,劉 弘.遺傳算法在計算機輔助創(chuàng)新作曲中的應用[J].計算機工程與應用,2007,43(3):198-206
[3]Todd PM,Werner GM.Frankensteinian methods for evolutionary music[M].Musical networks:parallel distributed perception and performance.Cambrige MA:MIT press/Bradford boos,1999:313-340
[4]Mehrabian A.Pleasure-arousal-dominance:A general framework for describing and measuring individual differences in temperament[J].Current Psychology,1996,14(4):261-292
[5]杜 鵬,周昌樂,賀志強.一種基于遺傳算法的自動生成創(chuàng)意曲動機的方法[J].計算機技術與發(fā)展,2007,17(4):150-153
[6]Maeda Y,Miyashita S.Chaotic Interactive Sound Generation System Using Interactive Genetic Algorithm[J].Journal of Japan Society for Fuzzy Theory and Intelligent Informatics,2009,21(5):768-781