早在20世紀,人類就開始探討計算機獨立制作音樂的可能性。1956年,在列哈倫·希勒(Lejaren Hiller)的研究室里,世界上第一首完全由計算機生成的音樂作品—弦樂四重奏《伊利亞克組曲》(Illiac Suite)誕生了。1995年,阿爾佩(Alpern)研發(fā)的EMI作曲系統(tǒng)也是較早的一個成熟的古典音樂作曲系統(tǒng),該系統(tǒng)主要采用拼接的方式來創(chuàng)作再現(xiàn)已故作曲家音樂風格的作品,其中有類巴赫的創(chuàng)意曲、器樂協(xié)奏曲和組曲,還有類莫扎特的奏鳴曲以及類肖邦的夜曲。
隨著AI相關技術的發(fā)展和普及,近年來,越來越多的企業(yè)和機構開始研究這個科技與藝術結(jié)合的奇妙領域,各式各樣的作曲算法不斷涌現(xiàn),不少虛擬音樂人嶄露頭角。筆者梳理如下。2016年,Google研發(fā)的機器學習項目馬真塔(Magenta studio)通過神經(jīng)學習網(wǎng)絡創(chuàng)作出一首時長90秒的鋼琴曲。同年,Sony旗下的計算機科學實驗室(Computer Science Laboratories,簡稱Sony CSL)開發(fā)了Flow Machines平臺。Flow Machines利用馬爾科夫鏈分析數(shù)據(jù)庫中現(xiàn)存的歌曲,提取旋律及和弦的關鍵信息,利用這些關鍵信息作為變量來學習音樂風格,讓不同風格的歌曲相互轉(zhuǎn)換、融合,并加以優(yōu)化,其代表作是一首披頭士音樂風格的歌曲《爸爸的汽車》(Daddys Car)。此外,Sony CSL還開發(fā)了一個名為“DeepBach(深度巴赫)”的神經(jīng)網(wǎng)絡,利用巴赫創(chuàng)作的352部作品來訓練DeepBach,最終完成2 503首贊美詩的創(chuàng)作。
第一個正式獲得世界地位的AI虛擬作曲家則是2016年誕生的AIVA(Artificial Intelligence Virtual Artist)。AIVA通過讀取由莫扎特、巴赫和貝多芬等名家譜寫的15 000首曲子進行學習,利用深度學習技術,搭建體現(xiàn)它自己對音樂理解的數(shù)學模型,運用模型創(chuàng)作出完全原創(chuàng)的曲子。作為虛擬音樂人,AIVA已通過法國和盧森堡作曲家協(xié)會(SACEM)的合法注冊,成為該協(xié)會首位非人類會員,并擁有自己的署名版權。
今年2月,美國數(shù)字研究機構Space150模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了說唱機器人Travis Bott。這是一個關于AI創(chuàng)造性的實驗,研發(fā)團隊采用附加神經(jīng)網(wǎng)絡技術(Additional Neural Network),創(chuàng)造出“Travis Scott味”的旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入“文本生成器模型(Text Generator Model)”,得到了機器自動仿照Travis風格生成的歌詞。于是,Travis Bott完成了自己的創(chuàng)作—Jack Park Canny Dope Man。最后,研發(fā)團隊使用基于AI的人體圖像合成技術“Deepfake”,為這首歌拍攝了MV。就樂曲效果而言,Travis Bott對Travis Scott的模仿幾乎以假亂真,完全融匯了Travis Scott作品以及人物魅力最主要的外部特征。同時,該項目也進一步驗證了人工神經(jīng)網(wǎng)絡技術(Artificial Neural Networks)的蓬勃發(fā)展,有助于探索未來AI在音樂中的應用價值。
現(xiàn)代AI作曲技術背后蘊含了多種算法模型的結(jié)合運用,包含人工神經(jīng)網(wǎng)絡、馬爾科夫鏈及遺傳算法等。如AIVA和Travis Bott就使用了一種基于人工神經(jīng)網(wǎng)絡的深度學習技術。
人工神經(jīng)網(wǎng)絡是一種對生物神經(jīng)的網(wǎng)絡行為特征進行模仿,開展分布式并行信息處理的算法數(shù)學模型。程序員必須搭建一個多層“神經(jīng)網(wǎng)絡”,在多層的結(jié)構中分別加以編程,從而處理各種輸入和輸出點之間的信息。作品數(shù)據(jù)輸入后,人工神經(jīng)網(wǎng)絡會找到眾多被輸入作品之間存在的規(guī)律,繼而形成對音樂旋律、節(jié)奏、音高、強弱變化的理解與學習。這種學習的主要目的是用來預測,并非就此生成作品。AI程序會帶著它對以上音樂風格的預測繼續(xù)運行,并將在前方遇到下一個驗證數(shù)據(jù)集。這個數(shù)據(jù)集會判定它的預測是否正確,正確與錯誤的回饋都將被AI記住。
在不斷地高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數(shù)據(jù)歸總后的曲風,進而編寫出自己的曲子。人工神經(jīng)網(wǎng)絡為從前的算法作曲提供了一種新的方式,其優(yōu)勢在于能夠?qū)σ魳纷髌返娜中蕴卣鬟M行學習,但是需采用大量的樣本進行訓練。當下國內(nèi)外有許多基于該種算法所形成的AI作曲系統(tǒng),如LSTM神經(jīng)網(wǎng)絡,可以確保所創(chuàng)作音樂的完整性。
除了人工神經(jīng)網(wǎng)絡,馬爾科夫鏈(Markov Chain)也一直被廣泛地應用于算法作曲領域。馬爾科夫鏈是一種隨機選擇過程,主要用于產(chǎn)生一段具有一定風格的旋律。就像按照一個特定的標準人為構造制定的轉(zhuǎn)換表來依次選擇音符,計算并選擇下一個要出現(xiàn)音符的可能性。這種方法可以模擬作曲家創(chuàng)作音樂時的思維,來控制計算機生成相應的音樂作品,但是整部作品的曲式結(jié)構無法通過馬爾科夫鏈建模。遺傳算法(Genetic Algorithm)則是模仿生物進化過程的智能計算方法,使用適應性函數(shù)來演化樣本、優(yōu)化全局。
其中,變異算子可以模擬人在其創(chuàng)作當中靈感的閃現(xiàn),相當于留下最具代表性的作品來產(chǎn)生新的旋律。該算法的壁壘在于適應性函數(shù)的設計至今尚無統(tǒng)一標準。