曾奕凡++高軍暉
摘 要:該文討論了人工智能在數(shù)字音樂中的多個應用,并對當前的技術(shù)成熟度做出分析,最后對人工智能在數(shù)值音樂中起到的作用做出總結(jié),并展望未來的發(fā)展方向。
關(guān)鍵詞:人工智能 數(shù)字 音樂 旋律識別流行預測 創(chuàng)作進化樹 音樂情緒
中圖分類號:TP18 文獻標識碼:A 文章編號:1672-3791(2015)06(c)-0043-02
人工智能(Artificial Intelligence)是20世紀中后期興起的一門學科,屬于計算機科學的范疇之內(nèi)。它的主要目的是讓機器能夠?qū)W習知識并且運用學到的知識來解決問題。換句話說,就是讓機器能夠擁有人類的思維方式。人工智能在近三十幾年來取得了飛躍性的進展,并且在眾多領(lǐng)域都得到了應用,例如機器人,互聯(lián)網(wǎng),模式識別等。不僅僅如此,人工智能在數(shù)字音樂中甚至都有十分重要的應用。數(shù)字音樂(Digital Music)是以數(shù)字的形式儲存的音樂,它們可以被音樂編輯軟件任意的創(chuàng)作,編輯,播放,擁有傳統(tǒng)唱片所沒有的靈活,快捷。正因為如此,人工智能在數(shù)字音樂中有了用武之地。該文將主要討論人工智能在數(shù)字音樂中的四個應用,分別是旋律識別,預測音樂是否流行,描繪音樂進化樹以及心理疾病的音樂治療。
1 人工智能在數(shù)字音樂中的應用
1.1 旋律識別
旋律識別的基本原理來自于模式識別(Pattern Recognition)。模式識別是指計算機通過數(shù)學方法來判定數(shù)據(jù)是否屬于已存在的模式之中并對數(shù)據(jù)進行適用于該模式的處理。模式識別的價值在于讓機器通過已有的知識應用在新的數(shù)據(jù)上,讓計算機擁有解決問題的能力。旋律識別就是把現(xiàn)有的旋律作為一個模式,儲存在計算機中之后,給計算機聽一段新的旋律,讓其判定是否與已知的旋律匹配,來達到識別音樂的目的?,F(xiàn)在許多軟件中的“聽歌識曲”功能都來源于此。
準確的旋律識別需要精密的算法,而這也是專家們研究的方向。王峰、張雪英、李炳男[1]對和弦識別進行了研究。和弦識別是音樂調(diào)式分析和自動標注的基礎(chǔ),同時在分析音樂的結(jié)構(gòu)和旋律方面有著非常重要的作用。結(jié)合音樂理論和信號處理知識,提出一種基于MPCP(Mel Pitch Class Profile)特征和CRFs(Conditional Random Fields)模型的和弦識別方法。利用短時傅里葉變換(STFT)對音樂信號進行時頻變換,定義了一種新的MPCP特征,最后用CRFs對和弦進行識別。實驗結(jié)果表明,提出的方法在識別率上由于其他方法,具有一定的潛力[1]。胡穎、田麗紅、王峰[2]全面總結(jié)了音樂和弦識別領(lǐng)域所取得的主要研究成果,重點介紹了音樂特征的提取,和弦識別等方面采用的各種智能分析處理方法,并對該領(lǐng)域中存在的主要困難和將來的發(fā)展方向提出來一些看法。旋律識別是人工智能在數(shù)字音樂中非常有前景的一個應用,將會為數(shù)字音樂的智能化做出巨大貢獻[2]。
1.2 預測音樂是否流行
用計算機預測音樂是否流行可以通過數(shù)據(jù)挖掘(Data Mining)來實現(xiàn)。
據(jù)the next web報道[3],英國的音樂發(fā)現(xiàn)軟件Shazam曾在2012年夏季預測過夏季將會流行的音樂榜單。Shazam怎樣得出這樣一個榜單?答案很簡單:挖掘數(shù)據(jù)資源。每天有兩億用戶使用Shazam的同時會生成七百萬條標簽,所以Shazam對流行音樂趨勢的把握總是走在我們的前面。這些數(shù)據(jù)也可以用來預測音樂流行趨勢。
對音樂流行趨勢的預測可以幫助人們更好的跟上當前音樂的流行風向標,讓人們能夠聽到最時髦的音樂。
1.3 音樂創(chuàng)作的進化樹
音樂的進化樹在音樂風格的研究中非常重要,因為它能梳理出某個藝術(shù)家的音樂風格或是某種音樂流派的發(fā)展趨勢。人工智能使得計算機能夠通過特殊的算法來分析出某種音樂的進化樹。Joe George和Lior Shamir[4]使用了一種自動化的定量分析法來分析一些流行音樂專輯之間的相似度。他們的算法能夠讓計算機將每首歌轉(zhuǎn)換為類似二維頻譜的視覺圖片。這張圖能夠顯示歌曲聲波變化的頻率、形狀以及紋理。接著,該算法通過比較聲音的“頻譜”來對不同的歌曲進行分析與排序,最后利用統(tǒng)計學方法對兩首歌曲進行相關(guān)性分析。他們對披頭士(The Beatles)的歌曲與專輯的相關(guān)度進行了分析,并畫出了樹狀圖,見圖1。圖1中,歌曲以及之間的連線長短表示它們的相似度,距離越長,相似度越低,反之亦然。
該算法分析出了《Please Please Me》出自披頭士的第一張專輯《With the Beatles》,它也正確地指出了披頭士不同時期的專輯順序。它同時顯示,披頭士的這些早期的歌曲和晚期的歌曲,比如“Abbey Road”是截然不同的。雖然《Let it Be》是披頭士發(fā)行的最后一首歌曲,但實際上這首歌比《Abbey Road》錄制的更早。也就是說,盡管打亂了發(fā)行日期,他們的算法仍可以根據(jù)歌曲的特征,從而正確地識別出歌曲創(chuàng)作的順序。不僅如此,他們還分析了U2,ABBA,Queen等其他著名樂隊,都基本正確地排列出了專輯和歌曲正確的時間順序。
在他們的另一篇論文中,他們把目光轉(zhuǎn)向了對不同音樂流派之間相似度以及不同的音樂家與音樂流派間關(guān)系的相似度進行了分析[5]。通過與上文類似的方法,他們成功地分析出了音樂流派之間的關(guān)系以及以流派為標準的音樂家之間的關(guān)系。這些進化樹都大大促進了學者們對音樂發(fā)展歷程的研究。
1.4 音樂情緒與音樂治療
丹尼爾·鮑林(Daniel Bowling)等人[6]研究音樂與情緒的關(guān)系。音樂何以通過琴弦來表現(xiàn)或歡快或悲凄的主題?一場振奮人心的演說往往配以激昂的大調(diào)樂曲,其鮮明的節(jié)奏,流暢優(yōu)美的旋律,常常蘊涵著某種自得其樂的情緒在其中,如著名的G大調(diào)弦樂小夜曲。而在另一些場合,如要對一位頗受人們愛戴的逝者致以哀挽的悼詞時,舒緩、婉約的小調(diào)樂曲無疑是最好的選擇了,人們也可以在小調(diào)曲營造的凄切氛圍中盡情地表達自己的哀思。很顯然,要讓音樂烘托出某種氣氛,與彼時彼刻所處的場景以及所發(fā)生的事是密不可分的。
那么,為什么大調(diào)音使人歡欣雀躍,而小調(diào)音令人沉痛哀傷呢?這是音樂史上一個非常古老的問題。為了揭開這層神秘的面紗,美國杜克大學(Duck university)神經(jīng)學家丹尼爾?鮑林(Daniel Bowling)及其同事對大調(diào)音和小調(diào)音在7500首西方古典樂曲和芬蘭民歌中的分布作了統(tǒng)計。結(jié)果發(fā)現(xiàn),小三度音(minor thirds)占小調(diào)曲中音符總數(shù)的15%,而在大調(diào)曲中僅占不到1%。
近年來,有人用人工智能的計算方法對各種音樂標注心情或情緒。Emokit公司在互聯(lián)網(wǎng)上建立一個平臺,提供音樂來匹配用戶的情緒,使用戶產(chǎn)生感官上的共鳴。他們通過穿戴設備獲得用戶的語音、面部表情、心率等體征的數(shù)據(jù)來識別情緒,在理想情況下準確率達到80%。
2 結(jié)語
人工智能所帶來的模式識別,數(shù)據(jù)挖掘,聚類分析等等技術(shù)已經(jīng)在數(shù)字音樂中有了重要的應用。在數(shù)字音樂產(chǎn)業(yè)日漸蓬勃的今天,人工智能未來必然會在音樂領(lǐng)域發(fā)揮更加重要的作用。
參考文獻
[1] 王峰,張雪英,李炳男.基于CRFs和MPCP特征的和弦識別研究[J].計算機工程與應用,2011,47(18):198-200.
[2] 胡穎,田麗紅,王峰.音樂和弦識別算法綜述[J].科技情報開發(fā)與經(jīng)濟,2010(26):149-152.
[3] ANNA HEIM. Music discovery service Shazam leverages its data to predict this summers music hits[EB/OL](2012-5-31).http://thenextweb.com/media/2012/05/31/uk-music-discovery-app-shazam-leverages-its-data-to-predict-this-summers-music-hits/.
[4] George J, Shamir L. Computer analysis of similarities between albums in popular music[J].Pattern Recognition Letters, 2014,45(11):78-84.
[5] Joe George, Lior Shamir.Unsupervised analysis of similarities between musicians and musical genres using spectrograms.Artificial Intelligence Research,2014.
[6] Bowling D L,Gill K,Choi J D,et al. Major and minor music compared to excited and subdued speech.[J].Journal of the Acoustical Society of America,2010,127(1):491-503.