技術(shù)宅
最近微軟小冰與馬來西亞歌手朱主愛一起發(fā)布了合唱版《好想你》的單曲以及MV,據(jù)說這是歷史上第一支由人類歌手與人工智能合唱的歌曲(圖1)。當(dāng)然小冰不僅會唱歌,而且之前還寫過很多讓人類詫異的詩詞絕句。那么小冰為什么如此聰明?就讓我們來揭密它的聰明勁來自哪。
小冰是誰 認(rèn)識微軟人工智能機(jī)器人
看到小冰如此聰明,可能很多朋友還不知道“她”是誰。其實(shí)小冰是微軟(亞洲)互聯(lián)網(wǎng)工程院早在三年前就開發(fā)出來的一款智能機(jī)器人,也是微軟內(nèi)部第一個人工智能機(jī)器人。因?yàn)槭侵悄軝C(jī)器人,小冰可不是只會唱歌,它還會主持節(jié)目、撰寫詩歌、智能聊天等,人類大部分工作,小冰幾乎都會做,甚至在很多方面表現(xiàn)比普通人要好得多(圖2)。
為啥這么聰明 小冰高智商背后的功臣
如上所述,小冰現(xiàn)在就擁有很多技能。那么這些技能小冰是怎么獲取?我們以小冰唱歌技能為例,看看它是怎樣能聽會唱的。
歌手的聲音由基音及不同共鳴腔/體產(chǎn)生的泛音組成。在科技如此發(fā)達(dá)的今天,聲音的這些信息都可以數(shù)字化,因此歌手的聲音就可以很輕松地被電腦識別,通過電腦來唱人類的歌曲并不是一件難事。比如早在2007年,日本就推出了一個名為“初音未來”的電腦虛擬歌手,通過對歌手音源數(shù)據(jù)進(jìn)行采樣并合成,“初音未來”可以唱出非常動聽的音樂(圖3)。
不過“初音未來”和小冰的唱歌水平卻不可同日而語,前者只是簡單的電腦合成,它無法完美展現(xiàn)人類歌手的一些自然特性,比如真人的那些“雜音”、“邊緣音”(比如卡痰、換氣等),因此歌唱的效果比較生硬。小冰的歌唱功能則和人類十分相像,不僅能夠完美演繹歌曲的各種感情,它甚至還有創(chuàng)作歌曲的能力,這些是“初音未來”無法具備的人工智能技巧。那么小冰這些技能是怎么獲取的呢?
人工智能的一大特色就是基于大量樣本的機(jī)器自主學(xué)習(xí)。為了能夠讓小冰有高招的唱歌技能,微軟先收集各種歌手的歌曲制作成龐大的數(shù)據(jù)庫,然后建立各種訓(xùn)練模型。在實(shí)際訓(xùn)練中,小冰使用的算法技術(shù)在某些程度上借鑒了我們對大腦的了解,使用時下流行的神經(jīng)網(wǎng)絡(luò)技術(shù)。這樣經(jīng)過大量樣本數(shù)據(jù)庫的訓(xùn)練后小冰就可以熟悉流行的各種唱法,并且通過自主學(xué)習(xí)小冰在多曲風(fēng)演唱和情感演繹兩方面有了很大的進(jìn)步。
不過小冰畢竟還只是機(jī)器,它和正常歌手相比,對人類感情的學(xué)習(xí)和理解還是不夠,因此這次微軟聘請了朱主愛作為產(chǎn)品經(jīng)理來對小冰進(jìn)行調(diào)教。通過朱主愛在歌手方面的經(jīng)驗(yàn),微軟技術(shù)人員結(jié)合原來的情感計(jì)算框架對小冰唱歌的模型進(jìn)行了進(jìn)一步的優(yōu)化,借助人工智能強(qiáng)大的學(xué)習(xí)能力,在短短幾個月小冰的演唱水平就有了很大的提高?,F(xiàn)在小冰的歌聲不僅與人聲非常接近,而且唱法也更加的擬人化,能在歌曲中加入不同的唱法,與人類歌手配合。比如《好想你》中間的“好想好想你”這一句,原唱是非??谡Z化的一種獨(dú)特唱法,原來僅憑機(jī)器自主發(fā)聲是很難做到,但是現(xiàn)在小冰卻可以進(jìn)行完美演繹(圖4)。
作為人工智能的代表,小冰不僅僅是會唱。基于人工智能強(qiáng)大的自主學(xué)習(xí)能力,未來小冰還會創(chuàng)作歌曲,并且會根據(jù)實(shí)際歌詞加入各種感情化的演唱。在未來我們可能根本分辨不出來到底是機(jī)器在唱歌,還是人類在唱歌。至于小冰其他的作詩、預(yù)測、寫文章、智能聊天等技能,獲取的方法大同小異,主要都是通過大數(shù)據(jù)+深度學(xué)習(xí)+各種算法模型獲得的。
當(dāng)然人工智能技術(shù)已經(jīng)成為時下熱門,除了微軟以外各大IT巨頭也紛紛推出自己的產(chǎn)品,比如前段時間戰(zhàn)勝人類圍棋高手的那“只”阿爾法狗、亞馬遜物流倉庫里的機(jī)器人,其實(shí)這些都是和小冰類似的人工智能機(jī)器人(圖5)。
更多應(yīng)用 人工智能不僅是唱歌和作詩
這次小冰和朱主愛完美演唱讓我們看到人工智能強(qiáng)大的自主學(xué)習(xí)和創(chuàng)造能力,當(dāng)然人工智能并不是僅僅用來唱歌、作詩?,F(xiàn)在人工智能已經(jīng)應(yīng)用在我們生活的方方面面,如日本版小冰在日本為境內(nèi)第二大連鎖店LAWSON提供對話式人工智能托管。在中國,小冰還為廣大內(nèi)容提供商提供微信、微博公眾號托管服務(wù)。使用微信的用戶只要搜索小冰微信公眾號,關(guān)注即可在手機(jī)上體驗(yàn)小冰的魅力(圖6)。
當(dāng)然作為普通人,我們在生活中也可以處處感受到人工智能服務(wù),iPhone用戶可以利用Siri讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘、實(shí)時翻譯等,平時大家出門使用的導(dǎo)航服務(wù),導(dǎo)航軟件會為我們規(guī)劃最優(yōu)的線路等,這些服務(wù)的背后其實(shí)都是人工智能的功勞。