倘若語(yǔ)言不再是人類交流的壁壘,會(huì)發(fā)生什么?
長(zhǎng)久以來(lái),人類都有一個(gè)共同夙愿:發(fā)明一個(gè)機(jī)器,實(shí)現(xiàn)全人類之間毫無(wú)障礙的自由交談。而毫無(wú)疑問(wèn),自由交談在一個(gè)宣稱自由連接的互聯(lián)網(wǎng)時(shí)代更能彰顯它的價(jià)值——畢竟,同是地球人,同住地球村,當(dāng)你我覓得彼此,卻聽(tīng)不懂彼此語(yǔ)言,實(shí)在有些尷尬。
事實(shí)上,與那些讓生活變得復(fù)雜的“智能產(chǎn)品”不同,實(shí)時(shí)語(yǔ)音翻譯是那種讓人在直覺(jué)上認(rèn)為理應(yīng)擁有的技術(shù),正因如此,它也一直存在于《星際迷航》、《神秘博士》以及《銀河系漫游指南》等科幻作品中。好消息是,人類似乎離這個(gè)夙愿越來(lái)越近了。
不久前,微軟旗下的Skype宣布,具備實(shí)時(shí)語(yǔ)音翻譯技術(shù)的Skype Translator中文預(yù)覽版正式在中國(guó)市場(chǎng)推出。其實(shí)不同母語(yǔ)間的人直接對(duì)話,讓機(jī)器實(shí)時(shí)翻譯,這些技術(shù)微軟早在去年就已與公眾見(jiàn)面,只是那時(shí)還不支持中文——你知道,哪怕是對(duì)于機(jī)器,有大約一萬(wàn)個(gè)常用漢字以及各種語(yǔ)音語(yǔ)調(diào)的中文也頗具挑戰(zhàn)性。但如今,包括微軟和谷歌在內(nèi)的科技巨頭的發(fā)力,使得地球上使用人數(shù)最多的語(yǔ)言和使用最廣泛的語(yǔ)言能直接展開(kāi)對(duì)話。
那么問(wèn)題來(lái)了,作為不同文化之間的擺渡者,倘若實(shí)時(shí)翻譯真能實(shí)現(xiàn)人類的自由交談,這一切意味著什么?
作為一項(xiàng)長(zhǎng)久愿望,在此前數(shù)十年時(shí)間,實(shí)時(shí)語(yǔ)音翻譯的發(fā)展一直受到錯(cuò)誤率高、麥克風(fēng)敏感度差異、噪音環(huán)境等因素阻礙。但近些年來(lái),由于大數(shù)據(jù)的涌現(xiàn),這項(xiàng)技術(shù)取得了不錯(cuò)的進(jìn)展。而Skype Translator更是凝聚了微軟在語(yǔ)音識(shí)別、自動(dòng)翻譯和機(jī)器學(xué)習(xí)等多領(lǐng)域的成果。
簡(jiǎn)單地說(shuō),Skype Translator的翻譯邏輯主要分為三步:將你的實(shí)時(shí)語(yǔ)音轉(zhuǎn)成文字;將文字翻譯成另一種語(yǔ)言的文字;將文字轉(zhuǎn)成語(yǔ)音。其中,識(shí)別實(shí)時(shí)語(yǔ)音并轉(zhuǎn)成文字是最棘手的部分。
如你所知,精確的實(shí)時(shí)語(yǔ)音翻譯有賴于強(qiáng)大的機(jī)器學(xué)習(xí)——也就是軟件學(xué)習(xí)訓(xùn)練數(shù)據(jù)的能力。這些訓(xùn)練數(shù)據(jù)包括翻譯的網(wǎng)頁(yè),配有字幕的視頻,以及預(yù)先翻譯且轉(zhuǎn)錄成文字的一對(duì)一談話。事實(shí)上,已有不少人分享了他們過(guò)去的對(duì)話記錄。Skype Translator通過(guò)記錄對(duì)話來(lái)分析文本并訓(xùn)練系統(tǒng)更好地“學(xué)習(xí)”語(yǔ)言——當(dāng)準(zhǔn)備好的數(shù)據(jù)錄入系統(tǒng)后,機(jī)器學(xué)習(xí)軟件會(huì)在這些對(duì)話和環(huán)境涉及到的單詞中搭建一個(gè)統(tǒng)計(jì)模型,當(dāng)你說(shuō)話時(shí),軟件會(huì)在統(tǒng)計(jì)模型中尋找相似內(nèi)容,然后應(yīng)用到預(yù)先“學(xué)到”的轉(zhuǎn)化程序中,得以讓語(yǔ)音轉(zhuǎn)換為文本,再?gòu)奈谋巨D(zhuǎn)換成另一種語(yǔ)言。
值得一提的是,與程序設(shè)定一般的朗誦不同,人會(huì)一邊思考一邊說(shuō)話,會(huì)犯錯(cuò),這種犯錯(cuò)在口語(yǔ)表達(dá)中的體現(xiàn)就是打磕巴、停頓、重復(fù)或者頻頻出現(xiàn)如“嗯”“啊”“呃”之類的語(yǔ)氣助詞,而Skype Translator的機(jī)器翻譯模型則會(huì)處理這些停頓。在預(yù)覽版中,用戶可以看到部分語(yǔ)氣詞停頓被移除,未被移除的部分則可能通過(guò)用戶反饋進(jìn)行再優(yōu)化。
不過(guò),作為一項(xiàng)不斷優(yōu)化的技術(shù),無(wú)論是微軟的Skype Translator還是“老對(duì)手”谷歌的Google Translate,至少在現(xiàn)階段,實(shí)時(shí)語(yǔ)音翻譯技術(shù)應(yīng)該還談不上完美,系統(tǒng)對(duì)語(yǔ)音的識(shí)別準(zhǔn)確率也有待完善——你知道,語(yǔ)言如一只野獸,時(shí)刻都在變化,哪怕同一國(guó)家,因地域不同也有不同口音與俚語(yǔ)文化。有人就非常期待機(jī)器實(shí)時(shí)翻譯以下對(duì)話:
“約嗎?我在火車站等你。”
“我去!太遠(yuǎn)了!我不去!”
這些問(wèn)題可以通過(guò)更大范圍的數(shù)據(jù)解決嗎?也許能,但還需要時(shí)間。無(wú)論怎樣,就像一位評(píng)測(cè)者所言:“(如今實(shí)時(shí)語(yǔ)音翻譯)整個(gè)體驗(yàn)就像是兩名電話銷售員在使用對(duì)講機(jī),不過(guò)在使用過(guò)程中,這樣的抱怨將會(huì)被‘奇跡帶來(lái)的震驚所取代。”
當(dāng)然了,在時(shí)間線君看來(lái),這樣的“震驚”或許可以更近一步。實(shí)時(shí)語(yǔ)音翻譯的聲音在現(xiàn)階段還略顯冰冷,沒(méi)什么生命感可言,那么在未來(lái)語(yǔ)音翻譯是否能像某款地圖一樣讓志玲姐姐曼妙的聲音為你服務(wù)?或者可以下載電影《Her》里斯嘉麗·約翰遜那般令人沉醉的聲線?
在微軟亞洲研究院,微軟研究院戰(zhàn)略總監(jiān)及技術(shù)顧問(wèn)Vikram Dendi向《時(shí)間線》記者解釋道:“Skype Translator和導(dǎo)航應(yīng)用不太相同,后者詞匯量很有限,語(yǔ)句有許多重復(fù)。而且,關(guān)于使用其他人的聲音也可能引起一些社會(huì)討論,譬如我能不能用斯嘉麗的聲音來(lái)嘲笑別人?當(dāng)然,在這個(gè)領(lǐng)域我們還有許多工作可以做,也有能力做好,我們需要對(duì)系統(tǒng)進(jìn)行訓(xùn)練來(lái)讓它像一個(gè)人的聲音。不過(guò)我們最初研發(fā)Skype Translator的目標(biāo)是不讓它占用用戶太多時(shí)間,我們希望用戶只要運(yùn)行程序,點(diǎn)擊一下對(duì)話者,就可以開(kāi)始說(shuō)話了。這個(gè)技術(shù)已經(jīng)很復(fù)雜了,現(xiàn)在系統(tǒng)就有一點(diǎn)延遲,因?yàn)樾枰葯C(jī)器翻譯,所以目前我們不想再給它加一層復(fù)雜度了?!?/p>
在《圣經(jīng)·創(chuàng)世紀(jì)》中記載,曾有一個(gè)時(shí)代,人類擁有共同的語(yǔ)言,于是有人想在巴比倫造一座通天塔——巴別塔,以便直接跟上帝對(duì)話。
為了懲罰人類的傲慢與虛榮,上帝讓這些人說(shuō)不同的語(yǔ)言,導(dǎo)致人們無(wú)法溝通,雞同鴨講,人類計(jì)劃失敗,自此各散東西。
那么技術(shù)能解除“巴別塔魔咒”嗎?倘若語(yǔ)言不再是人類交流的壁壘,會(huì)發(fā)生什么?
讓我們先來(lái)談?wù)務(wù)Z言的意義。在全球7000多種語(yǔ)言中(盡管有不少“小語(yǔ)種”已日漸枯萎),除了詞匯和語(yǔ)法的表層差異,不同的語(yǔ)言是否能使人類產(chǎn)生不同的思維方式——譬如對(duì)時(shí)間與空間概念的認(rèn)知,或者對(duì)因果關(guān)系的認(rèn)知,幾千年來(lái)就一直是學(xué)者們爭(zhēng)論的主題。神圣羅馬帝國(guó)的查理曼大帝就曾在科技還不甚昌明的時(shí)代宣稱:“掌握第二種語(yǔ)言就是擁有第二個(gè)靈魂?!?/p>
當(dāng)然,從科學(xué)的角度,斯坦福大學(xué)教授Lera Boroditsky也曾頗具詩(shī)意地表達(dá)過(guò)語(yǔ)言的意義:“每種語(yǔ)言都包含著一種獨(dú)特的世界觀,反映了使用者數(shù)千年來(lái)的思想、傾向和認(rèn)知方式。一種語(yǔ)言就像一個(gè)完整的宇宙,人類有7000多個(gè)平行宇宙,有的彼此相似,有的大相徑庭。這種巨大的多樣性是人類頭腦靈活性和精致性創(chuàng)造出的奇跡。我相信,對(duì)人類認(rèn)知世界的認(rèn)識(shí)越深刻,就越能更好地理解人類的本質(zhì)。”
假如互聯(lián)網(wǎng)發(fā)展的底層邏輯是將全人類更好地連接在一起,形成一個(gè)巨大村落,那么語(yǔ)言也許就是最后一個(gè)技術(shù)障礙。在此之前,圖片作為全世界的通用語(yǔ)言,在社交應(yīng)用上發(fā)揮了巨大作用——無(wú)論在哪個(gè)國(guó)家,笑容就是笑容,哭泣就是哭泣。當(dāng)然,表情符號(hào)也發(fā)揮了類似作用——你知道嗎,真的有人曾用表情符號(hào)聊了45分鐘。
所以,可以肯定的是,當(dāng)人類連接在一起,打破語(yǔ)言的壁壘,更好地理解彼此,勢(shì)必將開(kāi)啟“地球村”的新篇章。
好吧,最后,還是善意地提醒一下那些外語(yǔ)不太好的同學(xué)吧。在可以想見(jiàn)的未來(lái),語(yǔ)音翻譯的技術(shù)一定會(huì)闊步向前,但這并不意味著從現(xiàn)在開(kāi)始就徹底不用學(xué)外語(yǔ)啦。“我認(rèn)為這項(xiàng)技術(shù)不會(huì)取代學(xué)習(xí)一門語(yǔ)言的價(jià)值?!盫ikram Dendi告訴時(shí)間線君,“如果我是個(gè)年輕人,喜歡上一個(gè)中國(guó)姑娘,我可不敢想象自己一輩子靠翻譯技術(shù)來(lái)和她交流?!?/p>
嗯,無(wú)力反駁。