劉虹伶
近日,搜狗公司與新華社新媒體中心聯(lián)合發(fā)布站立式AI合成主播,新的AI合成主播將從過去的“坐著播新聞”升級成結(jié)合肢體動作的“站立式播報”,這是全球首個AI合成主播。
全球首個AI主播驚艷落地
在2018年的互聯(lián)網(wǎng)大會開幕當(dāng)天,全球首個“AI合成主播”第一次亮相于眾人眼前。據(jù)了解,它由搜狗和新華社新媒體中心共同打造,以新華社主持人邱浩為原型,實現(xiàn)高效的新聞播報。
AI主播不僅僅是新華社將AI技術(shù)引入新聞報道中的一次嘗試,也是“搜狗分身”技術(shù)在新聞行業(yè)的一次實踐。
搜狗CEO王小川表示,搜狗分身打造了AI合成主播,它利用搜狗的AI能力,從人類的聲音語言習(xí)慣、表情及嘴唇動作等層面對AI進行擬人化訓(xùn)練,然后“克隆”出人類的分身,進而幫助人類提高信息表達和傳遞的效率。
說得通俗易懂一些,真人主播小吳面對鏡頭錄制一段播報新聞的視頻,搜狗分身通過這段視頻可以將小吳的聲音、嘴唇動作和表情這些特征進行提取,再通過語音、嘴唇動作、表情三者合成,加之深度學(xué)習(xí)等技術(shù),“克隆”出于主播小吳幾乎一模一樣具備新聞播報能力的AI分身。
舉例來說,主播小吳每天工作10個小時,一周工作七天,這樣下來他每周工作時間是70小時。然而,只要有足夠多的服務(wù)器,AI合成主播呈現(xiàn)無數(shù)個AI分身,就可以有N個主播小吳的AI分身在一天24小時不間斷地工作。
相較于傳統(tǒng)視頻新聞需要漫長錄制過程而言,AI主播只需要人工將文本輸入就可以在短時間內(nèi)生成新聞播報視頻,并且無形中減少了主播播報新聞過程中的“失誤率”。由此可見,AI主播的誕生和落地大大地節(jié)省了人力成本,同時也提升了傳媒行業(yè)的效率。
據(jù)了解,AI主播從互聯(lián)網(wǎng)大會落地開始就已經(jīng)正式上崗,成為了新華社報道隊伍中的一員。上崗至今的這三個月以來,首批入職的一中一英兩位AI主播,已經(jīng)生產(chǎn)3400余條新聞報道,累計時長達10000多分鐘,其間還參與了第五屆世界互聯(lián)網(wǎng)大會、首屆進博會、2019春運、春節(jié)等若干重要報道。
全球首個“AI合成主播”無疑是中國人工智能與傳媒業(yè)大膽融合并付諸規(guī)模化應(yīng)用的典型案例。
搜狗AI主播再次升級
如果說AI合成主播的落地給新聞主播們帶來了“失業(yè)危機”的壓力,那么主播們壓力又升級了。
因為,搜狗再次升級,帶來了全球首個站立式AI合成主播。對,這個AI主播除了能夠播報新聞之外,還擁有了肢體語言能力。
據(jù)了解,搜狗此次升級除了讓AI主播肢體語言豐富起來之外,聲音更具有真實情感和表現(xiàn)力,在圖像生成方面也實現(xiàn)了更加逼真的表情生成、自然的肢體動作以及嘴唇動作預(yù)測等能力。簡單來說,AI主播可以站起來用更生動的方式播報新聞了。
AI主播的此次升級,不僅僅是提升了AI主播的表現(xiàn)力,同時也保持了搜狗在這一領(lǐng)域的全球領(lǐng)先。
除了可以站著播新聞,這位工作了三個月的AI主播還有了自己的名字——“新小浩”。而近日搜狗給新小浩帶來了一位新同事,一個叫“新小萌”的全球首個AI女主播?!靶滦∶取钡穆涞卣故玖恕八压贩稚怼奔夹g(shù)的通用能力,這項技術(shù)可以持續(xù)“克隆”不同類型、不同特點的AI主播的“分身”。
據(jù)搜狗方面透露,最新推出的站立式AI合成主播將參與2019年全國兩會的報道,并將在搜狗搜索、輸入法等資訊平臺上與用戶見面。
隨著搜狗與新華社達成的長期合作,更多的AI主播將不斷涌現(xiàn)。由此也可以預(yù)見,AI主播正在成為AI時代信息資訊傳播鏈條最重要的一環(huán)。
搜狗分身技術(shù)“克隆”人類
以“搜狗分身”技術(shù)為核心的AI主播交出的亮眼成績單,我們可以看出以輸入法、瀏覽器、搜索引擎起家的搜狗正在圍繞人工智能展開更多觸角。
搜狗分身是搜狗在多模態(tài)合成技術(shù)上的一次探索,它是人工智能在模仿人類領(lǐng)域的一次新進展。與此同時,搜狗的AI商業(yè)化落地也在同步推進。
新華社的AI主播是搜狗分身技術(shù)的第一個落地場景,它除了在新聞播報領(lǐng)域的應(yīng)用外,其實還有更廣泛的應(yīng)用空間可以探索。
例如在線教育場景,利用搜狗分身做音視頻的合成,在提升教育行業(yè)效率的同時,也可以增強與用戶的互動性。
又比如虛擬助理,相較于目前應(yīng)用最多的語音助手,帶有形象的虛擬助理親民度更高,在交互中也更加貼近人類的期待,這在未來也會是一個巨大的場景。
據(jù)搜狗CEO王小川介紹,“搜狗分身”技術(shù)未來還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個領(lǐng)域。而搜狗也將在今年推出更加大眾化的消費級智能硬件,目的為“爭奪用戶入口”。
搜狗AI商業(yè)化加速
從對AI主播的產(chǎn)品定位不難看出,對于人工智能技術(shù)的應(yīng)用探索,搜狗還是致力于讓機器成為輔助表達與信息獲取的分身以及助理,這同時也是搜狗給技術(shù)落地提出的戰(zhàn)略目標。
除了搜狗分身外,搜狗也在圍繞語言與交互搶占行業(yè)賽道。
在搜狗搜索中,搜狗可以做到輸入中文一鍵連接全球網(wǎng)頁。
在C端場景,將AI引入搜狗輸入法,推出AI制音坊,為自然交互的愿景代言。在智能硬件領(lǐng)域,發(fā)布拳頭產(chǎn)品翻譯寶Pro,圍繞新聞媒體推出搜狗翻譯筆,助力中英文的無縫轉(zhuǎn)換。
在B端場景,搜狗推出機器同聲傳譯、智能分診,落地手機語音助手等搶占行業(yè)賽道。
以上種種舉措,皆在傳遞著搜狗正在全方位釋放人工智能技術(shù)的實力,在讓溝通與表達變得更加簡單和高效的理念指引下,切實為廣大用戶提供更加貼近生活并貼近人性的產(chǎn)品。
同時也可以明顯感受到,搜狗的AI商業(yè)化也在加速。
根據(jù)公開數(shù)據(jù),2018年搜狗輸入法日均語音功能調(diào)用量已經(jīng)達到了5.34億次,這樣的數(shù)據(jù)一方面凸顯了搜狗輸入法的頭部地位,另一方面也彰顯了人工智能技術(shù)在搜狗的各條產(chǎn)品線存在著更加廣闊的應(yīng)用場景與發(fā)展?jié)摿Α?/p>
搜狗由文字輸入作為基礎(chǔ),不斷地在語音、搜索、翻譯等相關(guān)領(lǐng)域取得進展和突破,這些探索與嘗試為搜狗在人工智能時代布局積累了大量且豐富的應(yīng)用場景。
不可否認的是,兼具應(yīng)用場景與技術(shù)實力將為搜狗發(fā)力人工智能提供原動力,我們有理由相信在未來搜狗將帶給我們比AI合成主播更大的驚艷。
鋅刻度記者觀點:搜狗的AI商業(yè)化,未來可期
搜狗分身技術(shù)的推出代表著搜狗在多模態(tài)交互、語音合成、唇語合成等前沿技術(shù)上的進一步探索。而另一方面搜狗開始推動這項技術(shù)進入行業(yè),此次是與新華社一起推出AI主播,未來還會進入更多行業(yè),以及探索更多的商業(yè)落地。
除了要夯實基礎(chǔ)技術(shù)的積累沉淀,還要深化AI落地,一向低調(diào)的搜狗正全面加速AI的商業(yè)化進程。