撰文/朱輝杰
商湯科技CEO徐立:超越人類是人工智能廣泛應(yīng)用的開(kāi)端
撰文/朱輝杰
2016年11月18日,備受矚目的第三屆世界互聯(lián)網(wǎng)大會(huì)在浙江省烏鎮(zhèn)舉行。作為中國(guó)與世界互聯(lián)互通的國(guó)際平臺(tái),本屆大會(huì)的主題是“創(chuàng)新驅(qū)動(dòng) 造福人類——攜手共建網(wǎng)絡(luò)空間命運(yùn)共同體”,物聯(lián)網(wǎng)和人工智能成為了本屆大會(huì)的亮點(diǎn)。作為專注于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)原創(chuàng)技術(shù)的創(chuàng)新企業(yè),商湯科技CEO徐立發(fā)表了以“互聯(lián)網(wǎng)上的機(jī)器視覺(jué)”為主題的演講。
徐立認(rèn)為,判斷人工智能能否大規(guī)模商用的關(guān)鍵在于針對(duì)同樣一件事情,它能否比人類做得更好。只有達(dá)到超越人類的標(biāo)準(zhǔn),才是人工智能實(shí)現(xiàn)廣泛應(yīng)用的基礎(chǔ),而隨之引發(fā)的,不僅是生產(chǎn)效率的大幅度提升,更將催生新的行業(yè)和新的應(yīng)用。
商湯科技CEO徐立
從早期的ImageNet視覺(jué)識(shí)別挑戰(zhàn)賽,到如今的AlphaGo,人工智能系統(tǒng)紛紛在各個(gè)特定領(lǐng)域中擊敗人類,在很多人看來(lái),這都象征著人工智能的重大突破。但是談及人工智能實(shí)現(xiàn)大規(guī)模商業(yè)應(yīng)用的標(biāo)準(zhǔn),很多人認(rèn)為需要達(dá)到100%不出錯(cuò)。
徐立表示:“判斷它能不能大規(guī)模使用的唯一準(zhǔn)則,就是如果這件事情換成人,是不是能做得更好。如果機(jī)器的錯(cuò)誤率遠(yuǎn)低于人,那么就是可以接受的?!睋Q句話說(shuō),人工智能只要在特定垂直領(lǐng)域中超越人的標(biāo)準(zhǔn),就有廣泛的應(yīng)用意義。當(dāng)前大部分人工智能應(yīng)用,更準(zhǔn)確來(lái)說(shuō)其實(shí)叫機(jī)器智能,因?yàn)檫@些功能的目的不是仿人,而是通過(guò)深度學(xué)習(xí),不斷積累數(shù)據(jù),在特定垂直領(lǐng)域中超越人類,機(jī)器視覺(jué)即其中之一。
目前,商湯科技的機(jī)器視覺(jué)技術(shù)已經(jīng)廣泛應(yīng)用在智能手機(jī)、互聯(lián)網(wǎng)、金融、商業(yè)和安防等領(lǐng)域。生活中的例子比比皆是。例如,很多人拍照時(shí)都會(huì)遇到模糊的情況,現(xiàn)在通過(guò)算法即可對(duì)其進(jìn)行還原,或者直接辨認(rèn)出人眼無(wú)法捕捉的模糊圖像中的內(nèi)容。再如,在光線不足的場(chǎng)景拍照時(shí),可以通過(guò)手機(jī)的暗光增強(qiáng)來(lái)將場(chǎng)景中肉眼看不到的細(xì)節(jié)體現(xiàn)出來(lái),包括霧霾天的去霧處理,可以幫助人們排除霧霾對(duì)視覺(jué)的干擾。
除此之外,機(jī)器視覺(jué)還包括感知和理解。通過(guò)感知,可以賦予機(jī)器深度視覺(jué)的能力,感知三維場(chǎng)景中的位置。正如現(xiàn)在一些可以媲美單反的大景深效果的雙攝像頭手機(jī)一樣,其背后也運(yùn)用了商湯科技的機(jī)器視覺(jué)技術(shù)。
這些大家最為熟悉的應(yīng)用中,無(wú)一例外都是通過(guò)機(jī)器智能獲得人類所無(wú)法獲取的圖像內(nèi)容,甚至做得更好。正是在這些特定領(lǐng)域中,機(jī)器智能超越了人類,使得這些功能具有實(shí)際意義,為我們提供更好的幫助。
人工智能或機(jī)器智能的廣泛應(yīng)用,將會(huì)掀起兩波浪潮,其一便是在強(qiáng)勞動(dòng)力的行業(yè)中,機(jī)器大規(guī)模替代人力。這在中國(guó)勞動(dòng)力成本不斷上升的環(huán)境下,可以為企業(yè)節(jié)省人力成本,從而創(chuàng)造更多的利潤(rùn),帶來(lái)更多的商業(yè)價(jià)值。
金融和商業(yè)領(lǐng)域中的不少企業(yè)利用商湯科技的人臉技術(shù),實(shí)現(xiàn)快速的真人和身份證信息匹配,無(wú)需額外人力,即可進(jìn)行實(shí)名認(rèn)證和遠(yuǎn)程開(kāi)戶等業(yè)務(wù)。而在這一場(chǎng)景中,還必須防止他人通過(guò)照片或3D模型來(lái)進(jìn)行仿冒認(rèn)證?;谏虦萍紮C(jī)器視覺(jué)技術(shù)的活體檢測(cè)服務(wù),可以防止高精度的模擬手段,最大限度地確保線上認(rèn)證的安全性。甚至通過(guò)足夠多的數(shù)據(jù)訓(xùn)練,還能夠有效防止實(shí)時(shí)變臉等高級(jí)攻擊手段。
安防和智慧城市領(lǐng)域更是如此,借助商湯科技的機(jī)器視覺(jué)技術(shù),可以對(duì)人力根本無(wú)法看完的海量監(jiān)控視頻進(jìn)行快速梳理和分析,包括道路上的車輛識(shí)別,公共場(chǎng)所中可能出現(xiàn)的人流堆積問(wèn)題,以及小區(qū)街道上的打架斗毆情況。通過(guò)實(shí)時(shí)識(shí)別,及時(shí)做出預(yù)警,使人們更快地做出決策。
人工智能所掀起的另一大浪潮,便是新興行業(yè)或新型應(yīng)用。例如,眾多直播和短視平臺(tái)借助商湯技術(shù),可以提供包括變臉、實(shí)時(shí)美顏和動(dòng)態(tài)貼紙等增強(qiáng)現(xiàn)實(shí)效果,為主播帶來(lái)了個(gè)性化的直播體驗(yàn),可謂是開(kāi)創(chuàng)了娛樂(lè)互聯(lián)網(wǎng)行業(yè)的全新潮流。
除了對(duì)人臉的美化外,人工智能還可以開(kāi)創(chuàng)藝術(shù)創(chuàng)作的新方式。例如,通過(guò)商湯科技的機(jī)器視覺(jué)技術(shù),可以教會(huì)機(jī)器從一副畫作中將作者的藝術(shù)風(fēng)格提取出來(lái),形成獨(dú)有的畫風(fēng),并以此來(lái)對(duì)另一幅畫作進(jìn)行二次創(chuàng)作。因此,用戶可以將相冊(cè)中的照片,以油畫和水彩畫等方式重新生成,帶來(lái)不一樣的視覺(jué)感受。
從萬(wàn)物互聯(lián)到萬(wàn)物智聯(lián)的發(fā)展過(guò)程中,深度學(xué)習(xí)所引發(fā)的現(xiàn)代人工智能革命將發(fā)揮關(guān)鍵作用。在當(dāng)前人工智能的浪潮中,機(jī)器視覺(jué)被認(rèn)為是下一個(gè)前沿。作為在這一領(lǐng)域擁有核心技術(shù)的創(chuàng)新型企業(yè),商湯科技正在為互聯(lián)網(wǎng)、金融、安防、手機(jī)和機(jī)器人等各行業(yè)提供智能的核心,把人工智能廣泛地應(yīng)用在各行各業(yè)當(dāng)中,引發(fā)行業(yè)變革。