常莽
說起近年來手機(jī)上出現(xiàn)的新玩意兒,AI芯片可能是其中最耀眼的明星。無論是安卓陣營(yíng)還是iOS陣營(yíng),旗艦級(jí)別手機(jī)所使用的SoC中,AI算力總能成為著力吆喝的賣點(diǎn)。例如最近華為發(fā)布麒麟990芯片,其AI模塊的算力相比前代大幅提升數(shù)倍,甚至登頂安卓陣營(yíng)AI Benchmark榜單;而在最新發(fā)布的iPhone 11當(dāng)中,所使用的A13 Bionic仿生芯片也表現(xiàn)不俗,性能提升20 %,每秒可執(zhí)行1萬億次運(yùn)算??梢哉f,AI芯片目前已經(jīng)進(jìn)入到了“軍備競(jìng)賽”階段。
然而,和性能提升可以直觀感受到的CPU、GPU模塊不同,SoC當(dāng)中的AI性能攀升,其實(shí)際應(yīng)用場(chǎng)景一直令很多朋友感到迷?!狝I這么強(qiáng),日常使用的APP似乎也沒太大變化,游戲該怎么玩還是怎么玩。但AI芯片是否真的雞肋?這也未必。
軟件應(yīng)用往往滯后于硬件發(fā)展。觸摸屏并非是什么新鮮事物,但直到iOS橫空出世才讓人找到正確的交互方式;NFC早在安卓2.X時(shí)代就已經(jīng)實(shí)裝,但直到近年才迎來各種支付應(yīng)用的廣泛支持。
AI芯片目前的應(yīng)用范圍并不廣,大家可以感受到的,可能就是相機(jī)中場(chǎng)景的AI識(shí)別、人臉認(rèn)證等。那么隨著AI芯片算力的提升、軟件應(yīng)用的完善,未來的APP到底能進(jìn)化到怎樣的神奇地步?
為何手機(jī)需要AI芯片
作為近年最熱門的話題之一,AI這一字眼頻頻出現(xiàn)在各類科技資訊當(dāng)中。而谷歌開發(fā)的圍棋AI Alpha Go一舉擊敗李世石、柯潔,更是令A(yù)I走進(jìn)了聚光燈下。和傳統(tǒng)的算法相比,AI能夠讓計(jì)算機(jī)的某些舉止更接近人類,例如能夠識(shí)別圖像內(nèi)容和識(shí)別句法語義等,而這些,往往得益于使用神經(jīng)算法來進(jìn)行的機(jī)器學(xué)習(xí)。
移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來令數(shù)據(jù)規(guī)模前所未有的龐大,這為AI提供了茁壯成長(zhǎng)的土壤。這些數(shù)據(jù)成為了AI極其有價(jià)值的樣本,人們通過神經(jīng)算法對(duì)這些樣本進(jìn)行卷積分類,進(jìn)行一遍又一遍的機(jī)器學(xué)習(xí),輸出了不同權(quán)重的結(jié)果,并以此作為識(shí)別行為事物的判斷依據(jù)。從這方面來看,AI的本質(zhì)是數(shù)據(jù)密集、算法先進(jìn)和分類權(quán)重細(xì)致的統(tǒng)計(jì)學(xué),通過不斷輸入數(shù)據(jù)、不斷卷積衡量權(quán)重,AI最終做出的判斷會(huì)無比接近甚至超越人類。
由此可見,AI是依賴特定的神經(jīng)算法實(shí)現(xiàn)的,這個(gè)任務(wù)交給普通的CPU來做,效率比較低下———CPU屬于通用計(jì)算單元,暴力運(yùn)行某種算法并非其特長(zhǎng),例如CPU挖礦的效率就遠(yuǎn)比不上專門為HASH算法特制的ASIC礦機(jī)芯片。而AI芯片正是為密集處理數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法特制的,例如華為的麒麟990就可以支持包括VGG、VDSR等在內(nèi)的90 %視覺神經(jīng)網(wǎng)絡(luò)計(jì)算模型。
換言之,AI芯片能否發(fā)揮其功用,關(guān)鍵在于軟件應(yīng)用是否對(duì)相應(yīng)的神經(jīng)網(wǎng)絡(luò)算法有著良好的支持和運(yùn)用。隨著APP不斷進(jìn)化,AI會(huì)越來越多地應(yīng)用到實(shí)際中,出于算力和能效方面的考慮,AI芯片(模塊)的確必不可少。而當(dāng)AI芯片的性能日益強(qiáng)大時(shí),下面這些神奇的應(yīng)用可能會(huì)漸漸成為我們的日常應(yīng)用。
AI實(shí)時(shí)P視頻
在一些手機(jī)中,拍照APP可以通過AI來識(shí)別場(chǎng)景,然后成像風(fēng)格根據(jù)不同的場(chǎng)景變化,例如拍植物增加色彩的鮮艷度讓花朵綠葉更加?jì)善G欲滴,拍人像則增加柔光令皮膚更加白嫩等。而在未來,AI在圖像識(shí)別方面的應(yīng)用會(huì)更加廣泛,這在現(xiàn)在已經(jīng)可以看到一些苗頭。
AI既然可以辨認(rèn)出場(chǎng)景,自然也能辨認(rèn)出圖像中的事物。例如一張照片中,哪里是人臉,哪里是寵物,哪里是背景,AI都可以做到比較準(zhǔn)確的判斷。在這個(gè)前提下,AI實(shí)時(shí)“PS”視頻,也就成為了可能。
例如Google之前就展示了一項(xiàng)名為卷積神經(jīng)網(wǎng)絡(luò)(CNN)技術(shù),它是一種機(jī)器學(xué)習(xí)算法。該技術(shù)使用了數(shù)以萬計(jì)的圖像數(shù)據(jù)用以機(jī)器學(xué)習(xí),并且專門分辨頭發(fā)、頸部和皮膚等處的數(shù)據(jù),能夠輕而易舉地將人從背景中“摳”出來,背景自然也可以實(shí)時(shí)更換。從演示來看,Google的這項(xiàng)技術(shù)的確效果出眾,很輕松就能夠在雜亂的背景中辨認(rèn)人像,然后置換視頻中的背景,效果還非常自然。
而相關(guān)的應(yīng)用在國內(nèi)也開始出現(xiàn),而且可能很快就會(huì)和消費(fèi)者見面。華為在演示麒麟990的AI性能之時(shí),也呈現(xiàn)了令人驚訝的實(shí)時(shí)摳圖功能。在AI的作用下,視頻中的人物能夠隨時(shí)變更背景,非常神奇。
而AI算法顯然不僅能作用于背景,也可以作用于人像。前不久AI換臉APP“ZAO”的上線,引起了人們的熱烈討論。在ZAO應(yīng)用當(dāng)中,只要上傳一段視頻,即可通過AI算法將其中的人臉換成另一個(gè)人的,這種偽造身份的玩法令人感到驚愕。而在未來的AI應(yīng)用中,隨著算力的加強(qiáng),這一過程可能在手機(jī)中就能夠?qū)崟r(shí)完成,P一段子虛烏有的視頻,并非天方夜譚。
AI去碼(圖像修復(fù))
如果說AI實(shí)時(shí)P視頻只是將已有的元素重新組合,例如場(chǎng)景換成另一個(gè)場(chǎng)景或人臉換成另一張人臉等,而AI去碼,則可謂是憑空畫餅,將原本不存在的事物添加上去,這在很多場(chǎng)景下都有極大用途。
一般而言,去馬賽克是需要人類“腦補(bǔ)”的工作。從原理來看,馬賽克屬于不可逆運(yùn)算,把大量的小像素點(diǎn)合并到一個(gè)大的像素點(diǎn),并取平均色,就制造成了馬賽克。很顯然,是難以知道被攪勻之前的各個(gè)小像素的顏色是如何排布的。一般來說,要消除馬賽克,需要人進(jìn)行想象腦補(bǔ),然后把缺失的內(nèi)容重新畫出來。而有了AI,人不再是必須了,Google Brain的算法能夠自動(dòng)去除馬賽克。
Google Brain使用的是一種全新的像素遞歸超分辨率技術(shù),通過大量高、低分辨率的采樣學(xué)習(xí),然后得出規(guī)律來匹配修復(fù)結(jié)果。例如,Google Brain學(xué)習(xí)到了某種黑點(diǎn)是屬于眼睛,那么在還原馬賽克的時(shí)候,就可以把這種黑點(diǎn)還原成眼睛。從測(cè)試來看,效果的確不同凡響。
這樣的AI技術(shù)有什么用?去除馬賽克只是特定場(chǎng)合的具體應(yīng)用,類似的算法在很多時(shí)候都可以發(fā)揮作用,只要當(dāng)圖像需要修復(fù)的時(shí)候,就有用武之地。例如拍照片手抖了失焦了,糊成一片該咋辦?傳統(tǒng)的方法可能就是簡(jiǎn)單粗暴的銳化了,而如果拍照APP使用AI技術(shù),就可以“腦補(bǔ)”回丟失的細(xì)節(jié)和銳度,給你一張盡量可用的照片。
AI上色
既然AI能夠識(shí)別圖像內(nèi)容、“腦補(bǔ)”細(xì)節(jié),那么AI自動(dòng)上色也就成為了可能。上色其實(shí)涉及到了創(chuàng)作層面,而創(chuàng)作被很多人視為人類和機(jī)器的鴻溝,但這在AI時(shí)代不那么靈了。借助AI技術(shù),手機(jī)APP可以自動(dòng)為黑白照片甚至線稿畫作來涂上適合的顏色。
類似的技術(shù)現(xiàn)在已經(jīng)出現(xiàn)。照片處理自不必說,AI識(shí)別場(chǎng)景調(diào)節(jié)顏色和黑白照片上色并沒有本質(zhì)上的區(qū)別;而給線稿上色,在之前曾被認(rèn)為是不可思議的事情———電腦能夠讀懂線條勾勒的是何種輪廓、該輪廓還得填上適合的顏色,聽上去就如同魔法。不過Paintschainer推出的AI上色技術(shù)卻令人大吃一驚,它可以識(shí)別哪部分屬于皮膚,哪部分是頭發(fā),哪部分是衣服,哪部分是背景,然后分別涂上適當(dāng)?shù)念伾?/p>
不僅如此,Paintschainer的上色范圍還相當(dāng)精準(zhǔn),盡管線稿沒有封閉,但顏色依然會(huì)保留在適當(dāng)?shù)姆秶?,而不?huì)涂得滿地都是。這意味著,以后在手機(jī)中繪畫成為了可能。盡管手機(jī)的屏幕小且觸控并不算精確(相比數(shù)位板),但得益于AI已經(jīng)能辨識(shí)線稿,因此手指繪畫粗糙的筆跡,就可以被AI完補(bǔ)為精細(xì)的描線,并填上適合的顏色。對(duì)于創(chuàng)作者而言,大大節(jié)省了打磨具體畫技所需要的功夫,將更多精力留給設(shè)計(jì)、構(gòu)思,提高了效率。
這種AI輔佐創(chuàng)作的技術(shù),不僅能用于攝影、繪畫,在作曲等領(lǐng)域也同樣適用?;蛟S在不久后,對(duì)著手機(jī)哼一段旋律,AI會(huì)自動(dòng)幫你編好曲、選擇好演奏樂器,最后完成一段高質(zhì)量曲子的日子,也已經(jīng)并不遙遠(yuǎn)。
AI自動(dòng)翻譯
語義識(shí)別可謂是AI另一大廣泛實(shí)裝的應(yīng)用了。無論是語音識(shí)別,還是自動(dòng)翻譯,都離不開精準(zhǔn)的語義判斷。例如Google翻譯,已經(jīng)基本做到了語句通順流暢,用來閱讀一些專業(yè)性不強(qiáng)的外文,Google翻譯綽綽有余。這是如何做到的呢?
這主要得益于Google翻譯引入了神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等人工智能算法,邁入了神經(jīng)機(jī)器翻譯(GNMT)的時(shí)代。得益于人工智能和谷歌的大數(shù)據(jù),谷歌翻譯對(duì)語言的解析有了遠(yuǎn)比之前深入的理解,因此在長(zhǎng)句、整篇翻譯方面有了長(zhǎng)足的進(jìn)步。
在未來,AI翻譯還會(huì)愈加強(qiáng)悍,也不僅局限于靜態(tài)的文字。例如在Android 10當(dāng)中,引入了實(shí)時(shí)字幕(Live Caption)功能,借助機(jī)器學(xué)習(xí),它能夠讓手機(jī)在播放任何視頻的時(shí)候,精準(zhǔn)識(shí)別出音頻,并生成字幕。該技術(shù)顯然可以和AI翻譯結(jié)合,幫助人們啃下各地語言,大大減少交流的鴻溝。
另外,AI自動(dòng)翻譯還可以用于語音交流。隨著處理速度和精準(zhǔn)度的上升,手機(jī)安裝相應(yīng)的APP后,化身同聲傳譯器也并非不可能,雖然對(duì)于一些專業(yè)詞句、地域文化梗的翻譯,可能還比不上人工,但對(duì)比現(xiàn)在已有的機(jī)翻,這無疑要好上太多。
AI自動(dòng)對(duì)話
自從蘋果推出了Siri,語音助手成為了人們關(guān)注的焦點(diǎn)之一。然而在大多數(shù)情況下,語音助手們的表現(xiàn)并不盡如人意,無法理解自然語義、對(duì)話機(jī)械和無法針對(duì)上下文內(nèi)容應(yīng)答等缺點(diǎn),令語音助手如同“人工弱智”。而在AI的加持下,未來的語音助手們將會(huì)飛躍上新的臺(tái)階。
例如,Google Assistant就已經(jīng)走在了進(jìn)化的路上。在I/O開發(fā)者大會(huì)上,Google演示了AI技術(shù)加持的GoogleAssistant,它能夠和人類對(duì)答如流,能夠識(shí)別上下文內(nèi)容,話語也都非常符合邏輯,無論是內(nèi)容還是語調(diào)都異常接近真人。無論是識(shí)別、應(yīng)答還是任務(wù)的完成度,新的Google Assistant都遠(yuǎn)比之前的語音助手表現(xiàn)出色。
這樣的進(jìn)化,很大程度上得益于企業(yè)利用用戶數(shù)據(jù)訓(xùn)練語音、語言模型———蘋果、谷歌、微軟和Facebook等都被爆出干過這樣的事情。在未來,手機(jī)APP的語音交互或許會(huì)更加智能,但這種進(jìn)化的代價(jià)卻以用戶隱私作為代價(jià)。我們到底該如何平衡技術(shù)發(fā)展的需求和隱私信息的保護(hù)?這恐怕是值得一直深究的問題。
AI信息分類
智能分類在當(dāng)前很多相冊(cè)服務(wù)中都已經(jīng)初現(xiàn)雛形。例如在Google Photo中,照片可以根據(jù)題材、人物等自動(dòng)歸類為風(fēng)景照、建筑照、美食照以及與某個(gè)人的合照等,查找起來非常方便。而智能分類的出現(xiàn),很大程度上依賴于AI技術(shù)的發(fā)展,AI通過機(jī)器學(xué)習(xí),得以辨認(rèn)出照片場(chǎng)景、主體后,才讓智能分類成為可能。
而伴隨著AI的進(jìn)步,智能分類擁有了更多可能。目前智能分類主要涉及照片,而在未來隨著AI芯片算力的加強(qiáng),視頻的智能分類也將最終得以實(shí)現(xiàn)。而由于AI經(jīng)過足夠訓(xùn)練后,能夠較好地理解語言語義,因此將文稿按照其中內(nèi)容進(jìn)行分門別類,也成為了可能。類似的功用也可以作用于音頻中,某些音樂APP可以將音樂按照不同風(fēng)格的旋律分類,例如舒緩、激烈或甜美等,而隨著AI芯片愈發(fā)強(qiáng)大,手機(jī)本地也可以完成這樣的任務(wù)。
也就是說,當(dāng)AI發(fā)展到一定地步,手機(jī)中的相冊(cè)APP能夠按照內(nèi)容整理照片、視頻庫可以自動(dòng)分類不同內(nèi)容的視頻、文件管理器可以將近似內(nèi)容的文檔歸類在一起、音樂APP能夠識(shí)別風(fēng)格各異的旋律,都有可能成為現(xiàn)實(shí)。而當(dāng)AI將這些結(jié)合在一起,視頻的自動(dòng)剪輯、踩點(diǎn)等應(yīng)用,也將愈發(fā)成熟———目前微軟Windows 10中的相冊(cè)就已經(jīng)初步提供了類似功能,但還不太智能,將來手機(jī)在AI芯片的加持下,利用相應(yīng)的APP一鍵生成短視頻、Vlog等,將不再是夢(mèng)。
AI行為調(diào)度
得益于大數(shù)據(jù),AI能夠采集方方面面的信息,并給出一個(gè)統(tǒng)計(jì)學(xué)上的最優(yōu)解。例如Google的Alpha Go,就在學(xué)習(xí)了大量對(duì)弈樣本后,得知了圍棋每一步的權(quán)重,從而擊敗最頂級(jí)的棋手。因此當(dāng)AI的涉及面足夠廣,它就能以普通人所難以企及的全面視野,來為你安排生活中的點(diǎn)點(diǎn)滴滴,讓你真正感受到“智能”的精髓。
例如,很多人家中都購置了智能家電,但這些家電的調(diào)度仍不那么的“智能”———你需要為它們預(yù)設(shè)開啟、工作的時(shí)間段或者條件,雖然比傳統(tǒng)家電方便,但仍做不到根據(jù)你的實(shí)際行程,全自動(dòng)為你安排家電的開啟。
例如當(dāng)你設(shè)置了下班后自動(dòng)提前開啟空調(diào)等待回家,但某天突然塞車,又不便操作手機(jī),智能家電并不能因?yàn)檫@個(gè)調(diào)整自己的開啟時(shí)間,白白耗費(fèi)電能。當(dāng)你需要突然出差的時(shí)候,你還得手動(dòng)調(diào)節(jié)智能家電的使用方案,更加不便。而如果管控智能家電的APP加入了AI相關(guān)技術(shù),一切可能就變得不同了———APP會(huì)根據(jù)你的行程、身體情況和環(huán)境氣候等,自動(dòng)安排自己的工作時(shí)段、時(shí)長(zhǎng)和模式,你甚至?xí)杏X到電器上的開關(guān)功能按鈕是多余的———這才叫做智能家電。
AI的一大魅力在于找出大數(shù)據(jù)中的內(nèi)在規(guī)律,從而讓功能的自動(dòng)化實(shí)現(xiàn)成為可能,甚至能極大程度模糊人與機(jī)器間的界限。AI芯片目前仍處于起步階段,或許我們現(xiàn)在只能在少量應(yīng)用場(chǎng)景中感受到它的存在,但隨著應(yīng)用生態(tài)的完善,AI芯片將會(huì)為手機(jī)帶來更多神奇功用,期待AI芯片能在未來進(jìn)一步發(fā)光發(fā)熱吧。