得益于基礎(chǔ)計算能力的大幅提升和大規(guī)模的數(shù)據(jù)積累,當(dāng)前全球人工智能技術(shù)產(chǎn)業(yè)正快速成熟并步入商業(yè)化階段。為搶占產(chǎn)業(yè)發(fā)展先機(jī),谷歌、微軟、Facebook、百度等國內(nèi)外巨頭企業(yè)依托既有優(yōu)勢,持續(xù)加大研發(fā)投入力度,大力布局人工智能領(lǐng)域,并積極推動人工智能技術(shù)在各行業(yè)領(lǐng)域中的融合創(chuàng)新。谷歌作為全球人工智能技術(shù)產(chǎn)業(yè)創(chuàng)新的領(lǐng)跑者之一,近年來持續(xù)探索人工智能技術(shù)與移動互聯(lián)網(wǎng)技術(shù)的結(jié)合創(chuàng)新,并針對安卓生態(tài)體系進(jìn)行了一系列技術(shù)架構(gòu)升級,進(jìn)一步推動人工智能技術(shù)在智能終端應(yīng)用中的規(guī)?;涞亍?/p>
安卓操作系統(tǒng)是承載移動互聯(lián)網(wǎng)應(yīng)用的最大載體,也是谷歌構(gòu)建移動互聯(lián)網(wǎng)生態(tài)體系的核心之一。為了充分發(fā)揮移動互聯(lián)網(wǎng)龐大的用戶和開發(fā)者兩大群體優(yōu)勢,加速人工智能技術(shù)與移動互聯(lián)網(wǎng)技術(shù)的融合,谷歌從底層接口、平臺框架、應(yīng)用等層面對安卓體系進(jìn)行了大刀闊斧的升級,完善了人工智能技術(shù)在終端側(cè)的應(yīng)用生態(tài)體系,推動了人工智能算法模型向終端側(cè)的下沉,促進(jìn)了人工智能終端應(yīng)用的快速創(chuàng)新迭代。
谷歌在2017年年底的安卓8.1版本中增加了Android Neural NetworksAPI(簡稱安卓NNAPI),其是一個用于在移動設(shè)備上運(yùn)行與機(jī)器學(xué)習(xí)相關(guān)操作的API接口(見圖1)。安卓NNAPI的核心功能是依據(jù)安卓系統(tǒng)上運(yùn)行的應(yīng)用運(yùn)算需求,由安卓上的機(jī)器學(xué)習(xí)庫和機(jī)器學(xué)習(xí)框架,如TensorFLow Lite、Caffe 2等直接調(diào)用,靈活地為終端設(shè)備中的神經(jīng)網(wǎng)絡(luò)專用芯片、圖像處理單元(GPU)、數(shù)字信號處理器(DSP)等硬件分配計算量,從而為系統(tǒng)上層的機(jī)器學(xué)習(xí)框架提供底層支持。
圖1 安卓NN API運(yùn)行架構(gòu)
安卓NNAPI的推出是谷歌加速人工智能技術(shù)在終端本地化應(yīng)用的一項重要舉措,能夠幫助開發(fā)者構(gòu)建低延遲、高可靠、運(yùn)行快、低成本的本地化人工智能移動應(yīng)用。目前,安卓NNAPI支持Android設(shè)備上已有的推理應(yīng)用,如圖像分類、預(yù)測用戶行為、關(guān)鍵字搜索等以及開發(fā)者利用TensorFlow等框架自定義的模型。
作為谷歌人工智能應(yīng)用生態(tài)的布局核心,2018年谷歌進(jìn)一步提升了TensorFlow、TensorFlow Lite兩大核心產(chǎn)品產(chǎn)品的易用性、兼容性。一是簡化TensorFlow開發(fā)復(fù)雜度,提升開發(fā)效率。目前,深度學(xué)習(xí)模型規(guī)模龐大,通??蛇_(dá)數(shù)十層、數(shù)百萬個參數(shù),模型搭建、訓(xùn)練需要大量標(biāo)記數(shù)據(jù)和計算能力,嚴(yán)重制約了模型訓(xùn)練及優(yōu)化的效率?;诖耍緦么髸雀璋l(fā)布Tensor-Flow Hub共性模塊共享庫,鼓勵開發(fā)者基于此平臺分享和使用已訓(xùn)練完成的模型共性模塊,以節(jié)省現(xiàn)有深度學(xué)習(xí)模型訓(xùn)練中所涉大量重復(fù)的參數(shù)篩選、特征提取等操作,全面提升模型搭建效率。二是擴(kuò)展Tensor-Flow的多語言支持能力。本屆大會谷歌推出Tensor-Flow.js平臺,為Java開發(fā)者提供了一個新的機(jī)器學(xué)習(xí)平臺,幫助開發(fā)者在瀏覽器中定義和訓(xùn)練模型。同時,谷歌開源TensorFlow for Sw ift,進(jìn)一步拓展TensorFlow在Mac OS和iOS上的應(yīng)用布局。三是提升TensorFlow的跨平臺支持能力。谷歌擴(kuò)展了TensorFlow Lite的應(yīng)用平臺支持范圍,除了Android和iOS外,本屆大會宣布新增對Raspberry Pi系統(tǒng)的支持,將機(jī)器學(xué)習(xí)模型推理應(yīng)用由智能終端推廣到更廣域的物聯(lián)網(wǎng)設(shè)備。并進(jìn)一步優(yōu)化TensorFlow Lite性能,目前相較于Tensor-Flow,其運(yùn)行輕量化模型速度提升在3倍以上。
谷歌在2018年5月發(fā)布了機(jī)器學(xué)習(xí)開發(fā)工具包MLKit,其核心在于將訓(xùn)練好的機(jī)器學(xué)習(xí)模型整合成可直接調(diào)用的API接口對外提供服務(wù),使開發(fā)者僅需幾行代碼就可調(diào)用云端的深度模型算法能力,極大地簡化了終端人工智能APP開發(fā)流程。MLkit支持iOS和Android雙平臺應(yīng)用開發(fā),規(guī)模推廣后將極大提升人工智能應(yīng)用的開發(fā)效率。MLKit提供的API接口服務(wù)包括兩方面內(nèi)容:一是谷歌公司自有的人工智能基礎(chǔ)服務(wù)能力,包括文本識別、圖片標(biāo)記、條碼識別、人臉檢測、地標(biāo)識別等;二是允許開發(fā)者利用TensorFlow和Tensor Flow Lite面向多樣化場景應(yīng)用需求,訓(xùn)練深度學(xué)習(xí)模型并上傳至云端,谷歌將基于MLKit構(gòu)建API接口,并為開發(fā)者提供調(diào)用服務(wù),極大降低了人工智能應(yīng)用開發(fā)的門檻。
在系統(tǒng)層面,谷歌將自身的人工智能技術(shù)優(yōu)勢與安卓系統(tǒng)深度整合,構(gòu)建了一系列系統(tǒng)功能,持續(xù)提升安卓系統(tǒng)用戶體驗與應(yīng)用效能。一是智能化電池管理。在系統(tǒng)電池管理功能中,系統(tǒng)會檢測是哪些應(yīng)用在消耗電池,并自主判斷用戶對APP的使用情況,自動更改CPU的負(fù)載,讓手機(jī)的續(xù)航時間更長。二是智能屏幕亮度管理。在屏幕亮度管理方面,安卓會利用人工智能技術(shù),根據(jù)用戶的使用習(xí)慣調(diào)整手機(jī)屏幕的顯示亮度,例如用戶在白天、夜晚使用手機(jī)時的屏幕亮度選擇分別為70%、20%,系統(tǒng)將記錄這些數(shù)據(jù),并在白天或夜間自動保持舒適的顯示亮度,而不僅靠光線傳感器來解決問題。三是郵件智能寫作。在Gmail中,谷歌利用人工智能技術(shù)智能預(yù)測用戶的寫作意圖,在用戶編寫電子郵件時提供輸入內(nèi)容建議,幫助用戶更加快速地完成文字輸入。
谷歌關(guān)于人工智能技術(shù)布局以及針對安卓體系的一系列升級來看,為進(jìn)一步搶占產(chǎn)業(yè)制高點、構(gòu)筑生態(tài)壁壘,以谷歌為代表的國際巨頭企業(yè)通過“開源平臺框架”和“開放算法能力”兩大手段推進(jìn)技術(shù)創(chuàng)新,加速人工智能應(yīng)用的落地和技術(shù)變現(xiàn)。
為聚攏開發(fā)者、凝聚分散的技術(shù)力量,構(gòu)筑人工智能產(chǎn)業(yè)生態(tài)體系,人工智能開源框架已成為產(chǎn)業(yè)界的布局重點。人工智能開源框架的特點是允許開發(fā)者免費(fèi)使用、復(fù)制和修改源代碼,以期匯聚更廣泛的集體智慧,具有更新速度快、拓展性強(qiáng)等特點,能夠降低企業(yè)開發(fā)成本。目前,國際上人工智能領(lǐng)先企業(yè)大多發(fā)布了深度學(xué)習(xí)開源平臺,包括微軟的CNTK、Facebook的Torchnet、亞馬遜的DSSTNE等。谷歌于2015年年底正式開源TensorFlow開源平臺,并實現(xiàn)了對CNN、RNN和LSTM等主流算法的支持;隨后,谷歌公布TensorFlow Lite,將模型推理能力拓展至終端側(cè),延續(xù)谷歌在移動端的生態(tài)布局優(yōu)勢。在國內(nèi)企業(yè)方面,百度在2016年發(fā)布PaddlePaddle后,迅速成為Github上開發(fā)熱度增速最高的深度學(xué)習(xí)平臺。在后續(xù)更新中,PaddlePaddle著力解決了模型執(zhí)行速度問題,并實現(xiàn)了人工智能應(yīng)用作業(yè)過程的大規(guī)模計算集群彈性作業(yè)調(diào)度,極大提升了工作效率。與谷歌強(qiáng)化終端側(cè)布局的策略相比,百度傾向于將人工智能應(yīng)用于更加復(fù)雜的、對計算能力要求更高的場景,比如廣告、搜索、無人駕駛等領(lǐng)域。
同時,為覆蓋未來廣闊的人工智能應(yīng)用藍(lán)海市場,人工智能企業(yè)積極通過開放應(yīng)用API接口的方式,推動模型算法在多樣化場景中的落地,例如微軟提供的圖像及語言識別API、亞馬遜提供的Amazon Polly(翻譯API)、Amazon Rekognition(圖像與人臉識別API)、IBM的Watson等。為更加便捷地構(gòu)建移動端人工智能應(yīng)用,谷歌在TensorFlow、TensorFlow Lite以及Android NNAPI的基礎(chǔ)上,通過機(jī)器學(xué)習(xí)開發(fā)工具包MLKit為開發(fā)者打通了“從‘模型訓(xùn)練’到‘終端推理’到‘移動應(yīng)用’”的完整移動應(yīng)用創(chuàng)新路徑。谷歌模式為開發(fā)者提供了完整成熟的API接口服務(wù)能力,也鼓勵開發(fā)者將自己訓(xùn)練的深度學(xué)習(xí)模型上傳至谷歌云端并構(gòu)建API提供服務(wù),極大地激發(fā)了開發(fā)者的創(chuàng)新活力。在國內(nèi)方面,百度推出了Apollo開放平臺,通過開放API提供能力和開放代碼聯(lián)合研發(fā)兩種并行方式同步布局自動駕駛產(chǎn)業(yè)生態(tài);曠視科技、云從科技等公司也已經(jīng)將人工智能技術(shù)能力通過API開放,并在安防、金融等行業(yè)領(lǐng)域形成了一定的應(yīng)用規(guī)模。
整體來看,當(dāng)前無論全球還是我國的人工智能應(yīng)用產(chǎn)業(yè)均呈現(xiàn)出以下兩大特點:
一是技術(shù)力量較為分散。在人工智能產(chǎn)業(yè)生態(tài)構(gòu)建的初期階段,巨頭企業(yè)、初創(chuàng)企業(yè)、獨(dú)立開發(fā)者、學(xué)術(shù)界均具備較強(qiáng)的人工智能技術(shù)創(chuàng)新能力,但目前產(chǎn)業(yè)界與學(xué)術(shù)界中開源人工智能平臺多達(dá)數(shù)10款,各平臺技術(shù)側(cè)重點不同且模型無法互聯(lián)互通,人工智能應(yīng)用創(chuàng)新力量分散、生態(tài)構(gòu)建困難。
二是行業(yè)應(yīng)用覆蓋面窄,產(chǎn)品定制化能力不足。當(dāng)前,人工智能企業(yè)技術(shù)開放與行業(yè)規(guī)模應(yīng)用大多聚焦在安防、金融等少數(shù)領(lǐng)域,政務(wù)、農(nóng)業(yè)、零售、醫(yī)療、工業(yè)等更多市場仍具備廣闊的市場空間,且其中大量的專業(yè)化、定制化需求仍未得到滿足。
在當(dāng)前生態(tài)壁壘構(gòu)建的關(guān)鍵期,我國應(yīng)著力提升開源平臺核心技術(shù)水平,強(qiáng)化平臺軟硬件支持能力,提升平臺行業(yè)影響力。
一是持續(xù)拓展合作,擴(kuò)大自主開源平臺的支持范圍,強(qiáng)化對多種開發(fā)語言、硬件平臺的適配能力,形成面向多類型、多平臺開發(fā)者的技術(shù)生態(tài)圈。
二是積極強(qiáng)化開源平臺技術(shù)研發(fā),持續(xù)優(yōu)化內(nèi)置人工智能基礎(chǔ)算法運(yùn)行效率、豐富模型構(gòu)建工具庫,提升自主平臺高效性與易用性。
三是引導(dǎo)鼓勵產(chǎn)業(yè)界、學(xué)術(shù)界積極采用自主開源平臺、開放能力構(gòu)建應(yīng)用,擴(kuò)大自主開源平臺的業(yè)界影響力,促進(jìn)產(chǎn)學(xué)研用良性互動。
加快將人工智能技術(shù)能力開放并投入行業(yè)應(yīng)用,對于釋放技術(shù)對行業(yè)的轉(zhuǎn)型升級力量具有重要意義。未來,我國應(yīng)從鼓勵開放能力、匯聚創(chuàng)新資源、開放基礎(chǔ)數(shù)據(jù)等方面推進(jìn)人工智能技術(shù)在行業(yè)應(yīng)用中的落地。
一是鼓勵人工智能企業(yè)擴(kuò)大語音識別、圖像識別等核心能力開放程度,并積極與更多行業(yè)應(yīng)用核心需求相結(jié)合,開展技術(shù)與應(yīng)用的深度整合,擴(kuò)大人工智能技術(shù)覆蓋面。
二是探索通過舉辦人工智能應(yīng)用創(chuàng)新競賽、企業(yè)揭榜掛帥等方式,吸引各個行業(yè)優(yōu)秀人才參與人工智能應(yīng)用研發(fā),提升人工智能技術(shù)在不同行業(yè)中的專業(yè)化應(yīng)用能力。
三是依托政務(wù)系統(tǒng)、公共醫(yī)療等領(lǐng)域信息資源積累,探索建立標(biāo)準(zhǔn)化行業(yè)基礎(chǔ)數(shù)據(jù)庫,為重點行業(yè)的應(yīng)用落地提供高效訓(xùn)練數(shù)據(jù)資源。