□文/本刊記者 何遙
“未來,一定是一個無終端不AI,無AI不芯片的時代?!?月25日,在云天勵飛芯片專題的媒體溝通會上,云天勵飛聯(lián)合創(chuàng)始人、CEO陳寧提到,云天勵飛正在研發(fā)的一款面向嵌入式端的邊緣人工智能芯片IPU(inteligence processor unit),并取得階段性成果,計劃今年年中流片,明年上半年正式商用。
據(jù)介紹,云天勵飛AI芯片的技術(shù)路線是通過設(shè)計一系列面向多層神經(jīng)網(wǎng)絡(luò)的可編程處理器,應(yīng)對人工智能算法的快速迭代。“我們首創(chuàng)的‘自適應(yīng)云+端'AI系統(tǒng)架構(gòu),可通過云端邏輯控制終端芯片,自動更新終端芯片的算法和功能?!睋?jù)云天勵飛聯(lián)合創(chuàng)始人、CEO陳寧介紹,云天勵飛自主研發(fā)的專用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器芯片,采用ASIP設(shè)計思路,提供ASIC級別高性能和低功耗,也能提供處理器級別的指令集靈活性。同時,采用異構(gòu)計算多核SOC架構(gòu),集成多處理器單元,并行分布式處理與集中控制系統(tǒng)。
與傳統(tǒng)芯片迭代速度相比,AI芯片迭代更快?!澳壳皝碚f,算法每半個月迭代一次,AI芯片則要同步迭代,而傳統(tǒng)芯片的迭代是按年計算?,F(xiàn)有的CPU或GPU無法滿足嵌入式端視覺AI應(yīng)用?!睋?jù)云天勵飛研發(fā)副總李愛軍表示,通用CPU在神經(jīng)網(wǎng)絡(luò)加速上速度慢,性能上滿足不了對嵌入式端的需求;GPU性能是夠的,但功耗高、成本居高不下?!八裕覀冇X得有必要去研究適應(yīng)新型神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)處理器架構(gòu)芯片。”而云天勵飛研發(fā)的芯片是面向嵌入式端的邊緣計算人工智能芯片,專注智能視覺,聚焦在安防、智能商業(yè)等領(lǐng)域的場景應(yīng)用。
▲云天勵飛聯(lián)合創(chuàng)始人、CEO陳寧
“云天勵飛做芯片不是臨時起意,而是從公司創(chuàng)立之初就開始了芯片的布局?!睋?jù)陳寧介紹,云天勵飛早在2014年就有了完整的“機器學(xué)習(xí)與視覺智能處理器”AI芯片解決方案,并獲得2015年深圳孔雀團隊第一名。
當(dāng)時,云天勵飛的芯片研發(fā)團隊是國內(nèi)AI芯片界唯一有芯片商用經(jīng)驗的團隊,陳寧是中國第一款商用矢量處理器芯片的設(shè)計者,而芯片團隊主導(dǎo)者李愛軍是原中興通訊手機芯片的研發(fā)負責(zé)人,主導(dǎo)研發(fā)了國內(nèi)第一顆28nm手機芯片商用(2010)和國內(nèi)首款LTE多模手機芯片商用。
陳寧說,“我們的芯片研發(fā)團隊是國內(nèi)頂尖的ASIP矢量處理器芯片設(shè)計團隊,主要的骨干團隊成員有豐富的矢量處理器、復(fù)雜soc芯片設(shè)計經(jīng)驗,且平均設(shè)計經(jīng)驗超過10年?!?/p>
據(jù)了解,云天勵飛在2016年完成了第一代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器NNP100的研制,并基于FPGA載體實現(xiàn)商用。
李愛軍介紹說,NNP100深度結(jié)合云天勵飛自研深度學(xué)習(xí)算法,與自研神經(jīng)網(wǎng)絡(luò)模型深度耦合,具有強大的運算處理能力以及靈活的模型pooling能力,設(shè)計上支持PE數(shù)量根據(jù)場景需求任意擴展和裁剪,非常靈活,同時它又具有高性能、低時延和低功耗技術(shù)優(yōu)勢。
“相比之前的應(yīng)用效果,采用NN P10 0后FPGA加速卡,計算性能相比GPU提升2倍,功耗減低 5 倍,時延減低100倍?!崩類圮娊榻B,目前NNP100應(yīng)用在云天勵飛的DeepEye100智能盒子和DeepEye200服務(wù)器加速卡產(chǎn)品上?;贜NP100的技術(shù)基礎(chǔ),云天勵飛已經(jīng)在研發(fā)第二代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器NNP200,并取得階段性成果。NNP200將集成于云天勵飛IPU(inteligence processor unit)芯片上,并用于智能終端產(chǎn)品。
據(jù)介紹,云天勵飛的視覺AI芯片具有2Tops/W的高能量效率。與Nvidia開源的nvDLA相比,相同運算力下,在很小的內(nèi)存帶寬下,算法模型效率可以提高18倍。與麒麟970相比,相同運算力下,比970的性能提高4.4倍。
“云天的芯片除了高能低耗的優(yōu)勢之外,還能實現(xiàn)可編程,遠程一鍵升級。芯片可同時處理多路高清視頻,此外,通過片間級聯(lián)還可進行擴展?!崩類圮娬f,多芯片級聯(lián),相當(dāng)于搭積木一樣,一顆一顆之間通過板級互聯(lián)進行擴展。通過級聯(lián)擴展最多可以同時處理64路視頻。
“我們采用業(yè)界領(lǐng)先的22nm工藝,工藝的性能、功耗、面積經(jīng)過仿真、分析、比對,對比業(yè)界主流的28nm工藝,都具有一定優(yōu)勢,性能提升約10%,功耗降低約15%,面積減小15%-20%?!标悓庍€提到,云天勵飛的IPU芯片計劃在今年年中實現(xiàn)流片,并在明年上半年推向商用,最終通過模式創(chuàng)新,打造一個開放賦能的芯片平臺。
相比傳統(tǒng)的芯片,AI芯片更注重“從場景到算法,從算法到芯片”。正因為不同于以往從硬件出發(fā)的思路,AI芯片的行業(yè)形態(tài)和商業(yè)模式正在發(fā)生著變化。目前,AI芯片的應(yīng)用場景主要集中在安防、智能家居和消費電子、自動駕駛、云計算、智慧城市等行業(yè)。
“由于目前還不存在適用于所有通用算法的嵌入式AI芯片,確定芯片的應(yīng)用場景就顯得尤為重要?!标悓幪岬剑^往三年,云天勵飛深耕安防領(lǐng)域,最先提出了針對安防行業(yè)“云+端”的解決方案,真正做到將AI技術(shù)落地于垂直場景。
而云天勵飛的拳頭產(chǎn)品“深目”系統(tǒng),在深圳和全國已建設(shè)在線智能前端設(shè)備10000多路,動態(tài)人像數(shù)據(jù)量80+億,是全球最大的動態(tài)人像數(shù)據(jù)庫?!霸趫鼍岸x算法,算法定義芯片的今天,我們的算法訓(xùn)練來源于真實的場景,這也意味著在我們的芯片對場景的理解更深,我們知道應(yīng)該如何去優(yōu)化才能做到最好?!?陳寧還提到,“算法+芯片+數(shù)據(jù)”的閉環(huán)生態(tài)是云天勵飛的核心競爭力,同時,云天勵飛也是國內(nèi)唯一一家同時擁有算法、芯片和數(shù)據(jù)三個要素的公司。
中國已經(jīng)成為世界上視頻監(jiān)控發(fā)展速度最快的國家,我國一些一線城市已經(jīng)實現(xiàn)了監(jiān)控攝像頭的100%全覆蓋。據(jù)行業(yè)調(diào)查公司IHSMarkit的最新統(tǒng)計數(shù)據(jù)顯示,目前中國在公共和私人領(lǐng)域(包括機場、火車站和街道)的監(jiān)控攝像頭安裝量目前已有1.76億個,未來三年該數(shù)量將會成倍增長,達到6.26億個。
“云天勵飛想做的,就是用芯片的產(chǎn)品,去激活這些傳統(tǒng)的攝像頭。在2025年,讓1億攝像頭擁有‘AI芯’?!?/p>
據(jù)介紹,云天勵飛走的是一條“算法+芯片+數(shù)據(jù)+應(yīng)用+服務(wù)”、提供端到端整體解決方案的路線:將算法植入前端的智能攝像頭,進行人像檢測、特征值提取,數(shù)據(jù)上傳到云端,由云端引擎進行搜索和識別、決策。前端后端算法聯(lián)動和深度優(yōu)化,而芯片級的解決方案則是核心。
陳寧還提到,云天勵飛除了在芯片技術(shù)上的創(chuàng)新之外,還將探索芯片商業(yè)模式的創(chuàng)新,力推“芯片+服務(wù)”的新玩法?!拔磥?,我們甚至可能會推出免費的芯片試用,改變以往賣芯片的方式,以服務(wù)的方式讓云天的AI芯能下滲到行業(yè),最終達到賦能百業(yè)的目的。”