張友發(fā)
據(jù)美國媒體報(bào)道,5月4日,在美國亞利桑那州錢德勒市的公路上,谷歌旗下自動(dòng)駕駛公司W(wǎng)aymo的一輛自動(dòng)駕駛汽車遭遇車禍。而在此之前的3月18日,亞利桑那州因?yàn)橐黄瘃{駛事故禁止了優(yōu)步的自動(dòng)駕駛實(shí)驗(yàn),該事故導(dǎo)致了一位橫穿馬路女子的死亡。安全問題成為公眾對(duì)自動(dòng)駕駛最大的質(zhì)疑。
眼擎科技公司在今年4月20號(hào)發(fā)布了國內(nèi)首個(gè)車規(guī)級(jí)自動(dòng)駕駛視覺成像方案eyemoreDX120,為解決自動(dòng)駕駛的困局提出了自己的方案。方案建立在公司的成像芯片eyemoreX42基礎(chǔ)上。這款芯片致力于解決復(fù)雜光線成像問題。
在交流中,眼擎科技CEO(首席執(zhí)行官)朱繼志措辭謹(jǐn)慎:“我們的方案還需要和設(shè)備商磨合,要經(jīng)過車廠測試。我只能說這比現(xiàn)有方案前進(jìn)了一大步,但能否在成像方面解決自動(dòng)駕駛的安全問題,還需要觀察。”
除了自動(dòng)駕駛,朱繼志還談到了眼擎科技在人工智能和芯片領(lǐng)域的布局與野心。過程中,朱繼志經(jīng)常提到兩個(gè)詞:一是“專注”,即公司對(duì)某一個(gè)細(xì)分領(lǐng)域的專注;二是“機(jī)會(huì)”,包括大的技術(shù)變革給中國成像芯片產(chǎn)業(yè)帶來的機(jī)遇。
創(chuàng)業(yè)過程中,眼擎科技經(jīng)歷了4年的科技沉淀,積累了能應(yīng)用于人工智能(AI)領(lǐng)域的復(fù)雜成像技術(shù)。眼擎科技成像芯片的核心技術(shù)是復(fù)雜光線下的穩(wěn)定成像。朱繼志介紹,目前人工智能的圖像識(shí)別率已經(jīng)很高,在實(shí)驗(yàn)室中能達(dá)到98%甚至99%,但來到現(xiàn)實(shí)場景時(shí),圖像識(shí)別率就會(huì)大大下降。
“這就像我們?cè)谔詫毶腺I東西,看到的都是賣家秀,拿到手的卻是買家秀。這其中最大的差別,就是光線環(huán)境的問題。”朱繼志認(rèn)為眼擎科技研發(fā)的成像芯片能很好地解決行業(yè)痛點(diǎn):“實(shí)驗(yàn)室與現(xiàn)實(shí)環(huán)境的差別是光線差異,這是最大的落地難點(diǎn)。我們研發(fā)的這款成像芯片就像我們的眼睛一樣,能把實(shí)驗(yàn)室99%(的識(shí)別率)變成現(xiàn)場99%(的識(shí)別率)?!?/p>
這是人工智能帶來的挑戰(zhàn)與機(jī)遇。在成像芯片領(lǐng)域,之前芯片廠商的思路是服務(wù)于相機(jī),研發(fā)的出發(fā)點(diǎn)是看鏡頭的人;人工智能給成像芯片帶來了新的課題,研究思路從給人看轉(zhuǎn)向給AI看。
朱繼志說:“在傳統(tǒng)成像芯片時(shí)代,復(fù)雜環(huán)境下的成像問題不是剛需,因?yàn)榄h(huán)境光線不好可以補(bǔ)光,甚至可以不拍。但在自動(dòng)駕駛時(shí)代,這就成了剛需。”
適應(yīng)新的時(shí)代需要變革原有的技術(shù)框架,但在朱繼志看來,傳統(tǒng)公司很難完成轉(zhuǎn)型:“傳統(tǒng)的架構(gòu)不能解決復(fù)雜光線下成像的問題。為了解決這個(gè)問題,我們從芯片架構(gòu)到算法,再到場景測試,做了很多工作,我們?cè)趶?fù)雜光線的適應(yīng)情況上和傳統(tǒng)公司不是一個(gè)層級(jí),包括索尼?!?/p>
“過去30年,以ISP(圖像信號(hào)處理器)為代表的傳統(tǒng)成像架構(gòu)一直統(tǒng)治著成像能力的表現(xiàn),即使現(xiàn)在AI發(fā)展了,效果也不可能有很大的提升。原因很簡單:30年前的技術(shù)架構(gòu),人們不可能考慮未來人工智能有什么需求。以前圖像只考慮給人看,現(xiàn)在的圖像是給機(jī)器看,但傳統(tǒng)架構(gòu)成形多年,積重難返。這就是技術(shù)架構(gòu)的弊端。久而久之,大家沒看到視覺能夠突破,就會(huì)形成一種觀念——認(rèn)為視覺能力是不可能突破的,這也是激光雷達(dá)日后被叫好的一個(gè)原因。其實(shí)本質(zhì)上,我們應(yīng)該回到問題的源頭,視覺能力不夠,就研發(fā)新的成像引擎架構(gòu),做視覺成像專用的芯片,以此來提升汽車的視覺能力。這件事不好干,我們?yōu)榇藢W⒘?年?!?/p>
朱繼志覺得這是人工智能的發(fā)展給中國芯片企業(yè)帶來的機(jī)遇:“在AI芯片領(lǐng)域,美國比中國領(lǐng)先得不多,也就是幾年的優(yōu)勢(shì);而在傳統(tǒng)的芯片領(lǐng)域領(lǐng)先了我們幾十年。AI給中國公司帶來了機(jī)會(huì),這是一個(gè)新興市場,我們起點(diǎn)相仿?!?h3>成像技術(shù)的第一個(gè)應(yīng)用場景
朱繼志的思路是循序漸進(jìn),先通過4年積累掌握成像引擎核心技術(shù),第二階段再推出產(chǎn)品,也就是成像芯片。今年朱繼志的目標(biāo)是完成第三階段任務(wù),讓產(chǎn)品在應(yīng)用場景中進(jìn)一步落地。目前發(fā)布的產(chǎn)品eyemoreDX120通過配置汽車外圍接口做成適應(yīng)自動(dòng)駕駛的模組,將芯片產(chǎn)品發(fā)展為情景化的自動(dòng)駕駛解決方案。
eyemoreDX120解決方案的優(yōu)勢(shì)在于具備較強(qiáng)的場景適應(yīng)性,在不同場景下都能夠穩(wěn)定成像,解決了自動(dòng)駕駛面臨的復(fù)雜光線成像不穩(wěn)定的問題。eyemoreDX120的鏡頭傳感器符合接口的行業(yè)規(guī)范,能解決120dB動(dòng)態(tài)范圍內(nèi)的自動(dòng)駕駛成像問題。
朱繼志將自己的方案看作自動(dòng)駕駛技術(shù)的重要一環(huán):“AI落地的時(shí)候是一個(gè)接力賽,我們前面是鏡頭和傳感器,我們做的視覺成像處在第三棒,我們后面是成像識(shí)別。很多現(xiàn)在的明星芯片公司,比如地平線,都在做這個(gè)?!?/p>
眼擎科技今年打算讓成像芯片在多個(gè)行業(yè)落地,而之所以選擇自動(dòng)駕駛作為起點(diǎn),朱繼志有著自己的考量:“自動(dòng)駕駛對(duì)人工智能領(lǐng)域的技術(shù)要求很高,可以說是最高的。其次,我們的產(chǎn)品在自動(dòng)駕駛(領(lǐng)域)是剛需,痛點(diǎn)最大。我們判斷切入的標(biāo)準(zhǔn),首先是看這個(gè)市場的容量夠不夠大,其次是看痛點(diǎn)多不多。自動(dòng)駕駛恰好在這兩點(diǎn)上都符合?!?/p>
“人工智能的應(yīng)用場景很多,其中自動(dòng)駕駛的應(yīng)用很容易推廣到其他領(lǐng)域,成熟的技術(shù)可以遷移到AI其他產(chǎn)品中?!敝炖^志這樣解釋自動(dòng)駕駛對(duì)于人工智能發(fā)展的推動(dòng)作用。
對(duì)于自動(dòng)駕駛的未來發(fā)展,朱繼志覺得問題很復(fù)雜:“自動(dòng)駕駛系統(tǒng)相比機(jī)器人,挑戰(zhàn)更大。自動(dòng)駕駛需要人工智能不同系統(tǒng)的協(xié)調(diào)合作。我們只解決成像這一個(gè)點(diǎn),但如果有十幾個(gè)像我們這樣專注的公司,那人工智能自動(dòng)駕駛問題會(huì)得到很好的解決?!?h3>眼擎科技的關(guān)鍵一年
對(duì)朱繼志來說,今年是人工智能和眼擎科技的關(guān)鍵一年:“2018年是人工智能落地的一年,去年大家主要在做試點(diǎn)。我們公司在未來3年內(nèi)會(huì)有大規(guī)模的部署,預(yù)計(jì)在各個(gè)領(lǐng)域開發(fā)約60個(gè)客戶,讓方案在不同行業(yè)落地,豐富產(chǎn)品線。今年是重要的布局年。”
朱繼志未來打算重點(diǎn)在汽車、安防、工業(yè)檢測和機(jī)器人等方面發(fā)力:“人工智能進(jìn)入的領(lǐng)域越多越好,需要和更多產(chǎn)業(yè)去磨合試錯(cuò),然后才能從小到大得到發(fā)展。而視覺是人工智能的關(guān)鍵點(diǎn),我們需要把技術(shù)和芯片產(chǎn)品賦能到傳統(tǒng)行業(yè)。”
對(duì)于未來的人工智能大局,朱繼志覺得眼擎科技需要堅(jiān)持好技術(shù)導(dǎo)向:“我希望公司能看到技術(shù)痛點(diǎn),解決(痛點(diǎn))后形成產(chǎn)品,再去尋找潛在的市場。”
至于成像芯片的對(duì)手,朱繼志半開玩笑地說:“成像芯片目前的綜合能力和眼睛差別還很大,我們的對(duì)手應(yīng)該是人眼而不是傳統(tǒng)公司。AI最終就是要顛覆原有格局,讓機(jī)器做得比人更好,這是我們最終要解決的問題?!?h3>鏈接:新的千億級(jí)市場誕生
視覺技術(shù)分為兩種:成像(imaging)和圖像處理(image processing)。前端成像技術(shù)負(fù)責(zé)生成視覺圖像,后端圖像處理負(fù)責(zé)分析、識(shí)別、處理視覺圖像。換句話說,成像相當(dāng)于人的眼睛,圖像處理相當(dāng)于人的大腦。
目前人工智能領(lǐng)域的明星公司,包括商湯、曠世、地平線、云從、依圖、深鑒等,都是基于圖像處理算法為核心技術(shù)的公司。在過去的3年里,受深度學(xué)習(xí)技術(shù)的驅(qū)動(dòng),圖像處理獲得了飛速的發(fā)展,但前端的成像技術(shù),仍然停留在20年前的水平,成為AI視覺未來發(fā)展以及商業(yè)應(yīng)用落地的嚴(yán)重瓶頸,也是當(dāng)前各大AI公司的下一個(gè)必爭之地。
和數(shù)碼時(shí)代相比,AI時(shí)代的成像在成像架構(gòu)、算法模型、評(píng)判標(biāo)準(zhǔn)、光線適應(yīng)性等諸多關(guān)鍵環(huán)節(jié)都發(fā)生了本質(zhì)的變化。傳統(tǒng)的數(shù)碼成像技術(shù)架構(gòu)已不能滿足AI視覺的需求,面臨迅速被淘汰的窘境。未來5年,成像技術(shù)將有望完成從“圖像”到“視覺”的劃時(shí)代升級(jí),視覺成像芯片和AI處理芯片一樣,成為人工智能的核心部件,由此衍生的產(chǎn)業(yè)升級(jí)需求,將在未來5年催生出成像領(lǐng)域千億級(jí)別的新增量市場。