馮漢森
過年時節(jié),親戚朋友們總是對我學的專業(yè)“很有錢景”表示祝賀,好像與人工智能相關(guān)就是高薪的保障。對此我不置可否。我的專業(yè)確實與人工智能息息相關(guān),但高薪也不是必然的。人們對人工智能的過高期待使得前兩年從業(yè)者的薪資有些虛高了,所以會給大家“做人工智能肯定高薪”的錯覺。我以為,今后人工智能的高薪現(xiàn)象或許依舊會存在,卻將不再如此傳奇,換句話來說,其價值必定匹配其薪資。
人工智能行業(yè)看起來形勢一片大好,然而,相信大家多多少少也能感覺到,現(xiàn)在“人工智能”這個概念已經(jīng)被炒過頭了,很多商家完全是在消費這個概念,靠賣概念來掙錢,實際的產(chǎn)品并沒有多么“智能”,或者說只是“換皮智能”,用老的技術(shù)披個“智能”的名字罷了。
那什么樣的“智能”是有新技術(shù)加持的智能?請允許我簡單介紹一下這一波“人工智能熱”的背景。
大家可能常常在媒體上聽到“人工智能”“深度學習”“神經(jīng)網(wǎng)絡”“機器學習”這些概念,他們之間的關(guān)系是怎樣的呢?下圖給出了這個問題的答案。
這次人工智能熱的主角其實是“深度學習”,可以說“人工智能”這個大概念很大程度上只是被“深度學習”這個子概念帶火了而已。以當前的時間節(jié)點來看,越接近“深度學習”的技術(shù),一般就是“智能程度”越高的技術(shù)。其他的智能技術(shù)各有其適用的場景,但它們并不是這次智能浪潮驚艷世界的主角。
深度學習的崛起是時代的選擇,電子設(shè)備的快速發(fā)展和互聯(lián)網(wǎng)的普及功不可沒,前者提供了強大的計算資源,后者提供了海量的訓練數(shù)據(jù),而深度學習的理論其實早有醞釀,并不特別。本領(lǐng)域的權(quán)威書籍《Deep Learning》(Goodfellow)是這樣描述的:
一般認為,迄今為止深度學習經(jīng)歷了3次發(fā)展浪潮:20世紀40年代到60年代,深度學習的雛形出現(xiàn)在控制論中;20世紀80年代到90年代,深度學習表現(xiàn)為聯(lián)結(jié)主義;直到2006年,才真正以深度學習之名復興。
簡單地來說,深度學習是一種簡單有效地利用資源和數(shù)據(jù)的方法,它往往以神經(jīng)網(wǎng)絡的方法實現(xiàn),尤其擅長解決難以形式化描述的任務,比如視覺任務、自然語言處理、棋牌博弈等。深度學習對硬件以及數(shù)據(jù)的數(shù)量和質(zhì)量要求都很高,所以二十年前研究者覺得很難做,這些年硬件和數(shù)據(jù)都到位后,該領(lǐng)域卻有了爆發(fā)式的增長,在某些場景下人工智能甚至能夠超過人類的表現(xiàn)。
回到“人工智能高薪”這個話題,我想這首先還是市場需求催生出來的必然結(jié)果。
在我高考選專業(yè)的2016年,人工智能還只是一個“聽起來不錯但沒那么火”的專業(yè),并不是什么薪金遠超其他專業(yè)的存在。然而自AlphaGo在圍棋戰(zhàn)勝人類之后,人工智能賺足了眼球,徹底從實驗室走向臺前,加之深度學習的門檻其實并不高——開發(fā)工具成熟、開源社區(qū)龐大、公共資源較多、學習成本不高,使原本的局外資本和從業(yè)者大量涌入成為了局內(nèi)人。
當然,人工智能本身確實很有研究價值,無論是通用人工智能還是特定場景下的人工智能,都是解放生產(chǎn)力的大殺器,所以真正的人工智能值得投入,值得通過高薪來吸引人才。從2017和2018年的歷史節(jié)點來看,人工智能行業(yè)確實存在人才缺口,高薪是大勢所趨。
但過猶不及。據(jù)實驗室的學長所說,2019年的實際招聘情況吊打了各路懷夢青年,競爭十分慘烈。很多人奔著年薪“本科平均20萬元,碩士平均30萬元,博士平均50萬元”的口號轉(zhuǎn)行進入這個領(lǐng)域,卻在付出了大量時間和金錢后敗興而歸。我綜合了一下幾位學長透露的零散消息,大概印象是:2017年左右,只要懂基礎(chǔ)知識能調(diào)網(wǎng)絡就有機會入職;2018年左右,只有理論實踐都不錯的人和論文產(chǎn)出比較好的人才能拿到高薪;2019年左右,頂級會議的論文才是大廠的入職敲門磚。順帶一提,深度學習最成熟的應用領(lǐng)域是計算機視覺和自然語言處理,計算機視覺的三大頂級會議CVPR、ICCV、ECCV的論文接收數(shù)量都在1000篇左右,CVPR 2019接收論文1300篇,ICCV 2019接收論文1077篇,ECCV兩年一屆所以2019沒有召開。
回顧2017年到2019年的薪酬情況,相關(guān)公司想必早已醒過悶兒來了。人們給予了這個概念過多的期待,“欲戴王冠必承其重”,但深度學習這個技術(shù)的優(yōu)點也是它的局限,它承受不了如此多的期待,很多投資項目的資金與精力都浪費在了重復的工作上。重新復盤,兩年前的高薪崗位入職標準,不少有些“才不配位”。
我選擇的研究方向?qū)儆谟嬎銠C視覺,接下來的五年里我要繼續(xù)讀博深造,所以也對人工智能的前景有一些看法,在此提出僅作拋磚引玉,希望能給大家一些啟發(fā)。
一方面是深度學習技術(shù)本身的問題。深度學習的特點是簡單粗暴——實現(xiàn)簡單、方法粗暴。深度學習早期一度被不少機器學習教授和數(shù)學系教授所嫌棄,以至于2019年暑假我聽學術(shù)會議時還有教授感慨深度學習效果實在“出人意料”。只要數(shù)據(jù)和計算資源足夠多,深度學習的關(guān)鍵就不再是“能不能做”的問題,而是效率和精度的問題。然而電子設(shè)備是有極限的,除非能在10年內(nèi)進入量子計算時代,否則計算效率上會遭遇瓶頸。同理,有效數(shù)據(jù)的獲取也是有極限的,然而這是高質(zhì)量神經(jīng)網(wǎng)絡所必不可少的。人為標注大量的數(shù)據(jù)費錢費時費力,你可以試著把自己手機相冊里每張照片出現(xiàn)的人都做一下標注,你就能理解這個工作之枯燥和代價之高了。另外實驗室提出的模型在實際應用落地時效果往往會差一截子,泛化能力——即運用到其他地方的能力,參差不齊。非監(jiān)督學習還不夠成熟,而監(jiān)督學習想解決實際應用問題只能采集更多的數(shù)據(jù)。上述矛盾的核心即在于,想要變得更好所需的數(shù)據(jù)量/訓練開銷和經(jīng)濟投入完全不成正比。由此推斷,接下來的日子里,人工智能產(chǎn)業(yè)擴大的增速大概率會放緩,過飽和的市場大概會讓平均薪金下降到更合理的地位。
另一方面,深度學習是人工智能,但人工智能不只是深度學習。將多個研究領(lǐng)域有機結(jié)合是現(xiàn)在研究的一個思路,用無監(jiān)督學習自動標注也是一個思路,結(jié)合腦科學開發(fā)新模型又是一個思路……這樣的思路有很多,都需要踏踏實實地做才可以。容易啃的骨頭已經(jīng)被啃光了,深度學習本身的路還很長,人工智能的路,更長。完全沒有必要因為深度學習的缺陷而看衰人工智能行業(yè),人工智能“人均高薪”的奇跡可能會消失,但其作為生產(chǎn)力的放大器,從業(yè)者的待遇總不會差的。
人工智能行業(yè)依然需要人才,但“調(diào)包俠”和“煉丹師”已不再受歡迎,迫切需要的是能夠做切實研究的人,以及能夠?qū)⒀芯柯涞氐娜恕G罢咝枰性鷮嵉睦碚摶A(chǔ)和活躍的創(chuàng)新思維,這不是短時間之內(nèi)能培養(yǎng)出來的,所以我們的人才缺口大到需要在高校單開一個“人工智能”本科專業(yè)。后者需要有熟練的軟硬件開發(fā)經(jīng)驗,比如嵌入式開發(fā)或移動應用開發(fā),人工智能對這方面的需求很大,與其讓設(shè)計者一開始就考慮優(yōu)化不如讓開發(fā)人員去做,這是轉(zhuǎn)專業(yè)的一個很好的切入點。
以上就是我對人工智能高薪現(xiàn)象的看法,希望想從事人工智能行業(yè)的同學們靜下心來好好學習,夯實基礎(chǔ),同時多去嘗試些新的技術(shù),多去復現(xiàn)那些論文看看,讓自己保持活躍的思維和積極的興趣。不要只饞它的薪資,不論什么行業(yè),只有你愛它,多思考多實踐,才能創(chuàng)造出與眾不同的花火,才會獲得相應的回報。
責任編輯:樸添勤
常見人工智能概念名詞的層級關(guān)系