文/孟 醒
創(chuàng)業(yè)故事
快速奔跑的英偉達
文/孟 醒
近年來,科技發(fā)展的速度越來越快。稍一遲疑,企業(yè)就有可能由領先變?yōu)槁浜?。那么,如何站在風口之上隨風起舞,就成為值得探討的話題。
決定電腦運行速度的核心是中央處理器CPU。中央處理器在性能上的突破,定義了電腦的代際變化,使得電腦的世界“江山代有才人出”。第一代中央處理器的領跑者是IBM;第二代中央處理器的領跑者是Intel;到第三代的移動端,領跑者又變成了Apple、Google等。那么,在電腦要進入第四代的時候,應用于人工智能的GPU出世,出現(xiàn)了一個新的領跑者的身影,它就是NVIDIA(英偉達)。
NVIDIA創(chuàng)建于1993年1月,到今天已有24年的歷史。
自創(chuàng)建以來,它的總裁與CEO一直是黃仁勛。
1983年,二十歲的黃仁勛從美國俄勒岡州立大學電子工程專業(yè)畢業(yè),之后先后在硅谷任職于AMD和LSI公司。在LSI主持芯片銷售工作期間,黃仁勛結識了后來的兩個合伙人——克里斯、普雷厄姆。當時,克里斯、普雷艾姆都是SUN公司的工程師,三人常相約在硅谷高速旁的一家咖啡館暢談創(chuàng)業(yè)計劃。1992年年底的一天,咖啡館老板見到三位??停惆阉麄円揭粋€包廂,說是這里更安靜,便于聊天。三人很高興,可剛踏進去,他們都震驚了——靠街的那面墻上布滿了彈孔!其中的一位大驚失色道:“我們想找一個安靜,但更要安全的地方?!崩习暹B忙道歉:“是我忽略了,不過不用擔心,警察也常在這里聊天,我保證你們是安全的。墻上的彈孔是那些黑手黨留下的?!?/p>
1993年初,經(jīng)過一段時間的深入討論,三位好友決定共同創(chuàng)辦NVIDIA。
公司成立了,黃仁勛并沒有馬上上任,而是選擇在他30歲的生日這天上任。他特意選擇這一天,就是要兌現(xiàn)自己當年在大學追求妻子LORI時的承諾——30歲創(chuàng)辦自己的公司。
兩年后的1995年,NVIDIA推出第一款產品NV1。NV1采用獨特的正方形成像技術,摒棄了流行的多邊形成像技術,并集成了游戲手柄、聲卡等多重功能。NV1可以加快電子游戲中圖形圖像的渲染速度,增強顯示效果的逼真程度。
精心打磨了兩年,性能突出的NV1并沒有得到業(yè)界的認可,支持的廠家屈指可數(shù)。此時,NVIDIA的所有資金只能支撐30天。生存上升為第一要務,最實際的辦法就是裁員自救,公司從100多人裁減到了30多人。黃仁勛親自做說服工作,他答應等業(yè)務好轉,只要本人愿意,一定接大家返回公司。
正舉步維艱的時候,NVIDIA接到了日本游戲機巨頭世嘉公司一筆700萬美元的訂單,公司得以續(xù)命。世嘉看中的是NVIDIA的技術潛力,在合作協(xié)議中明確要求NVIDIA采用多邊形成像技術。但首席技術官普雷厄姆執(zhí)意堅持之前的技術路線,于是世嘉提出終止合作,新開發(fā)的NV2胎死腹中。所幸,黃仁勛的誠意最終打動了世嘉,世嘉放棄了追索資金的權利,而將NV2象征性地移作他用。
創(chuàng)業(yè)之初接連兩次失敗使黃仁勛認識到,自己的產品除了要具備領先的性能,更要與用戶的需求相匹配。黃仁勛果斷做出改變,NVIDIA重金聘請戴維·柯克博士為首席科學家。戴維·柯克博士原在軟件開發(fā)商Crystal Dynamics工作,在業(yè)界享有盛譽,被稱為技術天才。戴維·柯克博士將自己的研究開發(fā)經(jīng)驗與NVIDIA的既有經(jīng)驗相結合,花費兩年時間,在1997年推出了新產品NV3——RIVA 128顯卡,性能與市場領導者3DFX的VOODOO顯卡不分伯仲,且價格低廉。NV3具備2D/3D加速能力,匹配速率更快的三角形生成引擎,備受市場歡迎,上市四個月就銷出100萬片。NVIDIA再接再厲,又推出了簡單升級版RIVA 128zx,也就是游戲玩家熟知的小影霸,該款產品繼續(xù)暢銷。NVIDIA由此收獲了第一桶金。
就在NVIDIA奠定了發(fā)展基礎的時候,IT產業(yè)悄然發(fā)生了革命性變化。
科技發(fā)展的歷史已經(jīng)證明,每當大的變革來臨,往往伴隨著新的發(fā)展風口。此時,新生與死亡同樣迅速,端看你是在風口之上,還是在風口之下。
此時,英特爾推出了AGP接口來取代傳統(tǒng)的PCI接口,并支持3D加速顯卡;幾乎是同時,微軟Win 95推出支持3D程序應用接口——Direct3D。
就在大多數(shù)圖形芯片公司依舊在老路上全力奔跑(這樣的快跑則意味著更快速的死亡),還沒有覺察到風起于青萍之末的時候,而黃仁勛已經(jīng)敏銳地意識到,一股新的風潮就要來了,新的機會就在面前,誰能夠快速站在巨人的肩膀之上,誰就能更快地搶到成功的冠冕。
NVIDIA副總裁克里斯的一番話可以作為注腳。他說:“在1993年的時候,英偉達的芯片還沒有市場,但是我們預料到這股浪潮即將來到?!彼€舉了大自然風潮來襲的例子:“在每年特定的5個月內加州會舉辦沖浪比賽。當遠在太平洋另一端的日本有風浪的跡象出現(xiàn)時,加州的沖浪選手就蠢蠢欲動了,因為兩天之內風浪就會到達加州海岸。這跟當時我們決定創(chuàng)建芯片公司的情形是一樣的,我們是最先下水的沖浪選手。”
在開發(fā)NV3時,NVIDIA果斷選擇對接微軟的Direct3D和英特爾仍在試驗階段的AGP接口。在別人看來這是一場豪賭,因為NVIDIA投入自己的全部資金,但在黃仁勛看來,他是站在了風口之上。
方向確定之后,黃仁勛的專注力發(fā)揮出巨大的能量。NVIDIA產品的更新?lián)Q代速度明顯加快。此前是兩年,此時是不到一年,在1998年10月,NVIDIA發(fā)布了第四代產品——TNT。黃仁勛不再使用NV系列的名字,特意給這款產品取了一個更貼合他性格與黑色著裝的爆裂名字。TNT投放市場,果然如炸藥點燃,聲光乍現(xiàn),被業(yè)界稱為超級顯卡。如果說NV3與VOODOO還存在可比性,而TNT的性能已然超越3DFX公司同期推出的VOODOO2。
僅僅半年,3DFX還沒有回過神來,NVIDIA又推出了性能更為優(yōu)越的TNT2,生生將VOODOO系列顯卡甩在了身后,一舉奠定NVIDIA的領先位置。
此時的3DFX并沒有覺醒,就像NVIDIA在做第二代產品時一樣,仍然堅持自己的標準,不去支持行業(yè)領先的微軟與英特爾,產品無人問津,被新的市場風浪無情吞噬。2000年12月,3DFX以被NVIDIA收購收場。NVIDIA成為新一代顯卡之王。
上世紀90年代末,隨著計算機游戲、影音、視頻的多功能開發(fā),圖像處理任務在處理器中所占比重越來越大。黃仁勛意識到,是推出專門圖像處理器(GPU)來分擔CPU功能的時候了。
也許,他的心頭又燃起了一團火,那源自少年時代的一團火。當年,兄弟倆曾在游泳池水面布滿燃燒物,點燃之后隨即縱身跳進水池,那水火交融的刺激無法言說。黃仁勛是那種為了目標,奮不顧身的狂人。1999年8月,NVIDIA推出全球首款GPU——GeForce 256。像TNT一樣,GeForce 256摧毀了傳統(tǒng)圖像芯片的市場格局。
隨后,黃仁勛基于NVIDIA的經(jīng)驗,提出了令人震驚的黃氏定律:顯卡芯片的性能,每6個月可以提升一倍。這是對芯片市場著名摩爾定律的顛覆。摩爾定律認為,芯片處理能力每18個月增加一倍。多年以來,芯片制造商都是按照摩爾定律來制定研發(fā)規(guī)劃的。黃氏定律無疑打亂了整個計算機行業(yè)按部就班的發(fā)展路徑。這種近乎瘋狂的產品更新速度,讓那些墨守成規(guī)的廠商被迅速淘汰,NVIDIA則依仗自己的快速奔跑,繼續(xù)保持著自己行業(yè)領袖的地位。
就在1999年,NVIDIA在納斯達克上市。三年后,NVIDIA的芯片出貨量突破1億片,成為歷史上成長最快的芯片公司之一。
在此期間,NVIDIA因為沒有自己的CPU技術,必須依靠英特爾和AMD兩大巨頭的平臺,面臨著巨大的生存壓力。尤其是AMD對于NVIDIA的發(fā)展,處處掣肘,不斷打壓。AMD在收購ATI顯卡之后,更與NVIDIA形成了直接的競爭關系。英特爾也準備推出自己的集成顯卡,與NVIDIA展開競爭。2009年,英特爾公開宣布,其下一代CPU架構不再給NVIDIA技術授權。英特爾的這一殺招,直接迫使NVIDIA退出了芯片組業(yè)務。
專注和投入,使得NVIDIA始終處于領先位置,好萊塢使用NVIDIA芯片技術拍出《金剛》《蜘蛛俠》等特技大片,美國航空航天局則由NVIDIA協(xié)助完成火星探險任務。NVIDIA的應用市場,不僅沒有因為競爭夾擊而萎縮,反而日益擴大。
對此,黃仁勛口出狂言說,英特爾即使將圖像計算能力提高10倍,也無法與NVIDIA的產品相匹敵。對于AMD,他毫不留情地說,自己根本不關心AMD做什么的,因為自己與對方,一個是9,一個是0,沒有任何可比性。
但面臨競爭夾擊的NVIDIA,必須做出選擇:要么堅持做圖像芯片,要么像對手一樣沖進CPU市場,正面搏殺。以NVIDIA的技術實力,自己做CPU并非不可行。
盡管口無遮攔,但關鍵時刻,黃仁勛還是很清醒,絕不貿然進軍自己沒有技術積累的陌生領域:“我們的策略非常清晰,我再次重申,我們將永遠專注于圖像和并行計算技術。”他堅信,把所有的精力專注于做最少的事情,才能比對手做得更好。于是,NVIDIA投入巨資進行研發(fā),即使在2008年營收下降16%的困難情況下,繼續(xù)增加人財物投入。專注和投入,使得NVIDIA始終處于領先位置,好萊塢使用NVIDIA芯片技術拍出《金剛》《蜘蛛俠》等特技大片,美國航空航天局則由NVIDIA協(xié)助完成火星探險任務。NVIDIA的應用市場,不僅沒有因為競爭夾擊而萎縮,反而日益擴大。
正因青睞NVIDIA領先的技術能力,微軟在2001年推出Xbox時,決定采用NVIDIA芯片,協(xié)商的訂金是2億美元。但不久,微軟覺得NVIDIA報價太高,提出降價要求,NVIDIA不予同意。從微軟之后的動作來看,這是微軟采取的市場策略。微軟選擇的后續(xù)合作伙伴,正是NVIDIA的競爭對手ATI。
與此同時,英特爾也跟進微軟,減少與NVIDIA的合作,轉而支持ATI。
IT產業(yè)領先的兩大巨頭,同時出手,市場迅速做出反應,NVIDIA的股價從70美元一路下挫至7美元。
NVIDIA全力應對,先是攻克索尼PS游戲機市場,緊接著向微軟示好,開展價格談判,最終NVIDIA在價格上作出讓步,于2003年達成和解協(xié)議。
ATI就此得到喘息之機,隨后又被AMD收購。NVIDIA面臨的競爭壓力陡然增大,匆匆之中推出的GTX480、GTX590等顯卡,因為超頻溫度高于ATI卡兩倍,并多次發(fā)生自燃事故,飽受詬病。對于北京軟星科技(北軟)在測試之后指出NVIDIA卡在游戲中出現(xiàn)各種卡頓,甚至爆炸等問題,黃仁勛揚言要炸平北軟總部。
面對困局,NVIDIA不斷改進芯片架構。接連推出全新架構的Maxwell、Pascal等,來提高芯片能效比,最終超越對手AMD。
在過去的二十多年里,NVIDIA遇到過的競爭對手大大小小約有250家,除了3DFX、ATI等專業(yè)廠商,還包括IBM、惠普、松下等著名廠家。最終的結果是,大多數(shù)競爭對手被淘汰出局。
早在2008年,NVIDIA就發(fā)布了一款應用于智能手機的Tegra移動處理器,后來的競爭對手高通當時還是一家做基帶的廠商,另一個競爭對手MTK還只是一個仿造者。然而,跑在前面的NVIDIA在基帶和應用處理器的整合上稍有猶疑,市場上就涌現(xiàn)出一大批廠商,如展訊、聯(lián)芯、三星、高通等。NVIDIA果斷退出智能手機市場,劍走偏鋒轉而去做游戲設備和車載系統(tǒng),其核心是CUDA平臺——利用GPU進行通用并行計算的一種架構平臺。
CUDA的研發(fā)肇端于2004年,斯坦福大學博士Ian Buck進入NVIDIA實習的時候,提出了CUDA開發(fā)的理念。Buck曾參與一項涉及簡化利用GPU的眾多計算引擎過程的編程挑戰(zhàn)賽,并取得很好的成績,被NVIDIA招致麾下。
當時,黃仁勛拍板,通過一系列軟件開發(fā)和工作改進,讓GPU由單一的繪制圖像產品,升級為多任務解決平臺。
方案初定,前景美好,但投資成為最大的問題。當時,CUDA的研發(fā)成本估算高達5億美元。之所以有這么高的預算,是因為與傳統(tǒng)CPU的4、8和16個線程不同,GPU中的線程足有幾萬個。CUDA的核心設計理念就是發(fā)現(xiàn)可并行的線程,并為軟件開發(fā)提供便利性。5億美元的開發(fā)費用,相當于公司年收入30億美元的六分之一。黃仁勛后來也說:“此舉給公司帶來了極大的成本壓力?!睋?jù)NVIDIA披露,CUDA項目在將GPU轉變成更為通用的計算工具上的總支出接近100億美元。況且公司的核心業(yè)務是硬件,如今要開發(fā)的是一個軟件平臺,在那個時候難以讓人理解。
一開始,CUDA主要依賴編程人員發(fā)現(xiàn)代碼中可并行計算的部分,進展相當緩慢。而且編程人員必須熟悉特定的顯示芯片指令或是特殊的結構才能操作,這限制了可投入開發(fā)人員的數(shù)量。不久以后,NVIDIA將CUDA整合到消費級GPU和高端產品中,并開發(fā)出軟件輔助工具,其中包括支持標準的編程語言,如流行的C語言,不再是向圖像芯片發(fā)出專業(yè)指令的神秘工具。Buck認為,這一決定至關重要。它降低了門檻,只要是研究人員或者學生,都可以使用筆記本電腦或者臺式機,在實驗室或宿舍里進行軟件開發(fā)。同時,NVIDIA還與大學合作,開設專門的課程,推廣NVIDIA的最新編程技術。
由此,GPU進入研發(fā)迭代的快車道。
憑借CUDA項目開發(fā)出的芯片和軟件,NVIDIA逐步打造出一個廣受程序員和企業(yè)歡迎的開放性技術平臺。
在企業(yè)應用領域,德國商業(yè)軟件巨頭SAP利用CUDA來完成加速應付賬款流程以及匹配簡歷和空缺職位的任務。
CUDA還可以應用于氣候模擬、石油和天然氣勘探等領域。2012年,CUDA被應用于神經(jīng)網(wǎng)絡(深度學習所需的多層級軟件)之后,該技術進入了新的發(fā)展階段——人工智能(AI)。
以上諸多應用遠遠超過了黃仁勛當初的構想,關鍵的是,NVIDIA開始引領AI芯片市場。
目前,在CUDA平臺上,有來自全世界的超過50萬個開發(fā)者。其中既有大型跨國公司,也有很多初創(chuàng)公司。
2011年,黃仁勛預感人工智能將顛覆未來的諸多領域,他首先想到的是AI應用于汽車領域,并要求NVIDIA的所有工程師立刻領會并深度學習AI技術。
起初,NVIDIA的AI團隊只有數(shù)十人,半年后即激增至數(shù)百人,一年后更增加到上千人。到2017年,NVIDIA全面轉向了人工智能研究領域。
人工智能的基礎是海量運算。GPU運算速率一直在大幅度提升,對圖像解讀或語言翻譯等任務的準確度也不斷提升。
奧迪、特斯拉、豐田等企業(yè)均借助NVIDIA的AI專用芯片來研究無人駕駛,百度等公司的AI部門則借助NVIDIA來進行圖像和語音識別。
在黃仁勛看來,AI細分領域的專業(yè)化是未來的方向。例如,開車的AI不會洗盤子;會洗碗的AI知道如何改進洗碗機,但不能為地板吸塵;能吸塵的AI也不能幫我們閱讀郵件。分門別類的專業(yè)領域,需要并產生很多術業(yè)有專攻的AI。而所有這些術業(yè)有專攻的AI組合起來,將讓我們的工作生活更有效率。未來數(shù)十年,AI帶來的效率提升將是革命性的。
NVIDIA已經(jīng)并將繼續(xù)為這場效率革命打造底層AI計算的基石。2016年4月,NVIDIA在硅谷發(fā)布的首款基于Pascal架構的Tesla P100顯卡,集成了153億個晶體管。區(qū)區(qū)幾塊這種顯卡所提供的計算性能,已等同于幾百臺CPU服務器節(jié)點。在2016年,NVIDIA的股價長了近6倍,市值突破850億美元。即便是使用了谷歌TPU芯片的AlphaGo大火,也未對NVIDIA的股價上漲造成影響。
最近一年多以來,全球前十大超大規(guī)模企業(yè)數(shù)據(jù)中心,均采用了NVIDIA的GPU加速器。
2017年,NVIDIA推出功能更為強大的Volta。Volta芯片大幅度提升了運算能力,比自家的Pascal高出了近50倍。在AI急需的“inferencing”(推理)能力上,更有出色的表現(xiàn)。
“我們喜歡嘗試新東西,做沒有人做過的事情,做特別難做的事情?!秉S仁勛底氣十足。
2017年5月18日,AlphaGo大戰(zhàn)我國圍棋手柯潔前夕,谷歌推出TPU第二代。
5月25日,黃仁勛公開回應:“我們希望看到全球各地盡快采用AI。人們無需再投資建立一個TPU,我們有現(xiàn)成的,而且由世界上最優(yōu)秀的芯片設計師設計。”第二代TPU的浮點運算能力是每秒45萬億次,而英偉達之后推出的Volta,其浮點運算能力則達每秒120萬億次。
2017年NVIDIA開發(fā)者大會的數(shù)據(jù)顯示,全球有1300家使用NVIDIA平臺的創(chuàng)業(yè)公司,包括80家人工智能公司,50家虛擬現(xiàn)實公司,20家無人駕駛公司。
如今,快速奔跑的NVIDIA已經(jīng)與先行者谷歌、英特爾在AI芯片領域形成三足鼎立之勢。
孟醒 本刊副總編
責任編輯:孫俊杰
sunjunjie@ccidmedia.com