国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

挑戰(zhàn)壟斷者,擺脫英偉達

2023-11-27 16:08:01朱秋雨
南風(fēng)窗 2023年24期
關(guān)鍵詞:南風(fēng)窗華為芯片

朱秋雨

“這一定是很痛苦的……卻是不得不做的事?!痹?023中國計算機大會上,談及國產(chǎn)AI算力是否應(yīng)擺脫對國際的依賴,中科院計算所研究員崔慧敏說道。

在場的專家都點了頭。

那是在10月末的秋日沈陽。就在10天前,美國商務(wù)部工業(yè)和安全局(BIS)宣布重磅規(guī)定—對中國升級芯片出口管制。

規(guī)則制定者之一,美國商務(wù)部負責(zé)出口管理的助理部長西亞·肯德勒曾明確放話:“中國已投入大量資源開發(fā)超級計算的能力,力爭到2030年成為世界人工智能的領(lǐng)先者。”“我們的行動將保護美國的國家安全和外交政策利益,同時發(fā)出明確的信息,美國的技術(shù)領(lǐng)先地位關(guān)乎價值觀和創(chuàng)新。”

于是,10月17日,BIS的禁售令,將上述信號再度傳遞給中國。這則最嚴芯片出口令將于30天后生效,涵括三大方面:

一是將向中國禁售高性能芯片的標準改為“性能密度”。這一標準將更多AI芯片列入禁止出口名單中,英偉達、AMD、英特爾的產(chǎn)品均在列。

二是擴大了另外40多個國家出口的許可要求,以規(guī)避高性能AI芯片從海外其他地區(qū)輾轉(zhuǎn)到中國。

最后是將13家中國公司添加到“實體清單”。其中有兩家國產(chǎn)GPU企業(yè),壁仞科技、摩爾線程。進入實體清單的公司,未來不得在臺積電等先進工廠生產(chǎn)芯片。

一紙新規(guī)讓如火如荼的AI大模型元年氣氛愈發(fā)緊張。AI芯片領(lǐng)域,全球格局已經(jīng)是“一家獨大”?;ㄆ煅芯糠治鰩熢诮衲?月預(yù)計,英偉達占據(jù)了AI 芯片市場“至少 90%”的份額。

“脫鉤”風(fēng)云中,被“卡脖子”的國產(chǎn)芯片盡早突破英偉達,是現(xiàn)今中國業(yè)界的共識。用國家超算計天津中心首席科學(xué)家孟祥飛在上述大會的話說:“這不是一個可選項,而是一個必選項。”

問題是,有路嗎?怎么走?

被禁以后

無論從什么角度來說,英偉達高端芯片被禁,對多數(shù)中國AI創(chuàng)業(yè)者而言,都像被澆了一盆冷水。

“現(xiàn)在拿到卡了就是大爺?!?0月,一位不愿具名的清華大學(xué)計算機教授在私下交流時說道。

一切源于OpenAI率先開啟的“暴力美學(xué)”—大模型需要至少千億級參數(shù)歷練才能涌現(xiàn)智能。成本、計算速度和節(jié)能等因素,都催促著慢人一步的中國AI公司,使用最先進的AI芯片。

如果按照部署位置分類,基于深度學(xué)習(xí)的AI芯片大致有兩類:一是部署在邊緣側(cè)的芯片。也就是位于產(chǎn)品終端,比如,在一輛自動駕駛汽車里。

這些終端芯片基于訓(xùn)練好的模型進行實時推理、決策,強調(diào)實時性。騰訊、Meta推出的自研芯片,都是推理類型。

但當下更稀缺的,是技術(shù)門檻更高、部署在云端的芯片。它們的作用更基礎(chǔ)—訓(xùn)練大模型,以期AI涌現(xiàn)出類似大學(xué)生的智能。

上海通信技術(shù)中心前CEO、著有《AI芯片:前沿技術(shù)與創(chuàng)新未來》的張臣雄告訴南風(fēng)窗,自2014年深度學(xué)習(xí)算法在全球人工智能越加火熱以后,美國廠商英偉達推出的GPU獲得了巨大市場空間。

一切都是來自技術(shù)上的恰好契合:盡管深度學(xué)習(xí)算法擁有復(fù)雜的結(jié)構(gòu),但這些結(jié)構(gòu)大部分的運算和處理都與一個東西有關(guān)—矩陣乘法。

恰好,英偉達此前用于渲染圖像、游戲的GPU,尤其擅長矩陣和矩陣的乘法。張臣雄介紹,正是因為發(fā)現(xiàn)了GPU的這個特性,從此英偉達逐漸迭代產(chǎn)品,開發(fā)出多款適用于AI訓(xùn)練的芯片。

更重要的是,相比于通用型的芯片CPU(中央處理器),英偉達的GPU還完美契合了深度神經(jīng)網(wǎng)絡(luò)(DNN)并行計算的特性。不同于CPU按順序進行計算,GPU有著大量并行架構(gòu)的設(shè)計。這與DNN在訓(xùn)練和推理過程要進行大量獨立的、同時進行的矩陣乘法的操作不謀而合。

據(jù)南風(fēng)窗統(tǒng)計,截至2023年11月,明確對外稱有訓(xùn)練AI大模型能力的中國芯片公司在個位數(shù)。

也因此,基于深度神經(jīng)網(wǎng)絡(luò)的大模型,中國公司對GPU的需求達到了頂峰。上海某信息科技公司生態(tài)合作副總監(jiān)張迎告訴南風(fēng)窗,從2023年上半年開始,英偉達高性能GPU已經(jīng)在市面上極度短缺。他的公司早在6月訂購了十幾臺英偉達H800。

“稀缺啊,半年了到現(xiàn)在還沒拿到貨?!睆堄f。

緊張的AI芯片供應(yīng)以2022年為分界線。為了 “遏制中國實現(xiàn)在人工智能和先進計算領(lǐng)域的突破”,美國政府明確實行全面的芯片限制。2022年8月9日,美國總統(tǒng)拜登簽署《2022年芯片與科學(xué)法案》,要求接受補貼的美國廠商未來10年不得擴大在中國大陸的投資。

緊接著,8月31日,英偉達A100和H100、AMD MI250等AI芯片被禁銷往中國。

一年后,10月17日,美國商務(wù)部再度頒布最嚴出口令。其中,市場主流的7種英偉達AI芯片,包括特供給中國的A800、H800,都將在1個月后禁止出口中國。

禁運的AI芯片讓大模型創(chuàng)業(yè)大軍立刻感到“捉襟見肘”?!罢闵套C券”曾估算,長期來看,考慮國內(nèi)5家頭部大模型廠商對標GPT-4模型的訓(xùn)練需求,還額外需要13705臺A100、A800服務(wù)器。也就是對應(yīng)近11萬張GPU。

11月7日,在北京提供AI算力的云廠商楊加在行業(yè)群興奮宣布,手上有17臺A100服務(wù)器出售。“現(xiàn)貨。”他強調(diào)。

這個在去年被美國列為禁止向中國出口的芯片,過往每張標價約1萬美元(合計7萬元)。中國市面上現(xiàn)在流行的A100,多為去年禁令前囤積,以非正規(guī)渠道流通。

如今,在楊加這里,包含8張顯卡、散熱器等整機服務(wù)器部署下來,售價高達190萬元。至于更高性能的H100,整機價格已經(jīng)達到270萬-330萬區(qū)間。

“太夸張了?!睅讉€創(chuàng)業(yè)者聽到報價后感嘆。

追趕的玩家

大洋彼岸主動發(fā)起的“脫鉤”,讓中國AI企業(yè)和機構(gòu)不得不面對赤裸的現(xiàn)實。抓緊提出以國產(chǎn)芯片和硬件為主的替代方案,成為唯一的選項。

事實上,近年我國的AI芯片賽道并不冷門。除了老牌的A股上市公司,比如做AI推理芯片的寒武紀,服務(wù)于軍事用途起家的景嘉微以外,興起的AI芯片公司還有兩類。一類是以華為、百度、騰訊為代表的大廠隊,還有一類是在過去6年加入的創(chuàng)業(yè)公司。

最新被BIS列入實體清單的中國公司摩爾線程、壁仞科技,便是兩家創(chuàng)立于2019年后的年輕公司。巧合的是,兩家公司創(chuàng)始人都有在美國芯片公司工作的背景,現(xiàn)在都將野心瞄準了制造高端GPU。

其中,摩爾線程的速度為外界稱奇。成立僅3年的時間內(nèi),該公司宣布量產(chǎn)了蘇堤、春曉、曲院三顆全功能GPU芯片。它同時發(fā)布了MUSA元計算統(tǒng)一系統(tǒng)架構(gòu),包括統(tǒng)一的編程模型、軟件運行庫、指令集架構(gòu)和芯片架構(gòu),在AI計算領(lǐng)域表現(xiàn)突出。

百度孵化的昆侖芯也提出了一個不同于GPU、CPU的全新架構(gòu)—XPU。據(jù)介紹,配備XPU的昆侖芯二代專為當前的AI場景設(shè)計。它不僅與文心一言及其他大模型適配,且有更多的AI加速單元,為大模型時代“高性價比的計算力產(chǎn)品”。

但這是國產(chǎn)玩家的少數(shù)。

據(jù)南風(fēng)窗統(tǒng)計,截至2023年11月,明確對外稱有訓(xùn)練AI大模型能力的中國芯片公司在個位數(shù)。其中包括大廠隊的華為昇騰,百度昆侖芯,以及創(chuàng)業(yè)公司天數(shù)智芯、燧原、摩爾線程、壁仞科技。

更多數(shù)的AI芯片廠家,例如騰訊、寒武紀、地平線、沐曦、登臨等,選擇入局技術(shù)門檻更低的AI推理芯片。

摩爾線程CEO張建中曾在受訪時解釋,造GPU芯片的難度很大,因為這是一個由短板決定的創(chuàng)新過程。

人才、資金、技術(shù)、產(chǎn)業(yè)鏈環(huán)環(huán)相扣,缺一不可,“就像打游戲打通關(guān)一樣”。

只是,即使暫時通關(guān)成為賽道的“王者”,還有更嚴峻的現(xiàn)實擺在面前。造出國產(chǎn)GPU是一回事,怎么讓企業(yè)替換已經(jīng)在用的英偉達芯片,又是另一回事。

一位南京某云服務(wù)廠商告訴南風(fēng)窗,為了鼓勵使用國產(chǎn)芯片,許多由政府組建的超算中心會被要求購買一定份額的國產(chǎn)芯片?!半m然買了國產(chǎn),但用終歸還是英偉達好用?!?/p>

而據(jù)《財經(jīng)十一人》報道,2023年6月,部分地方政府出資建設(shè)“數(shù)字經(jīng)濟算力中心”時,曾向承建方提議,是否能采購一定數(shù)量國產(chǎn)AI芯片。但這家作為承建方的國資企業(yè)拒絕了,理由是,國產(chǎn)AI芯片相比英偉達的性能不足。

張臣雄對南風(fēng)窗分析,造出訓(xùn)練AI的GPU之所以難度更高,最難的還是GPU集群之中的通信和控制。

“把這么多的芯片連起來并行計算,那么如果沒有很好的設(shè)計,容易出現(xiàn)很多問題?!睆埑夹壅f。

讓國產(chǎn)芯片在現(xiàn)實場景中跑起來后,將為后續(xù)迭代、完善技術(shù)提供豐富原料。此后,才會逐漸出現(xiàn)技術(shù)加速迭代的正向循環(huán)。

這也是很多國內(nèi)AI大模型企業(yè)仍不敢大量使用國產(chǎn)GPU的一大原因。穩(wěn)健、不出錯,看上去是一個基本的要求,背后卻需要成熟的軟硬件配套和反復(fù)迭代的技術(shù)。在創(chuàng)業(yè)進入“百模大戰(zhàn)”的極度緊張之際,有條件的公司都不希望將過多時間花在出錯和調(diào)試硬件問題上。

華為昇思MindSpore系統(tǒng)架構(gòu)師蘇騰博士也在公開場合透露,當下訓(xùn)練GPU集群的一大關(guān)鍵—確保高度可用。

“大家有參與過訓(xùn)練大模型的話,都有體會,每個星期或者每隔兩三天,集群總要崩潰一次?!碧K騰說。因此,他的工作重點經(jīng)常圍繞著提高大模型訓(xùn)練過程的“可靠性”,以及“快速地將故障恢復(fù)”。

突圍護城河之路

好消息是,在使用國產(chǎn)硬件成為必選項的當下,有中國公司跑出來了。

華為昇騰910系列是其中被認為性能最為全面,同時使用程度也最高的國產(chǎn)GPU??拼笥嶏w創(chuàng)始人劉慶峰曾在8月透露,訊飛大模型接上了國產(chǎn)硬件。

“我特別高興地告訴大家,華為的GPU能力現(xiàn)在已經(jīng)跟英偉達一樣,”劉慶峰說,“任正非高度重視,華為的三位董事到科大訊飛專班工作,現(xiàn)在已經(jīng)把它做到了能對標英偉達的A100?!?/p>

11月7日,據(jù)路透社爆料,早在美國宣布出口禁令前,百度就在8月訂購了總價值4.5億元的共計1600個華為昇騰910B。

這顯然是國產(chǎn)芯片的一大勝利。

讓國產(chǎn)芯片在現(xiàn)實場景中跑起來后,將為后續(xù)迭代、完善技術(shù)提供豐富原料。此后,才會逐漸出現(xiàn)技術(shù)加速迭代的正向循環(huán)。

不過,業(yè)內(nèi)人士都很清楚,這只是國產(chǎn)GPU進展的第一步。

這時維持審慎,是因為芯片的能力不止來自硬件,同時是軟件能力的體現(xiàn)。

英偉達過往20年的領(lǐng)先就在于此—這不是單純的硬件公司,而是由軟件定義的巨頭。

回到1993年,英偉達成立的1990年代,市面上有70多家做圖形渲染的公司。

轉(zhuǎn)機直到2006年出現(xiàn)。英偉達此后開發(fā)了一個名為CUDA的平臺。這個平臺首先由3000多個工程師合力編寫,接著,越來越多人加入。2023年,全球超過400萬開發(fā)者在CUDA生態(tài)里。

張臣雄對南風(fēng)窗解釋,CUDA最大的作用,是為GPU提供了整套編程模型和編程語言。

更通俗地說,CUDA相當于一個編譯器?!俺绦騿T編了很多(軟件)程序,通過CUDA,能把它編譯成機器最底層的硬件語言,相當于中間翻譯?!?/p>

有了這個編譯器和編程語言,軟件工程師能高效地調(diào)試硬件,而不用重新從底層硬件進行更新,大大提升了效率。

CUDA的發(fā)明,讓英偉達驗證了俗語—“早起的鳥兒有蟲吃”。目前,世界上主流的深度學(xué)習(xí)框架都只與CUDA適配。就像蘋果系統(tǒng)內(nèi)部的閉環(huán)生態(tài),贏家通吃的局面也在AI芯片領(lǐng)域存在。

這也是當下中國AI芯片公司面臨的艱難抉擇:很多企業(yè)的代碼都是基于英偉達推出的運算平臺CUDA編程而寫的。如果要與英偉達完全脫鉤,換一個新的生態(tài),就意味著要做大量代碼性遷移及改變,工程量巨大得難以想象。

逐漸打破被壟斷的生態(tài),成為國產(chǎn)芯片公司在日益“脫鉤”的背景下努力的方向。

現(xiàn)在正處于國產(chǎn)芯片“被迫”獨立自主的關(guān)鍵期,這次,對我國而言更重要的是,走出長期的思維誤區(qū)?!耙欢ㄒ獢[脫follow(跟隨)的習(xí)慣?!?/blockquote>

2023年,以華為與百度為首的大廠,相比于推薦自己的底座大模型,都將更多的力氣放在了建立開發(fā)者生態(tài)之中。

蘇騰也在上述場合中提到了這一點。比起硬件上的發(fā)明,對華為來說,更難的在于迅速建立起生態(tài)。

“現(xiàn)在國際上很多新的算法和優(yōu)化手段,總是在英偉達的GPU和CUDA上率先出現(xiàn)。”蘇騰透露。華為也會將CUDA的創(chuàng)新在昇騰的Mindspore上復(fù)現(xiàn),并基于此做一些創(chuàng)新。

但是,他坦言,“我們自己所做的創(chuàng)新,相對于英偉達的整個生態(tài)來說,肯定是九牛一毛?!?/p>

這背后,關(guān)乎發(fā)展時間,關(guān)乎人才,也關(guān)乎創(chuàng)新的環(huán)境。

張臣雄分析,雖然起步慢,但中國的AI芯片“現(xiàn)在搞也來得及”。主要原因在于中國背靠巨大的市場。

“可以合力建立一個開放的生態(tài)系統(tǒng),有很多家企業(yè)合起來做,使用開源的架構(gòu)?!?/p>

他同時認為,現(xiàn)在正處于國產(chǎn)芯片“被迫”獨立自主的關(guān)鍵期,這次,對我國而言更重要的是,走出長期的思維誤區(qū)。

“一定要擺脫follow(跟隨)的習(xí)慣?!?/p>

他告訴南風(fēng)窗,從發(fā)展歷史回看,英偉達的GPU一開始并非用于AI,而是用于圖形、游戲渲染。也就是說,制造AI芯片,遠不止做出GPU這一個解法。

模仿英偉達的產(chǎn)品未必等于可行,重要的是在研制AI芯片過程中找到前進的目標—滿足深度學(xué)習(xí)網(wǎng)絡(luò)的矩陣乘法和并行運算的需求。

好消息是,回溯歷史的芯片之戰(zhàn),還有一個共同點:創(chuàng)新出現(xiàn)的一個重要動力,在于挑戰(zhàn)壟斷者。

處于下位者的公司,往往有強動力奮起直追,改變壟斷者控制的游戲規(guī)則。這是ARM、AMD、蘋果等等巨頭在研制芯片的故事。

這注定是充滿痛苦且有曲折的路。但一切正如美國經(jīng)濟歷史學(xué)家克里斯·米勒在《芯片戰(zhàn)爭》所描述的那樣:“戰(zhàn)爭會改變我們,不要辜負這場戰(zhàn)爭?!?/p>

(文中楊加為化名)

猜你喜歡
南風(fēng)窗華為芯片
《南風(fēng)窗》新媒體營收激增原因分析
傳媒(2023年8期)2023-05-20 02:06:12
現(xiàn)在的余華為誰寫作?
作品(2021年8期)2021-09-08 18:04:05
賽力斯華為智選SF5
汽車觀察(2021年11期)2021-04-24 18:04:58
華為沒有成功,只是在成長
華為
能源(2019年12期)2019-02-11 07:11:58
芯片測試
多通道采樣芯片ADS8556在光伏并網(wǎng)中的應(yīng)用
74HC164芯片的應(yīng)用
河南科技(2014年10期)2014-02-27 14:09:18
《南風(fēng)窗》 強化教育公平
《南風(fēng)窗》等
南乐县| 柯坪县| 青岛市| 禹州市| 阿拉善右旗| 丰城市| 广西| 安福县| 峨边| 土默特左旗| 安龙县| 忻州市| 蓝山县| 永川市| 定西市| 青铜峡市| 武乡县| 建阳市| 全椒县| 衡水市| 五原县| 海林市| 扬州市| 博客| 绥阳县| 淅川县| 盐城市| 西青区| 高唐县| 佳木斯市| 怀柔区| 若尔盖县| 文安县| 颍上县| 洛宁县| 谢通门县| 南汇区| 仙桃市| 湖北省| 滨州市| 枣庄市|