国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

挖開兔子洞后,世界充滿中國(guó)算法

2025-02-17 00:00:00朱秋雨
南風(fēng)窗 2025年4期
關(guān)鍵詞:算法用戶

2025年1月15日,北京街頭的小紅書廣告裝置

春節(jié)前后,中國(guó)“80后”梁文鋒旗下的產(chǎn)品DeepSeek成為網(wǎng)絡(luò)焦點(diǎn)。他主導(dǎo)的這款帶著藍(lán)色小鯨魚圖標(biāo)的AI應(yīng)用,在1月超越了ChatGPT,下載量登頂美國(guó)區(qū)等全球多個(gè)蘋果應(yīng)用商城的榜首。

稍早前,中國(guó)人的社區(qū)REDnote(小紅書)迎來了不少TikTok用戶。全球網(wǎng)友在這個(gè)以中文為主的社交APP上互動(dòng),就不同國(guó)度里的工作、生活、醫(yī)療等一一“對(duì)賬”。

像愛麗絲夢(mèng)游記里一樣,挖開兔子洞以后,人們驚喜地發(fā)現(xiàn),世界可以如此平靜與美好?!叭绻娴挠胁豢煽沽Φ囊蛩貙?dǎo)致我們的聯(lián)絡(luò)再次斷開,我們也一定要記住此刻對(duì)彼此的愛與信任?!币粋€(gè)中英雙語的小紅書帖子獲得高贊。

2025年,來自中國(guó)的“神秘力量”陸續(xù)在全球涌現(xiàn)。背后是中國(guó)算法的一路高歌。算法(Algorithm),這個(gè)最早由波斯數(shù)學(xué)家的名字衍生的詞,指解決(數(shù)學(xué))問題的一種抽象方法。在計(jì)算機(jī)領(lǐng)域,有了算法,計(jì)算機(jī)才可以自動(dòng)執(zhí)行大量指令,進(jìn)行大量計(jì)算,精準(zhǔn)推薦,涌現(xiàn)智能。

人們想知道,中國(guó)應(yīng)用勢(shì)如破竹背后,究竟有什么樣的算法以及發(fā)展路徑?

推薦時(shí)代

1940年代,費(fèi)城,美國(guó)。

在美國(guó)賓夕法尼亞大學(xué)摩爾學(xué)院地下室,一排排從地板延伸到天花板的柜子里,裝載著約17468個(gè)電子管。它們看上去毫無章法,由散落四處的電纜連接。實(shí)際上,一場(chǎng)史無前例的軍事計(jì)算正在進(jìn)行。

1年后,1946年,全世界第一臺(tái)計(jì)算機(jī)、重達(dá)30噸的ENIAC第一次在公眾面前亮相。為了讓在場(chǎng)的記者了解其速率,現(xiàn)場(chǎng)主燈被關(guān)掉了。閃爍著亮光的計(jì)算機(jī),用20秒算出了炮彈飛到目標(biāo)地的軌跡,這比炮彈飛行速度還快。

相比之下,人工計(jì)算彈道軌跡,得耗時(shí)3天。

這是人類第一次了解計(jì)算機(jī)算法的威力。當(dāng)時(shí)的媒體感嘆稱:“‘電子大腦’在2小時(shí)內(nèi),計(jì)算完本需要100年才能算完的問題。”但這個(gè)創(chuàng)世紀(jì)的發(fā)明由美國(guó)人發(fā)明、美國(guó)人主導(dǎo),主宰了接下來半個(gè)世紀(jì)的全球硬科技。而大洋彼岸的中國(guó),直至1958年,才根據(jù)蘇聯(lián)提供的M-3小型機(jī)技術(shù)資料,制造出第一臺(tái)國(guó)產(chǎn)計(jì)算機(jī)—103機(jī)。

了解這樣的起點(diǎn),也許就能理解外國(guó)友人、科技從業(yè)者,為什么對(duì)如今中國(guó)應(yīng)用火遍全球充滿著不解?!爸袊?guó)人已經(jīng)找到了吸引人類注意力的最佳計(jì)算機(jī)算法,這是我們應(yīng)該好好學(xué)習(xí)的?!泵绹?guó)科技人士在社交媒體上感嘆。

中美互聯(lián)網(wǎng)巨頭正式爭(zhēng)奪全球注意力,始于21世紀(jì)的第二個(gè)十年。2012年春,福建寧德人、連續(xù)創(chuàng)業(yè)者張一鳴在北京知春路的咖啡廳,在幾張餐巾紙上寫下了他的暢想。憑借紙上的移動(dòng)互聯(lián)網(wǎng)藍(lán)圖,他獲得了投資人的青睞,給予其200萬的啟動(dòng)資金。

誰也不曾預(yù)料到,一個(gè)由中國(guó)定義的“算法”悄然誕生。

在這張“餐巾紙”上,張一鳴提出,要解決人們?cè)谝苿?dòng)互聯(lián)網(wǎng)上獲取信息的痛點(diǎn)—不夠高效。傳統(tǒng)門戶網(wǎng)站即使再快,輸出的內(nèi)容依然是中心化的,無法高效地滿足每一個(gè)用戶的需求。

而他希望,用戶一打開手機(jī),就能獲得個(gè)性化的、獨(dú)屬于自己的內(nèi)容。事實(shí)上,這個(gè)想法并不算新穎,早在2006年許,扎克伯格就在臉書推出了信息流(NewsFeed)功能。他們根據(jù)用戶的喜好在主頁(yè)推薦和排序內(nèi)容,已經(jīng)初獲成效。

但張一鳴卻是將個(gè)性化信息推薦發(fā)揮到極致的人。有人用16字總結(jié)字節(jié)跳動(dòng)起家的秘訣,“遍地撒網(wǎng),確定爆款,獲取流量,集聚平臺(tái)”。圍繞著推薦算法,字節(jié)跳動(dòng)早期推出了數(shù)十個(gè)手機(jī)APP,看起來有所聯(lián)系,卻又各自不同。它們以各種渠道,大量出現(xiàn)在潛在用戶的面前。

經(jīng)過一番“田忌賽馬”后,2012年暑假,張一鳴把發(fā)展重心放在了新聞資訊上—這促成了“今日頭條”的迅速崛起。

接下來的故事大多數(shù)人都有印象,今日頭條在2016年日活量達(dá)到了驚人的6000萬,成功超越四大門戶網(wǎng)站。抖音也在這一年問世,接著勢(shì)不可擋地成為中國(guó)短視頻巨頭。

從這時(shí)開始,全球的互聯(lián)網(wǎng)從業(yè)者都意識(shí)到,由今日頭條開創(chuàng)的推薦算法,正在改變世界。曾任Uber和Netflix產(chǎn)品負(fù)責(zé)人的尼爾·亨特在論文中提到,算法推薦系統(tǒng)讓Netflix每年省下超過10億美元的費(fèi)用。80%的奈飛用戶都會(huì)在“推薦列表”里觀看視頻。

張一鳴的推薦算法,區(qū)別于很多先前算法,滿足了用戶自己都不清楚的需求。

過去,以微博、臉書、微信為代表的社交媒體,主要依賴熟人網(wǎng)絡(luò)以及考驗(yàn)忠誠(chéng)度的訂閱模式。但今日頭條和抖音開創(chuàng)的推薦算法時(shí)代,建立在預(yù)測(cè)用戶需求的前提上。在這類APP上,互關(guān)的好友不再是用戶停留的重點(diǎn),算法的“為你推薦”才是留住用戶的關(guān)鍵。

今日頭條資深算法架構(gòu)師曹歡歡,曾公布其算法原理。所謂的推薦系統(tǒng),形象地說,“實(shí)際上是擬合一個(gè)用戶對(duì)內(nèi)容滿意度的函數(shù)”。本質(zhì)上,現(xiàn)在的算法和1940年代的超大計(jì)算機(jī)沒什么不同,都是為了解決一個(gè)數(shù)學(xué)函數(shù)的問題而生。

但今日頭條的“函數(shù)”顯然復(fù)雜、龐大得多。曹歡歡介紹:“這個(gè)函數(shù)需要輸入三個(gè)維度的變量。第一個(gè)維度是內(nèi)容。第二個(gè)維度是用戶特征,包括用戶的興趣標(biāo)簽,職業(yè)、年齡、性別,以及各類模型發(fā)掘的隱式用戶興趣等。”

第三個(gè)維度是環(huán)境?!斑@是移動(dòng)互聯(lián)網(wǎng)時(shí)代推薦的特點(diǎn),用戶隨時(shí)隨地移動(dòng),在工作場(chǎng)合、通勤、旅游等不同場(chǎng)景,信息偏好有所偏移?!?/p>

結(jié)合三方面的維度,模型會(huì)給出一個(gè)預(yù)估,即用戶對(duì)哪類內(nèi)容可能感興趣。與此同時(shí),算法系統(tǒng)還會(huì)實(shí)時(shí)處理樣本數(shù)據(jù),包括用戶點(diǎn)擊、展現(xiàn)、收藏、分享等動(dòng)作,來實(shí)現(xiàn)對(duì)用戶的精準(zhǔn)推薦。

“推薦系統(tǒng)比你媽更了解你?!狈N種因素背后,各個(gè)推薦算法都在追求同一個(gè)目標(biāo):幫用戶發(fā)現(xiàn)自己都未察覺的感興趣內(nèi)容,讓他們的注意力留得越久越好。

深度學(xué)習(xí)時(shí)代

1950年代,達(dá)特茅斯,美國(guó)。

有了算法的計(jì)算機(jī)毋庸置疑地精通數(shù)學(xué)與計(jì)算,但人類早已不滿足于此。上世紀(jì)50年代,人工智能(AI)的概念由美國(guó)數(shù)學(xué)教授麥肯錫在達(dá)特茅斯會(huì)議上率先提出。意思是,萬能的計(jì)算機(jī),也許可以擁有像人一樣的智能。

至于什么是智能,多年來學(xué)術(shù)界紛爭(zhēng)不斷。人工智能先驅(qū)艾倫·圖靈的說法很有代表性。他說:“最初的那個(gè)問題—機(jī)器會(huì)思考嗎?我認(rèn)為它太沒意義了。”對(duì)于圖靈來說,如果機(jī)器的行為與人類已經(jīng)無法進(jìn)行區(qū)分,無論機(jī)器是否像人般思考,我們已經(jīng)可以得出結(jié)論—機(jī)器能思考。

21世紀(jì)以后,有了算法的加持,擁有學(xué)習(xí)能力的計(jì)算機(jī)早已通過了“圖靈測(cè)試”。在自動(dòng)駕駛、人臉識(shí)別、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、藥物設(shè)計(jì)等領(lǐng)域,AI經(jīng)常擁有比人類更高一籌的能力與效率。

首先掀起第四次AI革命的,是大洋另一頭的科學(xué)家。2012年,加拿大籍教授杰弗里·辛頓(2024年諾貝爾物理學(xué)獎(jiǎng)得主)和學(xué)生伊利亞(Ilya Sutskever,前OpenAI首席科學(xué)家)和亞歷克斯(Alex Krizhevsky)組成團(tuán)隊(duì),設(shè)計(jì)了名為“AlexNet”的卷積深度網(wǎng)絡(luò)程序。他們?cè)O(shè)計(jì)的AI系統(tǒng),以最低的誤差,在華裔科學(xué)家李飛飛舉辦的ImageNet圖像識(shí)別競(jìng)賽中奪冠。

三人身價(jià)隨即水漲船高,導(dǎo)師辛頓收到了來自百度、谷歌、微軟以及DeepMind等巨頭的橄欖枝。最重要的是,他們?cè)诙潭處啄陼r(shí)間,打敗了主宰過去半個(gè)世紀(jì)的模式識(shí)別研究,在全球掀起了深度學(xué)習(xí)的海嘯。

彼時(shí),中國(guó)的移動(dòng)互聯(lián)網(wǎng)正在興起,中國(guó)進(jìn)入4G時(shí)代。2013年,中國(guó)搜索引擎巨頭百度想挖辛頓無果,于是率先在國(guó)內(nèi)建立了深度學(xué)習(xí)研究院和自動(dòng)駕駛研究院。兩個(gè)研究院為中國(guó)業(yè)界培養(yǎng)了大批AI人才。后者更被外界稱為,中國(guó)自動(dòng)駕駛界的“黃埔軍?!?。

DeepSeek以不可思議的低成本擁有了世界頂尖水平的人工智能

主導(dǎo)百度參與辛頓競(jìng)拍的負(fù)責(zé)人、現(xiàn)自動(dòng)駕駛企業(yè)“地平線”的創(chuàng)始人余凱回憶:“盡管(百度)競(jìng)拍(辛頓)失敗,但我還是很開心的。我想我的目的也達(dá)到了,因?yàn)槔顝┖暧H眼見證了國(guó)際巨頭不惜花費(fèi)巨資來投資深度學(xué)習(xí)研發(fā),這讓他下定決心自己把深度學(xué)習(xí)做起來?!?/p>

4年后,阿里巴巴創(chuàng)始人馬云也宣布成立科學(xué)研究機(jī)構(gòu)“達(dá)摩院”,立下目標(biāo)—“三年投入1000億元”,用于機(jī)器學(xué)習(xí)、自然語言處理等多個(gè)前沿AI領(lǐng)域。同一時(shí)期,字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室、騰訊AI Lab等相繼成立。

這些不缺資金的互聯(lián)網(wǎng)巨頭,擁有海量數(shù)據(jù)以及國(guó)際化視野與人才團(tuán)隊(duì),同時(shí)有搜索、語音、電商等數(shù)字化業(yè)務(wù)與數(shù)據(jù),擁抱深度學(xué)習(xí)算法成為了必然。以BAT等互聯(lián)網(wǎng)大廠為首的大筆投入,加上各類高等院校的科研研究,合力推動(dòng)了中國(guó)AI這些年的飛速發(fā)展。

只是,相比于起步很早、資金和資源高度充裕的美國(guó)硅谷,中國(guó)發(fā)展AI始終面臨內(nèi)部資源有限和外部環(huán)境惡劣的困局。所謂的深度學(xué)習(xí),是受到人腦神經(jīng)系統(tǒng)的啟發(fā),通過算法建立更深層次的網(wǎng)絡(luò),讓機(jī)器擁有學(xué)習(xí)的能力。這依賴大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,也非??简?yàn)計(jì)算硬件并行計(jì)算的算力。

但在2022年10月,美國(guó)政府首次實(shí)施了先進(jìn)半導(dǎo)體向中國(guó)出口的限制措施,禁止英偉達(dá)向中國(guó)出售A100和H100等高性能AI芯片。

2025年1月13日,美國(guó)商務(wù)部發(fā)布新規(guī),將AI芯片出口限制范圍從中國(guó)擴(kuò)展至全球。在這份霸道的、高傲的禁售榜單中,中國(guó)被其列為高風(fēng)險(xiǎn)國(guó)家,無法通過任何正式渠道進(jìn)口英偉達(dá)AI芯片。

從元器件、光刻機(jī)到AI芯片,來自全球霸主的封鎖措施已經(jīng)全面升級(jí)。但此時(shí),美國(guó)也許也沒預(yù)料到,中國(guó)的科技團(tuán)隊(duì)和工程師,正以無法量化的努力,用精妙的算法與工程設(shè)計(jì),實(shí)現(xiàn)了后來者的超越。

中國(guó)算法時(shí)代

杭州,中國(guó)。

2025年1月20日,正值特朗普就職典禮前后,成立2年多的中國(guó)AI公司DeepSeek(深度求索)引發(fā)了中美科技圈人士的持續(xù)討論。這個(gè)堅(jiān)持開源、背后是一家量化金融公司的AI小廠,在1月20日發(fā)布了推理大模型DeepSeek-R1。

Appfigures的數(shù)據(jù)顯示,DeepSeek在1月26日升至蘋果美國(guó)區(qū)應(yīng)用商店的榜首,此后在全球140個(gè)地區(qū)名列前茅。在發(fā)布后的18天內(nèi),其全球下載量達(dá)到1600萬次,幾乎是ChatGPT發(fā)布18天時(shí)的兩倍。

令眾人驚嘆的,不止是中國(guó)AI超絕的效果,而是DeepSeek以不可思議的低成本擁有了世界頂尖水平的智能。根據(jù)創(chuàng)始團(tuán)隊(duì)的披露,訓(xùn)練DeepSeek-R1背后的大模型—DeepSeek-V3,共計(jì)耗費(fèi)557.6萬美元,涉及2048張H100的GPU集群。有專業(yè)人員指出,同等水平之下,世界AI大廠至少要用1.6萬張以上的GPU并行訓(xùn)練。

1月20日,同樣年輕的北京AI公司“月之暗面”,發(fā)布了Kimi k1.5多模態(tài)思考模型。該模型在數(shù)學(xué)、編程和通用推理領(lǐng)域,趕超OpenAI新發(fā)布的o1,還能處理文本和視覺等多模態(tài)數(shù)據(jù),支持跨模態(tài)推理任務(wù)。這一新模型的發(fā)布,再度讓中國(guó)年輕AI公司驚艷世界。

AI圈此前的生態(tài),是完全由美國(guó)人定義的。近年流行的AI大模型,首先是由8位谷歌工程師提出Transformer架構(gòu)引發(fā)的創(chuàng)新;2022年OpenAI發(fā)布的ChatGPT,向世人證明AI模型大的重要性—參數(shù)越大,計(jì)算機(jī)處理復(fù)雜問題的能力越好,越可能涌現(xiàn)智能。

而要想在AI圈不可戰(zhàn)勝,OpenAI首先背靠微軟,擁有無盡的云計(jì)算資源。他們也很早便是英偉達(dá)的合作伙伴,訓(xùn)練AI的芯片和算力因此源源不斷。先發(fā)優(yōu)勢(shì)一旦形成,與之合作的公司也紛至沓來,形成了美國(guó)主導(dǎo)的全球AI信仰。

面對(duì)各方領(lǐng)先的對(duì)手,中國(guó)公司只能另辟蹊徑。以DeepSeek為例,無論是其堅(jiān)持的技術(shù)理想,還是“多token預(yù)測(cè)”(Multi-Token Prediction, MTP)、混合專家模型(MoE)架構(gòu)的創(chuàng)新,都在窮盡各種方式,證明此前美國(guó)人定義的AI也可能是低效的。大模型不一定要比大、比量,還有更多來自算法、工程上的優(yōu)化與創(chuàng)新,從而以小成本實(shí)現(xiàn)大理想。

中國(guó)AI應(yīng)用的出圈說明,相比于巨無霸式的投資,看不見的算法和工程,也可以起重要作用。美國(guó)AI知名學(xué)者吳恩達(dá)發(fā)文感慨:“2022年11月推出ChatGPT時(shí),美國(guó)在生成式AI方面遠(yuǎn)遠(yuǎn)領(lǐng)先于中國(guó)。我一直聽到美國(guó)和中國(guó)的朋友都說,他們認(rèn)為中國(guó)落后了。但實(shí)際上,這種差距在過去兩年里迅速縮小了?!?/p>

至于為什么是中國(guó)公司取得了這一進(jìn)步,硅谷AI公司Perplexity的CEO斯里尼瓦斯提供了一個(gè)較符合現(xiàn)狀的解釋。他說:“需求是發(fā)明之母。因?yàn)镈eepSeek必須找到解決辦法,最終他們創(chuàng)造出了更高效的技術(shù)?!?/p>

始終在夾縫中突圍的中國(guó)科技公司,正是從中國(guó)14億用戶的市場(chǎng)中孕育出生命力和創(chuàng)新力。要想在競(jìng)爭(zhēng)高度激烈的市場(chǎng)中存活,中國(guó)公司學(xué)會(huì)了將需求放在第一位,尤其擅長(zhǎng)從惡劣的外部環(huán)境以及激烈的競(jìng)爭(zhēng)中,做出最接地氣的、滿足市場(chǎng)需求的產(chǎn)品。

而共享著相同文化和語言的十多億中國(guó)用戶,深度參與著中國(guó)互聯(lián)網(wǎng)與智能化的進(jìn)展。他們將個(gè)性化數(shù)據(jù)給了互聯(lián)網(wǎng)巨頭,在豐富的應(yīng)用場(chǎng)景中對(duì)算法和產(chǎn)品積極反饋,使得中國(guó)算法在反復(fù)迭代和優(yōu)化中,實(shí)現(xiàn)了在世界的領(lǐng)先。

在邁向中國(guó)特色社會(huì)主義現(xiàn)代化的進(jìn)程中,我國(guó)長(zhǎng)期被認(rèn)為擅長(zhǎng)從1到多的創(chuàng)新。但2025年,中國(guó)公司以算法和卓越產(chǎn)品告訴世界,勤奮的中國(guó)人不僅擅長(zhǎng)模仿、學(xué)習(xí)、超越,也樂于做從0到1的創(chuàng)新。

中國(guó)人不缺理想,更不缺從0到1的耐心。這是2025年讓人欣喜的開端。

猜你喜歡
算法用戶
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
算法初步兩點(diǎn)追蹤
基于增強(qiáng)隨機(jī)搜索的OECI-ELM算法
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
一種改進(jìn)的整周模糊度去相關(guān)算法
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
虹口区| 桐梓县| 赤城县| 嵊泗县| 商丘市| 界首市| 塘沽区| 河北区| 东兴市| 永城市| 旬邑县| 阳泉市| 台前县| 尉犁县| 威海市| 红安县| 茌平县| 梁山县| 汶上县| 嘉祥县| 泸溪县| 桃江县| 武穴市| 晋江市| 东辽县| 沙湾县| 宜宾县| 宁陵县| 阿荣旗| 综艺| 安阳县| 灵台县| 资中县| 繁峙县| 景洪市| 临安市| 甘泉县| 托里县| 卓资县| 长春市| 光山县|