最近,伊隆·馬斯克又整了個大招。他正式發(fā)布了CyberCab(無人駕駛出租車),據(jù)說每公里運營成本不到1塊錢人民幣。還有CyberVan(無人駕駛公交車),可以坐20個人,還可以拉貨。很多人興奮不已,也有人憂心忡忡。它們會不會搶走我的工作?不會把人類都毀滅了吧?這種擔(dān)心不光是美國有,中國也有。
去年夏天,百度的無人駕駛出租車“蘿卜快跑”,在武漢刮起了一場數(shù)字臺風(fēng)。4塊錢跑10公里,是不是在打價格戰(zhàn)?無人駕駛,那出了事故算誰的?這樣搞下去,傳統(tǒng)出租車怎么辦?
人工智能真的來了,它已經(jīng)不是一個遙不可及的新聞話題,它就發(fā)生在你我身上。那么,我們應(yīng)該怎么辦呢?我先給你講一個故事。這個故事的主人公叫盧德。1811年,英國諾丁漢一家織襪工廠的60臺織襪機一夜之間被砸成廢鐵。兇手是誰?沒錯,就是工廠自己的織襪工人。為什么會這樣?想象一下,你苦練了10年廚藝,突然來了個炒菜機器人。你慌不慌?機器織襪是便宜,可工人們的飯碗怎么辦?于是,他們自稱是盧德將軍的手下,趁著夜黑風(fēng)高,把機器砸了。這場運動也被稱為“盧德運動”。這場運動,就像野火一樣蔓延開來,織襪機、剪毛機、動力織布機,統(tǒng)統(tǒng)遭殃。
說到這里,我想做個小小的調(diào)查。關(guān)于盧德運動,你支持誰?A:我挺新科技。反對技術(shù)變革,極其愚昧;技術(shù)進步,雖然帶來了短暫的失業(yè),但長遠來看,會創(chuàng)造出更多的就業(yè)機會。B:我挺盧德派。如果一項新技術(shù),不能讓普通人受益,那它再先進也是惡魔。如果我現(xiàn)在就吃不上飯,那可能活不到你說的那個“長遠來看”。
你會選A,支持技術(shù)派;還是會選B,支持盧德派。其實,大部分人最終的選擇既不是A也不是B,而是C——挺消費者。想象一下,你面前有兩雙襪子,顏色、大小、材料、質(zhì)量全都一模一樣,一雙要賣99塊,另一雙只賣9塊9。你會買哪雙?我猜,如果它真的是一模一樣的話,大多數(shù)人會選9塊9的。
決定技術(shù)進退的,是消費者。盧德派和技術(shù)派就像兩個商販,一個賣蘋果,一個賣橘子。而你就是消費者,你選什么,世界就變成什么樣。而你呢,幾乎總會選擇用更少的錢過更美好的日子。所以,人工智能就像一陣風(fēng),擋不住也不該擋。與其擔(dān)心被吹跑,不如想想如何借風(fēng)起飛。
去年9月,我陪同“問道全球”的創(chuàng)業(yè)者們前往硅谷,調(diào)研當(dāng)?shù)氐娜斯ぶ悄苄袠I(yè)。我?guī)е粋€核心問題,請教每一位專家:我們到底應(yīng)該如何擁抱人工智能?回國后,我反復(fù)研讀筆記,一條“解題思路”在我腦海當(dāng)中逐漸清晰起來。我稱之為“擁抱人工智能的十種姿勢”。
第一種姿勢,叫看新聞。ChatGPT又升級了,Sora更聰明了,馬斯克又出大招了,中國公司也加入戰(zhàn)局了……網(wǎng)上各種新聞滿天飛,像放煙花一樣熱鬧??葱侣?,是大部分人擁抱人工智能的方式。這沒錯,但如果你只看新聞,什么用也沒有。真想體驗AI的魅力,就要從觀眾席跳到球場上,進入第二種姿勢:開始用。
擁抱的第一步,是張開雙臂。使用的第一步,是裝好APP。親自安裝、親自注冊、親自體驗,只有不斷親自練習(xí),你才能學(xué)會如何寫出一個好的“咒語”。什么是“咒語”?咒語,是讓AI為你施展魔法的指令。我們的商業(yè)社群“進化島”上有一位島民叫甲木,是LangGPT的聯(lián)合創(chuàng)始人。有一天,他在島上發(fā)了條帖子,說看了我們公眾號上一篇李婷老師的講“情緒價值營銷”的文章,覺得特別有啟發(fā)。然后,他就把文章內(nèi)容改成了一個“咒語”。你只要告訴它一個產(chǎn)品的名字,它就能給你寫出一條廣告語來。于是,我試了試。
我先隨便輸入了一個產(chǎn)品“一雙浴室里用的防滑拖鞋”。然后,它就給了我一張卡片“腳下自在,心中安然”。這文采,可比我強多了。然后我接著輸入“3萬元一根的曲別針”,我想看看它怎么賣這種貴到奇葩的產(chǎn)品,它說“彎折間藏世界,一鉤連接非凡”。
接下來是第三步:多探索。多探索,就是培養(yǎng)對AI強烈的好奇心。你要不停地問自己:這件事,能不能讓AI來搞定?那件事,能不能請AI來幫忙?我高中那會兒,正是席慕蓉和汪國真風(fēng)靡的年代。那時候,不管認字多少,大家都愛寫兩句詩,特別喜歡寫那種懵懵懂懂、云里霧里的情詩,我也不例外。我一直想給自己的“神作”譜個曲,可惜身邊沒幾個懂音樂的朋友。直到有一天,人工智能來了,我立馬試了一下。1994年人寫的詞,2024年AI譜的曲,這跨越30年的“3A”大作——AI作曲、AI唱歌、AI畫畫,就是人工智能的魅力。
我突然冒出個想法:如果潤米咨詢決定來賣這首歌,應(yīng)該如何請AI幫忙呢?騰訊廣告的同學(xué)說,那你可以試試用我們的“妙思”:先讓AI給這首歌設(shè)計個唱片封面,接著讓AI幫你弄張海報。然后,再讓AI幫你分析最有機會的客戶群體,投放廣告。這樣一來,你就可以等著有人來買你的“青春之歌”了。
看新聞,開始用,多探索,掌握這些你就算是AI的“票友級”玩家了。不過,如果想用AI創(chuàng)業(yè),那還得繼續(xù)努力,爭取達到“職業(yè)級”水平。而進入“職業(yè)級”第一步,就是學(xué)原理。提問:你買車的目的是什么?如果只是為了上下班通勤,那么學(xué)會開車就足夠了;但如果你想成為職業(yè)賽車手,那就必須真正懂車。懂車,就是說你掀開引擎蓋子的時候,能認出哪個是發(fā)動機、哪個是水箱、哪個是噴油嘴,但更重要的是,你得知道怎么調(diào)這些東西,讓車跑得更快,最后贏得比賽。
有人經(jīng)常問AI專家“如何用AI改變我的行業(yè)?”這就像問電工“如何安裝電燈,能讓我的餐廳生意更好”一樣。他怎么知道呢?這個答案,只有你自己去找。所以,就算你不是學(xué)計算機的,我也建議你至少要搞懂5個AI的基本概念:神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)、參數(shù)。懂點AI的基本原理,就像戴上了透視眼鏡,能讓你發(fā)現(xiàn)行業(yè)中隱藏的真正機會。
然而,AI再強大,也只是個“大腦”。要真正改變世界,還需要了解“身體”的作用,這就是具身。具身不僅包括大腦的決策,還包括身體的感知和行動。人之所以是人,是因為我們不僅僅有聰明的大腦可以做決策,還有靈敏的感官可以感知世界,以及靈活的雙手可以付諸行動。感知、決策、行動,構(gòu)成了一個完整的智能體,也就是具身智能。你可能會發(fā)現(xiàn),人形機器人和無人駕駛汽車其實都是具身智能的嘗試。被大模型武裝的具身智能不僅僅能和你聊天,它能真正地改變這個世界。
學(xué)原理,懂具身,然后就該動手了。怎么動手?不如從裝個本地模型開始。比如,META的LLaMA模型,或者繪圖用的Stable Diffusion模型,等等。裝模型的目的,是從操作層面上了解人工智能,理解什么是訓(xùn)練,什么是推理。下周一要考試,這個周末你拼命刷題,廢寢忘食,這個刷題的過程就是訓(xùn)練;到了周一你拿到卷子,根據(jù)刷題獲得的知識一道道解題,這個解題的過程就是推理。LLaMA和Stable Diffusion就是刷好題的“學(xué)霸”。裝AI模型,就像把學(xué)霸請到家里,仔細觀察他們是如何解題的。之后,你就可以進入更難的一步,也是成為職業(yè)級選手的關(guān)鍵一步:訓(xùn)數(shù)據(jù)。
網(wǎng)上有條關(guān)于寵物的視頻非?;?。狗主人說:“旺財,親我一下唄?”然后把手機遞給了旺財。手機里的APP嘰里呱啦地汪了一通,旺財就真親了主人一口。這款神奇的APP叫Traini,它的聯(lián)合創(chuàng)始人是我在硅谷見到的第一位華人創(chuàng)業(yè)者Jason。Jason說,他們收集了10萬只狗狗的照片、聲音和視頻。然后找專家,給這些數(shù)據(jù)貼標(biāo)簽。比如,狗眼淚汪汪就是傷心;耳朵豎起來,就是想玩;鼻子皺起來,就是警惕。然后,他們把這些數(shù)據(jù)喂給AI,讓它瘋狂刷題。雖然現(xiàn)在他們還做不到精準(zhǔn)“翻譯”,不過經(jīng)過海量數(shù)據(jù)的訓(xùn)練,他們已經(jīng)能比較準(zhǔn)確地識別狗狗的“心情”了。這就是訓(xùn)數(shù)據(jù)。
人工智能有三大要素:算法、算力和數(shù)據(jù)。當(dāng)大家的算法水平相當(dāng),算力也達到極限時,那最終比拼的就是數(shù)據(jù)了。我擁有獨特的數(shù)據(jù),或者我的數(shù)據(jù)質(zhì)量更高,我的AI效果當(dāng)然就會更好。
裝模型訓(xùn)數(shù)據(jù),到了這一步你就已經(jīng)踏上了AI的“職業(yè)化”之路。這條路,九九八十一難,而其中最關(guān)鍵的一難可能就是找方案。化學(xué)纖維(簡稱化纖)的上游是石油,下游是紡織業(yè),最后被做成各種衣物?;w行業(yè)長期面臨兩個問題:斷線和色差。為了解決這些問題,工人們需要用強光手電仔細檢查每一卷化纖,就像在尋找針尖上的瑕疵,又累又費事。那么,我們可以找AI要方案嗎?恒逸化纖找到了一個方案,他們采用了“AI智能眼”的解決方案。AI智能眼每隔5秒鐘眨一下,它眨這一下,就能準(zhǔn)確識別出化纖的質(zhì)量問題,檢測準(zhǔn)確率甚至超過了人工質(zhì)檢。這就是找方案。
每次技術(shù)革新,都像是搭積木:首先是基礎(chǔ)技術(shù)的出現(xiàn),然后是補充技術(shù)的發(fā)展,最后是應(yīng)用技術(shù)的繁榮。互聯(lián)網(wǎng)就是一種基礎(chǔ)技術(shù),一開始大家并不知道互聯(lián)網(wǎng)有什么用,直到瀏覽器出現(xiàn)。瀏覽器就是互聯(lián)網(wǎng)的補充技術(shù)。有了瀏覽器,互聯(lián)網(wǎng)才真正被激活,大量應(yīng)用技術(shù)井噴式發(fā)展,搜索引擎、電子商務(wù)、視頻網(wǎng)站、社交軟件等等。今天的AI可能也是一樣,基礎(chǔ)技術(shù)剛剛出現(xiàn)。未來真正的AI巨頭,可能今天根本不在牌桌上。
這一步已經(jīng)是“職業(yè)級”選手的最高水平了,還想更進一步,就需要進入“大師級”的領(lǐng)域。比如,做模型。做模型是少數(shù)人的游戲。為什么?因為它實在是太燒錢了。2023年一年,OpenAI訓(xùn)練ChatGPT4.0的成本高達7800萬美元;而谷歌訓(xùn)練Gemini Ultra模型,更是耗費了1.91億美元。如果把這些模型比作人,它們一天也要吃三頓飯,那Gemini每頓飯的成本是17萬美元,100多萬人民幣。所以,做基礎(chǔ)模型普通人很難參與其中。但如果我還是很想?yún)⑴c,怎么辦?為它提供數(shù)據(jù)。
基礎(chǔ)模型有時就像個書呆子,答不出一些看似簡單的問題。比如9.11和9.8,哪個大?大部分基礎(chǔ)模型都認為9.11大,問為什么,它們會回答:因為11比8大。AI似乎數(shù)學(xué)不太好,為什么?因為他們?nèi)狈Ω哔|(zhì)量的數(shù)學(xué)數(shù)據(jù)。沒學(xué)過,所以不會。
機會來了。上海交通大學(xué)大三的學(xué)生焦旸想,那我就生產(chǎn)這方面的數(shù)據(jù),賣給他們。于是,他開始用推理機生產(chǎn)優(yōu)質(zhì)的數(shù)學(xué)數(shù)據(jù),然后賣給科技巨頭。現(xiàn)在,他的創(chuàng)業(yè)公司已經(jīng)獲得了天使投資。所以,如果你真想?yún)⑴c基礎(chǔ)模型,也許不一定要在主戰(zhàn)場上和巨頭正面競爭,你可以在側(cè)翼尋找機會。
那么,做模型是擁抱人工智能的最高姿勢了嗎?還不是,“改范式”才是。這次硅谷調(diào)研中,給我最深啟發(fā)的是加州大學(xué)伯克利分校的教授、OpenAI最早的10名員工之一的Pieter Abbeel。他說,今天的人工智能也許方向就是錯的。比如算法,今天的AI要看成千上萬只狗的照片才認識狗,但是人類看幾只就認識了;比如算力,今天的AI需要耗費千萬、甚至上億美元來訓(xùn)練,可是人類一天吃幾頓飯就行了;比如數(shù)據(jù),今天的AI學(xué)習(xí)的數(shù)據(jù)都是人類已經(jīng)寫下來的,可是那些沒寫下來的思考過程呢?因此,很多科學(xué)家正在探索,AI是否有更好的范式,比如從“硅基智能”重回“碳基智能”?我不知道。但是,如果你愿意投身這項研究,即便只發(fā)現(xiàn)一絲微光,就可能像Geoffrey Hinton一樣,獲得諾貝爾物理學(xué)獎。因為,這能再次改變世界。
智能來襲,怎么辦?作為個人用戶,我建議你從看新聞走向開始用,走向多探索,成為“票友級”玩家。但如果你想借助AI創(chuàng)業(yè),我建議你學(xué)原理,懂具身,裝模型,訓(xùn)數(shù)據(jù),找方案,成為“職業(yè)級”選手。而如果你想改變世界,我建議你做模型,甚至改范式,做真正的“大師級”研究。
我不知道10年后替代我們的是不是AI,但我知道,明天就要替代我們的,是比我們更會用AI的人。既然這個世界必將充滿AI,那么,就讓我們擁抱AI吧。
(摘自微信公眾號“劉潤”)