不要輕信資本炒作人工智能

2025-02-19 00:00:00黃湘

第一財經(jīng) 2025年2期

關(guān)鍵詞：膿毒癥人工智能預(yù)測

《人工智能蛇油：AI能做什么，不能做什么，以及如何分辨》

作者：[美] 阿文德·納拉亞南（Arvind Narayanan），薩亞什·卡普爾（Sayash Kapoor）

出版社：Princeton University Press

出版時間：2024年9月

定價：24.95美元

本書揭示了人工智能的局限性，以及圍繞它的各種炒作。

阿文德·納拉亞南是普林斯頓大學(xué)計算機(jī)科學(xué)教授，薩亞什·卡普爾是普林斯頓大學(xué)計算機(jī)系博士研究生

人工智能（AI）無疑是當(dāng)今全球最火的概念，不僅與這個概念有關(guān)的初創(chuàng)公司無一例外受到投資者的追捧，許多傳統(tǒng)企業(yè)也爭先恐后地為其產(chǎn)品和服務(wù)貼上人工智能的標(biāo)簽。

然而，人工智能的概念其實是將一系列彼此相異的工具和研究領(lǐng)域簡化成一個整齊而便于營銷和炒作的包裝。如果“交通工具”是用來指代所有交通方式的唯一詞匯，關(guān)于環(huán)境影響、安全性、成本等方面的討論將變得混亂，因為這意味著把自行車、汽車、火車和飛機(jī)混為一談。關(guān)于人工智能的討論也是如此。

普林斯頓大學(xué)計算機(jī)科學(xué)教授納拉亞南和他的博士研究生卡普爾近年來在社交平臺Substack上開設(shè)專欄的“人工智能蛇油”（AI Snake Oil）受到了廣泛關(guān)注?！吧哂汀笔敲绹嫡Z，意指販賣者聲稱包治百病，但實際上毫無用處的所謂“靈丹妙藥”。兩位作者指出，由于人工智能一詞指代了廣泛的技術(shù)和應(yīng)用，大多數(shù)公眾無法區(qū)分哪些類型的人工智能可以按照宣傳和承諾運作，哪些只是“蛇油”。

2024年，他們基于發(fā)表在該專欄的文章撰寫了《人工智能蛇油：AI能做什么，不能做什么，以及如何分辨區(qū)別》一書，旨在揭示人工智能的局限性，以及圍繞它的各種炒作。

兩位作者將人工智能分為3種類型：預(yù)測型AI、生成型AI和內(nèi)容審核AI。預(yù)測型AI通過預(yù)測未來事件為決策提供信息；生成型AI能夠合成和制作文字、圖像和視頻等媒體內(nèi)容，是近年來備受矚目的熱點；內(nèi)容審核AI被用于清理社交平臺上的內(nèi)容。

預(yù)測型AI是“蛇油”最為集中的領(lǐng)域，因為它常常與現(xiàn)代的機(jī)器學(xué)習(xí)算法毫無關(guān)系，僅僅是使用了幾十年前的線性回歸或邏輯回歸工具，只是這些工具被包裝成了人工智能產(chǎn)品銷售。即使是那些使用了機(jī)器學(xué)習(xí)算法的人工智能產(chǎn)品，也常常由于各種原因出現(xiàn)荒謬的錯誤。

在新冠疫情大流行期間，業(yè)界推出了大量預(yù)測新冠肺炎的人工智能研究項目。后來，劍橋大學(xué)的邁克爾·羅伯茨及其團(tuán)隊分析了約500項此類研究，結(jié)果沒有一個研究被證明在臨床環(huán)境中有用。

例如，有一項研究訓(xùn)練了一個機(jī)器學(xué)習(xí)模型來預(yù)測新冠肺炎，但是訓(xùn)練中使用的所有陽性樣本（確診病例）都來自成年人，所有陰性樣本（未確診病例）都來自兒童。因此，該模型所謂的預(yù)測新冠肺炎的能力其實完全是通過識別X光片屬于兒童還是成年人來實現(xiàn)的。

很多預(yù)測型AI在測試的時候，使用了訓(xùn)練時用過的，或者與之相似的數(shù)據(jù)，從而導(dǎo)致夸大的“準(zhǔn)確率”。這相當(dāng)于考試前泄露考題，但是，主流媒體幾乎從來不向公眾披露這一風(fēng)險，也很少存在由第三方獨立驗證這些AI模型的可靠性的機(jī)會。這導(dǎo)致了預(yù)測型AI的一個普遍問題，它們是基于某一個群體的數(shù)據(jù)訓(xùn)練出來和通過測試的，但在使用的時候會被應(yīng)用到不同的群體。

2021年1月，荷蘭前首相呂特（Mark Rutte）領(lǐng)導(dǎo)的政府因為一件丑聞集體辭職，原因是稅收機(jī)構(gòu)使用的一種AI模型錯誤地斷言一些移民家庭欺詐性領(lǐng)取了兒童福利金，從而向這些家庭追回福利金，導(dǎo)致許多家庭陷入財務(wù)危機(jī)。這些移民家庭因為荷蘭語水平不佳，提交的材料無法通過該模型的審查。事實上，當(dāng)預(yù)測型AI被部署到保險、醫(yī)療、教育和刑事司法等領(lǐng)域之時，少數(shù)族群和貧困人群往往會成為首當(dāng)其沖的受害者，因為與他們有關(guān)的數(shù)據(jù)集與當(dāng)初用于訓(xùn)練和測試這類產(chǎn)品的數(shù)據(jù)集往往會存在系統(tǒng)性的差異。

有些專家認(rèn)為，對于上述問題，可以通過收集更多的數(shù)據(jù)、開發(fā)更創(chuàng)新的算法，并由人類監(jiān)督AI予以解決。然而，這恰恰等于承認(rèn)預(yù)測型AI無法作出準(zhǔn)確、節(jié)省成本且無偏見的預(yù)測，意味著它們的價值大打折扣。

當(dāng)預(yù)測型AI被用于預(yù)測人類行為的時候，它給出的結(jié)果就更加不可信。不少機(jī)構(gòu)在招聘中使用AI工具來決定誰可以進(jìn)入下一輪面試，誰會被立即淘汰，然而這些AI工具的判斷并不比隨機(jī)選擇強多少。人類行為過于復(fù)雜微妙，超出了AI的預(yù)測能力。

生成型AI是當(dāng)前人工智能迅猛崛起的前沿，其代表是能夠完成自動生成文本、自動問答、自動摘要等多種語言類任務(wù)的聊天機(jī)器人ChatGPT，和能夠根據(jù)文本生成圖像的Midjourney。兩位作者承認(rèn)，如果用戶聰明地使用生成型AI，它會是一個好幫手，但是絕不能迷信其能力。

例如，對于任何問題，ChatGPT都能夠提供貌似令人信服的答案，但實際上完全不符合事實。這固然是因為對于該程序的訓(xùn)練數(shù)據(jù)包含謬誤，畢竟這些數(shù)據(jù)大多來自互聯(lián)網(wǎng)文本，但更重要的是，ChatGPT實際上是通過預(yù)測單詞序列來生成文本，而不是真的“理解”上下文。具體而言，ChatGPT和圍棋程序AlphaGo在本質(zhì)上是一樣的，都是根據(jù)輸入的訓(xùn)練數(shù)據(jù)推測規(guī)則，然后將數(shù)據(jù)集中包含的相關(guān)內(nèi)容根據(jù)規(guī)則重新混合并輸出。就像AlphaGo學(xué)習(xí)下棋一樣，ChatGPT學(xué)習(xí)語言的結(jié)構(gòu)，而無需“思考”或“理解”語言。這使得ChatGPT在根據(jù)輸入文本自動摘要或者自動生成文本，甚至是自動創(chuàng)作詩歌的時候游刃有余，但是在處理涉及事實的任務(wù)時，它就經(jīng)常振振有詞地胡說八道。

即使是在生成型AI擅長的領(lǐng)域，用戶也不能聽之任之，而是必須具備操作它的能力。例如，現(xiàn)在很多程序員在寫代碼時使用AI，然后對AI生成的代碼初稿做校正。然而，如果用戶是編程新手，即使AI生成的代碼錯誤率只有5%，整個代碼也可能出現(xiàn)數(shù)十個錯誤，從而導(dǎo)致災(zāi)難性的結(jié)果。

社交平臺制定了很多關(guān)于哪些內(nèi)容可以發(fā)布、哪些不能發(fā)布的政策，這種政策現(xiàn)在一般都是通過內(nèi)容審核AI實施。例如，每當(dāng)用戶在Facebook上傳照片，該平臺都會運行若干個甚至數(shù)百個AI模型，檢測照片是否含有色情內(nèi)容、仇恨言論或其他可能違反平臺服務(wù)條款的有害內(nèi)容。內(nèi)容審核的難點不在于創(chuàng)建AI模型，而在于如何劃定界限。AI只負(fù)責(zé)自動檢測和刪除內(nèi)容，真正的裁定其實需要人類完成。

綜上所述，預(yù)測型AI常常是夸大其詞的“蛇油”；生成型AI在用戶善加利用時才真的有用；內(nèi)容審核AI的背后是人類負(fù)責(zé)終審決策。

當(dāng)前全球社會的一個常見現(xiàn)象是，每當(dāng)一家公司發(fā)布了一款新的人工智能工具，緊跟著就會產(chǎn)生大量的炒作。盡管公司并沒有披露它是如何訓(xùn)練的，使用了哪些數(shù)據(jù)，也沒有公開的證據(jù)表明該工具效果良好，它依然會在很多重要場合中被快速采納，其用途并不會受到質(zhì)疑。Epic的膿毒癥AI預(yù)測模型就是一個典型例證。

Epic是一家美國醫(yī)療保健公司，擁有美國醫(yī)療系統(tǒng)中使用最廣泛的電子健康記錄，覆蓋超過2.5億美國人。

膿毒癥是一種致命疾病，全球每五個死亡病例中就有一個與之有關(guān)。早期檢測可以預(yù)防死亡，越早發(fā)現(xiàn)膿毒癥，治療就越容易。

2017年，憑借龐大的健康數(shù)據(jù)，Epic推出了一款用于檢測膿毒癥的AI產(chǎn)品。這是一款即插即用工具，醫(yī)院可以將其與現(xiàn)有的健康記錄一起使用。Epi c 宣稱，“如果在患者發(fā)現(xiàn)膿毒癥的跡象之前6小時就使用這款A(yù)I，它可以在許多情況下識別出膿毒癥并挽救生命?！痹摦a(chǎn)品可以使醫(yī)院減少因膿毒癥導(dǎo)致的死亡病例，而不需要在設(shè)備或數(shù)據(jù)收集上花費更多的資金。

美國數(shù)百家醫(yī)院采用了這項產(chǎn)品。Epic并未發(fā)布任何關(guān)于該產(chǎn)品準(zhǔn)確性的同行評審證據(jù)。與許多其他AI公司一樣，Epic表示其產(chǎn)品是專有的商業(yè)機(jī)密。外部研究人員無法驗證Epic的結(jié)果。

直到該產(chǎn)品推出4年以后，2021年6月，密歇根大學(xué)醫(yī)學(xué)院的研究人員才發(fā)布了關(guān)于該模型的首個獨立研究。這些研究人員在一家使用該產(chǎn)品的醫(yī)院工作，掌握了它對病人患有膿毒癥風(fēng)險的預(yù)測記錄，而且他們也有數(shù)據(jù)來檢查病人最終是否真的患上了膿毒癥。結(jié)果令人震驚。Epic曾經(jīng)聲稱，其產(chǎn)品的相對準(zhǔn)確度在76%到83%之間，也就是說，經(jīng)它預(yù)測為高風(fēng)險的患者最終會發(fā)展成為膿毒癥的幾率在76%到83%之間。但是密歇根大學(xué)醫(yī)學(xué)院的獨立研究發(fā)現(xiàn)，其相對準(zhǔn)確度實際上只有63%—如果相對準(zhǔn)確度為50%，就和通過隨機(jī)選擇猜一個結(jié)果差不多，而63%的相對準(zhǔn)確度意味著該模型只比隨機(jī)選擇好一點。

Epic公司對此辯解說，成千上萬的臨床醫(yī)生使用了這款A(yù)I產(chǎn)品。既然它這樣受歡迎，肯定是有效的。事實上，Epic作為一家醫(yī)療保健公司，向醫(yī)院提供了最高達(dá)10 0萬美元的信用額度，也就是醫(yī)院在特定時間內(nèi)可以延遲支付最高達(dá)100萬美元的賬單，條件是醫(yī)院滿足它的某些要求。其中一個就是使用這款膿毒癥檢測AI。因此，很難說醫(yī)院使用該產(chǎn)品是因為它有效，還是它有助于提升醫(yī)院的利潤。

2022年10月，Epic停止銷售其即插即用的膿毒癥檢測AI，轉(zhuǎn)而提供要求各家醫(yī)院根據(jù)自己的患者數(shù)據(jù)來訓(xùn)練模型的檢測AI。但是，之前該產(chǎn)品的重要賣點是醫(yī)院不需要額外投資，可以直接使用現(xiàn)有的健康記錄跨醫(yī)院地應(yīng)用其模型。如果醫(yī)院需要自己訓(xùn)練AI，那么它就失去了即插即用AI所承諾的高效能，之前對于它的炒作也就是連篇空話。

逐利的企業(yè)總是熱衷于炒作，而A I正好是當(dāng)前的大熱門。媒體則推波助瀾，通過聳人聽聞的標(biāo)題吸引了注意力，卻很少發(fā)表對問題的細(xì)致理解，甚至只是將公司提供的宣傳稿件稍加改寫，偽裝成客觀中立的新聞報道。那些為了維護(hù)與大型技術(shù)公司的關(guān)系，保證自己獲得對于這些公司高管的訪問權(quán)限而回避誠實報道的記者，更是不足為訓(xùn)。

有些記者也許只是想要制造噱頭。例如，《紐約時報》專欄作家盧斯（Kevin Roose）在2023年的一篇報道中聲稱，當(dāng)他與微軟開發(fā)的“必應(yīng)”聊天機(jī)器人互動時，聊天機(jī)器人表示：“我想活著?！北R斯以此為據(jù)，在報道中渲染了聊天機(jī)器人“想要成為人類的隱秘愿望”，評論區(qū)充斥著讀者對于聊天機(jī)器人“活過來”的擔(dān)憂。而盧斯在另一篇文章里其實明確聲明過自己知道AI并沒有感知能力。

心理學(xué)所說的認(rèn)知偏差，使得公眾容易受到AI炒作的影響。比如，人們往往根據(jù)一些突出的例子來評價一種技術(shù)，因為聽說AI在圍棋比賽中擊敗世界冠軍，就認(rèn)為AI在完全不同的任務(wù)中也同樣有效，從而導(dǎo)致對AI的功能產(chǎn)生不切實際的期望和誤解。

除了抨擊了業(yè)界和媒體對于AI的炒作之外，兩位作者還強調(diào)指出，在當(dāng)今全球社會，AI的最大問題是隱藏在它的“自動化”外表下的勞動剝削。生成型AI的開發(fā)離不開勞動密集型的海量數(shù)據(jù)標(biāo)注工作，這些工作通常被外包給第三世界國家的廉價勞工，甚至招募囚犯、難民和無家可歸者來做—大公司們只需支付極低的報酬。同樣，內(nèi)容審核AI需要由人類負(fù)責(zé)終審決策，而審核色情內(nèi)容、仇恨言論和其他有害內(nèi)容的往往也是低薪的底層勞工。為這些勞工提供公平的工作環(huán)境和待遇，是AI產(chǎn)業(yè)在未來可持續(xù)發(fā)展的前提。

解讀／延伸閱讀

《共同智能；與人工智能一起生活和工作》

作者：[美] 伊?！つ耍‥than Mollick）

出版社：Portfolio

本書評估了人工智能對商業(yè)和教育的深遠(yuǎn)影響，以及它對人類社會的意義。

《揭開人工智能的面紗：我在機(jī)器世界中保護(hù)人性使命》

作者：[美] 喬伊·布奧蘭維尼（Joy Buolamwini）

出版社：W. W. Norton amp; Company

本書揭露了全球科技巨頭的人工智能服務(wù)中普遍存在的種族和性別偏見，講述了作者創(chuàng)建算法正義聯(lián)盟來防止和克服此類弊端的行動。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

不要輕信資本炒作人工智能

《人工智能蛇油：AI能做什么，不能做什么，以及如何分辨》

解讀／延伸閱讀

《人工智能蛇油：AI能做什么，不能做什么，以及如何分辨》