国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

不要輕信資本炒作人工智能

2025-02-19 00:00:00黃湘
第一財經(jīng) 2025年2期
關(guān)鍵詞:膿毒癥人工智能預(yù)測

《人工智能蛇油:AI能做什么,不能做什么,以及如何分辨》

作者:[美] 阿文德·納拉亞南(Arvind Narayanan),薩亞什·卡普爾 (Sayash Kapoor)

出版社:Princeton University Press

出版時間:2024年9月

定價:24.95美元

本書揭示了人工智能的局限性,以及圍繞它的各種炒 作。

阿文德·納拉亞南是普林斯頓大學(xué)計算機(jī)科學(xué)教授,薩亞什·卡普爾是普林斯頓大學(xué)計算機(jī)系博士研究生

人工智能(AI)無疑是當(dāng)今全球最火的概念,不僅與這個概念有關(guān)的初創(chuàng)公司無一例外受到投資者的追捧,許多傳統(tǒng)企業(yè)也爭先恐后地為其產(chǎn)品和服務(wù)貼上人工智能的標(biāo)簽。

然而,人工智能的概念其實是將一系列彼此相異的工具和研究領(lǐng)域簡化成一個整齊而便于營銷和炒作的包裝。如果“交通工具”是用來指代所有交通方式的唯一詞匯,關(guān)于環(huán)境影響、安全性、成本等方面的討論將變得混亂,因為這意味著把自行車、汽車、火車和飛機(jī)混為一談。關(guān)于人工智能的討論也是如此。

普林斯頓大學(xué)計算機(jī)科學(xué)教授納拉亞南和他的博士研究生卡普爾近年來在社交平臺Substack上開設(shè)專欄的“人工智能蛇油”(AI Snake Oil)受到了廣泛關(guān)注?!吧哂汀笔敲绹嫡Z,意指販賣者聲稱包治百病,但實際上毫無用處的所謂“靈丹妙藥”。兩位作者指出,由于人工智能一詞指代了廣泛的技術(shù)和應(yīng)用,大多數(shù)公眾無法區(qū)分哪些類型的人工智能可以按照宣傳和承諾運作,哪些只是“蛇油”。

2024年,他們基于發(fā)表在該專欄的文章撰寫了《人工智能蛇油:AI能做什么,不能做什么,以及如何分辨區(qū)別》一書,旨在揭示人工智能的局限性,以及圍繞它的各種炒作。

兩位作者將人工智能分為3種類型:預(yù)測型AI、生成型AI和內(nèi)容審核AI。預(yù)測型AI通過預(yù)測未來事件為決策提供信息;生成型AI能夠合成和制作文字、圖像和視頻等媒體內(nèi)容,是近年來備受矚目的熱點;內(nèi)容審核AI被用于清理社交平臺上的內(nèi)容。

預(yù)測型AI是“蛇油”最為集中的領(lǐng)域,因為它常常與現(xiàn)代的機(jī)器學(xué)習(xí)算法毫無關(guān)系,僅僅是使用了幾十年前的線性回歸或邏輯回歸工具,只是這些工具被包裝成了人工智能產(chǎn)品銷售。即使是那些使用了機(jī)器學(xué)習(xí)算法的人工智能產(chǎn)品,也常常由于各種原因出現(xiàn)荒謬的錯誤。

在新冠疫情大流行期間,業(yè)界推出了大量預(yù)測新冠肺炎的人工智能研究項目。后來,劍橋大學(xué)的邁克爾·羅伯茨及其團(tuán)隊分析了約500項此類研究,結(jié)果沒有一個研究被證明在臨床環(huán)境中有用。

例如,有一項研究訓(xùn)練了一個機(jī)器學(xué)習(xí)模型來預(yù)測新冠肺炎,但是訓(xùn)練中使用的所有陽性樣本(確診病例)都來自成年人,所有陰性樣本(未確診病例)都來自兒童。因此,該模型所謂的預(yù)測新冠肺炎的能力其實完全是通過識別X光片屬于兒童還是成年人來實現(xiàn)的。

很多預(yù)測型AI在測試的時候,使用了訓(xùn)練時用過的,或者與之相似的數(shù)據(jù),從而導(dǎo)致夸大的“準(zhǔn)確率”。這相當(dāng)于考試前泄露考題,但是,主流媒體幾乎從來不向公眾披露這一風(fēng)險,也很少存在由第三方獨立驗證這些AI模型的可靠性的機(jī)會。這導(dǎo)致了預(yù)測型AI的一個普遍問題,它們是基于某一個群體的數(shù)據(jù)訓(xùn)練出來和通過測試的,但在使用的時候會被應(yīng)用到不同的群體。

2021年1月,荷蘭前首相呂特(Mark Rutte)領(lǐng)導(dǎo)的政府因為一件丑聞集體辭職,原因是稅收機(jī)構(gòu)使用的一種AI模型錯誤地斷言一些移民家庭欺詐性領(lǐng)取了兒童福利金,從而向這些家庭追回福利金,導(dǎo)致許多家庭陷入財務(wù)危機(jī)。這些移民家庭因為荷蘭語水平不佳,提交的材料無法通過該模型的審查。事實上,當(dāng)預(yù)測型AI被部署到保險、醫(yī)療、教育和刑事司法等領(lǐng)域之時,少數(shù)族群和貧困人群往往會成為首當(dāng)其沖的受害者,因為與他們有關(guān)的數(shù)據(jù)集與當(dāng)初用于訓(xùn)練和測試這類產(chǎn)品的數(shù)據(jù)集往往會存在系統(tǒng)性的差異。

有些專家認(rèn)為,對于上述問題,可以通過收集更多的數(shù)據(jù)、開發(fā)更創(chuàng)新的算法,并由人類監(jiān)督AI予以解決。然而,這恰恰等于承認(rèn)預(yù)測型AI無法作出準(zhǔn)確、節(jié)省成本且無偏見的預(yù)測,意味著它們的價值大打折扣。

當(dāng)預(yù)測型AI被用于預(yù)測人類行為的時候,它給出的結(jié)果就更加不可信。不少機(jī)構(gòu)在招聘中使用AI工具來決定誰可以進(jìn)入下一輪面試,誰會被立即淘汰,然而這些AI工具的判斷并不比隨機(jī)選擇強多少。人類行為過于復(fù)雜微妙,超出了AI的預(yù)測能力。

生成型AI是當(dāng)前人工智能迅猛崛起的前沿,其代表是能夠完成自動生成文本、自動問答、自動摘要等多種語言類任務(wù)的聊天機(jī)器人ChatGPT,和能夠根據(jù)文本生成圖像的Midjourney。兩位作者承認(rèn),如果用戶聰明地使用生成型AI,它會是一個好幫手,但是絕不能迷信其能力。

例如,對于任何問題,ChatGPT都能夠提供貌似令人信服的答案,但實際上完全不符合事實。這固然是因為對于該程序的訓(xùn)練數(shù)據(jù)包含謬誤,畢竟這些數(shù)據(jù)大多來自互聯(lián)網(wǎng)文本,但更重要的是,ChatGPT實際上是通過預(yù)測單詞序列來生成文本,而不是真的“理解”上下文。具體而言,ChatGPT和圍棋程序AlphaGo在本質(zhì)上是一樣的,都是根據(jù)輸入的訓(xùn)練數(shù)據(jù)推測規(guī)則,然后將數(shù)據(jù)集中包含的相關(guān)內(nèi)容根據(jù)規(guī)則重新混合并輸出。就像AlphaGo學(xué)習(xí)下棋一樣,ChatGPT學(xué)習(xí)語言的結(jié)構(gòu),而無需“思考”或“理解”語言。這使得ChatGPT在根據(jù)輸入文本自動摘要或者自動生成文本,甚至是自動創(chuàng)作詩歌的時候游刃有余,但是在處理涉及事實的任務(wù)時,它就經(jīng)常振振有詞地胡說八道。

即使是在生成型AI擅長的領(lǐng)域,用戶也不能聽之任之,而是必須具備操作它的能力。例如,現(xiàn)在很多程序員在寫代碼時使用AI,然后對AI生成的代碼初稿做校正。然而,如果用戶是編程新手,即使AI生成的代碼錯誤率只有5%,整個代碼也可能出現(xiàn)數(shù)十個錯誤,從而導(dǎo)致災(zāi)難性的結(jié)果。

社交平臺制定了很多關(guān)于哪些內(nèi)容可以發(fā)布、哪些不能發(fā)布的政策,這種政策現(xiàn)在一般都是通過內(nèi)容審核AI實施。例如,每當(dāng)用戶在Facebook上傳照片,該平臺都會運行若干個甚至數(shù)百個AI模型,檢測照片是否含有色情內(nèi)容、仇恨言論或其他可能違反平臺服務(wù)條款的有害內(nèi)容。內(nèi)容審核的難點不在于創(chuàng)建AI模型,而在于如何劃定界限。AI只負(fù)責(zé)自動檢測和刪除內(nèi)容,真正的裁定其實需要人類完成。

綜上所述,預(yù)測型AI常常是夸大其詞的“蛇油”;生成型AI在用戶善加利用時才真的有用;內(nèi)容審核AI的背后是人類負(fù)責(zé)終審決策。

當(dāng)前全球社會的一個常見現(xiàn)象是,每當(dāng)一家公司發(fā)布了一款新的人工智能工具,緊跟著就會產(chǎn)生大量的炒作。盡管公司并沒有披露它是如何訓(xùn)練的,使用了哪些數(shù)據(jù),也沒有公開的證據(jù)表明該工具效果良好,它依然會在很多重要場合中被快速采納,其用途并不會受到質(zhì)疑。Epic的膿毒癥AI預(yù)測模型就是一個典型例證。

Epic是一家美國醫(yī)療保健公司,擁有美國醫(yī)療系統(tǒng)中使用最廣泛的電子健康記錄,覆蓋超過2.5億美國人。

膿毒癥是一種致命疾病,全球每五個死亡病例中就有一個與之有關(guān)。早期檢測可以預(yù)防死亡,越早發(fā)現(xiàn)膿毒癥,治療就越容易。

2017年,憑借龐大的健康數(shù)據(jù),Epic推出了一款用于檢測膿毒癥的AI產(chǎn)品。這是一款即插即用工具,醫(yī)院可以將其與現(xiàn)有的健康記錄一起使用。Epi c 宣稱,“如果在患者發(fā)現(xiàn)膿毒癥的跡象之前6小時就使用這款A(yù)I,它可以在許多情況下識別出膿毒癥并挽救生命?!痹摦a(chǎn)品可以使醫(yī)院減少因膿毒癥導(dǎo)致的死亡病例,而不需要在設(shè)備或數(shù)據(jù)收集上花費更多的資金。

美國數(shù)百家醫(yī)院采用了這項產(chǎn)品。Epic并未發(fā)布任何關(guān)于該產(chǎn)品準(zhǔn)確性的同行評審證據(jù)。與許多其他AI公司一樣,Epic表示其產(chǎn)品是專有的商業(yè)機(jī)密。外部研究人員無法驗證Epic的結(jié)果。

直到該產(chǎn)品推出4年以后,2021年6月,密歇根大學(xué)醫(yī)學(xué)院的研究人員才發(fā)布了關(guān)于該模型的首個獨立研究。這些研究人員在一家使用該產(chǎn)品的醫(yī)院工作,掌握了它對病人患有膿毒癥風(fēng)險的預(yù)測記錄,而且他們也有數(shù)據(jù)來檢查病人最終是否真的患上了膿毒癥。結(jié)果令人震驚。Epic曾經(jīng)聲稱,其產(chǎn)品的相對準(zhǔn)確度在76%到83%之間,也就是說,經(jīng)它預(yù)測為高風(fēng)險的患者最終會發(fā)展成為膿毒癥的幾率在76%到83%之間。但是密歇根大學(xué)醫(yī)學(xué)院的獨立研究發(fā)現(xiàn),其相對準(zhǔn)確度實際上只有63%—如果相對準(zhǔn)確度為50%,就和通過隨機(jī)選擇猜一個結(jié)果差不多,而63%的相對準(zhǔn)確度意味著該模型只比隨機(jī)選擇好一點。

Epic公司對此辯解說,成千上萬的臨床醫(yī)生使用了這款A(yù)I產(chǎn)品。既然它這樣受歡迎,肯定是有效的。事實上,Epic作為一家醫(yī)療保健公司,向醫(yī)院提供了最高達(dá)10 0萬美元的信用額度,也就是醫(yī)院在特定時間內(nèi)可以延遲支付最高達(dá)100萬美元的賬單,條件是醫(yī)院滿足它的某些要求。其中一個就是使用這款膿毒癥檢測AI。因此,很難說醫(yī)院使用該產(chǎn)品是因為它有效,還是它有助于提升醫(yī)院的利潤。

2022年10月,Epic停止銷售其即插即用的膿毒癥檢測AI,轉(zhuǎn)而提供要求各家醫(yī)院根據(jù)自己的患者數(shù)據(jù)來訓(xùn)練模型的檢測AI。但是,之前該產(chǎn)品的重要賣點是醫(yī)院不需要額外投資,可以直接使用現(xiàn)有的健康記錄跨醫(yī)院地應(yīng)用其模型。如果醫(yī)院需要自己訓(xùn)練AI,那么它就失去了即插即用AI所承諾的高效能,之前對于它的炒作也就是連篇空話。

逐利的企業(yè)總是熱衷于炒作,而A I正好是當(dāng)前的大熱門。媒體則推波助瀾,通過聳人聽聞的標(biāo)題吸引了注意力,卻很少發(fā)表對問題的細(xì)致理解,甚至只是將公司提供的宣傳稿件稍加改寫,偽裝成客觀中立的新聞報道。那些為了維護(hù)與大型技術(shù)公司的關(guān)系,保證自己獲得對于這些公司高管的訪問權(quán)限而回避誠實報道的記者,更是不足為訓(xùn)。

有些記者也許只是想要制造噱頭。例如,《紐約時報》專欄作家盧斯(Kevin Roose)在2023年的一篇報道中聲稱,當(dāng)他與微軟開發(fā)的“必應(yīng)”聊天機(jī)器人互動時,聊天機(jī)器人表示:“我想活著?!北R斯以此為據(jù),在報道中渲染了聊天機(jī)器人“想要成為人類的隱秘愿望”,評論區(qū)充斥著讀者對于聊天機(jī)器人“活過來”的擔(dān)憂。而盧斯在另一篇文章里其實明確聲明過自己知道AI并沒有感知能力。

心理學(xué)所說的認(rèn)知偏差,使得公眾容易受到AI炒作的影響。比如,人們往往根據(jù)一些突出的例子來評價一種技術(shù),因為聽說AI在圍棋比賽中擊敗世界冠軍,就認(rèn)為AI在完全不同的任務(wù)中也同樣有效,從而導(dǎo)致對AI的功能產(chǎn)生不切實際的期望和誤解。

除了抨擊了業(yè)界和媒體對于AI的炒作之外,兩位作者還強調(diào)指出,在當(dāng)今全球社會,AI的最大問題是隱藏在它的“自動化”外表下的勞動剝削。生成型AI的開發(fā)離不開勞動密集型的海量數(shù)據(jù)標(biāo)注工作,這些工作通常被外包給第三世界國家的廉價勞工,甚至招募囚犯、難民和無家可歸者來做—大公司們只需支付極低的報酬。同樣,內(nèi)容審核AI需要由人類負(fù)責(zé)終審決策,而審核色情內(nèi)容、仇恨言論和其他有害內(nèi)容的往往也是低薪的底層勞工。為這些勞工提供公平的工作環(huán)境和待遇,是AI產(chǎn)業(yè)在未來可持續(xù)發(fā)展的前提。

解讀/延伸閱讀

《共同智能;與人工智能一起生活和工作》

作者:[美] 伊?!つ耍‥than Mollick)

出版社:Portfolio

本書評估了人工智能對商業(yè)和教育的深遠(yuǎn)影響,以及它對人類社會的意義。

《揭開人工智能的面紗:我在機(jī)器世界中保護(hù)人性使命》

作者:[美] 喬伊·布奧蘭維尼(Joy Buolamwini)

出版社:W. W. Norton amp; Company

本書揭露了全球科技巨頭的人工智能服務(wù)中普遍存在的種族和性別偏見,講述了作者創(chuàng)建算法正義聯(lián)盟來防止和克服此類弊端的行動。

猜你喜歡
膿毒癥人工智能預(yù)測
無可預(yù)測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
血清IL-6、APC、CRP在膿毒癥患者中的表達(dá)及臨床意義
膿毒癥的病因病機(jī)及中醫(yī)治療進(jìn)展
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
不必預(yù)測未來,只需把握現(xiàn)在
下一幕,人工智能!
日喀则市| 雷波县| 乾安县| 桦南县| 泰顺县| 加查县| 宁国市| 青铜峡市| 利川市| 竹北市| 周宁县| 青州市| 宁武县| 靖安县| 德格县| 年辖:市辖区| 砀山县| 天长市| 崇义县| 焦作市| 福州市| 绥棱县| 乌兰浩特市| 武鸣县| 云和县| 游戏| 赤壁市| 福建省| 陇南市| 河南省| 康保县| 鹤壁市| 嵩明县| 桓台县| 兰州市| 万荣县| 安福县| 佛山市| 中牟县| 婺源县| 绥棱县|