郝國(guó)強(qiáng),李星瑩,楊琴
[摘要]隨著人工智能(AI)技術(shù)的快速發(fā)展,通用人工智能(AGI)技術(shù)正在快速崛起。文章以ChatGPT為例,描述通用人工智能技術(shù)與ChatGPT崛起的內(nèi)在邏輯,認(rèn)為它有助于消除“技術(shù)鴻溝”,推動(dòng)計(jì)算平權(quán),具有劃時(shí)代意義。通用人工智能技術(shù)將打破“摩爾定律”的禁錮,以“季度定律”為主導(dǎo),或以數(shù)倍于半導(dǎo)體行業(yè)速度快速發(fā)展。ChatGPT首創(chuàng)的半營(yíng)利模式暫時(shí)取得了商業(yè)運(yùn)營(yíng)和技術(shù)創(chuàng)新之間的平衡。AGI技術(shù)的核心方法包括監(jiān)督學(xué)習(xí)、增強(qiáng)學(xué)習(xí)、多任務(wù)學(xué)習(xí)等,已廣泛應(yīng)用于教育、醫(yī)學(xué)、學(xué)術(shù)研究和人工智能生成內(nèi)容(AIGC)等領(lǐng)域。但是,AGI技術(shù)存在數(shù)據(jù)安全問(wèn)題、倫理問(wèn)題和社會(huì)問(wèn)題等。該文針對(duì)構(gòu)建可信AI提出保護(hù)用戶(hù)隱私、建立可信AI認(rèn)證體系和加強(qiáng)消費(fèi)者教育三條建議。
[關(guān)鍵詞]ChatGPT;通用人工智能(AGI);安全問(wèn)題
[基金項(xiàng)目]廣西高等學(xué)校千名中青年骨干教師培育計(jì)劃(2020QGRW013);廣西民族大學(xué)相思湖青年學(xué)者創(chuàng)新團(tuán)隊(duì)“鄉(xiāng)村振興背景下廣西民族文化傳承創(chuàng)新的‘互聯(lián)網(wǎng)+方略研究”(2019RSCXSHQN01)
[作者簡(jiǎn)介]郝國(guó)強(qiáng)(1981—),安徽東至人,廣西民族大學(xué)民族學(xué)與社會(huì)學(xué)學(xué)院教授、博士生導(dǎo)師,廣西智庫(kù)“鄉(xiāng)村振興與文化產(chǎn)業(yè)發(fā)展研究院”研究員,研究方向:非遺傳承與鄉(xiāng)村振興、互聯(lián)網(wǎng)人類(lèi)學(xué)等;李星瑩(1998—),廣西田東人,廣西民族大學(xué)民族學(xué)與社會(huì)學(xué)碩士研究生,研究方向:互聯(lián)網(wǎng)人類(lèi)學(xué);楊琴(1988—),湖南邵陽(yáng)人,廣東省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)經(jīng)濟(jì)與信息研究所助理研究員,民族學(xué)博士,研究方向:中國(guó)—東南亞農(nóng)業(yè)合作、互聯(lián)網(wǎng)人類(lèi)學(xué)。
DOI:10.16743/j.cnki.cn45-1357/d.2023.01.015
近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人工智能在全球技術(shù)領(lǐng)域扮演著越來(lái)越重要的角色。而ChatGPT 作為一個(gè)通用人工智能(AGI)系統(tǒng)和應(yīng)用,一舉打破了此前TikTok 9個(gè)月用戶(hù)過(guò)億的紀(jì)錄,在短短2個(gè)月內(nèi)用戶(hù)突破1億。ChatGPT成功引爆了科技圈,并引發(fā)社會(huì)對(duì)人工智能的廣泛關(guān)注和討論。黨的二十大報(bào)告指出:“推動(dòng)戰(zhàn)略性新興產(chǎn)業(yè)融合集群發(fā)展,構(gòu)建新一代信息技術(shù)、人工智能、生物技術(shù)、新能源、新材料、高端裝備、綠色環(huán)保等一批新的增長(zhǎng)引擎。”[1]要以科技強(qiáng)國(guó)引領(lǐng)現(xiàn)代化強(qiáng)國(guó)建設(shè),中國(guó)應(yīng)在人工智能領(lǐng)域搶占科技制高點(diǎn)。
一、通用人工智能(AGI)技術(shù)與ChatGPT的崛起
人工智能的概念可以追溯到公元前一世紀(jì)的古希臘,當(dāng)時(shí)的古典哲學(xué)家試圖將人類(lèi)思維過(guò)程描述為對(duì)符號(hào)的機(jī)械操作,并率先發(fā)明了安提基特拉機(jī)械(Antikythera Mechanism),用來(lái)預(yù)測(cè)天文現(xiàn)象。隨著計(jì)算機(jī)的發(fā)明,人工智能技術(shù)在20世紀(jì)50年代蓬勃發(fā)展。1956年,科學(xué)家們?cè)谶_(dá)特茅斯學(xué)院召開(kāi)了歷史上第一次人工智能會(huì)議,約翰·麥卡錫(John McCarthy)創(chuàng)造了人工智能(Artificial intelligence)一詞,這標(biāo)志著人工智能正式成為一門(mén)學(xué)科[2]。在接下來(lái)的幾十年中,人工智能研究取得長(zhǎng)足進(jìn)展,如專(zhuān)家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)等技術(shù)的誕生。然而,受到算法、算力和數(shù)據(jù)量等諸多因素的限制,人工智能的發(fā)展在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)進(jìn)展緩慢[3]。直到近年來(lái)計(jì)算能力和數(shù)據(jù)量的大幅提升,以及深度學(xué)習(xí)等新技術(shù)的出現(xiàn),人工智能才迎來(lái)了新的發(fā)展機(jī)遇。目前,人工智能已廣泛應(yīng)用于自然語(yǔ)言處理、圖像識(shí)別、自動(dòng)駕駛、智能家居等領(lǐng)域,正不斷改變著我們的生活和工作方式。
(一)通用人工智能算法的出現(xiàn)
目前,傳統(tǒng)人工智能算法逐漸顯示出其在特定領(lǐng)域內(nèi)的優(yōu)勢(shì),但是在跨領(lǐng)域任務(wù)上的表現(xiàn)不盡如人意。這就迫使人們開(kāi)始研究一種能夠進(jìn)行跨領(lǐng)域決策和多任務(wù)執(zhí)行的算法,也就是通用人工智能算法。通用人工智能算法的出現(xiàn)加快了人工智能行業(yè)的發(fā)展,不同于過(guò)去只關(guān)注解決單項(xiàng)特定任務(wù)的人工智能,通用人工智能的最終目標(biāo)是像人類(lèi)一樣具有認(rèn)知能力,能夠進(jìn)行智能決策和解決各種問(wèn)題,被業(yè)內(nèi)稱(chēng)為強(qiáng)人工智能。因此,通用人工智能算法的大規(guī)模應(yīng)用成為人工智能技術(shù)發(fā)展史上的里程碑,是實(shí)現(xiàn)普適性的關(guān)鍵所在。
1950年,學(xué)者們就已經(jīng)開(kāi)始探索如何實(shí)現(xiàn)通用人工智能算法。然而,由于當(dāng)時(shí)計(jì)算能力和數(shù)據(jù)量的限制,這項(xiàng)研究陷入長(zhǎng)期停滯。直到近年來(lái),隨著深度學(xué)習(xí)、自然語(yǔ)言處理等人工智能技術(shù)的不斷發(fā)展,通用人工智能算法的研究逐漸受到重視。目前,通用人工智能算法的研究方向主要包括增強(qiáng)學(xué)習(xí)、遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)等。其中,增強(qiáng)學(xué)習(xí)通過(guò)不斷地與環(huán)境交互,使通用人工智能算法不斷提升自身能力;遷移學(xué)習(xí)是將已學(xué)習(xí)的知識(shí)和經(jīng)驗(yàn)應(yīng)用到新的任務(wù)中;而多任務(wù)學(xué)習(xí)則是通過(guò)同時(shí)學(xué)習(xí)多個(gè)任務(wù),提高算法的泛化能力和適應(yīng)性。
近年來(lái),通用人工智能取得了幾項(xiàng)重大突破,如谷歌在2021年2月率先發(fā)布了5400億參數(shù)的自然語(yǔ)言處理模型(PaLM),該模型能夠基于數(shù)百種語(yǔ)言進(jìn)行深度學(xué)習(xí)。這些突破顯示出通用人工智能算法在解決復(fù)雜任務(wù)上的潛力,同時(shí)也凸顯出發(fā)展通用人工智能算法的重要性。隨著技術(shù)的不斷進(jìn)步,通用人工智能算法將會(huì)成為人工智能技術(shù)未來(lái)重點(diǎn)的發(fā)展方向。
(二)“數(shù)據(jù)翻倍定律”(Data Doubling Law)
與算法的突破相對(duì)應(yīng),數(shù)據(jù)量方面的研究也取得重大進(jìn)展。2018年6月,OpenAI團(tuán)隊(duì)在提出的“數(shù)據(jù)翻倍定律”(Data Doubling Law)描述了人工智能行業(yè)發(fā)展的一條基本規(guī)律,極大地提振了行業(yè)的信心。該研究發(fā)現(xiàn),人工智能行業(yè)受限于算力和算法等因素,用于訓(xùn)練自然語(yǔ)言處理模型的數(shù)據(jù)量每隔18~24個(gè)月就會(huì)翻倍一次。但自2012年開(kāi)始,這個(gè)翻倍周期突然縮短到了3~4個(gè)月,人工智能行業(yè)以約5倍于半導(dǎo)體行業(yè)的發(fā)展速度向前推進(jìn)。出現(xiàn)這個(gè)現(xiàn)象的原因在于算力的迅速增長(zhǎng)、海量數(shù)據(jù)的生成、類(lèi)似谷歌和微軟等持續(xù)大量的資金投入。數(shù)據(jù)是一個(gè)至關(guān)重要的資源,大數(shù)據(jù)時(shí)代的到來(lái)加快了數(shù)據(jù)訓(xùn)練和數(shù)據(jù)喂養(yǎng)人工智能的速度。這是因?yàn)榇髷?shù)據(jù)能夠提供海量、多樣化、高質(zhì)量的數(shù)據(jù)樣本,可以幫助機(jī)器學(xué)習(xí)算法更好地識(shí)別模式和規(guī)律,從而提高模型的準(zhǔn)確度和泛化能力。此外,大數(shù)據(jù)也能夠?yàn)闄C(jī)器學(xué)習(xí)算法提供更好的訓(xùn)練和驗(yàn)證數(shù)據(jù)集,以此幫助算法更好地理解和處理各種復(fù)雜的任務(wù)和情境。
數(shù)據(jù)翻倍定律的意義在于,它展示了在自然語(yǔ)言處理領(lǐng)域中大規(guī)模數(shù)據(jù)對(duì)于訓(xùn)練準(zhǔn)確、流暢和具有創(chuàng)造性的語(yǔ)言生成模型的重要性。表明了數(shù)據(jù)量和算法的質(zhì)量之間的緊密聯(lián)系,它還為自然語(yǔ)言處理領(lǐng)域的進(jìn)一步發(fā)展提供了重要的指導(dǎo)和方向。
由此可見(jiàn),盡管此前主導(dǎo)半導(dǎo)體行業(yè)發(fā)展的“摩爾定律”(Moores Law)同樣制約著人工智能行業(yè)的發(fā)展,但借助算法的突破、算力的快速發(fā)展以及大數(shù)據(jù)時(shí)代的到來(lái),人工智能行業(yè)還是突破了“摩爾定律”(也被稱(chēng)為“兩年定律”)的限制,并于2012年開(kāi)始進(jìn)入“數(shù)據(jù)翻倍定律”主導(dǎo)的時(shí)代。
(三)ChatGPT的誕生及其半營(yíng)利模式的重要意義
目前,通用人工智能的發(fā)展速度突飛猛進(jìn)。人工智能專(zhuān)家正在探索將通用人工智能技術(shù)應(yīng)用于自然語(yǔ)言理解和圖像識(shí)別等方面的應(yīng)用。隨后,OpenAI團(tuán)隊(duì)推出基于通用人工智能算法的GPT模型(Generative Pre-trained Transformer),采用這種“生成式預(yù)訓(xùn)練變換模型”的聊天機(jī)器人ChatGPT,基于大參數(shù)語(yǔ)言算法模型、海量的高質(zhì)量真實(shí)數(shù)據(jù),能夠通過(guò)學(xué)習(xí)和理解人類(lèi)的語(yǔ)言來(lái)進(jìn)行對(duì)話(huà),還能根據(jù)聊天的上下文進(jìn)行互動(dòng),并協(xié)助人類(lèi)完成一系列復(fù)雜任務(wù):撰寫(xiě)郵件、論文、腳本,制定商業(yè)提案,創(chuàng)作詩(shī)歌、故事,甚至敲代碼、檢查程序錯(cuò)誤等。
然而,盡管ChatGPT在自然語(yǔ)言處理領(lǐng)域中已經(jīng)取得了重要的突破,仍需要面對(duì)諸多挑戰(zhàn)和難點(diǎn),如理解不同的語(yǔ)言表達(dá)方式、情境和背景,以及識(shí)別和理解語(yǔ)言中的隱含意義、情感和語(yǔ)義信息。
總的來(lái)說(shuō),ChatGPT的誕生標(biāo)志著自然語(yǔ)言處理領(lǐng)域的重要進(jìn)展,同時(shí)它還開(kāi)創(chuàng)了一種新的半營(yíng)利模式。ChatGPT母公司OpenAI原本是一家非營(yíng)利組織,其資金主要依賴(lài)于捐贈(zèng)和政府撥款。但隨著研究和開(kāi)發(fā)成本的不斷增加,非營(yíng)利模式難以滿(mǎn)足發(fā)展的需求,漸漸落后于DeepMind等同類(lèi)公司。為了可持續(xù)發(fā)展并獲得更多的資金和資源,OpenAI于2019年改組為半營(yíng)利公司,并在商業(yè)市場(chǎng)上推廣其研究成果,從而吸引更多的投資。這樣的轉(zhuǎn)型能夠讓OpenAI更加獨(dú)立自主,提高其資金來(lái)源的多樣性和可持續(xù)性,并有利于其長(zhǎng)期發(fā)展。
OpenAI成立的初衷是推動(dòng)人工智能的研究和發(fā)展,同時(shí)確保人工智能的發(fā)展不會(huì)對(duì)人類(lèi)造成危害。創(chuàng)始人認(rèn)為,人工智能的發(fā)展應(yīng)該是開(kāi)放和透明的,不應(yīng)受到商業(yè)利益和特定國(guó)家的控制,因此最初將其定為非營(yíng)利組織。但人工智能行業(yè)是一個(gè)資金密集型的賽道,需要大量資金招募全球頂尖的科學(xué)家、程序員,購(gòu)買(mǎi)設(shè)備和專(zhuān)業(yè)數(shù)據(jù)等。因此,為了更好地實(shí)現(xiàn)自己的使命和愿景,OpenAI開(kāi)始向商業(yè)領(lǐng)域拓展,并成立了子公司OpenAI LP,旨在將研究成果轉(zhuǎn)化為商業(yè)產(chǎn)品,并帶來(lái)收益以支持OpenAI的研究。與此同時(shí),OpenAI仍然保持著其非營(yíng)利組織的身份,其創(chuàng)始人兼CEO山姆·阿爾特曼(Sam Altman)自己并不持股,而且承諾在任何時(shí)候都不會(huì)為了商業(yè)利益而放棄其使命和價(jià)值觀(guān),還規(guī)定了公司盈利上限,超出的部分將用于推動(dòng)行業(yè)發(fā)展和公益事業(yè)等。具體來(lái)講,OpenAI盈利后的利潤(rùn)分配將分為四個(gè)階段:首先,讓馬斯克為首的首批投資者10億美元的捐贈(zèng)收回初始資本。其次,微軟將獲得OpenAI利潤(rùn)的75%,直到收回其130億美元的投資。再次,在OpenAI的利潤(rùn)達(dá)到920億美元之后,微軟的持股比例將下降到49%。剩余的部分利潤(rùn)將由其他風(fēng)險(xiǎn)投資者和OpenAI的員工分享。最后,當(dāng)利潤(rùn)達(dá)到1500億美元之后,微軟和其他風(fēng)險(xiǎn)投資者的股份將無(wú)償轉(zhuǎn)讓給OpenAI的非營(yíng)利基金。簡(jiǎn)單說(shuō),就有點(diǎn)像OpenAI把公司租給了微軟,賺到1500億美元之后,再還回來(lái)。這樣的利潤(rùn)分配方式,不僅能夠保障初始投資人的回報(bào),還能激勵(lì)員工和其他合作伙伴的積極性,同時(shí)也保證了OpenAI的獨(dú)立性和長(zhǎng)期發(fā)展的可持續(xù)性。這種基于共贏和長(zhǎng)期合作的戰(zhàn)略,為人工智能行業(yè)的可持續(xù)發(fā)展提供了一個(gè)很好的樣本,也向全球展示了OpenAI作為一個(gè)社會(huì)責(zé)任企業(yè)的良好形象和商業(yè)模式。
ChatGPT的誕生和OpenAI的轉(zhuǎn)型不僅是自然語(yǔ)言處理領(lǐng)域的重要進(jìn)展,也代表了一種在安全可控、技術(shù)創(chuàng)新與商業(yè)運(yùn)營(yíng)之間把握平衡的新型商業(yè)模式,這種模式將有助于OpenAI獲得更多的投資和資源,提高其研究和開(kāi)發(fā)水平,從而更好地服務(wù)于社會(huì)。
二、ChatGPT的關(guān)鍵技術(shù)
近年來(lái),隨著深度學(xué)習(xí)、自然語(yǔ)言處理、機(jī)器人和機(jī)器學(xué)習(xí)等技術(shù)的進(jìn)步,通用人工智能開(kāi)始在科技圈嶄露頭角。它可應(yīng)用于各種任務(wù),包括模仿人類(lèi)的思想和行為,并實(shí)現(xiàn)人類(lèi)水平的智能。在通用人工智能的研究中,ChatGPT是當(dāng)前最先進(jìn)的自然語(yǔ)言處理技術(shù)之一,因其出色的生成能力和廣泛的應(yīng)用而備受關(guān)注。
ChatGPT是OpenAI基于Transformer架構(gòu)開(kāi)發(fā)的預(yù)訓(xùn)練語(yǔ)言模型,并在大型人類(lèi)生成文本數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練[4]。在訓(xùn)練過(guò)程中,模型預(yù)測(cè)輸入序列的下一個(gè)詞,以此來(lái)學(xué)習(xí)上下文和語(yǔ)言的統(tǒng)計(jì)規(guī)律。首先,在預(yù)訓(xùn)練階段,ChatGPT使用無(wú)監(jiān)督學(xué)習(xí)算法對(duì)大規(guī)模的文本數(shù)據(jù)集進(jìn)行訓(xùn)練,以理解單詞和短語(yǔ)之間的關(guān)聯(lián)性,并學(xué)會(huì)在生成和回復(fù)對(duì)話(huà)時(shí)進(jìn)行上下文理解和語(yǔ)義推理,這個(gè)階段不涉及任何人類(lèi)反饋。其次,OpenAI使用了一種基于強(qiáng)化學(xué)習(xí)的技術(shù),即基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback,RLHF)來(lái)微調(diào)(Instruction Fine-Tuning,IFT)ChatGPT以生成更好的對(duì)話(huà)。在這個(gè)階段,OpenAI會(huì)與人類(lèi)用戶(hù)進(jìn)行交互,收集用戶(hù)的反饋,并將其用作獎(jiǎng)勵(lì)信號(hào)來(lái)調(diào)整ChatGPT的生成行為。具體來(lái)說(shuō),OpenAI設(shè)置了一個(gè)獎(jiǎng)勵(lì)模型(Reward Model,RM)[5]1881,并使用近端策略?xún)?yōu)化(Proximal Policy Optimization, PPO)算法來(lái)優(yōu)化ChatGPT以最大化獎(jiǎng)勵(lì)[6]。最后,OpenAI使用了人類(lèi)生成的對(duì)話(huà)數(shù)據(jù)集來(lái)評(píng)估ChatGPT的生成質(zhì)量,并將其與其他NLP模型進(jìn)行比較。
其中,基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)(RLHF)是一種強(qiáng)化學(xué)習(xí)算法,它結(jié)合了人類(lèi)智慧和機(jī)器學(xué)習(xí)的能力,以在復(fù)雜的任務(wù)中獲得更好的表現(xiàn)。通過(guò)引入人類(lèi)反饋來(lái)指導(dǎo)智能系統(tǒng)的決策和行為,RLHF算法可以更好地解決復(fù)雜的問(wèn)題,提高系統(tǒng)的性能和智能水平。這項(xiàng)技術(shù)主要包括生成對(duì)話(huà)和人類(lèi)反饋。在生成對(duì)話(huà)階段,ChatGPT會(huì)根據(jù)歷史對(duì)話(huà)和上下文生成一句話(huà)作為回應(yīng),然后將該回應(yīng)呈現(xiàn)給使用者。在人類(lèi)反饋階段,使用者可以選擇對(duì)這句話(huà)進(jìn)行打分,給出正面或負(fù)面的反饋。如果給出了正面反饋,ChatGPT會(huì)根據(jù)這個(gè)反饋來(lái)調(diào)整它所生成的回復(fù),以便更好地滿(mǎn)足用戶(hù)的需求和偏好。如果給出了負(fù)面反饋,ChatGPT則會(huì)嘗試生成一個(gè)新的回答,以改進(jìn)對(duì)話(huà)質(zhì)量。此外,在RLHF算法中,還會(huì)對(duì)整個(gè)對(duì)話(huà)過(guò)程進(jìn)行調(diào)整和優(yōu)化,以提高對(duì)話(huà)的流暢性和自然度。這些調(diào)整和優(yōu)化過(guò)程是基于獎(jiǎng)勵(lì)模型(RM)來(lái)完成的,RM會(huì)根據(jù)用戶(hù)反饋和對(duì)話(huà)質(zhì)量指標(biāo)來(lái)計(jì)算出適當(dāng)?shù)莫?jiǎng)勵(lì)值,并將其應(yīng)用于更新ChatGPT的生成策略,從而優(yōu)化對(duì)話(huà)過(guò)程和結(jié)果。
其次,指令微調(diào)(IFT)是指在預(yù)訓(xùn)練模型的基礎(chǔ)上,使用特定的任務(wù)數(shù)據(jù)集對(duì)模型進(jìn)行進(jìn)一步訓(xùn)練以適應(yīng)該特定任務(wù)的過(guò)程[7]。這個(gè)過(guò)程通常需要對(duì)預(yù)訓(xùn)練模型的參數(shù)進(jìn)行微調(diào),使之可以更好地理解和處理特定任務(wù)中的語(yǔ)言信息,增強(qiáng)模型的表現(xiàn)力。例如,可以將ChatGPT的指令微調(diào)想象成一名學(xué)生在做一份考試試卷的過(guò)程,將預(yù)訓(xùn)練模型想象成學(xué)生平時(shí)學(xué)習(xí)的知識(shí),指令微調(diào)就相當(dāng)于針對(duì)這份試卷對(duì)這些知識(shí)進(jìn)行進(jìn)一步的復(fù)習(xí)和強(qiáng)化,以適應(yīng)這個(gè)特定的考試任務(wù)。
最后,與傳統(tǒng)的企業(yè)聊天機(jī)器人相比,ChatGPT的發(fā)布是通用人工智能發(fā)展史上一個(gè)重要的里程碑,它能更好地理解自然的人類(lèi)語(yǔ)言并生成詳細(xì)的回復(fù)[8],具有更廣泛的應(yīng)用前景。但是,目前ChatGPT模型仍然存在許多問(wèn)題需要解決,例如帶有人工智能技術(shù)的偏見(jiàn)、數(shù)據(jù)私密性難保證、數(shù)量和技術(shù)方面缺乏常識(shí)和邏輯等問(wèn)題。因此,ChatGPT技術(shù)的發(fā)展還需要不斷地研究和探索。
三、ChatGPT的應(yīng)用
ChatGPT是一個(gè)基于人工智能技術(shù)的大型語(yǔ)言模型,它的作用體現(xiàn)在自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和數(shù)據(jù)分析三個(gè)方面。在自然語(yǔ)言處理方面,它可以幫助研究人員實(shí)現(xiàn)自動(dòng)化的文本處理,包括文本分類(lèi)、命名實(shí)體識(shí)別等任務(wù)。在機(jī)器學(xué)習(xí)方面,它可以生成各種類(lèi)型的數(shù)據(jù),并可應(yīng)用于模擬語(yǔ)言交互等。在數(shù)據(jù)分析方面,它可用于處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),進(jìn)行文獻(xiàn)分析、知識(shí)挖掘和知識(shí)圖譜構(gòu)建等任務(wù)。在以上多種技術(shù)作用下,ChatGPT被廣泛應(yīng)用于教育、醫(yī)學(xué)、學(xué)術(shù)研究、人工智能生成內(nèi)容等領(lǐng)域。
(一)在教育領(lǐng)域的應(yīng)用
首先,將ChatGPT融入自然語(yǔ)言教學(xué)。自然語(yǔ)言教學(xué)是一種第二語(yǔ)言學(xué)習(xí)方法,在規(guī)則和語(yǔ)法之前側(cè)重于溝通技巧和語(yǔ)言接觸[9]。在教學(xué)過(guò)程中,教師可以用ChatGPT來(lái)設(shè)計(jì)語(yǔ)言材料和練習(xí)[10]。并為學(xué)生提供翻譯、新詞定義和布置多樣化的練習(xí),或者讓學(xué)生與之進(jìn)行對(duì)話(huà)。在過(guò)去,學(xué)生聽(tīng)課常以教材、筆記等較為傳統(tǒng)的方式進(jìn)行知識(shí)積累,這種以單向輸入或輸出的方式難以真正地幫助學(xué)生掌握語(yǔ)言表達(dá)能力。現(xiàn)在,ChatGPT可以幫助教師設(shè)計(jì)教學(xué)內(nèi)容,例如語(yǔ)言模板、語(yǔ)法規(guī)則等,讓學(xué)生通過(guò)練習(xí)語(yǔ)法技巧掌握語(yǔ)言表達(dá)。
其次,ChatGPT可以應(yīng)用于個(gè)性化教學(xué),可作為學(xué)生的智能老師[11]。每個(gè)學(xué)生都有自己不同的學(xué)習(xí)風(fēng)格、興趣愛(ài)好和認(rèn)知能力。因此,ChatGPT有助于為學(xué)生提供不同的學(xué)習(xí)方法,以滿(mǎn)足學(xué)生在課堂以外的個(gè)性化學(xué)習(xí)需求。目前,ChatGPT已在miniF2F基準(zhǔn)上達(dá)到較為先進(jìn)水平,能夠解決高中奧林匹克競(jìng)賽中一組具有挑戰(zhàn)性的問(wèn)題[12]。ChatGPT可以幫助學(xué)生進(jìn)行智力提升和邏輯訓(xùn)練,從而提高他們的學(xué)習(xí)能力和競(jìng)賽水平。
最后,以ChatGPT輔助自動(dòng)化評(píng)估,為教師在學(xué)生的日常評(píng)估工作上節(jié)省時(shí)間和提供更準(zhǔn)確的反饋[13]。在部分學(xué)校,教師日常評(píng)估學(xué)生知識(shí)掌握程度、壓力承受程度以及心理健康程度等多方面的狀態(tài)時(shí),往往采用的是問(wèn)卷調(diào)查、計(jì)算機(jī)習(xí)題測(cè)試以及面對(duì)面咨詢(xún)等方式,存在耗時(shí)長(zhǎng)、程序煩瑣等問(wèn)題,而ChatGPT的自動(dòng)化評(píng)估功能可以通過(guò)人機(jī)交互狀態(tài)下的語(yǔ)言溝通,進(jìn)一步對(duì)學(xué)生的語(yǔ)言進(jìn)行分析和評(píng)估,給出客觀(guān)準(zhǔn)確的評(píng)價(jià),使學(xué)生能夠更好地了解自己的學(xué)習(xí)、身體、心理等狀況,再進(jìn)一步改善。然而,ChatGPT在應(yīng)用時(shí)經(jīng)常面臨一些挑戰(zhàn)。ChatGPT自然語(yǔ)言處理技術(shù)本身還存在著不確定性和歧義性,并且需要大量的高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練模型,提升交流過(guò)程中語(yǔ)言的準(zhǔn)確性。
(二)在醫(yī)學(xué)領(lǐng)域的應(yīng)用
隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)技術(shù)的高速發(fā)展,各大醫(yī)院也逐漸開(kāi)放了“智慧醫(yī)療”“線(xiàn)上醫(yī)療”等板塊,在2021年全球智能醫(yī)院市場(chǎng)研究報(bào)告中提到:“智能醫(yī)院的全球市場(chǎng)在2020年達(dá)到301億美元,預(yù)計(jì)2026年達(dá)到1112億美元。”[14]因此,ChatGPT借助自然語(yǔ)言處理模型在醫(yī)學(xué)領(lǐng)域逐漸展現(xiàn)價(jià)值。其中,ChatGPT在病理分析、醫(yī)學(xué)研究、健康管理等方面的應(yīng)用,為醫(yī)學(xué)領(lǐng)域帶來(lái)了許多創(chuàng)新和改進(jìn)。
一方面,ChatGPT的自然語(yǔ)言處理技術(shù)和語(yǔ)義理解技術(shù),可以加快識(shí)別和理解醫(yī)學(xué)文本中的關(guān)鍵信息,并對(duì)病歷進(jìn)行分析和數(shù)據(jù)挖掘。數(shù)據(jù)挖掘的技術(shù)包括分類(lèi)、聚類(lèi)、回歸、關(guān)聯(lián)規(guī)則等,它通過(guò)決策樹(shù)、遺傳算法、最近鄰法等算法來(lái)分析大量的原始或多數(shù)據(jù)[15]。例如,使用數(shù)據(jù)挖掘技術(shù)對(duì)乳腺癌患者進(jìn)行診斷和治療[16]。首先,ChatGPT通過(guò)對(duì)大量病例的分析和相似病例進(jìn)行分類(lèi),使醫(yī)生可以更加準(zhǔn)確地診斷病情、制訂治療方案,從而提高醫(yī)療服務(wù)的效率和質(zhì)量;其次,用于分析大規(guī)模的癌癥數(shù)據(jù)集,以幫助研究人員發(fā)現(xiàn)病體癌癥的獨(dú)特特征、診斷方法和治療方案等。
另一方面,醫(yī)學(xué)研究需要處理大量的文獻(xiàn)、數(shù)據(jù)和實(shí)驗(yàn)結(jié)果,需要耗費(fèi)大量的時(shí)間和精力進(jìn)行分析和整理。首先,ChatGPT可以通過(guò)文獻(xiàn)檢索、數(shù)據(jù)挖掘和知識(shí)圖譜構(gòu)建等技術(shù),幫助醫(yī)學(xué)研究人員更快地獲取、整理和分析醫(yī)學(xué)相關(guān)信息。例如,ChatGPT可以應(yīng)用于醫(yī)學(xué)文獻(xiàn)的自動(dòng)摘要和分類(lèi),幫助醫(yī)學(xué)研究人員更快地找到自己需要的信息,從而提高研究的效率和質(zhì)量。其次,ChatGPT還可以通過(guò)評(píng)估其在USMLE上的AI輔助醫(yī)療決策性能[17],幫助醫(yī)生更好地做出診斷和治療決策,從而提高醫(yī)療服務(wù)的質(zhì)量和效率。最后,ChatGPT有助于研究人員更好地理解疾病的發(fā)生和治療機(jī)理,例如,將機(jī)器學(xué)習(xí)模型建立在乳腺癌數(shù)據(jù)集上,以便更好地理解和預(yù)測(cè)乳腺癌的發(fā)生和治療[18]。
此外,隨著智能醫(yī)療技術(shù)的不斷發(fā)展,人們對(duì)健康管理的需求也越來(lái)越高。ChatGPT可以通過(guò)自然語(yǔ)言交互的方式,與用戶(hù)進(jìn)行對(duì)話(huà),了解用戶(hù)的健康狀況和需求,并提供相應(yīng)的健康管理建議和指導(dǎo)[19],進(jìn)而幫助用戶(hù)更好地掌握自己的健康狀況,制訂自身的健康計(jì)劃和管理方案,及時(shí)預(yù)防和治療疾病,從而提高他們的健康水平和生活質(zhì)量。
(三)在學(xué)術(shù)研究領(lǐng)域的應(yīng)用
在哲學(xué)社會(huì)科學(xué)領(lǐng)域,ChatGPT通過(guò)自動(dòng)化分析和分類(lèi)大量文獻(xiàn),為研究人員提供快速了解前沿研究進(jìn)展和發(fā)現(xiàn)新研究方向的途徑。同時(shí),ChatGPT也能夠從海量文獻(xiàn)中提取有用的參考文獻(xiàn)、內(nèi)容、人物和事件,從而提高數(shù)據(jù)挖掘的效率和質(zhì)量。不僅如此,它還能夠通過(guò)命名實(shí)體識(shí)別和關(guān)系抽取等技術(shù),從文獻(xiàn)中提取出關(guān)鍵的實(shí)體和關(guān)系,幫助研究人員更好地了解社會(huì)現(xiàn)象和人類(lèi)行為的本質(zhì)。
在天文研究領(lǐng)域,ChatGPT也具有一定的應(yīng)用價(jià)值。例如,一家名為JetBrains的捷克軟件開(kāi)發(fā)公司利用ChatGPT分析了The Astronomers Telegram和NASA的GCN Circulars等數(shù)據(jù),這些報(bào)告包含傳統(tǒng)算法無(wú)法解析的天文事件。其中,在OpenAI將天文事件嵌入這些天文報(bào)告后,研究人員可以在多個(gè)數(shù)據(jù)庫(kù)和出版物中搜索到諸如“crab pulsar bursts”之類(lèi)的事件。ChatGPT的嵌入在數(shù)據(jù)源分類(lèi)上實(shí)現(xiàn)了99.85%的準(zhǔn)確率,在天文研究領(lǐng)域的應(yīng)用具有較高的精度和效率[20]。
此外,在美術(shù)、設(shè)計(jì)領(lǐng)域,ChatGPT也具有一定的創(chuàng)新。例如,DALL·E2是一個(gè)新的人工智能系統(tǒng),可以根據(jù)文字描述創(chuàng)造原型逼真的圖像和藝術(shù)作品。它通過(guò)組合概念、屬性和樣式,擴(kuò)展原始畫(huà)布中的圖像,創(chuàng)建大量的新作品。DALL·E2還可以根據(jù)自然語(yǔ)言字幕對(duì)現(xiàn)有圖像進(jìn)行逼真的編輯,能夠考慮圖片中陰影、反射和紋理等多種因素,并且根據(jù)喜好進(jìn)行元素的添加和刪減。甚至可以通過(guò)拍攝的照片創(chuàng)建不同的變體,在保持原有創(chuàng)作靈感的同時(shí)做到圖文并茂,這說(shuō)明ChatGPT具備多樣性和靈活性[21]。
(四)在人工智能生成內(nèi)容(AIGC)領(lǐng)域的應(yīng)用
AIGC全稱(chēng)AI-Generated Content,是基于生成對(duì)抗網(wǎng)絡(luò)GAN、大型預(yù)訓(xùn)練模型等人工智能技術(shù),通過(guò)已有數(shù)據(jù)尋找規(guī)律,并通過(guò)適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù),如AI繪圖、AI文章等均屬于AIGC技術(shù)場(chǎng)景中的分支。隨著ChatGPT的爆火,帶動(dòng)了互聯(lián)網(wǎng)內(nèi)容生產(chǎn)方式的快速迭代,從傳統(tǒng)的PGC(專(zhuān)家生成內(nèi)容)到UGC(用戶(hù)生成內(nèi)容),再到如今的AIGC(AI生成內(nèi)容)模式。以ChatGPT為代表的AIGC作為一種全新的內(nèi)容生成方式,在效率、迭代和自動(dòng)化傳播等方面相對(duì)傳統(tǒng)社會(huì)具有明顯的技術(shù)優(yōu)勢(shì),因而可以應(yīng)用在諸多行業(yè)。
在服務(wù)行業(yè),ChatGPT可以應(yīng)用于不同的場(chǎng)景中,以提高企業(yè)的效率和客戶(hù)服務(wù)體驗(yàn)。在改進(jìn)酒店服務(wù)機(jī)器人上,ChatGPT可以讓機(jī)器人更智能化,進(jìn)一步提高酒店行業(yè)機(jī)器人的工作效率,使其更接近于人類(lèi)服務(wù)員的水平,可以識(shí)別和理解客戶(hù)的真實(shí)需求,為客戶(hù)提供更好的服務(wù)體驗(yàn)[22]。在電子郵件回復(fù)和聊天機(jī)器人方面,ChatGPT可以自動(dòng)回應(yīng)常見(jiàn)問(wèn)題、處理客戶(hù)查詢(xún)和投訴,從而幫助客戶(hù)更快地獲取所需信息,減少等待時(shí)間和提高滿(mǎn)意度[23]。在互聯(lián)網(wǎng)廣告應(yīng)約和銷(xiāo)售洽談中,ChatGPT可以自動(dòng)響應(yīng)客戶(hù)的查詢(xún),通過(guò)在聊天中上下文的梳理,生成客戶(hù)所偏向的答案,不斷對(duì)客戶(hù)的需求和偏好進(jìn)行追蹤和深入了解,并向客戶(hù)推薦符合其需求的產(chǎn)品和服務(wù),從而提高客戶(hù)體驗(yàn)和增加銷(xiāo)售量[24]。
四、以ChatGPT為代表的通用人工智能(AGI)技術(shù)的安全問(wèn)題省思
人工智能(AI)可能帶來(lái)的潛在文化、經(jīng)濟(jì)和社會(huì)變革一直受到社會(huì)各界的激烈辯論。計(jì)算機(jī)行業(yè)的快速發(fā)展和程序員群體的迭代帶來(lái)了他們與普通人之間的“技術(shù)鴻溝”。這種鴻溝在現(xiàn)代市場(chǎng)經(jīng)濟(jì)、資本市場(chǎng)等因素的作用下,進(jìn)一步形成了“經(jīng)濟(jì)鴻溝”“社會(huì)鴻溝”,導(dǎo)致貧富差距的加劇。隨著ChatGPT等大型語(yǔ)言模型的出現(xiàn),有助于彌合程序員與普通人之間的技術(shù)鴻溝(Technology divide),加快實(shí)現(xiàn)計(jì)算平權(quán)(Computational equity),進(jìn)而在一定程度上消除技術(shù)霸權(quán),具有劃時(shí)代的意義。但也有較多學(xué)者呼吁加強(qiáng)ChatGPT監(jiān)管,警惕“人工智能成為人類(lèi)文明史的終結(jié)”。
作為一種自然語(yǔ)言處理技術(shù),ChatGPT本身不會(huì)直接引起安全問(wèn)題。然而,在其基礎(chǔ)技術(shù)、通用人工智能的開(kāi)發(fā)過(guò)程中,圍繞數(shù)據(jù)隱私和信息安全問(wèn)題,以及在其應(yīng)用過(guò)程中可能出現(xiàn)的倫理問(wèn)題和社會(huì)問(wèn)題,都應(yīng)該得到足夠的關(guān)注和重視。中國(guó)信息通信研究院《人工智能白皮書(shū)(2022)》指出,人工智能行業(yè)除重視技術(shù)創(chuàng)新外,還將聚焦工程實(shí)踐和可信安全,這種“三維”發(fā)展思路將推動(dòng)人工智能行業(yè)進(jìn)入一個(gè)新的階段[25]。
(一)數(shù)據(jù)安全是人工智能時(shí)代的首要問(wèn)題
在應(yīng)用深度學(xué)習(xí)等通用人工智能技術(shù)進(jìn)行訓(xùn)練時(shí),需要大量的數(shù)據(jù)來(lái)支持。然而,這些數(shù)據(jù)往往包含大量的個(gè)人信息,因此,對(duì)于個(gè)人隱私的保護(hù)顯得尤為重要。同時(shí),在人工智能技術(shù)的應(yīng)用過(guò)程中,數(shù)據(jù)的安全性也需要被高度關(guān)注,以避免黑客攻擊和數(shù)據(jù)泄露等安全問(wèn)題的出現(xiàn)。
從個(gè)人層面來(lái)看,用戶(hù)每天在使用ChatGPT時(shí)都可能會(huì)留下大量的數(shù)據(jù),這些數(shù)據(jù)能夠讓AI為我們提供更加智能化、個(gè)性化的服務(wù)。然而,如果這些數(shù)據(jù)被濫用或泄露,將會(huì)給我們帶來(lái)巨大的安全隱患。因此,企業(yè)和國(guó)家需要確保對(duì)這些數(shù)據(jù)的合理收集、使用和保護(hù),以確保數(shù)據(jù)的安全性。
從企業(yè)的角度來(lái)看,企業(yè)需要建立完善的數(shù)據(jù)安全管理制度,加強(qiáng)對(duì)數(shù)據(jù)的保護(hù)和使用,同時(shí)確保在數(shù)據(jù)收集、存儲(chǔ)和傳輸過(guò)程中符合相關(guān)法規(guī)和規(guī)定。政府需要建立相應(yīng)的監(jiān)管體系和法規(guī),加強(qiáng)對(duì)數(shù)據(jù)的管理和監(jiān)督,同時(shí)確保在數(shù)據(jù)的跨境流動(dòng)和傳輸過(guò)程中符合國(guó)際規(guī)定和標(biāo)準(zhǔn)。只有企業(yè)和政府共同努力,才能夠更好地保障數(shù)據(jù)的安全,推動(dòng)人工智能技術(shù)的健康發(fā)展。
從國(guó)家層面來(lái)看,數(shù)據(jù)安全問(wèn)題同樣重要。特別是在一些涉及國(guó)家安全和公共安全的領(lǐng)域,比如政府、金融、能源等,數(shù)據(jù)泄露和黑客攻擊的風(fēng)險(xiǎn)可能會(huì)影響國(guó)家安全。因此,政府需要制定相應(yīng)的法律法規(guī)來(lái)保障數(shù)據(jù)的安全,防范數(shù)據(jù)泄露和黑客攻擊等。
(二)人工智能引發(fā)的倫理問(wèn)題和社會(huì)問(wèn)題
人工智能技術(shù)的偏見(jiàn)問(wèn)題可能會(huì)帶來(lái)一些潛在的倫理問(wèn)題和社會(huì)問(wèn)題。例如,斯坦福大學(xué)2022年發(fā)布的AI指數(shù)報(bào)告指出,許多人工智能的大型語(yǔ)言模型帶有偏見(jiàn)和歧視,這種偏見(jiàn)來(lái)自AI模型的基礎(chǔ)數(shù)據(jù)訓(xùn)練,它可能反映了人類(lèi)社會(huì)中的系統(tǒng)性偏見(jiàn)或篩選數(shù)據(jù)的科研管理人員[26]。同樣,ChatGPT開(kāi)發(fā)人員也總結(jié)了GPT-3模型是一個(gè)有偏見(jiàn)的系統(tǒng),其常見(jiàn)的偏見(jiàn)包括性別歧視、種族和宗教偏見(jiàn)[5]1895-1898等。
由于機(jī)器學(xué)習(xí)算法的黑盒性質(zhì),人們可能難以理解和解釋其決策過(guò)程。這可能導(dǎo)致人們對(duì)算法的信任度降低,甚至引發(fā)一些不公平和歧視的現(xiàn)象。這些偏見(jiàn)的產(chǎn)生可能來(lái)自科研人員經(jīng)過(guò)篩選的“帶有偏見(jiàn)”的數(shù)據(jù)訓(xùn)練,反映的是人類(lèi)社會(huì)可能存在的偏見(jiàn)和階級(jí)地位的歧視。反之,既然可以操控人工智能模型,科學(xué)家也可以通過(guò)技術(shù)和算法去糾正人工智能模型的偏見(jiàn),甚至糾正人類(lèi)本身的偏見(jiàn)問(wèn)題。例如,舊金山宣布推出一種名為“偏見(jiàn)緩解工具”的應(yīng)用程序,該應(yīng)用程序使用人工智能技術(shù)自動(dòng)編輯警方報(bào)告中與嫌疑人種族有關(guān)的信息,目的是減少種族偏見(jiàn)對(duì)檢察官在決定某人被指控犯罪時(shí)的影響。通過(guò)自動(dòng)過(guò)濾可能引起偏見(jiàn)的信息,該工具有望幫助警方和司法系統(tǒng)更公平地對(duì)待被調(diào)查者。
(三)人工智能對(duì)消費(fèi)者的影響
人工智能的可信問(wèn)題也會(huì)長(zhǎng)期困擾廣大消費(fèi)者,ChatGPT與大多數(shù)人工智能模型一樣,它也會(huì)存在撰寫(xiě)假新聞、編造知識(shí)等可能性。這和ChatGPT的算法邏輯有關(guān),該模型的知識(shí)來(lái)自訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律,而不是任何類(lèi)似人類(lèi)對(duì)世界復(fù)雜和抽象系統(tǒng)的理解,因此可能會(huì)產(chǎn)生不正確或誤導(dǎo)性的信息,并產(chǎn)生攻擊性或有偏見(jiàn)的內(nèi)容。有學(xué)者在使用ChatGPT的過(guò)程中發(fā)現(xiàn),它常常會(huì)“一本正經(jīng)地胡說(shuō)八道”。例如在得到指令“推薦中世紀(jì)英格蘭經(jīng)濟(jì)史的十本書(shū)”,它快速給出了答案,但是其中有8本是偽造的[27]。根據(jù)高德納(Gartner)公司的預(yù)測(cè),在2023年產(chǎn)出的內(nèi)容產(chǎn)品中,將有20%來(lái)自AI。而到2025年,AIGC產(chǎn)生的數(shù)據(jù),將占到整個(gè)互聯(lián)網(wǎng)的10%。比如新聞行業(yè),到2030年,九成以上的新聞稿件將由AI輔助完成[28]。如果這些預(yù)測(cè)成真,那么類(lèi)似ChatGPT這樣的人工智能模型的偏見(jiàn)和造假問(wèn)題將會(huì)給人類(lèi)社會(huì)帶來(lái)巨大的困擾。因此,在技術(shù)條件允許的情況下,應(yīng)該構(gòu)建一個(gè)值得信賴(lài)的可信AI,這樣才可以放心讓其幫助我們執(zhí)行各種重要的任務(wù)。
綜上所述,人工智能技術(shù)的發(fā)展需要綜合考慮安全、隱私、倫理和社會(huì)等多個(gè)方面的問(wèn)題,需要采取多種措施來(lái)應(yīng)對(duì)和解決這些問(wèn)題。
五、構(gòu)建可信AI的建議
世界各主要國(guó)家對(duì)人工智能的發(fā)展高度重視。2016年,美國(guó)白宮發(fā)布了三份政府工作報(bào)告[29],將人工智能發(fā)展上升到國(guó)家戰(zhàn)略層面的國(guó)家。人工智能的戰(zhàn)略規(guī)劃被視為“美國(guó)新的阿波羅登月計(jì)劃”,旨在人工智能領(lǐng)域取得領(lǐng)先地位,類(lèi)似于其在互聯(lián)網(wǎng)時(shí)代的霸主地位。習(xí)近平總書(shū)記在中共中央政治局第九次集體學(xué)習(xí)時(shí)強(qiáng)調(diào):“要加強(qiáng)人工智能發(fā)展的潛在風(fēng)險(xiǎn)研判和防范,維護(hù)人民利益和國(guó)家安全,確保人工智能安全、可靠、可控?!盵30]中國(guó)信息通信研究院與京東探索研究院于2021年聯(lián)合發(fā)布了《可信人工智能白皮書(shū)》,強(qiáng)調(diào)要把增強(qiáng)用戶(hù)信任、發(fā)展可信人工智能放在人工智能倫理和治理的核心位置[31]。當(dāng)前國(guó)際競(jìng)爭(zhēng)的實(shí)質(zhì)是以經(jīng)濟(jì)和科技實(shí)力為基礎(chǔ)的綜合國(guó)力的較量,中國(guó)有必要在當(dāng)前的人工智能浪潮中搶占制高點(diǎn),從而引領(lǐng)新一輪科技革命?;诖?,筆者針對(duì)構(gòu)建可信AI提出以下三條建議:
(一)加強(qiáng)數(shù)據(jù)安全,保護(hù)用戶(hù)隱私
數(shù)據(jù)是人工智能和大數(shù)據(jù)時(shí)代最重要的資源,隨之而來(lái)的數(shù)據(jù)安全問(wèn)題日益凸顯,并在一定程度上制約著行業(yè)的發(fā)展。2018年5月,歐盟通過(guò)了《通用數(shù)據(jù)保護(hù)條例》,其中包括“被遺忘權(quán)”的規(guī)定。該規(guī)定賦予了用戶(hù)選擇不向互聯(lián)網(wǎng)公司共享個(gè)人數(shù)據(jù)的權(quán)利。用戶(hù)只需選擇“被遺忘”,這樣公司將不會(huì)保留與該用戶(hù)相關(guān)的核心和敏感信息。這一措施旨在保護(hù)個(gè)人隱私,為用戶(hù)提供更多的數(shù)據(jù)控制權(quán)。中國(guó)政府可以借鑒國(guó)外經(jīng)驗(yàn)通過(guò)立法的方式加強(qiáng)數(shù)據(jù)的安全管理和保護(hù),防止數(shù)據(jù)泄露和濫用,采用密碼學(xué)、加密算法等安全技術(shù)保護(hù)數(shù)據(jù)的機(jī)密性、完整性和可用性。
此外,可以通過(guò)最新的區(qū)塊鏈技術(shù)實(shí)現(xiàn)數(shù)據(jù)的確權(quán)、交易和共享,確保數(shù)據(jù)安全。區(qū)塊鏈技術(shù)正是這樣一個(gè)在“去信任”的環(huán)境中構(gòu)造一種新信任機(jī)制和交易規(guī)則[32]??梢越柚钚碌膮^(qū)塊鏈技術(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)確權(quán)、共享和交易等,從而在人工智能時(shí)代保護(hù)用戶(hù)的隱私,確保用戶(hù)數(shù)據(jù)的安全。區(qū)塊鏈技術(shù)的分布式、去中心化、不可篡改等特點(diǎn)使其成為一個(gè)可信的數(shù)據(jù)交換和管理平臺(tái),可以應(yīng)用于人工智能的多個(gè)應(yīng)用場(chǎng)景。
(二)打造偏見(jiàn)評(píng)估系統(tǒng),建立可信AI認(rèn)證體系
隨著人工智能技術(shù)的快速發(fā)展,性別、種族、宗教等偏見(jiàn)問(wèn)題越來(lái)越受到關(guān)注。政府在加強(qiáng)監(jiān)管的同時(shí),應(yīng)當(dāng)采取有效的對(duì)策,以確保公眾對(duì)人工智能技術(shù)的信任。首先,政府應(yīng)當(dāng)指導(dǎo)第三方專(zhuān)業(yè)評(píng)估機(jī)構(gòu)對(duì)人工智能企業(yè)的偏見(jiàn)和數(shù)據(jù)安全、網(wǎng)絡(luò)安全等方面進(jìn)行全面、客觀(guān)地評(píng)估。這些評(píng)估機(jī)構(gòu)應(yīng)當(dāng)具備嚴(yán)格的資質(zhì)認(rèn)證和專(zhuān)業(yè)能力,確保評(píng)估結(jié)果的準(zhǔn)確性和可靠性。評(píng)估報(bào)告應(yīng)當(dāng)包含企業(yè)在偏見(jiàn)問(wèn)題和安全問(wèn)題上的具體表現(xiàn)和改進(jìn)建議。其次,政府應(yīng)當(dāng)建立可信AI認(rèn)證體系,對(duì)符合標(biāo)準(zhǔn)的人工智能產(chǎn)品進(jìn)行認(rèn)證,并提供給公眾,以便公眾購(gòu)買(mǎi)和使用更可信的人工智能產(chǎn)品。認(rèn)證標(biāo)準(zhǔn)應(yīng)當(dāng)包括對(duì)偏見(jiàn)和數(shù)據(jù)安全、網(wǎng)絡(luò)安全等方面的要求,以確保人工智能產(chǎn)品的質(zhì)量和可信度。最后,政府應(yīng)當(dāng)加強(qiáng)對(duì)人工智能企業(yè)的監(jiān)管,對(duì)于那些違反規(guī)定的企業(yè),應(yīng)當(dāng)采取相應(yīng)的法律措施。同時(shí),政府應(yīng)當(dāng)建立完善的數(shù)據(jù)保護(hù)和隱私保護(hù)法律體系,保護(hù)公民的合法權(quán)益和隱私安全。通過(guò)這些對(duì)策,政府可以促進(jìn)可信AI的發(fā)展,建立更加安全、可靠的人工智能生態(tài)系統(tǒng)。同時(shí),政府也可以促進(jìn)人工智能技術(shù)的創(chuàng)新和發(fā)展,為社會(huì)的可持續(xù)發(fā)展作出貢獻(xiàn)。
(三)加強(qiáng)消費(fèi)者教育,正確使用通用人工智能技術(shù)
通用人工智能技術(shù)的發(fā)展是全球科技發(fā)展的必然趨勢(shì),我們無(wú)法阻擋人工智能時(shí)代的到來(lái),只能積極應(yīng)對(duì)和適應(yīng)。然而,在正確使用人工智能的過(guò)程中,消費(fèi)者需要保護(hù)自己的隱私和數(shù)據(jù)安全,避免將自己置于安全風(fēng)險(xiǎn)之中。在使用通用人工智能技術(shù)過(guò)程中需要注意一些基本的準(zhǔn)則。例如,不要將個(gè)人信息泄露給未知的第三方,也不要使用人工智能技術(shù)來(lái)傷害他人等。此外,人們需要認(rèn)識(shí)到,制造帶有偏見(jiàn)的數(shù)據(jù)來(lái)訓(xùn)練人工智能模型將導(dǎo)致人工智能算法的偏差,從而產(chǎn)生不準(zhǔn)確的結(jié)果,可能帶來(lái)不良后果。
為了應(yīng)對(duì)這些挑戰(zhàn),加強(qiáng)消費(fèi)者教育、提高人們的科技素養(yǎng)是十分必要的。技術(shù)本身不具有價(jià)值判斷,只是一種工具或手段,其所帶來(lái)的影響和價(jià)值取決于人類(lèi)使用的方式和目的。因此,我們應(yīng)該將技術(shù)的中性作為一個(gè)前提條件,同時(shí)在技術(shù)應(yīng)用的過(guò)程中注重對(duì)其潛在影響的審慎評(píng)估和規(guī)范,以確保技術(shù)的應(yīng)用符合社會(huì)公共利益和道德倫理要求。
[參考文獻(xiàn)]
[1]習(xí)近平.高舉中國(guó)特色社會(huì)主義偉大旗幟為全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家而團(tuán)結(jié)奮斗:在中國(guó)共產(chǎn)黨第二十次全國(guó)代表大會(huì)上的報(bào)告[N].人民日?qǐng)?bào),2022-10-26(1).
[2]HAENLEIN M, KAPLAN A. A brief history of artificial intelligence: on the past, present, and future of artificial intelligence[J].California Management Review, 2019(4):5-14.
[3]Code-Dependent: Pros and Cons of the Algorithm Age[EB/OL].(2017-02-08)[2023-02-13].https://www.pewresearch.org/internet/2017/02/08/code-dependent-pros-and-cons-of-the-algorithm-age/.
[4]Understanding ChatGPT as explained by ChatGPT![EB/OL].(2020-10-20)[2023-02-15].https://www.advancinganalytics.co.uk/blog/2023/1/18/language-models-what-is-chatgpt.
[5]BROWN T, MANN B, RYDER N, et al. Language models are few-shot learners[J]. Advances in Neural Information Processing Systems, 2020,33.
[6]CHRISTIANO P F, LEIKE J, BROWN T, et al. Deep reinforcement learning from human preferences[C]. Advances in Neural Information Processing Systems ,2017:30.
[7]Bert: Pre-training of deep bidirectional transformers for language understanding[EB/OL].(2019-05-24)[2023-02-14].https://arxiv.org/pdf/1810.04805.pdf.
[8]What is AI chatbot phenomenon ChatGPT and could it replace humans?[EB/OL].(2022-12-05)[2023-02-14].https://www.theguardian.com/technology/2022/dec/05/what-is-ai-chatbot-phenomenon-chatgpt-and-could-it-replace-humans.
[9]HALL G.Exploring English language teaching:Language in action[M].Routledge,2011:198.
[10]ZHAI X. ChatGPT user experience: Implications for education[J/OL].SSRN,2022(4312418).https://www.researchgate.net/profile/Xiaoming-Zhai/publication/366463233_ChatGPT_User_Experience_Implications_for_Education/links/63a2817aca6a9d254f8de010/ChatGPT-User-Experience-Implications-for-Education.pdf.
[11]19 Ways to use ChatGPT in your classroom[EB/OL].(2023-01-18)[2023-02-13].https://www.edweek.org/teaching-learning/opinion-19-ways-to-use-chatgpt-in-your-classroom/2023/01.
[12]POLU S, HAN J M, ZHENG K, et al. Formal mathematics statement curriculum learning[J/OL].arXiv.2022(01344).https://arxiv.org/pdf/2202.01344.pdf.
[13]Creatingyour own ChatGPT: a guide to Fine-Tuning LLMs with LoRA[EB/OL].(2023-02-03)[2023-02-14].https://ai.plainenglish.io/how-chatgpt-can-improve-education-not-disrupt-it-c6fe7910d1e1.
[14]Global Smart Hospitals Market Research Report 2021-ResearchAndMarkets.com[EB/OL].(2021-11-23)[2023-02-16].https://www.businesswire.com/news/home/20211123006014/en/Global-Smart-Hospitals-Market-Research-Report-2021-ResearchAndMarkets.com.
[15]OSKOUEI R J, KOR N M, MALEKI S A. Data mining and medical world: breast cancers diagnosis, treatment, prognosis and challenges[J]. American Journal of Cancer Research, 2017(3):610.
[16]KHARYA S. Using data mining techniques for diagnosis and prognosis of cancer disease[J/OL].arXiv.2012(1923).https://arxiv.org/ftp/arxiv/papers/1205/1205.1923.pdf.
[17]KUNG T H, Cheatham M, Medenilla A, et al. Performance of ChatGPT on USMLE: potential for AI-assisted medical education using large language models[J]. PLOS Digital Health, 2023(2):198.
[18]GOEL V. Building a simple machine learning model on breast cancer data[J]. Towards Data Science, 2018:1-6.
[19]KING M R. The future of AI in medicine: a perspective from a chatbot[J]. Annals Biomedical Engineering, 2023(51):291-295.
[20]NEELAKANTAN A, XU T, PURI R, et al. Text and code embeddings by contrastive pre-training[J/OL].arXiv.2022(10005).https://arxiv.org/pdf/2201.10005.pdf.
[21]RAMESH A, DHARIWAL P, NICHOL A, et al. Hierarchical text-conditional image generation with clip latents[J/OL].arXiv.2022(06125).https://arxiv.org/pdf/2204.06125.pdf.
[22]What does ChatGPT really mean for businesses?[EB/OL].(2022-12-28)[2023-02-15].https://www.forbes.com/sites/bernardmarr/2022/12/28/what-does-chatgpt-really-mean-for-businesses/?sh=a7ecaac7d1e3.
[23]AGRAWAL A, GANS J, GOLDFARB A. ChatGPT and how AI disrupts industries[EB/OL].(2022-12-12)[2023-02-23].https://hbr.org/2022/12/chatgpt-and-how-ai-disrupts-industries.
[24]How can you use ChatGPT in business?[EB/OL].(2021-01-16)[2023-02-15].https://addepto.com/blog/how-can-you-use-chatgpt-in-business/.
[25]中國(guó)信息通信研究院.人工智能白皮書(shū)(2022年)[M].北京:中國(guó)信息通信研究院,2022:前言.
[26]Introduction to the AI index report 2022[EB/OL].(2022-03)[2023-02-15].https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf.
[27]歷史學(xué)家的技藝.當(dāng)ChatGPT學(xué)會(huì)編造多本中世紀(jì)經(jīng)濟(jì)史參考書(shū)目(一名世界史學(xué)生的反思和致歉)[EB/OL].(2023-02-11)[2023-02-16].https://mpweixinqqcom/s/nCTBoffzS3fh5wHTcDkamg.
[28]SINGH A, JHA S, SRIVASTAVA D K, et al. Future of work: a systematic literature review and ev-olution of themes[J]. Foresight, 2022(1):99-125.
[29]BUNDY A. Preparing for the future of artificial intelligence[J]. AI & Society, 2017(32):285-287.
[30]習(xí)近平.加強(qiáng)領(lǐng)導(dǎo)做好規(guī)劃明確任務(wù)夯實(shí)基礎(chǔ)推動(dòng)我國(guó)新一代人工智能健康發(fā)展[N].人民日?qǐng)?bào),2018-11-01(1).
[31]中國(guó)信息通信研究院,京東探索研究院.可信人工智能白皮書(shū)[M].北京:中國(guó)信息通信研究院,2021:前言.
[32]任仲文.區(qū)塊鏈領(lǐng)導(dǎo)干部讀本[M].北京:人民日?qǐng)?bào)出版社, 2018:75.
[責(zé)任編輯:楊軍]