時光
摘要:文章通過對AGI軟件和硬件目前的發(fā)展現(xiàn)狀、應(yīng)用場景以及發(fā)展趨勢進(jìn)行闡述。包括AGI軟件的原理,以及在生活、軍事和公安系統(tǒng)場景的應(yīng)用和相關(guān)技術(shù)弊端。同時也描述了AGI機(jī)器人的應(yīng)用場景和相關(guān)AGI硬件。最后對人工智能的發(fā)展進(jìn)行了分析與展望。
關(guān)鍵詞:通用人工智能;AGI軟件;AGI硬件;ChatGPT;公安系統(tǒng)
中圖分類號:TP391? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)07-0012-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
人工智能經(jīng)過近幾十年的發(fā)展,從開始的機(jī)器定理證明和邏輯推理的突破,到對知識庫的研究,再到現(xiàn)今發(fā)展出的計(jì)算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)等各個分支領(lǐng)域,其在整個社會發(fā)展中取得了大量成果,推動了整個社會生產(chǎn)力的提升[1]。美國OpenAI公司推出的通用型人工智能軟件ChatGPT,在與人類交流時具有高度的流暢性和邏輯性,引起了廣泛關(guān)注。本文將從通用型人工智能,即AGI(Artificial General Intelligence) 的軟件和硬件兩個方面來分析當(dāng)前新形態(tài)人工智能的應(yīng)用與發(fā)展趨勢[2]。
1 AGI軟件
1.1 AGI軟件原理
新形態(tài)人工智能最主要的特點(diǎn)即其表現(xiàn)出的通用智能特征。以往的人工智能比如基于深度學(xué)習(xí)的大語言模型,處理的都是單一的任務(wù),而通用型人工智能可以處理廣泛的無差別的任務(wù)。這些任務(wù)的處理是基于以往的人工智能各個領(lǐng)域的技術(shù)包括機(jī)器學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺、強(qiáng)化學(xué)習(xí)、數(shù)據(jù)挖掘、專家系統(tǒng)、智能機(jī)器人等的交叉融合來實(shí)現(xiàn)。比如上文提到的ChatGPT軟件,其實(shí)現(xiàn)包含了多個模型,有傳統(tǒng)的BERT、GPT等基于神經(jīng)網(wǎng)絡(luò)的模型,也有基于Transformer網(wǎng)絡(luò)架構(gòu)的深度學(xué)習(xí)模型,正是這種技術(shù)的融合,使得其實(shí)現(xiàn)了部分通用型智能的特征和功能[3] ,如圖1所示。
如圖1所示,ChatGPT使用了多種技術(shù)進(jìn)行實(shí)現(xiàn)。在預(yù)訓(xùn)練階段,ChatGPT通過大規(guī)模的無監(jiān)督學(xué)習(xí)來學(xué)習(xí)語言的統(tǒng)計(jì)規(guī)律和語義關(guān)系,其中的Transformer架構(gòu)中含有多個Encoder和Decoder層,預(yù)訓(xùn)練的目標(biāo)是通過自動回答遮蓋了一部分輸入文本的問題,來預(yù)測被遮蓋的部分。這樣可以讓程序?qū)W習(xí)到上下文的語義和語法。而在預(yù)訓(xùn)練結(jié)束后,需要進(jìn)行微調(diào),ChatGPT會通過有監(jiān)督學(xué)習(xí)的方式進(jìn)行。其使用特定任務(wù)的數(shù)據(jù)集來進(jìn)行訓(xùn)練,如對話生成、問題回答等。微調(diào)的目標(biāo)是讓軟件從一個通用的語言模型轉(zhuǎn)換成一個特定任務(wù)模型,從而更好地適應(yīng)特定任務(wù)需求。前面提到的Transformer架構(gòu)具有較好的并行計(jì)算能力,能夠處理長文本序列,可以有效捕捉上下文信息和語義關(guān)系。ChatGPT本身是一個自回歸生成模型,它在生成輸出時一次生成一個詞,這種生成方式可以讓ChatGPT生成連貫流暢的文本。Beam Search算法是用來生成多個可能的輸出序列,并通過考慮每個序列的概率來選擇最優(yōu)的輸出序列,該算法可以提高生成結(jié)果的多樣性和準(zhǔn)確性。另外,ChatGPT對于輸入的文本轉(zhuǎn)換為向量表示,通常使用Word Embedding技術(shù)表示每個詞。這樣就可以將文本序列轉(zhuǎn)化為模型可以理解和處理的數(shù)值表示。由每一項(xiàng)技術(shù)的共同作用使得ChatGPT能夠生成流暢、連貫的自然語言文本,并具有一定的語義理解和任務(wù)適應(yīng)能力,部分實(shí)現(xiàn)了通用人工智能的功能。
1.2 AGI軟件應(yīng)用場景
目前AGI軟件除了ChatGPT,還有百度的文心一言、谷歌的Bard、必應(yīng)的Copilot等。此類軟件可以實(shí)現(xiàn)機(jī)器翻譯、自然語言理解、智能推薦等功能。尤其在在線客服的應(yīng)用場景中,可以實(shí)現(xiàn)快速響應(yīng)、多語言支持、個性化回答等[4]。AGI軟件的背景技術(shù)還可以大量應(yīng)用于軍事領(lǐng)域,比如對軍方訓(xùn)練中虛擬場景的模擬、情報分析,在同一空域無人機(jī)或戰(zhàn)機(jī)的控制方面具有明顯優(yōu)勢。另外,其在公安系統(tǒng)中也有較多應(yīng)用,可以大大提升警務(wù)效率,如圖2所示。
由圖2所示,AGI軟件在公安系統(tǒng)各方面應(yīng)用廣泛。在信息搜集與分析領(lǐng)域,AGI軟件可以被用來搜索和分析大量公安信息,如犯罪記錄、人員信息、案件資料等。它可以幫助公安快速獲取所需信息,并進(jìn)行關(guān)聯(lián)分析和推理。在情報分析與預(yù)測領(lǐng)域,AGI軟件可以對收集的情報進(jìn)行深入分析,并基于模式識別和數(shù)據(jù)挖掘技術(shù)進(jìn)行預(yù)測,例如軟件可以基于歷史數(shù)據(jù)和模型訓(xùn)練,分析監(jiān)控視頻中的行為模式,預(yù)測潛在的犯罪活動發(fā)生的時間和地點(diǎn)。這有助于公安部門制定有效的應(yīng)對策略,并提高犯罪偵查和預(yù)防工作的效率。在輿情檢測和處理領(lǐng)域,AGI軟件可以檢測社交媒體、新聞報道和網(wǎng)絡(luò)論壇等渠道的輿情信息,并進(jìn)行情感分析和事件關(guān)聯(lián)分析。這有助于公安部門及時了解公眾的關(guān)切和態(tài)度,及時采取措施進(jìn)行輿情引導(dǎo)和危機(jī)處理。在智能問答和指導(dǎo)領(lǐng)域,AGI軟件可以作為公安知識庫的智能問答系統(tǒng),為公安人員提供實(shí)時的指導(dǎo)和解答。它可以回答常見的問題,提供法律法規(guī)解釋,提供操作指南等,幫助公安人員更好地履行職責(zé)。在智能語音領(lǐng)域,AGI軟件可以用于開發(fā)公安領(lǐng)域的智能語音系統(tǒng),用于輔助警務(wù)通訊、語音指令輸入、語音報警等。這有助于提高公安人員的響應(yīng)速度與效率。AGI軟件實(shí)際使用中需要結(jié)合實(shí)際使用場景,進(jìn)行定制和改進(jìn),以更好地符合使用需求。
1.3 AGI軟件弊端
AGI軟件相關(guān)技術(shù)可以用于網(wǎng)絡(luò)詐騙或其他非法活動[5],例如近期出現(xiàn)的WormGPT,其基于開源模型LLMgpt-J,可以任意生成各種惡意軟件。如圖3所示,為使用AGI軟件生成的Web Scraping小程序,它可以抓取并篩選出與自己目標(biāo)相關(guān)的信息,并針對特定事件進(jìn)行輿論炒作,造成一定影響。AGI軟件使得編寫程序變得更加容易,降低了犯罪門檻。
AGI軟件雖然具有部分通用人工智能的特征,但它是一個基于大量文本數(shù)據(jù)進(jìn)行預(yù)測的模型,在涉及道德、法律等問題時,并不能做出合理判斷。而且這類技術(shù)基于預(yù)先的訓(xùn)練模型,無法即時學(xué)習(xí)和適應(yīng)新信息,當(dāng)用戶提出的問題是關(guān)于當(dāng)前事件或最新動態(tài)時,AGI軟件無法給出準(zhǔn)確答案,所以它也缺乏一定的實(shí)時性。另外,因?yàn)锳GI軟件是一種通用型軟件,是為了解決各種不同任務(wù)和問題而設(shè)計(jì)的,這會導(dǎo)致軟件缺乏特定領(lǐng)域的專業(yè)知識和特長。對于AGI軟件的生成結(jié)果,由于其決策過程的復(fù)雜性和難解釋性,對許多重要問題,用AGI軟件得到結(jié)果的可信性降低,影響其使用效率。當(dāng)然,AGI軟件進(jìn)行訓(xùn)練所需的大量數(shù)據(jù)集也存在隱私和安全問題。
1.4 AGI軟件發(fā)展趨勢
目前AGI類軟件具有相對完善的自然語言處理能力。未來隨著模型規(guī)模的增加以及相關(guān)基礎(chǔ)設(shè)施的提升,交互會向語音、圖像、視頻領(lǐng)域發(fā)展,形成更高級別的交互模式[6],即多模態(tài)交互。AGI作為通用型軟件,在未來可能會出現(xiàn)為各種領(lǐng)域定制的AGI軟件,這些軟件的相關(guān)模型針對特定領(lǐng)域進(jìn)行預(yù)訓(xùn)練,從而在該領(lǐng)域中提供更專業(yè)化、更準(zhǔn)確的響應(yīng)。對于目前的AGI軟件在處理長篇對話時可能會出現(xiàn)理解上下文的困難,未來的AGI軟件會更好地理解上下文,形成更連貫和一致性的響應(yīng)。AGI軟件未來可能會加入個性化元素,使得它能夠根據(jù)用戶的偏好和歷史對話來生成更個性化的響應(yīng)。另外,針對上文提到的AGI軟件決策解釋性問題,未來的軟件可能會提供更好的解釋性,讓用戶可以更好地了解其決策過程,增加可信性。對于用戶隱私保護(hù)和降低犯罪門檻問題,AGI軟件背后的各大公司已經(jīng)在行動,相信未來會有更加明確的規(guī)范來解決這個問題。
2 AGI硬件
2.1 AGI硬件應(yīng)用場景
AGI軟件的交互會向著多模態(tài)的高級模式發(fā)展,而當(dāng)前的硬件并不能滿足多維交互模式,需要更高級別的硬件設(shè)備,例如MR設(shè)備,可以更多地將現(xiàn)實(shí)世界數(shù)字化,承載虛擬與現(xiàn)實(shí)世界的交互場景。另外,AGI機(jī)器人發(fā)展迅速,加拿大公司Sanctuary AI推出了第六代通用機(jī)器人Phoenix,其由人工智能控制系統(tǒng)Carbon進(jìn)行驅(qū)動,目標(biāo)是通過深度學(xué)習(xí)算法和大規(guī)模數(shù)據(jù)集的訓(xùn)練,開發(fā)具有人類情感和智能的機(jī)器人。另外,中國公司傅里葉智能也發(fā)布了AGI機(jī)器人GR-1,具備很高的商業(yè)化能力。
AGI機(jī)器人的發(fā)展目標(biāo)是可以具備感知、認(rèn)知、學(xué)習(xí)和決策能力,能夠與人類進(jìn)行自然語言交互,適應(yīng)不同的工作環(huán)境和場景需求的智能設(shè)備。其應(yīng)用場景非常廣泛,在醫(yī)療護(hù)理、教育培訓(xùn)、工業(yè)生產(chǎn)等領(lǐng)域極具價值[7]。比如目前已經(jīng)部分實(shí)現(xiàn)的在工業(yè)生產(chǎn)線上扮演工人的角色,執(zhí)行重復(fù)性、危險性或者高精度的任務(wù),可以通過機(jī)器學(xué)習(xí)和視覺識別,提高生產(chǎn)效率。未來的應(yīng)用場景中,在醫(yī)療機(jī)構(gòu)AGI機(jī)器人可以扮演護(hù)理的角色,為病人提供測量體溫,監(jiān)測生命體征等護(hù)理服務(wù)。在教育機(jī)構(gòu)則可以扮演教師的角色,為學(xué)生提供個性化輔導(dǎo)等,在其他領(lǐng)域的應(yīng)用如圖4所示。
AGI機(jī)器人可以在家庭中扮演助手角色,還可以時刻保護(hù)家人安全。在商業(yè)領(lǐng)域,AGI機(jī)器人可以在商業(yè)場所提供各種服務(wù),提升客戶體驗(yàn)和服務(wù)質(zhì)量。在社會交流領(lǐng)域,AGI機(jī)器人可以與人類進(jìn)行對話交流,給予一定的陪伴和情感支持。在休閑娛樂領(lǐng)域,其可以提供游戲、音樂等內(nèi)容,與傳統(tǒng)打游戲不同的是,AGI機(jī)器人可以以用戶的方式參與其中,極大提升用戶體驗(yàn)。在農(nóng)業(yè)領(lǐng)域,AGI機(jī)器人也可以作為農(nóng)業(yè)助手的角色,提高農(nóng)業(yè)生產(chǎn)效率。此外,其在公安領(lǐng)域也有很多應(yīng)用,比如安全巡邏和監(jiān)控,AGI機(jī)器人可以配備攝像頭和傳感器,根據(jù)預(yù)設(shè)的巡邏路線和時間,用于巡邏和監(jiān)控公共區(qū)域,應(yīng)用AGI軟件的訓(xùn)練模型自動識別異常行為和物體,及時報警并提供實(shí)時解決方案。另外,對于一些危急情況或者區(qū)域,AGI機(jī)器人還可以輔助調(diào)查與取證,并且提供線索和犯罪模式的分析。AGI機(jī)器人還可以在指揮系統(tǒng)等領(lǐng)域發(fā)揮重要作用,AGI機(jī)器人可以與警方指揮中心進(jìn)行實(shí)時通信,接受指令并傳遞信息,提供巡邏現(xiàn)場的實(shí)時圖像和數(shù)據(jù)。
2.2 AGI硬件弊端和發(fā)展趨勢
目前AGI機(jī)器人還處于發(fā)展的初級階段,除了少數(shù)工業(yè)領(lǐng)域,并沒有大規(guī)模的商業(yè)化應(yīng)用,但是對于像MR這種發(fā)展比較成熟的設(shè)備,雖然其并不能算AGI硬件,但是其具有整合AGI軟件,作為AGI軟件交互載體的功能。目前已經(jīng)有公司將AGI軟件植入MR設(shè)備中,其可以對現(xiàn)實(shí)世界進(jìn)行運(yùn)算,最終實(shí)現(xiàn)類似元宇宙的效果。當(dāng)MR設(shè)備可以實(shí)現(xiàn)與現(xiàn)實(shí)世界的交互,也就完成了與人的交互,進(jìn)而可以更容易地改變世界。但是目前AGI機(jī)器還無法理解人類情感,對于隱私、安全等問題和AGI軟件一樣還需要進(jìn)一步發(fā)展。相對于AGI軟件的多模態(tài)交互,AGI硬件未來也會發(fā)展出多元化的交互,更好地理解和響應(yīng)人類需求。AGI硬件未來將會具備真正的自主學(xué)習(xí)能力,能夠通過不斷學(xué)習(xí)和訓(xùn)練來提高自己的智能水平。另外AGI機(jī)器設(shè)備還將具備協(xié)作共存能力,能夠在不同場景下與人類合作完成任務(wù),并能夠和其他機(jī)器人進(jìn)行信息交流和共享。AGI硬件設(shè)備會向著更加智能化、高效化的方向發(fā)展,并且可以幫助人類解決更多的問題,與人類更好地共存。
3 結(jié)束語
人工智能是一個由計(jì)算機(jī)、通信等行業(yè)構(gòu)成的生態(tài)系統(tǒng),是當(dāng)今世界最具潛力和影響力的技術(shù)。除了上文所描述的應(yīng)用場景,人工智能目前在各個領(lǐng)域都發(fā)揮了巨大作用,如自動駕駛、金融科技、物聯(lián)網(wǎng)等[8]。通用型人工智能的快速發(fā)展,使得很多問題得到解決,而AGI的軟硬件也變得越來越高效與智能。但人工智能在發(fā)展的同時也帶來了一些挑戰(zhàn),比如對于個人隱私和數(shù)據(jù)安全的保護(hù)問題,以及傳統(tǒng)行業(yè)被沖擊導(dǎo)致的就業(yè)問題等都值得關(guān)注??傊?,人工智能的發(fā)展是一個持續(xù)不斷的過程,需要人們不斷探索與創(chuàng)新,從而為人類創(chuàng)造更美好的未來。
參考文獻(xiàn):
[1] 周軍強(qiáng).人工智能技術(shù)發(fā)展現(xiàn)狀與展望[J].計(jì)算機(jī)應(yīng)用文摘, 2023,39(12):201-203.
[2] (美)赫伯特·L.羅埃布萊特.通用人工智能:初心與未來[M].郭斌,譯.北京:機(jī)械工業(yè)出版社,2023.
[3] 陳崢.與AI對話 ChatGPT提示工程揭秘 人工智能[M].北京:電子工業(yè)出版社,2023.
[4] 沈陽,ChatGPT.智能對話新篇章:ChatGPT的探索與未來[J].傳媒論壇,2023,6(6):3.
[5] 劉旭東,周琳娜,任婷.ChatGPT帶來的網(wǎng)絡(luò)安全風(fēng)險挑戰(zhàn)及應(yīng)對舉措[J].工業(yè)信息安全,2023(2):73-78.
[6] SKAVRONSKAYA L,HADINEJAD A H,COTTERELL D.Reversing the threat of artificial intelligence to opportunity:a discussion of ChatGPT in tourism education[J].Journal of Teaching in Travel & Tourism,2023,23(2):253-258.
[7] 張?jiān)榔?,吳學(xué)濤,苗壯,等.一種基于人工智能技術(shù)的服務(wù)型機(jī)器人及控制系統(tǒng).CN202210862656.9[2023-10-16].
[8] 王智.淺談人工智能在自動駕駛技術(shù)中的應(yīng)用[J].電腦樂園, 2023(1):25-27.
【通聯(lián)編輯:唐一東】