2023年是“百模大戰(zhàn)”的一年,經(jīng)過一年時間的快速發(fā)展,國內(nèi)外主流的通用大模型不斷迭代和進化,綜合能力獲得了大幅提升,為它們在商業(yè)場景中的使用奠定了基礎。2024年則是大模型的應用元年,在各行各業(yè)全面開花,越來越多的企業(yè)用開放的姿態(tài)擁抱大模型。大模型在企業(yè)落地的方式有很多種,目前在全球范圍內(nèi)被普遍認可的是“LLM+Agent”的模式,即AI Agent(智能體)。
何為AI Agent
Agent的概念最早由人工智能之父馬文·明斯基(Marvin Lee Minsky)在他的著作《心智社會》(1985年出版)中提出。后來,羅素、諾維格、彼得在他們的著作《人工智能:現(xiàn)代研究方法》(1995年出版)一書中對Agent做了更詳細的描述:“Agent是任何可以被視為通過傳感器感知其環(huán)境并通過執(zhí)行器作用于該環(huán)境的東西,能夠在這個環(huán)境中自主行動,以實現(xiàn)其設計目標,并賦予Agent自主性、反應性、社會能力及主動性等屬性?!盇gent可能很復雜,也可能很簡單。復雜的比如人和動物,簡單的比如各種工業(yè)控制系統(tǒng)。
AI Agent是基于LLM構建的Agent,OpenAI將其定義為:“以LLM為大腦驅動,具有自主理解感知、規(guī)劃、記憶和使用工具的能力,能自動化執(zhí)行完成復雜任務的系統(tǒng)?!盠LM具備理解、生成、邏輯、記憶等能力,使得AI Agent成為一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。比如告訴 AI Agent 幫你安排出差行程,它會自動幫你完成行程規(guī)劃、機票預訂、酒店預訂等一系列工作,無需人工操作。
從AI Agent的定義可以看出,AI Agent能根據(jù)外界環(huán)境的變化自動調(diào)整自己的行為和狀態(tài),還具備對外界的刺激作出反應的能力,同時還能與其他智能體或人進行合作,不同的智能體可根據(jù)各自的意圖與其他智能體進行交互,以達到解決問題的目的。在不斷解決問題的過程中,AI Agent以進行智能和體能積累,并修改自己的行為以應對新環(huán)境。有了這些特性,AI Agent就能在各種應用場景中表現(xiàn)出足夠的主動能力,并發(fā)揮重要作用。將AI Agent應用的整個原理簡單概括,即AI Agent通過收集和分析數(shù)據(jù),對其進行預處理,根據(jù)機器學習算法做出決策,采取行動并接收反饋。
AI Agent在出版業(yè)的應用場景
前面概括性地介紹了AI Agent的定義、特征和原理,接下來簡單梳理一下AI Agent在出版業(yè)中有哪些應用場景。
選題策劃。在選題策劃的過程中,我們經(jīng)常需要定期跟蹤和刷新對某些技術領域的最新信息。過去的做法是,我們首先需要鎖定一些優(yōu)質(zhì)的信息源,然后定期閱讀和學習它們提供的信息。有了AI Agent之后,我們可以讓AI Agent快速獲取并整理全球各種信息渠道提供的相關信息,大幅提升了我們獲取信息的效率。在外版選題的策劃過程中,我們經(jīng)常需要定期到國外的一些網(wǎng)站上挖掘一些新作品,也可以通過類似的AI Agent來實現(xiàn)。
圖書寫作。很多作者在寫作前,都需要搜集、閱讀大量資料,然后從這些資料中提煉、抽取有價值的內(nèi)容放到書稿中。傳統(tǒng)的人工方式耗時費力,我們可以設計一個AI Agent,把搜集到的所有資料上傳到AI Agent的知識庫中,作者只需要告訴AI Agent主題,它就能從海量的知識庫中快速提取出相應的內(nèi)容,大幅提升了寫作的效率。比如,你正在寫作一本數(shù)據(jù)要素相關的書,搜集和整理了大量關于數(shù)據(jù)要素的政策、法規(guī)類文件,現(xiàn)在你可以設計一個輔助寫作的AI Agent,把你搜集到的文件上傳到知識庫中,你就可以根據(jù)你的需求讓AI Agent幫你快速整理各種信息。
圖書翻譯。翻譯是大模型最擅長的領域之一,在AI Agent出現(xiàn)之前,使用AI工具翻譯書稿時,我們需要頻繁輸入翻譯提示詞,而且隨著對話長度的增加,翻譯的質(zhì)量會不斷下降,因為AI沒有記憶,而且每個對話的上下文長度有限制。如果設計一個專門用于翻譯的AI Agent,不僅可以完全避免上面的兩個問題,還能精準地處理不同領域專業(yè)術語不一致的問題,大幅提升翻譯的效率。如今在翻譯領域,AI Agent已經(jīng)達到了專業(yè)級的水準,可以在出版行業(yè)工程化使用。
稿件潤色。對書稿進行潤色是我們編輯的主要工作之一,也是編輯工作中最耗時的環(huán)節(jié)。在AI Agent出現(xiàn)之前,用AI工具進行潤色時,同樣存在需要頻繁輸入潤色指令和潤色效果會隨著會話長度的增加而下降等問題。專門用于潤色的AI Agent可以很好地解決這兩個問題。
除了以上四個典型的場景外,AI Agent在出版領域還有很多應用場景,比如出版生產(chǎn)和市場營銷等。
AI Agent設計工具的選型與組件構成
工欲善其事,必先利其器。那么,如何才能獲得滿足我們自身需求的AI Agent呢?方式一般有兩種:到各種主流的AI Agent平臺上尋找平臺提供的AI Agent,或利用AI Agent平臺提供的功能,根據(jù)自己的需求自行設計。
目前,國內(nèi)主流的AI Agent平臺有如下幾種:由百度推出的基于文心大模型的文心智能體平臺,支持廣大開發(fā)者根據(jù)自身行業(yè)領域、應用場景,選不同類型的開發(fā)方式,打造大模型時代的產(chǎn)品能力;由字節(jié)跳動推出的AI聊天機器人Coze(扣子),支持30秒無代碼生成AI Bot,適于快速創(chuàng)建、調(diào)試和優(yōu)化AI聊天機器人的應用程序;字節(jié)跳動旗下的飛書智能伙伴,支持多款大模型及用戶自定義構建智能伙伴;阿里巴巴推出的智能化工具釘釘AI助理,允許用戶根據(jù)需求創(chuàng)建個性化AI助理;智譜推出的生成式AI智譜清言,用戶科技與ChatGLM構建各種AI Agent;一個開源的LLM應用開發(fā)臺Dify.AI,支持用戶以零代碼或低代碼的方式創(chuàng)建AI Agent;騰訊推出的騰訊元器,依托于騰訊混元大模型,允許用戶無須編寫代碼即可創(chuàng)建和部署AI Agent,實現(xiàn)聊天對話、內(nèi)容創(chuàng)作、圖像生成等功能。這些平臺的功能大同小異,基于這些平臺開發(fā)AI Agent的方法和步驟也基本相同,但是每個平臺底層的通用大模型不一樣,每個平臺的生態(tài)也不一樣。
要設計自己的AI Agent,必須懂得AI Agent的主要組件和工作原理。而在掌握了這些基礎知識后,即便你沒有任何編程基礎,也可以用零代碼的方式設計自己的AI Agent。如果你想設計符合自己需求的AI Agent,只需要結合AI Agent設計平臺的官方文檔和案例演示來操作即可,并不復雜。其中的關鍵點在于能寫好提示詞并清晰梳理AI Agent的作業(yè)流程。進一步鉆研學習,一定能開發(fā)出各種各樣能滿足日常工作需求的AI Agent。AI Agent是當前全球主流的大模型落地方式,能真正讓大模型的能力賦能各行各業(yè),未來每個人都要有設計AI Agent的能力,人人都應該成為AI Agent設計師,大幅提升工作效率和質(zhì)量。
(本文作者為機械工業(yè)出版社華章分社計算機圖書事業(yè)部負責人)