OpenAI發(fā)布了首款AI智能體Operator,能夠代理用戶執(zhí)行基于網(wǎng)頁的操作。據(jù)介紹,Operator由一個名為CUA的新模型驅(qū)動,結合了GPT-4o的視覺能力,以及通過強化學習達成的高級推理能力。經(jīng)過訓練后,Operator能夠“看見”瀏覽器中的內(nèi)容,并使用鼠標和鍵盤允許的所有操作與網(wǎng)頁進行互動。例如,官方演示了Operator預定飯店和在購物網(wǎng)站購物等案例。不過,OpenAI也提醒使用者,雖然Operator已經(jīng)是市面上最強的AI代理,但與人類相比還存在很大差距,所以這項新技術仍有可能出錯,不過會在未來數(shù)月里持續(xù)改進。