Agent 的概念和演变
Agent 一词起源于拉丁语 agere,意思是“行动”、“去做”或“驱动”。这个词最朴素的含义,是“代替某人行动的人或实体”。
在人工智能领域,Agent 也不是 ChatGPT 出现之后才被发明的新词。AI 先驱艾伦·图灵(Alan Turing)在提出“图灵测试”时,就将具备与人类相当智能行为的人工实体称为 Agent。在强化学习理论中,Agent 被定义为与环境进行交互、做出决策并采取行动的智能实体。经典教材《Artificial Intelligence: A Modern Approach》就用智能体作为组织人工智能知识的重要线索:一个智能系统并不只是被动地计算答案,它要感知自己所处的环境,并采取行动影响这个环境。
所以,Agent 的核心特点包括以下四个方面:感知、理解、规划、执行。
为什么 ChatGPT 之后 Agent 重新变得重要
既然 Agent 不是新词,为什么它在 ChatGPT 之后突然变得重要?原因在于:过去的系统缺少一种足够通用的“理解目标”的能力。
在 ChatGPT 之前,很多自动化系统已经很强。搜索引擎能帮你找资料,脚本能帮你批量处理文件,推荐系统能根据行为预测偏好。 但最关键的瓶颈在于:用户无法利用自然语言来表达不精确的意图。
2022 年 11 月 30 日,OpenAI 发布 ChatGPT,这给 Agent 补上了最关键的一块拼图。但 ChatGPT 或者说大语言模型本身还不是 Agent,它可以理解,可以规划,但是缺少核心的闭环:执行。
Agent 的四次能力迭代
从 2022 年底到现在,Agent 的演进可以不用按产品名背诵。更清晰的看法是:它经历了几次能力边界的扩展。
| 时间 | 能力阶段 | 代表事件 | 意义 |
|---|---|---|---|
| 2022 年底 | 自然语言对话 | ChatGPT 发布 | 自然语言成为新的交互入口 |
| 2023 年 | 工具调用 | 工具调用、代码执行、自主 Agent 实验兴起 | LLM 开始连接外部世界 |
| 2024 年 | 工作流 | 多模态、长上下文、计算机或浏览器操作、Agent 框架成熟 | Agent 开始处理更长链路任务 |
| 2024-2025 年 | 生态协作 | MCP 等上下文和工具协议出现,多 Agent 与 AgentOps 发展 | Agent 从单点能力走向工程生态 |
第一阶段:从命令到对话:早期人机交互更像“发命令”,你必须用系统能理解的方式表达需求,比如命令行、按钮、表单、配置文件,本质上都要求人适应机器。ChatGPT 之后,机器开始适应人的表达,自然语言第一次成为大规模可用的软件入口,人终于可以用自己的语言描述目标。
第二阶段:从回答到调用工具:只会回答问题的 LLM 有一个明显限制,它无法直接影响外部世界。工具调用补上了这只改变外部世界的“手”。当模型可以调用搜索、数据库、代码解释器、文件系统、业务 API 时,它就不再只是生成文本,而是可以把文本变成行动,大模型也即将从会说变成会做。
第三阶段:从单步响应到任务工作流:真实任务往往不是一步完成的,系统不只是回答当前这一问,而是围绕一个目标持续推进:记录当前状态,决定下一步行动,观察执行结果,再继续调整。这一步让 Agent 开始接近真实工作中的“任务承担者”。
第四阶段:从单个助手到持续协作:当任务继续变复杂,一个 Agent 也会遇到边界。多 Agent 系统开始出现,它们背后的共同方向是:让 Agent 不只是一个孤立助手,而是进入更大的软件生态,和工具、数据、流程、其他 Agent 协作。
Agent 的愿景:让人回到创造本身
如果把上面的变化串起来,你会看到一条很清晰的线:
LLM 让机器理解语言
工具调用让机器影响世界
工作流让机器持续推进任务
多 Agent 和协议生态让机器进入复杂协作Agent 不会只是 LLM 的一个应用形态,而会成为 LLM 通往现实世界的入口。
但也别急着过于乐观,我们不能把 Agent 神化。Agent 的底层仍然是 LLM,而 LLM 本身有天然边界:它擅长从已有语料和上下文中归纳、重组、预测、执行,却并不天然拥有真正的创意、幽默感、想象力和审美能力。
所以,Agent 的任务不是替代人的全部能力,而是替代那些可描述、可拆解、可执行、可验证的重复劳动。
人类的任务,则会越来越集中在另一侧:
提出值得追问的问题
想象尚不存在的可能性
创造新的表达和作品
判断什么是好的、重要的、美的
为技术设定方向和边界未来真正稀缺的,不是会不会操作某个软件,也不是能不能记住一套流程,而是想象力、创造力和审美能力。
Agent 的终点,不是让人变得无事可做,而是让人不再被重复执行困住。它应该把人从机械劳动中解放出来,让人把精力重新放回创造、创作和审美上。