Skip to content

Agent 的概念和演变

Agent 一词起源于拉丁语 agere,意思是“行动”、“去做”或“驱动”。这个词最朴素的含义,是“代替某人行动的人或实体”。

在人工智能领域,Agent 也不是 ChatGPT 出现之后才被发明的新词。AI 先驱艾伦·图灵(Alan Turing)在提出“图灵测试”时,就将具备与人类相当智能行为的人工实体称为 Agent。在强化学习理论中,Agent 被定义为与环境进行交互、做出决策并采取行动的智能实体。经典教材《Artificial Intelligence: A Modern Approach》就用智能体作为组织人工智能知识的重要线索:一个智能系统并不只是被动地计算答案,它要感知自己所处的环境,并采取行动影响这个环境。

所以,Agent 的核心特点包括以下四个方面:感知理解规划执行

为什么 ChatGPT 之后 Agent 重新变得重要

既然 Agent 不是新词,为什么它在 ChatGPT 之后突然变得重要?原因在于:过去的系统缺少一种足够通用的“理解目标”的能力。

在 ChatGPT 之前,很多自动化系统已经很强。搜索引擎能帮你找资料,脚本能帮你批量处理文件,推荐系统能根据行为预测偏好。 但最关键的瓶颈在于:用户无法利用自然语言来表达不精确的意图。

2022 年 11 月 30 日,OpenAI 发布 ChatGPT,这给 Agent 补上了最关键的一块拼图。但 ChatGPT 或者说大语言模型本身还不是 Agent,它可以理解,可以规划,但是缺少核心的闭环:执行

Agent 的四次能力迭代

从 2022 年底到现在,Agent 的演进可以不用按产品名背诵。更清晰的看法是:它经历了几次能力边界的扩展。

agent-evolution

时间能力阶段代表事件意义
2022 年底自然语言对话ChatGPT 发布自然语言成为新的交互入口
2023 年工具调用工具调用、代码执行、自主 Agent 实验兴起LLM 开始连接外部世界
2024 年工作流多模态、长上下文、计算机或浏览器操作、Agent 框架成熟Agent 开始处理更长链路任务
2024-2025 年生态协作MCP 等上下文和工具协议出现,多 Agent 与 AgentOps 发展Agent 从单点能力走向工程生态
  • 第一阶段:从命令到对话:早期人机交互更像“发命令”,你必须用系统能理解的方式表达需求,比如命令行、按钮、表单、配置文件,本质上都要求人适应机器。ChatGPT 之后,机器开始适应人的表达,自然语言第一次成为大规模可用的软件入口,人终于可以用自己的语言描述目标

  • 第二阶段:从回答到调用工具:只会回答问题的 LLM 有一个明显限制,它无法直接影响外部世界。工具调用补上了这只改变外部世界的“手”。当模型可以调用搜索、数据库、代码解释器、文件系统、业务 API 时,它就不再只是生成文本,而是可以把文本变成行动,大模型也即将从会说变成会做

  • 第三阶段:从单步响应到任务工作流:真实任务往往不是一步完成的,系统不只是回答当前这一问,而是围绕一个目标持续推进:记录当前状态,决定下一步行动,观察执行结果,再继续调整。这一步让 Agent 开始接近真实工作中的“任务承担者”。

  • 第四阶段:从单个助手到持续协作:当任务继续变复杂,一个 Agent 也会遇到边界。多 Agent 系统开始出现,它们背后的共同方向是:让 Agent 不只是一个孤立助手,而是进入更大的软件生态,和工具、数据、流程、其他 Agent 协作。

Agent 的愿景:让人回到创造本身

如果把上面的变化串起来,你会看到一条很清晰的线:

text
LLM 让机器理解语言
工具调用让机器影响世界
工作流让机器持续推进任务
多 Agent 和协议生态让机器进入复杂协作

Agent 不会只是 LLM 的一个应用形态,而会成为 LLM 通往现实世界的入口。

但也别急着过于乐观,我们不能把 Agent 神化。Agent 的底层仍然是 LLM,而 LLM 本身有天然边界:它擅长从已有语料和上下文中归纳、重组、预测、执行,却并不天然拥有真正的创意、幽默感、想象力和审美能力。

所以,Agent 的任务不是替代人的全部能力,而是替代那些可描述、可拆解、可执行、可验证的重复劳动。

人类的任务,则会越来越集中在另一侧:

text
提出值得追问的问题
想象尚不存在的可能性
创造新的表达和作品
判断什么是好的、重要的、美的
为技术设定方向和边界

未来真正稀缺的,不是会不会操作某个软件,也不是能不能记住一套流程,而是想象力创造力审美能力

Agent 的终点,不是让人变得无事可做,而是让人不再被重复执行困住。它应该把人从机械劳动中解放出来,让人把精力重新放回创造、创作和审美上。