Agent 的概念和演变

Agent 一词起源于拉丁语 agere，意思是“行动”、“去做”或“驱动”。这个词最朴素的含义，是“代替某人行动的人或实体”。

在人工智能领域，Agent 也不是 ChatGPT 出现之后才被发明的新词。AI 先驱艾伦·图灵（Alan Turing）在提出“图灵测试”时，就将具备与人类相当智能行为的人工实体称为 Agent。在强化学习理论中，Agent 被定义为与环境进行交互、做出决策并采取行动的智能实体。经典教材《Artificial Intelligence: A Modern Approach》就用智能体作为组织人工智能知识的重要线索：一个智能系统并不只是被动地计算答案，它要感知自己所处的环境，并采取行动影响这个环境。

所以，Agent 的核心特点包括以下四个方面：感知、理解、规划、执行。

为什么 ChatGPT 之后 Agent 重新变得重要

既然 Agent 不是新词，为什么它在 ChatGPT 之后突然变得重要？原因在于：过去的系统缺少一种足够通用的“理解目标”的能力。

在 ChatGPT 之前，很多自动化系统已经很强。搜索引擎能帮你找资料，脚本能帮你批量处理文件，推荐系统能根据行为预测偏好。但最关键的瓶颈在于：用户无法利用自然语言来表达不精确的意图。

2022 年 11 月 30 日，OpenAI 发布 ChatGPT，这给 Agent 补上了最关键的一块拼图。但 ChatGPT 或者说大语言模型本身还不是 Agent，它可以理解，可以规划，但是缺少核心的闭环：执行。

Agent 的四次能力迭代

从 2022 年底到现在，Agent 的演进可以不用按产品名背诵。更清晰的看法是：它经历了几次能力边界的扩展。

agent-evolution

时间	能力阶段	代表事件	意义
2022 年底	自然语言对话	ChatGPT 发布	自然语言成为新的交互入口
2023 年	工具调用	工具调用、代码执行、自主 Agent 实验兴起	LLM 开始连接外部世界
2024 年	工作流	多模态、长上下文、计算机或浏览器操作、Agent 框架成熟	Agent 开始处理更长链路任务
2024-2025 年	生态协作	MCP 等上下文和工具协议出现，多 Agent 与 AgentOps 发展	Agent 从单点能力走向工程生态

第一阶段：从命令到对话：早期人机交互更像“发命令”，你必须用系统能理解的方式表达需求，比如命令行、按钮、表单、配置文件，本质上都要求人适应机器。ChatGPT 之后，机器开始适应人的表达，自然语言第一次成为大规模可用的软件入口，人终于可以用自己的语言描述目标。
第二阶段：从回答到调用工具：只会回答问题的 LLM 有一个明显限制，它无法直接影响外部世界。工具调用补上了这只改变外部世界的“手”。当模型可以调用搜索、数据库、代码解释器、文件系统、业务 API 时，它就不再只是生成文本，而是可以把文本变成行动，大模型也即将从会说变成会做。
第三阶段：从单步响应到任务工作流：真实任务往往不是一步完成的，系统不只是回答当前这一问，而是围绕一个目标持续推进：记录当前状态，决定下一步行动，观察执行结果，再继续调整。这一步让 Agent 开始接近真实工作中的“任务承担者”。
第四阶段：从单个助手到持续协作：当任务继续变复杂，一个 Agent 也会遇到边界。多 Agent 系统开始出现，它们背后的共同方向是：让 Agent 不只是一个孤立助手，而是进入更大的软件生态，和工具、数据、流程、其他 Agent 协作。

Agent 的愿景：让人回到创造本身

如果把上面的变化串起来，你会看到一条很清晰的线：

text

LLM 让机器理解语言
工具调用让机器影响世界
工作流让机器持续推进任务
多 Agent 和协议生态让机器进入复杂协作

Agent 不会只是 LLM 的一个应用形态，而会成为 LLM 通往现实世界的入口。

但也别急着过于乐观，我们不能把 Agent 神化。Agent 的底层仍然是 LLM，而 LLM 本身有天然边界：它擅长从已有语料和上下文中归纳、重组、预测、执行，却并不天然拥有真正的创意、幽默感、想象力和审美能力。

所以，Agent 的任务不是替代人的全部能力，而是替代那些可描述、可拆解、可执行、可验证的重复劳动。

人类的任务，则会越来越集中在另一侧：

text

提出值得追问的问题
想象尚不存在的可能性
创造新的表达和作品
判断什么是好的、重要的、美的
为技术设定方向和边界

未来真正稀缺的，不是会不会操作某个软件，也不是能不能记住一套流程，而是想象力、创造力和审美能力。

Agent 的终点，不是让人变得无事可做，而是让人不再被重复执行困住。它应该把人从机械劳动中解放出来，让人把精力重新放回创造、创作和审美上。

Agent 的概念和演变 ​

为什么 ChatGPT 之后 Agent 重新变得重要 ​

Agent 的四次能力迭代 ​

Agent 的愿景：让人回到创造本身 ​

Agent 的概念和演变

为什么 ChatGPT 之后 Agent 重新变得重要

Agent 的四次能力迭代

Agent 的愿景：让人回到创造本身