Workflow 和 Agent 最本质的区别是什么？

一句话：Workflow 是按人提前规定好的步骤执行，Agent 是自己决定该执行哪些步骤。哪怕一条流程有几十个环节，只要路线是人写死的，它就还是 Workflow，AI 只是个执行工。Agent 的关键在于「自主」——它会自己判断下一步做什么、走不通时换条路、信息不够时还会反过来问你。

一个完整的 Agent 由哪几部分组成？

大致五个零件：LLM 是大脑，负责理解任务、制定计划；Prompt 是岗位说明书，规定职责、边界和语气；Memory 是记忆，记住上下文和任务进展；External Knowledge 是外部知识，补上企业内部资料；Tools 是工具，让它能真正发邮件、下订单、做 PPT。但凑齐五个零件也不等于 Agent，关键看它有没有自主工作的能力。

ReAct 和前端的 React 是一回事吗？

完全不是。这里的 ReAct 是 Reasoning（推理）+ Acting（行动），是 Agent 的经典工作框架，和前端开发的 React 框架毫无关系。它描述的是 Agent 的循环方式：思考下一步、动手执行、检查结果、不满意就接着改——靠这个循环，Agent 才从「输出一段文字」变成「围绕目标把活干完」。

你说的 Agent，八成只是个 Workflow：差别不在步骤多少，在谁决定下一步

最近跟人聊 AI，发现一个特别普遍的现象：几乎所有人都在说 Agent，但十个人里有八个，嘴里的「Agent」其实只是一条 Workflow。

这不怪大家。这两个词长得太像，又总被混着用。可一旦你真要做产品、或者判断一个工具值不值钱，这条边界就绕不过去了。

所以今天我想把它彻底讲清楚，只回答两个问题：第一，LLM、Workflow、Agent 到底有什么区别；第二，一个完整的 Agent，是由哪些部分组成的。

我尽量不用术语，用一个你天天都会遇到的小事来串——「帮我把上次会议纪要总结一下，发到我邮箱」。

Workflow 和 Agent 的根本区别

一、LLM、Workflow、Agent：从「会回答」到「会干活」

先把三层楼一层一层往上盖。

第一层，LLM——一个会聊天的大脑。

像 ChatGPT、DeepSeek 这类工具，本质上就是基于 LLM 的聊天机器人。你输入一个问题，它给你一个回答。你问「给我一份会议纪要模板」，它当场就能生成，写得还挺像样。

但你换个问法：「我上一次会议是什么时候？」它就懵了。因为它没有你的日历、没有你的个人信息，它只会「说」，不会「查」。

第二层，接上工具、串成步骤——这就是 Workflow。

现在我们给它接一个日历工具。再问「上一次会议是什么时候」，它就能先去查日历，再回答你。

更进一步，你说：「帮我把上一次会议纪要总结一下，然后发到我邮箱。」这就不再是一问一答了，而是一串动作：先找到会议记录 → 再总结内容 → 再调用邮箱发送。

这种事先由人设计好的、固定的步骤链，就叫 Workflow。

它的特点是：哪怕中间有十几步、几十步，只要这条路线是人提前规定死的，它就还不是 Agent——AI 只是一个老老实实照着流程跑的执行工，一步都不许自己改。

第三层，让它自己决定怎么走——这才是 Agent。

同样是「总结上次会议纪要并发邮件」，换成一个 Agent，它的内心戏完全不一样：

我得先知道上一次会议是什么时候 → 去查日历 → 咦，日历里没有？那我试试腾讯会议 → 找到记录了 → 总结内容 → 等等，他没说发到哪个邮箱，我要不要先问他一下？

看到区别了吗？遇到日历查不到，它会自己换一个工具去试；信息不全，它会反过来跟你确认。这些「拐弯」都不是人提前写好的，是它当场自己判断出来的。

所以一句话收尾，把这条边界焊死：

Workflow 是按人规定好的步骤执行；Agent 是自己决定该执行哪些步骤。

LLM、Workflow、Agent 三层对比

二、把 Agent 想成一个「数字员工」

讲到这里，Agent 这个抽象的词，其实可以换一个特别接地气的说法：

它就是一个「数字员工」。

你可以把它想象成公司里的一个岗位——24 小时待命，不用请假、不用社保，成本还比真人低。也正因为这样，现在越来越多公司盯上了这种「数字劳动力」，而「会不会造 Agent」，正在变成一项硬核能力。

那么，要造出这么一个数字员工，得给它配齐哪些零件？大致是五个。

Agent 是一个数字员工

1. LLM——大脑。 负责理解人话、拆解任务、制定计划。这是整个 Agent 的发动机，没有这个「大脑」，下面四个零件都没有意义。

2. Prompt——岗位说明书。 它规定这个 Agent 的职责、边界和回复风格。就像你招一个客服，不能只甩一句「你去做客服」，你得告诉他该怎么处理问题、语气要多客气、哪些事绝对不能碰。

3. Memory——记忆。 设想一个员工每 30 秒就失忆一次，那根本没法干活。Memory 的作用，就是记住上下文、跟踪任务进展、把经验一点点攒下来。

4. External Knowledge——外部知识。 Agent 有通用常识，但它不知道你们公司的内部资料。所以你得喂给它企业知识库、产品文档、规章制度——让它从「博学的陌生人」变成「懂行的自己人」。

5. Tools——工具。 这是最关键的一块。注意，这里的「工具」不是扳手，而是电脑和手机里那些能动手干活的软件能力：发邮件、下订单、做 Excel、做 PPT……工具，才是让 AI 从「会聊天」真正变成「会干活」的那一步。

但我必须泼一句冷水：凑齐这五个零件，也不一定就是真正的 Agent。

最重要的从来不是「组件够不够多」，而是它有没有自主工作的能力。零件是身体，自主才是灵魂。

三、让它「活」起来的：Agent Loop 与 ReAct

那这个「自主」，具体是怎么运转起来的？

答案是 Agent Loop——Agent 的循环工作方式。其中最经典的一个框架，叫 ReAct。

先澄清一个特别容易踩的坑：这里的 ReAct，不是前端开发那个 React 框架，俩没半毛钱关系。 它是两个词的缩写——Reasoning（推理）+ Acting（行动），也就是「思考」和「行动」。

举个例子你立刻就懂。你让一个普通聊天机器人「做个竞品分析」，它大概率只能甩给你一段文字。但一个真正的 Agent 会怎么做？

它会自己打开网页 → 搜索竞争对手 → 整理数据 → 画成图表 → 然后回头检查：这结果符合要求吗？ 不满意，它就继续改，改完再检查。

这个过程拆开就是四个字循环：思考 → 行动 → 检查 → 再循环。

ReAct：思考、行动、检查、循环

这才是 Agent 和聊天机器人最深的那道分水岭：

聊天机器人，给你一个结果就结束了；而真正的 Agent，会自己检查这个结果，并在不满意时一遍遍改进。

写在最后

把这篇捋一遍，其实就一张图：

Agent 像一个数字员工——LLM 是大脑，Tools 是手脚，Memory 是记忆，External Knowledge 是资料库，Prompt 是岗位说明书。 但真正让它配得上「Agent」这个名字的，不是零件多全，而是它能不能围绕一个目标自主把活干完：会思考、会行动、会检查，还能不断调整。

所以下次再有人跟你吹「我们这是 AI Agent」，你只要问一句：它的步骤，是人提前写死的，还是它自己决定的？ 答案立刻就清楚了。

而这套东西，恰恰是我每天在做的事。Zaokit 就是我一个人带着一支 AI Agent 团队跑出来的产品——让它们真正去帮人把图文创作、PPT 生成这些活儿干完，而不是停在「会聊天」那一层。理解 Workflow 和 Agent 的边界，正是用好这一代 AI 的第一道门槛。

我是 Jason，一个独立打造 AI 产品的创业者。如果这篇帮你把 Workflow 和 Agent 分清楚了，欢迎转发给身边还在混用这两个词的朋友。

我一个人打造的 Zaokit AI 产品（https://zaokit.app）正在内测，助力大家高效完成图文创作和 PPT 生成，唯一网站：https://zaokit.app

最后，如果你认可 Zaokit AI 的产品理念，欢迎后台留言加入我们的社群。我们不卖课、不割韭菜，只聚焦 ToB 企业场景的 AI 落地实战。 希望在这里，能给你带来不一样的思维火花和真实的商业碰撞。

相关阅读：