「循环工程（Loop Engineering）」到底是什么？和写提示词有啥不一样？

写提示词，是你给 AI 一条指令、它给你一个输出，然后你自己来当那个「检查、纠错、再发指令」的循环——你是回路里的人肉齿轮。循环工程，是你把这个圈本身设计出来：给 AI 一个目标和一套验证标准，让它自己走完「发现→规划→执行→验证→迭代」，过了验证就交付，没过就再转一圈，全程不用你一步步盯。说白了，提示词给的是一条指令，循环给的是一份工作。最顶尖的 AI 工程师现在的活，不是写更漂亮的句子，而是写那套管着 AI 怎么发现、怎么自查、怎么知道自己做完了的逻辑。

既然循环这么强，为什么大多数人到现在都没真正用起来？

因为没人挑明的那个拦路虎不是「不会设计」，是「烧不起」。一次中等规模的单 agent 循环，轻松烧掉 5 万到 20 万 token；一套带编排和几个专家 agent 的舰队循环，能到 50 万甚至几百万；再挂上每天定时跑，就是每周几百万 token。每一次重试、每一次自我纠错、每一个子 agent、每一道验证，都在烧钱。那种「放开了让它自己探索」的开环，烧 token 的速度能让你眼睛发酸。这就是为什么循环工程在普通预算上很快就崩——它不是难在设计，是难在你养不养得起。这也正是便宜的国产前沿模型真正改变的东西：当 token 足够便宜，循环才第一次变得人人玩得起。

一个普通的小团队，今天到底该从哪种循环入手？

从「闭环」入手，别一上来就玩「开环」。开环是放开了让 agent 自由探索，威力大、也最烧钱，今天基本是少数有近乎无限预算的人在玩；指向一个标准松散的项目，它就是台「废品制造机」，又快又乱又贵。闭环是你先把这条路从头到尾画好：清晰的目标、定好的步骤、每一步都有一道评估、一个明确的停下来或交还给你的点——agent 还是在循环，但是在你搭好的框架里循环。它每跑一轮都更好，因为这一轮的结果喂给了下一轮；它能在正常预算上跑，因为路是收紧的；它靠那道质量闸保持诚实。先用闭环搭出一套能稳定干活的系统，等你有了过硬的质量闸，再去把它放开。

别再给 AI 写提示词了——两个最顶尖的 AI 工程师，都在写『循环』

最近，两个我很服气的 AI 工程师，几乎前后脚说了同一句话。

一个是开源工具 OpenClaw 的作者、今年初加入 OpenAI 的 Peter Steinberger，他在网上写道：

「你不该再给你的编程 agent 写提示词了。你该去设计那些『替你给 agent 写提示词』的循环。」

另一个是 Anthropic 那边主导 Claude Code 的 Boris Cherny，他换了个说法，讲的是同一件事：

「我已经不再亲自给 Claude 写提示词了。我有一堆循环在跑，是它们在给 Claude 写提示词、替我盘算下一步该干啥。我的活，就是写循环。」

两个站在最前线的人，同一个意思。

大多数人看完，第一反应是：这听着挺高大上——可这到底是个啥意思？

我花了点时间，认认真真把它捋了一遍。这篇就一层层拆给你看，不堆术语，只讲你真正用得上的那套脑子里的模型。

别再给 AI 写提示词了，去写循环

但在拆它之前，我得先讲一件几乎没人在台面上挑明的事。

先说那个没人挑明的拦路虎

循环听起来很美。然后你看到账单。

一次中等规模的单 agent 循环，轻松烧掉 5 万到 20 万 token。一套带编排器加三个专家 agent 的舰队循环，50 万到几百万 token。再挂上每天定时跑——那就是每周几百万 token。

按主流 API 的标价，认真玩一周循环工程的花费，比很多人一整个月的 AI 预算还高。

这就是为什么 Steinberger 那条帖子底下，一堆人回他：「你说得轻巧——你有用不完的额度。」他们没说错。 在正常预算上搞循环工程，崩得飞快。每一次重试都烧钱，每一次自我纠错都烧钱，每一个子 agent、每一道验证，都在烧钱。那个放开了自由探索的开环，烧 token 的速度能让你眼睛发酸。

所以记住这句反直觉的话：循环不难设计，难在你养不养得起。

而这，恰恰是便宜的国产前沿模型真正改变的东西。像 DeepSeek、Kimi、MiniMax 这些模型，把「跑循环」这件事从经济上变得可行了。自主 agent 最大的瓶颈，从来不是智商，是 token 烧得太快。当 token 足够便宜、上下文足够长，长时间跑的循环才第一次能撑得住、又养得起。

先把这个成本前提钉在脑子里，下面所有的设计才有意义。

旧玩法 vs 新玩法

过去两年，我们都是一条任务一条任务地给 agent 写提示词。

你敲一段提示词，它给你回一段，你审一遍，把不对的改掉，再敲下一段……你，就是那个循环。

新玩法是：你不再亲自驱动每一步。你设好一个目标，搭起一个循环，让它自己走完发现、规划、干活、检查、迭代——直到目标达成。

旧玩法（写提示词）：你 → 提示词 → agent → 输出 → 你审 → 你改 → 再来一遍。
新玩法（写循环）：你设好目标 → 循环启动 → agent 发现 → 规划 → 执行 → 验证 → 迭代 → 完成。

一句话：提示词，给的是一条指令；循环，给的是一份工作。

循环工程，到底是什么

循环工程，就是去设计一套可重复的反馈循环，把 AI agent 从「尝试」一路领到「被验证过的结果」，中间不需要人一直插手。

它不是什么神秘的新框架。几乎任何 agent 工具都能跑，区别只在于你怎么把它接起来。最简单的形态，就是一个 agent 自己跟自己较劲：查资料 → 出草稿 → 拿草稿对着目标自查 → 把弱的地方改掉 → 再转一圈，直到这活过了线。

不管简单还是复杂，每个循环都走同样的五步：

发现 → 规划 → 执行 → 验证 → 迭代。

过了验证，交付；没过，再转一圈。这就是全部。这篇后面所有内容，都只是在讲：怎么把这个圈搭得靠谱。

一个 agent，还是一支舰队

循环有两种规模。

单 agent 循环。 一个 agent 自己跑完整个圈，像一个人反复打磨自己的草稿：发现需要啥、规划、执行、自查、不对就再迭代。适合：聚焦的任务、简单的目标、有限的范围。一个脑子，一个圈，自我改进。

舰队循环。 你给一个编排器 agent 一个目标，它把目标拆成几块，每块交给一个专家 agent，专家再把更小的活分给自己的子 agent。整棵树一起循环，直到目标达成。

编排器扛总目标 → 专家们扛各自的环节 → 子 agent 干最窄的活 → 一道道评估闸守着，别让它产出一堆「废品」。

比如「做一个效率类 App」：编排器扛着整个使命，下面分出研究专家、工程专家、QA 专家，每个专家再带自己的子 agent（网页调研、写代码、调试、写测试、追 bug）。树上的每一个 agent，都在跑同样的五步循环。

说白了：单 agent 循环，像一个人反复改自己的稿子；舰队循环，像一整支团队从头到尾跑一个项目。

开环 vs 闭环：2026 年最该搞懂的一个区别

这是今天最要紧的一条实务分界。

开环。 探索型，给 agent 一个目标，放它去撒野——它能试各种路子、撞见你没想到的东西、做出你压根没细想过的方案。这是最激动人心的那一端，也是最烧 token 的那一端。对 90% 没有无限额度的人来说，开环现在还不实用；要是再把它指向一个标准松散的项目，它立马变成一台「废品制造机」：又快、又乱、又贵。

闭环。 有边界。一个人先把从头到尾的路画好：清晰的目标、定好的步骤、每一步一道评估、一个明确「停下来或交还给你」的点。agent 还是在循环，但是在你搭的框架里循环。它每跑一轮都更好——因为这一轮喂给了下一轮；它能在正常预算上跑——因为路是收紧的；那道质量闸让它保持诚实。

没有质量闸，AI 会漂移；有了质量闸，AI 会变好。

该用哪个？先上闭环。 把一套能稳定干活的紧凑系统搭出来，等你有了过硬的质量闸，再去把它放开。

开环 vs 闭环：先把圈收紧，再谈放开

一个好循环，要装的 6 个零件

五步是「概念」。落到地上，你到底要搭哪些东西？6 个。Claude Code 和 Codex 现在都齐了。我把每个零件，对应到它在循环里干的活：

自动化（Automations）——循环的心跳，负责触发「发现」。它才是让循环成为「循环」、而不是「你手动跑过一次」的东西。你定好提示词、节奏和目标，它就按时跑，结果自己送上门。比如 /loop 按节奏重跑，/goal 一直跑到你写的某个条件真的成立为止：「test/auth 下所有测试通过、lint 干净」——设好，走人。
工作树（Worktrees）——让多个「执行」并行，又不互相踩脚。一旦你跑不止一个 agent，文件就开始打架——两个 agent 改同一个文件，跟两个工程师不打招呼就往同几行提交，是一模一样的乱。一个 git worktree 给每个 agent 一份隔离的工作目录、各自一条分支，同一份仓库历史，零冲突。
技能（Skills）——让「发现」更快，agent 还没动手就已经懂你的项目。一个 skill 就是一个带 SKILL.md 的文件夹：项目约定、构建步骤、「我们因为上次那个事故，绝不这么干」。写一次，每轮循环都读。没有 skills，循环每一轮都从零重新推导你的项目；有了，它会复利。常见的几份：VISION.md（成功长啥样）、ARCHITECTURE.md（技术栈和目录结构）、RULES.md（绝对不许干的事）。
插件与连接器（Plugins & Connectors）——让「执行」动真格，循环能在你真实的环境里动手，而不只是在文件系统里。只能看见文件系统的循环，是个小循环。连接器（建在 MCP 上）让 agent 能读你的工单系统、查数据库、打 staging 的 API、往 Slack 丢条消息。这就是「它说『这是修复方案』」和「它自己开了 PR、关联了工单、等 CI 绿了再去频道里 @ 你」之间的区别。
子 agent（Subagents）——让「验证」诚实，检查的那个，永远不是动手的那个。写代码的模型，给自己批作业时太手软。换一个带着不同指令、有时甚至是不同模型的 agent，能逮住第一个自己把自己说服了的东西。最管用的分工：一个负责探索，一个负责实现，一个负责对着规格验收。 /goal 底层就是这么干的——由一个全新的模型来判断这个循环是不是真做完了，而不是那个干活的。
记忆（Memory）——让循环能持续，第 47 轮的「发现」知道前 46 轮都试过些啥。它可以只是一个 markdown 文件、一块看板，任何活在「单次对话」之外的东西。模型每轮之间会忘光，仓库不会。记忆文件存着：试过啥、过了啥、还有啥没解决。明早，循环从今天停下的地方接着走。简单到不像回事，可每一个长时间跑的循环，都靠它。

一个好循环的 6 个零件，各管循环的哪一段

几个真实的循环，长啥样

编程循环：读 VISION.md + ARCHITECTURE.md → 规划下一处改动 → 改代码 → 自动跑测试 → 测试挂了就读报错、修、再测 → 测试过了就总结改动 → 停。中间没有人，agent 自己写、自己测、自己修、自己验。

研究循环：定研究问题 → 搜信源 → 总结 → 拿结论对着原始信源核验 → 比对矛盾的信息 → 综合出答案 → 置信度达标就停。

内容循环：定好主题、读者、目标 → 出草稿 → 批判 agent 审稿 → 按意见重写 → 对着成功标准打分 → 过了发布，没过再重写。

销售触达循环：定义理想客户画像（ICP）→ 找匹配的线索 → 补全公司数据 → 按标准筛 → 个性化文案 → 质量复查 → 发送，或升级给人。

每一个循环，都是同一副骨架：目标 → 动作 → 检查 → 修正 → 重复，直到做完。

提示词工程师 vs 循环工程师

这是 2026 年正在裂开的一道技能鸿沟。

提示词工程师：打磨更好的指令，靠的是语言能力；更好的提示词 → 更好的单次输出；每跑一次，还得自己手动审一遍——你，就是那个反馈回路。

循环工程师：设计更好的反馈循环，靠的是软件工程能力；更好的循环 → 可靠的、被验证过的结果；系统自己跑、自己查、自己纠错——系统，就是那个反馈回路。

提示词工程师说「给我写个函数」；循环工程师说「写 → 测 → 修，直到全绿」。工具是同一套，脑子完全是两套。提示词工程师向 AI 要输出；循环工程师设计出『能产出被验证结果』的系统。

2026 年那批薪水最高的 AI 工程师，不是在写更漂亮的英文句子。他们在写的，是那套管着 agent 怎么发现、怎么规划、怎么自查、怎么知道自己做完了的逻辑。

提示词工程师 vs 循环工程师：杠杆点挪了位置

把这套东西，落到我自己身上

讲到这儿你会发现，循环工程整套东西，本质上是在把「低成本、快速试一遍」这件事，做成一台能自己转的机器——而它真正的门槛，从来不是聪明，是 token 烧得起。

这也正是我每天在干的事。我一个人做的 Zaokit，想干的就是把这种能力塞进普通人的日常：你不用懂任何技术，把要做的事说清楚，它就帮你麻利地把图文、PPT 做出来——说白了，是帮你用最低的成本，先把脑子里那个还很糙的想法跑出个第一版，你再在它基础上挑刺、改、迭代。唯一网站：https://zaokit.app。

而把这种能力做成企业能放心用的底座，也是我一直在做的：cx.zaokit.com、cc.zaokit.com、tokenhub.zaokit.ai、gift.junxinzhang.com 以及更多项目，已经融进了不少公司的真实流程里，是稳定靠谱、开箱即用的 AI 全家桶。其中像 Token Hub 干的，正是循环工程的前提那一步——把全公司零散的 token 消耗先收成一个统一的底座，让「养得起循环」这件事，第一次成立。

写在最后

把整篇收一下：

那个转变：过去两年我们一条任务一条任务地写提示词 → 现在去设计跑完整圈的循环。
6 个零件：自动化（心跳）、工作树（并行不踩脚）、技能（每轮复利的项目知识）、插件与连接器（在真实工具里动手）、子 agent（做的人和查的人永远分开）、记忆（循环之间不遗忘）。
两种规模：单 agent，一个脑子自我改进；舰队，编排器 + 专家 + 子 agent，每个都跑同样的圈。
两种类型：开环，探索、强大、昂贵、要近乎无限的预算；闭环，有边界、可靠、养得起，今天真正划算的那个。
成本真相：循环烧 token 烧得飞快，便宜的国产前沿模型把最后那道拦路虎挪开了。

但最后，我想说一件这篇里没人挑明的事。

两个人搭出一模一样的循环，结果可能完全相反。 一个用它，在自己真懂的事上跑得更快；另一个用它，是为了从此不用再懂这件事。循环分不清这两者，你能。

这恰恰是循环工程比提示词工程更难、而不是更省心的地方。Boris Cherny 的意思，从来不是「活变简单了」，而是杠杆点挪了位置。把循环搭起来——但要像一个「打算一直当工程师的人」那样去搭，而不只是按下启动键的那个人。

因为一个靠谱的循环，顶得上一千条完美的提示词。 而当 token 终于便宜到你养得起，你才第一次真的有资格，去搭这么一个循环。

我是 Jason，一个自己一个人做 AI 产品的创业者。如果这篇让你想把「写提示词」升级成「写循环」，欢迎转发给那个也在认真跟 AI 较劲的朋友。

相关阅读：

</content> </invoke>

别再给 AI 写提示词了——两个最顶尖的 AI 工程师，都在写『循环』

常见问题

「循环工程（Loop Engineering）」到底是什么？和写提示词有啥不一样？

既然循环这么强，为什么大多数人到现在都没真正用起来？

一个普通的小团队，今天到底该从哪种循环入手？

先说那个没人挑明的拦路虎

旧玩法 vs 新玩法

循环工程，到底是什么

一个 agent，还是一支舰队

开环 vs 闭环：2026 年最该搞懂的一个区别

一个好循环，要装的 6 个零件

几个真实的循环，长啥样

提示词工程师 vs 循环工程师

把这套东西，落到我自己身上

写在最后

同分类推荐 · AI

产品召回三端，我用 Codex 和 Stitch 两小时交了

黄仁勋说五年内很难泡沫：打个折扣，盯一个指标

LLM 不会给你最优排产，求解器会

Enjoyed this article?

关注微信公众号，获取更多AI前沿洞察

Written by Jason Zhang Follow

微信赏杯奶茶🥤

支付宝赏杯奶茶🥤

PayPal 赏杯奶茶🥤

Ko-fi 赏杯咖啡☕

标签相关推荐

产品召回三端，我用 Codex 和 Stitch 两小时交了

黄仁勋说五年内很难泡沫：打个折扣，盯一个指标

LLM 不会给你最优排产，求解器会