最近,两个我很服气的 AI 工程师,几乎前后脚说了同一句话。
一个是开源工具 OpenClaw 的作者、今年初加入 OpenAI 的 Peter Steinberger,他在网上写道:
「你不该再给你的编程 agent 写提示词了。你该去设计那些『替你给 agent 写提示词』的循环。」
另一个是 Anthropic 那边主导 Claude Code 的 Boris Cherny,他换了个说法,讲的是同一件事:
「我已经不再亲自给 Claude 写提示词了。我有一堆循环在跑,是它们在给 Claude 写提示词、替我盘算下一步该干啥。我的活,就是写循环。」
两个站在最前线的人,同一个意思。
大多数人看完,第一反应是:这听着挺高大上——可这到底是个啥意思?
我花了点时间,认认真真把它捋了一遍。这篇就一层层拆给你看,不堆术语,只讲你真正用得上的那套脑子里的模型。
但在拆它之前,我得先讲一件几乎没人在台面上挑明的事。
先说那个没人挑明的拦路虎
循环听起来很美。然后你看到账单。
一次中等规模的单 agent 循环,轻松烧掉 5 万到 20 万 token。一套带编排器加三个专家 agent 的舰队循环,50 万到几百万 token。再挂上每天定时跑——那就是每周几百万 token。
按主流 API 的标价,认真玩一周循环工程的花费,比很多人一整个月的 AI 预算还高。
这就是为什么 Steinberger 那条帖子底下,一堆人回他:「你说得轻巧——你有用不完的额度。」他们没说错。 在正常预算上搞循环工程,崩得飞快。每一次重试都烧钱,每一次自我纠错都烧钱,每一个子 agent、每一道验证,都在烧钱。那个放开了自由探索的开环,烧 token 的速度能让你眼睛发酸。
所以记住这句反直觉的话:循环不难设计,难在你养不养得起。
而这,恰恰是便宜的国产前沿模型真正改变的东西。像 DeepSeek、Kimi、MiniMax 这些模型,把「跑循环」这件事从经济上变得可行了。自主 agent 最大的瓶颈,从来不是智商,是 token 烧得太快。当 token 足够便宜、上下文足够长,长时间跑的循环才第一次能撑得住、又养得起。
先把这个成本前提钉在脑子里,下面所有的设计才有意义。
旧玩法 vs 新玩法
过去两年,我们都是一条任务一条任务地给 agent 写提示词。
你敲一段提示词,它给你回一段,你审一遍,把不对的改掉,再敲下一段……你,就是那个循环。
新玩法是:你不再亲自驱动每一步。你设好一个目标,搭起一个循环,让它自己走完发现、规划、干活、检查、迭代——直到目标达成。
- 旧玩法(写提示词):你 → 提示词 → agent → 输出 → 你审 → 你改 → 再来一遍。
- 新玩法(写循环):你设好目标 → 循环启动 → agent 发现 → 规划 → 执行 → 验证 → 迭代 → 完成。
一句话:提示词,给的是一条指令;循环,给的是一份工作。
循环工程,到底是什么
循环工程,就是去设计一套可重复的反馈循环,把 AI agent 从「尝试」一路领到「被验证过的结果」,中间不需要人一直插手。
它不是什么神秘的新框架。几乎任何 agent 工具都能跑,区别只在于你怎么把它接起来。最简单的形态,就是一个 agent 自己跟自己较劲:查资料 → 出草稿 → 拿草稿对着目标自查 → 把弱的地方改掉 → 再转一圈,直到这活过了线。
不管简单还是复杂,每个循环都走同样的五步:
发现 → 规划 → 执行 → 验证 → 迭代。
过了验证,交付;没过,再转一圈。这就是全部。这篇后面所有内容,都只是在讲:怎么把这个圈搭得靠谱。
一个 agent,还是一支舰队
循环有两种规模。
单 agent 循环。 一个 agent 自己跑完整个圈,像一个人反复打磨自己的草稿:发现需要啥、规划、执行、自查、不对就再迭代。适合:聚焦的任务、简单的目标、有限的范围。一个脑子,一个圈,自我改进。
舰队循环。 你给一个编排器 agent 一个目标,它把目标拆成几块,每块交给一个专家 agent,专家再把更小的活分给自己的子 agent。整棵树一起循环,直到目标达成。
编排器扛总目标 → 专家们扛各自的环节 → 子 agent 干最窄的活 → 一道道评估闸守着,别让它产出一堆「废品」。
比如「做一个效率类 App」:编排器扛着整个使命,下面分出研究专家、工程专家、QA 专家,每个专家再带自己的子 agent(网页调研、写代码、调试、写测试、追 bug)。树上的每一个 agent,都在跑同样的五步循环。
说白了:单 agent 循环,像一个人反复改自己的稿子;舰队循环,像一整支团队从头到尾跑一个项目。
开环 vs 闭环:2026 年最该搞懂的一个区别
这是今天最要紧的一条实务分界。
开环。 探索型,给 agent 一个目标,放它去撒野——它能试各种路子、撞见你没想到的东西、做出你压根没细想过的方案。这是最激动人心的那一端,也是最烧 token 的那一端。对 90% 没有无限额度的人来说,开环现在还不实用;要是再把它指向一个标准松散的项目,它立马变成一台「废品制造机」:又快、又乱、又贵。
闭环。 有边界。一个人先把从头到尾的路画好:清晰的目标、定好的步骤、每一步一道评估、一个明确「停下来或交还给你」的点。agent 还是在循环,但是在你搭的框架里循环。它每跑一轮都更好——因为这一轮喂给了下一轮;它能在正常预算上跑——因为路是收紧的;那道质量闸让它保持诚实。
没有质量闸,AI 会漂移;有了质量闸,AI 会变好。
该用哪个?先上闭环。 把一套能稳定干活的紧凑系统搭出来,等你有了过硬的质量闸,再去把它放开。
一个好循环,要装的 6 个零件
五步是「概念」。落到地上,你到底要搭哪些东西?6 个。Claude Code 和 Codex 现在都齐了。我把每个零件,对应到它在循环里干的活:
-
自动化(Automations)——循环的心跳,负责触发「发现」。它才是让循环成为「循环」、而不是「你手动跑过一次」的东西。你定好提示词、节奏和目标,它就按时跑,结果自己送上门。比如
/loop按节奏重跑,/goal一直跑到你写的某个条件真的成立为止:「test/auth 下所有测试通过、lint 干净」——设好,走人。 -
工作树(Worktrees)——让多个「执行」并行,又不互相踩脚。一旦你跑不止一个 agent,文件就开始打架——两个 agent 改同一个文件,跟两个工程师不打招呼就往同几行提交,是一模一样的乱。一个 git worktree 给每个 agent 一份隔离的工作目录、各自一条分支,同一份仓库历史,零冲突。
-
技能(Skills)——让「发现」更快,agent 还没动手就已经懂你的项目。一个 skill 就是一个带
SKILL.md的文件夹:项目约定、构建步骤、「我们因为上次那个事故,绝不这么干」。写一次,每轮循环都读。没有 skills,循环每一轮都从零重新推导你的项目;有了,它会复利。常见的几份:VISION.md(成功长啥样)、ARCHITECTURE.md(技术栈和目录结构)、RULES.md(绝对不许干的事)。 -
插件与连接器(Plugins & Connectors)——让「执行」动真格,循环能在你真实的环境里动手,而不只是在文件系统里。只能看见文件系统的循环,是个小循环。连接器(建在 MCP 上)让 agent 能读你的工单系统、查数据库、打 staging 的 API、往 Slack 丢条消息。这就是「它说『这是修复方案』」和「它自己开了 PR、关联了工单、等 CI 绿了再去频道里 @ 你」之间的区别。
-
子 agent(Subagents)——让「验证」诚实,检查的那个,永远不是动手的那个。写代码的模型,给自己批作业时太手软。换一个带着不同指令、有时甚至是不同模型的 agent,能逮住第一个自己把自己说服了的东西。最管用的分工:一个负责探索,一个负责实现,一个负责对着规格验收。
/goal底层就是这么干的——由一个全新的模型来判断这个循环是不是真做完了,而不是那个干活的。 -
记忆(Memory)——让循环能持续,第 47 轮的「发现」知道前 46 轮都试过些啥。它可以只是一个 markdown 文件、一块看板,任何活在「单次对话」之外的东西。模型每轮之间会忘光,仓库不会。记忆文件存着:试过啥、过了啥、还有啥没解决。明早,循环从今天停下的地方接着走。简单到不像回事,可每一个长时间跑的循环,都靠它。
几个真实的循环,长啥样
编程循环:读 VISION.md + ARCHITECTURE.md → 规划下一处改动 → 改代码 → 自动跑测试 → 测试挂了就读报错、修、再测 → 测试过了就总结改动 → 停。中间没有人,agent 自己写、自己测、自己修、自己验。
研究循环:定研究问题 → 搜信源 → 总结 → 拿结论对着原始信源核验 → 比对矛盾的信息 → 综合出答案 → 置信度达标就停。
内容循环:定好主题、读者、目标 → 出草稿 → 批判 agent 审稿 → 按意见重写 → 对着成功标准打分 → 过了发布,没过再重写。
销售触达循环:定义理想客户画像(ICP)→ 找匹配的线索 → 补全公司数据 → 按标准筛 → 个性化文案 → 质量复查 → 发送,或升级给人。
每一个循环,都是同一副骨架:目标 → 动作 → 检查 → 修正 → 重复,直到做完。
提示词工程师 vs 循环工程师
这是 2026 年正在裂开的一道技能鸿沟。
提示词工程师:打磨更好的指令,靠的是语言能力;更好的提示词 → 更好的单次输出;每跑一次,还得自己手动审一遍——你,就是那个反馈回路。
循环工程师:设计更好的反馈循环,靠的是软件工程能力;更好的循环 → 可靠的、被验证过的结果;系统自己跑、自己查、自己纠错——系统,就是那个反馈回路。
提示词工程师说「给我写个函数」;循环工程师说「写 → 测 → 修,直到全绿」。工具是同一套,脑子完全是两套。提示词工程师向 AI 要输出;循环工程师设计出『能产出被验证结果』的系统。
2026 年那批薪水最高的 AI 工程师,不是在写更漂亮的英文句子。他们在写的,是那套管着 agent 怎么发现、怎么规划、怎么自查、怎么知道自己做完了的逻辑。
把这套东西,落到我自己身上
讲到这儿你会发现,循环工程整套东西,本质上是在把「低成本、快速试一遍」这件事,做成一台能自己转的机器——而它真正的门槛,从来不是聪明,是 token 烧得起。
这也正是我每天在干的事。我一个人做的 Zaokit,想干的就是把这种能力塞进普通人的日常:你不用懂任何技术,把要做的事说清楚,它就帮你麻利地把图文、PPT 做出来——说白了,是帮你用最低的成本,先把脑子里那个还很糙的想法跑出个第一版,你再在它基础上挑刺、改、迭代。唯一网站:https://zaokit.app。
而把这种能力做成企业能放心用的底座,也是我一直在做的:cx.zaokit.com、cc.zaokit.com、tokenhub.zaokit.ai、gift.junxinzhang.com 以及更多项目,已经融进了不少公司的真实流程里,是稳定靠谱、开箱即用的 AI 全家桶。其中像 Token Hub 干的,正是循环工程的前提那一步——把全公司零散的 token 消耗先收成一个统一的底座,让「养得起循环」这件事,第一次成立。
写在最后
把整篇收一下:
- 那个转变:过去两年我们一条任务一条任务地写提示词 → 现在去设计跑完整圈的循环。
- 6 个零件:自动化(心跳)、工作树(并行不踩脚)、技能(每轮复利的项目知识)、插件与连接器(在真实工具里动手)、子 agent(做的人和查的人永远分开)、记忆(循环之间不遗忘)。
- 两种规模:单 agent,一个脑子自我改进;舰队,编排器 + 专家 + 子 agent,每个都跑同样的圈。
- 两种类型:开环,探索、强大、昂贵、要近乎无限的预算;闭环,有边界、可靠、养得起,今天真正划算的那个。
- 成本真相:循环烧 token 烧得飞快,便宜的国产前沿模型把最后那道拦路虎挪开了。
但最后,我想说一件这篇里没人挑明的事。
两个人搭出一模一样的循环,结果可能完全相反。 一个用它,在自己真懂的事上跑得更快;另一个用它,是为了从此不用再懂这件事。循环分不清这两者,你能。
这恰恰是循环工程比提示词工程更难、而不是更省心的地方。Boris Cherny 的意思,从来不是「活变简单了」,而是杠杆点挪了位置。把循环搭起来——但要像一个「打算一直当工程师的人」那样去搭,而不只是按下启动键的那个人。
因为一个靠谱的循环,顶得上一千条完美的提示词。 而当 token 终于便宜到你养得起,你才第一次真的有资格,去搭这么一个循环。
我是 Jason,一个自己一个人做 AI 产品的创业者。如果这篇让你想把「写提示词」升级成「写循环」,欢迎转发给那个也在认真跟 AI 较劲的朋友。
相关阅读:
- 用 Claude Code 满一年:我敢交给 AI 的活,从一个函数变成了一整件事
- 你说的 Agent,八成只是个 Workflow:差别不在步骤多少,在谁决定下一步
- 微软 CEO 亲口说出的反共识:AI 时代公司的核心能力,不是选对模型
- AI 时代最值钱的能力,其实是『会做研究』
</content> </invoke>