我们不是在写代码而是在驯服一匹野马。2026 年 6 月当你打开 OpenAI Codex 或 Claude Code输入/goal 修复所有 CI 报错并提升测试覆盖率到 90%然后转身去喝咖啡时你正在见证一场静默的革命。这不是又一个新框架的发布而是人类与机器协作方式的根本重构。让我们从三个看似无关的词汇——Cron、Goal、Loop——出发追溯这场革命的技术脉络并理解为什么 2026 年成为Harness Engineering从概念走向实践的关键年份。第一章Cron 的黄昏——当定时遇见智能Cron 是 Unix 世界的活化石。那个0 21 * * *的表达式自 1975 年诞生以来已经让无数程序员在深夜 9 点收到过每日报告已生成的邮件。在 2026 年的 AI Agent 语境中Cron 完成了它的优雅降级Cron 只负责在固定时间点触发一个动作。它不知道任务做到了什么程度不判断结果的质量也不决定是否需要再来一轮。这不是贬低而是定位的精确化。在 2026 年 6 月 2-3 日于旧金山举办的 Microsoft BUILD 2026 大会上发布的 Agent Harness 框架中Cron 被归类为Level 0 触发器——与 Webhook、事件驱动、人工指令并列共同构成 Agent 系统的启动层。Cron 的新角色兜底机制Kelly AI 每日用 Cron 检查 App Store 拒绝状态确保没有遗漏心跳巡检与 Heartbeat 机制配合实现到点就执行的确定性调度成本锚点在无限迭代的智能循环世界中Cron 提供了到此为止的边界感但 Cron 的局限也愈发明显它无法回答如果上次任务失败了怎么办更无法理解修复所有 Bug这种结果导向的指令。2026 年的关键洞察Cron 是时间的奴隶而 AI Agent 需要成为目标的猎手。第二章从 /loop 到 /goal——工具的先行与方法的滞后2026 年的技术演进有一个鲜明特征具体命令的实现走在了方法论命名前面。但需要特别说明这里的/loop命令时间驱动的机械重复与第三章将讨论的Loop Engineering目标驱动的智能循环是两个不同层次的概念只是恰巧共享了同一个词。2026 年 3 月/loop 率先登场——一个轻量级定时器2026 年 3 月 7 日Anthropic 在 Claude Codev2.1.71中正式发布了/loop命令。它被描述为周日 cron job 的更好版本le cron job du dimanche mais en mieux——一个与终端会话绑定的轻量级定时器让 AI 能够按固定时间间隔重复执行同一指令。它的价值不在于智能迭代而在于让周期性任务不再需要离开对话去配置系统 cron。这是便利性改进而非智能跃迁。/loop的关键特性时间驱动每次执行完全相同的指令不根据结果调整与终端会话绑定关闭终端即消失3 天后过期与 Desktop 任务持久化、跨重启形成互补支持灵活的时间间隔秒(s)、分(m)、时(h)、天(d)默认 10 分钟2026 年 4-5 月/goal 紧随其后2026 年 4 月 30 日OpenAI Codex CLI 在 0.128.0 版本中加入/goal命令。约 11 天后2026 年 5 月 12 日Anthropic 在 Claude Code 2.1.139 版本中跟进发布了/goal命令。/goal的革命性在于它首次将目标作为原生原语First-class Primitive。传统自动化的范式是人类打开 A 网站 → 搜索 B 产品 → 比较三家价格 → 下单 机器执行步骤 1 → 执行步骤 2 → 执行步骤 3 → 执行步骤 4Goal-driven 的范式是人类Goal 为 A 产品寻找三家报价最低且两周内交货的供应商并完成下单 机器自主分解 Goal → 选择工具 → 执行 → 验证 → 调整 → 达成这不是交互方式的优化而是权力结构的转移。Goal 的三种形态形态层级示例战略 Goal最高层Q3 将用户留存率提升 15%战术 Goal中间层优化推荐算法提升 CTR 10%任务 Goal执行层修复推荐服务内存泄漏Goal 的核心设计原则结果可验证必须有明确的完成标准测试通过覆盖率 90%路径不确定允许 Agent 自主探索而非预设步骤可分解性复杂 Goal 自动拆分为子 Goal递归执行但 Goal 本身不会动。它需要一种机制将目标转化为行动将一次性指令转化为持续迭代。这就是Loop Engineering登场的时刻。第三章Loop Engineering 的爆发——当 AI 学会自我对话⚠️概念澄清本章讨论的 Loop Engineering循环工程与第二章介绍的/loop命令不是同一回事。/loop命令时间驱动的机械重复一个具体功能Loop Engineering目标驱动的智能循环一套方法论两者共享 loop 一词但层级和内涵完全不同。如果你感觉困惑——这很正常2026 年 6 月的技术社区也花了很长时间才把这两个概念区分清楚。2026 年 6 月一场关于 Loop 的讨论席卷了整个技术圈。导火索OpenClaw 创始人Peter Steinberger在 6 月初发布了一条推文别再给 coding agent 写提示词了。你应该设计循环来提示你的 agent。这条推文迅速走红成为 Loop Engineering 讨论的引爆点。正式命名Google 工程师Addy Osmani在 2026 年 6 月 7 日的博客文章中正式命名Loop Engineering系统整理了 Boris ChernyClaude Code 负责人的实践经验和 Peter Steinberger 的设计理念。Loop Engineering 的定义Loop 是 AI 系统提示自己的模式。它让系统能够递归地追求目标并根据结果调整行为。Loop 不是 while(true)。它是一个有灵魂的循环┌─────────────────────────────────────────┐ │ Agent Loop 生命周期 │ ├─────────────────────────────────────────┤ │ 1. 感知Perception │ │ └── 读取环境状态、用户输入、工具返回 │ │ │ │ 2. 推理Reasoning │ │ └── 分解 Goal、选择工具、评估风险 │ │ │ │ 3. 行动Action │ │ └── 执行代码、调用 API、修改文件 │ │ │ │ 4. 反馈Feedback │ │ └── 分析结果、更新记忆、调整策略 │ │ │ │ 5. 验证Verification │ │ └── 独立模型检查Goal 达成了吗 │ │ └── [未达成] → 回到步骤 1 │ │ └── [已达成] → 终止输出结果 │ └─────────────────────────────────────────┘Loop Engineering 的 2026 年关键变体类型特点来源/实现Ralph Loop社区创造的术语源自《辛普森一家》角色指用 bash 脚本或 hook 手动实现的循环模式强制持续迭代直到满足条件社区开源项目如ralph-claude-code、ralph-loopSelf-Correction Loop错误时自动退回修正实现自愈基于 Kumiho 等记忆系统的学术实践Multi-Agent Loop顶层 Goal 驱动子 Agent 并行执行多智能体协作框架HITL Loop高风险节点暂停等待人工确认金融/医疗等合规场景Loop Engineering 的爆发并非偶然。2026 年 4 月GitHub 发生多起服务降级事件4 月 9 日序列化错误、4 月 22 日数据库连接问题、4 月 23 日 DNS 降级暴露了无约束自动化的风险。业界意识到没有 Harness 的智能 Loop 是失控的螺旋有 Harness 的智能 Loop 才是可靠的引擎。第四章Harness 的降临——驯服野马的马具现在让我们引入 2026 年备受关注的新概念Harness Engineering。概念的诞生2026 年 2 月2026 年 2 月 5 日HashiCorp 联合创始人Mitchell Hashimoto在个人博客首次系统提出 Harness Engineering 概念给出核心公式Agent Model Harness他的核心纪律每次 Agent 犯错时花时间设计一个解决方案让 Agent 永远不会再犯同样的错误。几天后2026 年 2 月 11 日OpenAI 工程师 Ryan Lopopolo 发布了实地报告用1500 个自动化 PR、100 万行零人工代码的数据支撑了这一理念。概念的推广2026 年 3-4 月2026 年 3 月 6 日Birgitta Böckeler 在 Martin Fowler 网站发表文章推广 Harness Engineering 实践方法论2026 年 4 月Martin Fowler 在播客中讨论 Harness 工程之道2026 年 4 月 24 日nxcode.io 发布《What Is Harness Engineering? Complete Guide》概念的系统化2026 年 6 月2026 年 6 月 2-3 日Microsoft 在 BUILD 2026 大会上发布了Agent Harness作为 Microsoft Agent Framework (MAF) 的功能模块包含 context compaction、file memory、tool approval 等具体能力。这个比喻精妙绝伦马Horse AI 模型强大、不可预测、可能失控Harness马具 约束系统缰绳、马鞍、马嚼子骑手Rider 工程师提供方向但不再控制每一步Harness 的核心模块基于 Microsoft BUILD 2026 公开资料和业界实践归纳模块功能与 Cron/Goal/Loop 的关系开发Agent 模板、规则编辑器、权限配置定义 Goal 的分解规则测试自动化测试、压力测试、安全扫描验证智能 Loop 的收敛性部署部署编排、灰度发布、资源调度决定 Cron 的触发策略运行行为拦截、风险引擎、合规校验实时监控智能 Loop 的每一次迭代可观测链路追踪、指标采集、日志分析记录 Goal 达成路径迭代反馈收集、自动优化、规则更新优化智能 Loop 的效率关键洞察Harness 是舞台Goal 是终点智能 Loop 是引擎Harness、Goal、Loop 的关系可以这样理解Harness 是舞台环境划定演员能活动的边界沙箱、提供道具工具、安排安全监督权限管控Goal 是剧本的终点定义演员需要达成的最终成果Loop Engineering智能循环是演员的表演过程感知 → 推理 → 行动 → 反馈 → 验证直到抵达终点需要区分的是/goal命令内部已经内置了这个智能 Loop。当你在 Claude Code 中输入/goal 修复 CI时智能循环会自动启动。而第二章提到的/loop命令机械定时器是一个完全独立的功能与这个智能循环无关。在狭义的 Agent 实现上Harness 是智能 Loop 运行的基础设施沙箱、工具、权限、观测在广义的工程范式上设计 Goal 和智能 Loop 是实践 Harness 的核心环节。Loop engineering is not a distinct era; it refers to the agents execution cyclecontrolled bythe harness.Harness 不是 Loop 的替代品而是智能 Loop 的基础设施。就像 Kubernetes 不是容器的替代品而是容器的编排层。第五章四者的协奏曲——一个生产级系统的解剖让我们用自动修复生产环境 Bug这个真实场景展示四者如何协作┌──────────────────────────────────────────────────────────────┐ │ Harness Engineering │ │ 马具 约束系统 基础设施 可观测性 │ ├──────────────────────────────────────────────────────────────┤ │ │ │ ⏰ 1. Cron 触发层 │ │ └── 每 5 分钟运行健康检查或 PagerDuty 告警触发 │ │ └── Harness 的部署态模块决定何时启动 │ │ │ │ 2. Goal 定义层 │ │ └── 主 Goal恢复服务可用性 │ │ ├── 子 Goal 1定位根因 │ │ ├── 子 Goal 2生成修复补丁 │ │ └── 子 Goal 3验证修复并部署 │ │ └── Harness 的开发态模块定义分解规则 │ │ │ │ 3. 智能 Loop 执行层 │ │ └── 迭代循环 │ │ 感知 → 推理 → 行动 → 反馈 → 验证 │ │ └── [未达成] → 继续迭代 │ │ └── 运行态 Harness 实时监控 │ │ ├── 拦截危险操作如删除生产数据库 │ │ ├── 检查合规性如代码审计规则 │ │ └── 成本管控如 MAX_LOOPS50 │ │ │ │ ✋ 4. 人在回路HITL │ │ └── 高风险操作如部署到生产环境暂停等待人工确认 │ │ └── Harness 的运行态模块决策拦截点 │ │ │ │ 5. 可观测 Harness 记录 │ │ └── 完整链路谁触发、做了什么、为什么、结果如何 │ │ └── 用于事后复盘和规则优化 │ │ │ └──────────────────────────────────────────────────────────────┘这个系统的智能等级CronLevel 0纯脚本触发GoalLevel 3-4目标驱动路径自主智能 LoopLevel 3-5推理循环动态收敛HarnessLevel 5全生命周期管控人在回路第六章为什么不是提示词工程有人可能会问这些用精心设计的提示词Prompt也能做到吗短期简单任务是的。一个 10-shot 的提示词可以完成单次 LLM 调用。中长期复杂任务绝对不行。以下能力无法通过提示词实现状态持久化跨多轮的记忆和上下文管理工具自主调用根据中间结果动态选择工具错误自愈失败时自动调整策略重试成本管控设置预算上限和熔断机制合规审计完整记录每一步决策路径AI工程范式演进阶段时间核心人物核心问题类比Prompt Engineering2022-2024社区我该对模型说什么写一封邮件Context Engineering2025 年中Tobi Lütke / Andrej Karpathy该给模型看什么信息准备会议资料Harness Engineering2026 年 2 月Mitchell Hashimoto该围绕模型造什么系统公司治理Loop Engineering2026 年 6 月Addy Osmani命名 Boris Cherny / Peter Steinberger实践怎么让这个系统自己跑起来项目管理从 Level 2 到 Level 3 的跳跃是架构复杂度的质变。低于此阈值可用提示工程解决高于此阈值必须引入 Goal Loop Harness 架构。终章2026 年的工程师应该站在哪一层让我们回到文章开头的比喻。Cron 是驯马师的闹钟——它告诉你该去马厩了但不关心马的状态。Goal 是驯马师的指令——今天要让马学会跨越障碍但不规定每一步。智能 Loop循环工程是马的学习过程——尝试、失败、调整、再尝试直到掌握。这是/goal命令内部自动运行的机制。需要说明的是/loop命令——那个机械定时器——更像是驯马师手里的秒表只是按固定间隔提醒你再看一眼并不参与学习过程。Harness 是马具——缰绳防止马狂奔马鞍让骑手稳定马嚼子让马听懂指令。2026 年的工程师不再是写脚本的人而是设计 Harness 的人。我们不再逐行编写代码而是定义 Goal 的分解规则设计智能 Loop 的终止条件配置 Harness 的约束策略在关键节点保留 Human-in-the-Loop 的权限这不是失业的前奏而是进化的契机。当 AI 能够自主迭代时人类的价值从执行转向定义、从编码转向约束、从解决问题转向定义什么是要解决的问题。正如 Addy Osmani 在 2026 年 6 月提出的 Loop Engineering 概念中所言Prompting 是关于我们如何提问。Context engineering 是关于我们展示什么。Harness engineering 是决定模型工作的完整操作环境的更广泛学科。Loop engineering 是使该环境实现自动驾驶的特定模式。参考资料与延伸阅读Claude Code/loop命令2026 年 3 月 7 日v2.1.71 版本OpenAI Codex CLI/goal命令2026 年 4 月 30 日0.128.0 版本Claude Code/goal命令Anthropic 官方 GitHub Releases2026 年 5 月 12 日2.1.139 版本Mitchell Hashimoto《Harness Engineering》2026 年 2 月 5 日个人博客Ryan Lopopolo 实地报告2026 年 2 月 11 日1500 个自动化 PR 验证Birgitta Böckeler《Harness Engineering》2026 年 3 月 6 日Martin Fowler 网站Martin Fowler 播客讨论 Harness 工程之道2026 年 4 月CSDN 整理nxcode.io《What Is Harness Engineering? Complete Guide》2026 年 3 月Microsoft BUILD 20262026 年 6 月 2-3 日旧金山 Fort Mason CenterAgent Harness 框架发布Peter Steinberger 推文2026 年 6 月初别再给 coding agent 写提示词了Addy Osmani Boris Cherny《Loop Engineering》2026 年 6 月 7 日GitHub 可用性报告 2026 年 4 月官方事故复盘Ralph Loop 社区实现GitHub 开源项目ralph-claude-code、ralph-loop未来已来只是分布不均。而 Harness是让它均匀分布的马具。创作不易禁止抄袭转载请附上原文链接及标题
cron•loop•goal:AI 工程的智能循环进化论——从定时触发到目标驱动,Harness 如何驯服 AI 这匹野马
我们不是在写代码而是在驯服一匹野马。2026 年 6 月当你打开 OpenAI Codex 或 Claude Code输入/goal 修复所有 CI 报错并提升测试覆盖率到 90%然后转身去喝咖啡时你正在见证一场静默的革命。这不是又一个新框架的发布而是人类与机器协作方式的根本重构。让我们从三个看似无关的词汇——Cron、Goal、Loop——出发追溯这场革命的技术脉络并理解为什么 2026 年成为Harness Engineering从概念走向实践的关键年份。第一章Cron 的黄昏——当定时遇见智能Cron 是 Unix 世界的活化石。那个0 21 * * *的表达式自 1975 年诞生以来已经让无数程序员在深夜 9 点收到过每日报告已生成的邮件。在 2026 年的 AI Agent 语境中Cron 完成了它的优雅降级Cron 只负责在固定时间点触发一个动作。它不知道任务做到了什么程度不判断结果的质量也不决定是否需要再来一轮。这不是贬低而是定位的精确化。在 2026 年 6 月 2-3 日于旧金山举办的 Microsoft BUILD 2026 大会上发布的 Agent Harness 框架中Cron 被归类为Level 0 触发器——与 Webhook、事件驱动、人工指令并列共同构成 Agent 系统的启动层。Cron 的新角色兜底机制Kelly AI 每日用 Cron 检查 App Store 拒绝状态确保没有遗漏心跳巡检与 Heartbeat 机制配合实现到点就执行的确定性调度成本锚点在无限迭代的智能循环世界中Cron 提供了到此为止的边界感但 Cron 的局限也愈发明显它无法回答如果上次任务失败了怎么办更无法理解修复所有 Bug这种结果导向的指令。2026 年的关键洞察Cron 是时间的奴隶而 AI Agent 需要成为目标的猎手。第二章从 /loop 到 /goal——工具的先行与方法的滞后2026 年的技术演进有一个鲜明特征具体命令的实现走在了方法论命名前面。但需要特别说明这里的/loop命令时间驱动的机械重复与第三章将讨论的Loop Engineering目标驱动的智能循环是两个不同层次的概念只是恰巧共享了同一个词。2026 年 3 月/loop 率先登场——一个轻量级定时器2026 年 3 月 7 日Anthropic 在 Claude Codev2.1.71中正式发布了/loop命令。它被描述为周日 cron job 的更好版本le cron job du dimanche mais en mieux——一个与终端会话绑定的轻量级定时器让 AI 能够按固定时间间隔重复执行同一指令。它的价值不在于智能迭代而在于让周期性任务不再需要离开对话去配置系统 cron。这是便利性改进而非智能跃迁。/loop的关键特性时间驱动每次执行完全相同的指令不根据结果调整与终端会话绑定关闭终端即消失3 天后过期与 Desktop 任务持久化、跨重启形成互补支持灵活的时间间隔秒(s)、分(m)、时(h)、天(d)默认 10 分钟2026 年 4-5 月/goal 紧随其后2026 年 4 月 30 日OpenAI Codex CLI 在 0.128.0 版本中加入/goal命令。约 11 天后2026 年 5 月 12 日Anthropic 在 Claude Code 2.1.139 版本中跟进发布了/goal命令。/goal的革命性在于它首次将目标作为原生原语First-class Primitive。传统自动化的范式是人类打开 A 网站 → 搜索 B 产品 → 比较三家价格 → 下单 机器执行步骤 1 → 执行步骤 2 → 执行步骤 3 → 执行步骤 4Goal-driven 的范式是人类Goal 为 A 产品寻找三家报价最低且两周内交货的供应商并完成下单 机器自主分解 Goal → 选择工具 → 执行 → 验证 → 调整 → 达成这不是交互方式的优化而是权力结构的转移。Goal 的三种形态形态层级示例战略 Goal最高层Q3 将用户留存率提升 15%战术 Goal中间层优化推荐算法提升 CTR 10%任务 Goal执行层修复推荐服务内存泄漏Goal 的核心设计原则结果可验证必须有明确的完成标准测试通过覆盖率 90%路径不确定允许 Agent 自主探索而非预设步骤可分解性复杂 Goal 自动拆分为子 Goal递归执行但 Goal 本身不会动。它需要一种机制将目标转化为行动将一次性指令转化为持续迭代。这就是Loop Engineering登场的时刻。第三章Loop Engineering 的爆发——当 AI 学会自我对话⚠️概念澄清本章讨论的 Loop Engineering循环工程与第二章介绍的/loop命令不是同一回事。/loop命令时间驱动的机械重复一个具体功能Loop Engineering目标驱动的智能循环一套方法论两者共享 loop 一词但层级和内涵完全不同。如果你感觉困惑——这很正常2026 年 6 月的技术社区也花了很长时间才把这两个概念区分清楚。2026 年 6 月一场关于 Loop 的讨论席卷了整个技术圈。导火索OpenClaw 创始人Peter Steinberger在 6 月初发布了一条推文别再给 coding agent 写提示词了。你应该设计循环来提示你的 agent。这条推文迅速走红成为 Loop Engineering 讨论的引爆点。正式命名Google 工程师Addy Osmani在 2026 年 6 月 7 日的博客文章中正式命名Loop Engineering系统整理了 Boris ChernyClaude Code 负责人的实践经验和 Peter Steinberger 的设计理念。Loop Engineering 的定义Loop 是 AI 系统提示自己的模式。它让系统能够递归地追求目标并根据结果调整行为。Loop 不是 while(true)。它是一个有灵魂的循环┌─────────────────────────────────────────┐ │ Agent Loop 生命周期 │ ├─────────────────────────────────────────┤ │ 1. 感知Perception │ │ └── 读取环境状态、用户输入、工具返回 │ │ │ │ 2. 推理Reasoning │ │ └── 分解 Goal、选择工具、评估风险 │ │ │ │ 3. 行动Action │ │ └── 执行代码、调用 API、修改文件 │ │ │ │ 4. 反馈Feedback │ │ └── 分析结果、更新记忆、调整策略 │ │ │ │ 5. 验证Verification │ │ └── 独立模型检查Goal 达成了吗 │ │ └── [未达成] → 回到步骤 1 │ │ └── [已达成] → 终止输出结果 │ └─────────────────────────────────────────┘Loop Engineering 的 2026 年关键变体类型特点来源/实现Ralph Loop社区创造的术语源自《辛普森一家》角色指用 bash 脚本或 hook 手动实现的循环模式强制持续迭代直到满足条件社区开源项目如ralph-claude-code、ralph-loopSelf-Correction Loop错误时自动退回修正实现自愈基于 Kumiho 等记忆系统的学术实践Multi-Agent Loop顶层 Goal 驱动子 Agent 并行执行多智能体协作框架HITL Loop高风险节点暂停等待人工确认金融/医疗等合规场景Loop Engineering 的爆发并非偶然。2026 年 4 月GitHub 发生多起服务降级事件4 月 9 日序列化错误、4 月 22 日数据库连接问题、4 月 23 日 DNS 降级暴露了无约束自动化的风险。业界意识到没有 Harness 的智能 Loop 是失控的螺旋有 Harness 的智能 Loop 才是可靠的引擎。第四章Harness 的降临——驯服野马的马具现在让我们引入 2026 年备受关注的新概念Harness Engineering。概念的诞生2026 年 2 月2026 年 2 月 5 日HashiCorp 联合创始人Mitchell Hashimoto在个人博客首次系统提出 Harness Engineering 概念给出核心公式Agent Model Harness他的核心纪律每次 Agent 犯错时花时间设计一个解决方案让 Agent 永远不会再犯同样的错误。几天后2026 年 2 月 11 日OpenAI 工程师 Ryan Lopopolo 发布了实地报告用1500 个自动化 PR、100 万行零人工代码的数据支撑了这一理念。概念的推广2026 年 3-4 月2026 年 3 月 6 日Birgitta Böckeler 在 Martin Fowler 网站发表文章推广 Harness Engineering 实践方法论2026 年 4 月Martin Fowler 在播客中讨论 Harness 工程之道2026 年 4 月 24 日nxcode.io 发布《What Is Harness Engineering? Complete Guide》概念的系统化2026 年 6 月2026 年 6 月 2-3 日Microsoft 在 BUILD 2026 大会上发布了Agent Harness作为 Microsoft Agent Framework (MAF) 的功能模块包含 context compaction、file memory、tool approval 等具体能力。这个比喻精妙绝伦马Horse AI 模型强大、不可预测、可能失控Harness马具 约束系统缰绳、马鞍、马嚼子骑手Rider 工程师提供方向但不再控制每一步Harness 的核心模块基于 Microsoft BUILD 2026 公开资料和业界实践归纳模块功能与 Cron/Goal/Loop 的关系开发Agent 模板、规则编辑器、权限配置定义 Goal 的分解规则测试自动化测试、压力测试、安全扫描验证智能 Loop 的收敛性部署部署编排、灰度发布、资源调度决定 Cron 的触发策略运行行为拦截、风险引擎、合规校验实时监控智能 Loop 的每一次迭代可观测链路追踪、指标采集、日志分析记录 Goal 达成路径迭代反馈收集、自动优化、规则更新优化智能 Loop 的效率关键洞察Harness 是舞台Goal 是终点智能 Loop 是引擎Harness、Goal、Loop 的关系可以这样理解Harness 是舞台环境划定演员能活动的边界沙箱、提供道具工具、安排安全监督权限管控Goal 是剧本的终点定义演员需要达成的最终成果Loop Engineering智能循环是演员的表演过程感知 → 推理 → 行动 → 反馈 → 验证直到抵达终点需要区分的是/goal命令内部已经内置了这个智能 Loop。当你在 Claude Code 中输入/goal 修复 CI时智能循环会自动启动。而第二章提到的/loop命令机械定时器是一个完全独立的功能与这个智能循环无关。在狭义的 Agent 实现上Harness 是智能 Loop 运行的基础设施沙箱、工具、权限、观测在广义的工程范式上设计 Goal 和智能 Loop 是实践 Harness 的核心环节。Loop engineering is not a distinct era; it refers to the agents execution cyclecontrolled bythe harness.Harness 不是 Loop 的替代品而是智能 Loop 的基础设施。就像 Kubernetes 不是容器的替代品而是容器的编排层。第五章四者的协奏曲——一个生产级系统的解剖让我们用自动修复生产环境 Bug这个真实场景展示四者如何协作┌──────────────────────────────────────────────────────────────┐ │ Harness Engineering │ │ 马具 约束系统 基础设施 可观测性 │ ├──────────────────────────────────────────────────────────────┤ │ │ │ ⏰ 1. Cron 触发层 │ │ └── 每 5 分钟运行健康检查或 PagerDuty 告警触发 │ │ └── Harness 的部署态模块决定何时启动 │ │ │ │ 2. Goal 定义层 │ │ └── 主 Goal恢复服务可用性 │ │ ├── 子 Goal 1定位根因 │ │ ├── 子 Goal 2生成修复补丁 │ │ └── 子 Goal 3验证修复并部署 │ │ └── Harness 的开发态模块定义分解规则 │ │ │ │ 3. 智能 Loop 执行层 │ │ └── 迭代循环 │ │ 感知 → 推理 → 行动 → 反馈 → 验证 │ │ └── [未达成] → 继续迭代 │ │ └── 运行态 Harness 实时监控 │ │ ├── 拦截危险操作如删除生产数据库 │ │ ├── 检查合规性如代码审计规则 │ │ └── 成本管控如 MAX_LOOPS50 │ │ │ │ ✋ 4. 人在回路HITL │ │ └── 高风险操作如部署到生产环境暂停等待人工确认 │ │ └── Harness 的运行态模块决策拦截点 │ │ │ │ 5. 可观测 Harness 记录 │ │ └── 完整链路谁触发、做了什么、为什么、结果如何 │ │ └── 用于事后复盘和规则优化 │ │ │ └──────────────────────────────────────────────────────────────┘这个系统的智能等级CronLevel 0纯脚本触发GoalLevel 3-4目标驱动路径自主智能 LoopLevel 3-5推理循环动态收敛HarnessLevel 5全生命周期管控人在回路第六章为什么不是提示词工程有人可能会问这些用精心设计的提示词Prompt也能做到吗短期简单任务是的。一个 10-shot 的提示词可以完成单次 LLM 调用。中长期复杂任务绝对不行。以下能力无法通过提示词实现状态持久化跨多轮的记忆和上下文管理工具自主调用根据中间结果动态选择工具错误自愈失败时自动调整策略重试成本管控设置预算上限和熔断机制合规审计完整记录每一步决策路径AI工程范式演进阶段时间核心人物核心问题类比Prompt Engineering2022-2024社区我该对模型说什么写一封邮件Context Engineering2025 年中Tobi Lütke / Andrej Karpathy该给模型看什么信息准备会议资料Harness Engineering2026 年 2 月Mitchell Hashimoto该围绕模型造什么系统公司治理Loop Engineering2026 年 6 月Addy Osmani命名 Boris Cherny / Peter Steinberger实践怎么让这个系统自己跑起来项目管理从 Level 2 到 Level 3 的跳跃是架构复杂度的质变。低于此阈值可用提示工程解决高于此阈值必须引入 Goal Loop Harness 架构。终章2026 年的工程师应该站在哪一层让我们回到文章开头的比喻。Cron 是驯马师的闹钟——它告诉你该去马厩了但不关心马的状态。Goal 是驯马师的指令——今天要让马学会跨越障碍但不规定每一步。智能 Loop循环工程是马的学习过程——尝试、失败、调整、再尝试直到掌握。这是/goal命令内部自动运行的机制。需要说明的是/loop命令——那个机械定时器——更像是驯马师手里的秒表只是按固定间隔提醒你再看一眼并不参与学习过程。Harness 是马具——缰绳防止马狂奔马鞍让骑手稳定马嚼子让马听懂指令。2026 年的工程师不再是写脚本的人而是设计 Harness 的人。我们不再逐行编写代码而是定义 Goal 的分解规则设计智能 Loop 的终止条件配置 Harness 的约束策略在关键节点保留 Human-in-the-Loop 的权限这不是失业的前奏而是进化的契机。当 AI 能够自主迭代时人类的价值从执行转向定义、从编码转向约束、从解决问题转向定义什么是要解决的问题。正如 Addy Osmani 在 2026 年 6 月提出的 Loop Engineering 概念中所言Prompting 是关于我们如何提问。Context engineering 是关于我们展示什么。Harness engineering 是决定模型工作的完整操作环境的更广泛学科。Loop engineering 是使该环境实现自动驾驶的特定模式。参考资料与延伸阅读Claude Code/loop命令2026 年 3 月 7 日v2.1.71 版本OpenAI Codex CLI/goal命令2026 年 4 月 30 日0.128.0 版本Claude Code/goal命令Anthropic 官方 GitHub Releases2026 年 5 月 12 日2.1.139 版本Mitchell Hashimoto《Harness Engineering》2026 年 2 月 5 日个人博客Ryan Lopopolo 实地报告2026 年 2 月 11 日1500 个自动化 PR 验证Birgitta Böckeler《Harness Engineering》2026 年 3 月 6 日Martin Fowler 网站Martin Fowler 播客讨论 Harness 工程之道2026 年 4 月CSDN 整理nxcode.io《What Is Harness Engineering? Complete Guide》2026 年 3 月Microsoft BUILD 20262026 年 6 月 2-3 日旧金山 Fort Mason CenterAgent Harness 框架发布Peter Steinberger 推文2026 年 6 月初别再给 coding agent 写提示词了Addy Osmani Boris Cherny《Loop Engineering》2026 年 6 月 7 日GitHub 可用性报告 2026 年 4 月官方事故复盘Ralph Loop 社区实现GitHub 开源项目ralph-claude-code、ralph-loop未来已来只是分布不均。而 Harness是让它均匀分布的马具。创作不易禁止抄袭转载请附上原文链接及标题