Sonnet 5 发布Prompt 已死Loop 当道技趣星球 · 用技术创造乐趣。日期2026-07-016 月 30 日Anthropic 做了一件很少见的事同一天发布一个新模型和一套新范式。Claude Sonnet 5 上线定位最擅长 Agent 的 Sonnet 模型推理和编码能力接近旗舰 Opus 4.8价格便宜约 60%。同一天Claude Code 团队发布 “Getting started with loops” 官方文档把 Loop Engineering 从行业讨论直接做成了产品功能。这件事的背景是黄仁勋最近公开说 “Nobody writes prompts anymore”吴恩达判断 prompt 在 3 到 6 个月内消亡Anthropic 内部 80% 以上工程师已经在用自改进循环。Sonnet 5 和 Loop 文档同日发布不是巧合。Loop 是什么从踩油门到设计自动驾驶Google Chrome 工程总监 Addy Osmani 在 6 月 7 日发了一篇文章把这种变化拆成四层层级你在做什么你的角色Prompt Engineering写好一句话踩油门的人Context Engineering喂好上下文管信息的人Harness Engineering搭好运行环境管工具的人Loop Engineering定义目标、验证标准、停止条件设计自动驾驶Prompt Engineering 时代你是循环本身——写 prompt看结果再写 prompt。Loop Engineering 时代系统是循环。你只做一次设计然后它自己转起来。Boris Cherny 的经历是个极端例子。他用 Claude Code 写了 259 个 PR最终让 Claude 100% 自我编写。他说“我不再向 Claude 发送提示词了。我写循环让循环去提示 Claude。”四种循环从手动到全自动Claude Code 把 Loop 做成了四种产品原语。每种回答同一个问题谁来触发、谁来判断停、状态放哪。Turn-Based Loop你发消息Claude 做完就停。最基础的模式适合临时修改和探索。如果你经常重复同一种验证流程可以把它写进 SKILL.mdClaude 每次自动加载省掉反复交代背景的麻烦。Goal-Based Loop你用/goal设目标和上限。比如/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries。每个回合结束后一个独立的 evaluator 判断目标有没有达成。关键设计evaluator 不去翻文件、不跑命令只看对话里已有的信息。这防止了 Agent 自己篡改证据来通过检查。适合 bug 修复、性能优化这类有明确验证指标的任务。Time-Based Loop用/loop 5m设定间隔Claude 每隔 5 分钟自动跑一轮。适合监控 CI/CD、处理 PR review。关掉终端就停轻量但不持久。Proactive Loop用/schedule托管到云端外部事件触发无需人在场。比如/schedule every hour: check #project-feedback for bug reports。适合 issue triage、依赖升级、大规模代码迁移。Claude Code 官方建议的落地顺序很务实先写 verification skill再在任务有明确验证指标时用/goal最后才考虑/schedule。别一上来就搞全自动。Sonnet 5 为什么重要跑循环需要一个便宜但够聪明的模型Loop 要转起来模型要反复调用——跑测试、做验证、自我审查。每一轮都烧 token。Opus 级别跑循环太贵。Haiku 级别不够聪明。Sonnet 5 填的就是这个位置。优惠期到 8 月 31 日输入 $2 / MTok、输出 $10 / MTok比 Opus 4.8 便宜约 60%。能力上它在单次请求里能自主完成写复现测试、实现修复、验证 bug 消失的完整链路。安全方面也做了加固——幻觉和谄媚减少prompt injection 鲁棒性更强。如果你打算认真试 LoopSonnet 5 是当前性价比最高的选择。Claude Free 和 Pro 计划已默认启用API 模型名claude-sonnet-5。四个隐性风险Addy Osmani 在文章里提醒了一件事循环跑得越顺人越容易停止思考。社区总结的四个风险值得在设计 Loop 时就考虑验证债务——代码看起来能跑但细微错误悄悄合进了主分支。你每一处改动都没仔细看过。理解腐化——AI 写代码太快你对整个代码库的理解开始脱节。某天出了线上事故你甚至不知道去哪排查。认知投降——审查了几十轮之后你不再质疑 AI 的输出全盘接受。循环越自动化人越容易变成橡皮图章。Token 失控——Agent 在死循环里反复重试一晚上烧掉一周的预算。这些风险不是劝你别用 Loop。它提醒的是evaluator 必须独立于执行 Agent停止条件必须设上限。Claude Code 自己就这么做——Goal-Based Loop 的 evaluator 不碰文件系统每种 Loop 都有最大尝试次数。验证机制不是保险是前提。收个尾想快速理解 Loop直接看 Anthropic 的 “Getting started with loops” 博客四种循环类型各附了命令示例想试 Sonnet 5Claude Free 和 Pro 已默认启用API 模型名claude-sonnet-5优惠价到 8 月底正在搭 Agent 工作流先把验证动作写进 SKILL.md 或等效配置再考虑自动化触发。验证靠谱了跑得快才有意义技趣星球 · 用技术创造乐趣。
Sonnet 5 发布:Prompt 已死,Loop 当
Sonnet 5 发布Prompt 已死Loop 当道技趣星球 · 用技术创造乐趣。日期2026-07-016 月 30 日Anthropic 做了一件很少见的事同一天发布一个新模型和一套新范式。Claude Sonnet 5 上线定位最擅长 Agent 的 Sonnet 模型推理和编码能力接近旗舰 Opus 4.8价格便宜约 60%。同一天Claude Code 团队发布 “Getting started with loops” 官方文档把 Loop Engineering 从行业讨论直接做成了产品功能。这件事的背景是黄仁勋最近公开说 “Nobody writes prompts anymore”吴恩达判断 prompt 在 3 到 6 个月内消亡Anthropic 内部 80% 以上工程师已经在用自改进循环。Sonnet 5 和 Loop 文档同日发布不是巧合。Loop 是什么从踩油门到设计自动驾驶Google Chrome 工程总监 Addy Osmani 在 6 月 7 日发了一篇文章把这种变化拆成四层层级你在做什么你的角色Prompt Engineering写好一句话踩油门的人Context Engineering喂好上下文管信息的人Harness Engineering搭好运行环境管工具的人Loop Engineering定义目标、验证标准、停止条件设计自动驾驶Prompt Engineering 时代你是循环本身——写 prompt看结果再写 prompt。Loop Engineering 时代系统是循环。你只做一次设计然后它自己转起来。Boris Cherny 的经历是个极端例子。他用 Claude Code 写了 259 个 PR最终让 Claude 100% 自我编写。他说“我不再向 Claude 发送提示词了。我写循环让循环去提示 Claude。”四种循环从手动到全自动Claude Code 把 Loop 做成了四种产品原语。每种回答同一个问题谁来触发、谁来判断停、状态放哪。Turn-Based Loop你发消息Claude 做完就停。最基础的模式适合临时修改和探索。如果你经常重复同一种验证流程可以把它写进 SKILL.mdClaude 每次自动加载省掉反复交代背景的麻烦。Goal-Based Loop你用/goal设目标和上限。比如/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries。每个回合结束后一个独立的 evaluator 判断目标有没有达成。关键设计evaluator 不去翻文件、不跑命令只看对话里已有的信息。这防止了 Agent 自己篡改证据来通过检查。适合 bug 修复、性能优化这类有明确验证指标的任务。Time-Based Loop用/loop 5m设定间隔Claude 每隔 5 分钟自动跑一轮。适合监控 CI/CD、处理 PR review。关掉终端就停轻量但不持久。Proactive Loop用/schedule托管到云端外部事件触发无需人在场。比如/schedule every hour: check #project-feedback for bug reports。适合 issue triage、依赖升级、大规模代码迁移。Claude Code 官方建议的落地顺序很务实先写 verification skill再在任务有明确验证指标时用/goal最后才考虑/schedule。别一上来就搞全自动。Sonnet 5 为什么重要跑循环需要一个便宜但够聪明的模型Loop 要转起来模型要反复调用——跑测试、做验证、自我审查。每一轮都烧 token。Opus 级别跑循环太贵。Haiku 级别不够聪明。Sonnet 5 填的就是这个位置。优惠期到 8 月 31 日输入 $2 / MTok、输出 $10 / MTok比 Opus 4.8 便宜约 60%。能力上它在单次请求里能自主完成写复现测试、实现修复、验证 bug 消失的完整链路。安全方面也做了加固——幻觉和谄媚减少prompt injection 鲁棒性更强。如果你打算认真试 LoopSonnet 5 是当前性价比最高的选择。Claude Free 和 Pro 计划已默认启用API 模型名claude-sonnet-5。四个隐性风险Addy Osmani 在文章里提醒了一件事循环跑得越顺人越容易停止思考。社区总结的四个风险值得在设计 Loop 时就考虑验证债务——代码看起来能跑但细微错误悄悄合进了主分支。你每一处改动都没仔细看过。理解腐化——AI 写代码太快你对整个代码库的理解开始脱节。某天出了线上事故你甚至不知道去哪排查。认知投降——审查了几十轮之后你不再质疑 AI 的输出全盘接受。循环越自动化人越容易变成橡皮图章。Token 失控——Agent 在死循环里反复重试一晚上烧掉一周的预算。这些风险不是劝你别用 Loop。它提醒的是evaluator 必须独立于执行 Agent停止条件必须设上限。Claude Code 自己就这么做——Goal-Based Loop 的 evaluator 不碰文件系统每种 Loop 都有最大尝试次数。验证机制不是保险是前提。收个尾想快速理解 Loop直接看 Anthropic 的 “Getting started with loops” 博客四种循环类型各附了命令示例想试 Sonnet 5Claude Free 和 Pro 已默认启用API 模型名claude-sonnet-5优惠价到 8 月底正在搭 Agent 工作流先把验证动作写进 SKILL.md 或等效配置再考虑自动化触发。验证靠谱了跑得快才有意义技趣星球 · 用技术创造乐趣。