Harness Engineering深度指南（非常详细），软件工程转型控制系统设计，从入门到精通，收藏这一篇就够了！-尧图企业网站定制

导语George 提到Harness engineering这种模式已经出现了三次第一次是在 18 世纪 80 年代詹姆斯·瓦特James Watt发明了离心调速器Centrifugal governor。第二次是在 Kubernetes 出现。第三次是 OpenAI 提出的 Harness engineering。诺伯特·维纳Norbert Wiener在 1948 年给这个模式命名为控制论cybernetics。这个词来自希腊语 κυβερνήτης意思是舵手Kubernetes 这个名字也来自同一个词根。或许值得思考的问题不是AI 会不会取代程序员而是AI 时代的软件工程到底是什么样子的1. 一个反直觉的起点过去两年一个共识正在形成AI 已经可以写代码。但如果你真的把 Agent 放进工程系统里运行很快会遇到一个更本质的问题AI 最大的问题不是能力而是不可控。它可以正确实现一个模块也可能在下一步破坏整个系统结构能修复 bug也能引入更隐蔽的 bug更关键的是任务一旦变长系统几乎必然偏离目标。这不是模型问题。这是一个工程问题。2. 当软件工程变成“持续运行的过程”传统软件工程是静态的人 → 写代码 → 系统运行而 AI 介入之后人 → 描述任务 → Agent 持续生成代码 → 系统运行这里的关键变化不是“谁写代码”。而是系统不再是一次性构建而是持续演化。这意味着每一步都在改变系统状态每一步都可能引入偏差系统行为具有路径依赖于是问题变成我们如何让这个过程不失控3. Prompt Engineering 的边界最初大家尝试用 Prompt 解决问题Prompt → 模型 → 输出但在复杂工程任务中这种方式迅速失效Prompt 无法覆盖长期状态无法表达结构性约束无法纠正中途偏差本质上这是一个开环系统Open-loop一旦输出错误没有自动修正错误会被放大而 Agent 系统恰恰是需要长时间运行的系统4. Loop 的出现问题被“延长”但没有被解决随着 Agent 和自动化流程的发展一个新的模式出现了Loop典型结构是任务 → Agent 执行 → 结果 → 再次输入 → Agent这看起来像一个进步有循环有迭代有“自我修复”但这里存在一个非常关键的问题Loop ≠ 可控系统在很多实践中Loop 带来的不是稳定而是4.1 偏差累积每一轮生成都可能引入微小错误这些错误不会自动被约束最终导致系统偏离原始目标4.2 架构漂移Architecture DriftAgent 在多轮修改中会逐渐破坏分层结构引入临时性代码重复实现逻辑最终系统变成“能运行但不可维护”4.3 局部优化全局失控Agent 的行为是局部最优的修复当前错误满足当前测试但没有机制保证全局一致性长期稳定性于是一个非常关键的结论出现了Loop 只是让系统“持续运行”但没有提供“稳定机制”。5. Harness Engineering来自 OpenAI 的工程方法在这样的背景下OpenAI 提出了一个新的概念Harness Engineering这个概念不是抽象理论而是来自一个非常具体的实践使用 Codex Agent构建超过 100 万行代码几乎完全由 Agent 完成开发与迭代他们发现问题不在模型而在工程方式。5.1 一个关键转变当 Agent 出错时他们不再问“模型为什么错了”而是问“系统缺了什么让它必然会出错”5.2 如何 Agent-First可以用一个更严谨的方式来理解Harness Engineering 构建一个环境使 Agent 可以稳定地进行软件工程这个环境包括上下文context约束constraints反馈feedback它不是某个工具而是一整套可执行的工程结构5.3 Agent “不知道该做什么”解决方式结构化文档单一事实源repo明确接口与边界5.4 Agent “可以做任何事”解决方式架构约束分层限制自动检查5.5 Agent “做错了也没关系”解决方式测试CI自动反馈这些机制叠加起来形成一个新的能力系统可以自我修正而不是持续偏离。6. 一个重要的理解Harness Engineering 不是工具而是“结构”很多人会把 Harness Engineering 理解为Agent 框架工具链但在 OpenAI 的实践中Harness Engineering 是系统结构而不是工具集合。它的特点是可执行不是文档而是规则可验证不是建议而是强制可循环可以持续运行7. 从工程方法到控制系统到这里我们才可以引入控制论的视角。注意顺序Harness Enginerring 是工程实践控制论是对它的解释如果用控制系统来描述这个结构目标 ↓LLM约束上下文 ↓Agent执行 ↓输出代码 ↓测试 / CI / 观测 ↓反馈 → 回到系统这正是一个典型的闭环系统有目标有控制器有反馈有修正于是可以得到一个关键结论Harness Engineering本质上是在充当控制器Controller8. 为什么这些机制会“让系统稳定”如果只停留在“这是闭环”还不够。关键在于这些机制如何改变系统行为我们可以逐一来看。8.1 上下文让系统减少错误的“产生”在没有上下文时Agent 需要猜测猜测带来不确定性而结构化上下文明确边界明确接口明确目标效果是错误在生成之前被减少这类似于工程中的设计约束类型系统8.2 约束限制系统的“可行动空间”没有约束时Agent 可以修改任何地方可以引入任何依赖系统状态空间是无限的。而约束的作用是限制依赖关系限制调用路径限制结构变化结果是系统只能在一个“可控空间”内演化8.3 反馈让系统不断“回到正确轨道”即使有上下文和约束仍然会有偏差反馈的作用是检测偏差强制修正例如测试失败 → 必须修改CI 不通过 → 无法合并这使系统具备自动纠偏能力9. 更深一层AI 时代的软件工程是在控制“熵”如果再往深一层看会发现一个更本质的问题AI 系统天然是高熵系统。原因是每一步都在生成新状态状态空间不断扩大不一致不断增加如果没有控制机制系统会逐渐混乱最终失控所以 AI 时代的软件工程不是让系统“更强”。而是让系统不发散。通过约束限制空间反馈修正偏差清理消除冗余系统可以保持稳定收敛可维护10. 一个工程认知的变化这带来了一个非常深刻的转变过去我们关注代码是否正确功能是否实现现在我们关注系统是否可控行为是否收敛是否存在失控路径换句话说工程对象从“代码”变成了“行为系统”。结语Harness Engineering不是一个工具趋势。它标志着一个更深层的变化软件工程正在从“构建系统”走向“控制系统”。在这个过程中Agent 提供能力Loop 提供运行而 Harness Engineering 提供稳定而我们真正面对的问题是如何让一个持续生成代码的系统不走向失控。这才是这个时代的软件工程。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

C语言：动态内存管理

Swin2SR实现卫星图像增强：遥感数据处理实战

2026年3月大模型全景深度解析：国产登顶、百万上下文落地、Agent工业化，AI实用时代全面来临[特殊字符]

基于SHRDZM与ESP8266的超低功耗门窗传感器设计与FHEM集成

在CentOS 7上，用HBase 2.5.6自带的Zookeeper搭建伪分布式环境，保姆级避坑指南

别再只写业务代码了！用Kafka拦截器给你的消息加上“监控”和“审计”吧

保姆级教程：用Qt和MQTT库，5分钟搞定阿里云IoT设备在线状态监控

告别触摸漂移！基于STM32CubeMX的电阻屏校准与画板应用实战

在麒麟V10 X86系统里，从源码编译QEMU 8.0.4并成功启动ARM64虚拟机的完整记录

别再用MLP了！KAN模型实战：用Python复现论文核心，精度提升但速度真慢10倍？

Unity 3D基础：动画状态机的创建与状态切换

2026年SBTI刷屏引关注:结果为何不稳定

毕业论文神器！2026最新AI论文写作软件测评与推荐

基于指数矩的车牌识别解析方案【附代码】

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定