天天嚷嚷着做Agent_Harness,但具体工作是什么?

天天嚷嚷着做Agent_Harness,但具体工作是什么? 最近刷几个模型厂牌的招聘信息(定期刷可以提前预知这些公司的动作)发现 DeepSeek 和 Kimi 都上了 Harness 产品经理岗位。是的DeepSeek 要推出桌面 Agent 客户端了一个叫Agent Harness 产品经理一个叫Harness Product Engineer。这篇文章就从这两份 JD 出发借着专业团队对 Harness 这个概念的定义把里面提到的概念一个个拆开讲清楚。回答本文标题的问题天天嚷着要做 Agent Harness到底要做什么先看 DeepSeek 的定义Model Harness Agentdeepseek-jdDeepSeek 在 JD 开头写了一句话非常精确Model Harness Agent我们正在把 DeepSeek 的前沿模型能力转化为领先的 Agent 产品。这其中除模型本身以外的所有工作都属于 Harness 的范畴。这句话值得反复读。它说的是模型本身训练、推理、参数优化不是 Harness。模型之外的一切——怎么给模型喂信息、怎么管理工具、怎么设计交互、怎么处理错误、怎么让 Agent 在真实环境中跑起来——才是 Harness。Agent Harness 架构层次如果把 Agent 比作一辆自动驾驶汽车模型是发动机那 Harness 就是底盘、转向、刹车、传感器融合、路径规划、人机交互……发动机再强没有这些东西车也开不起来。Kimi 的视角Harness 决定 Agent 能走多远kimi-jdKimi 的 JD 开头用了另一种表述当 Agent 开始在真实世界中长时间调用工具、穿梭于浏览器、终端、桌面和移动端环境并持续完成复杂任务时真正决定它能走多远的往往不只是模型本身而是harness 与 LLM 的共同优化结果。Harness 决定状态如何被管理、上下文如何被交接、反馈如何被闭环也决定 Agent 在长时间、高复杂度执行中能否保持稳定、清醒与可控。这段话信息量很大。它点出了 Harness 需要解决的四个核心问题核心问题通俗解释状态管理Agent 执行到哪一步了已经做了什么还差什么上下文交接每一步执行完下一步需要知道什么信息信息怎么传递反馈闭环工具调用成功了还是失败了错误信息够不够清晰怎么从错误中恢复稳定、清醒与可控跑了 50 步之后Agent 还记不记得自己在干嘛会不会跑偏这四个问题就是 Harness 产品经理每天要面对的战场。拆解 JD 中的关键概念接下来我们把两份 JD 中反复出现的技术概念逐个拆开。每个概念我会回答三个问题它是什么它为什么重要PM 需要做什么1. Agent Loop是什么Agent 的基本运行模式。Agent 不是问一句答一句而是一个持续运转的循环——接收任务 → 推理思考 → 调用工具 → 获取结果 → 更新状态 → 继续下一步直到任务完成。Agent Loop 循环示意为什么重要传统的 Chatbot 是一问一答而 Agent 是给它一个任务它自己跑完。这个自己跑的过程就是 Agent Loop。Harness 的核心工作就是设计这个循环的每一步。PM 要做什么定义循环的边界——什么时候该停下来问人什么时候该自主决策循环最多跑多少步每一步之间的信息怎么传递2. Context Engineering上下文工程是什么管理 Agent 每次调用模型时喂进去的信息。LLM 有一个上下文窗口Context Window就像一个工作台空间有限。Context Engineering 就是决定工作台上放什么、不放什么、什么该压缩、什么必须保留。这个概念是 Prompt Engineering 的进化版•Prompt Engineering怎么写好一句提示词•Context Engineering怎么管理 Agent 运行过程中所有的上下文信息•Harness Engineering怎么设计整套系统让 Agent 稳定运行Context Engineering 是其中的一部分Context Engineering 概念为什么重要上下文窗口是有限的。一个长任务可能跑几百步但上下文窗口装不下所有历史。哪些信息该保留哪些该压缩compaction压缩后会不会丢失关键信息这些直接决定 Agent 的表现。Kimi 的 JD 里有一句话特别精准 “你关心 Agent 在每一个 step 中获得的 context在意 error message 是否给了 Agent 足够直接的引导希望优化每一次 compaction 后留下的关键信息。”PM 要做什么设计信息优先级策略——系统提示词占多少空间工具定义占多少对话历史保留多少轮文件内容怎么截断错误信息怎么精简但不失关键信息3. Tool Use 与 MCP工具调用是什么Agent 不只是说话它要做事。Tool Use 就是让 Agent 调用外部工具的能力——读写文件、执行代码、搜索网页、操作数据库、调用 API 等。MCP 是 Tool Use 的子集是 Anthropic 提出的一个开放协议标准化了 Agent 与工具之间的通信方式。也就是按照统一的规范写 Tool Use 的代码。为什么重要工具是 Agent 的手脚。没有工具Agent 只是一个聊天机器人。工具的质量直接影响 Agent 能完成什么任务。DeepSeek 的 JD 明确要求 PM 熟悉 MCP 协议。PM 要做什么决定 Agent 需要哪些工具、工具的优先级、工具调用的权限控制哪些操作需要用户确认、工具失败时的降级策略。4. State Management状态管理是什么跟踪 Agent 在执行任务过程中的当前状态。包括任务进度、已完成的步骤、待处理的事项、中间结果、错误记录等。为什么重要长任务执行中Agent 需要知道我做到哪了。如果状态管理混乱Agent 可能重复做同一件事或者遗漏关键步骤。Kimi 的 JD 把状态管理列为 Harness 的核心职责之一。PM 要做什么设计状态的可视化方案让用户能看到 Agent 的执行进度、状态持久化策略Agent 中断后能否恢复、状态异常的检测和处理机制。5. Sandbox沙箱与环境设计是什么Agent 执行代码和操作的隔离环境。沙箱确保 Agent 的操作不会影响真实系统——比如 Agent 写了一段有 bug 的代码沙箱可以防止它删掉你的系统文件。为什么重要Agent 需要在浏览器、终端、桌面、移动端等多种环境中工作。每种环境都有不同的能力和限制。Kimi 的 JD 明确提到了面向长时复杂任务的 long-running agent harness让 Agent 能在浏览器、终端、桌面、移动端等环境中持续推进工作。PM 要做什么定义 Agent 的环境边界能访问什么、不能访问什么、权限模型哪些操作需要授权、环境异常的处理策略。6. KV Cache是什么LLM 推理时的性能优化技术。模型在处理 token 时会生成中间计算结果Key-Value 对缓存这些结果可以避免重复计算大幅提升推理速度。大模型定价策略了“缓存命中”和“缓存未命中”的价值相差几十倍。为什么重要Agent 需要频繁调用模型每一步都可能调一次如果每次都从头计算速度和成本都不可接受。KV Cache 直接影响 Agent 的响应速度和运行成本。DeepSeek 的 JD 明确要求 PM 理解 KV Cache。PM 要做什么不需要自己实现 KV Cache但需要理解它的原理和限制比如缓存命中率、上下文长度对缓存效率的影响以便在产品设计中做出合理权衡。7. Reasoning 与 Planning推理与规划是什么Agent 的思考能力。Reasoning 是对当前情况的分析和推理Planning 是对任务的整体规划和步骤拆解。为什么重要简单任务可以一步一步做但复杂任务需要先规划再执行。Planning 能力决定了 Agent 能处理多复杂的任务。DeepSeek 的 JD 提到了 Reasoning 和 PlanningKimi 的 JD 则强调了从 agent trace、失败案例和长任务运行日志中反推出系统真正的结构性问题—— 这意味着 PM 需要理解 Agent 的推理过程才能判断问题出在哪里。PM 要做什么设计 Planning 的展示方式用户能否看到 Agent 的计划能否修改计划、规划失败时的降级策略。8. Memory记忆是什么Agent 跨会话、跨任务的信息持久化能力。包括短期记忆当前任务内的信息和长期记忆跨任务积累的知识和偏好。为什么重要没有 Memory 的 Agent 每次对话都是从零开始。有了 MemoryAgent 可以记住用户的偏好、历史决策、常用工具和工作模式越用越好用。PM 要做什么设计记忆的存储、检索和遗忘策略——什么信息值得记住记忆怎么检索用户能不能查看和编辑 Agent 的记忆隐私怎么保障9. Subagent 与 Multi-Agent子智能体与多智能体是什么一个 Agent 可以拆分出多个子 Agent 来并行处理不同任务或者多个 Agent 之间协作完成复杂任务。为什么重要复杂任务往往包含多个独立子任务。与其让一个 Agent 串行处理所有事情不如让多个 Agent 各司其职、并行推进。DeepSeek 的 JD 提到了 Subagent 和 Multi-AgentOpenClaw、Hermes 等主流 Agent 产品都有非常棒的自动激活子 Agent 加速任务的设计。PM 要做什么设计任务拆分和分配策略、子 Agent 之间的通信机制、结果汇总和冲突解决方案。汇总两份 JD 的关键词全景把两份 JD 中出现的所有技术关键词整理成一张表类别关键词来源核心框架Agent Loop, Harness EngineeringDeepSeek Kimi上下文管理Context Engineering, Prompt Engineering, Context Window, CompactionDeepSeek Kimi工具生态Tool Use, MCPDeepSeek状态与反馈State Management, Feedback Loop, Error HandlingKimi推理能力Reasoning, PlanningDeepSeek Kimi记忆系统MemoryDeepSeek多智能体Subagent, Multi-AgentDeepSeek运行环境Sandbox, Environment DesignKimi底层技术LLM API, KV CacheDeepSeek工程实践Agent Trace, Long-running Execution, Fault Tolerance, Retry LogicKimi设计方法论Load-bearing Design, Minimal Effective StructureKimi两份 JD 的异同两个视角看同一件事DeepSeek 和 Kimi 对 Harness 产品经理的理解高度一致但侧重点不同维度DeepSeekKimi岗位名称Agent Harness 产品经理Harness Product Engineer核心定位产品规划 用户研究 团队协调系统设计 技术架构 亲手打造对 Harness 的定义除模型以外的所有工作状态管理 上下文交接 反馈闭环用户研究要求强调设计系统性数据收集方法问卷、访谈、A/B 测试强调从 agent trace 和失败案例中反推结构性问题技术深度要求理解原理能 vibe coding 即可需要能判断问题出在模型/prompt/工具/环境/orchestration 哪一层对 Agent 产品的态度强调热情和品味列举了大量需深度使用的产品强调不满足于现有体验是重度榨取者产出预期产品路线图 指标体系 用户社群核心 harness 交互范式 系统支撑结构简单说DeepSeek 招的是懂技术的产品经理Kimi 招的是懂产品的工程师。PM 到底要会什么从 JD 提炼的能力模型综合两份 JDAgent Harness 产品经理需要具备以下能力必备能力1. Agent 产品的深度使用经验这是两份 JD 共同的硬性要求。DeepSeek 列了一串产品清单Claude Code、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes 等。不是用过就行是要深度使用、融入工作和生活。为什么这么重要因为 Harness 的设计决策极其依赖直觉——“这个 error message 够不够清晰”“compaction 之后信息丢没丢”“这个工具调用的反馈够不够及时”——这些判断只能来自大量真实使用经验。2. 理解 LLM 和 Agent 的技术原理不需要会写模型训练代码但需要理解• LLM API 的输入输出机制• Agent Loop 的运行逻辑• 工具调用的协议和流程• 上下文窗口的限制和管理策略• KV Cache 对性能的影响DeepSeek 明确说能够使用 vibe coding 写代码不一定需要技术背景。这说明岗位不要求你是工程师出身但要求你能用 AI 辅助写代码有动手验证想法的能力。3. 系统性的用户研究能力DeepSeek 要求设计系统性的收集数据的方法包括问卷、访谈、A/B 测试、灰度测试等并使用统计学的工具严谨科学的分析数据。Kimi 则要求从 agent trace、失败案例和长任务运行日志中反推出系统真正的结构性问题。两个视角合在一起你需要既能从用户侧获取反馈问卷、访谈也能从系统侧提取信号日志、trace、失败案例然后用科学的方法分析这些数据。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】