《构建FDE的核心交付能力实战工作坊》大模型实战专家—周红伟老师 法国科学院数据算法博士/前阿里人工智能专家/曾任马上消费风控负责人课程背景FDE成为AI行业落地的标准职位。OpenAI和Anthropic组建FDE工程团队。目前缺乏针对FDE的系统训练方法。大部分转型过来的工程师面临三个共同的困境第一习惯了拿到明确需求再动手到了客户现场发现需求本身就是模糊的不知道从哪里开始。第二技术能力没问题但不知道怎么在客户盯着屏幕时当场改方案也不知道怎么把一次失败的项目变成对公司有价值的情报。第三对Agent、Skills这些新工具会用来做Demo但不知道怎么能稳定跑在生产环境里更不知道怎么交给客户的团队自己维护。这门课就是为这三个困境设计的。它不讲通用的AI原理也不讲单一工具的文档用法而是把FDE日常工作中最高频、最容易卡住的环节拆开用两天时间密集训练一套能直接带走的工作方法。课程收益学完这两天你能带走的东西包括一、一套从模糊需求到可运行Agent的工作流程。从客户说“我想用AI做点什么”开始到画工作流草图、拆任务节点、搭最小可行Agent、现场迭代实操。二、对Hermes智能体架构的实际操作能力。能理解它的感知、规划、执行、反思循环能把它嵌入客户的具体业务流程里能在私有化环境下把依赖打包跑通。三、写Skill和复用Skill的方法。知道合格的Skill应该包含什么能把客户现场的常见任务封装成标准化Skill能在团队内部建立Skill集市避免重复造轮子。四、判断模型边界的直觉。能用压力测试探测模型在特定场景下的能力边界能判断什么任务该用RAG、什么该走规则能把失败案例整理成可复用的避坑清单。五、把客户现场信息转化成内部反馈的能力。能结构化地记录客户痛点能分析根因能写出让产品和研发看得懂、动得了的反馈报告能在内部推动需求落地。课程特色案例精讲案例实操项目实操代码实操项目实战交付培训时长2天课程大纲第一天 构建FDE的核心交付能力和案例实操第一部分 FDE交付闭环从模糊需求到可运行Agent1.1丢掉SOW从Mission开始1.1.1 用真实客户的模糊需求开场让学员先写下自己会怎么接这个活1.1.2 拆解Mission的关键动作把一句话需求变成3到5个可以由Agent完成的任务节点1.1.3 引入Agent编排画布工具动手画第一版工作流草图标出每一步谁来做决策1.2现场搭能跑的最小Agent1.2.1 选最简单的主线任务用提前准备好的模板搭出能跑通的Agent1.2.2 演示如何在客户盯着你屏幕时改System Prompt调整Agent的行为1.2.3 练习在客户说“这不是我要的”之后15分钟内重新跑一遍演示1.3看清Demo和上线的距离1.3.1 拿出3个Demo时完美上线后崩溃的真实案例逐个拆解死因1.3.2 给Agent加上日志、报警和人工暂停按钮从玩具变成能用的东西1.3.3 总结从Demo到Production的检查清单贴在工位上每次上线前过一遍第二部分 Hermes智能体FDE的现场决策引擎2.1为什么你需要Hermes2.1.1 回顾传统Prompt链路的三个常见痛点僵化、脆弱、难调试2.1.2 讲清Hermes的“感知-规划-执行-反思”循环画在一张白板上反复对照2.1.3 把反欺诈调查员的真实工作流拆开展示Hermes循环怎么嵌入进去2.2 Hermes的架构现场拆解2.2.1 用一套开源的Hermes实例把每个模块的输入输出打印出来看2.2.2 学员动手修改规划步骤的逻辑观察Agent后续行为的变化2.2.3 讨论什么场景下应该让Hermes自己规划什么场景应该走固定编排2.3让Hermes跑在客户业务里2.3.1 接入客户真实API时的三个常见坑鉴权、限流、超时逐条过方案2.3.2 如何把客户内部术语映射到Agent的指令里避免模型理解偏差2.3.3 完成练习在客户的内网环境里把Hermes跑通输出第一份正确结果第三部分 Skills把能力拆成可拼装的积木3.1 Skills不是写代码是定义能力3.1.1 从烂Skill开始讲让大家挑毛病建立好坏判断标准3.1.2 拆解好的Skill包含什么名称、描述、参数、接口、输出格式3.1.3 现场写简单的Skill然后让其他人调用来找茬3.2把客户现场任务变成标准化Skill3.2.1 从客户现场带回来的常见需求中抽象出3到5个高频Skill3.2.2 给Skill写描述让三个不同的Agent调用对比输出一致性3.2.3 讨论Skill应该写到多细才算合格粗细之间的分界线在哪里3.3建Skill集市3.3.1 把所有人写的Skill放在共享目录里按行业和场景分好类3.3.2 定简单规范让下人能找到、看懂、直接用别人写的Skill3.3.3 演练接到新客户后先在集市里翻一遍匹配能复用的Skill再动手第四部分 模型边界的肌肉记忆4.1摸清模型能做什么不能做什么4.1.1 用同一组指令测试三个不同模型观察输出的差异并记录4.1.2 设计有针对性的压力测试集专门测幻觉、遗忘、逻辑断裂4.1.3 每天选自己跑出来的失败case放进个人错题本标注根因4.2 RAG、规则、Fallback的选择直觉4.2.1 用五个真实业务场景做判断题训练什么时候该用RAG4.2.2 讨论三个强规则约束的场景推导出必须加规则引擎的信号4.2.3 设计人工兜底节点的触发条件写出具体的阈值和逻辑4.3失败案例解剖4.3.1 每人带自己遇到过的最头疼的失败case当堂分组解剖4.3.2 用同一套框架分析每个case模型问题、编排问题还是Skill问题4.3.3 把解剖结果归纳成一份避坑清单后续新项目启动时先拿出来对照第五部分 从客户现场到产品Roadmap5.1你不是去交付项目5.1.1 把FDE的定位重新讲清楚前线感知器不是高级外包5.1.2 解释反馈链路为什么值钱模型公司为什么愿意为这个付高薪5.1.3 分组讨论自己做过的项目里哪些信息如果能回流就价值巨大5.2把客户抱怨变成可行动的反馈5.2.1 拿到一句“这个太慢了”逐层拆出问题现象、根因、改进方向、商业价值5.2.2 练习用同一套模板写反馈条让产品和研发看完就能动手5.2.3 对比一份好反馈和一份烂反馈明确差距在哪里5.3把反馈推进产品Roadmap5.3.1 模拟一次产品规划会FDE要在3分钟内把反馈讲清楚争取排期5.3.2 写一份内部问题单附上客户场景截图、日志、影响范围5.3.3 总结FDE推动内部改进的三条常用路径提issue、产品会、直接找owner第六部分 全天实战从Mission到交付模拟6.1拿到Mission开始动手6.1.1 给模拟银行客户的模糊需求两人一组开始拆解任务6.1.2 用画布画出Agent工作流列好需要哪些Skill然后分工去写6.1.3 各组在2小时内完成可跑通的MVP原型6.2模拟客户会议当场迭代6.2.1 导师扮演客户每组轮流演示原型并接收反馈6.2.2 现场改System Prompt或换Skill15分钟内重新演示6.2.3 迭代两轮后评估原型的可用性改进幅度第二天 FDE在复杂场景中实战交付第一部分 复杂业务场景下的Agent设计1.1多Agent协同模式1.1.1 区分三种协同方式串行管道、并行分派、自由协作各举适用场景1.1.2 设计跨部门审批场景的Agent群画出消息传递路径1.1.3 讨论多Agent协同时最常出的三个乱子消息丢失、重复处理、顺序错乱1.2长时间运行任务的编排1.2.1 拆解可能跑几小时甚至几天的任务设计分段和检查点1.2.2 给Agent加上中断恢复能力停电断网后能从断点继续1.2.3 讨论什么时候该用排队机制把任务存下来而不是让Agent一直等着1.3在客户私有化环境里的交付1.3.1 列出私有化部署的五个硬约束网络隔离、模型本地、鉴权体系、审计日志、合规备案1.3.2 如何在离线环境下把依赖打包好确保到现场能一次跑通1.3.3 用一套模拟的私有化环境完成部署跑出第一份结果并截图留证第二部分 调优与排障实战2.1 Agent行为不符合预期时的排查路径2.1.1 从现象倒推先用日志锁定是哪个环节出的问题2.1.2 用二分法逐步缩小范围定位到具体的Skill或Prompt语句2.1.3 拿着定位到的问题当场改完重跑记录修复前后的对比2.2 Skill调用失败的处理策略2.2.1 列出Skill失败的五种常见类型超时、返回空、格式错、权限不够、数据脏2.2.2 给每种失败设计对应的重试或降级策略写进Skill定义里2.2.3 在代码里加入失败计数器和熔断机制避免坏Skill拖垮整个Agent2.3客户说模型变笨了怎么办2.3.1 收集证据把同case在旧版本和新版本上的输出对比2.3.2 用一组标准化的测试case跑一遍把退步的地方标出来2.3.3 决定下一步调整Prompt绕过、换模型、还是反馈给内部团队等修复第三部分 交付物的落地与交接3.1什么该留什么该扔3.1.1 区分三类交付物代码和Skill、操作文档、给高管的汇报3.1.2 代码交接的核心不是堆注释是让客户的工程师能自己改得动3.1.3 文档只写最关键的三件事怎么跑起来、常见问题怎么排、找谁求救3.2让客户团队能自己接手3.2.1 设计一次30分钟的交接会10分钟演示、10分钟答疑、10分钟让他们自己操作3.2.2 教会客户最核心的维护动作改Prompt让Agent适配业务变化3.2.3 用录屏工具把常见维护操作录下来文件命名写清楚日期和场景3.3离开后的持续支撑3.3.1 跟客户定好未来月的响应节奏和联系方式3.3.2 在内部记录这个客户的状态、遗留问题、可扩展的方向3.3.3 三个月后回访一次收集Agent真实运行数据作为后续迭代的依据第四部分 内部反馈的推动与汇报4.1写好一份让产品经理秒懂的反馈报告4.1.1 用一套标准模板写反馈报告含问题现象、复现步骤、根因判断、改进建议四个部分4.1.2 对比三份真实反馈报告的改前改后版本抽取出好坏标准4.1.3 每人写一份针对自己昨天实战项目的反馈报告互评打分4.2在内部推动需求落地4.2.1 画出一张内部决策流程图找到你反馈的问题最终谁拍板4.2.2 模拟一次1对1沟通用3分钟说服产品经理把这个需求排上4.2.3 讨论如果产品没排期怎么办自己写Skill先用、拉客户一起提需求、还是等4.3用数据讲你的工作价值4.3.1 列出FDE值得记录的三类数据客户用量、解决的问题数、带来的新增消耗4.3.2 用季度维度的表格展示自己的输出标注哪些影响了内部决策4.3.3 写100字的自我总结用于内部述职或晋升材料第五部分 全套流程大演练5.1拿到新客户Mission开始部署5.1.1 接到新场景Mission由学员独立完成从拆解到Agent设计5.1.2 列出需要提前准备的环境信息和客户资料清单5.1.3 搭建Agent并完成第一轮自测确保交付给客户前基本可用5.2客户现场演示与迭代5.2.1 每组在导师扮演的客户面前演示接收随机抛出的刁钻问题5.2.2 现场调整方案并重新演示两轮迭代后评估最终效果5.2.3 其他组观察并记录反馈手法结束后互评优劣5.3收尾复盘与认证评估5.3.1 每人用一页纸总结自己的Agent做了什么、遇到什么问题、如何解决5.3.2 导师从原型可用性、迭代速度、Skill复用度三个维度打分5.3.3 公布考核结果颁发课程认证收集每个人下一步的行动计划
AI时代必修课:构建FDE的核心交付能力实战工作坊
《构建FDE的核心交付能力实战工作坊》大模型实战专家—周红伟老师 法国科学院数据算法博士/前阿里人工智能专家/曾任马上消费风控负责人课程背景FDE成为AI行业落地的标准职位。OpenAI和Anthropic组建FDE工程团队。目前缺乏针对FDE的系统训练方法。大部分转型过来的工程师面临三个共同的困境第一习惯了拿到明确需求再动手到了客户现场发现需求本身就是模糊的不知道从哪里开始。第二技术能力没问题但不知道怎么在客户盯着屏幕时当场改方案也不知道怎么把一次失败的项目变成对公司有价值的情报。第三对Agent、Skills这些新工具会用来做Demo但不知道怎么能稳定跑在生产环境里更不知道怎么交给客户的团队自己维护。这门课就是为这三个困境设计的。它不讲通用的AI原理也不讲单一工具的文档用法而是把FDE日常工作中最高频、最容易卡住的环节拆开用两天时间密集训练一套能直接带走的工作方法。课程收益学完这两天你能带走的东西包括一、一套从模糊需求到可运行Agent的工作流程。从客户说“我想用AI做点什么”开始到画工作流草图、拆任务节点、搭最小可行Agent、现场迭代实操。二、对Hermes智能体架构的实际操作能力。能理解它的感知、规划、执行、反思循环能把它嵌入客户的具体业务流程里能在私有化环境下把依赖打包跑通。三、写Skill和复用Skill的方法。知道合格的Skill应该包含什么能把客户现场的常见任务封装成标准化Skill能在团队内部建立Skill集市避免重复造轮子。四、判断模型边界的直觉。能用压力测试探测模型在特定场景下的能力边界能判断什么任务该用RAG、什么该走规则能把失败案例整理成可复用的避坑清单。五、把客户现场信息转化成内部反馈的能力。能结构化地记录客户痛点能分析根因能写出让产品和研发看得懂、动得了的反馈报告能在内部推动需求落地。课程特色案例精讲案例实操项目实操代码实操项目实战交付培训时长2天课程大纲第一天 构建FDE的核心交付能力和案例实操第一部分 FDE交付闭环从模糊需求到可运行Agent1.1丢掉SOW从Mission开始1.1.1 用真实客户的模糊需求开场让学员先写下自己会怎么接这个活1.1.2 拆解Mission的关键动作把一句话需求变成3到5个可以由Agent完成的任务节点1.1.3 引入Agent编排画布工具动手画第一版工作流草图标出每一步谁来做决策1.2现场搭能跑的最小Agent1.2.1 选最简单的主线任务用提前准备好的模板搭出能跑通的Agent1.2.2 演示如何在客户盯着你屏幕时改System Prompt调整Agent的行为1.2.3 练习在客户说“这不是我要的”之后15分钟内重新跑一遍演示1.3看清Demo和上线的距离1.3.1 拿出3个Demo时完美上线后崩溃的真实案例逐个拆解死因1.3.2 给Agent加上日志、报警和人工暂停按钮从玩具变成能用的东西1.3.3 总结从Demo到Production的检查清单贴在工位上每次上线前过一遍第二部分 Hermes智能体FDE的现场决策引擎2.1为什么你需要Hermes2.1.1 回顾传统Prompt链路的三个常见痛点僵化、脆弱、难调试2.1.2 讲清Hermes的“感知-规划-执行-反思”循环画在一张白板上反复对照2.1.3 把反欺诈调查员的真实工作流拆开展示Hermes循环怎么嵌入进去2.2 Hermes的架构现场拆解2.2.1 用一套开源的Hermes实例把每个模块的输入输出打印出来看2.2.2 学员动手修改规划步骤的逻辑观察Agent后续行为的变化2.2.3 讨论什么场景下应该让Hermes自己规划什么场景应该走固定编排2.3让Hermes跑在客户业务里2.3.1 接入客户真实API时的三个常见坑鉴权、限流、超时逐条过方案2.3.2 如何把客户内部术语映射到Agent的指令里避免模型理解偏差2.3.3 完成练习在客户的内网环境里把Hermes跑通输出第一份正确结果第三部分 Skills把能力拆成可拼装的积木3.1 Skills不是写代码是定义能力3.1.1 从烂Skill开始讲让大家挑毛病建立好坏判断标准3.1.2 拆解好的Skill包含什么名称、描述、参数、接口、输出格式3.1.3 现场写简单的Skill然后让其他人调用来找茬3.2把客户现场任务变成标准化Skill3.2.1 从客户现场带回来的常见需求中抽象出3到5个高频Skill3.2.2 给Skill写描述让三个不同的Agent调用对比输出一致性3.2.3 讨论Skill应该写到多细才算合格粗细之间的分界线在哪里3.3建Skill集市3.3.1 把所有人写的Skill放在共享目录里按行业和场景分好类3.3.2 定简单规范让下人能找到、看懂、直接用别人写的Skill3.3.3 演练接到新客户后先在集市里翻一遍匹配能复用的Skill再动手第四部分 模型边界的肌肉记忆4.1摸清模型能做什么不能做什么4.1.1 用同一组指令测试三个不同模型观察输出的差异并记录4.1.2 设计有针对性的压力测试集专门测幻觉、遗忘、逻辑断裂4.1.3 每天选自己跑出来的失败case放进个人错题本标注根因4.2 RAG、规则、Fallback的选择直觉4.2.1 用五个真实业务场景做判断题训练什么时候该用RAG4.2.2 讨论三个强规则约束的场景推导出必须加规则引擎的信号4.2.3 设计人工兜底节点的触发条件写出具体的阈值和逻辑4.3失败案例解剖4.3.1 每人带自己遇到过的最头疼的失败case当堂分组解剖4.3.2 用同一套框架分析每个case模型问题、编排问题还是Skill问题4.3.3 把解剖结果归纳成一份避坑清单后续新项目启动时先拿出来对照第五部分 从客户现场到产品Roadmap5.1你不是去交付项目5.1.1 把FDE的定位重新讲清楚前线感知器不是高级外包5.1.2 解释反馈链路为什么值钱模型公司为什么愿意为这个付高薪5.1.3 分组讨论自己做过的项目里哪些信息如果能回流就价值巨大5.2把客户抱怨变成可行动的反馈5.2.1 拿到一句“这个太慢了”逐层拆出问题现象、根因、改进方向、商业价值5.2.2 练习用同一套模板写反馈条让产品和研发看完就能动手5.2.3 对比一份好反馈和一份烂反馈明确差距在哪里5.3把反馈推进产品Roadmap5.3.1 模拟一次产品规划会FDE要在3分钟内把反馈讲清楚争取排期5.3.2 写一份内部问题单附上客户场景截图、日志、影响范围5.3.3 总结FDE推动内部改进的三条常用路径提issue、产品会、直接找owner第六部分 全天实战从Mission到交付模拟6.1拿到Mission开始动手6.1.1 给模拟银行客户的模糊需求两人一组开始拆解任务6.1.2 用画布画出Agent工作流列好需要哪些Skill然后分工去写6.1.3 各组在2小时内完成可跑通的MVP原型6.2模拟客户会议当场迭代6.2.1 导师扮演客户每组轮流演示原型并接收反馈6.2.2 现场改System Prompt或换Skill15分钟内重新演示6.2.3 迭代两轮后评估原型的可用性改进幅度第二天 FDE在复杂场景中实战交付第一部分 复杂业务场景下的Agent设计1.1多Agent协同模式1.1.1 区分三种协同方式串行管道、并行分派、自由协作各举适用场景1.1.2 设计跨部门审批场景的Agent群画出消息传递路径1.1.3 讨论多Agent协同时最常出的三个乱子消息丢失、重复处理、顺序错乱1.2长时间运行任务的编排1.2.1 拆解可能跑几小时甚至几天的任务设计分段和检查点1.2.2 给Agent加上中断恢复能力停电断网后能从断点继续1.2.3 讨论什么时候该用排队机制把任务存下来而不是让Agent一直等着1.3在客户私有化环境里的交付1.3.1 列出私有化部署的五个硬约束网络隔离、模型本地、鉴权体系、审计日志、合规备案1.3.2 如何在离线环境下把依赖打包好确保到现场能一次跑通1.3.3 用一套模拟的私有化环境完成部署跑出第一份结果并截图留证第二部分 调优与排障实战2.1 Agent行为不符合预期时的排查路径2.1.1 从现象倒推先用日志锁定是哪个环节出的问题2.1.2 用二分法逐步缩小范围定位到具体的Skill或Prompt语句2.1.3 拿着定位到的问题当场改完重跑记录修复前后的对比2.2 Skill调用失败的处理策略2.2.1 列出Skill失败的五种常见类型超时、返回空、格式错、权限不够、数据脏2.2.2 给每种失败设计对应的重试或降级策略写进Skill定义里2.2.3 在代码里加入失败计数器和熔断机制避免坏Skill拖垮整个Agent2.3客户说模型变笨了怎么办2.3.1 收集证据把同case在旧版本和新版本上的输出对比2.3.2 用一组标准化的测试case跑一遍把退步的地方标出来2.3.3 决定下一步调整Prompt绕过、换模型、还是反馈给内部团队等修复第三部分 交付物的落地与交接3.1什么该留什么该扔3.1.1 区分三类交付物代码和Skill、操作文档、给高管的汇报3.1.2 代码交接的核心不是堆注释是让客户的工程师能自己改得动3.1.3 文档只写最关键的三件事怎么跑起来、常见问题怎么排、找谁求救3.2让客户团队能自己接手3.2.1 设计一次30分钟的交接会10分钟演示、10分钟答疑、10分钟让他们自己操作3.2.2 教会客户最核心的维护动作改Prompt让Agent适配业务变化3.2.3 用录屏工具把常见维护操作录下来文件命名写清楚日期和场景3.3离开后的持续支撑3.3.1 跟客户定好未来月的响应节奏和联系方式3.3.2 在内部记录这个客户的状态、遗留问题、可扩展的方向3.3.3 三个月后回访一次收集Agent真实运行数据作为后续迭代的依据第四部分 内部反馈的推动与汇报4.1写好一份让产品经理秒懂的反馈报告4.1.1 用一套标准模板写反馈报告含问题现象、复现步骤、根因判断、改进建议四个部分4.1.2 对比三份真实反馈报告的改前改后版本抽取出好坏标准4.1.3 每人写一份针对自己昨天实战项目的反馈报告互评打分4.2在内部推动需求落地4.2.1 画出一张内部决策流程图找到你反馈的问题最终谁拍板4.2.2 模拟一次1对1沟通用3分钟说服产品经理把这个需求排上4.2.3 讨论如果产品没排期怎么办自己写Skill先用、拉客户一起提需求、还是等4.3用数据讲你的工作价值4.3.1 列出FDE值得记录的三类数据客户用量、解决的问题数、带来的新增消耗4.3.2 用季度维度的表格展示自己的输出标注哪些影响了内部决策4.3.3 写100字的自我总结用于内部述职或晋升材料第五部分 全套流程大演练5.1拿到新客户Mission开始部署5.1.1 接到新场景Mission由学员独立完成从拆解到Agent设计5.1.2 列出需要提前准备的环境信息和客户资料清单5.1.3 搭建Agent并完成第一轮自测确保交付给客户前基本可用5.2客户现场演示与迭代5.2.1 每组在导师扮演的客户面前演示接收随机抛出的刁钻问题5.2.2 现场调整方案并重新演示两轮迭代后评估最终效果5.2.3 其他组观察并记录反馈手法结束后互评优劣5.3收尾复盘与认证评估5.3.1 每人用一页纸总结自己的Agent做了什么、遇到什么问题、如何解决5.3.2 导师从原型可用性、迭代速度、Skill复用度三个维度打分5.3.3 公布考核结果颁发课程认证收集每个人下一步的行动计划