OpenClaw学习总结_I_核心架构_11:ModelFailover详解

OpenClaw学习总结_I_核心架构_11:ModelFailover详解 I. 核心架构 - 11. Model Failover 课程位置阶段I. 核心架构课序第 11 课前置知识I-10. Sandboxing后续阶段II. 频道系统 本课核心问题你不懂我就这样教你你会遇到非常现实的问题模型偶尔超时/报错怎么办某个 API Key 被限流/失效怎么办我能不能让系统自动切换到备用模型/备用凭证答案是可以这就是Model Failover模型故障转移/自动降级。一句话Model Failover 当主模型请求失败时按策略自动切换到备用模型/备用认证并带冷却与重试策略保证系统可用性。 正确心智模型类比主模型像“主电源”备用模型像“UPS 备用电源”Failover 像“自动切换开关”目标不是“永不失败”不可能而是失败时系统还能工作用户能得到稳定响应 Failover 通常包含三件事1Fallbacks备用模型列表配置主模型 若干备用模型{ agents: { defaults: { model: { primary: anthropic/claude-sonnet-4-5, fallbacks: [openai/gpt-5.2, anthropic/claude-haiku-4.5], }, models: { anthropic/claude-sonnet-4-5: { alias: Sonnet }, openai/gpt-5.2: { alias: GPT }, anthropic/claude-haiku-4.5: { alias: Haiku }, }, }, }, }重点fallbacks 不只是“换模型”也是“换提供者”。2Retry重试策略常见失败包括timeout5xxrate limittransient network errorFailover 需要先判断是不是“短暂错误” → 重试还是“持续不可用” → 切换3Cooldown冷却机制如果某模型刚失败立即再试可能还是失败。所以 Failover 会设置“冷却时间”失败后一段时间内不再选它等冷却结束再恢复这能避免一直撞墙在多个模型之间疯狂来回切 实战你应该怎么配推荐配置生产可用主模型高质量Sonnet/Opus备用一个不同提供者OpenAI再备一个便宜快速模型Haiku{ agents: { defaults: { model: { primary: anthropic/claude-sonnet-4-5, fallbacks: [openai/gpt-5.2, anthropic/claude-haiku-4.5], }, }, }, }适用场景你想要主质量但不能因为主模型挂了就完全不可用⚠️ 常见陷阱陷阱表现原因解决备用模型没配置主模型失败就彻底挂fallbacks 为空配置至少 1 个 fallback备用同提供者同时一起挂同一供应商故障至少 1 个跨提供者 fallback频繁切换回复质量忽高忽低没冷却/没策略配 cooldown retry policy认证轮换混乱某 key 失效导致全挂凭证未隔离/未轮换用 auth profiles/轮换策略 学习心得Model Failover 的核心不是“高级”而是“工程常识”。只要你线上跑起来一定会遇到API 抖动限流超时供应商故障Failover 让你从“碰运气”变成“可控系统”。我建议把 Failover 当成生产环境默认配置而不是可选项✅ 本课总结记住 4 点Failover 的目标是可用性不是永不失败。至少配置 1 个跨提供者 fallback。要有 retry cooldown避免疯狂切换。生产环境必须配置 failover否则迟早翻车。 相关资源官方 Model Failoverhttps://docs.openclaw.ai/concepts/model-failoverModels 配置https://docs.openclaw.ai/concepts/models配置参考modelhttps://docs.openclaw.ai/gateway/configuration-reference下一阶段II. 频道系统从 WhatsApp 开始