5个OpenClaw可用的免费AI模型

5个OpenClaw可用的免费AI模型 我曾担心 Anthropic 会因为我在 OpenClaw 中运行 Claude 而封禁我的账户。有报道称用户在发布后的第一周就被标记了。然后它发生了——Anthropic 完全阻止了在 OpenClaw 中使用 Claude Max tokens。我另一个担心的是成本。每天在 OpenClaw 上运行 Claude Sonnet 的消耗超出了我的预期。每条消息都会将完整的对话历史发送给模型。所以我开始寻找免费的替代方案。经过数周测试不同的模型、提供商和配置我找到了 5 个可以与 OpenClaw 配合使用的模型。有些模型可以在本地运行。有些使用免费云层足够完成工作。我学到了——免费根据你选择的路线有不同含义。本地模型每个 token 不花钱但需要不错的硬件。云免费层给你一个每日重置的配额。有些模型非常便宜四舍五入后接近零。在本文中我将详细介绍我使用的 5 个模型、为什么使用它们以及如何在 OpenClaw 中设置每个模型。1. Kimi K2.5来自 Moonshot AI 的 Kimi K2.5 是目前 OpenRouter 上最受欢迎的免费模型。我最初将它作为临时备用方案同时我完善设置。最终它成为了我在 OpenClaw 中的首选模型。推理质量接近 Claude Sonnet工具调用正常工作128K 上下文窗口可以处理长 OpenClaw 会话不会丢失早期消息。非常适合处理阅读电子邮件、管理日历和运行自动化的代理Moonshot 已宣布在其平台上提供永久免费访问。在 OpenRouter 上免费层大约每分钟给你 20 个请求每日重置。设置方法openclaw config set agents.defaults.model.primary openrouter/moonshotai/kimi-k2.5如果你使用 Ollama还有更快的路线。Kimi K2.5 在 Ollama 上作为云模型可用因此你可以用一行命令直接启动它并与 OpenClaw 配合ollama launch openclaw --model kimi-k2.5:cloud最佳用途通用代理工作、编码任务、研究和内容起草。如果你想使用免费云推理这是我推荐的入门模型。局限性免费层的速率限制意味着重度用户在高负载会话时会遇到瓶颈。2. 通过 OAuth 的 Qwen大多数人在寻找免费 OpenClaw 模型时会跳过 Qwen。OpenClaw 有一个内置插件用于 Qwen 的 OAuth 流程你通过设备代码进行一次认证即可访问 Qwen Coder 和 Qwen Vision 模型每天 2000 次免费请求Qwen 3.5 具有原生代理能力它被设计为可以思考、搜索、使用工具和构建设置方法如下openclaw plugins enable qwen-portal-auth openclaw models auth login --provider qwen-portal --set-default登录后你的模型引用类似于qwen-portal/coder-model或qwen-portal/vision-model。Token 会自动刷新所以你不需要一直登录。我不会用这个运行整个团队。但对于处理编码任务、文件读取和日常自动化的个人 OpenClaw 代理Qwen 免费层可以完成工作。最佳用例编码任务、基于视觉的工作流程以及任何想要可靠免费层但不想处理多个 API 密钥的人。局限性如果 OAuth token 过期或被撤销你需要重新运行登录命令。3. Gemini FlashGoogle 的 Gemini Flash 是如果你想要大上下文窗口而不付费的情况下云推理的最佳免费选项。免费层每分钟给你 15 个请求最高达 100 万个 token 的上下文对于越来越长的 OpenClaw 会话那个上下文长度是相对于大多数免费替代方案的真实优势我将 Gemini Flash 作为我的备用模型。当 Kimi K2.5 达到速率限制时Gemini 接上。像这样添加到你的 OpenClaw 配置中{ models: { providers: { google: { models: [ { id: gemini-3-flash, name: Gemini 3 Flash } ] } } } }你需要从 Google 的 AI Studio 获取GEMINI_API_KEY。免费层 API 密钥大约两分钟就能生成。最佳用例长对话、文档摘要、研究任务以及作为主要免费模型达到每日上限时的可靠备用。局限性Google 的免费层可能会使用你的数据进行训练。对于副项目和学习这可能没问题。对于专有代码或敏感客户工作使用付费层或在本地运行。4. OpenRouter 免费模型OpenRouter 不是模型而是一个网关让你通过单个 API 密钥访问来自不同提供商的数十个模型。使它对 OpenClaw 有用的是:free后缀。将其附加到支持的模型你就可以获得零成本推理。*可用的免费模型会随时间轮换但通常都有不错的可用选择*你通过 OpenRouter 将 Kimi K2.5 配置为主模型添加一个 Llama 模型作为第一个备用Gemini 作为最后的备用一个基本的免费设置如下{ agents: { defaults: { model: { primary: openrouter/meta-llama/llama-3.2-3b-instruct:free } } } }OpenClaw 还有一个内置扫描器检查当前 OpenRouter 上有哪些免费模型可用并测试它们的工具调用和图像支持openclaw models scan此命令按能力对可用的免费模型进行排名让你交互式地选择主模型和备用模型。它节省了你手动检查哪些免费模型符合 OpenClaw 工具调用要求的时间。最佳用例想要最大灵活性并在免费模型之间自动故障转移的用户。也非常适合实验不同的模型而不必每次都更改提供商配置。局限性OpenRouter 上的免费模型会变化。今天免费的模型明天可能不免费。回来检查并保持你的备用模型更新。5. 通过 Ollama 的 Qwen 3.5我到目前为止介绍的所有模型都依赖于别人的服务器。通过 Ollama 本地运行的 Qwen 3.5 依赖于你的硬件。我选择 Qwen 3.5 是因为阿里巴巴构建它时考虑到了代理工作流程。*它在工具调用、多步推理和代码生成方面比同尺寸的大多数开源模型做得更好。*9B 版本可以在大多数具有 16GB RAM 的现代笔记本电脑上运行。27B 版本需要 32GB 但在复杂任务上提供更好的结果。*如果你有 M 系列 Mac 或专用 GPU体验很流畅。Ollama 最近添加了 OpenClaw 的一键启动命令。ollama launch openclaw --model qwen3.5这一条命令会拉取模型、配置提供商并将其连接到 OpenClaw。如果你更喜欢手动控制你仍然可以单独安装 Ollama用ollama pull qwen3.5拉取模型并自己连接提供商配置。但对大多数人来说启动命令就足够了。最佳用例隐私优先设置、离线工作、你不信任任何云处理的敏感数据以及想要将成本尽可能接近零的开发者。局限性你需要不错的硬件。9B 模型在 16GB RAM 上可以工作但在复杂的的多步任务上会很吃力。6、最终思考经过数周测试这是我最终采用的配置主模型Kimi K2.5 — 免费处理大多数日常任务备用 1通过 Ollama 本地运行的 Qwen 3.5 — 在速率限制时接上备用 2Gemini Flash — 在 100 万 token 上下文的重度使用时非常理想自从有多个免费选项后我停止了在 Claude 模型上运行 OpenClaw。原文链接5个OpenClaw可用的免费AI模型 - 汇智网