零 Token 消耗!Agnes 多模态 Agent 全栈实战指南

零 Token 消耗!Agnes 多模态 Agent 全栈实战指南 文生图 · 文生视频 · 智能 Agent 一站式接入真正让 AI 落地工作流前言我为什么开始用 Agnes在折腾了一堆 AI 工具之后我最大的痛点不是模型效果而是——每次调用都在烧钱。输入 token、输出 token还有各种隐性计费一个稍微复杂点的 Agent 工作流跑下来账单看得人心疼。直到我发现了 Agnes才算找到了真正能「无感」使用的 AI 平台。本文不是硬广是我实际配置并跑通了图像生成、视频生成、多轮 Agent 对话之后把整套流程整理出来分享给大家。如果你也在找一套零 token 消耗、功能完整的多模态 AI 解决方案这篇可以直接当手册用。一、Agnes 平台概览三大核心模型Agnes 目前对外提供三个主力模型覆盖了日常 AI 工作流的主要场景Agnes2.0 Flash —— 智能 Agent 模型支持工具调用、多轮对话、自定义知识库适合构建自动化工作流Agnes-Image-2.1-Flash —— 图像生成模型文生图效果出色支持风格定制出图速度快Agnes-Video-V2.0 —— 视频生成模型支持文生视频适合内容创作、产品演示等场景重点Agnes 平台的模型调用不消耗用户的 token 配额按实际 API 请求计费对于高频场景尤其友好。二、注册账号并获取 API Key整个接入流程非常标准跟 OpenAI 的操作逻辑基本一致熟悉的同学五分钟内可以跑通。2.1 创建 API 密钥登录 Agnes 平台后进入「设置 → API 密钥」页面点击「创建新的密钥」为密钥命名比如 test_01保存后复制备用。图1Agnes 平台 API 密钥管理页面注意密钥只在创建时完整显示一次务必即时保存。后续列表中只展示前缀和后缀如 sk-m9b5I...9Aobph。2.2 接口地址Agnes 提供兼容 OpenAI 协议的 API接口地址格式为https://api.agnes-ai.com/v1/chat/completions三、将 Agnes 模型接入 WorkBuddy以自定义模型为例Agnes 支持通过任何兼容 OpenAI 协议的客户端接入。下面以 WorkBuddy 为例演示完整的配置流程。WorkBuddy 是目前体验较好的 AI 工作台之一支持多模型切换、技能调用、Agent 工作流等功能。3.1 打开「添加模型」配置弹窗在 WorkBuddy 主界面底部工具栏点击模型选择器 → 展开列表后找到「 配置自定义模型」入口见下图红色箭头标注。图2WorkBuddy 模型选择器底部有「 配置自定义模型」入口3.2 填写配置信息在弹出的「添加模型」对话框中按如下内容填写各字段提供商选择「自定义 / Custom」接口地址填入 Agnes API 地址API Key粘贴第二步中保存的密钥模型名称根据需要填写例如 agnes2-flash 或 agnes-image-2.1-flash图3WorkBuddy 添加自定义模型配置弹窗高级配置中建议勾选「工具调用」和「图片输入」这样 Agnes2.0 Flash 的 Agent 能力和多模态输入都能正常使用。配置完成后点击「保存」即可。四、实战一Agnes-Image-2.1-Flash 文生图Agnes 图像模型支持自然语言描述直接出图接入 WorkBuddy 后可以通过技能Skill调用的方式触发图像生成。4.1 在 WorkBuddy 中触发图像生成配置完成后在对话框中使用 agnes-image-api 技能直接用中文描述你想要的画面模型会自动理解并生成。图4WorkBuddy 中调用 agnes-image-api 技能用自然语言生成图像如上图输入「我要猫咪在海边散步图片」系统触发工具调用Agnes-Image-2.1-Flash 完成图像生成。整个过程不需要编写任何 Prompt 模板。4.2 生成效果示例以下是 Agnes-Image-2.1-Flash 实际输出的图像效果提示词猫咪在海边散步黄昏光线写实风格图5Agnes-Image-2.1-Flash 生成效果 —— 猫咪海边散步画面细节丰富光线处理自然毛发质感和背景的海浪、贝壳都有较高的真实感适合内容创作、社媒配图等场景。五、实战二Agnes2.0 Flash Agent 能力Agnes2.0 Flash 的核心优势在于 Agent 工作流支持多步骤工具调用、联网搜索、文件处理、自定义知识库等能力适合构建自动化流程。5.1 API 调用示例Python下面是一个简单的 Python 示例展示如何通过 API 调用 Agnes2.0 Flash 进行多轮对话import openai client openai.OpenAI( api_keysk-your-agnes-api-key, base_urlhttps://api.agnes-ai.com/v1 ) response client.chat.completions.create( modelagnes2-flash, messages[ {role: system, content: 你是一个专业的数据分析助手}, {role: user, content: 请帮我分析这份销售数据的趋势} ] ) print(response.choices[0].message.content)Agnes2.0 Flash 完全兼容 OpenAI SDK存量代码只需替换 api_key 和 base_url 两个参数迁移成本极低。5.2 工具调用Function CallingAgnes2.0 Flash 支持标准的 tools 参数格式可以接入自定义函数、数据库查询、外部 API 等工具。以下是定义工具的示例结构tools [ { type: function, function: { name: get_weather, description: 获取指定城市的实时天气, parameters: { type: object, properties: { city: {type: string, description: 城市名称} }, required: [city] } } } ]六、实战三Agnes-Video-V2.0 文生视频视频生成是 Agnes 平台近期推出的重量级功能。Agnes-Video-V2.0 支持通过文字描述直接生成短视频适用于产品功能演示视频社交媒体短视频内容教学/说明类动态图解创意广告素材生成接入方式与图像模型相同在 WorkBuddy 中配置模型名称为 agnes-video-v2 即可或通过 API 直接调用response client.chat.completions.create( modelagnes-video-v2, messages[ {role: user, content: 生成一段5秒的产品展示视频科技感蓝色背景3D旋转logo} ] )七、关于计费不消耗 token 是什么意思很多同学对「不消耗 token」有疑惑这里解释一下Agnes 平台的计费单位是 API 调用次数 / 请求量而非按输入输出 token 数量计费。这意味着无论你的输入内容有多长不会因为「token超出」而产生额外费用Agent 多轮对话中的上下文不会随着对话变长而指数级增加成本批量处理任务时费用预估更稳定、更可控对于需要频繁调用 AI 的自动化工作流来说这种计费方式可以显著降低成本不确定性便于做预算规划。八、总结折腾完这一套下来Agnes 给我最大的感受是「接入成本低、功能覆盖全、计费逻辑清晰」。三个模型分工明确Agnes2.0 Flash日常 Agent 任务、自动化工作流首选Agnes-Image-2.1-Flash快速出图、内容创作Agnes-Video-V2.0短视频素材生成如果你正在搭建自己的 AI 工具链或者想把 AI 能力嵌入到现有业务系统里Agnes 是值得认真评估的选项。有问题欢迎评论区交流我会尽量回复。— 本文仅供技术参考如有更新请以官方文档为准 —