Claude Code Token 自由，还能用上 DeepSeek V4+Seedance2，字节 Agent Plan 性价比真顶！-尧图企业网站定制

大家好我是二哥呀。市面上目前所有的 Coding Plan 都只有语言模型。换句话说如果你的 Agent 需要音频能力你需要额外接入 TTS 模型需要 RAG你需要额外接入向量模型需要视频/图片生成你需要额外接入视觉模型。这还不包括联网搜索、记忆能力等其他 Harness。麻中麻。于是宇宙厂出手了火山引擎推出了业界第一个 Agent 套餐方舟 Agent Plan。我把交付产物录了屏大家先感受一下。【视频】真的从编码、到最后的工作流编排全部搞定。彻底打破了通用月包服务只有语言模型的限制提供一站式的 Agent 多模态能力。包括但不限于DeepSeek V4 Pro、GLM-5.1、Doubao-Seed-2.0-pro 等国内顶级大模型免费赠送豆包同源的联网搜索以及做记忆和 RAG 的向量模型 Doubao-embedding-visionSeedance 2.0 生成图片/视频。这下好Agent 干活需要的十八般武器全齐活了。全文手把手教系好安全带我们粗粗粗发01、CC 接入方舟 Agent Plan我这里购买的是 200元的 Medium 套餐高强度使用了一天的感受是完全够用。订阅地址有需要的小伙伴可以体验下。接入方式非常简单我用的是自研的 PaiSwitch和 CC Switch 是同类产品。base URL 填https://ark.cn-beijing.volces.com/api/planAPI Key 就是方舟 Agent Plan 配置里专属的 API Key。获取路径见下图大语言模型可以填ark-code-latest默认使用 Auto 模式方舟会根据当前任务的复杂度自动选择最合适的模型。简单的补全用轻量模型复杂的多文件修改用 DeepSeek V4 Pro 这种重型选手兼顾速度和效果。当然你也可以直接填 DeepSeek-V4 或者 GLM-5.1固定就用指定的模型。配置完成后点【测试连接】如果成功的话说明我们已经配置成功了。不确定的话可以在 Claude Code 启动后输入/status看到 base URL 指向方舟 Agent Plan 就说明接入成功了。然后。我们就可以猛猛干活了。这次的开发任务是把方舟 Agent Plan 接入 PaiAgent。用户配置一次 Agent Plan 后工作流可复用语言模型、联网搜索、知识库、图片生成、视频生成并让 ReAct Agent 按需调用这些能力。PSPaiAgent 是我开源的一个类似扣子的工作流编排项目。里面覆盖了 Agent 开发所需的各种技术栈比如说 SpringAI、LangGraph4j、ReAct、MCP、RAG、tool call、Skills 等等。大家可以跟着学https://github.com/itwanger/PaiAgent梳理一下这次要新增的能力全局配置新增「方舟 Agent Plan」。扩展 Harness 能力包括联网搜索可通过 MCP 的方式接入。新增多模态节点图片生成视频生成。LLM 节点新增 ReAct、MCP、RAG 知识库接入。然后扔给 Claude Code开始干活。这次的开发量可不少。OK搞定。总体用量还算合理当然了后期我也修了一些bug就不一一截图展示了。给我的体感就是用 Claude Code DeepSeek V4 写代码还是很丝滑的没怎么返工。02、PaiAgent 接入方舟 Agent Plan代码写完只是第一步接下来才是重头戏把方舟 Agent Plan 的全套能力在 PaiAgent 里跑通。我们的目标是同时搞定 ReAct、MCP 联网搜索、知识库 Embedding、图片生成和视频生成。现在就来一个个接入。第一步是在全局配置里新增方舟 Agent Plan 供应商。API 地址填写https://ark.cn-beijing.volces.com/api/plan/v3API 密钥和前面配置 Claude Code 的一样。这里解释一下为什么要在 PaiAgent 里再配一次。Claude Code 那边是用来写代码的走的是语言模型的额度。PaiAgent 这边是用来跑工作流的除了语言模型还会用到联网搜索、向量模型、图片和视频生成。然后是图片和视频模型的配置。图片生成模型填doubao-seedream-5.0-lite视频生成模型填doubao-seedance-2.0可以在【配置模型及base URL】点【视觉模型】获取。向量模型填doubao-embedding-vision可以在【配置模型及base URL】点【向量化模型】获取。真手把手跟着实操就完事了。03、接入方舟 Agent Plan 联网搜索联网搜索这个能力对 Agent 来说太重要了。大模型的训练数据都有截止日期我们问它“特立独行的猪在 2026 年还会上树吗”它答不上来问它“最新的 Spring AI 版本是多少”它可能给一个过时的答案。有了联网搜索LLM 就能在推理过程中主动去搜拿到最新的信息再回答。PaiAgent 以前的 LLM 节点是不支持联网搜索的需要接入专门的联网搜索能力。那现在方舟 Agent Plan 免费赠送了和豆包同源的联网搜索额度我们就可以直接在 LLM 节点里调用了。怎么用在 PaiAgent 中点击【MCP 配置】添加联网搜索 MCP填写联网搜索的API Key。可以在【配置Harness】这里点【查看联网API key】获取。添加成功后就会多一个联网搜索 MCP 工具。可以点【测试】验证一下比如说搜索关键词是【沉默王二 Java 博主】看看能不能搜到相关信息。OK搜到了信息也是很准确的。说明联网搜索从配置到调用已经完全跑通了。从配置 Harness 这里也可以看到联网搜索的额度在发生变化说明确实走的是方舟 Agent Plan 赠送的搜索额度。配置搞定了接下来我们实战跑一个有意思的 case。我设计了一个“AI 自画像生成器”的工作流输入一个人名LLM 先联网搜索这个人的公开信息然后根据搜到的信息生成一段图片提示词。回到工作流编辑这里新建一个工作流LLM 节点这里选上联网搜索。提示词填入你是一个专业的肖像生成提示词设计师。用户输入的人物是{{input}} 请使用联网搜索获取这个人物的公开信息重点关注 1. 真实身份与职业标签 2. 公开头像、照片或个人主页中的外貌特征 3. 常见穿搭、气质、年龄段、表情与场景 4. 与人物强相关的身份符号或背景元素搜索后请基于公开信息生成一段适合图片生成模型使用的“自画像提示词”。要求 - 不要编造无法从公开信息判断的具体五官细节 - 如果公开资料不足请用“公开信息可见的身份气质合理泛化外观”表达 - 提示词要适合直接传给后续图片生成节点 - 风格为真实人物肖像、自然光、半身像、专业但亲和 - 不要输出搜索过程 - 不要输出解释 - 只输出最终图片生成提示词输出格式一位基于公开信息创作的中文技术博主/作家人物肖像人物是{{input}}……然后我们输入【沉默王二】先让 LLM 通过联网搜索获取公开信息再根据信息生成提示词。提示词很准确LLM 搜到了我的公开信息后自动提取了外貌特征、穿搭风格、职业标签这些关键要素组织成了一段适合图片生成模型使用的提示词。一位基于公开信息创作的中文技术博主/作家人物肖像人物是沉默王二网名“二哥”约30-40岁的男性程序员佩戴黑框眼镜短发面容清秀亲和面带微笑穿着休闲程序员风格白色或浅色T恤/格子衬衫半身构图自然柔光背景简洁柔和或带书架与电脑屏幕元素专业但亲和的气质真实人物肖像摄影风格焦距85mm景深适度眼神交流自然。从搜索日志里也可以看到 LLM 确实调用了联网搜索 web_search获取到了正确的数据。等会接入图片生成节点后我们看看这个提示词的效果哈。04、接入方舟 Agent Plan 向量模型联网搜索解决的是实时信息获取的问题但如果我们有自己的私有知识库呢比如公司内部的技术文档、产品说明书、客户资料这些东西互联网上搜不到LLM 的训练数据里也没有。这时候就需要知识库了把文档向量化存起来LLM 需要的时候去检索相关片段这就是 RAG。新建一个知识库就把前面的开发需求文档放进来吧。选择方舟 Agent Plan 提供的doubao-embedding-vision向量模型。选择文件后点上传并导入。点击分片预览查看一下。分片策略默认按段落切分也可以自定义分片大小和重叠窗口。对于技术文档来说默认配置就够用了。确认没问题后点击【建立索引】完成向量化。这里用的就是方舟 Agent Plan 里的doubao-embedding-vision向量模型不需要额外付费。然后我们点【检索测试】输入一个查询比如说【联网搜索怎么做】看看能不能检索到相关的文档内容。OK检索结果很精准把需求文档里关于联网搜索的那几段给捞了出来。当然了这块可以继续优化比如说分片策略、相似度阈值、召回数量这些参数都可以调整来提升检索的准确率和召回的相关性。接下来是测试。回到工作流把 LLM 勾选上这个知识库看看在工作流里能不能正常调用向量检索让 LLM 基于知识库内容来回答问题。比如说【沉默王二是谁】看看能不能检索到相关内容。不错LLM 很诚实地回答了“知识库中没有找到相关信息”没有瞎编。这一点很重要没命中就是没命中不能硬凑答案。再换个查询比如说【联网搜索怎么做】执行日志里能看到 LLM 确实调用了知识库向量检索命中了相关分片然后基于检索结果生成了回答。整个 RAG 流程没问题。部分结果如下所示根据当前知识库资料PaiAgent-one的联网搜索使用方法如下 1. 前提配置需要先在全局配置中选择「火山方舟Agent Plan」providervolcengine_agent_plan 开启web_search_enabled开关启用联网搜索能力 Agent Plan免费赠送与豆包同源的联网搜索额度开箱即可获取实时、权威信息 1. 使用方式一节点编排可以通过新增的联网节点实现搜索能力 web_search节点通用搜索输入参数query搜索关键词、limit结果数量、freshness时效性、siteFilter站点过滤、language语言输出内容results搜索结果列表、summary结果摘要、citations引用来源、query原始查询。。。。真不错。联网搜索和知识库向量检索这两大信息获取能力都接入成功了LLM 在工作流里可以按需调用了。05、接入方舟Agent Plan视觉模型然后是多模态生成图片和视频。我们设计的工作流是这样的先让 LLM 通过联网搜索拿到人物信息生成一段图片提示词和一段视频提示词然后把这段提示词直接传给图片生成节点/视频生成节点。一次输入自动出图出视频。先给工作流加上图片生成节点它的输入提示词引用上一步 LLM 生成的提示词。来看一下最终的输出结果牛逼啊感觉特么见到真人了我去。这个质量完全超出我预期了尤其是眼镜、发型、气质这些细节特征都表现得很到位。Seedream 5.0 的出图能力确实可以。好图片生成搞定了我们再加一个 LLM 节点视频生成节点看看 Seedance 2.0 的视频生成效果。LLM 的提示词如下所示你是一个专业的视频生成提示词设计师。请根据用户输入生成一段适合 AI 视频生成模型使用的中文视频提示词。要求 1. 只输出最终视频提示词不要解释不要分点。 2. 提示词要包含主体、场景、动作、镜头运动、光线、画面风格、质量要求。 3. 画面要真实自然适合短视频生成。 4. 避免出现文字、水印、LOGO、字幕、畸形肢体、画面闪烁。 5. 如果用户只给出人物或主题请补充合理的场景和镜头表达。用户输入{{input}} 请输出一段完整的视频生成提示词。输入同样是【沉默王二】看看视频提示词的效果。视频生成和图片生成不太一样图片是同步返回的基本秒出。但视频生成是异步的提交任务后需要等一会生成时间大概在 30 秒到 2 分钟之间取决于视频时长和画面复杂度。PaiAgent 这边做了 SSE 推送任务状态变化会实时通知前端。我把视频也贴一下大家感受一下。【视频2】06、PaiAgent如何写到简历上到这里我们用方舟 Agent Plan 把联网搜索、图片生成、视频生成、知识库向量检索全部跑通了。语言模型、向量模型、视觉模型三类模型统一管理工作流里随便调用不用到处去申请不同平台的 Key这个体验确实省心。我们来总结一下简历写法项目名称PaiAgent — 类扣子的 AI 工作流编排平台项目简介可通过拖拽构建复杂的 AI 处理流程支持多模型接入、联网搜索、知识库 RAG、图片/视频生成等多模态能力编排。技术栈Java 21、Spring AI 1.0、LangGraph4j、MySQL、MinIO、Redis核心职责联网搜索基于 MCP 协议封装方舟 Agent Plan 联网搜索 API实现 LLM 节点内按需调用联网搜索的能力。搜索结果自动注入 Prompt 上下文LLM 能拿到实时信息再做推理接入 Seedream 图片生成节点和 Seedance 视频生成节点支持工作流内“LLM 生成提示词→图片生成→视频生成”的并行链式编排视频和图片统一转存到 MinIO向量检索集成 Doubao-embedding-vision 向量模型实现文档上传→自动分片→向量化→建立索引的完整 RAG 流程LLM 节点可勾选知识库进行 topK 向量召回检索结果作为上下文参与推理实现 ReAct 模式的 Agent 节点执行器支持最大 20 步推理迭代和动态工具注册将联网搜索、知识库检索、记忆召回等 9 个预置工具封装为 Agent 可自主调用的能力基于 Spring AI 集成方舟 Agent Plan 实现 DeepSeek V4 Pro、GLM-5.1 等多个语言模型的配置化切换一套 API 对接语言、向量、图片、视频四类模型

相关新闻

从‘会动’到‘好玩’：Godot4里给3D角色加跳跃和踩怪手感，我调了这些参数

玩转PLC编程：用CFC在CODESYS里快速搭建一个电机启保停与延时控制

GD32F303新手必看：用TIMER0的CH0通道，5分钟搞定呼吸灯（附完整代码）

MySQL 执行计划（EXPLAIN）背诵版

新手也能搞定的AUV设计：用SolidWorks+Ansys Workbench搞定水下机器人耐压壳与推进器（附仿真文件）

Jellyfin Android TV 终极指南：从入门到精通的完整设置教程

【Claude决策分析框架黄金标准】：基于137家头部客户实测数据，提炼出的3类高风险决策盲区及实时干预协议

别再用GDM了！在Ubuntu 22.04上手动安装并配置LightDM，打造你的专属轻量级登录界面

DS4Windows：在Windows上解锁PlayStation手柄的全部潜能

如何快速下载百度文库等30+平台文档：终极免费文档获取指南

手把手教你用MMDetection 3.x复现EfficientDet的BiFPN模块（附代码逐行解析）

CSS3从零基础到精通（四）：终章大项目——纯CSS构建企业品牌展示网站

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势