又一款国产模型诞生,StepPlan性价比杀疯了

又一款国产模型诞生,StepPlan性价比杀疯了 大家好我是二哥呀。最近高强度体验了一下阶跃星辰 Step Plan配合 Claude Code 的 Agent 能力直接肝出来了一个 PaiCLI——类似 Claude Code 那种终端交互体验的 Java 版 Agent。全程 step-3.5-flash-2603 在干活。整体完成度还是非常高的 阶跃星辰 Step Plan 非常良心不仅支持 LLM 的 step-3.5-flash-2603还支持 TTS 的 stepaudio-2.5-tts以及能够绘图的 step-image-edit-2我打算下一期给 PaiAgent 加一个画板。StepAudio 2.5 TTS Step 3.5 Flash LLM 这个 AI 播客工作流整体的效果也很不错。两个项目一口气跑下来整体感受就一个字稳。国产模型在 Claude Code 这种强无敌的 Harness 架构下跑起来也是完全超出预期。这里必须点名表扬一下 A 厂虽然他的很多做法招人恨但就这一个 Agent CLI确实给 AI 的发展提供了无限可能 。刚好最近有不少小伙伴需要 Coding Plan 这种订阅服务我就把自己的真实体验分享给大家看看阶跃星辰 Step Plan 到底值不值得冲。01、在 CC 中配置阶跃星辰 Step Plan第一步去阶跃星辰的官网开通 Step Plan 账号然后创建一个 API Key。阶跃星辰 Step Plan 目前有四档套餐从 Flash Mini 的 49 元/月到 Flash Max 的 699 元/月。我订的是季度套餐日常 Coding 场景够用。和 GPT-5.5 一样阶跃星辰 Step Plan 也是每 5 小时刷新一次调用额度每周刷新一个总额度。实际跑下来中间档一天高强度写代码也没碰到过限额够用。第二步使用 PaiSwitch这是我自己很早起 Vibe Coding 的一个一直也没宣传或者 CCSwitch 在 Claude Code 中配置阶跃星辰 Step Plan 的 API Key。其中 base URL 填写https://api.stepfun.com/step_plan/v1模型可以选择step-3.5-flash-2603。这个模型在代码理解和生成方面表现相当不错。第三步启动 Claude Code重载模型就可以在 Claude Code 中使用阶跃星辰 Step Plan 的能力了。可以键入/status来确认是否生效。看到模型名切换过来就说明配置成功了。兼容性做得很到位凡是支持自定义 base URL 的工具都能无缝接入。02、用 CC 完成 PaiCLI TUI先交代一下背景。PaiCLI 是我做的一个 Java CLI Agent定位类似 Claude Code但完全用 Java 写的。核心能力包括 ReAct 推理、Plan-and-Execute 任务拆解、Memory 记忆系统、RAG 语义代码搜索、MCP 工具协议、Skill 专家决策系统等等。分析需求这一步非常关键。模型的能力已经非常强了不管是国产模型还是顶级的 Opus 4.7 或者 GPT-5.5。出问题的地方往往在于我们怎么使用 Agent或者使用了什么样的 Agent 工具。当然了不管使用哪一个工具如果需求分析不到位后面的交付结果就只能呵呵了。提示词分析一下第 16 期要开发的需求我们先讨论一下看看哪些需要调整。Claude Code 会从 ROADMAP.md 中提取需求分析边界帮我们梳理出几个关键决策点技术选型是用 Lanterna 还是 JLine文件树浏览怎么做代码高亮用什么方案对话历史可视化怎么设计这些问题如果不在动手之前讨论清楚后面返工的概率极高。好接下来我直接把决定权交给 Agent。提示词需要你给一份非常完整的需求文档你直接出可以参考前几期。Claude Code 这里选择了 Lanterna 3 作为全屏 TUI 的渲染方案同时保留 JLine 3 作为内联流式渲染的基础。如果我们不确定 Agent 的选择是否靠谱可以多方求证一下。比如说可以问一嘴 Gemini看看它的判断。最终 PaiCLI 的 TUI 方案确定下来了默认走 InlineRenderer类似 Claude Code 的内联流式输出可选切换到 Lanterna 全屏三栏布局文件树 对话流 状态栏还有一个 PlainRenderer 作为兜底。三种渲染模式共享同一套 Agent 内核通过PAICLI_RENDERER环境变量切换。这个方案既保证了默认体验的轻量感又给重度用户留了全屏模式的选择。没有问题后就可以让 Agent 狠狠干活了。开始干活接下来就是两手一摊看 Agent 表演了。已经运行 7 分钟了还在继续干活看来任务量不小。这期间我们完全不需要插手。step-3.5-flash-2603 在跑长任务上的表现让我挺意外的。它的推理速度接近 200 tokens/s根据 Artificial Analysis 的实测数据是 179 tps在 212 个模型里排第 13 位。更关键的是它在代码生成场景下的上下文理解很扎实。7 分钟、十几分钟持续输出代码逻辑连贯性没出过问题。要知道 PaiCLI 是一个 Java 项目技术栈涉及 JLine 3 的终端控制、Lanterna 3 的全屏渲染、ANSI 转义序列处理、DECSTBM 滚动区域设定这些比较底层的东西。我简单翻了一下 Claude Code 的执行日志这一轮它做了这些事情创建了 Renderer 接口和三个实现类、实现了 InlineRenderer 的 DECSTBM 滚动区域控制和底部状态栏、实现了 BlockRegistry 和 ToolCallRenderer 做工具调用的折叠展示、写了 HITL 审批的单字符交互逻辑输入 y/n/a/s/m 就能决策、还做了终端能力检测如果终端不支持滚动区域就自动降级到 PlainRenderer。整个过程大概改了二十多个文件新增了十来个类。如果是我自己手写保守估计得两三天其实可能得二三十天给自己脸上贴贴金。验收结果我现在的工作流一般是这样的如果让 Claude Code 先跑那就用 Codex 来验收交付结果。反之亦然。两个 Agent 交叉验证只要双方都认为 OK基本上就没啥大问题。把 Claude Code 生成的代码丢给 Codex review让它从架构设计、代码质量、潜在 bug 三个维度去分析。Codex 对这次的代码改动还是非常满意的给了很高的评价。这再次说明 step-3.5-flash-2603 的代码能力确实已经到了一个相当不错的水平——不是“能写代码”那种及格线而是“写出来的代码经得住另一个 Agent review”的水平。好激动人心的时刻到了。我们来看一下最终的效果。当然了这期间还有很多细节比如 HITL 审批弹窗的交互、工具调用的折叠展示、内联 git diff 的渲染很枯燥我就不一一截图展示了。只能说 Claude Code 真的太强了把模型的能力拉满了。step-3.5-flash-2603 能做到这个效果离不开 Claude Code 的 Agent 框架。好马配好鞍不是没有道理哈哈。03、StepAudio 2.5 TTS 接入阶跃星辰 Step Plan 里面不只有文本模型。还有 StepAudio 2.5 TTS 这个语音合成模型这是我觉得阶跃星辰 Step Plan 比较有意思的一点一个订阅搞定文本加语音不用再单独去接第三方 TTS 服务。刚好 PaiAgent 里有一个 TTS 节点之前接的是通义千问的 Qwen3 TTS现在我们把 StepAudio 2.5 TTS 也接进去体验下。PaiAgent 是我做的另一个开源项目AI 工作流编排平台前端 React ReactFlow 可视化拖拽后端 Spring Boot 3 Spring AI。第一步启动 PaiAgent 后点击全局配置把阶跃星辰的 TTS 模型和 LLM 模型配置好。TTS 模型名填写stepaudio-2.5-ttsLLM 模型名填写step-3.5-flash-2603API 地址和 API 密钥和之前的一样。PaiAgent 的 ChatClientFactory 会根据供应商名称自动匹配对应的 API 协议阶跃星辰走的是 OpenAI 兼容接口配起来没有额外的适配成本。PS这个全局的模型配置也是 Step 3.5 Flash 2603 完成的老读者应该还有印象。我之前也分享过。第二步配置好 AI 播客的工作流。四个节点串起来输入 → 大模型文本生成 → TTS 音频合成 → 输出。LLM 节点和 TTS 节点都选择我们刚刚配置好的阶跃星辰供应商。然后点调试输入“阶跃星辰 Step Plan 真不错啊”点执行工作流。很快30 秒音频文件就拿到了。StepAudio 2.5 TTS 支持单次最多 1000 个字符的输入PaiAgent 的 TTSNodeExecutor 会自动按标点符号切分长文本用 CompletableFuture 并行处理每个文本块最后把 WAV 音频合并。所以即使输入一篇上千字的文章稿也能很快拿到完整音频。这个音频的质量让我挺惊喜的语音自然流畅完全没有机械感。StepAudio 2.5 在语气停顿和情感表达上很自然尤其是语句之间的衔接不会有那种“一字一顿”的割裂感。【音频】当然了TTS 的音色选择也很丰富。StepAudio 2.5 TTS 默认用的是“磁性男声”cixingnansheng还可以通过 instruction 参数调整语速、音量和说话风格最长支持 200 个字符的指令描述。StepAudio 2.5 能处理 1000 个字符分块次数少合成速度明显很快音频衔接处的停顿也很自然。对于做 AI 播客、有声读物、语音助手这些场景可玩性很高。我甚至在想后面要不要在 PaiAgent 里做一个“每日技术播报”的工作流模板早上自动抓取 GitHub Trending用 LLM 生成播报文案再用 StepAudio 合成音频推到飞书群里。整个流程在 PaiAgent 里四五个节点就能搞定。04、Step 3.5 Flash 2603 很强聊完体验我们来看看数据。毕竟感受是主观的数据不会骗人。step-3.5-flash-2603 的架构是稀疏 MoE混合专家模型总参数量 196B但每个 token 只激活 11B 参数。45 层 Transformer每层 288 个路由专家加 1 个共享专家Top-8 激活。支持 256K 上下文窗口。翻译成人话就是模型很强壮但跑起来很轻快。因为每次推理只用到一小部分参数所以速度快、成本低。如果聚焦到 Coding 和 Agent 这两个场景step-3.5-flash-2603 的表现确实是第一梯队的。还有一个值得一提的能力阶跃星辰 Step Plan 里有一个 step-router-v1 智能路由模型它会根据任务复杂度自动调度不同模型。简单任务走轻量模型省额度复杂任务走重量级模型保质量。对于 Agent 场景来说很实用——Agent 一轮对话里可能有“读个文件名”这种简单操作也有“重构一整个模块”这种重活用路由模型自动调度比我们手动切换省心得多。另外阶跃星辰 Step Plan 还包含 stepaudio-2.5-asr语音识别和 step-image-edit-2图片编辑这些多模态能力一个订阅覆盖了文本、语音、图像三个方向。对于想做多模态 Agent 的开发者来说不用到处开账号、到处充钱一个阶跃星辰 Step Plan 就够了。05、简历怎么写PaiCLI — Terminal-First Agent IDE项目简介基于 Java 17 的终端 AI Agent支持 ReAct 推理、Plan-and-Execute 任务拆解、Memory 记忆系统、RAG 语义代码搜索、MCP 工具协议和 Skill 专家决策系统提供三种渲染模式的 TUI 交互体验。核心职责基于 ReAct 框架实现 Think-Act-Observe 推理循环支持多轮工具调用和上下文追踪Agent 任务完成率提升至 89%设计并实现 Renderer 抽象层支持 InlineRendererDECSTBM 滚动区域、LanternaRenderer全屏三栏、PlainRenderer 三种渲染模式终端兼容性覆盖率达 95%基于 SQLite 向量存储和 JavaParser AST 分析实现 RAG 语义代码搜索top-5 召回准确率 82%实现 MCP 协议适配层支持 stdio 和 Streamable HTTP 两种传输方式已接入 Chrome DevTools 等 5 个 MCP ServerPaiAgent — AI 工作流编排平台项目简介企业级 AI 工作流可视化编排平台前端基于 React ReactFlow 实现拖拽式流程设计后端基于 Spring Boot 3 Spring AI 实现多模型调度和 DAG 引擎执行。核心职责基于 Kahn 算法实现 DAG 拓扑排序引擎支持条件分支和循环节点工作流执行延迟 P99 200ms设计 ChatClientFactory 动态工厂运行时根据节点配置创建 ChatClient 实例支持 OpenAI、DeepSeek、通义千问、智谱、阶跃星辰等 6 家模型供应商热切换实现 TTS 节点执行器支持 StepAudio 2.5 和 Qwen3 两种 TTS 引擎基于 CompletableFuture 并行处理文本分块单次合成延迟降低 60%集成 LangGraph4j 状态图引擎支持条件路由和动态分支覆盖多轮对话、文档审批等复杂编排场景ending说实话这次体验下来阶跃星辰 Step Plan 给我最大的感受是它在真实开发场景里的“可用度”。用 step-3.5-flash-2603 配合 Claude Code 完成 PaiCLI TUI 模块的开发从需求分析到代码生成到交叉验证中间没出过大的 bug。49 一个月的订阅价格对于每天都在跟 Agent 打交道的开发者来说绝对是一笔很划算的投资。如果是像我这样每天用 Claude Code 写代码、用工作流跑任务的场景阶跃星辰 Step Plan 确实值得一试包年会更划算。https://platform.stepfun.com/plan-subscribe【好的工具从来不是让我们多一个选择而是让我们少纠结一次。】我们下期见。配合 Claude Code 完成 PaiCLI TUI 模块的开发从需求分析到代码生成到交叉验证中间没出过大的 bug。49 一个月的订阅价格对于每天都在跟 Agent 打交道的开发者来说绝对是一笔很划算的投资。如果是像我这样每天用 Claude Code 写代码、用工作流跑任务的场景阶跃星辰 Step Plan 确实值得一试包年会更划算。https://platform.stepfun.com/plan-subscribe[外链图片转存中…(img-Z1eZiELV-1781575424369)]【好的工具从来不是让我们多一个选择而是让我们少纠结一次。】我们下期见。