MiniMax M3 正式发布并开源详解 + 国内 API 接入教程

MiniMax M3 正式发布并开源详解 + 国内 API 接入教程 前言2026 年 6 月 1 日MiniMax 正式发布并开源新一代模型 MiniMax M3主打前沿 Coding、1M 超长上下文与原生多模态。本文整理它的架构、基准、定价以及国内开发者接入方式。一、核心架构MSA 稀疏注意力自研注意力架构MSAMiniMax Sparse Attention用 KV-block 选择取代全注意力支持最高1,048,576 token上下文1M token 长度下算力成本约为上一代1/20prefill / decode 速度大幅提升原生多模态图片 视频输入可操作电脑桌面从 Step 0 多模态混合训练训练数据达 100 万亿 token 量级参数规模官方未明确公布M2 参考229.9B 总参 / 9.8B 激活 / 192K 上下文二、基准成绩SWE-Bench Pro: 59.0% (超 GPT-5.5、Gemini 3.1 Pro接近 Opus 4.7) Terminal Bench 2.1: 66.0% SWE-fficiency: 34.8% KernelBench Hard: 28.8% MCP Atlas: 74.2% SVG-Bench: 超过 Opus 4.7 OmniDocBench: 超过 Gemini 3.1 Pro (多模态) Claw-Eval: 最高分 (端到端 Agent)注以上为 MiniMax 官方发布口径建议按自身任务实测。三、定价M3 采用阶梯计费≤512k 一档512k 以上更贵下面以 ≤512k 档为主。国内按量计费shuyanai.com 实际 ¥ 价 / 每百万 token / ≤512k 档分组 折扣 输入 输出 缓存读取 官方原价 — ¥2.10 ¥8.40 ¥0.42 dataeyes-vip 6.0折 ¥1.26 ¥5.04 ¥0.25 512k 以上档输入 ¥5.04 / 输出 ¥19.78dataeyes-vip 分组走自部署 A 类资源6.0 折后输入低到 ¥1.26/百万 token。国际口径参考OpenRouter 美元单价输入: $0.30 / 百万 token 输出: $1.20 / 百万 token 上下文窗口: 1,048,576 token 最大输出: 131,072 token¥ 价以 shuyanai.com 平台模型页实时显示为准截至 2026-06-01。四、国内接入代码OpenAI SDK 兼容fromopenaiimportOpenAI clientOpenAI(api_keyYOUR_KEY,base_urlhttps://platform.shuyanai.com)responseclient.chat.completions.create(modelMiniMax-M3,# 以平台实际上架模型 ID 为准messages[{role:system,content:你是一个代码分析助手},{role:user,content:分析这段 Go 代码的并发安全问题}])print(response.choices[0].message.content)数眼智能国内站 shuyanai.com同一 Key 可调 DeepSeek、通义千问、豆包等国产模型。M3 已开源有条件的团队也可本地私有化部署。五、配套与选型MiniMax Code专为 M3 设计的 Agent 产品Agent Team 可拆解多阶段并发 Workflow选型参考场景建议代码 / AgentM3 这代主打百万级长文档M31M 上下文 低算力成本图片 / 视频理解M3 原生多模态私有化部署M3 开源可选多模型对冲聚合平台一 Key 多模型