国产开源大模型发布时间线

国产开源大模型发布时间线 国产开源大模型发布时间线本文档按发布时间倒序梳理三大主流国产开源大模型MiniMax、DeepSeek、Qwen系列的关键版本便于横向对比各阵营的技术演进脉络。数据截至2026 年 3 月 29 日 · 涵盖 MiniMax、DeepSeek、Qwen 三大开源模型系列一、MiniMax 模型时间线魔塔社区MiniMax ModelScope2026 年发布时间模型名称类别核心特点2026-03-18MiniMax M2.7文本 / Agent新一代 Agent 旗舰首次实现模型自我进化可深度参与自身训练与优化研发场景中可承担 30%–50% 工作量2026-02-12MiniMax M2.5文本原生 Agent 生产级模型编程能力显著提升支持工具调用与搜索成本优势突出1 万美元可支持 4 个 Agent 连续工作一年2026-01-16MiniMax Music-2.5音乐音乐生成模型升级版支持纯音乐创作突破风格边界2025 年发布时间模型名称类别核心特点2025-12-22MiniMax M2.1文本多语言编程专家专注复杂编程体验与精准代码重构2025-10-30MiniMax Music-2.0音乐百变唱将人声灵动精准乐器控制支持 5 分钟音乐创作2025-10-29MiniMax Speech-2.6语音新一代语音模型极致音质与韵律表现首包响应时间压缩至 250 ms2025-10-28MiniMax Hailuo-2.3视频肢体动作、物理表现与指令遵循能力全面升级支持 Fast 版本2025-10-27MiniMax M2文本10B 激活参数总参 230B专为编码与 Agent 工作流优化开源后登顶开源模型榜首2025-09-11MiniMax Music-1.5音乐支持 4 分钟音乐时长回归好听本质2025-08-06MiniMax Speech-2.5语音支持更多语种极高相似度声音克隆表现2025-06-18MiniMax Hailuo-02视频支持 1080P 分辨率及 10 秒视频生成2025-06-16MiniMax M1文本 / 推理推理模型80K 思维链 × 1M 上下文输入效果比肩海外顶尖模型全球首个开源大规模混合架构推理模型2025-04-02Speech-02 系列语音超真实人声表现卓越韵律与稳定性2025-02-15Image-01图像支持文本描述生成多种尺寸图片2025-02-11T2V-01-Director / I2V-01-Director视频导演级运镜控制电影级镜头叙事语言2025-01-15Text-01 / VL-01文本 / 视觉全新一代文本模型与视觉理解模型2024 年及更早发布时间模型名称类别核心特点2024-08-31Video Generation API视频视频生成接口首次开放2024-06-27Music Generation API音乐音乐生成接口首次开放2024-05abab 6.5s / 6.5 / 5.5文本abab 系列主力版本2024-01abab 5.5s文本abab 系列早期优化版MiniMax 模型分类汇总类别代表模型 文本模型M2.7、M2.5、M2.1、M2、M1、Text-01、abab 系列️ 视觉理解VL-01 视频生成Hailuo-2.3、Hailuo-02、T2V / I2V-01-Director 语音模型Speech-2.6、Speech-2.5、Speech-02 系列 音乐模型Music-2.5、Music-2.0、Music-1.5️ 图像模型Image-01二、DeepSeek 模型时间线魔塔社区DeepSeek ModelScope2026 年发布时间模型名称类别核心特点2026-02-11DeepSeek-V3.2上下文升级版文本上下文窗口从 128K 扩展至1M tokens可一次性处理海量长文本2025 年发布时间模型名称类别核心特点2025-12-01DeepSeek-V3.2文本正式版发布支持思考 / 非思考双模式切换定位话少活好日常助手性能比肩 GPT-52025-12-01DeepSeek-V3.2-Speciale文本 / 推理“偏科天才”专攻高难度数学、学术研究逻辑验证与编程竞赛解题2025-09-29DeepSeek-V3.2-Exp文本实验版引入 DSA 稀疏注意力机制长文本训练与推理效率大幅提升API 降价 50% 以上2025-09-22DeepSeek-V3.1-Terminus文本V3.1 改进版优化中英混杂问题增强 Code Agent 与 Search Agent 能力2025-08-21DeepSeek-V3.1文本引入混合推理架构单模型同时支持思考与非思考模式上下文扩展至 128KAgent 能力大幅增强2025-05-28DeepSeek-R1-0528文本 / 推理R1 系列旗舰推理模型升级版让 DeepSeek 声名远播2025-03-24DeepSeek-V3-0324文本V3 小版本升级提升推理、代码生成与中文写作能力2025-01-20DeepSeek-R1文本 / 推理强化学习驱动推理能力比肩 OpenAI o1以极低成本引爆全球关注2024 年及更早发布时间模型名称类别核心特点2024-12-26DeepSeek-V3文本671B 参数 MoE 架构生成速度较 V2 提升 3 倍正式开源2024-05-06DeepSeek-V2多模态新增图像理解与生成模块支持图文联合推理2023-11-08DeepSeek-V1文本130 亿参数初代开源模型支持中英双语更早DeepSeek-Coder / DeepSeek-Math代码 / 数学代码生成与数学推理领域的专用模型系列DeepSeek 模型分类汇总类别代表模型 文本模型V3.2、V3.2-Speciale、V3.1、V3.1-Terminus、V3、V2、V1 推理模型R1、R1-0528 代码 / 数学DeepSeek-Coder、DeepSeek-Math三、Qwen通义千问模型时间线魔塔社区Qwen ModelScope2026 年发布时间模型名称类别核心特点2026-03-03Qwen3.5 小尺寸系列0.8B / 2B / 4B / 9B文本 / 端侧覆盖超轻量到中等规模端侧部署支持原生 256K 上下文可运行于移动设备与边缘场景2026-02-27Qwen3.5 中等规模系列Flash / 35B-A3B / 122B-A10B / 27B文本 / 多模态采用 Gated Delta Network MoE 高效架构35B-A3B 仅激活 3B 参数即可超越上一代 235B 旗舰支持 201 种语言2026-02-16Qwen3.5-Plus397B-A17B文本 / 多模态全球首个原生多模态 MoE 大模型总参 3970 亿仅激活 170 亿性能媲美万亿参数模型支持视觉 - 语言统一理解2026-02-04Qwen3-Coder-Next80B-A3B代码 / Agent专为 AI 编程智能体设计基于 Qwen3-Next 架构支持 256K 上下文推理成本显著降低2026-01-27Qwen3-Max-Thinking1T文本 / 推理阿里规模最大旗舰推理模型预训练数据 36T Tokens支持自适应工具调用与多轮迭代推理19 项基准测试领先2026-01-12qwen-image-plus-2026-01-09图像生成千问图像生成全新快照版为 qwen-image-max 蒸馏加速版支持快速生成高质量图像2025 年发布时间模型名称类别核心特点2025-12Wan2.6 系列t2v / i2v / r2v视频生成通义万相视频生成模型升级支持文生视频、图生视频、参考生视频等多模态创作2025-09Qwen3-Omni30B-A3B全模态 / 端到端原生端到端多语种全模态大模型流畅处理文本 / 图像 / 音频 / 视频输入支持实时交互响应2025-08Qwen-Image / Qwen-Image-Edit图像生成 / 编辑通义千问图像基础模型及编辑模型发布支持高质量文生图与精细化图像编辑2025-07Qwen3 系列0.6B–32B Dense 30B / 235B MoE文本 / 混合推理国内首款融合快思考与慢思考的混合推理模型支持/think模式切换119 种语言覆盖强到弱蒸馏技术使小模型继承旗舰能力2025-04Qwen3 系列首发文本 / 推理阿里巴巴开源新一代通义千问大语言模型系列涵盖 6 款密集模型和 2 款混合专家模型2025-03QwQ-32B推理 / 数学开源推理大模型专注数学推理与逻辑验证在 AIME、MATH 等基准测试中表现优异2025-02Qwen2.5-VL 系列3B / 7B / 32B / 72B视觉语言新一代多模态视觉理解模型支持文档解析、长视频理解、视觉代理操作13 项权威评测视觉理解夺冠2025-01Qwen2.5-Max文本 / MoE超 20 万亿 token 训练的混合专家架构旗舰模型通过阿里云 API 提供服务性能对标世界顶级闭源模型2025-01Qwen2.5-1M 系列文本 / 长上下文支持 100 万 tokens 超长上下文采用 YARN 扩展技术适用于超长文档分析与跨文档推理2024 年发布时间模型名称类别核心特点2024-12Qwen2.5-Coder 系列0.5B–32B代码生成专为编程优化的代码模型系列支持代码生成、理解、调试与重构在 HumanEval、MBPP 等评测中领先2024-11Qwen2.5-Math 系列数学推理专注数学问题求解的专用模型支持多步推理与公式推导在 MATH、GSM8K 等基准测试中表现突出2024-09Qwen2.5 系列0.5B–72B MoE文本 / 多领域知识、代码、数学能力全面升级首次推出领域专用模型Coder / Math支持 128K 上下文29 种语言覆盖2024-06Qwen2 系列0.5B–72B 57B-A14B MoE文本 / 长上下文新一代开源模型性能全面超越 Qwen1.5 与 Llama3部分模型支持 128K 上下文引入细粒度专家与双块注意力机制2024-05CodeQwen1.5代码生成通义千问代码模型升级支持多语言代码生成与理解与 Qwen1.5 架构对齐生态兼容性提升2024-04Qwen1.5 系列0.5B–110B MoE文本 / 全面开源架构与主流模型对齐所有模型采用 Apache 2.0 协议取消商业限制统一支持 32K 上下文极大推动社区普及2024-02Qwen1.5 首发文本 / 开源里程碑式升级通过更开放、易用、强大的重构赢得社区广泛赞誉形成完整尺寸梯度2023 年及更早发布时间模型名称类别核心特点2023-12Qwen-Audio / Qwen-Audio-Chat音频理解业界首个开源大规模音频语言模型支持 30 音频任务理解语音 / 音乐 / 环境音内容2023-11Qwen-VL / Qwen-VL-Chat视觉语言基于 Qwen-7B 扩展的多模态模型支持 448×448 高分辨率图像、中文 OCR 优化、视觉定位与图文对话2023-09Qwen-14B / Qwen-72B文本推出 140 亿与 720 亿参数模型性能超越同尺寸开源模型72B 支持 32K 上下文逼近 GPT-3.5 水平2023-08Qwen-7B / Qwen-7B-Chat文本通义千问系列首款开源模型70 亿参数基于 2.2 万亿 tokens 预训练支持 8K 上下文Apache 2.0 协议开源2023-04通义千问 1.0文本阿里云峰会正式发布初代通义千问大语言模型支持中英双语对话与内容创作Qwen 模型分类汇总类别代表模型 文本模型Qwen3.5 系列、Qwen3 系列、Qwen2.5 系列、Qwen2 系列、Qwen1.5 系列、Qwen-7B / 14B / 72B 推理模型Qwen3-Max-Thinking、QwQ-32B、Qwen3混合推理模式 代码模型Qwen3-Coder 系列、Qwen2.5-Coder 系列、CodeQwen1.5 数学模型Qwen2.5-Math 系列️ 视觉语言Qwen2.5-VL 系列、Qwen-VL、Qwen2-VL 音频模型Qwen-Audio、Qwen2-Audio 全模态Qwen3-Omni、Qwen2.5-Omni️ 图像生成Qwen-Image、Qwen-Image-Edit、qwen-image-plus 视频生成Wan2.6 系列通义万相 嵌入 / 重排序Qwen3-Embedding 系列、Qwen3-Reranker 系列️ 安全模型Qwen3Guard 系列四、三大模型最新版本性能对比2026 年 3 月对比对象MiniMax M2.7|DeepSeek-V3.21M 上下文版|Qwen3.5 系列 核心参数与技术架构对比维度MiniMax M2.7DeepSeek-V3.21M 版Qwen3.5 系列发布时间2026-03-182026-02-112026-02 ~ 03分批次模型类型文本 / Agent 原生文本 / 超长上下文文本 / 多模态 / 端侧架构创新Agent Harness 自我进化框架DSA 稀疏注意力 投机采样Gated Delta Network MoE 混合架构参数量未公开高效激活设计~660BMoE0.8B ~ 397B多尺寸覆盖激活参数高效稀疏激活动态稀疏激活35B 模型仅激活 3B122B 激活 10B上下文窗口标准长上下文官方未强调极限1,000,000 tokens256K端侧/ 1MFlash 托管版支持语言多语言侧重中英中英为主多语言支持201 种语言开源协议部分开源 API 服务✅ MIT License 完全开源✅ Apache 2.0 / 部分模型开源部署门槛API 为主企业级部署消费级显卡可运行中等版本0.8B~9B 支持移动端27B 需服务器 基准测试性能对比公开数据整理数据来源官方技术报告、第三方评测平台截至 2026 年 3 月评测基准任务类型MiniMax M2.7DeepSeek-V3.2Qwen3.5-122BSWE-Pro软件工程修复 56.22%追平 Opus~52%预估~54%预估VIBE-Pro端到端项目交付 55.6%——Terminal Bench 2复杂系统理解 57.0%——GDPval-AAELO专业办公能力 1495开源第一~1450预估~1480预估MM-Claw复杂 Skills 遵循 62.7%近 Sonnet 4.6——MathVista多模态数学推理—— 87.4%MMMU多学科多模态理解—— 领先同尺寸模型HumanEval / MBPP代码生成 一线水平 领先开源模型 优秀小模型继承能力强MMLU-Pro综合知识理解 优秀 接近 GPT-5 水平 旗舰版媲美万亿参数模型LongBench / Needle长上下文检索— 1M 上下文精准检索 256K~1M 稳定表现说明 表示该维度领先或持平国际顶尖闭源模型— 表示官方未公开具体数据或该模型非主打方向 特色能力横向对比 Agent / 智能体能力能力维度MiniMax M2.7DeepSeek-V3.2Qwen3.5 系列自我进化✅ 首创模型参与自身训练可优化强化学习 Harness❌ 不支持⚠️ 通过蒸馏实现小模型能力继承多智能体协作✅ 原生支持 Agent Teams角色边界清晰⚠️ 需外部框架支持✅ 支持多工具调用与任务规划工具调用遵循率✅ 40 复杂 Skills 保持 97% 遵循率✅ 优秀支持 Search / Code Agent✅ 优秀内置官方工具链Flash 版研发场景替代率✅ 30%~50% 工作流自动化⚠️ 辅助编码为主✅ 支持代码生成 调试 重构全流程 推理与专业能力能力维度MiniMax M2.7DeepSeek-V3.2Qwen3.5 系列数学 / 逻辑推理 文字强、推理相对弱 接近 GPT-5 水平 Qwen3-Max-Thinking 19 项基准领先代码工程能力 生产级排障、日志分析、安全审计 前端生成美观HumanEval 领先 Qwen3-Coder 专为 Agent 编程优化专业领域知识 GDPval-AA 开源第一金融 / 办公突出 中文写作与搜索优化 201 语言覆盖全球化部署友好多模态理解 侧重文本 Agent多模态非核心❌ 纯文本模型 原生多模态视觉 - 语言统一理解 效率与成本对比维度MiniMax M2.7DeepSeek-V3.2Qwen3.5 系列推理速度高吞吐设计支持 100 TPSDSA 机制 投机采样60 tokens/sMoE 动态激活小模型端侧实时响应显存占用高效稀疏激活生产级优化128K 上下文下消费级显卡可运行原生 FP8 训练显存占用降低约 50%API 成本1 万美元支持 4 个 Agent 年工作V3.2 Exp 版 API 降价 50%Flash 版输入 $0.03 / 1M tokens≤128K开源友好度部分模型开源主打 API 服务✅ 完全开源 MIT 协议可商用蒸馏✅ Apache 2.0 为主社区生态最活跃 适用场景推荐指南不同模型适用场景 快速选型建议需求首选推荐理由 自动化研发 / 代码排障MiniMax M2.7唯一支持模型自我进化生产环境故障恢复 3 分钟 百万字文档 / 跨文档推理DeepSeek-V3.21M原生 1M 上下文长文本检索精度行业领先 移动端 / 边缘设备部署Qwen3.50.8B~9B小尺寸系列专为端侧优化支持原生 256K 上下文 图文 / 视频多模态创作Qwen3.5-Plus / Omni全球首个原生多模态 MoE视觉 - 语言统一理解 极致性价比 API 调用Qwen3.5-Flash$0.03 / 1M tokens 输入预装工具链生产级可用 多语言全球化应用Qwen3.5 系列201 种语言支持 25 万词表编码效率提升 60% 完全开源可商用DeepSeek-V3.2MIT 协议允许蒸馏训练其他模型社区支持完善 总结三大模型核心定位模型核心标签一句话定位MiniMax M2.7 Agent 原生 · 自我进化“让模型参与自身迭代重塑研发工作流”DeepSeek-V3.2 超长上下文 · 开源友好“百万字一键读懂开源界的性价比之王”Qwen3.5 系列 全尺寸覆盖 · 原生多模态“从手机到云端一套架构覆盖所有场景” 选型建议追求极致工程自动化→ 选 MiniMax M2.7需要处理海量文本 / 完全开源→ 选 DeepSeek-V3.2要求多模态 多尺寸 全球化→ 选 Qwen3.5 系列预算敏感 / 初创团队→ 优先考虑 Qwen3.5-Flash 或 DeepSeek 开源版本注以上对比基于官方公开信息及第三方评测整理实际效果可能因具体任务、提示词工程及部署环境而异。建议结合自身业务场景进行小范围实测后再做最终选型。结束~