文章目录下面是从 2025-05 至 2026-05-15按时间顺序整理的“主线模型/技术报告”时间线。不是全量穷举而是优先保留对技术直觉最有价值的节点旗舰模型、推理模型、开源权重、多模态/全模态、语音模型、技术报告。日期厂商/团队标题链接2025-05-14阿里 QwenQwen3 Technical Report统一 thinking / non-thinking0.6B–235BApache 2.0(arXiv)2025-05-20Google DeepMindGemini 2.5 I/O 更新2.5 Pro / Flash、Deep Think、多模态与工具能力(blog.google)2025-05-22AnthropicClaude Opus 4 / Sonnet 4编码、长任务、Agent 工作流(Anthropic)2025-05-28DeepSeekDeepSeek-R1-0528推理增强、开源权重、工具调用支持(DeepSeek API 文档)2025-06-10OpenAIo3-proo3 的长思考可靠性版本面向 Pro/API(OpenAI)2025-06-12Mistral AIMagistralMistral 首个推理模型Small 开源 / Medium 企业版(arXiv)2025-06-16MiniMaxMiniMax-M1 Technical Report混合注意力、CISPO、40K/80K thinking budget(arXiv)2025-07-09xAIGrok 4 / Grok 4 Heavy工具调用、实时搜索、多 Agent Heavy 版本(xAI)2025-07-28Moonshot AIKimi K2 Technical Report1T MoE32B activeAgentic / SWE-Bench 强项(arXiv)2025-07-28智谱 / Z.aiGLM-4.5开源 Agentic / Reasoning / Coding 基座模型(Omni Ekonomi)2025-08-05OpenAIgpt-oss-120b / gpt-oss-20bOpenAI 开源权重推理模型(OpenAI)2025-08-05AnthropicClaude Opus 4.1编码、Agentic tasks、推理升级(Anthropic)2025-08-07OpenAIGPT-5统一路由系统快模型 Thinking编程/数学/视觉/医疗增强(OpenAI)2025-08-21DeepSeekDeepSeek V3.1 发布(DeepSeek API 文档)2025-09-22QwenQwen3-Omni Technical Report文本/图像/音频/视频统一全模态模型(arXiv)2025-09-23QwenQwen3-MaxQwen 当时最大、最强模型主打规模化与通用能力(Qwen Studio)2025-09-29AnthropicClaude Sonnet 4.5编码、Agent、Computer Use 重点升级(Anthropic)2025-09-29DeepSeekDeepSeek-V3.2-Exp 发布(DeepSeek API 文档)2025-10-15AnthropicClaude Haiku 4.5小模型高性价比接近 Sonnet 4 编码能力(Anthropic)2025-11-12OpenAIGPT-5.1 Instant / Thinking自适应推理、对话风格与可用性升级(OpenAI)2025-11-18Google DeepMindGemini 3 Pro Preview新一代多模态、推理、Agentic / Vibe Coding(blog.google)2025-11-24AnthropicClaude Opus 4.5编码、Agent、Computer Use、深度研究增强(Anthropic)2025-11-26QwenQwen3-VL Technical Report256K 图文视频交错上下文多尺寸 VLM(arXiv)2025-12-01DeepSeekDeepSeek-V3.2 正式版发布(DeepSeek API 文档)2025-12-17GoogleGemini 3 Flash PreviewGemini 3 系列高性价比/低延迟版本(Google AI for Developers)2026-01QwenQwen3-TTS Technical ReportQwen 系列首个 TTS 模型(arXiv)2026-04-17QwenQwen3.5-Omni Technical Report百亿/千亿级全模态、256K、音视频理解增强(arXiv)2026-04-24DeepSeekDeepSeek-V4 Preview 发布(DeepSeek API 文档)2026-05-07OpenAIGPT-Realtime-2 / Realtime-Translate / Realtime-Whisper实时语音推理、翻译、转写(OpenAI)追逐路径建议第一条线看“推理范式”Qwen3 → DeepSeek-R1-0528 → Magistral → MiniMax-M1 → GPT-5 / GPT-5.1 → Gemini 3。重点感受 thinking budget、RL、test-time compute、router 这些概念如何变成产品能力。第二条线看“Agent / Coding”Claude 4 → Kimi K2 → GLM-4.5 → GPT-5 → Claude Sonnet 4.5 / Opus 4.5 → Gemini 3。重点看 SWE-Bench、Terminal-Bench、工具调用、Computer Use、长任务稳定性。第三条线看“多模态到全模态”Gemini 2.5 → Seed1.5-VL → Qwen3-Omni → Gemini 3 → Qwen3-VL → Qwen3.5-Omni → OpenAI Realtime。趋势是从“看图/看视频”走向“音视频实时交互 工具 Agent”。
从 2025-05 至 2026-05-15按时间顺序整理的“主线模型/技术报告”时间线
文章目录下面是从 2025-05 至 2026-05-15按时间顺序整理的“主线模型/技术报告”时间线。不是全量穷举而是优先保留对技术直觉最有价值的节点旗舰模型、推理模型、开源权重、多模态/全模态、语音模型、技术报告。日期厂商/团队标题链接2025-05-14阿里 QwenQwen3 Technical Report统一 thinking / non-thinking0.6B–235BApache 2.0(arXiv)2025-05-20Google DeepMindGemini 2.5 I/O 更新2.5 Pro / Flash、Deep Think、多模态与工具能力(blog.google)2025-05-22AnthropicClaude Opus 4 / Sonnet 4编码、长任务、Agent 工作流(Anthropic)2025-05-28DeepSeekDeepSeek-R1-0528推理增强、开源权重、工具调用支持(DeepSeek API 文档)2025-06-10OpenAIo3-proo3 的长思考可靠性版本面向 Pro/API(OpenAI)2025-06-12Mistral AIMagistralMistral 首个推理模型Small 开源 / Medium 企业版(arXiv)2025-06-16MiniMaxMiniMax-M1 Technical Report混合注意力、CISPO、40K/80K thinking budget(arXiv)2025-07-09xAIGrok 4 / Grok 4 Heavy工具调用、实时搜索、多 Agent Heavy 版本(xAI)2025-07-28Moonshot AIKimi K2 Technical Report1T MoE32B activeAgentic / SWE-Bench 强项(arXiv)2025-07-28智谱 / Z.aiGLM-4.5开源 Agentic / Reasoning / Coding 基座模型(Omni Ekonomi)2025-08-05OpenAIgpt-oss-120b / gpt-oss-20bOpenAI 开源权重推理模型(OpenAI)2025-08-05AnthropicClaude Opus 4.1编码、Agentic tasks、推理升级(Anthropic)2025-08-07OpenAIGPT-5统一路由系统快模型 Thinking编程/数学/视觉/医疗增强(OpenAI)2025-08-21DeepSeekDeepSeek V3.1 发布(DeepSeek API 文档)2025-09-22QwenQwen3-Omni Technical Report文本/图像/音频/视频统一全模态模型(arXiv)2025-09-23QwenQwen3-MaxQwen 当时最大、最强模型主打规模化与通用能力(Qwen Studio)2025-09-29AnthropicClaude Sonnet 4.5编码、Agent、Computer Use 重点升级(Anthropic)2025-09-29DeepSeekDeepSeek-V3.2-Exp 发布(DeepSeek API 文档)2025-10-15AnthropicClaude Haiku 4.5小模型高性价比接近 Sonnet 4 编码能力(Anthropic)2025-11-12OpenAIGPT-5.1 Instant / Thinking自适应推理、对话风格与可用性升级(OpenAI)2025-11-18Google DeepMindGemini 3 Pro Preview新一代多模态、推理、Agentic / Vibe Coding(blog.google)2025-11-24AnthropicClaude Opus 4.5编码、Agent、Computer Use、深度研究增强(Anthropic)2025-11-26QwenQwen3-VL Technical Report256K 图文视频交错上下文多尺寸 VLM(arXiv)2025-12-01DeepSeekDeepSeek-V3.2 正式版发布(DeepSeek API 文档)2025-12-17GoogleGemini 3 Flash PreviewGemini 3 系列高性价比/低延迟版本(Google AI for Developers)2026-01QwenQwen3-TTS Technical ReportQwen 系列首个 TTS 模型(arXiv)2026-04-17QwenQwen3.5-Omni Technical Report百亿/千亿级全模态、256K、音视频理解增强(arXiv)2026-04-24DeepSeekDeepSeek-V4 Preview 发布(DeepSeek API 文档)2026-05-07OpenAIGPT-Realtime-2 / Realtime-Translate / Realtime-Whisper实时语音推理、翻译、转写(OpenAI)追逐路径建议第一条线看“推理范式”Qwen3 → DeepSeek-R1-0528 → Magistral → MiniMax-M1 → GPT-5 / GPT-5.1 → Gemini 3。重点感受 thinking budget、RL、test-time compute、router 这些概念如何变成产品能力。第二条线看“Agent / Coding”Claude 4 → Kimi K2 → GLM-4.5 → GPT-5 → Claude Sonnet 4.5 / Opus 4.5 → Gemini 3。重点看 SWE-Bench、Terminal-Bench、工具调用、Computer Use、长任务稳定性。第三条线看“多模态到全模态”Gemini 2.5 → Seed1.5-VL → Qwen3-Omni → Gemini 3 → Qwen3-VL → Qwen3.5-Omni → OpenAI Realtime。趋势是从“看图/看视频”走向“音视频实时交互 工具 Agent”。