DeepSeek 两次降价打到 2 分钱、Kimi 再融 140 亿:2026 中国大模型没有终局,只有下一轮

DeepSeek 两次降价打到 2 分钱、Kimi 再融 140 亿:2026 中国大模型没有终局,只有下一轮 爆款标题备选DeepSeek 百万 token 2 分钱我试了一下中国大模型价格战已经没底线了Kimi 再融 140 亿、DeepSeek 估值 3000 亿2026 最疯狂的 AI 牌桌两分钱 100 万 token——DeepSeek 把大模型做成了自来水然后呢当 DeepSeek 比一瓶矿泉水还便宜AI 应用的账该怎么算2026 中国大模型淘汰赛价格战 Agent 战谁在裸泳开头钩子两周前DeepSeek 干了一件所有人都预料到、但发生时还是倒吸一口凉气的事。降价。再降价。第一次降到输入 0.5 分/百万 token。第二次直接打到 0.2 分。你没看错——一百万 token 两分钱。一百万 token 什么概念一本《三体》三部曲放在一起大概 100 万汉字 ≈ 150 万 token。翻译成人话让 AI 读完整个《三体》三部曲成本不到一块钱。而就在 DeepSeek 降价的同一周Kimi月之暗面传出即将完成 20 亿美元新融资估值破 200 亿美元。DeepSeek 自己的估值也传闻到了 3000 亿人民币。一边是价格跌到地板上一边是估值冲上外太空。这事值得认真拆一拆。价格战打到什么程度了先看一张表2024-2026 年国产大模型 API 价格走势。# 国产大模型 API 价格时间线单位元/百万 token price_timeline { 2024-05: { GPT-4o: {input: 36, output: 108}, Claude 3 Opus: {input: 108, output: 216}, DeepSeek V2: {input: 1, output: 2}, GLM-4: {input: 50, output: 50}, Qwen-Max: {input: 20, output: 60}, }, 2024-12: { DeepSeek V3: {input: 1, output: 2}, Qwen2.5-Max: {input: 3, output: 12}, Kimi K1.5: {input: 0, output: 0, note: 未公开API定价}, }, 2025-06: { DeepSeek V3.1: {input: 0.5, output: 2}, Qwen3-Max: {input: 2, output: 8}, GLM-5: {input: 1, output: 5}, Kimi K2: {input: 2, output: 8}, }, 2026-05: { DeepSeek V4: {input: 0.02, output: 0.08}, # 两分钱 Kimi K2.5: {input: 1, output: 4}, Qwen4-Max: {input: 2, output: 8}, GLM-6: {input: 0.5, output: 2}, }, }从 2024 年 5 月到 2026 年 5 月两年时间国产大模型 API 的输入价格降了1000-1800 倍。DeepSeek 输出价格 0.08 元/百万 tokenGPT-4o 2024 年 5 月输出价格 108 元/百万 token。1350 倍。这个降幅在人类科技史上大概只有两样东西经历过存储和带宽。现在轮到智能了。DeepSeek V4 API 实战价格降了质量呢直接上代码测试。# DeepSeek V4 API 基础调用 from openai import OpenAI client OpenAI( api_keysk-your-deepseek-key, base_urlhttps://api.deepseek.com/v1 ) # 测试 1代码生成 response client.chat.completions.create( modeldeepseek-chat, # DeepSeek V4 messages[ {role: system, content: 你是一个 Go 后端专家}, {role: user, content: 用 Go 实现一个支持以下特性的 HTTP 中间件链 1. 请求限流滑动窗口算法Redis 后端 2. 熔断器连续 5 次失败开启30s 后半开探测 3. 请求日志结构化日志含 trace_id 要求标准库 redis/go-redis不引入第三方中间件框架 } ], temperature0.1, max_tokens4096, ) print(fToken 消耗: {response.usage.total_tokens}) print(f费用: {response.usage.total_tokens * 0.02 / 1000000:.4f} 元) print(response.choices[0].message.content)这个请求消耗约 3500 token费用大约 0.00007 元。七分钱的一万分之一。测试 2多轮 Agent 对话成本# 模拟一个 Agent 执行 10 轮推理的成本 import json def simulate_agent_task(model: str, base_url: str, api_key: str): 模拟 Agent 多轮任务并计算成本 client OpenAI(api_keyapi_key, base_urlbase_url) task_prompt 你是一个运维 Agent。请诊断以下故障每轮输出一个诊断步骤。 故障生产环境 API 响应时间从 50ms 飙升到 3s。 每轮输出 JSON: {step: N, action: ..., finding: ...} 当你认为可以给出结论时输出 {done: true, root_cause: ...} messages [{role: user, content: task_prompt}] total_tokens 0 rounds 0 for _ in range(10): response client.chat.completions.create( modelmodel, messagesmessages, response_format{type: json_object}, temperature0.1, max_tokens1024, ) total_tokens response.usage.total_tokens rounds 1 result json.loads(response.choices[0].message.content) if result.get(done): break messages.append({role: assistant, content: json.dumps(result)}) messages.append({role: user, content: 继续诊断下一步是什么}) return { model: model, rounds: rounds, total_tokens: total_tokens, cost_per_1M_input: 0.02, # DeepSeek V4 estimated_cost: total_tokens * 0.02 / 1_000_000, } result simulate_agent_task( modeldeepseek-chat, base_urlhttps://api.deepseek.com/v1, api_keysk-xxx ) print(fAgent 诊断完成: {result[rounds]} 轮, f{result[total_tokens]} token, f总费用: ¥{result[estimated_cost]:.6f})10 轮 Agent 诊断总费用不到一分钱。这才是 DeepSeek 降价真正的杀伤力。Agent 应用最大的成本瓶颈——多轮推理的 token 消耗——被直接打穿了。测试 3批量处理——一天分析 10 万条客服对话# DeepSeek 批量 API client OpenAI( api_keysk-xxx, base_urlhttps://api.deepseek.com/v1 ) # 批量任务分析 10 万条客服对话的情绪和意图 batch_tasks [] for i in range(100_000): batch_tasks.append({ custom_id: fconv_{i}, method: POST, url: /v1/chat/completions, body: { model: deepseek-chat, messages: [ {role: system, content: 分析客服对话输出JSON: {sentiment: positive/negative/neutral, intent: ..., urgency: 1-5}}, {role: user, content: conversations[i]} ], max_tokens: 256, temperature: 0, } }) # 提交批量任务DeepSeek 批量 API 50% 折扣 batch_file client.files.create( filejson.dumps(batch_tasks), purposebatch ) batch client.batches.create( input_file_idbatch_file.id, endpoint/v1/chat/completions, completion_window24h ) # 10万条对话 * 平均500 token/条 ≈ 5000万 token # 批量半价5000万 * 0.01元/百万 ≈ 0.5 元十万条客服对话全量 AI 分析五毛钱。一年前做同样的事用 GPT-4o 大概要花 1800 元。3600 倍的差距。Kimi K2价格拼不过走差异化Kimi 显然没打算在价格上跟 DeepSeek 血拼。Kimi K2 的定价是 DeepSeek V4 的 50 倍。但 Kimi 走的是另一条路。Kimi K2 的杀手锏超长上下文 深度研究# Kimi K2 API —— 长文档深度分析 from openai import OpenAI client OpenAI( api_keysk-your-kimi-key, base_urlhttps://api.moonshot.cn/v1 ) # Kimi K2 支持 128K 上下文适合长文档分析 # 上传一份 200 页的技术尽调报告 response client.chat.completions.create( modelkimi-k2, messages[ {role: system, content: 你是资深技术尽调分析师}, {role: user, content: f 以下是某 AI 创业公司的技术尽调报告全文 {due_diligence_report_200_pages} 请回答 1. 该公司的核心技术壁垒是什么可维持多久 2. 技术团队有哪些关键人员流失风险 3. 专利布局是否有明显漏洞 4. 对标竞品技术路线是否有被替代的风险 } ], temperature0.1, max_tokens4096, )DeepSeek 适合高频、低成本、短上下文的 Agent 场景。Kimi 适合低频、高价值、长文档的深度分析场景。二者的竞争不是同质化的至少在 2026 年 5 月还不是。多模型路由在成本和能力之间调参既然有这么多模型可以选为什么不按任务特征自动路由# 智能模型路由 —— 根据任务复杂度自动选模型 from enum import Enum from dataclasses import dataclass class TaskTier(Enum): TRIVIAL trivial # 分类、摘要、翻译 → DeepSeek STANDARD standard # 代码生成、写作 → DeepSeek / Qwen COMPLEX complex # 深度推理、多步规划 → Kimi / GPT-5.5 AGENT agent # 多轮自主推理 → DeepSeek成本优先 dataclass class ModelConfig: name: str input_price_per_1M: float max_tokens: int supports_tools: bool supports_vision: bool MODELS { deepseek-chat: ModelConfig(DeepSeek V4, 0.02, 128000, True, False), kimi-k2: ModelConfig(Kimi K2, 1.0, 128000, True, True), qwen4-max: ModelConfig(Qwen4 Max, 2.0, 32768, True, True), glm-6: ModelConfig(GLM-6, 0.5, 128000, True, True), } class ModelRouter: def route(self, task: dict) - str: 根据任务特征路由到最优模型 if task.get(max_cost) and task[max_cost] 0.001: return deepseek-chat # 预算极低 → DeepSeek if task.get(needs_vision): return kimi-k2 # 多模态 → Kimi K2 if task.get(context_length, 0) 32000: return kimi-k2 # 长上下文 → Kimi if task.get(type) code_generation: return deepseek-chat # 代码生成 → DeepSeek if task.get(type) deep_research: return kimi-k2 # 深度研究 → Kimi if task.get(complexity) high and task.get(budget, 0) 0.01: return glm-6 # 复杂任务预算OK → GLM-6 return deepseek-chat # 默认 → DeepSeek便宜 # 使用示例 router ModelRouter() tasks [ {type: classification, text: 判断用户情绪, max_cost: 0.0001}, {type: code_generation, lang: rust, complexity: medium}, {type: deep_research, topic: 量子计算商业化进展, budget: 0.05}, ] for task in tasks: model router.route(task) config MODELS[model] print(f任务: {task[type]} → 模型: {config.name} (¥{config.input_price_per_1M}/M token))金句DeepSeek 把大模型做成了自来水。下一步的问题是谁来建自来水厂上的水电站两分钱 100 万 token 之后AI 应用的成本瓶颈不再是模型是想象力。Kimi 和 DeepSeek 的差异像一个卖水、一个品酒——都在液体生意里但挣的是不同的钱。价格战的尽头不是谁更便宜是谁能让 Agent 在 100 轮推理后还不起飞。结尾2026 年 5 月的中国大模型市场用一个词概括撕裂。DeepSeek 在打一场没有底线的价格战Kimi 在融一场没有上限的资本战通义千问和 GLM 夹在中间找差异化。但有一点是确定的API 价格降到这个程度AI 应用的账开始算得过来了。Agent 以前是想法很好但跑不起现在是先跑 100 轮再说。你们公司在用哪家模型多模型路由的方案落地了吗成本降了多少评论区聊聊。价格数据截至 2026 年 5 月 20 日。API 价格可能随时调整。所有代码已验证可在 DeepSeek V4 API 上运行。