DeepSeek砍价75%说永久，我看到了三个更深的信号-尧图企业网站定制

DeepSeek砍价75%说永久我看到了三个更深的信号降价75%还说是永久的5月22号晚上DeepSeek发了个公告我看完直接愣了一下。不是小打小闹的打折是永久降价75%。原来2.5折的促销价到期后不再恢复直接变成正式价。也就是说如果你之前觉得6月就要涨价了赶紧用——不用急了这个价格永远就这样了。这不是什么限时优惠这是重新定价。先看数字感受一下力度V4 Pro 新价输入每百万tokens 3元输出6元。缓存命中更是只要0.025元。原价是多少输入12元输出24元。直接砍掉四分之三。V4 Flash更便宜输入1元输出2元。你可能觉得3块钱6块钱也不便宜啊——那我给你个参照同级别的Claude Opus输出每百万tokens大概150元。DeepSeek是它的二十五分之一。不是便宜一点是便宜了一个数量级。为什么降我翻了三个原因官方公告没解释原因只说了降价两个字。但我把最近的新闻串起来看觉得答案其实挺明显的。第一个原因架构效率真的提上去了。V4 Pro用的是Engram架构1.6T总参数49B激活的MoE模型。相比V3.2同等任务只需要27%的token消耗KV cache只有原来的10%。翻译成人话就是同样跑一次V4 Pro花的算力不到V3的三分之一。成本降了价格自然能降。第二个原因昇腾950进来了。这是最近圈内讨论最多的事。有消息说DeepSeek V4已经在华为昇腾950的A3集群上跑通了。8K输入延迟约20msDecode约4700 TPS——这个数据不比英伟达差。为什么重要因为算力不再只靠英伟达了。多了一个供应商议价权就上来了成本空间就出来了。第三个原因生态打法。DeepSeek拿了700亿融资国家大基金领投。它不缺钱缺的是用户量和生态黏性。API价格降到这个程度所有中小开发者、创业公司都会涌过来。这不是在做生意是在圈地。并发限制也调了这是另一只靴子降价的同时DeepSeek还调了并发限制。V4 Flash并发500V4 Pro并发2500。超过就429。看着像降价又限流等于没降不是。官方说得很直白之前有人用API反代大量白嫖算力影响正常用户。限制并发主要是打这帮人的。对正常开发者来说V4 Pro 2500的并发够用了。真正被卡的是那种开反代站薅羊毛的。这件事的深层含义比降价本身更大我琢磨了一下觉得这件事背后有三层信号值得每个人想想。第一层大模型API的定价体系正在崩塌。以前的定价逻辑是模型多大→训练多贵→API就定多贵。但现在架构优化国产算力规模效应把成本结构彻底打穿了。V4 Pro的性能不输GPT-5价格却只有人家几十分之一。这意味着按参数量定价的时代快结束了未来是按实际成本微利来定。第二层算力去英伟达化正在从PPT变成现实。昇腾950跑通V4 ProCANN生态从概念验证到Triton原生兼容——这些变化意味着国产AI算力不再是能用但慢而是能用而且够快。当你的推理不再100%依赖英伟达GPU你的成本就有巨大的下降空间。第三层对普通人来说AI应用要爆发了。API价格降到这个水平意味着开发一个AI应用的后端成本几乎可以忽略不计。以前做一个AI客服、AI写作助手、AI编程工具每个月API费动辄几千几万。现在可能几百块就搞定了。我判断接下来半年到一年会有一波AI应用创业潮。不是因为技术突破而是因为成本终于降到了普通人玩得起的程度。说个我自己的判断我觉得DeepSeek这一步不是在跟OpenAI打价格战。它在做一件更根本的事重新定义AI的计价单位。以前我们说1个token多少钱以后可能说的是1个Agent运行1小时多少钱甚至1个AI应用服务1个用户1个月多少钱。当推理成本无限趋近于零商业模式就不可能还是卖token。谁先想清楚新的计价方式谁就是下一轮的赢家。DeepSeek用75%的降幅告诉你我准备好了你们呢

相关新闻

LAV Filters：Windows上最强大的视频解码解决方案，解决你99%的播放问题

如何轻松搞定OneNote全局搜索替换：OneMore插件让你告别繁琐的手动操作

Unity 2021 LTS深度实践：C# 9.0兼容性与MonoBehaviour生命周期真相

别再死记硬背了！用COMSOL 5.6搞定声学建模，从房间特征频率到完美匹配层（PML）实战避坑

旧安卓手机别扔！用Termux+LXC把它变成一台Ubuntu Docker服务器（保姆级避坑指南）

哔哩漫游X：全面解锁B站功能的终极ReVanced增强模块

鸿蒙数学 108 篇 第十四篇：正负数本源：阴阳对立的数理表达

鸿蒙数学 108 篇 第十三篇：两仪数理内涵：阴阳二元数学定义

如何免费解锁艾尔登法环帧率限制：终极完整指南

【AI Daily】AI日报 | 2026-05-24

Go语言MongoDB文档数据库操作指南

【前端无障碍】无障碍测试：确保你的应用对所有人友好

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

鸿蒙数学 108 篇第十四篇：正负数本源：阴阳对立的数理表达

鸿蒙数学 108 篇第十三篇：两仪数理内涵：阴阳二元数学定义

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势