2026年AI行业最大地震：Transformer七年统治被打破，算力成本直降千分之一-尧图企业网站定制

P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。最近AI圈炸锅了炸到什么程度呢我上周去参加程序员线下聚会平时大家坐下来第一句都是“今天又写了多少CRUD”“你们公司裁员了吗”结果那天所有人张口闭口都是“SubQ”“线性复杂度”“RAG要凉了”。有个做了5年向量数据库的兄弟喝了三瓶啤酒之后抱着我哭说自己刚凑够首付现在感觉人生都崩塌了。事情是这样的两周前一个叫Subquadratic的迈阿密小公司从隐身模式里蹦出来扔了一颗核弹级别的消息他们打破了Transformer自2017年以来统治整个AI行业的数学约束。消息一出24小时内全网曝光超过1200万次3万人连夜挤爆了他们的候补名单那场面比当年抢茅台还疯狂。可能有人不知道Transformer是什么这么说吧现在你用的所有大模型GPT、Claude、Gemini、文心一言全都是基于Transformer架构做的。它就像AI界的Windows所有人都在用所有人都知道它有bug但所有人都没办法换掉它。Transformer最大的bug是什么就是它的注意力计算是平方级别的复杂度O(n²)。这是什么概念呢就像你去超市结账每多拿一件商品结账时间就平方增长。你买10件东西结账要100秒买100件就要10000秒也就是两个多小时要是你买1000件那你得在收银台待将近12天。等你结完账你买的牛奶都过期了你家孩子都能打酱油了。放到大模型里就是上下文长度每翻一倍需要的算力就翻四倍。所以你看现在那些大模型动不动就说自己支持1M、2M上下文其实都是打肿脸充胖子。真让它处理1M token的文档不仅慢得要死贵得离谱还会出现“中间注意力退化”的问题。就像你让一个人背一本1000页的书他确实能背下来但你问他第500页写了什么他大概率会说“我忘了”。为了解决这个破问题整个AI行业折腾了整整七年。大家想出了各种奇招RAG、向量数据库、上下文压缩、记忆系统……说白了全都是补丁。就像你家水管漏了你不换水管天天拿桶接水。接了一桶又一桶还发明了各种高级桶什么智能接水桶、自动倒水桶、桶联网甚至还搞出了桶的生态一堆公司靠卖桶发了财。结果现在突然有人跳出来说“要不咱们换个水管吧”所有人都愣住了。对啊我们怎么没想到呢这个说要换水管的人就是Subquadratic。他们搞出来的新架构叫SSA次二阶选择注意力。名字听起来挺唬人其实原理特别简单原来的Transformer是让每个token都去看所有其他token不管重要不重要而SSA是只让每个token去看那些真正重要的token。就像你准备期末考试原来的老师让你把整本书一字不差地背下来背不下来就挂科现在的老师给你划了重点只让你背考点。你说哪个效率高官方给出的数据是在1M token的情况下SSA比现在最快的FlashAttention还要快52倍到了12M token的时候算力消耗直接比主流前沿模型少了接近1000倍。1000倍是什么概念原来跑一个任务要花1000块钱电费现在只要1块钱原来要跑一整天才能出结果现在只要1分半钟。你说这谁顶得住最激动的是谁是做AI Agent的那帮人。现在做代码Agent的比如Cursor、Claude Code天天在那跟RAG死磕。为什么因为整个代码仓库根本塞不进上下文啊。就像你要写一篇关于《红楼梦》的论文图书馆不让你把书带进去只能每次进去抄一页抄完出来写写着写着忘了前面的内容再进去抄。来回跑断腿不说写出来的东西还前后矛盾。现在SubQ说“别跑了你把整个图书馆搬进去吧随便看随便翻我还能帮你记住每一页的每一个字。”官方更狠直接放话“RAG就是Transformer时代的权宜之计。”这句话一出整个AI基础设施圈都地震了。向量数据库公司的CEO们连夜开会改PPT原来的PPT第一页是“向量数据库是AI时代的核心基础设施”现在改成了“向量数据库是SSA时代的最佳补充”。做上下文压缩、记忆系统的公司已经开始在招聘网站上搜“SSA开发工程师”了。当然了吹得这么凶质疑的人也不少。毕竟AI圈这些年吹过的牛比写过的代码还多。远的不说就说2024年的Magic.dev当时也是横空出世说自己支持1亿token上下文效率提升1000倍一口气融了5亿美元。结果呢到2026年了连个能用的Demo都没放出来就像你朋友圈有人天天说自己中了500万结果天天找你借钱吃饭。而且在SubQ之前已经有好多公司说自己解决了平方复杂度的问题。Mamba、RetNet、RWKV还有Kimi Linear、DeepSeek稀疏注意力一个个都喊着要干翻Transformer。结果最后要么是下游任务性能拉胯要么是偷偷在里面加了传统注意力层本质上还是换汤不换药。就像大家都在朋友圈说自己要减肥结果背地里都在偷偷吃火锅。现在大家对SubQ的质疑主要集中在几点第一论文细节没公开不知道它到底是怎么实现的第二所有的基准测试都是自己测的没有第三方独立验证第三API还在私测阶段普通人根本用不到第四架构也没开源谁也不知道里面有没有藏着什么猫腻。说白了现在的情况就是一个人跑过来跟你说他发明了永动机但是不让你看机器只给你看他拍的视频还说已经有好多大佬给他投钱了。你信吗但话说回来这件事之所以能引起这么大的轰动不是因为大家都信了而是因为大家都太希望它是真的了。整个AI行业被Transformer的平方复杂度逼了七年了。这七年里我们所有的创新本质上都是在给Transformer打补丁。我们搞RAG搞向量数据库搞各种工程优化都是为了绕过这个根本的架构瓶颈。就像所有人都在一条破船上船漏了个大洞大家都在拼命舀水突然有人说他造了一艘新船你说大家能不激动吗如果SubQ真的能做到它说的那样那整个AI行业的格局都会被彻底改写。代码Agent能直接把整个代码仓库塞进上下文再也不用搞什么RAG、分块、摘要了写代码的效率能提升十倍不止企业知识库不用再折腾什么向量数据库了直接把所有文档扔进去想问什么就问什么法律、医疗这些需要处理超长文档的行业直接迎来生产力革命还有AI的长期记忆问题也能得到根本解决。但如果它做不到呢那就是又一个AI泡沫又一批投资人的钱打了水漂又一群创业者从神坛上摔下来。所以现在最理性的态度是什么就是观望。别着急跟风也别着急否定。等它过了独立基准测试、同行评审、开放访问这三道关再说它是不是真的革命。真正能改变行业的技术从来不是靠推特上的曝光量也不是靠融了多少钱。它靠的是实实在在的性能是能解决别人解决不了的问题。Transformer已经统治了AI行业七年这七年里无数人想挑战它的地位但都失败了。现在SubQ站了出来它到底是下一个时代的开启者还是又一个营销骗局我们拭目以待。P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

相关新闻

AI赋能光通信：深度学习与机器学习在信号处理与网络管理中的实战应用

N-HiTS时间序列预测：分层插值原理与工业落地实践

Mythos Preview：通用AI模型如何实现网络安全能力范式跃迁

CANN/pypto isfinite函数文档

CANN/pypto循环结束判断API

CANN/asc-devkit int64转int32向量转换

Stylis插件开发完全指南：如何扩展CSS预处理功能

OpenISP 模块拆解 · 第12讲：双边滤波降噪 (BNF)

Jooby数据库集成实战：Hikari、JDBI、Ebean最佳实践

状态机——SpringStateMachine嵌套状态流转

终极Windows 11优化指南：如何用开源工具彻底清理系统冗余

利用TaoToken模型广场为不同文本处理任务选择性价比最优模型

基于CircuitPython与运动传感器的智能LED滑雪板灯光系统全解析

app扫描wifi的时候需要打开GPS定位----否则扫不到

使用辅助权限登录wifi

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感