网易首页 > 网易号 > 正文 申请入驻

13人干翻Transformer!新架构SSA算力暴减千倍,成本仅Opus 5%

0
分享至


新智元报道

编辑:桃子

【新智元导读】Transformer统治地位悬了!一款SubQ模型带着SAA架构横空出世,1200万上下文成本仅Opus的5%,计算量暴减千倍。

Transformer,王座不保?!

今天,一款AI模型SubQ横空出世,震撼了全世界。

这是全球首个基于完全亚二次方稀疏注意力架构(SSA)的模型,上下文高达1200万Token。


SubQ的核心优势在于,其SSA架构会根据内容「动态选择」关注点,不会盲目计算所有Token间的关联。

相较于Transformer,它的计算量直接暴减1000倍。

实验结果显示,100万token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


而打造出这款架构的背后这家公司,叫Subquadratic,坐标迈阿密,全公司仅13人。

AI大佬Bindu Reddy辣评道,「若这一切都是真的,Anthropic和OpenAI的估值直接归0」!


还有人表示,这才是LLM接下来真正Scaling的方式。


Transformer「原罪」,九年未解

2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架构的统治地位。

此后九年,从GPT到Claude到Gemini,所有前沿大模型都建立在同一个基础上:密集注意力机制。


长期以来,Transformer的工作方式非常暴力,即每个token都要和序列中所有其他token做一次比较。

这种机制让它深陷「二次方复杂度」的泥潭,上下文每增加一倍,计算成本飙升四倍。

这意味着,输入越长,模型越贵、越慢、越容易崩。

这就解释了几乎所有LLM的上下文卡在100万token左右,不是技术做不到更长,是做到了也用不起。

这一次,SubQ的诞生,从根本上改变了这个等式。


SSA架构出世

不要「更快」只要「更少」

SubQ的核心突破叫做SSA——亚二次方稀疏注意力(Subquadratic Sparse Attention)。

它的思路出奇地简单,不再让每个token和所有token做比较。

既然训练好的模型中,绝大多数注意力权重都接近零0,那为什么还要算它们?

SSA的做法是,对每一个query,基于「内容」选择序列中真正值得关注的位置,然后只在这些位置上精确计算注意力。

它只计算那些真正有意义的交互,跳过其余99%以上的无用计算。


以下是SSA的三大关键特性——

  • 线性扩展

计算量随选中的位置数量增长,而不是随整个序列长度增长。上下文翻倍,成本只翻倍,不再是翻四倍。

  • 内容依赖路由

模型根据语义决定看哪里,而不是根据位置。关键信息在序列第3个token还是第1100万个token,都能被找到。

  • 精确检索

不像循环模型那样把信息压缩成固定状态,SSA保留了从任意位置精确取回信息的能力。

说白了,SSA不是「把密集注意力算得更快」,而是「让模型做更少的注意力计算」。


减少的计算量,直接转化为速度。

速度狂飙52.5倍,成本不到Opus 5%

SubQ放出的数据,每一条都在暴击:

在100万token长度上,SSA比标准密集注意力+FlashAttention-2快52.2倍。


在12.8万token上快7.2倍,25.6万token快13.2倍,51.2万token快23倍。

显而易见,上下文越长,优势越碾压。

这正是SSA线性扩展的直接体现——密集注意力越长越慢,SSA越长越划算。


再来看算力消耗,在100万token下,注意力FLOP减少了62.5倍。在1200万token下,这个数字飙升到接近1000倍。


至于成本,Subquadratic给了一个非常直观的对比——

在RULER 128K基准测试上,SubQ花费8美元,Opus为2600美元,直接拉出了300倍的成本差距。

最关键的是,这些速度和成本优势,并没有以牺牲准确率为代价。

RULER 128K基准测试: SubQ拿下95%,Opus 4.6是94.8%;


SWE-Bench Verified(代码工程): SubQ得分81.8,超过Opus 4.6的80.8。

MRCR v2(长上下文检索): SubQ拿到65.9%,虽然低于Opus 4.6的78%,但远超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


这组数字放在一起看,细思极恐——

一家种子轮公司,用不到Opus 5%的成本,在多项核心基准测试上打平甚至超过了Anthropic和OpenAI的旗舰模型。


一个提示词,SubQ即可处理1200万Token的超长信息:

无论是整个代码库、数月的 PR 记录,还是长期运行的 AI 智能体状态,全都游刃有余,而且成本仅需原来的五分之一。


不得不说,若这一切成真,这将是Transformer问世以来最重要的架构级突破。

13人初创公司,要颠覆Transformer

Subquadratic成立于2024年,拿下2900万美元种子轮,估值5亿美元。

它有两位联合创始人:CEO Justin Dangel,CTO Alexander Whedon。


研究团队11人,全部是博士,来自Meta、谷歌、牛津大学、剑桥大学、Adobe。

值得一提的是,这家公司之前叫Aldea,做的是语音模型,后来转型到了注意力架构研究。

这一次,产品线三条同时上线:

  • SubQ API:12M token全量上下文接口

  • SubQ Code:命令行编码Agent,整个代码库一次性塞进去

  • SubQ Search:深度研究工具,初期免费

全网炸锅:是终结者,还是AI版Theranos?

SubQ发布后数小时内,AI社区就分裂成了两个阵营。

AI大佬Dan McAteer一句话,概括了所有人的心态:

SubQ要么是Transformer以来最大的突破……

要么就是AI界的Theranos。


支持者一方阵容不小。

有人表示,这是2026年最疯狂的AI发布之一。

Subquadratic可能找到了奥特曼所言的另一个架构的重大突破。




但怀疑派也毫不留情,有人直言这就是一个「骗子公司」,尤其是看完创始人领英介绍后。



OpenAI前研究员Will Depue更是连发多条,第一时间指出,「SubQ几乎可以确定是基于Kimi或DeepSeek的稀疏注意力微调」。




AI圈见过太多「发布即巅峰」的故事,发布会上的PPT和真实世界的部署之间,隔着一整条死亡谷。

但话说回来,也正因为这个赌注太大,整个行业才不敢不认真对待。

答案,也许只有等技术报告公开、独立benchmark复现之后,才会真正揭晓。

参考资料:

https://x.com/alex_whedon/status/2051663268704636937?s=20

https://subq.ai/how-ssa-makes-long-context-practical

https://x.com/daniel_mac8/status/2051710659822305661?s=20

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
海航空姐卖货,真的是太拼了

海航空姐卖货,真的是太拼了

微微热评
2026-05-01 15:58:13
穆帅连线佛爷的消息,立刻稳住皇马局面,背景是本菲卡失欧冠名额

穆帅连线佛爷的消息,立刻稳住皇马局面,背景是本菲卡失欧冠名额

穆里尼奥主义者
2026-05-06 22:07:01
荣耀600 Pro:把老旗舰芯片塞进中端机的实验

荣耀600 Pro:把老旗舰芯片塞进中端机的实验

爬虫饲养员
2026-05-05 23:15:43
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
合肥:坚决拥护党中央决定

合肥:坚决拥护党中央决定

新京报
2026-05-06 20:26:10
广州将迎来“极大雨”!

广州将迎来“极大雨”!

羊城攻略
2026-05-06 23:16:11
内心强大到可怕的12种境界,读完一身冷汗,建议收藏

内心强大到可怕的12种境界,读完一身冷汗,建议收藏

金沛的国学笔记
2026-04-12 20:56:09
毛主席的压力,到底有多大?放眼全球,无人能比!

毛主席的压力,到底有多大?放眼全球,无人能比!

温读史
2026-05-05 15:56:05
一半中国人蛋白质没吃够!医生:50岁以上人群,每天这样吃才达标

一半中国人蛋白质没吃够!医生:50岁以上人群,每天这样吃才达标

路医生健康科普
2026-05-03 11:40:03
秦昊真坦诚啊:和伊能静结婚时,她卡里有6000万,我就20万

秦昊真坦诚啊:和伊能静结婚时,她卡里有6000万,我就20万

老吴教育课堂
2026-05-06 17:40:21
网友吐槽徐州一医院窗口高度设计不合理,市民需蹲地办理业务,院方回应

网友吐槽徐州一医院窗口高度设计不合理,市民需蹲地办理业务,院方回应

齐鲁壹点
2026-05-06 19:03:11
央国企这套形式主义,真的太可笑了

央国企这套形式主义,真的太可笑了

职场资深秘书
2026-05-05 18:28:40
连院子里的树都被贴了封条,山东临沂纳税状元变“黑老大”

连院子里的树都被贴了封条,山东临沂纳税状元变“黑老大”

有戏
2026-04-16 18:23:20
国际足联也急了!原来除了中国,还有这么多国家不给世界杯买单

国际足联也急了!原来除了中国,还有这么多国家不给世界杯买单

时光流转追梦人
2026-05-06 22:13:52
余承东在华为权力排名

余承东在华为权力排名

生活新鲜市
2026-04-27 18:30:53
马卡:巴尔韦德和楚阿梅尼在训练当中发生冲突,几乎大打出手

马卡:巴尔韦德和楚阿梅尼在训练当中发生冲突,几乎大打出手

懂球帝
2026-05-07 01:14:34
不甘心!杜锋暗示,下一场,广东队要赢北京队

不甘心!杜锋暗示,下一场,广东队要赢北京队

体育哲人
2026-05-06 23:14:39
日经225指数期货一度升至61440点,创下历史新高

日经225指数期货一度升至61440点,创下历史新高

每日经济新闻
2026-05-06 08:56:04
常规赛装虫,季后赛成龙!从高薪低能到活塞救世主,5200万超值

常规赛装虫,季后赛成龙!从高薪低能到活塞救世主,5200万超值

毒舌NBA
2026-05-06 21:26:29
2026年5月1日起严查隔夜酒,喝酒后到底多久能上路?

2026年5月1日起严查隔夜酒,喝酒后到底多久能上路?

老特有话说
2026-05-06 16:53:50
2026-05-07 01:55:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15145文章数 66838关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

本地
时尚
数码
手机
公开课

本地新闻

用青花瓷的方式,打开西溪湿地

有些路,不必每一步都走得那么用力

数码要闻

清闲OC1 Pro体验:高端工学椅新标杆 拯救打工人的老腰

手机要闻

“iPhone Ultra”或将成为业内最易维修的折叠屏手机

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版