网易首页 > 网易号 > 正文 申请入驻

13人干翻Transformer!新架构SSA算力暴减千倍,成本仅Opus 5%

0
分享至


新智元报道

编辑:桃子

【新智元导读】Transformer统治地位悬了!一款SubQ模型带着SAA架构横空出世,1200万上下文成本仅Opus的5%,计算量暴减千倍。

Transformer,王座不保?!

今天,一款AI模型SubQ横空出世,震撼了全世界。

这是全球首个基于完全亚二次方稀疏注意力架构(SSA)的模型,上下文高达1200万Token。


SubQ的核心优势在于,其SSA架构会根据内容「动态选择」关注点,不会盲目计算所有Token间的关联。

相较于Transformer,它的计算量直接暴减1000倍。

实验结果显示,100万token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


而打造出这款架构的背后这家公司,叫Subquadratic,坐标迈阿密,全公司仅13人。

AI大佬Bindu Reddy辣评道,「若这一切都是真的,Anthropic和OpenAI的估值直接归0」!


还有人表示,这才是LLM接下来真正Scaling的方式。


Transformer「原罪」,九年未解

2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架构的统治地位。

此后九年,从GPT到Claude到Gemini,所有前沿大模型都建立在同一个基础上:密集注意力机制。


长期以来,Transformer的工作方式非常暴力,即每个token都要和序列中所有其他token做一次比较。

这种机制让它深陷「二次方复杂度」的泥潭,上下文每增加一倍,计算成本飙升四倍。

这意味着,输入越长,模型越贵、越慢、越容易崩。

这就解释了几乎所有LLM的上下文卡在100万token左右,不是技术做不到更长,是做到了也用不起。

这一次,SubQ的诞生,从根本上改变了这个等式。


SSA架构出世

不要「更快」只要「更少」

SubQ的核心突破叫做SSA——亚二次方稀疏注意力(Subquadratic Sparse Attention)。

它的思路出奇地简单,不再让每个token和所有token做比较。

既然训练好的模型中,绝大多数注意力权重都接近零0,那为什么还要算它们?

SSA的做法是,对每一个query,基于「内容」选择序列中真正值得关注的位置,然后只在这些位置上精确计算注意力。

它只计算那些真正有意义的交互,跳过其余99%以上的无用计算。


以下是SSA的三大关键特性——

  • 线性扩展

计算量随选中的位置数量增长,而不是随整个序列长度增长。上下文翻倍,成本只翻倍,不再是翻四倍。

  • 内容依赖路由

模型根据语义决定看哪里,而不是根据位置。关键信息在序列第3个token还是第1100万个token,都能被找到。

  • 精确检索

不像循环模型那样把信息压缩成固定状态,SSA保留了从任意位置精确取回信息的能力。

说白了,SSA不是「把密集注意力算得更快」,而是「让模型做更少的注意力计算」。


减少的计算量,直接转化为速度。

速度狂飙52.5倍,成本不到Opus 5%

SubQ放出的数据,每一条都在暴击:

在100万token长度上,SSA比标准密集注意力+FlashAttention-2快52.2倍。


在12.8万token上快7.2倍,25.6万token快13.2倍,51.2万token快23倍。

显而易见,上下文越长,优势越碾压。

这正是SSA线性扩展的直接体现——密集注意力越长越慢,SSA越长越划算。


再来看算力消耗,在100万token下,注意力FLOP减少了62.5倍。在1200万token下,这个数字飙升到接近1000倍。


至于成本,Subquadratic给了一个非常直观的对比——

在RULER 128K基准测试上,SubQ花费8美元,Opus为2600美元,直接拉出了300倍的成本差距。

最关键的是,这些速度和成本优势,并没有以牺牲准确率为代价。

RULER 128K基准测试: SubQ拿下95%,Opus 4.6是94.8%;


SWE-Bench Verified(代码工程): SubQ得分81.8,超过Opus 4.6的80.8。

MRCR v2(长上下文检索): SubQ拿到65.9%,虽然低于Opus 4.6的78%,但远超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


这组数字放在一起看,细思极恐——

一家种子轮公司,用不到Opus 5%的成本,在多项核心基准测试上打平甚至超过了Anthropic和OpenAI的旗舰模型。


一个提示词,SubQ即可处理1200万Token的超长信息:

无论是整个代码库、数月的 PR 记录,还是长期运行的 AI 智能体状态,全都游刃有余,而且成本仅需原来的五分之一。


不得不说,若这一切成真,这将是Transformer问世以来最重要的架构级突破。

13人初创公司,要颠覆Transformer

Subquadratic成立于2024年,拿下2900万美元种子轮,估值5亿美元。

它有两位联合创始人:CEO Justin Dangel,CTO Alexander Whedon。


研究团队11人,全部是博士,来自Meta、谷歌、牛津大学、剑桥大学、Adobe。

值得一提的是,这家公司之前叫Aldea,做的是语音模型,后来转型到了注意力架构研究。

这一次,产品线三条同时上线:

  • SubQ API:12M token全量上下文接口

  • SubQ Code:命令行编码Agent,整个代码库一次性塞进去

  • SubQ Search:深度研究工具,初期免费

全网炸锅:是终结者,还是AI版Theranos?

SubQ发布后数小时内,AI社区就分裂成了两个阵营。

AI大佬Dan McAteer一句话,概括了所有人的心态:

SubQ要么是Transformer以来最大的突破……

要么就是AI界的Theranos。


支持者一方阵容不小。

有人表示,这是2026年最疯狂的AI发布之一。

Subquadratic可能找到了奥特曼所言的另一个架构的重大突破。




但怀疑派也毫不留情,有人直言这就是一个「骗子公司」,尤其是看完创始人领英介绍后。



OpenAI前研究员Will Depue更是连发多条,第一时间指出,「SubQ几乎可以确定是基于Kimi或DeepSeek的稀疏注意力微调」。




AI圈见过太多「发布即巅峰」的故事,发布会上的PPT和真实世界的部署之间,隔着一整条死亡谷。

但话说回来,也正因为这个赌注太大,整个行业才不敢不认真对待。

答案,也许只有等技术报告公开、独立benchmark复现之后,才会真正揭晓。

参考资料:

https://x.com/alex_whedon/status/2051663268704636937?s=20

https://subq.ai/how-ssa-makes-long-context-practical

https://x.com/daniel_mac8/status/2051710659822305661?s=20

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6岁被偷,32年后DNA比对成功,母亲抱着骨灰盒哭喊:回家了

6岁被偷,32年后DNA比对成功,母亲抱着骨灰盒哭喊:回家了

真实人物采访
2026-06-10 12:55:07
考场外“华为全家桶”走红!网友调侃:小米全家桶,不比这有面儿

考场外“华为全家桶”走红!网友调侃:小米全家桶,不比这有面儿

火山詩话
2026-06-10 08:50:50
公狗剧场男色生意经:一群180男人月入10万,让女人们疯狂买单?

公狗剧场男色生意经:一群180男人月入10万,让女人们疯狂买单?

金融八卦女
2026-06-10 13:46:40
央视直播乒乓球时间表:6月11日CCTV5直播国乒!国乒战张本美和大藤沙月

央视直播乒乓球时间表:6月11日CCTV5直播国乒!国乒战张本美和大藤沙月

好乒乓
2026-06-11 12:21:28
高志凯预言:全球金融危机将至!杀伤力是 2000 年互联网泡沫的十倍

高志凯预言:全球金融危机将至!杀伤力是 2000 年互联网泡沫的十倍

混沌录
2026-06-10 21:57:11
马筱梅带汪宝儿逛乐园,宝宝五官神似张兰,网友:长得很“京味”

马筱梅带汪宝儿逛乐园,宝宝五官神似张兰,网友:长得很“京味”

凡知
2026-06-11 12:40:35
万万没想到,第一个援助菲律宾的国家,既不是日本,也不是美国

万万没想到,第一个援助菲律宾的国家,既不是日本,也不是美国

小樾说历史
2026-06-10 15:20:55
央视发力!中国球迷小心了:别录屏世界杯发朋友圈 否则或赔108万

央视发力!中国球迷小心了:别录屏世界杯发朋友圈 否则或赔108万

念洲
2026-06-11 08:36:06
跌落神坛的8大热门藏品,当年一件抵北京一套房,你买过几种?

跌落神坛的8大热门藏品,当年一件抵北京一套房,你买过几种?

复转这些年
2026-06-09 16:24:15
民进党南霸天不保!黄捷救场遭扒:母在厦赚大钱,她狂反中

民进党南霸天不保!黄捷救场遭扒:母在厦赚大钱,她狂反中

时尚的弄潮
2026-06-10 11:32:08
1962年,当36岁梦露当众褪衣亮相那一刻,生命就已经进入了倒计时

1962年,当36岁梦露当众褪衣亮相那一刻,生命就已经进入了倒计时

毒舌小红帽
2026-06-10 18:33:58
电车车主最担心的事情发生了!燃油车价格崩塌

电车车主最担心的事情发生了!燃油车价格崩塌

说财猫
2026-06-10 05:02:28
“现在的医生和老师真坏!”我听了一笑了之

“现在的医生和老师真坏!”我听了一笑了之

梅斯医学
2026-06-11 07:52:33
中国海警船突入与那国岛海域,日本抗议无效,琉球群岛不属于日本

中国海警船突入与那国岛海域,日本抗议无效,琉球群岛不属于日本

铁锤简科
2026-06-11 14:16:55
高考刚结束,央视、人民日报接连“点名”张桂梅,句句戳心窝

高考刚结束,央视、人民日报接连“点名”张桂梅,句句戳心窝

阿器谈史
2026-06-11 12:41:21
“不理解但尊重”,家长打扮粉嫩幼态送娃上学,网友:很不得体

“不理解但尊重”,家长打扮粉嫩幼态送娃上学,网友:很不得体

蝴蝶花雨话教育
2026-06-03 00:05:12
9岁男孩吃了夜市提拉米苏,全麻开腹手术进了ICU:你的那口随便的甜,可能要了孩子的命!

9岁男孩吃了夜市提拉米苏,全麻开腹手术进了ICU:你的那口随便的甜,可能要了孩子的命!

消化石医生
2026-06-09 20:08:20
午宴结束,中方离开平壤,临走前送给朝鲜2句话,美制裁神话破灭

午宴结束,中方离开平壤,临走前送给朝鲜2句话,美制裁神话破灭

秋枫凋零
2026-06-10 21:12:50
35年来最危险时刻已至!英军总长下令:全军必须准备大开杀戒!

35年来最危险时刻已至!英军总长下令:全军必须准备大开杀戒!

聚焦真实瞬间
2026-06-07 11:24:05
湖北省700万退休人员养老金将迎调整,看看过去3年是如何变化的?

湖北省700万退休人员养老金将迎调整,看看过去3年是如何变化的?

小彬说事
2026-06-11 11:08:44
2026-06-11 14:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15438文章数 66920关注度
往期回顾 全部

科技要闻

淘宝、京东、拼多多、抖音、小红书被约谈

头条要闻

大批印度学生高考考卷被"调包" 40万人申请看扫描件

头条要闻

大批印度学生高考考卷被"调包" 40万人申请看扫描件

体育要闻

文班:付出那么多努力,却把胜利拱手让人

娱乐要闻

《花少8》阵容大揭秘!秒杀前一季

财经要闻

干细胞生意:17万一针的希望

汽车要闻

埃安i60 530宁德时代版上市限时焕新价10.36万起

态度原创

艺术
家居
旅游
手机
军事航空

艺术要闻

四川美术学院,2026届研究生毕业作品集(一)

家居要闻

空间微调 移形换境

旅游要闻

粤看粤美|广州:金色花海美成童话世界

手机要闻

2026最新数码选购指南!准大学生如何买手机/电脑/平板?

军事要闻

特朗普召开战情室会议讨论对伊朗军事行动

无障碍浏览 进入关怀版