网易首页 > 网易号 > 正文 申请入驻

截击英伟达!OpenClaw狂吞Token,北大系芯片黑马剑指2000 Tokens/s

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】英伟达200亿美元「招安」Groq,推理芯片赛道一夜变天。但在大洋彼岸,一家北大系创业公司刚刚交出了自己的流片答卷。

NVIDIA GTC 2026前夕,AI推理赛道大雨欲来。

国内死磕「超大带宽流式推理」路线的北大系黑马——寒序科技,今日宣布完成数千万元融资。

蛰伏两年,寒序直接亮出硬货:

  • 首颗样片回片测试全面跑通,单位面积带宽飙至100 GB/s/mm²;

  • 下一代「MRAM+SRAM」混合架构直指2000 Tokens/s极限。

这场破除「内存墙」的国产算力突围战,正从纸面跃向流片。



GTC 2026前夜的「路线倒戈」

大模型硬件的下半场,正迎来一场底层路线的剧烈「倒戈」。

下周,NVIDIA GTC 2026即将开幕。

作为全球AI算力的风向标,业内普遍预测:随着Agent(智能体)与具身智能的大规模落地,算力焦点的天平已彻底向「推理(Inference)」倾斜。

而在此前,业界盛传英伟达已通过约200亿美元的惊人估值级别,以技术授权与核心团队吸纳的方式,实质性绑定了北美明星推理芯片公司Groq。巨头为何对一家初创公司掷出天价?


核心逻辑在于:传统GPU在应对流式大模型推理时,正撞上难以逾越的「内存墙(Memory Wall)」与动态调度延迟。在实时生成的战场上,原本为并行计算而生的GPU,正显得有些「尾大不掉」。

就在英伟达试图在北美完成技术垄断、构筑推理算力护城河的当下,新智元独家获悉:国内专注超快流式推理芯片的创业黑马——「寒序科技」今日正式宣布完成数千万元融资。本轮投资方为启高资本、赛意产业基金,源合资本担任独家财务顾问。

在蛰伏两年后,这家源自北大的硬核团队直接交出了流片答卷,向业界证明:在「确定性流式处理」这条非共识的道路上,中国团队不仅跟得上,而且打得通。



GPU的「原罪」与推理时代的「阳谋」

要理解寒序科技的技术护城河,必须先拆解为何连英伟达都要焦虑。

现代GPU(如H100/Blackwell)是为并行计算而生的艺术品。为了兼容通用计算,它支持复杂的软件生态和多类型算子,内部包含极其复杂的动态调度、乱序执行、多级Cache层级以及Warp调度机制。

在「训练阶段(Training)」,这种吞吐量优先的架构通过大规模数据并行,展现了统治级的实力。

但在「推理阶段(Inference)」,风向变了。

大模型生成Token的过程是串行的、流式的。每生成一个Token,本质上都需要执行一次矩阵向量乘(GEMV):

y = Wx

其中W为权重矩阵(Weight Matrix),x为激活向量(Activation Vector)。

这意味着推理阶段并不是「算力受限」问题,而是典型的「带宽受限计算(Bandwidth-bound Computing)」。在Decode(生成)阶段,GPU庞大的浮点运算单元(ALU)大部分时间都在空转,苦苦等待从显存中搬运权重的指令。这种「高射炮打蚊子」的错配,导致了极大的算力闲置与延迟波动。

英伟达的「阳谋」昭然若揭既然GPU架构在小Batch推理上存在天生缺陷,那就通过资本手段「收编」像Groq这样走LPU(Language Processing Unit)路线的公司,从而在黑盒内部完成对推理架构的补完。



叫板Groq

寒序科技的「极致断舍离」

寒序科技(SpinPU-E Series)走的是一条与GPU截然不同、却与Groq核心理念高度共鸣的道路:片上存储权重的流式高带宽架构彻底摒弃硬件调度,采用片上存储权重的流式高带宽架构

参照张量流式处理器(TSP)的底层原则,寒序科技在产品定义上实现了极致的重构。这种架构在内部被形象地称为「生产线模式」,而非GPU的「计件工厂模式」。

1. 算法指导的流式「确定性」

传统处理器依赖多级缓存和复杂的调度逻辑来处理不规则任务,这在大模型看来是多余的负担。寒序通过神经网络前向传播算法指导的Decode专用性、确定性数据流动规划,实现了超高吞吐的精确调度与处理。

这意味着,数据在芯片内部每一纳秒的位置都是预先确定的,消除了任何因动态争抢资源带来的延迟抖动。

2. 面向算子的数据通路

寒序将芯片内部空间划分为针对Transformer模型优化的特定功能块:片上权重存储、GEMV计算单元、向量运算单元。这种设计让权重读取与计算形成完美流水线,真正做到了「数据到达即计算」。

3. 带宽即生命线

在大模型推理中,决定吞吐量的不是FLOPS,而是带宽利用率。公式如下:


寒序科技的核心竞争力,就在于将这个公式的分子(带宽)推向了物理极限。



100 GB/s/mm²

跨越「死亡之谷」的硬核指标

对于芯片初创公司而言,从PPT架构图到硅片回片,中间横亘着被称为「死亡之谷」的流片验证期。

知情人士向新智元透露,寒序科技首颗芯片样片的「回片测试」结果远超预期,核心功能与技术逻辑被全面验证。其中最关键的一项硬指标:其「单位面积带宽」达到了100 GB/s/mm²。

这是一个足以让业界侧目的数字。在流式推理架构中,这一指标几乎可以直接映射为推理速度。

  • 对比传统架构:即使是顶级的HBM3e显存方案,其单位面积能提供的有效读取带宽也受限于显存控制器和物理封装。

  • 对比Groq:寒序在单位面积上提供了更高密度的权重存取能力,这意味着同样的芯片尺寸下,寒序能以更短的时间处理更多的权重参数。

在「得带宽者得天下」的推理赛道,这不仅是一个数据,更是一道分水岭。它使得大模型在高吞吐流式输出时,能够真正满足未来AI Agent对低延迟的苛刻要求。

终极杀招

「MRAM+SRAM」混合架构

Groq虽然快,但它有一个致命的弱点:存不下

Groq采用纯SRAM方案,虽然速度极致,但SRAM的密度极低。要运行一个70B规模的模型,往往需要数百张卡集群,其成本和功耗让许多中小企业望而却步。

寒序科技的野心不止于复刻Groq,而是要进化它。

据悉,寒序科技在即将流片的下一代芯片中,首创了「片上MRAM + SRAM」的混合存储架构。

  • SRAM(静态随机存储器)负责最高速的缓存与中间变量计算,保持极低延迟。

  • MRAM(磁性随机存储器)这种新型非易失性存储器拥有接近SRAM的速度,但密度却远高于SRAM,且功耗极低

这种「北大系」擅长的底层技术融合,让寒序在保持「确定性流式架构」优势的同时,大幅提升了单片的模型容量存储密度。其目标性能直指2000 Tokens/s的极限。

这是什么概念?

目前市面上最快的对话模型推理速度通常在30-50 Tokens/s。如果寒序的2000 Tokens/s方案量产,意味着:

  1. 具身智能:机器人可以在毫秒级完成视觉输入到动作指令的推理闭环。

  2. 实时同传:翻译将不再有「滞后感」,实现真正意义上的同步。

  3. 多智能体(小龙虾):复杂的智能体规划任务可以在瞬间完成多次自我博弈与修正。



北大基因与国产算力的新变量

资料显示,寒序科技成立于2023年8月,核心创始团队源自「北京大学磁学中心」。

这是一个典型的「科学家+工程师」组合。他们在底层新型存储器(MRAM)与存算架构融合领域,拥有深厚的学术积累和工程落地经验。这解释了为什么他们能驾驭这种极其考验硬件底层控制逻辑的异构设计。

有接近本轮融资的投资人对新智元表示:我们看好寒序,是因为他们没有在GPU的旧地图上寻找新大陆,而是直接重构了推理时代的『底层指令集』。

寒序选择在GTC 2026前夕释放融资与技术进展信息,显然有着更深层的考量。在算力霸权日益集中的今天,国内需要一种不依赖海外高端HBM供应、能够通过架构创新实现性能弯道超车的方案。



算力霸权的终局之战

回看GTC的历史,每一代架构都在定义一个时代:

  • 2017年,Volta GPU标志着训练时代的全面爆发;

  • 2022年,Hopper H100引入Transformer Engine,定鼎LLM基石;

  • 2026年,这场关于「推理」的战争,将决定AI能否真正走进各行各业。

英伟达虽然强大,但没有任何一个王朝能通过一种架构统治所有场景。在大模型从「博学」走向「行动(Agentic AI)」的过程中,对速度、能效比和实时性的要求,正在为像寒序科技这样的垂直创新者留出巨大的窗口。

寒序科技的这笔融资,只是一个开始。随着Agent系统、多模态模型和具身智能的爆发,AI不再只是单轮对话,而是需要持续的规划与环境反馈。

推理,才是AGI的「最后一公里」。

寒序科技已经在这一硬核战场上落下了关键的一子。

下周的圣何塞,老黄或许会拿出更强的Blackwell变体,但在大洋彼岸,国产算力的黑马们,正在用全新的架构逻辑,截击巨头的阳谋。

您认为在推理芯片赛道,国内企业通过「非通用架构」能否实现对NVIDIA的突围?欢迎在评论区留下您的洞见。

关于寒序科技:成立于2023年,致力于开发超大带宽、确定性流式大模型推理芯片,目前已完成四轮融资。其核心技术路径旨在解决大模型推理中的「内存墙」难题,为实时AI应用提供颠覆性基础设施。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
坐拥十余套豪宅家中名酒无数,被抓后直言:再找不到8分钱的美味

坐拥十余套豪宅家中名酒无数,被抓后直言:再找不到8分钱的美味

阿莱美食汇
2026-03-10 14:58:57
欧冠又看白对蓝!折损了一条中轴线的皇马,这次拿什么击败曼城?

欧冠又看白对蓝!折损了一条中轴线的皇马,这次拿什么击败曼城?

涛哥侃球
2026-03-10 15:54:20
搞笑图片第1148期:为什么老年人总能在网上买到我们想不到的东西

搞笑图片第1148期:为什么老年人总能在网上买到我们想不到的东西

今天的快乐
2026-03-01 21:03:56
国家发改委:将探索延长义务教育年限

国家发改委:将探索延长义务教育年限

极目新闻
2026-03-07 16:41:06
1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

哄动一时啊
2026-02-17 22:21:25
阿迪新鞋被吐槽“太阴间” 网友:“玫瑰花的葬礼”

阿迪新鞋被吐槽“太阴间” 网友:“玫瑰花的葬礼”

LOGO研究所
2026-03-10 13:00:41
多尔特向约基奇正式道歉:我不是故意打他脸 不觉得这是一级恶犯

多尔特向约基奇正式道歉:我不是故意打他脸 不觉得这是一级恶犯

罗说NBA
2026-03-10 14:21:50
中国最“闲”的3座机场:每天飞1趟航班,飞机一走员工就集体下班

中国最“闲”的3座机场:每天飞1趟航班,飞机一走员工就集体下班

青眼财经
2026-03-07 23:26:43
山东洗碗阿姨被辞退后续:带全家人大闹饭店,原因曝光,老板回应

山东洗碗阿姨被辞退后续:带全家人大闹饭店,原因曝光,老板回应

以茶带书
2026-03-10 14:25:59
华工科技股价创历史新高

华工科技股价创历史新高

证券时报
2026-03-10 15:43:18
谢贤前女友再曝猛料!相识第一天拒绝了两次谢贤,当时行情非常好

谢贤前女友再曝猛料!相识第一天拒绝了两次谢贤,当时行情非常好

念得小柔
2026-02-13 02:19:33
哈梅内伊次子当选伊朗最高领袖 特朗普威胁其“难长久” 以色列扬言要“追杀”

哈梅内伊次子当选伊朗最高领袖 特朗普威胁其“难长久” 以色列扬言要“追杀”

国际在线
2026-03-09 06:59:13
董明珠:提高农民养老金跟我给员工发奖金一样,加一点都是大支出

董明珠:提高农民养老金跟我给员工发奖金一样,加一点都是大支出

映射生活的身影
2026-03-10 02:44:16
见过日本人的驾照,才知道什么是牛鬼蛇神

见过日本人的驾照,才知道什么是牛鬼蛇神

不相及研究所
2026-03-07 22:04:00
8天6个涨停板!股民:被暴力洗盘给洗出去了!

8天6个涨停板!股民:被暴力洗盘给洗出去了!

数据挖掘分析
2026-03-10 15:14:24
印度在伊朗背后捅了一刀!战略机遇把握不住:伊朗那就有打不完的仗

印度在伊朗背后捅了一刀!战略机遇把握不住:伊朗那就有打不完的仗

星辰大海路上的种花家
2026-03-09 13:19:55
6点吃晚饭是错误的?医生建议:过了70岁,晚饭尽量要做到这6点

6点吃晚饭是错误的?医生建议:过了70岁,晚饭尽量要做到这6点

医学科普汇
2026-03-09 21:50:06
特朗普撂挑子不干了,以色列连俄大楼都敢炸,普京把话说得很清楚

特朗普撂挑子不干了,以色列连俄大楼都敢炸,普京把话说得很清楚

荷兰豆爱健康
2026-03-10 11:35:30
美国联邦航空管理局:捷蓝航空所有目的地航班均已停飞

美国联邦航空管理局:捷蓝航空所有目的地航班均已停飞

财联社
2026-03-10 12:50:05
你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

带你感受人间冷暖
2026-01-21 00:15:05
2026-03-10 16:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14685文章数 66674关注度
往期回顾 全部

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

头条要闻

特朗普称已考虑接替穆杰塔巴的人选 外交部表态

头条要闻

特朗普称已考虑接替穆杰塔巴的人选 外交部表态

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

肖战首夺SMG视帝,孙俪四封视后创历史

财经要闻

全民"养龙虾"背后 第一批受害者浮现

汽车要闻

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

态度原创

数码
房产
本地
公开课
军事航空

数码要闻

QNAP威联通推出TS-h1077AFU:10×SATA盘位1U全闪NAS

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

本地新闻

云游中国|候鸟高颜值亮相!沉浸式打卡青海湿地

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

刚说完战争很快结束 特朗普改口

无障碍浏览 进入关怀版