网易首页 > 网易号 > 正文 申请入驻

又一大算力AI芯片发布!比B200快3倍,刚融资24亿元

0
分享至


芯东西(公众号:aichip001)
作者 ZeR0
编辑 漠影

芯东西2月25日报道,2月24日,英特尔宣布向美国AI芯片独角兽SambaNova的超过3.5亿美元(约合人民币24亿元)E轮战略融资注资,具体金额未披露。

同时,SambaNova推出其第五代AI芯片SN50,号称这是“唯一一款能够提供智能体AI所需速度和吞吐量的芯片”,最高速度达同类芯片的5倍,经多芯互连可支持的单模型参数规模达10万亿、上下文长度达1000万个token


据SambaNova披露,与Blackwell B200 GPU相比,SN50的最大速度是其5倍,智能体推理的吞吐量是其3倍以上,这在Meta的Llama 3.3 70B等一系列模型上得到充分体现。


据外媒报道,在此之前,英特尔曾讨论过以约16亿美元(约合人民币110亿元)收购SambaNova,但谈判最终破裂。不过双方均未回应过此事。

SambaNova由多位斯坦福大学教授在2017年创立,在2021年融资后估值达到50亿美元(约合人民币344亿元)。其董事长是英特尔CEO陈立武。英特尔曾多次投资SambaNova。


在最新公告中,SambaNova与英特尔宣布达成了一项多年战略合作计划,旨在提供高性能、高性价比的AI推理解决方案,打造下一代异构AI数据中心,整合英特尔至强处理器、英特尔GPU、英特尔网络和存储及SambaNova系统,以释放数十亿美元的推理市场机遇。

消息公布后,英特尔在美东时间周二股价涨超5%。

一、5倍算力、4倍网络带宽,能支撑10万亿参数大模型

SN50芯片基于SambaNova的可重构数据流单元(RDU)架构,超低延迟可提供实时响应,能支持数千个并发AI会话,并通过更高的硬件利用率降低了每个token的成本。

每块芯片的算力提高到第四代SN40L的5倍,网络带宽提高至4倍

SambaRack SN50将16块SN50芯片组合在一起,可运行多达10万亿个参数1000万个token的超大模型。


互连的SambaRack可通过每秒数TB的互连速度连接多达256块芯片,从而缩短首次token生成时间,并支持更大的批处理规模,因此可以部署具有更高吞吐量和响应速度的模型。

SambaRack的功耗平均仅需20kW,可在现有的风冷数据中心中运行。这为运行gpt-oss等模型的推理服务提供商带来了总拥有成本(TCO)优势,其节能效果是B200 GPU的8倍


SN50将于2026年下半年开始发货。软银集团将成为首家在日本下一代AI数据中心部署SN50的客户。


二、基于数据流、三层内存架构,跑大模型时更快更高能效

SambaNova团队认为,智能体需要智能、预测性和弹性的基础架构,要实现可行智能体,硬件必须能够即时适应突发性工作负载,在专家模型之间无延迟切换。


GPU擅长AI模型训练,但AI推理是数据移动和内存优化方面的挑战,需要不同的架构方法。

为了执行AI推理,GPU必须多次冗余地调用片外内存,每次内存调用都会增加处理延迟并消耗能量,会导致高功耗问题。

在GPU上部署多个模型的标准方法是将模型加载到高带宽内存(HBM)中,但GPU HBM资源稀缺且成本高昂。

当工作负载需要一个未加载的模型时,系统必须卸载当前模型并获取新模型,这个过程通常以秒为单位。即便使用vLLM的1级睡眠模式,唤醒一个小型模型也需要0.1到0.8秒。

对于智能体所需的大型推理模型而言,这种唤醒时间会造成3到6秒的延迟。对于执行涉及5个不同模型的10步推理过程的AI智能体来说,这些延迟累积起来会达到30秒,导致实时智能体工作流程无法使用。

SambaNova的RDU正是为解决这一问题而设计的。

RDU将给定AI模型的计算图映射到处理器上数据传输的最有效路径。这种方法消除了冗余的内存调用,可显著降低延迟和功耗。


与受限于单卡HBM容量的GPU不同,SN50 RDU采用独特的三层内存架构,结合了片上SRAM、海量HBM和超高速SRAM

这种分层结构使芯片能承载最大的模型,支持在毫秒级时间内运行和切换多个模型。

此外,借助SN50,输入token可缓存在内存中,从而减少预填充处理时间和请求的首token获取时间(TTFT)。


结合这些优势,其内存架构非常适合作为智能体的缓存,能够更高效地处理任务。

SambaNova还在SambaStack上推出了由RDU支持的可配置模型包,与传统的GPU架构和vLLM等推理框架相比,这些模型包的切换速度更快。

三、与英特尔联手,加速推出AI云平台

作为多年战略合作的一部分,英特尔计划对SambaNova进行战略投资,以加速推出基于英特尔技术的AI云平台。

此次合作预计将涵盖三个关键领域:

(1)AI云扩展:SambaNova正在扩展其垂直整合的AI云平台,该平台基于英特尔至强处理器构建,并针对大语言模型和多模态模型进行了优化。该平台将提供低延迟、高吞吐量的AI服务,并由参考架构、部署蓝图以及与系统集成商和软件供应商的合作关系提供支持。

(2)集成AI基础设施:将SambaNova的系统与英特尔的CPU、加速器和网络技术相结合,为推理、代码生成、多模态应用和智能体工作流提供可扩展的、可用于生产的推理能力。

(3)市场推广执行:通过英特尔的全球企业、云和合作伙伴渠道进行联合销售和联合营销,以加速AI生态系统的普及。

据英特尔披露,此次合作是对英特尔现有数据中心GPU投入的补充,并不会改变其在AI领域的竞争战略,英特尔将继续加大对GPU知识产权、架构、产品、软件和系统的投资,并强化其从边缘到云端AI战略路线图。

结语:AI推理市场迎来新组合

随着AI推理蓬勃发展,科技公司们都在寻求更高速度和效率、更低企业级AI部署成本的AI硬件基础设施方案。

许多云端AI芯片创企都将自家产品的卖点放在了高能效上,既顺应AI推理需求旺盛的趋势,又能避开英伟达强于AI训练的锋芒。

通过合作,SambaNova可以借助英特尔的全球影响力扩大其AI处理器的规模,英特尔也增强了在AI推理领域的综合实力。这将为日趋多元化的AI推理市场提供一个有竞争力的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
星链大降价!马斯克:无关竞争对手 我只想平价服务大众

星链大降价!马斯克:无关竞争对手 我只想平价服务大众

快科技
2026-02-25 10:33:12
别再吹天生混血脸了,谷爱凌那一头标志性的金发藏不住天然的黑发

别再吹天生混血脸了,谷爱凌那一头标志性的金发藏不住天然的黑发

西楼知趣杂谈
2026-02-24 16:14:33
2450元降至118元!春节假期过后,有潮汕酒店价格大降95%

2450元降至118元!春节假期过后,有潮汕酒店价格大降95%

第一财经资讯
2026-02-24 20:41:17
战争风险不断升高!美军重兵集结中东,“数十年来最大规模”

战争风险不断升高!美军重兵集结中东,“数十年来最大规模”

环球网资讯
2026-02-25 06:53:10
3亿烟民都供不起了?亏损原因是?有员工10年公积金高达96万?

3亿烟民都供不起了?亏损原因是?有员工10年公积金高达96万?

猫叔东山再起
2026-02-25 12:20:03
60度电池、油箱50L,“哪哪都大”的新能源车,是不是工业鸡肋?

60度电池、油箱50L,“哪哪都大”的新能源车,是不是工业鸡肋?

少数派报告Report
2026-02-25 07:49:41
痛心!江西跑友刘涛去世,仅51岁,生前坚持晨跑,是3家公司老板

痛心!江西跑友刘涛去世,仅51岁,生前坚持晨跑,是3家公司老板

离离言几许
2026-02-25 10:43:45
平顶山夫妻打人事件:共殴打4人。先殴打三位路人,发现打错人后又殴打15岁女孩。

平顶山夫妻打人事件:共殴打4人。先殴打三位路人,发现打错人后又殴打15岁女孩。

贴小君
2026-02-25 16:52:25
冲上热搜!中秋请3天假堪比春节,13天超长假期!最实用拼假攻略已备好

冲上热搜!中秋请3天假堪比春节,13天超长假期!最实用拼假攻略已备好

上观新闻
2026-02-25 14:08:57
贝加尔湖事故中溺亡的7名国人,很大可能连赔偿都拿不到

贝加尔湖事故中溺亡的7名国人,很大可能连赔偿都拿不到

律法刑道
2026-02-25 12:16:48
连霍高速交警硬核喊话:速度提不起来就给我去慢车道!

连霍高速交警硬核喊话:速度提不起来就给我去慢车道!

闪电新闻
2026-02-24 15:52:12
全网好奇,谷爱凌嘴里咬的东西是啥?

全网好奇,谷爱凌嘴里咬的东西是啥?

有意思报告
2026-02-25 12:25:30
107票赞成,12票反对,联大通过决议呼吁俄乌立即停火!俄方反对,中美投弃权票!俄军全线进攻,泽连斯基发声,乌方公布对俄作战3大目标

107票赞成,12票反对,联大通过决议呼吁俄乌立即停火!俄方反对,中美投弃权票!俄军全线进攻,泽连斯基发声,乌方公布对俄作战3大目标

每日经济新闻
2026-02-25 13:01:16
外国人对中国国土面积有啥误解?网友:梵蒂冈,就故宫一半大点

外国人对中国国土面积有啥误解?网友:梵蒂冈,就故宫一半大点

带你感受人间冷暖
2026-02-25 00:10:12
傅彪儿子近照曝光!过年和张一山聚餐,生活奢华难掩35岁满头白发

傅彪儿子近照曝光!过年和张一山聚餐,生活奢华难掩35岁满头白发

离离言几许
2026-02-24 10:04:27
恐怖! 华人富商被女子约会引诱 惨遭绑架撕票埋尸荒野! 人财两失

恐怖! 华人富商被女子约会引诱 惨遭绑架撕票埋尸荒野! 人财两失

北国向锡安
2026-02-25 09:32:28
索赔超80亿美元,李嘉诚出手了!

索赔超80亿美元,李嘉诚出手了!

财经三分钟pro
2026-02-25 12:27:12
同家族近20人在路上祭祖遇车祸,致2死多伤后又遇理赔难,多方回应

同家族近20人在路上祭祖遇车祸,致2死多伤后又遇理赔难,多方回应

大风新闻
2026-02-25 17:00:14
崩了,江苏某光伏公司终止全部业务,全员被遣散!

崩了,江苏某光伏公司终止全部业务,全员被遣散!

黯泉
2026-02-24 22:41:15
秦皇岛发生当街杀人恶性事件,疑因情感纠纷,撞停车辆后钝器锤头

秦皇岛发生当街杀人恶性事件,疑因情感纠纷,撞停车辆后钝器锤头

爆角追踪
2026-02-25 19:24:37
2026-02-25 19:51:00
芯东西 incentive-icons
芯东西
专注AI芯片、半导体产业媒体
2208文章数 8150关注度
往期回顾 全部

财经要闻

上海楼市放大招,地产预期别太大

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

科技要闻

“机器人只跳舞,没什么用”

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

家居
游戏
健康
旅游
公开课

家居要闻

艺居办公 温度与效率

《Reloadian》正式亮相Steam新品试玩节

转头就晕的耳石症,能开车上班吗?

旅游要闻

马年首艘国际访问港邮轮抵沪 外籍旅客比例超95%

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版