网易首页 > 网易号 > 正文 申请入驻

1.5T内存挑战英伟达!8芯撑起3个GPT-4,来自华人AI芯片独角兽

0
分享至

梦晨 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。

8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍)。

这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——

型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。

CEORodrigo Liang表示,当前行业标准做法下运行万亿参数大模型需要数百枚芯片,我们的方法使总拥有成本只有标准方法的1/25

SambaNova目前估值50亿美元(约365亿人民币),累计完成了6轮总计11亿美元的融资,投资方包括英特尔、软银、三星、GV等。

他们不仅在芯片上要挑战英伟达,业务模式上也说要比英伟达走的更远:直接参与帮助企业训练私有大模型。

目标客户上野心更是很大:瞄准世界上最大的2000家企业。

1.5TB内存的AI芯片

最新产品SN40L,由台积电5纳米工艺制造,包含1020亿晶体管,峰值速度638TeraFLOPS。

与英伟达等其他AI芯片更大的不同在于新的三层Dataflow内存系统

  • 520MB片上SRAM内存
  • 65GB的高带宽HBM3内存
  • 以及高达1.5TB的外部DRAM内存

与主要竞品相比,英伟达H100最高拥有80GB HBM3内存,AMD MI300拥有192GB HBM3内存。

SN40L的高带宽HBM3内存实际比前两者小,更多依靠大容量DRAM。

Rodrigo Liang表示,虽然DRAM速度更慢,但专用的软件编译器可以智能地分配三个内存层之间的负载,还允许编译器将8个芯片视为单个系统。

除了硬件指标,SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速

他们认为大模型中许多权重设置为0,像其他数据一样去执行操作很浪费。

他们找到一种软件层面的加速办法,与调度和数据传输有关,但没有透露细节,“我们还没准备好向公布是如何做到这一点的”。

咨询机构Gartner的分析师Chirag Dekate认为,SN40L的一个可能优势在于多模态AI

GPU的架构非常严格,面对图像、视频、文本等多样数据时可能不够灵活,而SambaNova可以调整硬件来满足工作负载的要求。

目前,SambaNova的芯片和系统已获得不少大型客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。

业务模式也比较特别,芯片不单卖,而是出售其定制技术堆栈,从芯片到服务器系统,甚至包括部署大模型。

为此,他们与TogetherML联合开发了BloomChat,一个1760亿参数的多语言聊天大模型。

BloomChat建立在BigScience组织的开源大模型Bloom之上,并在来自OpenChatKit、Dolly 2.0和OASST1的OIG上进行了微调。

训练过程中,它使用了SambaNova独特的可重配置数据流架构,然后在SambaNova DataScale系统进行训练。

这也是这家公司最大被投资者热捧之外的最大争议点之一,很多人不看好一家公司既做芯片又做大模型。

给每家大企业打造150个大模型

在与The Next Platform网站交流时,CEO Rodrigo Liang表示:

用于大模型训练的公开数据已快耗尽,但对参数数量的追求还在不断增加。
各种大模型的性能相差只有几个百分点,这不是大家应该玩的游戏。

他认为大模型与生成式AI商业化的下一个战场是企业的私有数据,尤其是大企业。

这些企业坐拥大量的数据,但自己不知道其中大部分内容是什么。

对于企业私有大模型的形态,SambaNova也有与众不同的观点。

他们认为最终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型,而是根据不同数据子集创建150个独特的模型,聚合参数超过万亿

相当于把GPT-4等大模型内部的Mixture of Experts(专家混合)架构扩展到整个系统,称为Composition of Experts(专家合成)。

在企业运转的每个节点运行一个完整且经过专门调整的基础模型,分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库、客户支持语料库等等不同数据训练。

这些专家模型之间通过一种软件路由或负载平衡器联在一起,收到推理请求后决定具体向哪个模型推送提示词。

这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比,巨头大多希望创建一个能泛化到数百万个任务的巨型模型。

分析师认为技术上可能谷歌的做法性能更强,但SambaNova的方法对企业来说更实用。

没有任何一个模型或人能完整访问企业的所有数据,限制每个部门能访问的专家模型,就能限制他们能访问的数据。
斯坦福系芯片公司,华人工程师主力

SambaNova成立于2017年,2020年之前都比较低调。

联创3人都是斯坦福背景,连产品系列名Cardinal(深红色)都是斯坦福的昵称与代表颜色。

CEO Rodrigo Liang是前Sun/甲骨文工程副总裁,也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue(深蓝)。

另外两位联合创始人都是斯坦福教授。

CTOKunle Olukotun是电气工程教授,因多核芯片架构方面的研究而闻名,开发了首批支持线程级推测 (TLS) 的芯片之一。

Christopher Ré是计算机科学副教授,重点研究方向机器学习和数据分析的速度和可扩展性。

此外团队中还有不少华人工程师。

从官网公开信息来看,SambaNova的领导团队中,至少有3名华人。

Jonathan Chang,拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。

他在构建高增长方面拥有20多年的经验。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁,监督了数十个行业的企业硬件和软件产品的上市。

Penny Li,在EDA工具和微处理器设计方面拥有超过27年的经验。此前,她曾在IBM和甲骨文工作过。

如果去领英搜索还能发现更多华人团队成员。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定价没有公开。

根据Rodrigo Liang的说法,8个SN40L组成的集群总共可处理5万亿参数,相当于70个700亿参数大模型。

全球2000强的企业只需购买两个这样的8芯片集群,就能满足所有大模型需求。

参考链接:
[1]https://spectrum.ieee.org/ai-chip-sambanova
[2]https://www.nextplatform.com/2023/09/20/sambanova-tackles-generative-ai-with-new-chip-and-new-approach/
[3]https://sambanova.ai/resources/##

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
79岁佛爷连任后烧起第1把火:要求欧足联剥夺巴萨长达20年的冠军

79岁佛爷连任后烧起第1把火:要求欧足联剥夺巴萨长达20年的冠军

风过乡
2026-06-08 20:03:20
惨!纸包不住火,美国航母也不行

惨!纸包不住火,美国航母也不行

枢密院十号
2026-06-08 21:49:21
新华视点丨2026高考作文“上新”,折射语文教育哪些新趋势

新华视点丨2026高考作文“上新”,折射语文教育哪些新趋势

澎湃新闻
2026-06-08 02:34:09
泽连斯基宣布:由于俄方拒绝谈判,将对俄全境展开猛烈打击

泽连斯基宣布:由于俄方拒绝谈判,将对俄全境展开猛烈打击

史政先锋
2026-06-08 12:07:40
女子痴迷裸聊,情夫看她和网友的裸聊经过,2012年将她杀死并抛尸

女子痴迷裸聊,情夫看她和网友的裸聊经过,2012年将她杀死并抛尸

汉史趣闻
2026-06-06 14:50:38
泽连斯基给某人的公开信(全文)

泽连斯基给某人的公开信(全文)

金召点评
2026-06-08 14:00:34
2010年,俄罗斯超级富二代当街暴打普京女婿,被捕后几乎家破人亡

2010年,俄罗斯超级富二代当街暴打普京女婿,被捕后几乎家破人亡

禾所思
2024-10-22 15:23:53
王炸!涉及1.5万人搬迁、总投资772亿元,湖北世界级巨无霸超级工程来了!

王炸!涉及1.5万人搬迁、总投资772亿元,湖北世界级巨无霸超级工程来了!

越乔
2026-06-08 22:40:30
0-11!国乒 19 岁女单小将被张本美和打爆,粉丝无语提前离场

0-11!国乒 19 岁女单小将被张本美和打爆,粉丝无语提前离场

酷侃体坛
2026-06-08 21:25:54
化工专业真有这么恐怖?网传中南大化工33人走了3人,6人确诊癌症

化工专业真有这么恐怖?网传中南大化工33人走了3人,6人确诊癌症

慧翔百科
2026-06-08 11:28:13
连续一轮游!郑钦文伦敦站0-2输克里斯蒂安 跌至世界第158名

连续一轮游!郑钦文伦敦站0-2输克里斯蒂安 跌至世界第158名

醉卧浮生
2026-06-09 02:15:34
报复升级!有人公开煽动“搞垮中餐馆”:下巨额订单、永远别去取

报复升级!有人公开煽动“搞垮中餐馆”:下巨额订单、永远别去取

大洛杉矶LA
2026-06-08 07:16:19
演员杨雪回应结婚原因:恋爱期间,丈夫拿出全部存款替自己母亲还贷;其丈夫系知名美术指导,代表作有《大明王朝1566》《你好,李焕英》等

演员杨雪回应结婚原因:恋爱期间,丈夫拿出全部存款替自己母亲还贷;其丈夫系知名美术指导,代表作有《大明王朝1566》《你好,李焕英》等

台州交通广播
2026-06-08 21:17:47
女子向精神医生诉苦,两次“被精神病”收治累计161天,司法鉴定为完全民事行为能力人,仍难摘掉“精神病”帽子

女子向精神医生诉苦,两次“被精神病”收治累计161天,司法鉴定为完全民事行为能力人,仍难摘掉“精神病”帽子

大风新闻
2026-06-08 17:17:09
iPhone天气显示杭州临安下周气温53℃、48℃,官方通报:系该品牌手机天气APP自身数据错误所致,依据权威预报6月15日最高气温预报实为32℃

iPhone天气显示杭州临安下周气温53℃、48℃,官方通报:系该品牌手机天气APP自身数据错误所致,依据权威预报6月15日最高气温预报实为32℃

极目新闻
2026-06-08 11:02:22
这才是中方在这个节骨眼访问朝鲜的真正原因!

这才是中方在这个节骨眼访问朝鲜的真正原因!

李荣茂
2026-06-08 18:32:34
扬州回应“央视曝光回收料牙刷”:依法从严从快作出处理

扬州回应“央视曝光回收料牙刷”:依法从严从快作出处理

澎湃新闻
2026-06-08 10:24:26
菲律宾强震背后:中国态度变了,这才是大国该有的清醒

菲律宾强震背后:中国态度变了,这才是大国该有的清醒

阿振观点
2026-06-08 18:55:56
2026年,1270万毕业生,许多家庭的天塌了

2026年,1270万毕业生,许多家庭的天塌了

猫叔东山再起
2026-06-07 10:20:07
多所大学明确:不招复读生

多所大学明确:不招复读生

麦可思研究
2026-06-08 11:36:49
2026-06-09 04:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12761文章数 176488关注度
往期回顾 全部

科技要闻

干掉聊天框,ChatGPT不只回答,还要办事

头条要闻

女主播拒绝男子追求被快递包裹炸伤 当事人最新发声

头条要闻

女主播拒绝男子追求被快递包裹炸伤 当事人最新发声

体育要闻

2026年世界杯?到底会是什么样?

娱乐要闻

越扒越有!奔跑吧文旅合作费近两千万

财经要闻

华润万家蜜薯被检查农药超标

汽车要闻

从真实事故场景出发 吉利银河星舰7 EV硬核安全“超纲”了

态度原创

亲子
教育
本地
健康
公开课

亲子要闻

1岁5个月人类幼崽收到新鞋子,跟妈妈说“谢谢”,十分可爱!#睡个好觉

教育要闻

高考数学的精明账:放弃压轴题!20分钟换12分,不如盯死前面题目

本地新闻

用杨柳青年画的方式,打开天津

干细胞新规落地,打干细胞更容易还是更难了?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版