网易首页 > 网易号 > 正文 申请入驻

Tensordyne宣称新AI芯片性能大幅超越英伟达

0
分享至


据模拟测试显示,初创公司Tensordyne研发的新型AI芯片在推理任务的能耗效率与响应延迟方面,可能大幅领先市场龙头英伟达。该公司已完成首款芯片的流片送样,搭载72颗芯片的整机系统预计于2027年下半年正式开售。Tensordyne宣称,其72芯片系统运行大型大语言模型的速度是72颗英伟达GB300系统的4倍,功耗却仅为后者的五分之一。不过,这些数据要等到年底真实系统上线后才能得到验证。

Tensordyne新芯片Napier实现超高能效的核心秘诀,在于其执行AI核心运算——矩阵乘法的独特方式。该方案利用了对数运算的一个基本性质:log(A×B) = log(A) + log(B)。

"我们把乘法器变成了加法器,"Tensordyne联合创始人兼AI副总裁吉勒斯·巴克胡斯解释道。他表示,加法器比乘法器体积更小、能耗更低,因此Napier芯片能够在更小的面积内集成更强的算力,同时还能降低功耗。

这一思路在学界早已为人所知,但长期以来缺乏实用化的方法,因为在对数数值与描述神经网络的浮点数之间相互转换,不仅耗时耗能,还会引入过多误差。而巴克胡斯表示,这一难题现已迎刃而解。

"迄今为止,还没有人能像我们这样实现线性与对数之间的相互转换,这正是整件事的关键所在。我们的工程师找到了一种在硅芯片上极为优雅、精确且低成本的实现方式。"

数字格式的重要性早已引起AI行业的关注。英伟达首席科学家比尔·达利在2023年IEEE Hot Chips大会上发言时指出,当时英伟达GPU性能提升的主要驱动力,正是采用了更短的数字格式及其所需的更小电路。研究人员也在探索类对数格式(如posit)及其科学计算版本takum的计算电路,但由于其硬件实现与传统浮点运算差异较大,这些格式至今未能进入主流应用。

随着AI智能体的兴起,推理——即神经网络模型的执行——正变得比训练新大语言模型更为重要。成本与响应速度开始成为主导因素,这促使AI公司寻找更适合推理场景的系统架构。Tensordyne管理层表示,他们对这一趋势早有预判,并据此进行了针对性的系统设计。

执行大语言模型主要分为两个阶段:预填充(prefill)和解码(decode)。预填充阶段,模型将输入文本转化为Token,并构建一种称为键值缓存的工作记忆,这是一项计算密集型任务。解码阶段,大语言模型根据上一个Token及键值缓存逐步生成输出Token,这一顺序生成的特性使解码过程相对较慢,且对内存与网络延迟的依赖程度高于算力。

为此,AI芯片厂商开始针对这两种不同需求设计系统。英伟达推出了一种方案:用满载B300 GPU的服务器机架处理预填充,再用多个搭载Groq 3处理器的机架负责解码。亚马逊云服务则将自研Trainium AI芯片机架用于预填充,并结合多个Cerebras晶圆级计算机机架完成解码。

Tensordyne表示,其系统可同时胜任两项任务。"我们同时在攻克两个艰难的挑战,"Tensordyne首席产品官兼联合创始人R.K.阿南德说,"我们是第一家证明无需依赖多个供应商和多个机架就能同时完成两项任务的公司。"

预填充所需的密集算力来源于对数运算;解码所需的能力则依托144GB高带宽内存,以及一套延迟仅1微秒的自研互联网络——Tensordyne Napier Link。

在一个占用标准机架四分之一空间的"pod"系统中,Tensordyne集成了72颗Napier芯片、8颗英特尔至强CPU以及64TB固态存储。据该公司称,四个pod组成的完整机架在处理2万亿参数大语言模型时,每用户每秒可输出1300个Token,每百万Token的成本约为11美元,功耗为120千瓦,其中一个pod负责预填充,三个pod负责解码。相比之下,若要实现相近的每用户每秒Token数,九机架规模的Rubin与Groq 3组合系统功耗预计将高达1.5兆瓦。

上述数据是否真实可靠,有待年内进一步验证。Tensordyne计划通过云端提供测试版本,供客户提前体验,并预计在约一年后开始向客户批量交付系统。

Q&A

Q1:Tensordyne的Napier芯片是如何实现高能效的?

A:Napier芯片的核心创新在于利用对数运算代替传统矩阵乘法。由于log(A×B)=log(A)+log(B),乘法可以转换为加法运算,而加法器比乘法器体积更小、能耗更低。这使得Napier能在更小面积内集成更强算力,同时大幅降低功耗。Tensordyne表示,其工程师攻克了长期以来线性与对数数值相互转换精度差、效率低的难题,实现了在硅芯片上的高精度、低成本转换。

Q2:Tensordyne的72芯片系统和英伟达系统相比,性能差距有多大?

A:根据Tensordyne的模拟数据,其72芯片系统运行大型大语言模型的速度是同等规模英伟达GB300系统的4倍,功耗仅为后者的五分之一。在处理2万亿参数大语言模型时,四pod机架可实现每用户每秒1300个Token,功耗120千瓦,每百万Token成本约11美元;而实现相近性能的英伟达Rubin与Groq 3九机架系统,预计功耗高达1.5兆瓦。不过,这些数据目前仍来自模拟测试,需等真实系统上线后才能得到验证。

Q3:Tensordyne的系统何时可以商用?普通客户如何体验?

A:Tensordyne计划于2027年下半年正式开售搭载72颗Napier芯片的商用系统。在此之前,该公司预计将在约一年内开始向客户批量发货,并计划先通过云端提供测试版本,让客户提前上手体验和评估。目前,首款芯片已完成流片送样,正处于研发验证阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
荷兰出局众生相!韦霍斯特趴地懊恼,萨默维尔痛哭,科曼安慰球员

荷兰出局众生相!韦霍斯特趴地懊恼,萨默维尔痛哭,科曼安慰球员

橙汁的味道123
2026-06-30 12:22:08
强拆华为设备,德国铁路大瘫痪,德高管低头认错,任正非预言成真

强拆华为设备,德国铁路大瘫痪,德高管低头认错,任正非预言成真

无心小姐姐
2026-06-30 00:50:31
随着德国4-5巴拉圭,世界杯16强已出3席,欧洲0队,巴西绝杀日本

随着德国4-5巴拉圭,世界杯16强已出3席,欧洲0队,巴西绝杀日本

侃球熊弟
2026-06-30 07:30:21
没钱了?西蒙斯重返NBA!主动示好热火队

没钱了?西蒙斯重返NBA!主动示好热火队

篮球教学论坛
2026-06-30 12:55:37
630G 机密外泄iPhone18 全套图纸从印度代工厂流出,苹果底牌全曝光

630G 机密外泄iPhone18 全套图纸从印度代工厂流出,苹果底牌全曝光

小兔子发现大事情
2026-06-30 00:34:50
4次助攻第1!巴西28岁中场大师崛起:追平济科,辅佐维尼修斯冲冠

4次助攻第1!巴西28岁中场大师崛起:追平济科,辅佐维尼修斯冲冠

李喜林篮球绝杀
2026-06-30 11:52:23
大放厥词,却惨遭三连败!这次,郑钦文终于为自己的狂妄付出代价

大放厥词,却惨遭三连败!这次,郑钦文终于为自己的狂妄付出代价

一窥究竟
2026-06-30 11:44:39
黄仁勋为什么不带着芯片回中国做贡献?网友一语道破天机

黄仁勋为什么不带着芯片回中国做贡献?网友一语道破天机

三言四拍
2025-07-28 09:11:52
广州珠江新城发生一起高坠事故,1人死亡,调查报告公布

广州珠江新城发生一起高坠事故,1人死亡,调查报告公布

南方都市报
2026-06-30 12:07:33
物色妇女荒地施暴泄欲,三年奸杀24人,恶魔鞋匠吴建臣落网纪实

物色妇女荒地施暴泄欲,三年奸杀24人,恶魔鞋匠吴建臣落网纪实

易玄
2026-06-29 22:55:53
1950 年,四川地主拿出朱德欠条,朱总司令:马上把他接到北京来

1950 年,四川地主拿出朱德欠条,朱总司令:马上把他接到北京来

纪实文录
2025-06-21 14:47:10
佩泽希齐扬:伊朗在卡塔尔被冻结的120亿美元资产中,将有60亿美元解冻并还给伊朗

佩泽希齐扬:伊朗在卡塔尔被冻结的120亿美元资产中,将有60亿美元解冻并还给伊朗

政知新媒体
2026-06-29 17:19:12
原来他是迟蓬的丈夫,是我们熟悉的资深大导演,公公是电影明星

原来他是迟蓬的丈夫,是我们熟悉的资深大导演,公公是电影明星

仙味少女心
2026-06-29 12:37:47
张大千为何至死也不回大陆?

张大千为何至死也不回大陆?

花开无田
2026-06-28 19:25:06
残酷3-2!摩洛哥逆天改命跻身16强,荷兰队再次倒在点球大战

残酷3-2!摩洛哥逆天改命跻身16强,荷兰队再次倒在点球大战

全景体育V
2026-06-30 11:57:02
本田圭佑:巴西最可怕的是让你觉得自己能行,结果他们进球了

本田圭佑:巴西最可怕的是让你觉得自己能行,结果他们进球了

懂球帝
2026-06-29 23:16:13
《棕色尘埃2》线下活动 人气角色硅胶仿真翘臀随便摸!

《棕色尘埃2》线下活动 人气角色硅胶仿真翘臀随便摸!

3DM游戏
2026-06-29 09:31:13
如果没有安切洛蒂巴西恐被爆冷,针对性战术+神级换人拿捏住日本

如果没有安切洛蒂巴西恐被爆冷,针对性战术+神级换人拿捏住日本

杨华评论
2026-06-30 04:06:37
“中国为什么不踢世界杯?”外国网友的答案,让中国球迷沉默了

“中国为什么不踢世界杯?”外国网友的答案,让中国球迷沉默了

留学生日报
2026-06-30 09:11:23
大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

户外阿毽
2026-06-29 18:29:28
2026-06-30 13:44:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19706文章数 49712关注度
往期回顾 全部

科技要闻

DeepSeek V4正式版要来 高峰期API价格翻倍

头条要闻

荷兰队连续3届倒在点球大战 此前9次点球大战只赢两场

头条要闻

荷兰队连续3届倒在点球大战 此前9次点球大战只赢两场

体育要闻

德国足球,脸都不要了

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

本地
旅游
健康
数码
公开课

本地新闻

贵州小城的新目标:举办“村超”世界杯!

旅游要闻

自贡富顺:白日繁华铺锦绣 夜色灯火暖人心

狂吃“糯叽叽”小心肠梗阻!

数码要闻

内存涨价到头了?20年前的DDR1被迫“复工”,还真能跑Win11

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版