网易首页 > 网易号 > 正文 申请入驻

24人团队硬刚英伟达!AMD前高管梦之队出手,新芯片每秒17000个token

0
分享至

造芯片的还有高手?

刚刚推出的一款最新芯片,直接冲上硅谷热榜。

峰值推理速度高达每秒17000个token

什么概念呢?当前公认最强的Cerebras,速度约为2000 token/s。

速度直接快10倍,同时成本骤减20倍、功耗降低10倍。

这就意味着,LLM真正来到了亚毫秒级的即时响应速度。实机效果be like:

但这块一夜之间刷屏硅谷的芯片,并非出自英伟达、AMD之手,而是一家成立仅两年、团队仅有24人的初创公司——Taalas。


芯片代号HC1,也是公司的首款产品。

不同于所有竞争对手,Taalas选择了迄今为止最极端的技术方案——

模型不再加载到内存里,而是直接刻在硅片上。换言之,芯片即模型。

结果显而易见,Taalas撬动了芯片算力护城河:H100买不到,试试HC1又何妨?

速度快10倍,功耗降至10分之一

HC1目前搭载Llama 3.1 8B模型,用户每秒最高可生成17000 token/s,远高于主流GPU/ASIC。


其中,在同一模型下Cerebras接近每秒2000个token,SambaNova约为每秒900个token,Groq约为每秒600个,英伟达Blackwell架构的B200为每秒350个。

具体来说,HC1采用台积电N6工艺,面积为815mm²,体积小巧而且开源,单颗芯片即可满足8B模型需求。

每颗芯片典型功耗仅为250W,一个服务器如果同时装配10颗HC1,功耗也才2.5kW,可以直接使用常规空气冷却机架部署。

那么是如何做到这么大的性能飞跃的呢?

首先HC1借鉴了2000年代初期的结构化ASIC芯片理念。结构化ASIC芯片采用门阵列和固化IP,然后仅通过改变互连层就能使芯片适应特定的工作负载。

这样下来,结构化ASIC芯片不仅比全定制ASIC更便宜,也比FPGA性能更优。


HC1则采用类似思路,不改变底层电路,只通过调整两层掩模,就能低成本快速做出专用AI推理芯片。

它放弃了大多数可编程功能,将模型连同权重一起通过基于掩模ROM的调用架构存储在芯片上,并保留一个可编程SRAM,用于保存微调后的权重(如LoRA)和KV缓存。其余则全部通过掩模ROM固化执行。

这一策略能在设计成本相对可控的前提下,实现模型到芯片的快速转化,将芯片生产周期从原先的六个月缩短到两个月。

而如此激进的量化方式势必会影响性能,研究团队也意识到了这一点,所以可以通过LaRA适配器进行重新训练,以及可配置的上下文窗口,让芯片的最低限度灵活性得以保留。

换句话说,就是将一个完整大模型通过物理硬连线进芯片中,省去了传统存算分离的成本,用灵活性换取极致的速度和效率。


除了Llama 3.1,Taalas也尝试将其它模型集成到HC1上,例如对DeepSeekR1-671B的多芯片解决方案。

将SRAM部分拆分到单独的芯片上,然后可以将每片HC1的存储密度提高到约20位参数,总计需要30个定制HC1。

整体处理速度可达到每用户每秒12000个token,如果考虑到30颗芯片成本为每百万token是7.6美分,那么该方案成本也不到同等吞吐量的GPU方案的一半。

假设GPU更新周期为四年,而HC1每年都需要重新更换,总成本也仍然具备优势。

AMD前高管梦之队

其背后的公司Taalas成立于两年前,由AMD前集成电路设计总监Ljubiša Bajić、AMD/ATI/Altera前技术经理和工程师Leila Bajić、AMD前ASIC设计总监Drago Ignjatović共同创立,堪称AMD前高管梦之队。

其中,Ljubiša Bajić不仅曾在AMD和英伟达担任高级职位,负责高性能GPU研发设计,还是Tenstorrent的创始人兼首任CEO。

新公司致力于开发专为AI推理和训练设计的全新架构,强调分层设计和晶格网络,能够让芯片像大脑一样根据任务需求动态处理数据。

在2020年,芯片教父Jim Keller也强势加入Tenstorrent,并接任CEO一职,而Ljubiša Bajić转任首席技术官CTO,专注于产品研发。


随后,他又创立了Taalas,试图通过类似硅基编译器的方式,直接将AI模型转化为硅芯片。

于是首战告捷,一个仅有24名成员的团队,产品投入仅3000万美元,就创造出比通用AI芯片高出几个数量级的能效比。

目前Taalas已筹集2亿美元投资,预计将在春季基于HC1发布第二代变体,将集成一款中等规模的推理大模型。

随后预计将在冬季部署上线HC2,HC2密度更高、运行速度也会更快。

不过对于HC1,网友们的评价却是两极分化。

一方面,网友认为HC1的超低延迟将有益于推动具身智能等领域发展。


另一方面,也有网友实测过后发现,HC1高速推理的背后,却是糟糕的推理深度:


以及对于迭代周期相当迅速的大模型来说,HC1的硬编码可能会使芯片很容易过时。

这也是为什么当前芯片厂商都在普遍推出通用型芯片的原因之一。


参考链接:
[1]https://x.com/wildmindai/status/2024810128487096357?s=20
[2]https://taalas.com/the-path-to-ubiquitous-ai/
[3]https://chatjimmy.ai/
[4]https://www.eetimes.com/taalas-specializes-to-extremes-for-extraordinary-token-speed

文章来源:量子位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真要退役?全红婵过年喝奶茶不怕变胖 又被游客围堵 下车转身就跑

真要退役?全红婵过年喝奶茶不怕变胖 又被游客围堵 下车转身就跑

念洲
2026-02-21 13:45:42
德媒:中国新酷感引发全球年轻人共鸣

德媒:中国新酷感引发全球年轻人共鸣

参考消息
2026-02-21 14:13:22
尼格买提春晚归家惊现无绿叶菜,背后隐藏的新疆美食秘密!

尼格买提春晚归家惊现无绿叶菜,背后隐藏的新疆美食秘密!

一盅情怀
2026-02-21 13:36:27
官方:开拓者将杨瀚森下放至发展联盟

官方:开拓者将杨瀚森下放至发展联盟

懂球帝
2026-02-22 07:49:04
痛心!树龄1200年古樟持续燃烧7小时,只因俩小孩随手扔爆竹……

痛心!树龄1200年古樟持续燃烧7小时,只因俩小孩随手扔爆竹……

环球网资讯
2026-02-21 10:22:16
龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

龙洋眼往上瞟,不是看提词器,也不是针打多了,而是一个“硬伤”

她时尚丫
2026-02-17 22:41:30
于和伟:三岁丧父,吃姐姐的奶长大,成名后给八个哥哥姐姐买房

于和伟:三岁丧父,吃姐姐的奶长大,成名后给八个哥哥姐姐买房

卷史
2026-02-17 22:09:21
格林双加时绝杀魔术!阿伦27分7板,贝恩空砍34分,班凯罗26+14+8

格林双加时绝杀魔术!阿伦27分7板,贝恩空砍34分,班凯罗26+14+8

无术不学
2026-02-22 10:10:34
鞋子买小了挤脚怎么办?鞋厂老板教我正确方法,鞋子立马变舒适!

鞋子买小了挤脚怎么办?鞋厂老板教我正确方法,鞋子立马变舒适!

妙招酷
2026-02-21 00:20:05
1800公里充电11次,车主被教育了,再也不开电车回乡了

1800公里充电11次,车主被教育了,再也不开电车回乡了

柏铭锐谈
2026-02-11 23:57:30
特朗普杀红眼!洗劫全球万亿,却猛然发现:唯独中不吃这一套

特朗普杀红眼!洗劫全球万亿,却猛然发现:唯独中不吃这一套

比利
2026-02-22 02:20:20
特朗普:税率将升至15%!数百家公司已起诉!德国总理发声

特朗普:税率将升至15%!数百家公司已起诉!德国总理发声

每日经济新闻
2026-02-22 07:11:19
杨瀚森能在NBA立足吗?美媒给出响亮的回答,没有料到会说这种话

杨瀚森能在NBA立足吗?美媒给出响亮的回答,没有料到会说这种话

林子说事
2026-02-21 16:31:39
被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

白浅娱乐聊
2026-02-21 22:59:54
广东男篮开工,杜锋朱芳雨发派红包,四外援归队崔永熙参加合练

广东男篮开工,杜锋朱芳雨发派红包,四外援归队崔永熙参加合练

中国篮坛快讯
2026-02-21 16:10:04
德国人点评高铁:日本优秀,法国先进,只有中国是用了4个字评价

德国人点评高铁:日本优秀,法国先进,只有中国是用了4个字评价

云舟史策
2026-02-19 07:13:27
詹姆斯在湖人队战胜快船后盛赞科怀·伦纳德——“他是最棒的”

詹姆斯在湖人队战胜快船后盛赞科怀·伦纳德——“他是最棒的”

好火子
2026-02-22 07:13:46
被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

生活魔术专家
2026-02-22 06:57:51
轰27+5!中国男篮19岁2米03新星闪耀:全美高中第25位创纪录

轰27+5!中国男篮19岁2米03新星闪耀:全美高中第25位创纪录

李喜林篮球绝杀
2026-02-22 09:23:52
春节剩菜大战:爸妈舍不得扔,怎么办?

春节剩菜大战:爸妈舍不得扔,怎么办?

都市快报橙柿互动
2026-02-17 23:15:16
2026-02-22 10:48:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5369文章数 64616关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

游客自驾青海遭野牦牛拦路:车动一下 牦牛就想攻击

头条要闻

游客自驾青海遭野牦牛拦路:车动一下 牦牛就想攻击

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

时尚
健康
本地
数码
手机

50岁女性过冬穿搭:有大衣和羽绒服就够了,简约从容才是优雅

转头就晕的耳石症,能开车上班吗?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

数码要闻

2026中国电影票房暂列全球第一;小米17系列进军全球市场

手机要闻

苹果史上首款折叠屏手机将量产,平价版MacBook现身

无障碍浏览 进入关怀版