网易首页 > 网易号 > 正文 申请入驻

GPU要凉?前英伟达AMD大神将AI刻在芯片上!17000 tokens/秒屠榜

0
分享至


新智元报道

编辑:定慧

【新智元导读】在这个所有科技巨头都在为英伟达的高端GPU抢破头的时代,一家成立不到三年的多伦多小厂Taalas,突然朝着整个行业扔出了一颗反常识的「深水炸弹」:他们抛弃了液冷,抛弃了昂贵的HBM显存,甚至抛弃了「通用计算」,选择了一种最粗暴、最狂野的物理美学:直接把大模型焊死在芯片里!

今天是大年初六,年还没过完。但有一个新闻却淹没在各种消息中。

这可能是今年最重要的AI新闻,但现在依然还没什么人聊!

这两天,一家成立不到三年的多伦多芯片公司Taalas扔下了一颗核弹:

他们绕开了所有热门概念,直接把AI大模型,物理焊死在芯片里!


这家公司开发的HC1芯片,运行Llama 3.1 8B的速度达到了极度恐怖的17,000tokens/秒


作为对比,目前业界最快Cerebras跑同等模型,速度也不过两千。

Taalas HC1硬生生将速度拔高了将近10倍!

而和英伟达最先进B200,提高了近50倍!


他们还上线了一个体验网站:chatjimmy.ai


这个AI的速度有多离谱呢?可以看看下面的速度。


这个AI不是在回复,而是直接未卜先知把答案砸在你的脸上。


这还不算完,除了「光速」输出Token以外。

Taalas如何解决散热和传输速度问题?

他们交出的答卷是:抛弃液冷!抛弃HBM显存!

因为没有复杂的存储层级,HC1的成本只有传统方案的1/20,功耗更是直接缩减到1/10,十张卡加起来仅仅需要2.5千瓦的空气冷却。


官方博客:https://taalas.com/the-path-to-ubiquitous-ai/

在这块主打「复古暴力」的芯片里,它出厂时的命运就被永远锁死——它的晶体管只为Llama 3.1 8B的权重而生,这辈子只能跑这一个模型。


一时间,X上彻底炸锅了!

「等待LLM思考」的时代宣告终结。


有测试者满脸震撼:

「你敲下回车的瞬间,答案就像预谋已久一样扑在屏幕上,那根本不是秒回,那是啪地一下砸你脸上!」


有网友发出了绝望的哀叹:「人类该怎么跟得上这种速度?」


另一位网友的回答则更加冷酷:「尊敬的先生,我们不可能跟得上。」


但反方意见同样明确。

首先就是,虽然速度达到「光速」,但是小模型带来的幻觉问题无法避免。

甚至无法正确计算简单的加减乘除。


而且按照现在的模型的迭代速度。

在一个物理实体上固化一个即将被淘汰的模型,真的有用么?


也有乐观者认为,这可能确实是未来的一种方向,因为这种Token的输出速度,并不是给人类准备的。

而是让智能体之间相互对话使用的。


所以,Taalas这条所谓的物理实体AI之路是否真的能走通?


暴力美学vs极致封印:AI的两条路线之争

要看懂这场「豪赌」的意义,我们必须回顾一下芯片的发展史。

过去三十年,无论是CPU还是GPU,甚至是后来的各种AI加速器,整个硅谷都在疯狂追求同一件事:「造一个通用的计算平台」

我们在造一个巨大的舞台,然后让不同的软件在上面跳舞。

这就形成了一个绝对的物理硬边界:「内存墙」


内存墙通常是指处理器速度和内存带宽之间不断扩大的差距

当模型膨胀到几百亿、上千亿参数,你为了算一次乘法,每次都要把海量数据从显存搬到计算单元。

这个「搬砖」过程消耗的能量和时间,早就远远超过了计算本身。

Taalas团队的思路简直是「反向升级」:

既然这个舞台每天都只演《罗密欧与朱丽叶》,我们为什么要费劲巴拉地每天搬布景?直接把布景用水泥砌死在台上不就行了!

在这块HC1芯片里,模型的每一个权重,都对应着芯片上特定的晶体管


矩阵乘法根本不需要软件去调度,而是通过物理电路的电流直接完成!

你可以把传统的GPU理解为「交响乐团现场演奏」,每次运行都要调配乐手、看曲谱、听指挥;

那么Taalas的做法就是直接刻了一张「黑胶唱片」。

你把Llama模型录死在磁带上,插上电就能播,而且是以一种摧枯拉朽的倍速在狂飙。

但,一切命运的馈赠,都在暗中早就标好了价格!


这也意味着,只要这块芯片一出厂,它的命运就已经被彻底锁死

它无法微调,无法更换模型,更无法升级。

如果明年Meta发布了Llama 4,或者你发现这个8B模型在特定业务里太卡智商,这块满载尖端科技的硅片,瞬间就会沦为精美的电子垃圾

在这个所有巨头都在拼命炫耀自家新模型多聪明的时代,主动把自己锁死在一个固定的历史版本上,这到底是逆天改命,还是饮鸩止渴?

路线大分裂与人脑的奇妙隐喻

事实上,这种极尽专用的思路,背后牵扯出的是一场硅谷顶级大佬的路线大决裂。

Taalas的CEO Ljubisa Bajic曾在AMD、英伟达担任骨干架构师,也是明星AI芯片公司Tenstorrent的创始人。


2022年,「芯片之神」Jim Keller(「硅仙人」)加入Tenstorrent,Jim Keller 不仅为该公司提供了第一笔资金,后来更直接加入公司担任CTO,并于2023年与Ljubisa Bajic互换角色出任CEO。


Ljubisa在2023年4月宣布从Tenstorrent的日常管理岗位「退休」并转任顾问,其实是为了追求一个更激进、更极端的计算梦想

他随后创办了新公司Taalas。

Jim Keller的毕生信仰,是做一个通用的、可编程的、软件友好的完美平台。

扩展阅读:英伟达亲手终结CUDA「护城河」?传奇芯片架构师引发争议


而Ljubisa则决绝地走向了另一个极端——

绝对的极繁固化,换取绝对的极简自由。

对于这种把AI模型做成ASIC(专用集成电路)的做法,网上的评价两极分化。

有人嘲讽「流片贵得吓人,模型一更新旧卡就炸死路一条」,但也有极其敏锐的观察者,将它与人类大脑的运行机制,产生了深度的共振。

X上一条高赞评论直指灵魂:

「哈佛和谷歌耗尽资源,花了十年时间,才勉强绘制出1立方毫米、比米粒还小的人脑图谱。这背后的数学复杂度和能效比,足以让地球上所有的AI实验室集体汗颜。」


人类大脑那种不可思议的精密和低功耗,本质上不就是一种长在肉体上的「硬件固化」吗?


且人脑的运算虽然精妙,但光论「生成代码」和「吐词」的速度,可远没有这类新硬件这般快如闪电。


另一位网友的一席话更让人破防:

「其实大部分人类,一辈子也就说一种语言、做着一份固定的职业

这和大脑里刻死了一个模型有什么区别?」

一语惊醒梦中人。

我们并非在所有的场景里,都需要一个通晓天文地理、能写诗能解微分方程的「全知全能神」。

在海量的垂直场景里——比如一个需要毫秒级响应的语音助手,流水线上的自动化数据标注,甚至是你家里每天只懂避障的扫地机。

它们根本不在乎你是GPT-6还是Claude 5,它们需要的仅仅是像一颗钉子一样,用光速和最低廉的成本,把手头那件事干到极致。

这时候,一个极其便宜、永远不需要换代的「电子牛马」芯片,就足够了。

也许这就是AI走向物理世界的终极两极分化:

一部分化作云端庞大而昂贵的通用神灵;

而另一部分,则被死死刻进硅晶体里,化作数以百亿计的廉价、极速的工匠,渗透进人类生活的每一个毛孔。

Taalas这步险棋,可能成为技术史上一次昂贵而有趣的注脚,但也极有可能,正在砸开一扇用「零延迟」统治未来的大门。

无论怎样,17,000 tokens/秒的凶兽已经出笼。

在绝对的速度和暴力成本面前,传统的AI硬件法则,已经出现了一道刺眼的裂痕。

你认为人类的科技树,应该点在哪里?

参考资料:

https://x.com/wildmindai/status/2024810128487096357

https://x.com/ai_for_success/status/2025239027490971681

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
去掉娃哈哈,宗馥莉把自己名字印在了包装上

去掉娃哈哈,宗馥莉把自己名字印在了包装上

观察者网
2026-06-02 18:34:45
“别无选择”,鲁比奥最新涉华表态

“别无选择”,鲁比奥最新涉华表态

观察者网
2026-06-03 09:37:08
万万没想到:李连杰主演的《少林寺》,绝大多数镜头居然都不是在“少林寺”拍的!

万万没想到:李连杰主演的《少林寺》,绝大多数镜头居然都不是在“少林寺”拍的!

良有方
2026-05-31 05:38:41
重启首日崩了,崩就对了:为什么挤着回天涯?

重启首日崩了,崩就对了:为什么挤着回天涯?

鲁八两
2026-06-01 15:45:07
雷达全瞎、通信中断、直升机降不下来,荷兰护卫舰夹着尾巴逃了

雷达全瞎、通信中断、直升机降不下来,荷兰护卫舰夹着尾巴逃了

趣文说娱
2026-06-02 18:19:31
魏宗万去世细节曝光:多次住院,拒500万广告靠租房度日

魏宗万去世细节曝光:多次住院,拒500万广告靠租房度日

笑饮孤鸿非
2026-06-03 11:26:05
3家保险公司进入破产程序!保单会作废吗?现在买保险还安全吗?

3家保险公司进入破产程序!保单会作废吗?现在买保险还安全吗?

老特有话说
2026-06-02 16:08:24
断档领先!各联赛世界杯输送国脚数量:英超20队出163人

断档领先!各联赛世界杯输送国脚数量:英超20队出163人

新英体育
2026-06-03 10:49:01
纳赛尔致信巴黎员工:并非所有冠军都在场上,欧冠两连冠属于所有人

纳赛尔致信巴黎员工:并非所有冠军都在场上,欧冠两连冠属于所有人

懂球帝
2026-06-03 09:53:29
济南公安通报“山姆偷吃”

济南公安通报“山姆偷吃”

扬子晚报
2026-06-03 12:06:03
吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

莫地方
2026-06-02 00:10:26
南方新一轮降雨来袭!广东“下开水”模式持续

南方新一轮降雨来袭!广东“下开水”模式持续

广东发布
2026-06-03 14:07:59
斯科尔斯:曼联有争冠机会;阿森纳下赛季3、4名我丝毫不意外

斯科尔斯:曼联有争冠机会;阿森纳下赛季3、4名我丝毫不意外

懂球帝
2026-06-03 14:00:11
在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

山河路口
2026-06-02 14:04:22
6月4日,人社部关于2026年上调退休人员,养老金的通知公布了吗?

6月4日,人社部关于2026年上调退休人员,养老金的通知公布了吗?

社保小达人
2026-06-03 10:15:28
女子网约车排泄后续曝光,平台公布信息结局大快人心

女子网约车排泄后续曝光,平台公布信息结局大快人心

每一次点击
2026-06-01 16:41:11
乌克兰承不承认俄罗斯对克里米亚和乌东四州的主权,都没什么意义

乌克兰承不承认俄罗斯对克里米亚和乌东四州的主权,都没什么意义

空想之喵
2026-05-09 01:21:47
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

凡知
2026-06-03 05:12:25
离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

白浅娱乐聊
2026-06-02 18:26:05
印媒披露数据:印度极端高温,单日或致3400人死亡

印媒披露数据:印度极端高温,单日或致3400人死亡

环球网资讯
2026-06-03 06:46:06
2026-06-03 14:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15376文章数 66899关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

艺术
家居
旅游
教育
军事航空

艺术要闻

二十年前割麦的场景

家居要闻

江畔轻奢 观云大宅

旅游要闻

主持人点点带你打卡北美高端亲子品牌Jolly Bubble 波浪谷全国首店,解锁高质量亲子游玩体验,烟台遛娃首选!

教育要闻

教育部:“阳光志愿”信息服务系统将优化升级

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版