网易首页 > 网易号 > 正文 申请入驻

一个疯子,造出便宜100倍的AI芯片

0
分享至

25个人,3000万美金,两年半。

做出了一块碾压英伟达旗舰GPU 10倍的芯片。

不是PPT,不是实验室demo。芯片已经量产,API已经开放,开发者现在就能测。

做这件事的人叫Ljubisa Bajic。两年前,他放弃了自己一手创办的、估值32亿美金的AI

芯片公司Tenstorrent。AI芯片赛道正火,资本疯抢,所有人都觉得他疯了。

但Bajic觉得,真正疯的是这个行业——大家花几十亿美金造芯片,结果90%的算力都在搬数据,不在算数据

他放不下一个问题:AI推理,为什么非得这么贵?

问题有多本质?

你用ChatGPT问一个问题,背后是什么?是一堆服务器里的GPU,把一个几十GB甚至几百GB的模型文件,从内存里反复搬运到计算单元,一个字一个字地算出来,再传给你。

这个过程,每问一次,就搬一次。不是搬一次,是每生成一个token,都要把所有的模型权重过一遍。

NVIDIA的GPU卖这么贵,本质上是在卖"通用性"——它什么模型都能跑。这种灵活性,代价是极大的浪费。好比你每次做饭,都要把整个菜市场搬进厨房,然后再搬走。

Bajic想的是:如果你只做一道菜,为什么不直接把菜长在厨房里?

这就是Taalas的起点。

先说说Bajic这个人

他的履历,光看都觉得累。在AMD做了十几年,从工程师一路做到GPU芯片架构师,主导过混合CPU-GPU芯片的整体设计。后来跳去Nvidia做了一年高级架构师,结果又被AMD挖回去,当了两年集成电路设计总监。

AMD、Nvidia、AMD——在两家芯片巨头之间来回蹦跶。不是他坐不住,是这个行业的顶尖人才就这样,谁给更大的舞台就去谁那儿。

再后来他自己出来创业,创办了Tenstorrent——专做AI芯片。公司融了7亿美金,估值一路飙到32亿。为了补强团队,他请来了芯片界的传奇人物Jim Keller先担任CTO——这个人在AMD设计过Zen架构、在苹果做过A系列芯片、在特斯拉搞过自动驾驶芯片,硅谷芯片圈的活化石。

Keller一开始以CTO身份加入,负责技术方向。但很快,Bajic发现这个人不只是能做技术——他能扛起整个公司。于是Bajic把他升为CEO,自己退到幕后。2022年秋天,Bajic彻底离开了Tenstorrent。

一手创办的公司,估值32亿,亲手交给别人,然后走人

他停下来想了六个月,然后做了一个更疯的决定。

颠覆80年的基本假设

2023年,Bajic带着他的妻子Lejla(AMD/Tenstorrent系统工程老兵,后出任COO),还有老搭档Drago Ignjatovic(前Tenstorrent硬件VP,出任CTO),三个人,把这个想法从零开始做。

他们给这个方向起了个霸气的名字:Hardcore Models.

口号只有六个字:The Model is The Computer.

不是模型运行在计算机上。模型本身,就是那台计算机。

具体怎么做到的?

具体怎么做到的?Bajic的技术解释,我觉得非常有意思。传统芯片的逻辑是:有一堆计算单元,有一堆内存,需要推理的时候,把模型权重从内存搬到计算单元,算完结果,再吐出来。这中间有一道无形的"墙"——内存带宽墙。

你能算多快,取决于你能搬多快。这道墙,是整个AI算力行业几十年的噩梦。Cerebras用一整个晶圆做计算,SambaNova和Groq用大量高速SRAM,本质都是在想办法把这道墙打薄。但墙还在。

Taalas的做法,是把这道墙彻底炸掉。

从1945年冯·诺依曼提出计算机架构至今,有一个基本假设从没变过:存储是存储,计算是计算,中间靠总线搬数据。八十年了所有芯片都在这个框架里优化。

Bajic说:我不优化了,我把这个架构废了。

存储和计算,合为一体。模型参数直接刻进晶体管,晶体管本身既是存储又是计算。不需要搬运,因为数据就长在计算的地方。

这才是真正疯的地方——不是做一块更快的芯片,而是否定了八十年来计算机的基本假设

他们发明了一种叫"Mask ROM Recall Fabric"的架构——直接把模型权重,在芯片制造的时候,固化进晶体管里。不是写进内存,是刻进硅里

他们用的是70年代手工晶体管级别的设计方法,一行一行地布局,像在手工雕刻。一共申请了14项专利

结果

第一代芯片HC1,TSMC 6纳米工艺,815平方毫米,530亿个晶体管,功耗200W一张卡。

跑Llama 3.1 8B的推理速度:17,000 tokens/秒(每用户)

NVIDIA最新的B200(Blackwell架构):大约1,800 tokens/秒

差了将近10倍成本便宜20倍功耗低10倍

而且,因为速度太快,根本不需要"批处理"。HC1速度太快,每个用户的请求直接实时响应,延迟极低。

低延迟和低成本,原本是一对矛盾。Taalas说,我两个都要。

代价与解法

你可能会问:这听起来太好了,有什么代价?

有的。

每一个模型,对应一款专属芯片。你想跑Llama 3.1,就得用Llama 3.1的HC芯片。

Bajic说:不麻烦。他们和TSMC一起,设计了一套"两层金属"的快速更新方案——换个模型,只改芯片里的两层金属。从收到新模型的权重,到可以量产出货:两个月

定制一块专属推理芯片,成本大概是训练成本的百分之一

这个账,算得过来。

更关键的是:模型更新的速度,正在放缓。用户开始在乎"稳定性"多过"新功能"。GPT-4到GPT-4.5到GPT-5,不少企业用户反而不急着升级,因为已经跑通的工作流不想被打乱。这种趋势,恰恰给了HC芯片更大的生存空间。

25人,$3000万

Taalas今年2月刚宣布完成$1.69亿融资,总融资额达到$2.19亿投资方包括Fidelity(富达)。

他们总共只花了$3000万在研发上。还有$1.7亿在账上没动。

25个人,$3000万,两年半做出了一个跑赢NVIDIA旗舰GPU 10倍的芯片。

这不是在吹牛。他们现在已经有公开可用的API(chatjimmy.ai),开发者可以自己去测。

我见过太多创业团队,动不动就说要做多大的事,然后花很多钱,很多年,产出一个平庸的结果。Taalas这个数字,让我坐直了。

极度焦虑=极度效率

这件事让我想到一个更大的问题:资源,到底是优势,还是束缚?

Taalas走了另一条路:用极度聚焦换来极度效率

Bajic从AMD到Tenstorrent,再到Taalas,每次都在做减法:

  • AMD:做所有人的GPU

  • Tenstorrent:做AI时代的通用芯片

  • Taalas:只做一个模型的最优硬件

越聚越窄,越聚越深,越聚越快。

我自己做猎豹的时候,也经历过类似的阶段。做移动工具的那几年,整个团队想的就是一件事:如何在手机清理这件小事上,做到极致?

别人觉得这太窄,没有未来。但正是这种极致的聚焦,让我们在全球超过一亿用户。

Taalas让我想到,这个道理在硬科技领域一样成立——甚至更成立因为硬件容错率更低,极度聚焦,不是退而求其次,而是生存本能。

因为硬件容错率更低。你不能"先发布再迭代",每次流片都是真金白银。极度聚焦,不是退而求其次,而是生存本能。

顺便说,Taalas的VP of Products,叫Paresh Kharya。

这个人之前在NVIDIA做了三年数据中心业务高级产品负责人,然后去Google Cloud管了一段时间GPU和TPU的整个硬件产品线。

从NVIDIA和Google的内部,主动跳槽去一个25人的初创公司。

这个选择,很说明问题。见过最好的,选择去做可能更颠覆的,这种判断不轻易发生。

价格革命

当然,Taalas面前还有很多没解决的问题。

模型迭代越来越快,两个月的交货周期够不够?超大参数量的模型(数千亿参数)怎么做,目前HC1只支持80亿参数,HC2年底才出。客户愿不愿意为"专用芯片"接受灵活性上的限制,这是真实的商业挑战。

这些问题,都不是小问题。

但有一件事我觉得是确定的:AI推理的成本,必然会被打穿。

DeepSeek从训练端做到了,用更少的算力训练出接近GPT-4水平的模型。

Taalas从推理端做,把同一个模型的运行成本砍掉20倍

两条路,同一个方向——让AI的使用成本趋近于零。

这不是一个技术故事,这是一场价格革

最后说一句话。

Bajic离开Tenstorrent的时候,所有人都说他疯了——AI芯片赛道正热,公司估值$32亿,你走什么走?

但他停下来想了六个月,然后去做一件更疯的事——否定冯·诺依曼架构,把模型直接烧进芯片。

现在他们拿着$2.19亿,25个人,从加拿大多伦多出发,准备在一个万亿美元的市场里,打出一道裂缝。

有时候,疯子才能看到正常人看不到的路。

这件事的结局还没写完。但开头,已经很精彩了。

Taalas的HC1已经可以申请API试用:taalas.com/api-request-form/。如果你在做AI应用,不妨去测一下。17,000 tokens/秒是什么感觉,亲眼看看。

关于EasyClaw


AI推理成本趋近于零的那一天,真正的价值不在算力,在应用。

EasyClaw是我们做的AI Agent平台——让每个人都能拥有自己的AI助理,7×24小时帮你处理工作、获取信息、管理日程。不需要写代码,不需要懂技术,开箱即用。

Taalas让AI算力便宜100倍,EasyClaw让AI能力人人可用。

easyclaw.com — 你的第一只龙虾,在等你。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大学“倒闭潮”倒计时?7年后你的文凭,或许还不如一张电工证

大学“倒闭潮”倒计时?7年后你的文凭,或许还不如一张电工证

小谈食刻美食
2026-04-25 09:37:54
两个事实证明,我国实际已经控制了面积80平方公里的南沙五方礁

两个事实证明,我国实际已经控制了面积80平方公里的南沙五方礁

老谢谈史
2026-04-10 17:30:50
婚介所彻底变天!因没有男客户而倒闭,转变成了专坑女人的杀猪盘

婚介所彻底变天!因没有男客户而倒闭,转变成了专坑女人的杀猪盘

谭谈社会
2026-04-27 19:01:19
逆转!马杜罗被捕114天后,特朗普首度重大让步,美法官有言在先

逆转!马杜罗被捕114天后,特朗普首度重大让步,美法官有言在先

娱乐圈的笔娱君
2026-04-29 22:23:18
民调:超四成澳大利亚民众认为燃油危机主要责任在美以

民调:超四成澳大利亚民众认为燃油危机主要责任在美以

新华社
2026-04-29 13:15:42
意大利议会批准:捐赠航母

意大利议会批准:捐赠航母

环球时报国际
2026-04-30 00:20:31
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
踢出西班牙,改变对英国马岛主权支持,盟友就要对等

踢出西班牙,改变对英国马岛主权支持,盟友就要对等

移光幻影
2026-04-25 12:43:46
四川攀枝花木棉飘絮如下雪!当地启动专项除絮作业:已修剪木棉树2600余棵,清理棉果32吨

四川攀枝花木棉飘絮如下雪!当地启动专项除絮作业:已修剪木棉树2600余棵,清理棉果32吨

红星新闻
2026-04-29 16:32:43
我妈过来住岳母不让上桌,我在隔壁给我妈买套房子,对妻子说:我搬到对面住

我妈过来住岳母不让上桌,我在隔壁给我妈买套房子,对妻子说:我搬到对面住

麦子情感故事
2026-04-29 23:36:15
1-4!汤姆斯杯爆大冷 上届亚军印尼队小组赛出局 国羽冲冠获利好

1-4!汤姆斯杯爆大冷 上届亚军印尼队小组赛出局 国羽冲冠获利好

我爱英超
2026-04-29 06:06:08
罗永浩自曝深陷抖音成瘾:每周装删循环 一不小心就通宵刷视频

罗永浩自曝深陷抖音成瘾:每周装删循环 一不小心就通宵刷视频

快科技
2026-04-29 14:58:03
美股纳指低开0.28% 希捷科技大涨17%带动存储概念股走高

美股纳指低开0.28% 希捷科技大涨17%带动存储概念股走高

财联社
2026-04-29 21:32:48
龚雪现状:和丈夫在上海生活,73岁仍然很美,唯一女儿在美国发展

龚雪现状:和丈夫在上海生活,73岁仍然很美,唯一女儿在美国发展

素衣读史
2026-04-28 20:06:40
畸形母爱毁星二代:母乳12年同床15年荒唐事

畸形母爱毁星二代:母乳12年同床15年荒唐事

看尽落尘花q
2026-04-25 14:10:18
新规把医药代表逼到悬崖边:3万就入刑,院长收钱的日子一去不返

新规把医药代表逼到悬崖边:3万就入刑,院长收钱的日子一去不返

心灵得以滋养
2026-04-29 02:31:36
曝光西门子iQ100冰箱大批故障,罗永浩称是“劣质产品”,客服:返修率非常低,自己也用西门子

曝光西门子iQ100冰箱大批故障,罗永浩称是“劣质产品”,客服:返修率非常低,自己也用西门子

山西经济日报
2026-04-29 15:28:57
世锦赛战报:四位TOP16激战八强,8-8/8-8,赵心童与艾伦强势反击

世锦赛战报:四位TOP16激战八强,8-8/8-8,赵心童与艾伦强势反击

求球不落谛
2026-04-29 05:27:31
1991年,郑浩南与大岛由加利的结婚照,两人在1990年相识

1991年,郑浩南与大岛由加利的结婚照,两人在1990年相识

岁月有情1314
2026-04-22 07:52:08
赢球反而多花钱?卡里克战绩太好,红魔被迫多掏400万奖金

赢球反而多花钱?卡里克战绩太好,红魔被迫多掏400万奖金

夜白侃球
2026-04-29 08:59:30
2026-04-30 00:59:00
傅盛 incentive-icons
傅盛
猎豹移动董事长兼CEO、猎户星空董事长
90文章数 792关注度
往期回顾 全部

科技要闻

今晨庭审纪实|马斯克当庭讲述OpenAI被偷走

头条要闻

补壹刀:解放军两支舰队同时行动 信息量非常大

头条要闻

补壹刀:解放军两支舰队同时行动 信息量非常大

体育要闻

一场九球狂欢,各路神仙批量下凡

娱乐要闻

马頔一句话,孙杨妈妈怒骂节目组2小时

财经要闻

苏州,率先进入牛市

汽车要闻

技术天花板再摸高 全能型的奕境X9首秀

态度原创

亲子
家居
健康
教育
房产

亲子要闻

近年来屡上“黑榜”,十月结晶再因婴幼儿背带pH值不合格被通报

家居要闻

寂然无界 简洁风格

干细胞治烧烫伤能用了么?

教育要闻

高考地理试题中的“学考分离”现象

房产要闻

80亿投资!浙商总部基地+海口北站,金沙湾这是要起飞啊!

无障碍浏览 进入关怀版