网易首页 > 网易号 > 正文 申请入驻

24人打造的6nm AI芯片火了!比B200快48倍,30块能跑DeepSeek满血版

0
分享至


芯东西(公众号:aichip001)
作者 程茜
编辑 Panken

芯东西2月24日消息,2月20日,加拿大神秘AI芯片创企Taalas浮出水面:宣布总融资额已超2亿美元(约合人民币14亿元)、推出首款可为任意模型定制芯片的平台HC1,首款产品由24人团队打造,共花费3000万美元(约合人民币2.1亿元)

Taalas成立于2023年8月,其技术路线特立独行:无需软件而是将模型结构、参数与权重深度直接固化于硬件之中。其推出的产品就是集成了Meta Llama 3.1 8B模型的HC1平台。


一夜之间,Taalas的产品刷屏硅谷,社交平台网友纷纷开启实测,并称其性能惊人、将给英伟达GPU带来巨大挑战。

HC1采用台积电6nm制程,芯片面积与英伟达H100芯片相当,为815平方毫米。HC1芯片可以将整个8B版本的Llama 3.1模型集成到单个芯片上。

Taalas还模拟了DeepSeek R1-671B的多芯片解决方案,其存储整个671B模型采用了大约30个定制芯片,模拟结果表明,DeepSeek R1-671B每用户每秒可生成约12000个token;Llama 3.1单个用户的生成速度可达17000 token/秒,速度接近Cerebras推理平台的10倍,英伟达H200的73倍、B200的48倍,构建成本为Cerebras现有方案的1/20、功耗仅为1/10。


Taalas创始人兼CEO柳比萨·巴吉克(Ljubisa Bajic)曾任职AMD集成电路设计与架构总监、英伟达高级架构师。他2016年创立AI芯片公司Tenstorrent,2023年将其交接给Jim Keller(吉姆·凯勒)后,又创办了Taalas。

Taalas的另外两位创始人是巴吉克的妻子、曾在AMD担任系统工程高级经理的莱拉·巴吉克(Lejla Bajic)以及曾在AMD担任高级设计工程师、在Tenstorrent担任工程师的德拉贡·伊格(Drago Ignjatovic)。

不过在社交平台上,有不少用户吐槽:Taalas的产品确实快,但错误率过高。芯东西提问了“9.9和9.11比大小”以及经典的鸡兔同笼题目,该模型分别在0.001秒、0.017秒内给出了错误答案。


▲社交平台X上网友评论(左、中),芯东西实际体验截图(右)

巴吉克称,Taalas的极端方案可能很适合某些特定应用,本质是找到追求经济效益和速度而牺牲灵活性的方法。

Taalas还透露了下一步计划,他们将基于HC1为第二款中等规模的推理模型打造芯片,该模型预计于今年春季在实验室完成流片,并很快集成至其推理服务中;随后,该公司将基于第二代芯片平台HC2推出新大语言模型,HC2将提供更高的算力密度与更快的执行速度,计划在今年冬季正式部署。

体验地址:https://chatjimmy.ai/chats/648a53af-eb3f-4f81-a604-69e3dcec69ae

一、极致性价比,30颗芯片模拟部署DeepSeek R1

2月20日,Taalas正式推出首款芯片平台HC1,该平台已集成Meta Llama 3.1 8B模型,用于聊天机器人演示与推理API服务。

其官方博客提到,基于HC1,Llama 3.1单个用户的生成速度可达17000个token/秒,速度接近Cerebras推理平台的10倍,构建成本为Cerebras现有方案的1/20,功耗为1/10。

Taalas发布了HC1集成Llama 3.1 8B的免费试用链接。芯东西提出的需求是“请详细提供1960年至1972年阿波罗计划逐年的完整历史,包括任务目标、技术挑战、核心人员、飞行里程碑与科学发现。”Llama 3.1仅0.078秒就输出了答案,每秒可输出15694个token,其输出内容对关键分类进行了罗列。


根据Taalas发布的成本与延迟对比数据,基于Taalas的芯片方案,Llama 3.1 8B的推理查询成本为每百万token 0.75美分(约合人民币0.052元),DeepSeek R1的成本为每百万token 7.6美分(约合人民币0.53元)。

相比之下,Llama 3.1 8B在GPU吞吐量优化方案上的成本为每百万token 3.79美分(约合人民币0.26元),DeepSeek R1为20.2美分(约合人民币1.4元),延迟优化方案中,Llama 3.1 8B的成本为28.61美分(约合人民币2元),DeepSeek R1为49美分(约合人民币3.37元)。


可以看出,Taalas在token生成成本、延迟上相较英伟达GPU效果都更好,尤其在参数规模更小的模型上更是实现了数量级的领先。

该公司的第一代芯片平台HC1采用了自定义的3位基础数据类型,这是因为他们在进行研发设计时,低精度参数格式尚未形成标准。

集成Llama时,Taalas还采用了激进的量化方案,混合使用3位与6位参数,相较于GPU基准测试,会带来一定的精度损失。

Taalas的收入来源将分为两块,推理即服务、HC硬件。在官宣博客中,Taalas将基于Llama 3.1 8B的HC1称作测试版服务,其目的是让开发者体验大模型推理实现亚毫秒级速度、且成本近乎为零的同时,探索更多新应用。这一服务预计不会产生显著收入。

二、遵循三大原则,2个月内完成芯片定制

一般而言,对于更新的模型,Taalas能在不到两个月内完成芯片定制。

巴吉克对此的解释是,由于Taalas的芯片高度专业化,其设计比英伟达的同类产品更简单,因此生产速度更快。例如一块Taalas芯片就能容纳一个完整的大语言模型,将模型及其权重硬编码到HC1中,然后将整个模型嵌入到定制的专用芯片中,而无需像英伟达和其他公司那样依赖外部高带宽内存。

这一过程中,该公司遵循三个原则。

第一是完全定制化(Total specialization):其团队认为,在计算机发展史上,深度专业化一直是让关键工作负载以极高效率运行的最可靠途径之一。

因此,Taalas会为每个单独的模型生产最佳芯片,也就是将特定的模型神经网络映射到芯片本身,从而针对每个模型优化基础设施。

第二是实现存储与计算融合:此前,AI推理芯片架构设计中计算与存储相互分离,且二者运行速度存在显著差异,这直接导致当前AI推理硬件架构日趋复杂。系统不仅需要依赖先进封装、HBM堆栈与超高I/O带宽,再加上单芯片功耗攀升,有时必须依靠液冷方案才能稳定运行。

其博客提到,Taalas的突破性就在于,将存储和计算统一在单个芯片上,并达到DRAM级别的密度,以此来解决此前计算和内存分家的痛点。

第三是极致简化(Radical simplification):在融合存储与计算,并针对每个模型定制芯片的基础上,Taalas可以从根本上重新设计整个硬件堆栈。其最终得到的系统不依赖于复杂或特殊的技术,不需要HBM、先进封装、3D堆叠、液冷等。

HC在设计时还进一步降低了AI部署中的能耗和成本。HC系统每个机架的能耗为12-15千瓦,GPU每个机架的能耗则高达120-600千瓦。再加上Taalas的机架可采用风冷散热,从而进一步降低数据中心的改造成本。

此外,Taalas HC1 PCIe卡几乎可以安装在任何服务器中,并支持英特尔和AMD的CPU。

三、业界好评与担忧并存,缺乏灵活性、机架寿命短引热议

凭借HC1的性能和极低成本,Taalas近期获得了不少关注,但业界仍提出了反对意见。

其优势显而易见。即便云服务商每次模型更新时都要更换数千颗加速芯片,在四年的可比使用周期内,Taalas方案的资本支出(CAPEX)仍能比其他AI加速方案节省60%–75%,同时还能为用户提供全球最快的AI推理服务。

企业担忧的关键之一在于,Taalas的方案缺乏灵活性。

使用其方案的企业将不得不长期适配同一固化模型的多个迭代版本,同时还要部署不同的芯片版本来运行各异的模型。如此繁多的版本,会加重数据中心的运营复杂度。

但《福布斯》认为,即便如此这套方案依然非常划算。因为如果一家数据中心只有少数几个模型,却占用了生产环境中绝大部分AI推理算力,那用这种专用芯片的性价比会很高。

企业担心的另一个点是Taalas机架的使用寿命较短。

目前,英伟达和AMD的更新周期都是以年为单位,但Taalas的模式就意味着,每个模型都要跟着更新。大模型基本1~1.5年就会迭代一次,而新一代芯片的研发通常需要2~3年。

针对这一隐忧,Taalas的应对策略是,通过对两层金属层进行改动来升级基础逻辑层,无需彻底重新设计。《福布斯》估计,Taalas很可能让台积电预先存储未完成的晶圆,以便添加这两层金属互连层,从而实现在两个月内完成交付。

结语:Taalas走出新路:牺牲灵活性换极致速度、成本效益

外媒Wccftech认为,目前Taalas的主要制约因素在于市场接受度和商业模式,其采用的固定编码方案,硬件确实会针对特定的大模型生进行定制,无法更改模型权重,但考虑到其惊人的生成速度与成本效益,这可能会让企业忽略其缺乏灵活性的不足。

Taalas已经实现了单芯片部署Llama 3.1 8B,以及成功用30颗芯片模拟部署DeepSeek R1模型,这也进一步展现了其采用集群式方案的潜力。对于未来的商业化探索,巴吉克称,他们希望与开发者合作,并构建Taalas自己的基础设施来运行开源模型,并提供API接口、销售芯片。

来源:《福布斯》、Taalas官网、EE Times

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
无人问津!缅甸掸邦传统鸦片崩盘,种咖啡的利润超过种大烟

无人问津!缅甸掸邦传统鸦片崩盘,种咖啡的利润超过种大烟

好笑娱乐君每一天
2026-02-25 17:46:29
55岁主持人李静自曝绝经过程,很快失去性魅力,连男人也没兴趣了

55岁主持人李静自曝绝经过程,很快失去性魅力,连男人也没兴趣了

林轻吟
2026-02-23 07:16:08
大战在即!伊朗不思一战反而想让中国买单?

大战在即!伊朗不思一战反而想让中国买单?

李荣茂
2026-02-24 06:59:14
黄子华罕见评价英国不留情面 狠批谋生艰难:我不是诋毁 若赴当地必带一物免凄惨

黄子华罕见评价英国不留情面 狠批谋生艰难:我不是诋毁 若赴当地必带一物免凄惨

TVB资讯台
2026-02-24 22:57:01
皇马公布对阵本菲卡大名单:姆巴佩、赫伊森缺席

皇马公布对阵本菲卡大名单:姆巴佩、赫伊森缺席

懂球帝
2026-02-25 19:23:07
韦雪广西被偶遇,像杨幂但差远了,馒化严重,吃螺蛳粉不敢张大嘴

韦雪广西被偶遇,像杨幂但差远了,馒化严重,吃螺蛳粉不敢张大嘴

非常先生看娱乐
2026-02-25 16:59:15
中国男篮VS日本,CCTV5明晚直播!余嘉豪从西班牙飞北京再到琉球

中国男篮VS日本,CCTV5明晚直播!余嘉豪从西班牙飞北京再到琉球

足球评论qs
2026-02-25 17:28:04
库里迎最强挑战者 克尼普尔58场200三分历史最快!

库里迎最强挑战者 克尼普尔58场200三分历史最快!

体坛周报
2026-02-25 12:14:11
好说歹说软磨硬泡,特朗普做梦都想来中国,原来是想干这个!

好说歹说软磨硬泡,特朗普做梦都想来中国,原来是想干这个!

一个坏土豆
2026-02-24 20:13:13
平山打女孩后续:母亲再度发声,打人者有势力,女孩现状令人担忧

平山打女孩后续:母亲再度发声,打人者有势力,女孩现状令人担忧

离离言几许
2026-02-24 14:01:15
加盟骑士6胜1负!哈登连3场成队史首人 阿特金森:攻防都因他提升

加盟骑士6胜1负!哈登连3场成队史首人 阿特金森:攻防都因他提升

颜小白的篮球梦
2026-02-25 16:42:19
当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

老范谈史
2026-02-24 14:51:55
曲婉婷孤注一掷要在中国复出,看来在加国坠入斩杀线属实

曲婉婷孤注一掷要在中国复出,看来在加国坠入斩杀线属实

侠客栈
2026-02-23 14:54:27
空交火!美伊大战,还是打响了!

空交火!美伊大战,还是打响了!

大嘴说天下
2026-02-24 22:39:51
中锋的“奶妈”,美媒晒三大中锋数据,与哈登做队友后全方面提升

中锋的“奶妈”,美媒晒三大中锋数据,与哈登做队友后全方面提升

懂球帝
2026-02-25 15:12:18
晒晒我从“山姆”买的13件家居用品:买着贵,用着便宜,确实划算

晒晒我从“山姆”买的13件家居用品:买着贵,用着便宜,确实划算

三农老历
2026-02-24 22:03:07
公积金缴纳等级,你在几级?

公积金缴纳等级,你在几级?

新浪财经
2026-02-04 05:17:52
乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

环球网资讯
2026-02-24 17:12:54
长春市九台区政协原党组书记、主席于海山接受纪律审查和监察调查

长春市九台区政协原党组书记、主席于海山接受纪律审查和监察调查

极目新闻
2026-02-25 17:18:01
权志龙再三挑衅中国春节,女星邓家佳跟风,被网友骂后删博了事

权志龙再三挑衅中国春节,女星邓家佳跟风,被网友骂后删博了事

钱小刀娱乐
2026-02-22 21:54:09
2026-02-25 19:47:00
芯东西 incentive-icons
芯东西
专注AI芯片、半导体产业媒体
2208文章数 8150关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

头条要闻

新房被淹男子12年未交物业费 春节前后家中停水超50天

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

艺术
手机
亲子
公开课
军事航空

艺术要闻

这位艺术家的马赛克画让人惊叹不已!

手机要闻

消息称魅族手机业务已经实质性停摆,追觅曾谈判收购

亲子要闻

总想把世界上最好的都给你 但却发现世界上最好的就是你!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄乌冲突四周年:和平谈判希望渺茫

无障碍浏览 进入关怀版