网易首页 > 网易号 > 正文 申请入驻

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

0
分享至

来源:市场资讯

(来源:IT之家)

IT之家 2 月 21 日消息,科技媒体 Wccftech 昨日(2 月 20 日)发布博文,报道称 AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,推出“硬连线”(Hard-wiring)技术,直接将 AI 模型固化在硅片中。

在 AI 算力竞争日益激烈的当下,延迟已成为制约智能体(Agentic)应用的核心瓶颈。不同于 Cerebras 或 Groq 试图通过集成 SRAM 来加速的路径,成立仅 2.5 年的初创公司 Taalas 选择了更为激进的 ASIC(专用集成电路)路线。

IT之家援引博文介绍,该公司研发出一种能将任意 AI 模型转化为定制硅片的平台,其核心逻辑在于“融合计算与存储”,直接将特定 LLM 的神经网络映射到硅片电路中,在 DRAM 级密度下完成所有计算。

这种设计彻底摒弃了 HBM(高带宽内存)、复杂封装及昂贵的散热系统,从物理层面消除了数据传输的“内存墙”障碍。


Taalas 已展示其首款产品 HC1,该芯片专为 Meta 的 Llama 3.1 8B 模型设计。从技术规格来看,HC1 采用台积电 6nm 工艺制造,芯片面积高达 815 mm²,这一尺寸几乎与 NVIDIA 的 H100 相当。

Taalas 的在线聊天机器人演示在 EE Times 试用时达到了每秒 15,000+ tokens,但公司表示,在某些条件下内部测试已接近 17000 tokens(Taalas 承认其版本的 Llama3.1-8B 被“激进”量化)。


然而,巨大的芯片面积仅容纳了 80 亿参数的模型,这与当前万亿参数的前沿模型相比显得“容量有限”。这表明,为了实现极致的硬连线速度,Taalas 在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。


尽管参数密度不高,但 HC1 的性能表现极具颠覆性。官方数据显示,相比现有的高端算力基础设施,Taalas 方案的每秒 Token 生成数(TPS)提升了 10 倍,同时生产成本降低至 20 分之一。

为了解决单芯片容量不足的问题,Taalas 采用了集群化扩展策略。在针对 DeepSeek R1 模型的测试中,通过 30 芯片的集群配置,实现了高达 12000 TPS / User 的吞吐速度(据公司称,GPU 目前的技术约为每人每秒 200 个 tokens)。这一数据意味着在实时交互和复杂推理任务中,用户将获得近乎零延迟的体验。

TPS 是衡量大语言模型生成速度的关键指标,代表模型每秒能输出多少个文本单位(Token)。相当于打字员的打字速度,TPS 越高,AI 回复得越快,用户等待时间越短。

该媒体指出 Taalas 的技术路线虽然诱人,但商业模式面临独特挑战。由于模型权重被“硬连线”在硅片中,芯片一旦制造完成便无法更改模型参数。

这意味着客户必须为特定的模型版本(如 Llama 3.1 或 DeepSeek R1)购买专用硬件,一旦算法迭代,硬件可能面临淘汰风险。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
遭93分钟绝平!1.2亿先生低迷,切尔西主场爆冷,下轮死磕阿森纳

遭93分钟绝平!1.2亿先生低迷,切尔西主场爆冷,下轮死磕阿森纳

我的护球最独特
2026-02-22 01:02:15
反常识?技术门槛很低的增程技术,为什么越卖越贵?

反常识?技术门槛很低的增程技术,为什么越卖越贵?

少数派报告Report
2026-02-21 07:58:37
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
中俄东北虎数量差距断崖:俄罗斯700只,中国的数量令人意外!

中俄东北虎数量差距断崖:俄罗斯700只,中国的数量令人意外!

又是美好的日子
2026-02-21 04:01:54
为何年纪大了会越羡慕体制内的人?这是我见过最简明易懂的答案

为何年纪大了会越羡慕体制内的人?这是我见过最简明易懂的答案

夜深爱杂谈
2026-02-21 21:39:42
木耳不要直接用水泡,相当于吃虫卵,大厨教你正确做法,太实用了

木耳不要直接用水泡,相当于吃虫卵,大厨教你正确做法,太实用了

妙招酷
2026-02-19 23:55:20
新春走基层|绝壁之上,一个“索道村”的新生

新春走基层|绝壁之上,一个“索道村”的新生

新华社
2026-02-20 22:39:30
去的时候好好的,回来的时候却

去的时候好好的,回来的时候却

中国民航人
2026-02-21 18:07:25
任弼时46岁时猝然离世,毛主席为党中央定下一条规矩,用意深远

任弼时46岁时猝然离世,毛主席为党中央定下一条规矩,用意深远

寄史言志
2026-02-15 15:07:08
2换1堪称本赛季最佳!交易后4胜0负,溢价中锋变超值,场均21+10

2换1堪称本赛季最佳!交易后4胜0负,溢价中锋变超值,场均21+10

你的篮球频道
2026-02-21 08:21:36
调侃曼联球迷蓄发哥,曼城官方:五连胜,是时候修剪一下了

调侃曼联球迷蓄发哥,曼城官方:五连胜,是时候修剪一下了

懂球帝
2026-02-22 07:35:06
江苏省最奇葩的一个城市,被省内兄弟城市“拦腰截断”!

江苏省最奇葩的一个城市,被省内兄弟城市“拦腰截断”!

触摸史迹
2026-02-21 22:04:58
娜然已经融入霍家?相比章子怡当年的“被嫌弃”,她做对了什么

娜然已经融入霍家?相比章子怡当年的“被嫌弃”,她做对了什么

扒点半吃瓜
2026-02-21 07:00:09
直到看了骑士VS黄蜂的伤病名单,才发现现在的骑士真是兵强马壮!

直到看了骑士VS黄蜂的伤病名单,才发现现在的骑士真是兵强马壮!

田先生篮球
2026-02-21 06:35:41
为什么年糕是浙江人的噩梦?

为什么年糕是浙江人的噩梦?

不相及研究所
2026-02-21 22:04:29
国内大医院内卷的极限来了:一三甲医院宣布春节开始全面取消挂号费

国内大医院内卷的极限来了:一三甲医院宣布春节开始全面取消挂号费

金水路7号站
2026-02-21 09:46:18
真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

聚焦真实瞬间
2026-02-10 20:45:40
大年初二,中美两国在黄海突发对峙,整整2天2夜后才传出消息?

大年初二,中美两国在黄海突发对峙,整整2天2夜后才传出消息?

通鉴史智
2026-02-21 09:34:58
春晚“丢”了董卿,年初二她却在无锡小区“溜达”,网友:玩捉迷

春晚“丢”了董卿,年初二她却在无锡小区“溜达”,网友:玩捉迷

小椰的奶奶
2026-02-22 06:19:28
票房三连逆跌!《镖人:风起大漠》逆势破1.1365亿春节档最强黑马

票房三连逆跌!《镖人:风起大漠》逆势破1.1365亿春节档最强黑马

喜欢历史的阿繁
2026-02-22 03:12:39
2026-02-22 08:03:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2232144文章数 5507关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

本地
手机
数码
健康
旅游

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

小米8500mAh电池新机曝光,下半年还有万级方案

数码要闻

AMD RX 9060 XT成功超频4.769GHz!打破世界纪录

转头就晕的耳石症,能开车上班吗?

旅游要闻

新春假期游兴浓

无障碍浏览 进入关怀版