网易首页 > 网易号 > 正文 申请入驻

又一颗芯片,要吊打英伟达

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

近年来,围绕着下一代人工智能的竞争正在涌现新的战线,而处于核心地位的是一家名为 Positron AI 的初创公司,其雄心勃勃的计划正在半导体行业引起广泛关注。随着各大公司争相控制人工智能系统不断飙升的能源需求,Positron 和少数几家挑战者押注,截然不同的芯片架构可能会削弱英伟达等行业巨头的控制力,并重塑人工智能硬件格局。

Positron 日前宣布,公司已经完成超额认购的5160万美元A轮融资,,使其今年的融资总额超过7500万美元。这笔新资金将支持Positron AI第一代产品 Atlas 的持续部署,并加速其第二代产品在 2026 年的推出。

Positron AI 首席执行官 Mitesh Agrawal 表示:“我们创立 Positron 是为了满足现代人工智能的需求:旨在以最低的单位tokens生成成本和最高内存容量运行前沿模型。我们高度优化的芯片和内存架构允许在单个系统中运行超级智能,我们的目标是每个系统运行多达 16 万亿个参数的模型,这些模型包含数千万个上下文长度的tokens,或内存密集型视频生成模型。”

Positron AI是谁?

Positron AI由首席技术官 Thomas Sohmers 和首席科学家 Edward Kmett 于 2023 年共同创立,前 Lambda 首席运营官 Mitesh Agrawal 加入担任首席执行官,以扩大公司的商业运营规模。在短短 18 个月内,该团队仅用 1250 万美元的种子资金就将 Atlas 推向市场。在完成 A 轮融资之前,他们验证了产品性能,获得了早期企业客户,并在部署环境中完善了产品。

现在,随着采用率的不断提高和产品路线图的清晰,Positron AI正在开发定制 ASIC,以解锁推理的更高水平的性能、功率效率和部署规模。

据该公司在领英介绍。Positron AI为企业和研究团队提供了供应商自由度和更快的推理速度,允许他们使用专为生成式语言模型 (LLM) 和大型语言模型 (LLM) 全新设计的硬件和软件。Positron AI凭借更低的功耗和大幅降低的总体拥有成本 (TCO),让您能够运行热门的开源 LLM,以高tokens率和长上下文长度为多用户提供服务。Positron AI还在设计自己的 ASIC,以将推理和微调功能扩展到支持训练和其他并行计算工作负载。

该公司团队表示,其创立 Positron AI的初衷很简单:通过最佳性价比和功耗比的生成式 AI 推理系统,让每个人都能拥有超级智能。

据Positron AI所说,我们花了足够多的夜晚来应对臃肿的 GPU,深知必须做出改变。GPU是一个很好的起点——但长期的 Nvidia 短缺、巨大的功耗和内存瓶颈正在扼杀我们大规模有效部署 Transformer 模型的能力。

“我们厌倦了眼睁睁地看着计算周期(和预算)因 GPU 效率低下而消失。因此,我们决定自己动手,创建了专门用于高效运行 Transformer 推理工作负载的方案。”Positron AI团队介绍。如他们所说,其方案具备以下特征:

  • 内存带宽利用率超过 90%(而 GPU 约为 30%);

  • 每个推理机架的功耗降低 66%;

  • 不再受供应商锁定或 GPU 短缺的困扰。

PositronAI的第一代产品 Atlas 现已上市,我们很高兴地宣布,Positron 的第二代产品将于 2026 年上市。Positron致力于最大限度地提升 Terachip 的内存带宽和内存容量(每个芯片最高可达 2TB 内存)。

先用FPGA打开局面

相关资料显示,在该公司成立仅 18 个月后就一直在向客户交付其基于 FPGA 的 LLM 推理系统。今年年初,他们也向其二级 CSP 客户交付了首批价值数百万美元的订单系统。

据该公司CEO Sohmers 所说,目前另有 20 家潜在客户正在直接或远程评估 Positron 基于 FPGA 的 AI 设备 Atlas。Positron 的客户包括运行本地或主机托管基础设施的企业,以及二级云服务提供商 (CSP)。

Sohmers 补充道:“我们进行的大部分对话,尤其是关于更大规模部署的对话,都是与那些本身就是 CSP 的公司或提供大规模网络服务的公司进行的。”

“当我们创立 Positron 时,我们专注于只有两件事很重要:从基于 Nvidia 的系统获得完全无缝的体验,而我们看到许多 AI 芯片初创公司的失败点是他们花了太长时间和太多时间才进入市场,”Sohmers 表示,并指出虽然该公司正在开发自己的 AI 推理加速器 ASIC,但其第一代和第二代 Atlas 系统都是基于 FPGA 的。

他说,FPGA 无法提供 GPU 或 ASIC 解决方案的 FLOPS,但它们具有其他优势。Sohmers 表示,公司的设备基于 Altera 的 Agilex-7M FPGA,配备 32GB HBM。

“在我们完全确定产品与市场契合之前,我们不想在构建 ASIC 上投入大量的时间和金钱,”Sohmers 说道。“虽然其他 AI 芯片公司各自都有独特的问题,但它们都存在产品与市场契合的问题,尤其是在第一代设备上。采用 FPGA 使我们能够进行非常快速的迭代,并在客户参与的情况下启动迭代。”

据报道,Positron AI 的 Atlas 以 2000 瓦的功耗搭配 BF16 计算能力运行 Llama 3.1 8B ,可实现每位用户每秒约 280 个tokens的交付。而根据 Positron AI 自己进行的比较,在相同场景下,8 路 Nvidia DGX H200 服务器每位用户每秒仅能交付约 180 个tokens,同时功耗高达 5900 瓦。这意味着 Atlas 的每瓦性能和每美元性能比是 Nvidia DGX H200 系统的三倍。当然,此说法需要第三方验证。

当前版本的 Atlas 是一个 4U 系统,在 PCIe 卡上使用四块 FPGA。它被设计为一款交钥匙设备,可以零步骤(无需重新编译)从 HuggingFace 或客户专有模型中提取二进制文件。

下一代平台将采用 Positron 的定制模块尺寸(类似于 Nvidia SXM),将四 FPGA 系统缩小至 2U 空间,并显著扩展 DDR 内存。

按照Positron AI所说,公司团队之所以能实现如此高的内存带宽利用率,关键在于其核心 IP;Sohmers 表示,为了最大限度地提高矩阵乘法 (matmul) 阵列及其连接内存的互连密度,Positron 的工作层级低于 Altera 的 Quartus 工具。Positron 的初始原型基于上一代搭载 HBM 的 Stratix 器件,实现了理论峰值内存带宽的 65% 至 70%。但升级到 Agilex 意味着团队可以利用 Altera 全新的强化 Fabric NoC(片上网络),该 NoC 旨在支持 FPGA 存储器之间的快速传输,而无需依赖芯片其他可编程逻辑资源所使用的通道。新的 NoC 拥有从 HBM 到可编程逻辑阵列中任意位置的 SRAM 块的专用路径。

下一代产品:ASIC

前面有讲到,Positron AI 的下一代产品是ASIC 硬件。据了解,该芯片将在台积电位于亚利桑那州的 Fab 21 工厂生产的(即采用 N4 或 N5 工艺技术),而且这些卡也在美国组装,这使得它们几乎完全是美国制造的。不过,由于该 ASIC 配备了 32GB HBM 内存,它采用了先进的封装技术,因此很可能是在台湾组装的。

Positron AI 的 Asimov AI 加速器将为每个 ASIC 配备 2 TB 内存,并且根据该公司发布的图片,它将不再使用 HBM,而是使用其他类型的内存。该 ASIC 还将配备 16 Tb/s 的外部网络带宽,以便在机架级系统中更高效地运行。Titan 基于八个 Asimov AI 加速器,总内存为 16 GB,预计能够在单台机器上运行高达 16 万亿个参数的模型,从而显著扩展大规模生成式 AI 应用的上下文限制。据 Positron AI 称,该系统还支持同时执行多个模型,从而消除了每个 GPU 只能运行一个模型的限制。

Sohmers 表示:“LPDDR 5X 和 6 能够以每 GB 成本的四分之一获得比 HBM 更高的容量。封装将采用常规的有机基板,这将大幅降低产品成本。”

他表示,虽然 LPDDR 的速度不如 HBM,但使用 Positron 的 IP 来接近理论峰值内存带宽足以弥补这一缺陷。Positron 还可以直接控制 DDR 上的内存刷新,这使得该公司能够比 HBM 更接近理论峰值性能,而无需承担 HBM 带来的功耗或成本开销。

随着竞争日趋激烈,分析师警告称,单靠提高芯片效率不足以应对AI工作负载的爆炸式增长。从历史上看,硬件性能的提升很快就会被新的用例和日益强大的模型所吞噬。

尽管如此,凭借新的资金、主要客户的关注以及高度专注的设计,Positron 已将自己定位于关于 AI 基础设施未来的关键辩论的中心。它(或其任何竞争对手)能否兑现承诺,将决定未来几年世界如何构建、驱动和支付 AI 的费用。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4109期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
场均19+10!前火箭队主力中锋发声:愿重返联盟!申京曾是他替补

场均19+10!前火箭队主力中锋发声:愿重返联盟!申京曾是他替补

熊哥爱篮球
2026-02-21 12:28:36
原来主动可以打破很多规则,后悔没早看到!网友:脸皮厚能吃肉

原来主动可以打破很多规则,后悔没早看到!网友:脸皮厚能吃肉

夜深爱杂谈
2026-02-11 18:31:18
女子婚礼穿低胸婚纱引热议,全程用纸巾遮挡,网友:太尴尬了!

女子婚礼穿低胸婚纱引热议,全程用纸巾遮挡,网友:太尴尬了!

流云随风去远方
2026-02-12 17:40:44
美媒:俄中舰艇或可阻挠美国打击伊朗的计划

美媒:俄中舰艇或可阻挠美国打击伊朗的计划

俄罗斯卫星通讯社
2026-02-20 15:30:23
四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

喜欢历史的阿繁
2026-02-07 14:21:17
特朗普将解密外星生命相关文件,实物黄金即将迎来宇宙级暴涨

特朗普将解密外星生命相关文件,实物黄金即将迎来宇宙级暴涨

东方豪侠
2026-02-20 14:28:41
81款主流耳机全军覆没:ToxFree检测发现均含对人体有害化学物质

81款主流耳机全军覆没:ToxFree检测发现均含对人体有害化学物质

IT之家
2026-02-20 08:19:14
春晚这一夜,“跌落神坛”的王菲,让所有人见识了她的江湖地位!

春晚这一夜,“跌落神坛”的王菲,让所有人见识了她的江湖地位!

深度解析热点
2026-02-18 15:13:48
23岁女同事住院没人管,我请7天假陪护,出院后董事长却亲自来接

23岁女同事住院没人管,我请7天假陪护,出院后董事长却亲自来接

千秋文化
2026-02-21 19:44:13
湖南益阳27岁女子扁桃体发炎输液后休克去世,丈夫称错过黄金救援4分钟,医院:诊疗符合规范,支付11万元赔偿,但拒绝家属探视遗体

湖南益阳27岁女子扁桃体发炎输液后休克去世,丈夫称错过黄金救援4分钟,医院:诊疗符合规范,支付11万元赔偿,但拒绝家属探视遗体

大象新闻
2026-02-21 13:44:05
一次解决藏南问题,桑多河谷冲突:6万大军集结,印度不敢打了

一次解决藏南问题,桑多河谷冲突:6万大军集结,印度不敢打了

正观历史
2026-02-02 17:40:07
33.9万!火锅店称把春节4天盈利分给员工,老板:去年关了两家店 但春节福利要坚持

33.9万!火锅店称把春节4天盈利分给员工,老板:去年关了两家店 但春节福利要坚持

红星新闻
2026-02-21 10:12:08
2026春节,两个成都妹儿闯重庆舞厅,一下午就遭整崩溃!

2026春节,两个成都妹儿闯重庆舞厅,一下午就遭整崩溃!

成都人的故事
2026-02-21 17:16:49
新春走基层|绝壁之上,一个“索道村”的新生

新春走基层|绝壁之上,一个“索道村”的新生

新华社
2026-02-20 22:39:30
哈佛大学:被父母用心关注的孩子,其大脑发育速度比同龄人快30%

哈佛大学:被父母用心关注的孩子,其大脑发育速度比同龄人快30%

追寻文史
2026-02-21 22:24:30
直降13℃!中雨、大雨、雨夹雪来了,湖北即将降温

直降13℃!中雨、大雨、雨夹雪来了,湖北即将降温

极目新闻
2026-02-21 09:45:26
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
销售额暴涨19%,New Balance凭“老爹鞋”逆袭耐克

销售额暴涨19%,New Balance凭“老爹鞋”逆袭耐克

新浪财经
2026-02-19 21:58:12
日本一货船与渔船发生相撞 多人死伤

日本一货船与渔船发生相撞 多人死伤

环球网资讯
2026-02-20 19:51:24
4倍赔偿!2018年,江苏男子徒手抓3200多只,被罚买12800只放生

4倍赔偿!2018年,江苏男子徒手抓3200多只,被罚买12800只放生

万象硬核本尊
2026-02-21 21:39:49
2026-02-22 08:07:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12982文章数 34803关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

时尚
数码
家居
游戏
军事航空

冬天穿衣尽量别露腿,这些基础穿搭可尝试,简单大方又不挑人

数码要闻

AMD RX 9060 XT成功超频4.769GHz!打破世界纪录

家居要闻

本真栖居 爱暖伴流年

LCK历史级统治力!GEN晋级先锋赛,轻松击败T1的BFX惨遭抽陀螺

军事要闻

硬核揭秘!福建舰“一马当先”底气何在

无障碍浏览 进入关怀版