网易首页 > 网易号 > 正文 申请入驻

一家AI芯片初创公司:不搞ASIC,用FPGA

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

今天,总部位于西雅图的人工智能硬件初创公司ElastixAI正式亮相。该公司由前苹果和 Meta 机器学习工程师创立,推出了一款基于 FPGA 的推理平台。该公司声称,与基于 Nvidia GPU 的部署相比,该平台在大型语言模型推理方面可降低高达 50 倍的总拥有成本和 80% 的功耗。

该公司于 2025 年 5 月完成了由 Fuse VC 领投的 1800 万美元种子轮融资,其 Elastix Rack 产品定位为 GPU 服务器基础设施的即插即用替代品,计划于 2026 年年中首次出货。

在发布会之前,外媒采访了联合创始人Mohammad Rastegari(首席执行官)、Saman Naderiparizi(首席技术官)和Mahyar Najibi(首席战略官),向我们阐述了 FPGA 比 GPU 更适合 LLM 推理的技术原因,以及他们为什么认为时机成熟。

人工智能训练与人工智能推理

他们的核心论点是,GPU 的设计初衷是处理计算密集型工作负载,例如 LLM 训练。但当处理内存密集型工作负载(例如 LLM 推理)时,GPU 的效率会降低,计算利用率也会大幅下降。“训练严重依赖计算,而推理严重依赖内存,”Rastegari 说。这种不匹配导致推理过程中 GPU 的计算利用率很低。


硬件的不灵活性加剧了这个问题:4 位量化理论上可以使吞吐量翻倍,但 Rastegari 指出,在像 H100 这样缺乏原生支持的硬件上,运营商“不得不围绕它构建一个软件内核,而这个内核只能利用其 10% 的潜力”。

顶级加速器依赖于速度最快、价格最昂贵的内存,而 ElastixAI 则专注于真正影响总体拥有成本 (TCO) 的指标:每带宽成本和每容量成本。通过利用机器学习定义的软件专用化,ElastixAI 能够从运行在商用现成 FPGA 服务器上的低成本硬件(例如,先进的 DDR 和 HBM)中榨取最大性能。据该团队称,这种方法能够以远低于业界顶级内存的每 GB 成本,提供高性能推理所需的内存带宽。

为什么选择FPGA而不是定制芯片

FPGA 相较于定制芯片的优势在于机器学习的发展速度远超芯片开发周期。Rastegari 是 Xnor.ai 的联合创始人,该公司于 2020 年被苹果以约 2 亿美元收购。Rastegari 后来领导了 Meta 的 Llama 405B 模型的推理优化工作。他指出,混合专家模型就是一个此前存在风险的例证。

“当时许多公司都在筹集资金,准备基于现有技术开发芯片,但随后混合专家算法出现了。”他说道,“突然之间,这些公司不得不重新设计芯片以支持混合专家算法,而这种算法在他们最初的设计过程中并不存在。”问题显而易见。定制芯片从设计到生产需要三年多的时间;而机器学习领域的快速发展可能在短短几个月内就彻底改变这一进程。

推理吞吐量需求也印证了这一点。Rastegari 加入 Meta 时,每秒 20 个词元足以满足语音交互的需求。“但对于推理而言,你需要更快地在后台生成词元;现在需要每秒 200 个词元。” 随着这些需求的变化,FPGA 可以重新配置。

“通用性和效率之间存在着根本性的权衡。一旦你想要更通用,就会降低效率,因为你必须增加额外的硅片来覆盖许多不同的工作负载。”

Rastegari认为,Transformer架构目前在结构上足够稳定,可以进行FPGA实现,而底层优化层仍在快速发展,因此锁定固定的芯片设计仍然存在风险。关于最终是否会流片定制芯片的问题,他谨慎地表示:“决定我们何时以及是否流片芯片的,实际上取决于机器学习改进的速度。”


功率、成本和机架兼容性

Naderiparizi 谨慎地对主要性能数据进行了限定。他表示:“根据我们采用的令牌速率,与英伟达 B200 相比,我们可以在成本方面实现 10 倍甚至 50 倍的性能提升。”他指出,这一范围反映了目标用户不同的“每用户延迟”(或者说每秒每用户令牌数)。

这些数据涵盖了整个数据中心部署的资本支出和运营支出,并通过与FPGA制造商和数据中心运营商的合作验证。在功耗方面,Naderiparizi表示,在相同吞吐量下,每个令牌的功耗降低了五倍。

Elastix 机架符合标准的 17-19 kW 机架功率范围,并采用空气冷却,而 Nvidia 的 GB200 NVL72 需要 120 kW 至 200 kW 的功率以及大多数现有数据中心无法支持的专用液冷基础设施。

直接替换

集成是通过 vLLM 插件实现的,该插件替换了 Nvidia CUDA 后端,同时保持前端 OpenAI 兼容 API 不变,因此从 GPU 基础架构迁移的运营商无需修改其应用程序堆栈。

ElastixAI计划最终向机器学习研究人员开放其模型转换工具——Naderiparizi明确地将这一策略与Nvidia构建CUDA生态系统的方式进行了比较。“起初,Nvidia免费向研究人员发布其软件。但问题在于,CUDA是为Nvidia服务的——人们为CUDA框架开发的任何东西都会对Nvidia有所帮助。” ElastixAI计划围绕其自身平台构建同样的开发者良性循环。

创始团队成员还包括纳吉比 (Najibi),他曾为苹果智能团队做出贡献,此前还担任过 Waymo 的首席科学家。公司董事会成员之一是乔恩·格尔西(Jon Gelsey ),他曾担任 Xnor.ai 的首席执行官,也是 Auth0 的创始首席执行官,Auth0 后来被 Okta 以 65 亿美元收购。格尔西目前担任 ElastixAI 的战略和市场营销主管。

ElastixAI 目前仅面向部分企业合作伙伴和数据中心运营商开放,硬件出货预计将于 2026 年年中开始。

(来源:编译自allaboutcircuit)

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4329期内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
溃败式输球,山东高速男篮全员状态低迷,邱彪的细节处理极不到位

溃败式输球,山东高速男篮全员状态低迷,邱彪的细节处理极不到位

阿错田间生活
2026-04-04 21:53:45
3月销量"惨案":长城汽车,已被"四座大山"压成第二梯队?

3月销量"惨案":长城汽车,已被"四座大山"压成第二梯队?

沙雕小琳琳
2026-04-03 15:28:47
医院就诊患者惊现“某某之女”被怒斥!网友:打拳打到新生儿科了

医院就诊患者惊现“某某之女”被怒斥!网友:打拳打到新生儿科了

火山詩话
2026-04-04 17:02:01
重磅!土木工程学院被正式撤销!!

重磅!土木工程学院被正式撤销!!

新浪财经
2026-04-03 21:40:45
谁让黑人留学生的待遇如此之高?

谁让黑人留学生的待遇如此之高?

红色少女主播
2026-04-03 21:29:58
0-1!王彤坑死泰山,泰山为韩鹏重用兄弟买单:3大水货稳获首发

0-1!王彤坑死泰山,泰山为韩鹏重用兄弟买单:3大水货稳获首发

建哥说体育
2026-04-04 20:10:58
绝处逢生!王楚钦4-3逆转达科!赛后高情商发言尽显格局与担当!

绝处逢生!王楚钦4-3逆转达科!赛后高情商发言尽显格局与担当!

田先生篮球
2026-04-04 22:20:51
哀悼!张福云教授逝世

哀悼!张福云教授逝世

双一流高校
2026-04-04 00:10:15
伊朗发动“真实承诺-4”行动第95波攻势

伊朗发动“真实承诺-4”行动第95波攻势

新华社
2026-04-04 21:40:09
女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

一盅情怀
2026-03-16 17:28:45
广东男篮对阵广厦男篮,半场球员评分:3人满分,3人不合格

广东男篮对阵广厦男篮,半场球员评分:3人满分,3人不合格

阿衃体育
2026-04-04 21:08:47
格伊:四线五杀利物浦?不是靠我一个人,纯属巧合罢了

格伊:四线五杀利物浦?不是靠我一个人,纯属巧合罢了

懂球帝
2026-04-04 22:30:08
施瓦辛格私生子太争气,首夺健美冠军!女保姆所生,肌肉复制父亲

施瓦辛格私生子太争气,首夺健美冠军!女保姆所生,肌肉复制父亲

头号电影院
2026-04-03 22:24:38
鏖战!前四局2平后,王曼昱五六局压着桥本,4-2艰难晋级四强!

鏖战!前四局2平后,王曼昱五六局压着桥本,4-2艰难晋级四强!

篮球资讯达人
2026-04-04 21:49:24
老网游再回潮,为什么停服多年的经典游戏突然又被玩家想起?

老网游再回潮,为什么停服多年的经典游戏突然又被玩家想起?

17173游戏网
2026-04-03 15:48:14
周杰伦演唱会口碑又崩了,本人唱不上去就划水,舞美落后效果不佳

周杰伦演唱会口碑又崩了,本人唱不上去就划水,舞美落后效果不佳

萌神木木
2026-04-04 14:15:57
为黄金叛逃台湾,陈宝忠驾机遭朝军拦截,最终下场悲惨

为黄金叛逃台湾,陈宝忠驾机遭朝军拦截,最终下场悲惨

磊子讲史
2026-03-31 11:28:08
49岁广东男子长期吃复方丹参滴丸,4年后复查,身体情况有啥变化

49岁广东男子长期吃复方丹参滴丸,4年后复查,身体情况有啥变化

路医生健康科普
2026-04-04 11:25:03
断更五个月!知名网红董赤赤发声,患严重抑郁,还遭导演恶意引导

断更五个月!知名网红董赤赤发声,患严重抑郁,还遭导演恶意引导

裕丰娱间说
2026-04-04 19:21:13
菲尔兹奖得主牵头近2000名数学家拒绝赴美,数学家大会陷入争议

菲尔兹奖得主牵头近2000名数学家拒绝赴美,数学家大会陷入争议

DeepTech深科技
2026-04-04 12:10:59
2026-04-04 22:59:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
13314文章数 34861关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

媒体:美军上演现实版"拯救大兵" 特朗普"赢学"被打脸

头条要闻

媒体:美军上演现实版"拯救大兵" 特朗普"赢学"被打脸

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

旅游
健康
亲子
游戏
军事航空

旅游要闻

山东清明首日文旅市场火爆,多元活动激发出游热情

干细胞抗衰4大误区,90%的人都中招

亲子要闻

中俄带娃观念差异有多大

别偷看啦!《红色沙漠》美女NPC全都懂

军事要闻

美军又一架战机坠毁 此前F-15E被击落

无障碍浏览 进入关怀版