网易首页 > 网易号 > 正文 申请入驻

GPU独霸的时代,必将结束

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。


人工智能加速硬件的成本日益高昂,下一代芯片需要更高的功耗和大量的基础设施投资。对于许多初创公司和小型企业而言,大规模部署人工智能的成本和复杂性在软件开发开始之前就已构成障碍。

像 FuriosaAI 这样的新兴硅芯片厂商正试图重新思考这一格局,专注于效率、性能以及替代 GPU 主导市场的方案。

FuriosaAI 是一家总部位于韩国的公司,致力于开发高性能人工智能推理芯片,旨在降低功耗和数据中心压力。其最新处理器 RNGD 基于公司自主研发的张量收缩处理器架构,旨在无需依赖传统 GPU 框架即可运行高要求的人工智能模型。

FuriosaAI 的首席执行官兼联合创始人 June Paik 在 2017 年创立该公司之前,曾在AMD和三星担任硬件和软件工程师。我们与他探讨了人工智能芯片初创公司面临的挑战、数据中心的未来,以及 FuriosaAI 计划如何在受能源限制、基础设施成本和英伟达长期主导地位影响的行业中竞争。

问:从历史上看,日本和欧洲涌现出了一些伟大的公司(ST Electronics、NEC 等),为什么中国和美国以外的 AI 芯片厂商如此之少?

答:首先,我想对你的前提提出一些质疑:在人工智能领域,几乎没有哪家硬件初创公司能够撼动英伟达的统治地位。即使在 AlexNet 问世十五年后,我们仍然处于这个行业的早期阶段。而且,一些人工智能硬件创新者,例如 Hailo 和 Axelera,实际上并非来自美国或中国。

但由于结构性原因,这份名单很短。

与加密货币挖矿(算法固定,简单的ASIC矿机就能很好地工作)不同,人工智能正在快速发展和演变。

为不断变化的市场需求打造芯片需要硬件和编译器方面的专业知识,而这些知识往往集中在半导体产业底蕴深厚的地区。此外,世界上只有少数几个地方与晶圆厂和芯片制造合作伙伴建立了深厚的合作关系。

这就是为什么总部设在韩国实际上对Furiosa来说是一个竞争优势。

我们能够接触到韩国大学世界一流工程项目和韩国科技巨头的优秀人才。我们还与韩国(例如,SK海力士为我们的第二代芯片推理芯片RNGD提供HBM3)以及亚洲其他地区(例如,我们的代工厂合作伙伴台积电)的领先企业建立了合作关系。

与硅谷的距离也迫使我们采取非常自律的方式。Furiosa 最初仅靠 100 万美元的种子轮融资起步,我们在芯片交付之前花了数年时间完善我们的理念。

我们完全致力于基于张量收缩的方法,并且能够忽略硅谷的传统观念和炒作。

但硬件必须在全球市场竞争;我们不能仅仅成为区域供应商。现在,随着RNGD产品批量出货,我们正在与世界各地的企业客户合作。

问:硬件只是成功的一部分,英伟达花了数年时间才打造出如今声名远扬的软件护城河(CUDA)。Furiosa 正在采取哪些措施来对抗其强大的对手?

答:试图复制英伟达庞大的 CUDA 库是一个战略死胡同。

我们采取了更大胆的做法,从第一性原理出发,专门为人工智能共同设计硬件和软件,这样我们就无需重新创建 CUDA。

我们的芯片采用 Furiosa 专有的张量收缩处理器 (TCP) 架构,该架构能够原生执行深度学习的多维数学运算,而不是将其强行放入 GPU 使用的传统结构中。

这使得我们的编译器能够在无需数千个手工调优内核的情况下优化模型。

RNGD目前已投入量产,充分展现了我们方法的优势。它能为世界上最苛刻的模型提供高性能推理,而功耗仅为180瓦(相比之下,GPU需要600瓦甚至更高)。

LG AI Research等全球合作伙伴已在生产中验证了这一突破性的效率。

我们还打破了 CUDA 的锁定,构建了能够与 PyTorch 和 vLLM 等标准工具无缝集成的软件栈,以便开发人员无需改变工作流程即可获得这种性能。

问:大型超大规模数据中心运营商(如谷歌、微软和亚马逊)正逐步构建自己的AI芯片解决方案,以减少对第三方供应商的依赖。那么,Furiosa(以及其他类似公司)在这一趋势中扮演着怎样的角色呢?

答:当前的GPU架构给整个行业(包括超大规模数据中心)带来了严峻的能源挑战和基础设施瓶颈。我们展望未来,异构计算将成为主流,不同的架构可以协同工作,以最高效的方式满足不同的需求(例如训练与推理)。

因为我们优先考虑总拥有成本、能源效率和灵活性,所以我们的技术将在解决所有人面临的这个问题上发挥核心作用。

我们目前重点关注四个特定领域,这些领域正最强烈地感受到电力和基础设施方面的难题:

  • 各国和受监管行业需要在本地而非公共云上处理敏感数据。RNGD 使他们能够在现有电力资源范围内部署高性能推理,从而确保数据主权,而无需大规模的新基础设施项目。

  • 对于企业客户而言,总体拥有成本 (TCO) 和灵活性至关重要。RNGD 可安装在标准的 15kW 风冷机架中,避免了传统 GPU 所需的高昂液冷改造费用,使其成为扩展速度最快、成本效益最高的方式。

  • 区域性和专业性云服务商需要在利润率方面与三大巨头竞争。RNGD 的高计算密度使云服务提供商 (CSP) 能够在保持低运营成本 (OpEx) 的同时,最大限度地提高每个机架的收入。

  • 其他行业,例如电信运营商,也在网络边缘的电力受限数据中心环境中工作。RNGD 的节能特性也能满足他们的需求。

我们正在开发的下一代芯片将直接面向超大规模数据中心以及这些关键行业。

问:您认为数据中心的未来发展趋势是什么?(假设您在 2036 年参观一个数据中心,您会看到什么?)

答:10 年后,“数据中心”的含义将发生很多变化,就像“计算机”一词现在已经可以指代从智能手表到高性能服务器的一切事物一样。

有些数据中心会像你想象的那样,是那种充满未来感的设施:规模庞大,而且(很可能)采用聚变能源或绕地球运行。但另一些数据中心则会很小巧,但效率极高。

例如,您当地的医院将拥有一个本地人工智能数据中心,用于运行医生和护士的智能助手,从而保持低延迟,并确保数据本地化和安全。

电信运营商将拥有许多高性能的“边缘”人工智能数据中心,这些数据中心针对极低延迟进行了优化。

我确信的一点是,2036年的人工智能数据中心不会再充斥着GPU,而是会配备各种满足不同需求的专用人工智能芯片。

部分原因是GPU的能效较低。但从根本上讲,人们普遍认为GPU架构并不适合人工智能。

GPU 制造商一直致力于通过创新来弥合这一差距,例如在芯片中添加张量核心,但最终从 GPU 转向 AI 优先架构的好处将太大,不容忽视。

问:在不透露太多产品路线图细节的情况下,Furiosa 的芯片是否会遵循人工智能产品的传统发展路径?

答:我们现在以及未来的产品都专注于提供企业客户最需要的产品:高性能数据中心推理,同时还要节能、经济高效,并且易于部署,无需进行大规模的基础设施升级。

这意味着要优先考虑每瓦token数和每机架token数等指标,以提高计算密度。

我们还将积极利用行业新进展,例如更小的制程节点和新的内存技术。

我们的第一代芯片采用14纳米制程。我们的RNGD芯片采用HBM3显存和5纳米制程,我们将继续推进技术进步。但正是我们的架构创新,使我们能够实现比采用相同制程的GPU更优异、更节能的性能。

关于我们的产品路线图,还有一点需要说明,那就是软件和硬件同等重要。Furiosa 的软件工程师数量多于硬件工程师,因为我们必须持续快速有效地支持新的模型和部署工具。

我们在 2025 年发布了三个主要的 SDK 更新,并将在 2026 年及以后保持这一速度。

https://www.techradar.com/pro/the-ai-data-centers-of-2036-wont-be-filled-with-gpus-furiosaais-ceo-on-the-future-of-silicon

(来源:编译自techradar)

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4326期内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
朱婷最新决定曝光!不是退役,不去土耳其联赛,已拒绝多队报价

朱婷最新决定曝光!不是退役,不去土耳其联赛,已拒绝多队报价

跑者排球视角
2026-02-24 17:28:31
丰田突然官宣:13.78万起,新车正式上市

丰田突然官宣:13.78万起,新车正式上市

高科技爱好者
2026-02-24 22:56:39
“36斤活羊烤完仅6.9斤”系非正常投喂增重,涉事餐馆附近同行斥责:太离谱,败坏了口碑生意做不长

“36斤活羊烤完仅6.9斤”系非正常投喂增重,涉事餐馆附近同行斥责:太离谱,败坏了口碑生意做不长

极目新闻
2026-02-24 13:19:26
谷歌Gemini 3.1 Pro新王登场!一口气手搓Win11操作系统

谷歌Gemini 3.1 Pro新王登场!一口气手搓Win11操作系统

智东西
2026-02-23 17:35:51
广东一网红餐厅卖“冰镇男友”,被指擦边低俗

广东一网红餐厅卖“冰镇男友”,被指擦边低俗

昆明信息港
2026-02-25 10:44:17
被公认的今年春晚最佳小品,没有之一!

被公认的今年春晚最佳小品,没有之一!

犀利强哥
2026-02-24 19:32:52
2月23日俄乌最新:辉煌的战果

2月23日俄乌最新:辉煌的战果

西楼饮月
2026-02-23 16:56:49
西甲裁判技术委员会:孔德被踩事件VAR存在明显且严重的失误

西甲裁判技术委员会:孔德被踩事件VAR存在明显且严重的失误

懂球帝
2026-02-25 07:34:50
浓眉:真正的冠军球队,是没有任何东西能动摇其决心的

浓眉:真正的冠军球队,是没有任何东西能动摇其决心的

懂球帝
2026-02-25 01:26:05
英媒:美国冰球队迈阿密纵酒狂欢 伏特加香槟龙舌兰共喝103万酒水

英媒:美国冰球队迈阿密纵酒狂欢 伏特加香槟龙舌兰共喝103万酒水

劲爆体坛
2026-02-25 10:22:03
0进球封神!震撼!哈兰德凭啥让瓜帅彻底折服

0进球封神!震撼!哈兰德凭啥让瓜帅彻底折服

卿子书
2026-02-25 08:50:35
销冠的我年终奖仅5.9万,躺平同事却拿81万!从此半年0业绩

销冠的我年终奖仅5.9万,躺平同事却拿81万!从此半年0业绩

时尚的弄潮
2026-02-25 11:35:46
东体:有其他俱乐部有意艾菲尔丁,海港27日举行出征仪式

东体:有其他俱乐部有意艾菲尔丁,海港27日举行出征仪式

懂球帝
2026-02-25 11:46:06
韩信刚死满朝欢呼,张良一句话吓瘫刘邦:四十万匈奴压境 谁去退

韩信刚死满朝欢呼,张良一句话吓瘫刘邦:四十万匈奴压境 谁去退

老谢谈史
2026-02-24 11:12:25
订单排到年底!亨通、永鼎、华工、烽火,谁是光通信里最能涨的?

订单排到年底!亨通、永鼎、华工、烽火,谁是光通信里最能涨的?

Thurman在昆明
2026-02-25 04:45:03
汪小菲再当爹,恶心事接连发生!马筱梅面目曝光,连婴儿都不放过

汪小菲再当爹,恶心事接连发生!马筱梅面目曝光,连婴儿都不放过

离离言几许
2026-02-25 13:44:26
狂吸2010万人次!这个春节,广州被全网夸了!

狂吸2010万人次!这个春节,广州被全网夸了!

广州楼市发布
2026-02-24 18:21:14
巴拿马政府强行进入并接管港口,李嘉诚旗下长和回应:相关行动不合法,构成严重风险,将研究所有可行途径

巴拿马政府强行进入并接管港口,李嘉诚旗下长和回应:相关行动不合法,构成严重风险,将研究所有可行途径

都市快报橙柿互动
2026-02-24 14:12:41
周杰伦2026演唱会海报引发热议,网友称“像AI创作”!

周杰伦2026演唱会海报引发热议,网友称“像AI创作”!

手工制作阿歼
2026-02-25 09:32:20
A股:今天,股市又拉升了,但是,这次释放了两个信号!

A股:今天,股市又拉升了,但是,这次释放了两个信号!

明心
2026-02-25 11:37:15
2026-02-25 14:31:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
13013文章数 34810关注度
往期回顾 全部

科技要闻

台积电市值破2万亿美元,翻倍只用了16个月

头条要闻

老人被大狗撕咬骨折住进ICU 犬主付1000元后驾车离开

头条要闻

老人被大狗撕咬骨折住进ICU 犬主付1000元后驾车离开

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

春节档"开门黑" 电影票少卖了7000万张

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

旅游
亲子
房产
本地
公开课

旅游要闻

这个春节,日均15.56万人次逛廊道

亲子要闻

花园宝宝致敬过这一段

房产要闻

330万人涌入!春节全国楼市,第一个卖爆的区域出现了!

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版