网易首页 > 网易号 > 正文 申请入驻

Agent运行提速10倍!斯坦福教授押注异构推理,破解AI推理瓶颈

0
分享至

过去两年,我们已经习惯了与大模型对谈,但 AI 的进化并未止步于此。现在,行业正集体转向一个更具野心的目标——AI Agent。不同于只会见招拆招的聊天机器人,AI Agent 更像是一个拥有自主行动能力的“数字员工”:它会自主上网搜集情报、多维分析海量数据、甚至跨平台调用各种专业工具完成复杂的业务闭环。

但问题来了,在一次完整的执行流中,Agent 会产生海量的计算步骤,且各环节对硬件的需求存在本质差异:逻辑推理阶段依赖极速计算,知识检索阶段渴求高带宽存储,而工具调用则对网络 I/O 的响应时延有着近乎苛刻的要求。

这种复杂的、多阶段的任务特性,导致了当前算力架构中一个极其尴尬的悖论:由于缺乏精细化的调度能力,开发者往往只能将所有任务都扔到同一种硬件(通常是高端 GPU)上跑,而硬件性能与任务需求其实并不匹配。

据统计,目前全球数据中心硬件的平均利用率仅维持在 15%-30% 之间。这意味着,在 AI 浪潮狂热扩张的背后,每年有价值数百亿美元的算力资源正处于隐性的闲置与浪费之中。

为了打破这种桎梏,一个被视为下一代 AI 基础设施核心的理念——“异构推理”应运而生。异构推理就是让 AI 在推理时,不再只盯着一种芯片使劲,而是根据任务的不同需求,把工作拆开,分给最适合的多种硬件去协同完成。

权威 IT 研究与顾问咨询公司 Gartner 预测,到 2028 年,40% 的领先企业会采用混合计算架构,把 CPU、GPU、ASIC、甚至不同代际的芯片混在一起用。同时,2026 年全球 AI 基础设施支出预计将达到约 1.36 万亿美元,推理部分占比正快速超过训练,成为 AI 计算的主战场。

近日,总部位于美国旧金山的 AI 基础设施初创公司 Gimlet Labs 宣布完成 8,000 万美元 A 轮融资。此轮由知名风投 Menlo Ventures 领投,至此,该公司累计融资达到 9,200 万美元。

天使投资人包括红杉资本的合伙人比尔·科夫兰(Bill Coughran)、斯坦福大学教授及网络专家尼克·麦基翁(Nick McKeown)、VMware 前首席执行官拉古·拉古拉姆(Raghu Raghuram)以及英特尔首席执行官陈立武(Lip-Bu Tan)。值得注意的是,英特尔前首席技术与人工智能官 Sachin Katti(萨钦·卡蒂)参与其中,担任 Gimlet 的顾问,他曾与创始人兼首席执行官 Zain Asgar(扎因·阿斯加)在斯坦福共同授课并合作相关研究。

Gimlet 针对上述问题推出了一个无服务器的 AI 推理云平台 Gimlet Cloud。它就像是一个聪明的“云端指挥部”,会自动将复杂的 AI Agent 工作拆解成很多环节,然后根据每个环节的需求,精准地分配给最合适的硬件。比如计算重的用高端 GPU,内存重的找加速器,联网重的用带快网的机器。甚至能把英伟达、AMD、英特尔、ARM 等不同厂商、不同代际的芯片混在一起协同工作。

根据 Gimlet 官方披露的数据,这种异构调度方式能让同样的 AI Agent 在不增加电费和硬件投入的情况下,运行速度提升 3 到 10 倍,显著降低每 token 成本,同时解锁原本闲置的老旧算力。

为了让模型在各种新旧、不同品牌的芯片上都能丝滑运行,Gimlet 还开发了一款工具 kforge,它能用 AI 自己帮模型写出最优的底层代码,让不同硬件自动跑得更顺,省掉程序员大量手动调试的功夫。

正如阿斯加所言,“我们的目标基本上是设法将当今 AI 工作负载的效率提升 10 倍。”

阿斯加是斯坦福大学的兼职教授,曾在英伟达担任 GPU 架构师、在谷歌担任软件工程师。他与其他三位联合创始人曾共同创办了知名可观测性平台 Pixie Labs,后被 New Relic 收购。而就在被收购的两个月前,该公司刚刚完成了由 Benchmark 领投的 900 万美元 A 轮融资。


图 | 创始团队(来源:Gimlet )

在宣布融资的同时,Gimlet 还透露,公司目前营收已达八位数,自结束隐身模式以来客户群增长了两倍,其客户群在过去四个月内增长了一倍以上,目前包括一家顶尖的前沿模型实验室和一家超大规模云服务商,但并未透露两家公司的名称。

此外,该公司还与包括 AMD、ARM、Cerebras、d-Matrix、英特尔和英伟达在内的领先人工智能芯片公司开展合作。

1.https://gimletlabs.ai/blog/announcing-series-a

2.https://www.gartner.com/en/newsroom/press-releases/2025-10-20-gartner-identifies-the-top-strategic-technology-trends-for-2026

运营/排版:何晨龙Agent运行提速10倍!斯坦福教授押注异构推理,破解AI推理瓶颈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别查了,受不了!巴拿马外长终于急了:请中国尊重我!

别查了,受不了!巴拿马外长终于急了:请中国尊重我!

青青子衿
2026-04-10 01:19:51
追觅俞浩工作群发飙:把宇树所有客户抢过来,2亿招首席科学家

追觅俞浩工作群发飙:把宇树所有客户抢过来,2亿招首席科学家

三言科技
2026-04-10 14:05:08
金莎婚后财产9:1分配惹争议,新露面孕肚明显,业内曝其赚钱不易

金莎婚后财产9:1分配惹争议,新露面孕肚明显,业内曝其赚钱不易

古希腊掌管松饼的神
2026-04-10 11:08:21
段永平“再吹”新拼姆

段永平“再吹”新拼姆

牛刀财经
2026-04-10 10:55:24
世界上最可怜的国家:全国仅两辆公交、吃青菜算土豪,面临被淹没

世界上最可怜的国家:全国仅两辆公交、吃青菜算土豪,面临被淹没

老谢谈史
2026-04-10 13:40:50
耐克千元世界杯新战袍翻车!球员穿上肩膀凸起大包,官方急道歉

耐克千元世界杯新战袍翻车!球员穿上肩膀凸起大包,官方急道歉

仰卧撑FTUer
2026-04-10 16:49:02
年薪百万但裁员劝退,计算机开始塌房了?

年薪百万但裁员劝退,计算机开始塌房了?

差评XPIN
2026-04-11 00:05:35
不留骨灰,不设墓地,不立碑,59岁王志文对后事的安排让人深思

不留骨灰,不设墓地,不立碑,59岁王志文对后事的安排让人深思

北纬的咖啡豆
2026-04-08 14:48:50
49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

浩渺青史
2026-03-25 13:59:19
秋瓷炫不再回避,坦白和于晓光婚姻真相,婚内出轨传闻早真相大白

秋瓷炫不再回避,坦白和于晓光婚姻真相,婚内出轨传闻早真相大白

距离距离
2026-04-09 23:00:44
体育总局宣布周继红免职退休,曾引发内斗争议,如今能否平稳落地

体育总局宣布周继红免职退休,曾引发内斗争议,如今能否平稳落地

元哥说历史
2026-01-10 11:50:03
林彪得知前未婚妻卖鞋为生,托人送去3000元,汪静宜:他还没忘我

林彪得知前未婚妻卖鞋为生,托人送去3000元,汪静宜:他还没忘我

历史龙元阁
2026-04-10 13:30:19
一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

共工之锚
2026-04-08 00:29:52
赔光2亿后,冉莹颖独自搬家30箱未给邹市明留体面

赔光2亿后,冉莹颖独自搬家30箱未给邹市明留体面

春之韵
2026-03-18 09:32:52
4年8100万!回看哈特交易和续约,是否超值?

4年8100万!回看哈特交易和续约,是否超值?

篮球实录
2026-04-11 00:30:09
以色列宣布:不停火,将继续在黎作战,伊朗已虚弱,真主党已被孤立!特朗普最新表态,伊朗发声!内塔尼亚胡腐败案将恢复审理

以色列宣布:不停火,将继续在黎作战,伊朗已虚弱,真主党已被孤立!特朗普最新表态,伊朗发声!内塔尼亚胡腐败案将恢复审理

每日经济新闻
2026-04-10 20:48:29
德国总理:绝不允许以色列军事行动破坏中东和平进程

德国总理:绝不允许以色列军事行动破坏中东和平进程

环球网资讯
2026-04-10 09:09:08
张雪机车夺冠赛车复刻版被“秒拍”:45秒就达500万封顶价 买主称代表一公司拍下

张雪机车夺冠赛车复刻版被“秒拍”:45秒就达500万封顶价 买主称代表一公司拍下

红星新闻
2026-04-10 23:17:19
600082,将被“ST”!

600082,将被“ST”!

中国基金报
2026-04-10 22:59:01
老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

未央看点
2026-04-05 15:48:09
2026-04-11 08:43:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16563文章数 514860关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

美伊谈判倒计时 特朗普:美方已为军舰装载最先进武器

头条要闻

美伊谈判倒计时 特朗普:美方已为军舰装载最先进武器

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

家居
亲子
游戏
房产
健康

家居要闻

复古风格 自然简约

亲子要闻

时间会融化所有尖锐,只剩平静

任天堂独占传统不再!经典作品跨平台引粉丝不满

房产要闻

28条新规落地!好房子,终于有了“广州标准”!

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版