网易首页 > 网易号 > 正文 申请入驻

性价比搏击:Grok 4 Fast 推理成本直降 98%

0
分享至

雷峰网讯 几乎没有预热,马斯克不声不响把模型调用成本砍掉 98%。

作为低成本推理模型的最新进展,xAI 于上周五发布了其旗舰模型的轻量化版本 Grok 4 Fast。

通过大规模强化学习实现智能密度最大化,Grok 4 Fast 在基准测试上实现了与 Grok 4 相当的表现。同时由于推理任务的平均 token 消耗减少了 40 %,xAI 此次更新将前沿模型的调用成本大幅降低。

据官方测算,Grok 4 Fast 单个推理任务的成本最低可降至原来的 2%。

这已经是一个可以改写大模型竞争规则的数字。

端到端强化学习

如果要给 Grok 4 Fast 三个关键词,那应该是 AI 搜索、上下文窗口和统一模型架构。

xAI 在一篇博客中介绍,Grok 4 Fast 拥有原生的工具调用能力,这是指 Grok 4 Fast 通过端到端工具使用强化学习进行训练,在决定何时调用代码或网页等工具方面表现出色。

由于背靠 X 平台的丰富数据,此举为 Grok 4 Fast 在自主探索能力方面带来的优势更为突出。该模型能够无缝浏览网页和 X 平台,利用实时数据增强查询,同时支持跳转链接获取媒体内容,并以极快速度综合生成结果。

对于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基准测试中,表现优均于 Grok 4。

在 LMArena 的搜索竞技场中,Grok 4 Fast 以 1163 分位列第一,力压此前 OpenAI 领先的 o3-websearch,更是优于 gpt-5-search 和 grok-4-search。在文本竞技场中,Grok 4 Fast 则排名第八,以一分之差险胜 grok-4-0709版本。

可以看到,Grok 4 Fast 已经显著优于同等量级的模型,而在搜索相关任务中,模型参数造成的差距则可以被强化学习带来的推理效率和智能密度所追平甚至跨越。


即将和 Grok 4 Fast 同期推出的是其两个版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即长链式思维和快速响应两种推理模式,均具备 200 万 token 的上下文窗口。

值得一提的是,Grok 4 Fast 采用了统一模型架构。

此前,在不同推理模式下应用不同的独立模型已经成为业界通行的选择。对于仅需要简单回答和大量推理的任务,手动切换模型的开关对于各个模型厂商来说几乎已是标配。

而 Grok 4 Fast 此次更新引入了统一架构,其中 reasoning(长链式思维)和 non-reasoning(快速响应)两种模式由同一模型权重处理,推理过程中通过系统提示进行引导。

这种设计进一步降低了端到端延迟和 token 成本。可以预见的结果是,在压缩调用成本之外,Grok 4 Fast 距离那些对即时响应存在高需求的场景也更近了一步。

SOTA 性价比

SOTA 一日三变,市场对模型性能挤牙膏的戏码早就没有了耐心。

xAI 也深知这一点,所以比起循例公布的基准测试结果,此次更新真正的“军火展示”其实是下面这两张图。



Grok 4 Fast 的 token 效率提升了 40%,加之每个 token 的大幅降价,最终结果是开发者的模型调用成本显著降低。而此时的模型性能,仍可以基本保持在 Grok 4 的水平。

根据 Artificial Analysis 的独立评测,Grok 4 Fast 相较于其它公开可用的模型,展现出了 SOTA 级别的性价比。

在官方博客中,xAI 将 Grok 4 Fast 称为“低成本推理的最近进展”。98% 的成本压缩一出,马斯克就差把“我们最便宜大碗”写在脸上。虽然没能在追求智能上限的路上甩开友商,但“谁都能用”是在“比谁都强”之外,另一种打遍天下的可行方案。

在此前的很长一段时间里,大模型都是一场暴力美学的军备竞赛,更大的参数规模、算力消耗和更强的推理能力成为了模型厂商竞争的硬指标。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是这种极致性能追求下的产物。

然而实验室之外的世界没有那么关注技术边界,当大模型以一款产品的角色面向市场,过去的技术路线也在应用场景之前留下了一道道坎,其中最为明显的就是昂贵的推理成本和漫长的响应时间。

相比之下,曾经被视为阉割性能的小模型,如今却正在成为应用普及的关键角色。

xAI 虽未公布 Grok 4 Fast 的具体参数,但根据命名逻辑的行业惯例,其大概率是在 Grok 4 的基础上通过蒸馏、架构优化等技术降低了计算负载与延迟。这意味着它能在更低配置的服务器甚至边缘设备上高效运行,并实现远低于 Grok 4 Heavy 每百万 tokens 输入 3 美元、输出 15 美元的“奢侈品”定价。

“低成本推理”主打的不是推理,而是低成本。在智能上限短期内突破无望的背景下,每省下一个 token,每个 token 多便宜一点,都是向落地多迈出了一步。而在这场性价比搏击中,马斯克先挥出了一记重拳。

参考资料:

https://x.ai/news/grok-4-fast#native-tool-use-with-sota-search

雷峰网文章

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
局势再度升级,战争是不可预测的

局势再度升级,战争是不可预测的

中产先生
2026-03-09 12:53:46
徐若瑄妈妈70大寿,贾静雯林心如上台献唱,徐妈出场太惊艳

徐若瑄妈妈70大寿,贾静雯林心如上台献唱,徐妈出场太惊艳

嘴角上翘的弧度
2026-03-10 08:05:06
最高法:依法惩处唐仁健、罗保铭等57名原中管干部

最高法:依法惩处唐仁健、罗保铭等57名原中管干部

极目新闻
2026-03-09 10:15:54
“成都黑老大”雷晓伟:嚣张至极,残杀亿万富豪,43岁被处决

“成都黑老大”雷晓伟:嚣张至极,残杀亿万富豪,43岁被处决

叹为观止易
2026-03-09 20:35:10
以色列市长餐厅遭到“斩首”式枪击,中东报复性暗杀循环正式打响

以色列市长餐厅遭到“斩首”式枪击,中东报复性暗杀循环正式打响

看看七七
2026-03-10 07:35:10
这所大学宣布破产,政府接管

这所大学宣布破产,政府接管

深度报
2026-03-09 23:39:09
养龙虾的第一批受害者出现了!OpenClaw给装惨用户自动转了笔钱

养龙虾的第一批受害者出现了!OpenClaw给装惨用户自动转了笔钱

柴狗夫斯基
2026-03-10 08:15:15
NBA历史首现!黄蜂将次轮签送至热火 解决两年前罗齐尔交易纠纷

NBA历史首现!黄蜂将次轮签送至热火 解决两年前罗齐尔交易纠纷

罗说NBA
2026-03-10 06:11:07
余额高达508586.51元!一邯郸职工公积金引发热议,网友:一般般

余额高达508586.51元!一邯郸职工公积金引发热议,网友:一般般

火山詩话
2026-03-08 11:24:05
年薪600万华为技术总监,美国公民身份曝光,带13人窃密获刑

年薪600万华为技术总监,美国公民身份曝光,带13人窃密获刑

过期少女致幻录
2026-03-02 02:11:15
索博升级版!利物浦瞄准 1 亿中场新核,名宿直言:比赖斯更强

索博升级版!利物浦瞄准 1 亿中场新核,名宿直言:比赖斯更强

澜归序
2026-03-10 06:29:33
军事专家称:照这么打下去,等伊朗导弹打光了,美国就笑到最后了

军事专家称:照这么打下去,等伊朗导弹打光了,美国就笑到最后了

我心纵横天地间
2026-03-08 14:01:34
“龙虾”狂欢④AI“养虾”技术指南:怎么养,要注意哪些风险

“龙虾”狂欢④AI“养虾”技术指南:怎么养,要注意哪些风险

澎湃新闻
2026-03-10 07:48:29
阿斯:恩德里克替补登场状态低迷,离谱远射引起球迷嘘声

阿斯:恩德里克替补登场状态低迷,离谱远射引起球迷嘘声

懂球帝
2026-03-09 15:08:17
特朗普宣称美国“已经赢了”,伊朗新领袖没有发表讲话

特朗普宣称美国“已经赢了”,伊朗新领袖没有发表讲话

近距离
2026-03-10 07:58:13
一天开13个会、一个Bug要修200天!前亚马逊L7爆料:这轮大裁员,AI只是“背锅侠”

一天开13个会、一个Bug要修200天!前亚马逊L7爆料:这轮大裁员,AI只是“背锅侠”

CSDN
2026-03-09 19:11:04
美专家突然发现,中国早就准备好,一旦冲突,先废掉美军最强战力

美专家突然发现,中国早就准备好,一旦冲突,先废掉美军最强战力

墨印斋
2026-03-09 11:30:27
伊朗驻华大使回应哈梅内伊之子当选最高领袖、霍尔木兹海峡问题:如果世界希望能源运输的安全得到保证,美国和以色列必须离开本地区

伊朗驻华大使回应哈梅内伊之子当选最高领袖、霍尔木兹海峡问题:如果世界希望能源运输的安全得到保证,美国和以色列必须离开本地区

极目新闻
2026-03-09 13:34:17
为什么全世界最瘦的是日本人?评论区的回答笑晕了,简直一针见血

为什么全世界最瘦的是日本人?评论区的回答笑晕了,简直一针见血

另子维爱读史
2026-03-06 20:14:42
赛季报销被裁!被伊森毁掉职业生涯,刚展现天赋,才25岁无球可打

赛季报销被裁!被伊森毁掉职业生涯,刚展现天赋,才25岁无球可打

你的篮球频道
2026-03-10 08:09:57
2026-03-10 08:48:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68676文章数 656088关注度
往期回顾 全部

科技要闻

OpenClaw更新,"养虾"再也不会犯健忘症了

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

体育要闻

36连胜终结!大魔王也是可以战胜的

娱乐要闻

薛之谦老婆怀二胎,现身产检心情愉快

财经要闻

"养虾"生意经:有人卖铲,有人做保镖

汽车要闻

对标奔驰小号G级 路虎小型卫士最新消息曝光

态度原创

家居
本地
艺术
公开课
军事航空

家居要闻

独栋独院 精致亲子墅

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

艺术要闻

30000亩杏花开了,才知道原来新疆的春天这么美!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊媒发布小学被炸瞬间 战斧导弹从天而降

无障碍浏览 进入关怀版