网易首页 > 网易号 > 正文 申请入驻

性价比搏击:Grok 4 Fast 推理成本直降 98%

0
分享至



打响低成本推理之争。

作者丨梁丙鉴

编辑丨马晓宁

几乎没有预热,马斯克不声不响把模型调用成本砍掉 98%。

作为低成本推理模型的最新进展,xAI 于上周五发布了其旗舰模型的轻量化版本 Grok 4 Fast。

通过大规模强化学习实现智能密度最大化,Grok 4 Fast 在基准测试上实现了与 Grok 4 相当的表现。同时由于推理任务的平均 token 消耗减少了 40 %,xAI 此次更新将前沿模型的调用成本大幅降低。

据官方测算,Grok 4 Fast 单个推理任务的成本最低可降至原来的 2%。

这已经是一个可以改写大模型竞争规则的数字。

01

端到端强化学习

如果要给 Grok 4 Fast 三个关键词,那应该是 AI 搜索、上下文窗口和统一模型架构。

xAI 在一篇博客中介绍,Grok 4 Fast 拥有原生的工具调用能力,这是指 Grok 4 Fast 通过端到端工具使用强化学习进行训练,在决定何时调用代码或网页等工具方面表现出色。

由于背靠 X 平台的丰富数据,此举为 Grok 4 Fast 在自主探索能力方面带来的优势更为突出。该模型能够无缝浏览网页和 X 平台,利用实时数据增强查询,同时支持跳转链接获取媒体内容,并以极快速度综合生成结果。

对于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基准测试中,表现优均于 Grok 4。

在 LMArena 的搜索竞技场中,Grok 4 Fast 以 1163 分位列第一,力压此前 OpenAI 领先的 o3-websearch,更是优于 gpt-5-search 和 grok-4-search。在文本竞技场中,Grok 4 Fast 则排名第八,以一分之差险胜 grok-4-0709版本。

可以看到,Grok 4 Fast 已经显著优于同等量级的模型,而在搜索相关任务中,模型参数造成的差距则可以被强化学习带来的推理效率和智能密度所追平甚至跨越。


即将和 Grok 4 Fast 同期推出的是其两个版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即长链式思维和快速响应两种推理模式,均具备 200 万 token 的上下文窗口。

值得一提的是,Grok 4 Fast 采用了统一模型架构。

此前,在不同推理模式下应用不同的独立模型已经成为业界通行的选择。对于仅需要简单回答和大量推理的任务,手动切换模型的开关对于各个模型厂商来说几乎已是标配。

而 Grok 4 Fast 此次更新引入了统一架构,其中 reasoning(长链式思维)和 non-reasoning(快速响应)两种模式由同一模型权重处理,推理过程中通过系统提示进行引导。

这种设计进一步降低了端到端延迟和 token 成本。可以预见的结果是,在压缩调用成本之外,Grok 4 Fast 距离那些对即时响应存在高需求的场景也更近了一步。

02

SOTA 性价比

SOTA一日三变,市场对模型性能挤牙膏的戏码早就没有了耐心。

xAI 也深知这一点,所以比起循例公布的基准测试结果,此次更新真正的“军火展示”其实是下面这两张图。



Grok 4 Fast 的 token 效率提升了 40%,加之每个 token 的大幅降价,最终结果是开发者的模型调用成本显著降低。而此时的模型性能,仍可以基本保持在 Grok 4 的水平。

根据 Artificial Analysis 的独立评测,Grok 4 Fast 相较于其它公开可用的模型,展现出了 SOTA 级别的性价比。

在官方博客中,xAI 将 Grok 4 Fast 称为“低成本推理的最近进展”。98% 的成本压缩一出,马斯克就差把“我们最便宜大碗”写在脸上。虽然没能在追求智能上限的路上甩开友商,但“谁都能用”是在“比谁都强”之外,另一种打遍天下的可行方案。

在此前的很长一段时间里,大模型都是一场暴力美学的军备竞赛,更大的参数规模、算力消耗和更强的推理能力成为了模型厂商竞争的硬指标。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是这种极致性能追求下的产物。

然而实验室之外的世界没有那么关注技术边界,当大模型以一款产品的角色面向市场,过去的技术路线也在应用场景之前留下了一道道坎,其中最为明显的就是昂贵的推理成本和漫长的响应时间。

相比之下,曾经被视为阉割性能的小模型,如今却正在成为应用普及的关键角色。

xAI 虽未公布 Grok 4 Fast 的具体参数,但根据命名逻辑的行业惯例,其大概率是在 Grok 4 的基础上通过蒸馏、架构优化等技术降低了计算负载与延迟。这意味着它能在更低配置的服务器甚至边缘设备上高效运行,并实现远低于 Grok 4 Heavy 每百万 tokens 输入 3 美元、输出 15 美元的“奢侈品”定价。

“低成本推理”主打的不是推理,而是低成本。在智能上限短期内突破无望的背景下,每省下一个 token,每个 token 多便宜一点,都是向落地多迈出了一步。而在这场性价比搏击中,马斯克先挥出了一记重拳。

参考资料:


https://x.ai/news/grok-4-fast
-tool-use-with-sota-search

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚刚,18家公司出现重大利好和利空公告,有没有与你相关的个股?

刚刚,18家公司出现重大利好和利空公告,有没有与你相关的个股?

股市皆大事
2026-01-18 11:44:22
1972年有人要撤汪东兴的中办厅主任,毛主席:替我转告总理三句话

1972年有人要撤汪东兴的中办厅主任,毛主席:替我转告总理三句话

文史季季红
2026-01-17 18:15:03
观赏欧阳娜娜的最佳视角  娜比也长大了

观赏欧阳娜娜的最佳视角 娜比也长大了

喜欢历史的阿繁
2026-01-18 10:26:22
风雪中,送别“棋圣”聂卫平!北京市民排起长队,韩国名宿到场告别

风雪中,送别“棋圣”聂卫平!北京市民排起长队,韩国名宿到场告别

环球网资讯
2026-01-18 11:31:08
医生发现:大量喝茶的糖尿病患者,用不了多久,身体或有6个变化

医生发现:大量喝茶的糖尿病患者,用不了多久,身体或有6个变化

健康之光
2026-01-18 13:10:09
汪小菲带娃吃日料,玥儿贴心夹菜!汪小菲和大S家已私下进行和解

汪小菲带娃吃日料,玥儿贴心夹菜!汪小菲和大S家已私下进行和解

汪巗的创业之路
2026-01-18 11:50:29
澳网开赛前夕,前俄罗斯名将正式入籍澳大利亚!发文:感恩自由

澳网开赛前夕,前俄罗斯名将正式入籍澳大利亚!发文:感恩自由

全景体育V
2026-01-18 08:59:11
“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

“地震中消失的人去哪了?”网友的扎心评论,直接看哭了上万网友

另子维爱读史
2026-01-15 18:13:19
北京市中小学,放寒假通知!

北京市中小学,放寒假通知!

美丽大北京
2026-01-18 09:10:40
江苏多地政府主官去代转正

江苏多地政府主官去代转正

上观新闻
2026-01-18 07:33:04
身价上千亿?深扒之下,终于知道李湘的钱都是从哪里来的了!

身价上千亿?深扒之下,终于知道李湘的钱都是从哪里来的了!

清晨的世界
2026-01-18 10:10:27
真敢说!郝帅疑似暗讽王楚钦,网友刷屏:有个好姑父

真敢说!郝帅疑似暗讽王楚钦,网友刷屏:有个好姑父

十点街球体育
2026-01-16 00:00:03
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
患癌早有预料!74岁聂卫平生前习惯被扒,烟酒成瘾只是冰山一角

患癌早有预料!74岁聂卫平生前习惯被扒,烟酒成瘾只是冰山一角

哄动一时啊
2026-01-17 20:00:32
“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

上观新闻
2026-01-17 17:17:15
谁能拒绝年轻貌美又洋气的李一桐!这身材比例真的绝了

谁能拒绝年轻貌美又洋气的李一桐!这身材比例真的绝了

枫尘余往逝
2026-01-17 15:50:47
欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

欠薪千万、关店100家!昔日家居龙头的体面,终究是碎了一地

品牌观察官
2026-01-17 18:06:29
美国这次蒙了,最近美国大量囤积了铜,把铜价炒上天去了

美国这次蒙了,最近美国大量囤积了铜,把铜价炒上天去了

百态人间
2026-01-17 16:07:35
德甲犟驴!莱比锡被揍0-6仍与拜仁打对轰:这次1-5崩盘 渣叔傻眼

德甲犟驴!莱比锡被揍0-6仍与拜仁打对轰:这次1-5崩盘 渣叔傻眼

风过乡
2026-01-18 06:52:55
日本人气球星高桥蓝因与女优河北彩伽爆绯闻,远走波超卢布林

日本人气球星高桥蓝因与女优河北彩伽爆绯闻,远走波超卢布林

排球大视界
2026-01-17 20:22:57
2026-01-18 16:16:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7046文章数 20725关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

特朗普向各国开价:"和平委员会"永久席位 10亿美元

头条要闻

特朗普向各国开价:"和平委员会"永久席位 10亿美元

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

43岁贾玲退出春晚、解散公司

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

健康
亲子
教育
旅游
数码

血常规3项异常,是身体警报!

亲子要闻

三岁前养成这些习惯,让娃赢在起跑线

教育要闻

解方程,越简单,越出错

旅游要闻

参观青岛档案馆,了解青岛历史

数码要闻

存储涨价行情下如何省钱?新年高性价比DDR4主机配置推荐

无障碍浏览 进入关怀版