网易首页 > 网易号 > 正文 申请入驻

性价比搏击:Grok 4 Fast 推理成本直降 98%

0
分享至



打响低成本推理之争。

作者丨梁丙鉴

编辑丨马晓宁

几乎没有预热,马斯克不声不响把模型调用成本砍掉 98%。

作为低成本推理模型的最新进展,xAI 于上周五发布了其旗舰模型的轻量化版本 Grok 4 Fast。

通过大规模强化学习实现智能密度最大化,Grok 4 Fast 在基准测试上实现了与 Grok 4 相当的表现。同时由于推理任务的平均 token 消耗减少了 40 %,xAI 此次更新将前沿模型的调用成本大幅降低。

据官方测算,Grok 4 Fast 单个推理任务的成本最低可降至原来的 2%。

这已经是一个可以改写大模型竞争规则的数字。

01

端到端强化学习

如果要给 Grok 4 Fast 三个关键词,那应该是 AI 搜索、上下文窗口和统一模型架构。

xAI 在一篇博客中介绍,Grok 4 Fast 拥有原生的工具调用能力,这是指 Grok 4 Fast 通过端到端工具使用强化学习进行训练,在决定何时调用代码或网页等工具方面表现出色。

由于背靠 X 平台的丰富数据,此举为 Grok 4 Fast 在自主探索能力方面带来的优势更为突出。该模型能够无缝浏览网页和 X 平台,利用实时数据增强查询,同时支持跳转链接获取媒体内容,并以极快速度综合生成结果。

对于外部工具的自主使用能力,Grok 4 Fast 在 BrowseComp(44.9%)和 X Bench Deepsearch(74%)等基准测试中,表现优均于 Grok 4。

在 LMArena 的搜索竞技场中,Grok 4 Fast 以 1163 分位列第一,力压此前 OpenAI 领先的 o3-websearch,更是优于 gpt-5-search 和 grok-4-search。在文本竞技场中,Grok 4 Fast 则排名第八,以一分之差险胜 grok-4-0709版本。

可以看到,Grok 4 Fast 已经显著优于同等量级的模型,而在搜索相关任务中,模型参数造成的差距则可以被强化学习带来的推理效率和智能密度所追平甚至跨越。


即将和 Grok 4 Fast 同期推出的是其两个版本,grok-4-fast-reasoning 和 grok-4-fast-non-reasoning,即长链式思维和快速响应两种推理模式,均具备 200 万 token 的上下文窗口。

值得一提的是,Grok 4 Fast 采用了统一模型架构。

此前,在不同推理模式下应用不同的独立模型已经成为业界通行的选择。对于仅需要简单回答和大量推理的任务,手动切换模型的开关对于各个模型厂商来说几乎已是标配。

而 Grok 4 Fast 此次更新引入了统一架构,其中 reasoning(长链式思维)和 non-reasoning(快速响应)两种模式由同一模型权重处理,推理过程中通过系统提示进行引导。

这种设计进一步降低了端到端延迟和 token 成本。可以预见的结果是,在压缩调用成本之外,Grok 4 Fast 距离那些对即时响应存在高需求的场景也更近了一步。

02

SOTA 性价比

SOTA一日三变,市场对模型性能挤牙膏的戏码早就没有了耐心。

xAI 也深知这一点,所以比起循例公布的基准测试结果,此次更新真正的“军火展示”其实是下面这两张图。



Grok 4 Fast 的 token 效率提升了 40%,加之每个 token 的大幅降价,最终结果是开发者的模型调用成本显著降低。而此时的模型性能,仍可以基本保持在 Grok 4 的水平。

根据 Artificial Analysis 的独立评测,Grok 4 Fast 相较于其它公开可用的模型,展现出了 SOTA 级别的性价比。

在官方博客中,xAI 将 Grok 4 Fast 称为“低成本推理的最近进展”。98% 的成本压缩一出,马斯克就差把“我们最便宜大碗”写在脸上。虽然没能在追求智能上限的路上甩开友商,但“谁都能用”是在“比谁都强”之外,另一种打遍天下的可行方案。

在此前的很长一段时间里,大模型都是一场暴力美学的军备竞赛,更大的参数规模、算力消耗和更强的推理能力成为了模型厂商竞争的硬指标。GPT-4、Gemini、Llama系列,乃至 xAI 自家的 Grok 4 Heavy,都是这种极致性能追求下的产物。

然而实验室之外的世界没有那么关注技术边界,当大模型以一款产品的角色面向市场,过去的技术路线也在应用场景之前留下了一道道坎,其中最为明显的就是昂贵的推理成本和漫长的响应时间。

相比之下,曾经被视为阉割性能的小模型,如今却正在成为应用普及的关键角色。

xAI 虽未公布 Grok 4 Fast 的具体参数,但根据命名逻辑的行业惯例,其大概率是在 Grok 4 的基础上通过蒸馏、架构优化等技术降低了计算负载与延迟。这意味着它能在更低配置的服务器甚至边缘设备上高效运行,并实现远低于 Grok 4 Heavy 每百万 tokens 输入 3 美元、输出 15 美元的“奢侈品”定价。

“低成本推理”主打的不是推理,而是低成本。在智能上限短期内突破无望的背景下,每省下一个 token,每个 token 多便宜一点,都是向落地多迈出了一步。而在这场性价比搏击中,马斯克先挥出了一记重拳。

参考资料:


https://x.ai/news/grok-4-fast
-tool-use-with-sota-search

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘强东铁腕 “斩” 老臣!京东副总裁邵京平双 11 被开除

刘强东铁腕 “斩” 老臣!京东副总裁邵京平双 11 被开除

诗意世界
2025-11-14 15:06:16
江苏连云港一公司女职员陪酒后死亡,事后家属得知死者体内被检出男性精液,申请公开死因被拒后起诉警方

江苏连云港一公司女职员陪酒后死亡,事后家属得知死者体内被检出男性精液,申请公开死因被拒后起诉警方

观威海
2025-11-14 16:30:07
燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼频道
2025-11-13 12:44:36
用AI假图骗“仅退款”,这是今年双十一最脏的一幕。

用AI假图骗“仅退款”,这是今年双十一最脏的一幕。

数字生命卡兹克
2025-11-14 09:22:51
卓伟爆了一个新瓜!

卓伟爆了一个新瓜!

八卦疯叔
2025-11-15 10:16:28
遭逆转!王楚钦感慨:虽然一年没打什么比赛 樊振东依旧是世界第1

遭逆转!王楚钦感慨:虽然一年没打什么比赛 樊振东依旧是世界第1

风过乡
2025-11-15 14:57:13
1万助攻+205次三双!威少刷8纪录成历史首控 国王360万真签到宝

1万助攻+205次三双!威少刷8纪录成历史首控 国王360万真签到宝

颜小白的篮球梦
2025-11-15 11:54:02
五条人命的血腥!

五条人命的血腥!

梳子姐
2025-11-14 16:43:16
高市早苗涉台错误言论,在日本国内遭到多方质疑

高市早苗涉台错误言论,在日本国内遭到多方质疑

环球时报新闻
2025-11-15 14:08:40
“长期戴耳机的受害者”上热搜,医生:听力损伤不可逆

“长期戴耳机的受害者”上热搜,医生:听力损伤不可逆

南方都市报
2025-11-13 10:14:07
神舟二十号被撞出裂纹,改乘二十一号返航;外国网友惊掉下巴

神舟二十号被撞出裂纹,改乘二十一号返航;外国网友惊掉下巴

头条爆料007
2025-11-15 07:34:25
林诗栋4-1战胜袁励岑,职业生涯首次晋级全运会男单决赛

林诗栋4-1战胜袁励岑,职业生涯首次晋级全运会男单决赛

懂球帝
2025-11-15 14:57:33
中国籍男子涉连环性侵案,在英国被判终身监禁

中国籍男子涉连环性侵案,在英国被判终身监禁

扬子晚报
2025-11-15 13:46:02
男子线上下单6台苹果手机,骑手取货后连夜出逃,平台:已垫付相关款项

男子线上下单6台苹果手机,骑手取货后连夜出逃,平台:已垫付相关款项

极目新闻
2025-11-15 12:38:03
日本议员:受降的是中华民国,新中国没资格说话!网友:那更好了

日本议员:受降的是中华民国,新中国没资格说话!网友:那更好了

青青子衿
2025-11-15 15:51:35
知名品牌紧急召回:有风险,立即停止使用!

知名品牌紧急召回:有风险,立即停止使用!

浙江之声
2025-11-15 14:36:22
女歌手“阿珍”意外身亡,很多剧院都有的电动座椅竟如此危险?业内人士推测:事发时可能忘切电源

女歌手“阿珍”意外身亡,很多剧院都有的电动座椅竟如此危险?业内人士推测:事发时可能忘切电源

极目新闻
2025-11-14 20:10:12
凶手另有其人?山西狗咬人案律师甩出关键证据,死者妹妹惨遭打脸

凶手另有其人?山西狗咬人案律师甩出关键证据,死者妹妹惨遭打脸

刚哥说法365
2025-11-15 01:09:15
钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

萌神木木
2025-11-15 12:42:02
高市一刻也等不了了!一架专机飞抵中国,这次派的高官,很有讲究

高市一刻也等不了了!一架专机飞抵中国,这次派的高官,很有讲究

寻墨阁
2025-11-12 21:14:07
2025-11-15 17:52:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
6976文章数 20706关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

限时10.59万起 新款星海S9将11月19日上市

态度原创

亲子
艺术
旅游
教育
军事航空

亲子要闻

摊牌了,我不装了

艺术要闻

1.7亿建成,1.5亿拆掉!荆州“天下第一关公”雕像

旅游要闻

赏彩林不用去川西 凉山人自己的“大兴安岭”美翻了!丨图集

教育要闻

山东卷和重庆卷打起来了?

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版