网易首页 > 网易号 > 正文 申请入驻

Grok 4.3全面上线:1M上下文+降价58%,8款老模型5月15日退役

0
分享至



Input $1.25/M,Output $2.50/M,1M上下文窗口。这不是某家创业公司的低价引流,这是xAI刚全量放出的Grok 4.3。

4月30日太平洋时间,Grok 4.3正式开放API。比起上一代Grok 4.20,输入价格砍了约38%,输出价格砍了约58%。更关键的是——1M tokens上下文,比Claude Opus 4.7的200k大了5倍。

我是虾哥,不是程序员。搞了多年连锁零售信息化,我对"性价比"这事儿特别敏感。Grok 4.3这波,是真把API党当回事了。

核心结论:Grok 4.3不是"又一个大模型",而是API党降本增效的现成弹药。1M上下文+激进低价+Agentic能力,三个维度同时升级,适合长文档、Agent和语音场景快速上车。

❶ 五大升级,xAI这次动了真格

先说结论:这次不是挤牙膏,是五条线同时推。

升级维度

Grok 4.20时代

Grok 4.3现在

定价

$2.00 / $6.00

$1.25 / $2.50

上下文窗口

约200K

1M tokens

多模态

文本+图片

文本+图片+视频

文档生成

纯文本输出

原生PDF/XLSX/PPTX

语音API

无独立API

STT/TTS $4.20/M chars

数据来源:据xAI官方文档、aipricing.guru数据显示。定价单位为每百万tokens(美元)。

❷ 价格到底砍了多少?这是最关键的问题。对比Grok 4.20,输入从$2.00降到$1.25,降幅约37.5%;输出从$6.00降到$2.50,降幅约58.3%。如果你用的是Grok 4旗舰($3.00/$15.00),那降幅更夸张——综合降幅接近70%。

⚠️ 注意:超过200K tokens的请求,xAI会加倍收费。实际使用中建议控制在800K以内,留够推理空间。超长请求的端到端延迟可能超过30秒,生产环境建议异步处理。



❷ 1M上下文,不只是"能塞更多字"

1M tokens什么概念?大概能一次性塞进去一整本书、200页报告、或者一个中型项目的全部代码。这意味着很多场景下RAG可以省掉了——长上下文直接替代检索。

但也有代价。超过200K tokens按双倍价格计费,这意味着你得算清楚:是真需要1M,还是RAG+短上下文更划算。我的判断:文档分析、合同审查、长代码review这类场景,1M确实有用;普通问答和短对话,256K的Grok 4 Fast更省。

另一个隐藏信息:知识截止日期是2024年11月。比Claude Opus 4.7和GPT-5都老。如果你需要最新时事,得配合web_search工具补。

❸ Agent能力:这才是Grok 4.3的主场

据Artificial Analysis数据显示,Grok 4.3的Intelligence Index拿到53分,比同价位模型中位数34分高出一大截。

但更值得关注的是Agent维度:τ²-Bench电信客服准确率从93%提到98%,GDPval-AA Agent基准ELO从1179涨到1500。Vending-Bench长线仿真收益领先Claude Opus 4.7约1.26倍

关键判断:Grok 4.3的强项不在Coding(SWE-bench约73%,比Opus 4.7低14个百分点),而在Agentic——多步工具调用、长链规划、客服Agent,这些才是它的主场。

服务端工具调用也是亮点。Grok 4.3能自主决定何时调哪个工具——web_search、x_search、code_execution三个内置工具,模型自己串联,不用你在应用层写编排逻辑。

场景

Grok 4.3评级

长文档总结

⭐⭐⭐⭐⭐

1M窗口+高吞吐

Agent工作流

⭐⭐⭐⭐⭐

Vending-Bench领先

代码生成

⭐⭐⭐⭐

落后Opus 4.7,但价格补

语音场景

⭐⭐⭐⭐

比OpenAI便宜86-92%

能力维度

GPT-5.5

Claude Opus 4.7

Grok 4.3

Agent Planning

9.7

9.2

8.5

Tool Use / MCP

9.6

9.4

8.0

Coding(Agentic)

9.7

9.5

8.7

深度推理

9.2

9.8

8.8

长上下文

9.8

9.5

8.2

幻觉控制

8.8

9.5

7.8

写作/审美

9.0

9.8

8.2

响应速度

8.9

9.4

9.1

“自主执行感”

9.8

9.1

8.3

综合Agent指数

9.5

9.4

8.4

❹ 开发者实操:3分钟上手

❶ API接入模型名:grok-4.3 或 grok-4.3-latest 兼容OpenAI SDK,换base_url和model字段就行。 地区:us-east-1、eu-west-1。 快速测试走OpenRouter或Vercel AI Gateway也行。

❷ 核心参数Reasoning Effort三档:low(快)、medium(默认)、high(复杂任务)。 简单问答用low省token,复杂Agent用high。 Structured Outputs + Tool Calling原生支持,不用自己拼多步pipeline。

❸ 代码示例

# Grok 4.3 快速上手(OpenAI兼容)from openai import OpenAI client = OpenAI( api_key="你的xAI API Key", base_url="https://api.x.ai/v1" ) response = client.chat.completions.create( model="grok-4.3", messages=[ {"role": "user", "content": "帮我分析这份合同的风险点"} ], extra_body={"reasoning_effort": "high"} ) print(response.choices[0].message.content)

注意:reasoning_effort参数通过extra_body传入,不是OpenAI SDK的标准参数,但xAI API兼容支持。

❺ ⚠️ 8款老模型5月15日退役,迁移指南收好

这是很多人忽略的紧急事项。xAI官方5月6日发通知:8款旧模型将于5月15日PT时间12:00 PM退役(北京时间5月16日凌晨3:00)。退役后请求直接报错,不是降级,是硬停

退役模型

类型

迁移目标

grok-3

通用

grok-4.3

grok-4-0709

推理

grok-4.3

grok-4-fast-reasoning

推理

grok-4.3

grok-4-1-fast-reasoning

推理

grok-4.3

grok-code-fast-1

代码

grok-4.3

grok-4-fast-non-reasoning

快速

grok-4.20-non-reasoning

grok-4-1-fast-non-reasoning

快速

grok-4.20-non-reasoning

grok-imagine-image-pro

图片

grok-imagine-image

⚠️ 特别提醒:grok-code-fast-1是很多代码Agent项目的默认模型。如果你用的是Cursor类工具、IDE插件或CLI Agent,5月15日后必须切到grok-4.3,否则直接报错。迁移不是简单的搜索替换,记得重新测试提示词行为和工具调用稳定性。

❻ 语音API:比OpenAI便宜90%,这才是暗牌

很多人盯着语言模型降价,忽略了xAI同步推出的语音API

STT(语音转文字)和TTS(文字转语音),统一价格$4.20/百万字符。对比OpenAI Whisper约$30/百万字符,便宜86%;对比ElevenLabs约$50/百万字符,便宜92%

还有Voice Cloning:120秒参考音频就能克隆声音,生成的voice ID可以跨TTS和Voice Agent复用。客服机器人、播客生成、车载语音助手——xAI基本把语音AI的行业地板价打到了1/10。

我之前搞零售信息化的时候,客服系统是刚需。如果当时有这个价格,语音客服的部署成本能砍掉一大半。现在做AI工具的同学们,这是实打实的红利窗口。

❼ Colossus 2 + 7模型并训:xAI的算力野心

Elon Musk 4月8日在X平台披露:xAI的Colossus 2超算集群同时训练7个AI模型,参数规模从1T到10T不等,还额外推Imagine V2。

10T参数级模型——如果落地,就是Grok 5。据nextbigfuture分析,预计2026年中发布

这意味着什么?Grok 4.3不是终点,而是xAI算力基础设施的中间交付物。Colossus 2的并行训练能力才是底牌——7条线同时推,总有一条跑出来。

✅ 建议:编程工具党值得持续盯xAI。Grok 5的10T参数如果兑现,加上1M+上下文和更成熟的Agent工具链,2026下半年的API格局可能大变。

❽ 三个实操切入场景

❶ Voice Agent用新Voice API做客服/实时翻译,成本只有OpenAI的1/10。 120秒克隆声音+TTS复用,小团队也能做专业级语音产品。

❷ Coding Agent混合方案本地TUI(终端)跑轻量任务,Grok 4.3云端跑复杂推理。 "免费本地+低价云端"对比,这个选题本身就值得写一篇。

❸ 长文档/合规分析1M上下文+原生PDF输出,合同审查、报告生成一条龙。 零售行业的促销方案审核、供应商合同对比,都能直接上。

红虾点评:1. 性价比是最大杀手锏——xAI不玩虚的,直接把价格打下来,开发者真能用低价跑通复杂任务。 2. PR还是弱项——Elon团队悄咪咪放模型,OpenAI同级更新早上头条了。内容党从"被低估的Grok 4.3"切入,差异化明显。 3. 长期看好——Grok 5(10T参数级)已在路上,多模型并训+Colossus 2,基础设施野心不小。

关注亮虾哥

连锁零售IT老司机 | 非程序员用AI省80%时间

每天一篇AI干货,让AI替你打工

你现在用的是哪家API?5月15日前打算迁移吗?评论区聊聊

#AI工具 #Grok #大模型 #API #职场效率

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女总裁天天催我找对象,我说:催催催!那你嫁给我好了!

女总裁天天催我找对象,我说:催催催!那你嫁给我好了!

千秋文化
2026-05-04 18:31:52
196天逆转!巴萨困境反超皇马:从-5分到+11分 弗里克立功

196天逆转!巴萨困境反超皇马:从-5分到+11分 弗里克立功

叶青足球世界
2026-05-10 09:41:43
是大厨也是美人!在米其林三星餐厅进修的结城希下海了!

是大厨也是美人!在米其林三星餐厅进修的结城希下海了!

孤独的独角兽影视
2026-05-10 10:35:08
豪门梦碎!阿隆索直言执教皇马是巨大错误:权力斗争已让战舰失控

豪门梦碎!阿隆索直言执教皇马是巨大错误:权力斗争已让战舰失控

星耀国际足坛
2026-05-09 21:58:29
诗妮娜贵妃机场照罕曝光!穿现代装对镜挥手笑容甜,颜值也好真实

诗妮娜贵妃机场照罕曝光!穿现代装对镜挥手笑容甜,颜值也好真实

八八尚语
2026-05-09 15:30:23
航炮点穴瘫痪伊朗油轮!美军这手操作,把暴力与克制玩到了极致

航炮点穴瘫痪伊朗油轮!美军这手操作,把暴力与克制玩到了极致

民间胡扯老哥
2026-05-10 07:06:14
15.98万,真的疯了

15.98万,真的疯了

放毒
2026-05-09 18:53:10
“求是”文章不足以改变对房地产的预期

“求是”文章不足以改变对房地产的预期

科学发掘
2026-05-10 06:31:04
湖人利好:范德比尔特复出可出战G3 四天前刚遭遇手指脱臼

湖人利好:范德比尔特复出可出战G3 四天前刚遭遇手指脱臼

醉卧浮生
2026-05-10 07:04:34
果不其然,特朗普访华又生变?中国提的要求,美国竟然拒绝了

果不其然,特朗普访华又生变?中国提的要求,美国竟然拒绝了

松林侃世界
2026-05-09 23:10:09
两口子因为给不给9岁的儿子割包皮 争八百回!网友:听爸爸的没错

两口子因为给不给9岁的儿子割包皮 争八百回!网友:听爸爸的没错

市井大实话
2026-04-24 10:20:09
陈翔六点半“吴妈”去世,球球证实,死因曝光,生命最后瘦到脱相

陈翔六点半“吴妈”去世,球球证实,死因曝光,生命最后瘦到脱相

叨唠
2026-05-09 19:41:34
历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

听心堂
2026-03-31 15:52:04
罕见啊!毁车+恐吓+醉驾+亲子鉴定!这连环计太可怕了!!

罕见啊!毁车+恐吓+醉驾+亲子鉴定!这连环计太可怕了!!

柚子说球
2026-05-09 20:45:00
黄维被特赦后偶遇廖运周,当场就要动手:你真把老子害苦了!

黄维被特赦后偶遇廖运周,当场就要动手:你真把老子害苦了!

近史谈
2026-05-10 02:54:15
李亚鹏回应嫣然儿童医院新址:开下去没问题,但选址需要解决医保资质、跨区等很多问题,所以还得再等等

李亚鹏回应嫣然儿童医院新址:开下去没问题,但选址需要解决医保资质、跨区等很多问题,所以还得再等等

上观新闻
2026-05-10 06:43:16
张本智和又喊夺冠,日媒称马龙樊振东隐退后国乒不行了,真相如何

张本智和又喊夺冠,日媒称马龙樊振东隐退后国乒不行了,真相如何

李絙在北漂
2026-05-10 13:13:32
太突然!国际奥委会连招呼都没打,直接官宣上海办“奥运”?

太突然!国际奥委会连招呼都没打,直接官宣上海办“奥运”?

可乐爱微笑
2026-05-09 19:30:34
“森林北”否认与汪峰分手:“我们俩其实挺好的”,如果未来真有什么变化,想说的话会亲自告诉大家,此前其清空与汪峰相关社交动态引热议

“森林北”否认与汪峰分手:“我们俩其实挺好的”,如果未来真有什么变化,想说的话会亲自告诉大家,此前其清空与汪峰相关社交动态引热议

鲁中晨报
2026-05-10 09:54:07
大唐订单破10万!比亚迪快把自己笑死了

大唐订单破10万!比亚迪快把自己笑死了

ZAKER新闻
2026-05-08 20:47:05
2026-05-10 14:15:00
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
378文章数 6723关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

美贸易代表:中国在很大程度上限制大量美商品对华出口

头条要闻

美贸易代表:中国在很大程度上限制大量美商品对华出口

体育要闻

詹姆斯生涯第6次0-3困境:今年会被横扫吗

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

艺术
家居
时尚
房产
教育

艺术要闻

毛主席83岁时写给华国锋的6字真相令人震惊!

家居要闻

菁英人居 全能豪宅

今年最好看的衬衫竟然是它?太减龄了!

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

教育要闻

高校争开新增本科新专业,内幕来啦

无障碍浏览 进入关怀版