网易首页 > 网易号 > 正文 申请入驻

马斯克旗下AI公司xAI推出Grok 4.1大模型

0
分享至

DoNews11月18日消息,埃隆・马斯克(Elon Musk)旗下的人工智能公司 xAI 11 月 17 日宣布推出最新大语言模型 Grok 4.1,并已面向所有用户全面推送。


本次更新旨在全面提升 Grok 在真实世界场景下的可用性。官方表示,Grok 4.1 不仅继承了前代模型敏锐的智能与高可靠性,更在创造性、情感理解和协作互动方面实现了重大改进,让其能够更精准地感知用户细微意图,提供更具吸引力和人格连贯性的对话体验。

Grok 4.1 的性能实现了业界顶尖水平。在大型语言模型竞技场(LMArena)的文本能力排行榜上,其具备深度思考能力的版本(代号:quasarflux)以 1483 的 Elo 分数高居榜首,领先第二名达 31 分。

更引人注目的是,其无需深度思考的“即时响应”版本也以 1465 的 Elo 分数位列第二,性能甚至超越了其他所有模型的“全推理”模式。这一成绩相较于前代 Grok 4(排名第 33 位)实现了巨大飞跃,也印证了其在底层能力上的绝对优势。


除了在通用能力基准测试中表现出色,Grok 4.1 还在“软实力”方面取得了显著进步。在衡量模型情商的 EQ-Bench3 基准测试和评估创意能力的 Creative Writing v3 测试中,新模型均表现优异。

在评估情感理解、洞察力和人际交往能力的 EQ-Bench3 基准测试中,Grok 4.1 的推理与非推理模式包揽了榜单前两名。

在创意写作领域,根据 Creative Writing v3 基准测试结果,Grok 4.1 的两种模式分别位列第二和第三,仅次于早期的 GPT-5.1 模型。

这意味着 Grok 4.1 不仅能处理复杂的逻辑推理,还能更好地理解并回应带有人类情感的提示,进行富有想象力的内容创作,让其在人机交互中更具“人情味”。

另一项关键改进在于大幅降低了模型的“幻觉”率。对于配备搜索工具的快速响应模型而言,由于推理深度和工具调用预算有限,容易出现事实性错误。

x.ai 在 Grok 4.1 的训练后期,特别针对优化信息查询类提示,专注于减少事实性幻觉。根据对真实世界查询样本的评估,新模型的幻觉率已显著降低,从而为用户提供更可靠、更准确的信息。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
11.19全运会今日金牌获奖情况:山东7金、浙江4金,广东3金

11.19全运会今日金牌获奖情况:山东7金、浙江4金,广东3金

林子说事
2025-11-20 03:25:25
大公开!独行侠内斗升级,老板越权介入啊,再见了,浓眉

大公开!独行侠内斗升级,老板越权介入啊,再见了,浓眉

球童无忌
2025-11-19 23:37:27
坏消息,灰熊队中锋小贾伦·杰克逊因脚踝扭伤进入伤病名单

坏消息,灰熊队中锋小贾伦·杰克逊因脚踝扭伤进入伤病名单

好火子
2025-11-20 08:04:29
中日军方隔空叫阵,日本亮电磁炮示威,中方落弹区扩大,美军懂事

中日军方隔空叫阵,日本亮电磁炮示威,中方落弹区扩大,美军懂事

梁讯
2025-11-19 14:24:13
你绝对想不到!老辈人竟如此开放,真相让人目瞪口呆!

你绝对想不到!老辈人竟如此开放,真相让人目瞪口呆!

特约前排观众
2025-11-20 00:05:08
飞天茅台价格“腰斩”,单瓶低至1300,“白酒神话”要破灭了?

飞天茅台价格“腰斩”,单瓶低至1300,“白酒神话”要破灭了?

一只番茄鱼
2025-11-19 10:41:18
炸裂!切尔西疯狂追逐拉什福德,真相令人震惊!

炸裂!切尔西疯狂追逐拉什福德,真相令人震惊!

澜归序
2025-11-20 01:55:55
忍了两天,中方开了金口:日本敢碰红线,总账就从甲午战争开始算

忍了两天,中方开了金口:日本敢碰红线,总账就从甲午战争开始算

趣味八卦
2025-11-20 04:26:57
女性白天和情人发生关系,晚上和老公同房有怎样的感受呢?

女性白天和情人发生关系,晚上和老公同房有怎样的感受呢?

思絮
2025-10-24 10:42:12
向高市早苗提问日本议员吐露:听到她的回答,我心想“糟了”,不敢接着问下去

向高市早苗提问日本议员吐露:听到她的回答,我心想“糟了”,不敢接着问下去

环球网资讯
2025-11-19 16:29:32
恐怖!洗衣引发“爆炸”,杭州一女子撕扯凝珠发生意外致眼睛失明

恐怖!洗衣引发“爆炸”,杭州一女子撕扯凝珠发生意外致眼睛失明

火山诗话
2025-11-19 07:55:07
美股科技股大幅拉涨,纳斯达克指数涨超1%,谷歌涨6%

美股科技股大幅拉涨,纳斯达克指数涨超1%,谷歌涨6%

每日经济新闻
2025-11-19 23:00:03
王健同志工作期间突发疾病,不幸因公殉职,终年52岁

王健同志工作期间突发疾病,不幸因公殉职,终年52岁

极目新闻
2025-11-19 09:45:29
解放军警告日本:高市早苗再不明白就让你明白明白

解放军警告日本:高市早苗再不明白就让你明白明白

极目新闻
2025-11-19 18:15:42
陈数:14年幸福婚姻,被赵胤胤狠狠撕碎,爱情终究还是败给了现实

陈数:14年幸福婚姻,被赵胤胤狠狠撕碎,爱情终究还是败给了现实

乡野小珥
2025-11-16 06:43:55
当我们在讨论西安供暖时,我们是否忽略了锅炉内的“水”?

当我们在讨论西安供暖时,我们是否忽略了锅炉内的“水”?

水质检测仪器
2025-11-19 16:34:46
马拉多纳之子:孔蒂是足坛最成功的教练之一,批评他很荒谬

马拉多纳之子:孔蒂是足坛最成功的教练之一,批评他很荒谬

懂球帝
2025-11-20 07:53:05
高市严重误判,以为中国只会口头抗议?中日磋商破裂,日本慌了神

高市严重误判,以为中国只会口头抗议?中日磋商破裂,日本慌了神

梁讯
2025-11-19 15:54:14
为什么越来越多机关事业单位的临时工工资发不出了?

为什么越来越多机关事业单位的临时工工资发不出了?

细说职场
2025-11-19 23:26:19
100万买辆奔驰,三包期内斜拉臂、调节旋钮相继断裂 厂家以“外力”拒保引车主质疑

100万买辆奔驰,三包期内斜拉臂、调节旋钮相继断裂 厂家以“外力”拒保引车主质疑

大风新闻
2025-11-19 17:02:04
2025-11-20 08:20:49
DoNews incentive-icons
DoNews
不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向迈进。
105135文章数 26774关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日本首次出口具有杀伤力武器 专家:危险信号

头条要闻

日本首次出口具有杀伤力武器 专家:危险信号

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

游戏
手机
艺术
数码
教育

我的小众XP,在“玩法正确”面前一无是处?

手机要闻

OPPO Find X9系列海外卖爆!销量接近上代2倍

艺术要闻

周恩来夫妇珍贵合影集,太难得一见!

数码要闻

猫头鹰黑化版散热器风扇来袭

教育要闻

高考选科时候这样做更靠谱!

无障碍浏览 进入关怀版