马斯克xAI全新旗舰 Grok 4.1 登顶LMArena AI榜首，双冠封王抢占AI王座！|谷歌|grok|知名企业|埃隆_马斯克|马斯克xai|lmarena

马斯克xAI全新旗舰 Grok 4.1 登顶LMArena AI榜首，双冠封王抢占AI王座！

2025-11-18 20:35:09　来源: 中科智媒

上海举报

分享至

2025年11月18日，埃隆·马斯克旗下人工智能公司xAI在全球同步发布了最新聊天机器人 Grok 4.1，并以免费全平台的形式向公众开放。该版本在发布当天即在多个权威基准榜单上实现“双冠”——在 LMArena 文本竞技场夺得全球第一，在 EQ‑Bench3 情绪智能评测中夺得榜首，标志着 AI 领域的“王座”在一夜之间易主。

打开百度APP畅享高清图片

静默上线、免费全平台

Grok 4.1 采用“静默上线”方式，于2024年4月首次在网页、iOS 与 Android 三端以 beta 版形式向用户开放，随后在本次发布会上宣布正式免费向所有人开放，用户无需付费即可体验其全部功能。xAI 团队表示，此次升级在算力与训练规模上实现了一个数量级的提升，采用了全新奖励模型和大规模 RL 引擎，显著提升了模型的响应速度与质量。

双版本布局：Thinking 与标准版

本次发布的 Grok 4.1 包含两大版本：

Grok 4.1 Thinking（代号 quasarflux），主打深度推理与复杂任务处理；

Grok 4.1（代号 tensor），侧重对话流畅性与情感交互。

两者在算力、幻觉率以及情绪智能方面均实现了显著突破。与前代 Grok 4 相比，幻觉率下降了约 3 倍，FactScore 评估显示事实准确性大幅提升。

基准成绩抢占榜首

在 LMArena Text Arena 中，Grok 4.1 Thinking 以 1483 Elo 位居全球第一，领先竞争对手 Gemini 2.5 Pro 31 分；标准版以 1465 Elo 紧随其后，位列第二。在 EQ‑Bench3（情绪智能评测）中，Grok 4.1 获得 1586 Elo，再次拔得头筹。创意写作基准 Creative Writing v3 也显示出 1722 Elo 的高分，较前代提升约 600 分，彰显其在文本生成与创意表达方面的优势。

智商+情商双在线的核心竞争力

xAI 将 Grok4.1 定位为 “智商+情商双在线” 的新一代对话模型。实验数据显示，在 64.78% 的使用场景中，用户更倾向于选择 Grok4.1；其在共情、情绪理解以及人际交互方面的表现尤为突出，情感交互满意度提升约 22%。与此同时，非推理模式的输出 Token 从约 2300 降至 850，响应速度显著加快，仍保持高排名。

对标谷歌 Gemini，抢占先机

在 Gemini 3.0 尚未正式发布前，Grok 4.1 已率先登场并在多项基准上超越 Gemini 2.5 Pro，抢占了 AI 市场的先机。马斯克在发布会上强调，Grok 4.1 的速度与品质提升是“用户可以立刻感受到的”，并指出该模型在细微意图感知、对话连贯性以及情感表达方面均实现了突破。

市场影响与未来展望

Grok 4.1 的免费全平台策略迅速吸引了全球数百万用户注册使用，短时间内在 LMArena 与 EQ‑Bench 等平台的活跃度激增。业内分析人士认为，xAI 此举不仅提升了其在大模型竞争格局中的话语权，也对谷歌、OpenAI 等传统巨头形成了强有力的挑战。随着后续版本的迭代与功能扩展，Grok 系列有望在企业级应用、教育辅导以及内容创作等多个场景继续保持领先。

结语：Grok 4.1 通过算力升级、奖励模型创新以及情绪智能的双重强化，实现了在多个权威基准上的“双冠”成绩，并以免费全平台的方式快速占领用户市场，标志着 AI 领域的竞争格局正在发生深刻变化。xAI 未来的技术路线与生态布局值得业界持续关注。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.