2025年11月18日,埃隆·马斯克旗下人工智能公司xAI在全球同步发布了最新聊天机器人 Grok 4.1,并以免费全平台的形式向公众开放。该版本在发布当天即在多个权威基准榜单上实现“双冠”——在 LMArena 文本竞技场夺得全球第一,在 EQ‑Bench3 情绪智能评测中夺得榜首,标志着 AI 领域的“王座”在一夜之间易主。
![]()
打开百度APP畅享高清图片
静默上线、免费全平台
Grok 4.1 采用“静默上线”方式,于2024年4月首次在网页、iOS 与 Android 三端以 beta 版形式向用户开放,随后在本次发布会上宣布正式免费向所有人开放,用户无需付费即可体验其全部功能。xAI 团队表示,此次升级在算力与训练规模上实现了 一个数量级 的提升,采用了全新奖励模型和大规模 RL 引擎,显著提升了模型的响应速度与质量。
![]()
双版本布局:Thinking 与标准版
本次发布的 Grok 4.1 包含两大版本:
Grok 4.1 Thinking(代号 quasarflux),主打深度推理与复杂任务处理;
Grok 4.1(代号 tensor),侧重对话流畅性与情感交互。
两者在算力、幻觉率以及情绪智能方面均实现了显著突破。与前代 Grok 4 相比,幻觉率下降了约 3 倍,FactScore 评估显示事实准确性大幅提升。
![]()
基准成绩抢占榜首
在 LMArena Text Arena 中,Grok 4.1 Thinking 以 1483 Elo 位居全球第一,领先竞争对手 Gemini 2.5 Pro 31 分;标准版以 1465 Elo 紧随其后,位列第二。在 EQ‑Bench3(情绪智能评测)中,Grok 4.1 获得 1586 Elo,再次拔得头筹。创意写作基准 Creative Writing v3 也显示出 1722 Elo 的高分,较前代提升约 600 分,彰显其在文本生成与创意表达方面的优势。
![]()
智商+情商双在线的核心竞争力
xAI 将 Grok4.1 定位为 “智商+情商双在线” 的新一代对话模型。实验数据显示,在 64.78% 的使用场景中,用户更倾向于选择 Grok4.1;其在共情、情绪理解以及人际交互方面的表现尤为突出,情感交互满意度提升约 22%。与此同时,非推理模式的输出 Token 从约 2300 降至 850,响应速度显著加快,仍保持高排名。
对标谷歌 Gemini,抢占先机
在 Gemini 3.0 尚未正式发布前,Grok 4.1 已率先登场并在多项基准上超越 Gemini 2.5 Pro,抢占了 AI 市场的先机。马斯克在发布会上强调,Grok 4.1 的速度与品质提升是“用户可以立刻感受到的”,并指出该模型在细微意图感知、对话连贯性以及情感表达方面均实现了突破。
市场影响与未来展望
Grok 4.1 的免费全平台策略迅速吸引了全球数百万用户注册使用,短时间内在 LMArena 与 EQ‑Bench 等平台的活跃度激增。业内分析人士认为,xAI 此举不仅提升了其在大模型竞争格局中的话语权,也对谷歌、OpenAI 等传统巨头形成了强有力的挑战。随着后续版本的迭代与功能扩展,Grok 系列有望在企业级应用、教育辅导以及内容创作等多个场景继续保持领先。
结语:Grok 4.1 通过算力升级、奖励模型创新以及情绪智能的双重强化,实现了在多个权威基准上的“双冠”成绩,并以免费全平台的方式快速占领用户市场,标志着 AI 领域的竞争格局正在发生深刻变化。xAI 未来的技术路线与生态布局值得业界持续关注。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.