网易首页 > 网易号 > 正文 申请入驻

ChatGPT哭了!马斯克新AI直接封神

0
分享至

近日,马斯克的xAI公司推出了最新一代大语言模型 Grok 4.1。这次更新距离今年 7 月 Grok 4 发布仅过去四个多月,却带来了用户立刻就能感知到的显著提升。马斯克本人在 X 平台上发帖表示,大家应该会明显感觉到速度和质量的双重飞跃,而实际体验也确实如此。


Grok 4.1 的最大亮点在于它对大模型顽疾的针对性优化。xAI 团队这次把后训练阶段的重心放在了减少幻觉上,通过大规模强化学习和针对信息求取类提示的专项纠偏,新模型在真实世界查询中的幻觉率从 Grok 4 的 12% 左右直接降到 4% 左右,降幅接近三倍。这意味着用户问事实性问题时,Grok 4.1 更不容易胡编乱造,而是给出可靠、可验证的答案。对于依赖 AI 进行研究、写作或决策的用户来说,这无疑是一次实质性进步。


除了更可靠,Grok 4.1 在对话体验上也完成了质的飞跃。官方描述称它在创意、情感和协作交互方面表现出色,更善于捕捉用户细微意图,回复更有共情力、个性更连贯,同时保持了前代模型那种锋利又幽默的风格。在 EQ-Bench 情感智商测试中,Grok 4.1 的得分从 Grok 4 的 1206 分暴涨到 1586 分,在创意写作和人际理解维度同样领先。这让它不再只是冷冰冰的问答机器,而是更像一个真正懂你的对话伙伴。


第三方盲测数据进一步印证了这些改进。在 LMArena 的 Text Arena 排行榜上,Grok 4.1 的思考模式以 1483 的 Elo 分数稳坐第一,甚至非推理的快速模式也拿下第二,领先所有非 xAI 模型 31 分之多。更值得一提的是,在 11 月 1 日到 14 日为期两周的静默灰度测试中,xAI 把新旧模型的回复随机混在一起让用户盲选,结果 Grok 4.1 以 64.78% 的偏好率完胜前代。这份来自真实用户的投票,比任何内部基准都更有说服力。



访问方式也保持了 xAI 一贯的亲民作风。Grok 4.1 已向所有用户免费开放,无论在 grok.com 网站、X 平台,还是 iOS 和 Android 的 Grok App 上,都可以直接使用。进入界面后,Auto 模式默认就是 Grok 4.1,如果你想手动指定,也能在模型选择器里找到它。付费的 SuperGrok 或 Premium+ 用户自然能享受更高配额,但免费版已经足够日常使用。


这次发布没有大张旗鼓的直播,也没有长篇的技术报告,xAI 只是平静地把模型推上线,任由用户自己去感受变化。这种低调反而凸显了自信:当产品真正好用时,不需要太多噱头。和其他厂商动辄几个月一次的大版本迭代相比,xAI 的节奏明显更快,从 Grok 4 到 4.1 只用了不到半年,就实现了从排行榜三十多名到全面登顶的逆袭。

当然,Grok 4.1 并非完美无缺。它依然继承了 Grok 系列一贯的直率风格,有时回答会比其他模型更不加修饰,但这也正是许多用户喜欢它的原因。在当前 AI 军备竞赛白热化的背景下,xAI 用实际表现证明,追求真理和最大化帮助用户,依然能在性能和体验上占据上风。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩媒再曝猛料!被警方带走的鸟叔再迎3大噩耗,公司经纪人全遭殃

韩媒再曝猛料!被警方带走的鸟叔再迎3大噩耗,公司经纪人全遭殃

梦史
2025-12-13 09:43:45
2026年如果房价继续下跌,我国有一半的家庭或将面临三个现实压力

2026年如果房价继续下跌,我国有一半的家庭或将面临三个现实压力

装修秀
2025-12-11 11:20:03
布朗狂轰16+2首秀及格!张陈治锋11+9+2满分表现,辽篮喜提开门红

布朗狂轰16+2首秀及格!张陈治锋11+9+2满分表现,辽篮喜提开门红

君马体育
2025-12-13 21:49:45
CBA战报:青岛89-77深圳,贺希宁24分

CBA战报:青岛89-77深圳,贺希宁24分

懂球帝
2025-12-13 21:23:09
石破茂再批高市:中国已不是百年前中国,当年侵华那招不好使了

石破茂再批高市:中国已不是百年前中国,当年侵华那招不好使了

通文知史
2025-12-12 21:00:05
泰国拘留所325名中籍诈骗犯集体砸场暴动,原因是怕被遣返回国。

泰国拘留所325名中籍诈骗犯集体砸场暴动,原因是怕被遣返回国。

环球趣闻分享
2025-12-13 16:37:45
国务院国资委:坚决拥护党中央决定

国务院国资委:坚决拥护党中央决定

新京报政事儿
2025-12-12 23:34:19
和杨丽萍离婚20年,富豪前夫突然回心转意,只要是你没孩子也行

和杨丽萍离婚20年,富豪前夫突然回心转意,只要是你没孩子也行

查尔菲的笔记
2025-12-12 19:41:00
罪恶的柬埔寨,让中国人闻风丧胆?为什么是东南亚最可怕的国家?

罪恶的柬埔寨,让中国人闻风丧胆?为什么是东南亚最可怕的国家?

户外钓鱼哥阿勇
2025-12-13 13:52:01
没想到范曾还有个义子,57岁是知名歌唱家,在上海音乐学院当院长

没想到范曾还有个义子,57岁是知名歌唱家,在上海音乐学院当院长

银河史记
2025-12-12 23:25:38
印媒:中国未来50年,必打6场大战,台海首战,终战对手不是美国

印媒:中国未来50年,必打6场大战,台海首战,终战对手不是美国

boss外传
2025-11-20 21:20:03
总决赛上连续爆发,陈熠的表现引来郭焱高度评价

总决赛上连续爆发,陈熠的表现引来郭焱高度评价

鲸鲱鱼体坛
2025-12-13 17:49:10
38岁作家痞子老妖突发离世!十年创作630万,读者发现诡异细节

38岁作家痞子老妖突发离世!十年创作630万,读者发现诡异细节

天天热点见闻
2025-12-13 11:34:31
突发!成都发生3.9级地震,震中距汶川县24公里

突发!成都发生3.9级地震,震中距汶川县24公里

都市快报橙柿互动
2025-12-13 08:16:33
联赛首战上海女排轻取福建!阵容需磨合,但蔡斌也给年轻队员机会

联赛首战上海女排轻取福建!阵容需磨合,但蔡斌也给年轻队员机会

金毛爱女排
2025-12-13 18:21:02
12月13日俄乌:乌军收复库皮扬斯克

12月13日俄乌:乌军收复库皮扬斯克

山河路口
2025-12-13 19:14:23
谁都逃不掉!倒查风暴已经席卷全国,凭关系吃饭的时代要结束了?

谁都逃不掉!倒查风暴已经席卷全国,凭关系吃饭的时代要结束了?

陈博世财经
2025-12-11 10:47:44
双塔归队,经典首发重新上线!乌度卡再变阵,底薪大闸取代谢泼德

双塔归队,经典首发重新上线!乌度卡再变阵,底薪大闸取代谢泼德

熊哥爱篮球
2025-12-13 20:19:16
如何看待老郭的相声“我就是一条沉睡千年的蛆”呢?

如何看待老郭的相声“我就是一条沉睡千年的蛆”呢?

翻开历史和现实
2025-12-12 16:52:58
外卖时代将被终结?一个全新行业正悄悄取代外卖,你准备好了吗?

外卖时代将被终结?一个全新行业正悄悄取代外卖,你准备好了吗?

猫叔东山再起
2025-12-10 10:05:04
2025-12-13 22:12:49
PConline太平洋科技 incentive-icons
PConline太平洋科技
深度剖析未来趋势,实用解答科技疑惑,趣味呈现科技魅力!
37818文章数 864622关注度
往期回顾 全部

科技要闻

比亚迪、小鹏、北汽,集体表态

头条要闻

媒体:美军罕见突袭一艘中国货船 拦截"中国货"

头条要闻

媒体:美军罕见突袭一艘中国货船 拦截"中国货"

体育要闻

有了风骚白人秃头,忘掉谈了10年的前任

娱乐要闻

插刀门后,印小天一举动实现口碑逆转

财经要闻

镁信健康闯关港交所:被指窃取商业秘密

汽车要闻

表面风平浪静 内里翻天覆地!试驾银河星舰7 EM-i

态度原创

旅游
家居
游戏
艺术
公开课

旅游要闻

北京初雪,绝美!这些地方超出片——

家居要闻

温润质感 打造干净空间

Xbox计划将于明年1月举办一场Dev Direct直播活动

艺术要闻

何镜堂院士设计!前海博物馆开馆时间定了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版