网易首页 > 网易号 > 正文 申请入驻

9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”

0
分享至

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

(九派新闻)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
傅斯年最终决定前往台湾,北平解放之后,他听的太多,担忧太多

傅斯年最终决定前往台湾,北平解放之后,他听的太多,担忧太多

王知鱼说历史
2026-05-31 07:43:50
哈尔滨遭遇极端强对流大风天气 ,树干被吹断广告牌被吹落;应急局:暂无伤亡,损失正统计

哈尔滨遭遇极端强对流大风天气 ,树干被吹断广告牌被吹落;应急局:暂无伤亡,损失正统计

大风新闻
2026-05-31 23:05:05
51岁贝克汉姆身价暴涨海岛度假,52岁贝嫂又黑又老,14岁小七胖了

51岁贝克汉姆身价暴涨海岛度假,52岁贝嫂又黑又老,14岁小七胖了

照见古今
2026-05-31 21:02:40
果然阳谋在任何面前都是无敌的!网友:把水搅混了,也是一种智慧

果然阳谋在任何面前都是无敌的!网友:把水搅混了,也是一种智慧

夜深爱杂谈
2026-04-07 17:50:08
骗子内部总结:最难骗的不是聪明人,是这几类普通人基本从不上当

骗子内部总结:最难骗的不是聪明人,是这几类普通人基本从不上当

科学发掘
2026-06-01 05:33:27
美伊局势再添迷雾!协议草案遭遇更严苛修改 特朗普重申“不急”

美伊局势再添迷雾!协议草案遭遇更严苛修改 特朗普重申“不急”

财联社
2026-06-01 08:20:07
林俊杰母亲回应!力挺大儿子一家,一句话道出对七七的真实态度

林俊杰母亲回应!力挺大儿子一家,一句话道出对七七的真实态度

白面书誏
2026-05-29 16:18:39
王毅成大明星了?访问加国途中,加参议员竟说:请给我您的签名

王毅成大明星了?访问加国途中,加参议员竟说:请给我您的签名

离离言几许
2026-05-31 20:10:00
7死11伤!已婚女子出轨遭灭门,凶手开车逃窜残忍碾压无辜百姓

7死11伤!已婚女子出轨遭灭门,凶手开车逃窜残忍碾压无辜百姓

易玄
2026-05-30 10:08:39
成龙、李连杰、甄子丹、吴京!《1941》立项,港片真正的王要来了

成龙、李连杰、甄子丹、吴京!《1941》立项,港片真正的王要来了

得得电影
2026-05-31 13:49:16
绝不向中国低头!宁愿裁员9000人公司破产,也不接受中国的帮助?

绝不向中国低头!宁愿裁员9000人公司破产,也不接受中国的帮助?

混沌录
2026-04-11 15:18:05
68岁大爷找了个90后小姑娘,转给她4800万

68岁大爷找了个90后小姑娘,转给她4800万

张晓磊
2026-05-29 11:56:09
中国家门口生变,东盟11国选边站队,缅甸交权菲律宾,菲改了身份

中国家门口生变,东盟11国选边站队,缅甸交权菲律宾,菲改了身份

混沌录
2026-05-20 18:16:08
俄军将轰炸基辅,9国退出联盟,不再给乌供弹,泽连斯基向美求援

俄军将轰炸基辅,9国退出联盟,不再给乌供弹,泽连斯基向美求援

手里有读
2026-06-01 09:20:14
“割四赔五”事件终于尘埃落定,当事人父亲发声,令人动容

“割四赔五”事件终于尘埃落定,当事人父亲发声,令人动容

芳姐侃社会
2026-05-31 20:51:10
基辅高官人人自危!俄军包了一个“大饺子”:乌军四个旅见死不救

基辅高官人人自危!俄军包了一个“大饺子”:乌军四个旅见死不救

影孖看世界
2026-05-31 23:19:30
广西18岁女失联:深夜出行,反常行为不止清空余额,朋友圈现端倪

广西18岁女失联:深夜出行,反常行为不止清空余额,朋友圈现端倪

小虎新车推荐员
2026-06-01 06:24:11
中越曾争了9年的老山,如今究竟属于谁?一座山而已为啥都要争?

中越曾争了9年的老山,如今究竟属于谁?一座山而已为啥都要争?

史之铭
2026-06-01 02:21:18
意外!苗润东曾被认为潜力比王钰栋大,如今土伦杯首秀却表现平平

意外!苗润东曾被认为潜力比王钰栋大,如今土伦杯首秀却表现平平

振刚说足球
2026-06-01 11:12:04
5月还没结束,朱玲玲与罗康瑞私下状态被曝,婚变传闻该真相大白

5月还没结束,朱玲玲与罗康瑞私下状态被曝,婚变传闻该真相大白

TVB的四小花
2026-06-01 12:42:48
2026-06-01 13:27:00
郑州华图教育
郑州华图教育
公务员之路,从华图起步
6588文章数 369关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

家居
本地
房产
公开课
军事航空

家居要闻

自信舒展 高背座椅

本地新闻

用剪纸的方式,打开江苏扬州

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版