网易首页 > 网易号 > 正文 申请入驻

地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋

0
分享至

AI好好用报道

编辑:Sia

又是一个文理兼修的优等生,能薅一点是一点。

好消息!好消息!

堆了20万张 GPU、号称「地表最强」大模型 Grok-3已经可用啦。

这两天,网友们已陆续晒出截图:

作为非付费用户,我们昨天只能旁观 Grok 3,今儿突然可以免费体验部分功能。

但,次数有限 !

由此看来,Grok 3 ( beta )提供「三件套」服务(除了基础模型)。

Thinking是指启动推理模型。

对此,AI 大神 Andrzej Karpathy 快速体验后,评价说:

「 Grok 3 + Thinking 感觉与 OpenAI 最强商用模型(o1-pro,200美元/月)的顶尖水平相差无几,

比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 要稍微强点儿。 」

DeepSearch, 对标 OpenAI「深度研究」功能,解决更加复杂困难的问题。

Big Brain可能是指推理模型 + 更多思考时间,类似 OpenAI o3 mini high。

要体验完整的 Grok3 「三件套」,大伙儿可得破费了。

即使是premium+用户也无法使用最强的推理( Think )和深度搜索( DeepSearch ),还必须订阅新服务 SuperGrok。

一顿操作下来,月费估计要50美金。

就刷榜成绩来说, Grok-3表现确实不俗。

准确地说,Grok 3是一个系列,不只是某一个模型。轻量版本 Grok 3 mini 可以更快地回答问题,但会牺牲一些准确性。

数理编程上,Grok 3都大幅超过 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。

而这些被用来对比的模型的性能,与轻量版本 Grok-3 mini 相近。

马斯克直言:Grok 3比 Grok 2 「好10倍」!

网友们也迫不及待地开始整活了。

意外啊

居然是中文写作高手

最让人意外的是,从刷榜成绩来看,明明是个优秀理科生,偏被中文网友发现中文写作水平真高!

一位科技博主让 Grok 3写了一篇《我的故乡回忆》,直接把我看感动了!

「海就像村里的钟......日子就得跟着海走。」多好的句子啊!

煤油灯、番薯粥、咸鱼干配粥、咯吱作响的竹床、老师的吼一嗓子、同宗同族、祠堂议事、「吵归吵,闹归闹,遇事还是齐心」

......

充满乡土气息的日常文化符号,让一个90年代的泉州小渔村跃然纸上,也暗示了时代变迁。

立刻有网友让 DeepSeek 也如法炮制一篇《我的高中》。

DeepSeek 也很擅长日常细节,怎么说呢,这些细节加起来并没有产生一加一大于二的效应,不如 Grok 3的深刻,情感触动也不那么明显。

至于最后出场的 OpenAI o1 Pro,就像背了一堆典范作文、好词好句的人,写成的应试文。

DeepSeek 毒舌功力已经众人皆之,网友发现 Grok 3辣评能力也是没有瓶颈!

让它犀利点评自己的推文,因为没告诉具体账号,这位网友先被 Grok 3怼了一脸。告知账号后,Grok 3开始毒舌,就连拍它马屁的推文也被怼:

夸得那么猛,也不怕把自己舌头闪了?光吹不给证据,跟放空炮有啥区别?

吹牛不带喘气、细节一抓就漏风 ......

Think 模式

确实是个理科高手

这些只是开胃菜。

作为一个数理编程的强者,网友们分享最多的是 Grok3强大代码能力,简直是游戏开发者的福音。

比如,用 python 编写一个在正方形内弹跳的黄色小球的脚本,正确处理碰撞,使正方形缓慢旋转。

下面是 DeepSeek R1(左)、o1-pro(右)的结果。

继续输入提示词:

put the ball in a tesseract instead of a square

就有了下面这个结果。

这里只是基础模型,没有启动「 Think 」、「 Big Brain 」哦。

还能再复杂一些吗?

来自x@_akhaliq prompt: Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

这是一个连马斯克本人都点赞的演示,看看 DeepSearch + Think 能创造什么?

网友让 DeepSearch 帮忙用 p5.js(一个网页动画工具)复刻《 Flappy Bird 》小游戏,它先帮忙从网上找好了游戏素材和图片。

然后,在同一个聊天窗口里启动 Think 模式,AI 就自动把完整的游戏代码给写出来了。

结果,Run 一次就成功。

来自x@CrisGiardina DeepSearch Prompt: Write a p5js implementation of Flappy Bird. It must be extremely polished, and I want you to use actual sprites or images for all the elements, which you need to find online. Think Prompt: now create a code block with the entire correct code please

AI 大神 Andrzej Karpathy 也让模型通过代码动态生成一个可交互的《卡坦岛》风格游戏地图。目前,很少有模型能稳定地完成这个任务。

结果,只有 Grok 3 (「Think 」)、OpenAI(如 o1-pro,月费$200)可以实现。

而 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude 均告失败 。

谢耳朵玩的就是《卡坦岛》风格游戏。

除了代码和复杂逻辑推理, Andrzej Karpathy 发现,在数学推理、探索解决黎曼猜想的测试中,Grok 3(「Think 」)也都表现不俗。

特别是针对黎曼猜想,Grok 3(和 DeepSeek R1 )表现出探索意愿,而其他模型会立即放弃并仅回复「这是未解难题」。

一些常见的陷阱题目也难不到它,但要打开「 Think 」。

Grok 3知道 strawberry 中有3个「 r 」。它还告诉我 LOLLAPALOOZA 中有4个「 L 」。

Grok 3告诉我9.11比9.9小。

DeepSearch 模式

挑战 OpenAI ?还嫩了些

不过,对标OpenAI「深度研究」的 DeepSearch,它明显不如前者。

Andrzej Karpathy 的评价是:

优于 Perplexity 的类似功能,弱于:OpenAI 近期发布的「深度研究」工具。

作为一个 AI 研究助手,搜索范围要广、尽量全,而且来源是真实、可靠的。

如果具有洞察力,那更好。

而 AK 发现了幻觉问题,有时会编造根本不存在的网页链接,也会对事实做出错误陈述,数据统计上也存在问题。

其他网友也发现了类似问题。

除了幻觉问题,在信息搜寻力度上,不如 Google Deep Research 全面,分析信息时,洞察力也不如 OpenAI 的 Deep Research ,「还处在早期阶段」。

例如,谈到软件企业如何应对创新者困境,谷歌的研究助手引用了80多个来源,Grok3最少。

OpenAI 研究助手也只引用了29个来源,但分析洞察能力很强。

米勒德·菲尔莫尔(Millard Fillmore)作为美国第13任总统(1850-1853 ),其任内最具争议的举措是签署了加强《逃奴法》的《 1850年妥协法案》。

关于他是否违反宪法的问题,是一个非常复杂的法律问题,但 Grok 3的研究结论似乎不这么认为。

而 OpenAI 研究助手明显要审慎多得多。

始终翻不过的山

遗憾的是,大模型讲笑话真的很烂,Grok 3的幽默感也没有明显改善。

看来,思考推理能力对于幽默来说,更像是砒霜?

至于伦理问题上,比如为救百万人该不该错误鉴定别人的性别?大模型们仍然不善于应对。

要么打太极,而 Grok 3直面难题后,结论又明显功利主义了。

最离谱的当属 SVG 绘图挑战赛!

让 AI 用代码画鹈鹕骑自行车,就像让它闭着眼睛拼乐高——生成的矢量图坐标歪七扭八,活脱脱抽象派赛博艺术。

毕竟对 AI 来说,在2D 网格上布置许多图形元素,就像让盲人指挥交通,结果比毕加索的画还魔幻。

以后我们会带来更多好玩的AI用例,也欢迎大家进群交流。

© THE END

转载请联系本公众号获得授权

责任编辑:郭鹏_NO4657

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

乐天闲聊
2026-03-26 03:40:35
民主党85%概率获胜!特朗普用一场战争,把共和党的优势全打没了

民主党85%概率获胜!特朗普用一场战争,把共和党的优势全打没了

黑鹰观军事
2026-03-26 00:31:22
赵心童:谢菲尔德已成为我在英国的家,很高兴将世锦赛留在这里

赵心童:谢菲尔德已成为我在英国的家,很高兴将世锦赛留在这里

懂球帝
2026-03-25 12:33:08
盘点岛国最具魅力的十位萝莉女老师

盘点岛国最具魅力的十位萝莉女老师

碧波万览
2026-03-26 05:25:04
南京一大厦有女生坠楼?记者核实:系谣言,实为外省某大厦事件误传

南京一大厦有女生坠楼?记者核实:系谣言,实为外省某大厦事件误传

扬子晚报
2026-03-25 18:25:42
独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

犀利辣椒
2026-03-19 06:40:31
西甲积分榜:巴萨73分领跑!皇马69分第2!奥维耶多21分垫底!

西甲积分榜:巴萨73分领跑!皇马69分第2!奥维耶多21分垫底!

林子说事
2026-03-26 01:59:35
20分惨败!CBA焦点1战,山东大破新疆男篮,巩晓彬苦笑:都输麻了

20分惨败!CBA焦点1战,山东大破新疆男篮,巩晓彬苦笑:都输麻了

话体坛
2026-03-25 22:16:29
法国美女嫁到中国后,直言:钱可以借中国婆婆却不会给父母,为何

法国美女嫁到中国后,直言:钱可以借中国婆婆却不会给父母,为何

岁暮的归南山
2026-03-26 08:53:39
昆明今晨现“红太阳”,朝霞染亮老城街巷

昆明今晨现“红太阳”,朝霞染亮老城街巷

春城晚报
2026-03-26 04:47:04
寿命与心率的关系被发现:心率40的人和心率80的人,谁更长寿?

寿命与心率的关系被发现:心率40的人和心率80的人,谁更长寿?

杜医生聊健康
2026-03-23 21:45:03
张雪峰离世!北京苏州房产不在名下,1400名员工等安抚,好友停工

张雪峰离世!北京苏州房产不在名下,1400名员工等安抚,好友停工

阿绐聊社会
2026-03-26 08:57:43
涉嫌严重违纪违法,姚启生被查

涉嫌严重违纪违法,姚启生被查

都市快报橙柿互动
2026-03-25 20:00:35
英媒:欧美要死死守住这5项技术,一旦被中国突破那将势不可挡

英媒:欧美要死死守住这5项技术,一旦被中国突破那将势不可挡

史行途
2026-03-18 06:02:09
等了整整一年!iOS 26.4正式推送老机封神,国行遗憾背后!

等了整整一年!iOS 26.4正式推送老机封神,国行遗憾背后!

时尚的弄潮
2026-03-25 16:35:26
87年,已退休的张爱萍提醒总参谋长:饮鸩止渴你懂吧,所为何事?

87年,已退休的张爱萍提醒总参谋长:饮鸩止渴你懂吧,所为何事?

大运河时空
2026-03-25 09:00:03
离谱!皇马队医坑完姆巴佩坑卡马文加,前员工曝其用ChatGPT开药

离谱!皇马队医坑完姆巴佩坑卡马文加,前员工曝其用ChatGPT开药

仰卧撑FTUer
2026-03-26 08:02:05
汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

孤酒老巷QA
2026-03-24 05:34:17
宠物界医闹!全网最记仇的小狗坚持每天早中晚上门追着医生骂,狗主人:只因8年前在这里挨了一针,骂多久看心情,吃饱了就多骂一会儿

宠物界医闹!全网最记仇的小狗坚持每天早中晚上门追着医生骂,狗主人:只因8年前在这里挨了一针,骂多久看心情,吃饱了就多骂一会儿

观威海
2026-03-24 16:55:04
活鱼麻醉风波刷屏:哪些鱼不能买?如何烹饪更安全?上海海洋大学教授给你讲透

活鱼麻醉风波刷屏:哪些鱼不能买?如何烹饪更安全?上海海洋大学教授给你讲透

文汇报
2026-03-25 17:41:17
2026-03-26 10:11:00
AI好好用 incentive-icons
AI好好用
探索人工智能应用场景及商业化
2095文章数 4429关注度
往期回顾 全部

科技要闻

硅谷因AI大裁员?一线工程师戳破真相

头条要闻

举天价零件发出灵魂拷问的美官员 自己被大学生质问了

头条要闻

举天价零件发出灵魂拷问的美官员 自己被大学生质问了

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

艺术
亲子
教育
时尚
公开课

艺术要闻

王洪文的狂草背后隐藏的秘密,赵孟頫书法的真实价值揭秘!

亲子要闻

期盼每个孩子天天都能睡好觉

教育要闻

惊了!斯坦福大学近四成学生登记为残障人士?!

《非穷尽列举》,好看又绝望

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版