网易首页 > 网易号 > 正文 申请入驻

马斯克口中最智能的Grok 3登场,号称性能超ChatGPT及DeepSeek

0
分享至

界面新闻记者 | 宋佳楠

2月18日午间,马斯克旗下xAI公司的新一代大模型Grok 3正式发布。发布会采用视频直播形式,观看人数超过100万人,马斯克本人也出现在直播间。

据马斯克介绍,Grok3在很短的时间内实现了功能比Grok2强大一个数量级,Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

xAI工程师则表示,虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT,Grok 3所涉及的训练是Grok 2的10倍,目前Grok 3已经在xAI内部运行了2周。MMLU是一个用于评估语言模型在多种任务上语言理解能力的基准测试。

此外,xAI推出名为Deepsearch的Grok-3智能搜索引擎。xAI工程师强调,Deepsearch是xAI的第一代广泛代理工具,它不仅帮助工程师、研究人员和科学家编写代码,也能帮助每个人回答日常遇到的问题。

马斯克在现场演示了Grok 3的搜索能力,如问“下一次的星舰发射是什么时候”,Grok 3会像DeepSeek一样,显示模型正在做什么,包括浏览的网页、思考的过程,并确认网页上的信息是否可信,再得出一个相关的结论。最终,大模型以列表形式预测了下一次星舰的发射期。

值得注意的是,该搜索引擎在深度思考过程中还会显示不同的次任务,这种功能据称比现在的搜索引擎更为强大,可节省更多时间,因对搜索引擎的算法和逻辑重新进行了设计。

对于用户何时可以体验到“地球上最聪明的人工智能”,马斯克称会首先向预定用户开放。由于模型仍在不断更新和改进中,苹果应用商店上线的Grok版本会相对落后,而网页版更新最为及时。据其透露,Grok 3语音模式可能在一周后推出。

直播末尾,马斯克和xAI工程师现场回答了网友提问。当被问及是否会开源时,马斯克给出了肯定的答案,称每次做下一个版本时会开源上一个版本,几个月后会开源Grok 3。对于颇为敏感的“Grok 3是男性还是女性”问题,马斯克称,性别是模型自己定义的,还提醒“不要爱上Grok”。

谈及开发Grok 3最难的部分,马斯克表示是训练模型和100%的逻辑推理过程,那种复杂程度就像随时随地预测宇宙的发展情况。

如果Grok 3的推理能力真如视频中所讲的那样强大,可能推动AI从 “生成答案” 向 “逻辑推导” 升级。

xAI公司成立于2023年7月,此前已推出过Grok-1、Grok-1.5、Grok-1.5 Vision、Grok-2等大模型产品。其中,Grok-1是迄今参数量最大的开源大语言模型;Grok-1.5具有改进的推理能力和128k的上下文长度;Grok-1.5 Vision是首个多模态智能模型;Grok-2在Chatbot Arena榜单排名第18位。

不过,当前大模型行业竞争态势无比激烈。在Grok 3发布当日,奥特曼在X上表示,“对于高要求的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要深刻得多!”这似乎在预示着,GPT-4.5已经进入测试阶段,距离正式发布也不会太远了。

而在2月初,谷歌也发布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本。Grok 3能否占据主导地位还需进一步观察。

可以确定的是,包括OpenAI、谷歌等AI巨头在内,近期都已感受到了来自中国大模型公司DeepSeek带来的冲击波,以往坚持闭源的OpenAI也有了进一步开源的迹象。2月18日,奥特曼在X上发起投票,问大家希望下一个OpenAI开源的大模型是哪种?是o3-mini还是手机上可运行的大模型?或是在为开源某个大模型做预热。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
崩了,知名光伏公司大规模停产,大面积待岗!

崩了,知名光伏公司大规模停产,大面积待岗!

黯泉
2026-03-25 21:36:39
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
2026QS世界大学学科排名正式发布!

2026QS世界大学学科排名正式发布!

双一流高校
2026-03-26 00:11:50
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
多名大学校长炮轰机器人跳舞是哗众取宠

多名大学校长炮轰机器人跳舞是哗众取宠

上峰视点
2026-03-25 19:07:57
中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

中国最“尴尬”的5个地级市:它们根本不该在本省,应该“改嫁”

好笑娱乐君每一天
2026-03-26 01:22:35
怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

丁丁鲤史纪
2026-03-25 16:35:13
白宫:美国总统特朗普将于5月访华

白宫:美国总统特朗普将于5月访华

辇毂
2026-03-26 05:18:40
清纯得不像动作片女一号!

清纯得不像动作片女一号!

贵圈真乱
2026-03-26 11:33:33
张雪峰追悼会周六将在苏州殡仪馆举行

张雪峰追悼会周六将在苏州殡仪馆举行

界面新闻
2026-03-26 07:04:27
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

社会酱
2026-03-23 17:34:19
狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

青眼财经
2026-03-17 16:03:09
哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

小樾说历史
2026-03-25 12:16:16
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
国家出手逮捕的3名华人首富,疯狂敛财坑害百姓,每个都罪有应得

国家出手逮捕的3名华人首富,疯狂敛财坑害百姓,每个都罪有应得

林轻吟
2026-03-25 07:15:32
日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

有范又有料
2026-03-25 14:08:39
9中9轰20+9+5!杨瀚森付出一切遭库克坑苦 G联赛首次百分百命中率

9中9轰20+9+5!杨瀚森付出一切遭库克坑苦 G联赛首次百分百命中率

颜小白的篮球梦
2026-03-26 10:15:13
2026-03-26 15:43:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1044108文章数 1332018关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
房产
艺术
本地
公开课

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被查

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

艺术要闻

哪一座桥不是风景?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版