网易首页 > 网易号 > 正文 申请入驻

被马斯克誉为“地球上最聪明的AI”,果真如此吗?

0
分享至

北京时间2月18日,在备受瞩目中,由埃隆・马斯克创办的人工智能公司xAI推出了大模型Grok-3。之所以备受瞩目,是因为在发布会前夕马斯克就将其描述为“地球上最聪明的AI”。

Grok-3真的如此聪明吗?“这是xAI公司厚积薄发的一个版本,从发布会上的多项测评指标来看确实是最高的,甚至超越DeepSeek R1也有相当幅度,肯定可以入列国际上的头部大语言模型之一。”师从图灵奖得主、深度学习创始人约书亚·本吉奥,上海交通大学人工智能学院副教授林洲汉接受了解放日报记者的采访。

马斯克在发布会上解释了Grok的由来,在罗伯特·海因莱因的小说《异乡异客》中,它被一个在火星长大的角色使用,代表着充分而深刻地理解某事。

Grok-3在发布会上的表现确实不负这一词汇的内涵。它在数学、科学和编程的基准测试中,“优于目前所有已发布的产品”,包括GPT-4o、Claude3.5 Sonnet、DeepSeek-V3等。

当它面对一个太空飞船任务——用3D动画代码演示从地球发射、着陆火星以及在下一个发射窗口返回地球的全过程时,Grok-3展现出了强大的推理和编程能力,且生成的代码可以直接运行。马斯克透露,Grok-3给的答案正是SpaceX公司未来探索火星的轨道。

让林洲汉印象深刻的是,不同于DeepSeek的算法优化路径和低成本训练,Grok-3由一台超级计算机训练完成,由10万-20万个英伟达的H100 GPU驱动,提供了超过2亿GPU小时的计算资源,是Grok-2的10多倍。

“这应该是全球首次在单一集群里用这么大规模的GPU来训练单一模型,不知道xAI公司是如何保持模型在如此规模的集群上训练时的稳定性,发布会上没有透露具体细节。”林洲汉说。

Grok-3并非开源模型,X上的 Premium+订阅者将是首批获得访问权限的人。

“不过,发布会上展示的能力与实际落地后的用户反馈有时会有偏差。”林洲汉说,这是因为在开发过程中,研发人员会对公开测试集所涉及的领域做专门优化,如此一来测评分数会很高。比如,大多数语言模型都会针对数学奥赛题做专门优化,也会有一个很好的答题效果,但并不意味着这个模型就真的像奥赛金牌得主那么聪明,一旦偏离奥赛题领域,模型能力可能会大幅下降。

“目前尚未出现能够像人一样能力泛化的大语言模型。一个模型的好坏不仅仅取决于它在训练数据上的表现,更重要的是其在未见过的数据上的泛化能力。”林洲汉说。

值得关注的是,随着DeepSeek等开源模型的崛起,犹如在大模型的湖面投下了一颗石头,激起了层层涟漪。OpenAI公司发布了o3-mini系列模型以及GPT-4.5和GPT-5的路线图,Anthropic公司也表示将推出Claude-4。

在林洲汉看来,这意味着OpenAI公司不会一家独大,其先进性正在弱化,不太能维持过去几年的“断层式领先”。与此同时,新冒出来的人工智能企业和模型,为了避免同质化竞争,也将谋求不同的技术路线,进行差异化发展。

题图来源:IC photo 图片编辑:曹立媛

来源:作者:解放日报 黄海华

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘晓庆外甥否认吃绝户!怒斥刘晓庆造谣,承认有矛盾希望私下解决

刘晓庆外甥否认吃绝户!怒斥刘晓庆造谣,承认有矛盾希望私下解决

萌神木木
2026-03-26 13:31:02
余承东:问界M6 24小时订单突破60000台 展车已到店

余承东:问界M6 24小时订单突破60000台 展车已到店

CNMO科技
2026-03-24 17:14:29
法拉利发布F1日本大奖赛海报,画风帅气但“铃鹿”拼错了

法拉利发布F1日本大奖赛海报,画风帅气但“铃鹿”拼错了

懂球帝
2026-03-26 16:09:08
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

懂球帝
2026-03-26 15:47:08
王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

晓肂爱八卦
2026-03-25 14:04:56
东北两省书记省长会见刘强东

东北两省书记省长会见刘强东

观察者网
2026-03-25 21:43:37
郭正亮突现颜面神经失调急就医,观众涌入留言关心:保重身体!

郭正亮突现颜面神经失调急就医,观众涌入留言关心:保重身体!

海峡导报社
2026-03-26 17:05:07
穆雷轰53+6+4无缘今日最佳!对不起,东契奇暴走创神级纪录

穆雷轰53+6+4无缘今日最佳!对不起,东契奇暴走创神级纪录

世界体育圈
2026-03-26 13:01:23
教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

教育部宣布中考重大变革,取消 5:5 分流,升学规则将全面调整?

今朝牛马
2026-03-26 20:22:18
再次闹分手!美记:雄鹿和字母哥出现分歧,这是明确分手的信号

再次闹分手!美记:雄鹿和字母哥出现分歧,这是明确分手的信号

爱体育
2026-03-26 23:42:10
为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

侃神评故事
2026-03-10 18:50:04
梁安琪没想到,儿子何猷君竟走上霍启刚老路,狠狠为赌王家族长脸

梁安琪没想到,儿子何猷君竟走上霍启刚老路,狠狠为赌王家族长脸

墨印斋
2026-03-25 06:25:05
美股科技股领跌,存储股、中概股集体下挫!小马智行跌15%,闪迪跌6%,美光跌超4%,原油涨超4%|美股开盘

美股科技股领跌,存储股、中概股集体下挫!小马智行跌15%,闪迪跌6%,美光跌超4%,原油涨超4%|美股开盘

每日经济新闻
2026-03-26 22:37:04
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

今日养生之道
2026-03-23 11:46:39
Manus终于喝下自己藏好的毒

Manus终于喝下自己藏好的毒

蓝媒汇财经plus
2026-03-25 21:27:26
41岁张雪峰去世,成名10年争议不断,遗产曝光早已做好一切安排!

41岁张雪峰去世,成名10年争议不断,遗产曝光早已做好一切安排!

古希腊掌管松饼的神
2026-03-24 22:00:07
张柏芝现身机场接儿子回家,母子见面拥抱好温暖!谢振轩又长高了

张柏芝现身机场接儿子回家,母子见面拥抱好温暖!谢振轩又长高了

娱乐团长
2026-03-26 15:45:18
洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

阿龙美食记
2026-02-28 10:49:43
终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

另子维爱读史
2026-03-25 22:34:08
2026-03-27 00:08:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
456550文章数 760381关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
亲子
教育
公开课
军事航空

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

看看把孩子吓得哈哈哈

教育要闻

天天学习|走进课堂的“大朋友”

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版