网易首页 > 网易号 > 正文 申请入驻

马斯克的xAI连发两款新模型,有进步但还谈不上领先

0
分享至

界面新闻记者 | 陈振芳
界面新闻编辑 | 宋佳楠

“Grok的进度是火箭。”马斯克如此兴奋地在X上宣布Grok-2的到来。

当地时间8月14日,xAI发布了Grok-2和Grok-2mini两款AI模型的测试版。其中,Grok-2是该公司推理能力最强的语言模型,而轻量化模型Grok-2mini则是Grok-2的“兄弟产品”,试图实现小参数体型下的强功能。

xAI在博客文章中表示,Grok-2的早期预览版相较于Grok-1.5有了重大进步,具有聊天、编码和推理方面的前沿功能。

该公司声称,Grok-2的早期版本以“sus-column-r”的名称进行测试,在LMSYS排行榜上的表现优于Anthropic公司的Claude 3.5 Sonnet和OpenAI的GPT-4-Turbo。LMSYS排行榜通过在大语言模型间进行随机匿名的一对一“对战”,并基于ELO评级系统得出排名。

sus-column-r(Grok 2早期版本)现已公开,凭借超过12000个社区投票,sus-column-r在总体排行榜上获得了第3名,与GPT-4o相当。它在编码获得第2名、困难提示获得第4名,数学方面也取得第2名。

xAI还通过AI导师系统测试Grok与新的模型互动表现,Grok-2重点评估模型在两个关键领域的能力:遵循指示和提供准确、真实的信息。Grok-2在推理检索到的内容和工具使用能力方面表现出显著进步,例如正确识别缺失信息、通过事件序列进行推理以及丢弃不相关的帖子。

此外,xAI通过一系列学术基准对Grok-2模型进行了评估,这些基准包括推理、阅读理解、数学、科学和编码。该公司表示,“在研究生水平的科学知识、常识和数学竞赛问题等领域的表现可与其他前沿模型相媲美。”

马斯克正在将xAI与其收购的社交媒体“X”深度绑定——Grok-2和Grok-2mini将对X的增强搜索功能、深入了解帖子以及改进回复功能提供支持,尽管此前xAI曾因使用X用户数据进行训练而遭致反对。

此次更新的一大亮点是,Grok-2模型可以在X上生成图像,其生图模型使用了近期大火的 Flux.1模型,但目前仅限于X上的Premium和Premium+用户。

由于Grok的图像生成功能没有任何限制,已经有不少用户借此进行政治人物图像创作,例如有用户利用Grok-2生成美国首任总统华盛顿的图片,该帖子还被马斯克转载。然而,OpenAI的ChatGPT会拒绝生成这类图像,避免政治风险。

值得注意的是,Grok-2和Grok-2mini目前仍处于测试阶段。该公司预计,本月晚些时候将通过其企业API向开发人员提供这两种模型。即将推出的API建立在新的定制技术堆栈上,允许多区域推理部署,以实现全球低延迟访问,同时提供增强安全功能,例如强制性多因素身份验证、流量统计数据和高级计费分析。

在与OpenAI分道扬镳后,马斯克曾预测2029年将会实现通用人工智能,而他所创办的xAI最终目标是让消费者、企业甚至所有人都可以使用AI产品,并变成有用的工具。其希望通过AI去帮助人们解决复杂的科学和数学问题,并且“理解”宇宙。

xAI的动作也在不断加速。该公司于2024年1月进行了首次融资,金额为1.35亿美元;5月完成了60亿美元的B轮融资,公司估值也从此前的180亿美元飙升至250亿美元,成为美国又一家AI独角兽。

到了7月,马斯克表示,xAI团队已经开始在“孟菲斯超级集群”上进行训练。该集群由10万个液冷H100 GPU组成,目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”。

他的野心还不止于此,曾透露xAI计划打造一台超级计算机“算力的超级工厂”,预计规模是市场上最强大竞争对手的四倍。

作为大模型的“后来者”,马斯克认为xAI可以在人工智能领域带来新的突破和创新,同时强调竞争有利于推动整个行业的进步,避免形成一家公司在人工智能领域占主导地位的单极世界。

但从其最新发布的两款模型来看,并未表现出超越行业的创新性,仍处于追赶者的角色。Grok-2要想在与OpenAI、谷歌等一众科技公司的竞争中突围,需拿出更强有力的产品才行。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
发展新大众文艺是民生之需

发展新大众文艺是民生之需

上观新闻
2026-04-08 07:20:05
美军宣称摸清中国导弹库存!俄专家:中国解放军可以半小时定胜负

美军宣称摸清中国导弹库存!俄专家:中国解放军可以半小时定胜负

共工之锚
2026-04-07 00:20:47
陈丽华仙逝,陈光标哭错坟了!

陈丽华仙逝,陈光标哭错坟了!

李万卿
2026-04-08 00:40:03
裁委会承认马丁直红,马竞官方转发:承认错误值得称赞

裁委会承认马丁直红,马竞官方转发:承认错误值得称赞

懂球帝
2026-04-08 07:43:06
一个女人愿意跟你上床,一定是喜欢你的

一个女人愿意跟你上床,一定是喜欢你的

加油丁小文
2026-04-08 12:30:04
自导自演?佛山鸡煲老板因流量压力自黑求放过,结果惨遭网友扒光

自导自演?佛山鸡煲老板因流量压力自黑求放过,结果惨遭网友扒光

从零到一研究所
2026-04-03 15:04:26
孟子义现身景德镇,本人又高又瘦白到发光呀,这是听到了啥很震惊

孟子义现身景德镇,本人又高又瘦白到发光呀,这是听到了啥很震惊

陈意小可爱
2026-04-08 02:44:26
为啥说最好不要送孩子出国?网友:希望你的孩子跟你眼界一样

为啥说最好不要送孩子出国?网友:希望你的孩子跟你眼界一样

解读热点事件
2026-04-03 00:05:08
越拼越富!这3个生肖竞争意识拉满,2026年事业收益双爆发

越拼越富!这3个生肖竞争意识拉满,2026年事业收益双爆发

毅谈生肖
2026-04-08 11:18:59
马奇柯任重庆市南川区委书记

马奇柯任重庆市南川区委书记

汲古知新
2026-04-07 23:47:04
离谱!维尼修斯丢球后原地抱怨,误导队友致防守真空,终酿丢球

离谱!维尼修斯丢球后原地抱怨,误导队友致防守真空,终酿丢球

侧身凌空斩
2026-04-08 06:21:52
外媒感叹:这一轮冲击,中国又扛住了

外媒感叹:这一轮冲击,中国又扛住了

环球时报国际
2026-04-07 23:57:45
谢娜浪姐7被骂上热搜!现场提词器曝光,网惊觉:帮齐思钧背黑锅

谢娜浪姐7被骂上热搜!现场提词器曝光,网惊觉:帮齐思钧背黑锅

阿废冷眼观察所
2026-04-08 07:41:23
马特乌斯复盘:皇马组织混乱,面对世界级的诺伊尔束手无策

马特乌斯复盘:皇马组织混乱,面对世界级的诺伊尔束手无策

行舟问茶
2026-04-08 10:27:12
28亿元救一个上校,美国为何不惜一切代价非救不可?

28亿元救一个上校,美国为何不惜一切代价非救不可?

码头青年
2026-04-06 07:37:05
大限已到!所有人都以为大战即将结束,伊朗突然打出了最猛导弹雨

大限已到!所有人都以为大战即将结束,伊朗突然打出了最猛导弹雨

阿讯说天下
2026-04-08 10:27:59
事业编制的副高职称相当于公务员序列的什么级别?是副处吗?

事业编制的副高职称相当于公务员序列的什么级别?是副处吗?

侃故事的阿庆
2026-04-06 14:50:15
1986年,胡耀邦与青海领导谈到蒯大富在服刑时,作出了指示

1986年,胡耀邦与青海领导谈到蒯大富在服刑时,作出了指示

雍亲王府
2026-04-08 11:20:05
最新:乌克兰收复库皮扬斯克北部失地!推进30公里

最新:乌克兰收复库皮扬斯克北部失地!推进30公里

项鹏飞
2026-04-07 19:31:46
终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

夜深爱杂谈
2026-03-13 22:02:43
2026-04-08 13:07:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1051587文章数 1332590关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

伊朗代表:感谢中俄 坚定站在历史正确的一边

头条要闻

伊朗代表:感谢中俄 坚定站在历史正确的一边

体育要闻

皇马1.5亿巨星浪费超级单刀 丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

艺术
游戏
家居
本地
公开课

艺术要闻

齐白石『凌波仙子』

研发5年投入13亿《王者荣耀世界》上线!盘点Q2能够玩到的MMORPG

家居要闻

自在恣意 侘寂风别墅

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版