网易首页 > 网易号 > 正文 申请入驻

马斯克在直播中首次披露Grok 3的训练成本:20万块英伟达GPU

0
分享至

马斯克披露了Grok 3的训练成本(资料图)

财联社2月18日电,马斯克在直播中首次披露了Grok 3的训练成本,称Grok 3训练过程累计消耗20万块英伟达GPU,训练在xAI公司的数据中心完成。

延伸阅读

马斯克放大招,Grok-3来了

马斯克,放大招!

北京时间2月18日中午,马斯克旗下人工智能初创公司xAI开发的Grok-3模型正式发布。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品”。

北京时间12:18,Grok-3发布会正式开始。在发布会背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。截至发稿时,直播观看人次超300万次。

xAI在X平台直播,马斯克到场(图片来源:X平台)

马斯克在直播中表示,Grok的名字来自海因莱因的小说《异乡异客》,主角是一个在火星上长大的人类,而Grok这个词代表了全面深刻地理解事物。

xAI团队介绍,Grok-3的性能比Grok-2提升了一个数量级,和Grok-3聊天会觉得非常有趣。

xAI团队在直播中展示称,Grok-3和Grok-3 mini在多方面的测试得分上都超过或媲美Gemini和ChatGPT等对手。在训练Grok的过程中,团队搭建了大型算力集群,并克服了散热、电力等问题带来的挑战,用了122天让首批10万张GPU投入使用并正常运行,现在他们计划将集群规模继续扩大一倍。

团队还演示用Grok-3生成代码,并运行了这段代码。画面上显示出了飞船在地球和火星间往返的动画。随后,Gork-3又演示了制作一款类似于俄罗斯方块的游戏。马斯克称,将在xAI推出一个人工智能游戏工作室。

飞船在地球和火星间往返的动画直播截图(图片来源:X平台)

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎。名字和最近大热的Deepseek颇有几分相似。

Grok 3聪明在哪?

在此前举行的世界政府峰会上,马斯克通过视频通话表示,Grok-3是“地球上最聪明的人工智能”。他表示,Grok-3将在推理、编程能力以及文本和图像分析等多模态能力方面有显著提升,它的表现“优于目前所有已发布的产品”。

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

2023年7月,马斯克成立xAI公司。2023年11月,xAI发布第一款大模型 Grok-1,拥有3140亿参数,成为当时参数量最大的开源大语言模型;2024年8月发布的Grok-2,在性能上与ChatGPT最新模型相媲美。该系列大模型可以通过联网获取实时信息,浏览和使用X平台(原推特)上的资讯,使其具有信息获取的时效性。

AI大模型群雄逐鹿

马斯克的xAI成为AI大模型领域强有力的竞争者,同样参与这场竞技的还有OpenAI、谷歌、Anthropic以及近期引发全球关注的中国初创企业DeepSeek。

OpenAI于近日宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。

OpenAI首席执行官兼联合创始人SamAltman今日凌晨在社交平台表示:“对于高要求的测试者来说,试用GPT-4.5的体验,远比我预期的要深刻得多!”业内人士预计,这说明GPT-4.5已经进入测试阶段,离正式发布非常近了。

2月初,DeepSeek新模型发布后,谷歌公司发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,全面开放使用并降低成本。

另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude 4,用户可以自行控制使用时的推理成本。

当地时间本周一,总部位于法国巴黎的Mistral发布名为Mistral Saba的定制大模型,特点是具有高准确率的阿拉伯语交互能力。

今年春节以来,中国初创企业DeepSeek发布新模型DeepSeek-R1,以极低的训练成本和使用成本,超越OpenAI对标模型,搅动AI大模型竞争,也在国内各大行业带起了大模型接入潮。

据不完全统计,已经有数百家公司正式接入DeepSeek研发的大模型。包括国内三大基础运营商、超过15家芯片厂商,以及包括云服务、网络科技、金融在内的200多家企业,多个手机厂商和车企,地方政府政务系统,以及微软、英伟达、亚马逊等世界级云计算巨头都宣布接入DeepSeek。

腾讯集团确认,微信自2月15日起开始灰度测试接入DeepSeek-R1模型,增强其搜索功能。消息一出,引发腾讯股价大涨。2月16日晚间,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。

智能、免费

大模型加速走入日常生活

值得关注的是,在DeepSeek的推动下,大模型正朝着越来越智能且免费的方向发展,这也加快了大模型走入日常生活的脚步。

百度官方宣布,文心一言将于4月1日起全面免费,所有PC端和APP端用户均可体验其最新模型,包括超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。2月13日凌晨,OpenAI也公布了GPT-5的最新消息,OpenAI将在未来几个月内推出GPT-5的模型,免费版ChatGPT能在标准智能设置下无限制地使用GPT-5进行对话。此外,谷歌也在早些时候宣布其最新AI模型套件Gemini 2.0正式向所有用户开放使用。

中国信息通信研究院技术与标准研究所工程师龚正表示,AI技术的成熟正在改写商业模式,DeepSeek等开源模型的崛起正在重构行业生态。OpenAI首席执行官萨姆·奥尔特曼则预言,使用AI的成本每12个月下降10倍。

走向免费的大模型如何赚钱?一位关注AI创新的投资服务业人士告诉记者:“AI大模型实际从去年就开始了降价潮,而大模型企业目前还没有完成商业化。”他表示,“AI大模型企业要想挣钱,可以提供面向企业端的解决方案,同时大模型企业的估值也不是根据模型,而是看其生态。”

上述业内人士称,对于大模型企业来说,未来的估值将不再单纯依赖于模型本身,而是更多地关注其生态建设、用户规模、数据质量以及增值服务的盈利能力。拥有庞大用户基础和完善生态的企业,将在未来的市场竞争中占据优势。

责任编辑:戴丽丽_NN4994

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
114球,莱万升至巴萨队史射手榜第15位

114球,莱万升至巴萨队史射手榜第15位

懂球帝
2026-02-08 03:05:22
上海两会炸锅!取消中高考是必然?82%家长怒怼:断了普通娃活路

上海两会炸锅!取消中高考是必然?82%家长怒怼:断了普通娃活路

金哥说新能源车
2026-02-08 02:39:15
天津西站,一天抓了四个!

天津西站,一天抓了四个!

天津族
2026-02-07 13:31:19
突发!利雅得胜利准备清洗 C 罗!两大英超巨星成接班目标

突发!利雅得胜利准备清洗 C 罗!两大英超巨星成接班目标

奶盖熊本熊
2026-02-08 03:09:15
金价26年2月7日:大家做好准备,明后两天,金价可能更大变盘?

金价26年2月7日:大家做好准备,明后两天,金价可能更大变盘?

白浅娱乐聊
2026-02-07 14:34:32
古巴实施燃料配给制应对美国石油封锁,国企改为一周工作四天

古巴实施燃料配给制应对美国石油封锁,国企改为一周工作四天

澎湃新闻
2026-02-07 17:31:30
国际奥委会呼吁无济于事!美国队亮相开幕式,现场观众一片嘘声

国际奥委会呼吁无济于事!美国队亮相开幕式,现场观众一片嘘声

全景体育V
2026-02-07 06:48:11
67岁倪萍近照引热议,面部状态显变化,身旁71岁前央视名嘴认不出

67岁倪萍近照引热议,面部状态显变化,身旁71岁前央视名嘴认不出

可乐谈情感
2026-02-07 19:09:16
中国的社保压力超乎想象。

中国的社保压力超乎想象。

流苏晚晴
2026-02-06 20:42:14
中交集团区域总失联

中交集团区域总失联

地产微资讯
2026-02-07 23:11:04
吴桂英,当选新职

吴桂英,当选新职

新京报政事儿
2026-02-07 14:41:21
演员立威廉:身心几近崩溃,已重新安排遗嘱!去年被诊断出甲状腺癌二期

演员立威廉:身心几近崩溃,已重新安排遗嘱!去年被诊断出甲状腺癌二期

都市快报橙柿互动
2026-02-07 00:32:47
这些离谱谣言该停了:英国没地铁?美澳遍地饥民?

这些离谱谣言该停了:英国没地铁?美澳遍地饥民?

老马拉车莫少装
2025-12-20 07:06:48
李兰娟发现:经常吃红薯的人,用不了多久,肠胃或有这5个变化

李兰娟发现:经常吃红薯的人,用不了多久,肠胃或有这5个变化

九哥聊军事
2025-11-30 18:49:01
外媒:挪威王储妃梅特·玛丽特就涉爱泼斯坦案致歉

外媒:挪威王储妃梅特·玛丽特就涉爱泼斯坦案致歉

环球网资讯
2026-02-07 14:10:36
陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈意小可爱
2026-02-07 09:53:51
炸锅!皇马接近签下利物浦世界级巨星 互换交易悬念拉满

炸锅!皇马接近签下利物浦世界级巨星 互换交易悬念拉满

澜归序
2026-02-08 01:05:51
收手吧资本家的丑孩子,临近春节沈佳润又整幺蛾子小沈阳都救不了

收手吧资本家的丑孩子,临近春节沈佳润又整幺蛾子小沈阳都救不了

阿废冷眼观察所
2026-02-08 02:09:55
小伙签下1.8亿合同,不给提成反被解雇,这记闷棍打醒多少老实人

小伙签下1.8亿合同,不给提成反被解雇,这记闷棍打醒多少老实人

从零到一研究所
2026-02-07 19:41:06
假房假妻假儿女,他布局4年骗走香港明星4亿巨款,至今下落不明

假房假妻假儿女,他布局4年骗走香港明星4亿巨款,至今下落不明

不似少年游
2026-02-07 09:33:17
2026-02-08 06:00:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
682835文章数 1017508关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

网购椅子却收到15公斤银砖 男子紧急报警

头条要闻

网购椅子却收到15公斤银砖 男子紧急报警

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

健康
本地
手机
家居
公开课

转头就晕的耳石症,能开车上班吗?

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

手机要闻

华为苹果领衔 TOP5厂商入场,阔折叠方向对了吗?

家居要闻

现代轻奢 温馨治愈系

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版