网易首页 > 网易号 > 正文 申请入驻

马斯克发布Grok-1.5手撕GPT-4,xAI的开源战略能打得过OpenAI吗?

0
分享至

Grok-1自宣布开源至今不足一个月,其最新版本Grok-1.5已经发布。马斯克旗下的xAI公司今日宣布,Grok-1.5的上下文理解能力已提升至128K,并显著增强了推理功能。该版本预计将很快对公众开放使用。

Grok-1.5:128K长语境处理新突破

Grok-1.5,这款备受关注的人工智能模型,在数学推理能力上实现了惊人的飞跃。官方介绍显示,Grok-1.5不仅改进了推理能力,而且在编码和数学相关任务中的表现尤为突出。

在数学基准测试中,Grok-1.5取得了令人瞩目的成绩。它在GSM8K基准上获得了90%的高分,而在MATH基准上也从之前的23.9%提升到了50.6%。这些成绩充分证明了Grok-1.5在处理数学问题方面的强大能力,无论是小学还是高中的竞赛问题,它都能轻松应对。

除了数学推理能力的提升,Grok-1.5在长语境处理方面也取得了重要突破。它能够在其上下文窗口内处理高达128K token的文本,这使得Grok的内存容量增加到了以前的16倍。这意味着Grok-1.5能够利用更长的文档中的信息,处理更长和更复杂的提示,同时保持其指令跟随能力。

在实际应用中,Grok-1.5展现出了出色的检索能力。在Needle In A Haystack(NIAH)评估中,它能够在长度达128K字节的上下文中检索嵌入文本,并取得了完美的检索结果。这一特性使得Grok-1.5在处理大量信息时能够迅速找到关键内容。

值得一提的是,Grok-1.5的基础设施也非常强大。它构建在基于JAX、Rust和Kubernetes的定制分布式训练框架之上,这使得xAI团队能够以最少的投入大规模构建创意,并训练新的架构。同时,Grok-1.5的训练编排器还能够确保自动检测有问题的节点,并将其从训练任务剔除,以最大限度地提高训练任务的可靠性和正常运行时间。

数字经济应用实践专家骆仁童博士表示,Grok-1.5凭借其在数学推理能力和长语境处理方面的卓越表现,成为了当前最受关注的人工智能模型之一。相信在未来,随着更多新功能的推出,Grok-1.5将会在各个领域发挥更加重要的作用。


Grok:打造成科幻理想的实现者

Grok,由马斯克命名,灵感源于科幻巨作《异乡异客》中的核心概念,字面虽为“喝”,实则寓意深远,涵盖理解、共鸣及人机交融等多重维度。作为xAI旗下的首款产品,Grok展现了惊人的开发速度,自七月问世至今短短四月便已呈现在公众面前。目前,Grok正针对美国部分用户展开测试,有意参与的用户可通过xAI官网提交申请。展望未来,Grok将逐步扩展至X高级订阅用户群体。

尽管与OpenAI有着紧密的联系,Grok却选择了与ChatGPT背道而驰,成为市场上的一股清流。其名称本身便充满了科幻色彩,与马斯克的个人品味不谋而合。在《异乡异客》中,Grok代表着对事物有深刻理解和直觉的状态,而Grok在这里也被赋予了类似的定位,旨在追求《银河系漫游指南》中的科幻理想。

值得一提的是,Grok拥有一个独特的优势:能够实时了解世界动态。这意味着,Grok不仅利用了X平台的海量数据进行训练,还能在实际应用中实时调用这些数据以提供更准确的回答。这一点或许反映了马斯克对于其他AI工具过度依赖X平台数据的担忧,他似乎正在努力为自家产品构建一道保护屏障。

然而,Grok并非完美无缺。它同样受到了目前大模型普遍存在的问题——偏见的困扰,有时会出现事实错误。例如,在马斯克分享的一张截图中,Grok错误地将某法律案件的陪审团商议时长从4个小时夸大为8个小时。尽管如此,xAI表示Grok的核心驱动力是自家研发的Grok-1大语言模型,经过四个月的精心打磨和多次迭代,该模型已准备好在现实世界中大展拳脚。

Grok只是个开始,而目前的Grok更是“尝鲜粗糙版”,马斯克和xAI已经准备好深入。

xAI官网频频发出招募令,寻求更多精英人才的加入。展望未来,xAI将在多个领域进行深度优化,例如提升模型对上下文的理解和检索技能,赋予Grok视觉、听觉等多元感官能力,从而增强其多模态交互能力,拓展其应用场景至实时交流和辅助决策等更广泛领域。马斯克正致力于将Grok打造成一个全面互联的平台,与X平台实现无缝对接,成为展示和训练Grok的核心舞台。X平台当前估值已缩水至190亿美元,相较于马斯克当初的收购价440亿美元有所下滑,他依然信心满满地推出付费订阅服务,计划将Grok置于最高订阅等级,以期吸引更多用户。

此外,特斯拉也可能为Grok提供有力支持,马斯克暗示特斯拉的车载人工智能计算机有望成为全球领先的推理计算平台。为了推动AI项目的发展,特斯拉已经打造了Dojo超级计算机,并在美国德州奥斯汀总部筹建新设施以容纳Dojo的部分组件。数字经济应用实践专家骆仁童博士认为,如果未来特斯拉和X平台携手合作,为xAI模型的训练提供强大的算力和数据支持,会构建出一个坚不可摧的合作联盟。


开源指控:OpenAI有背弃人工智能宗旨吗?

ChatGPT所引发的人工智能热潮,已然超越了单纯的商业机遇,演变成一场关于未来走向的激烈辩论及话语权的争夺。在关乎人类整体命运的关键时刻,科技巨头马斯克自然不会袖手旁观。自从他掌舵xAI并推出Grok这一AI大模型以来,马斯克便毫不犹豫地加入了这场混战。他甚至直言不讳地揭露OpenAI的承诺不过是空谈。当马斯克宣布将Grok开源后,立即在业界掀起轩然大波,赢得了广大网友的一致好评。

最近,马斯克更是向旧金山高等法院提起诉讼,指控OpenAI背弃了公司最初关于公共开源人工通用智能(AGI)的宗旨。此次Grok的开源行动,也被视为马斯克对OpenAI放弃开源原则的有力反击。在诉讼文件中,马斯克罗列了对OpenAI的多项指控,包括违约、违反信托义务和不正当竞争等,并强烈要求公司恢复其开源状态。

作为OpenAI的联合创始人,马斯克一直致力于打造一个开放的人工智能研究平台,倡导技术的透明化和共享精神,以确保人工智能的发展成果能够惠及全人类。他曾在多个场合表示,OpenAI这个名字正是源于他的愿景,并强调自己在吸引顶尖科学家和工程师加盟团队方面发挥了关键作用。

然而,这场围绕马斯克与OpenAI之间的纷争并未就此平息。面对马斯克的连番指控,OpenAI也迅速作出回应,并曝光了双方长达八年的邮件往来。值得一提的是,开源一直是马斯克行事风格中的重要一环。早在2014年,他就宣布特斯拉将放弃对其部分电动汽车技术专利的法律保护,希望通过开源特斯拉技术来激励其他汽车制造商投身电动汽车领域,共同推动行业的进步。尽管SpaceX并未像特斯拉那样直接开源其核心技术,但该公司的Starship火箭设计和一些关键技术细节也在一定范围内得到了公开。

如今,马斯克的开源宣言无疑给OpenAI带来了巨大的压力。在这场关乎未来的较量中,OpenAI是否会在近期内推出新的AI模型以应对挑战,将成为这场较量的最大看点。

关联分析:

商道童言(Innovationcases)欢迎点赞和分享哦!~~

免费电子书: | | | |

数字经济应用实践专家 骆仁童主讲课程

人工智能:

数字应用:

数字中国:

数字化转型:

产业数字化:《》

宏观与趋势:

思维与技能:

创新与创业:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人口只有1100多万,国土面积相当于桂林市,如今踢进世界杯正赛

人口只有1100多万,国土面积相当于桂林市,如今踢进世界杯正赛

青烟小先生
2026-06-25 19:39:28
教育界有个“托举悖论”:你替孩子铺的路越平坦,孩子自己的路就越难走;高段位父母只做两件“减法”

教育界有个“托举悖论”:你替孩子铺的路越平坦,孩子自己的路就越难走;高段位父母只做两件“减法”

心理观察局
2026-06-23 06:58:08
没人敢明说的真相:法拍拍不掉的房子,正在悄悄转嫁成本

没人敢明说的真相:法拍拍不掉的房子,正在悄悄转嫁成本

言叔财经视角
2026-03-01 22:50:30
散步再次成为焦点!医生发现:走得越多,脑梗患者血管或越干净?

散步再次成为焦点!医生发现:走得越多,脑梗患者血管或越干净?

健康科普365
2026-05-23 22:00:06
河南考生600分可能上不了郑大

河南考生600分可能上不了郑大

糖逗在娱乐
2026-06-25 18:57:50
官宣北京首钢遭重罚!开出3大处罚,和去年的4人禁赛3年差别很大

官宣北京首钢遭重罚!开出3大处罚,和去年的4人禁赛3年差别很大

老吴说体育
2026-06-25 23:33:52
梅雨“中场”休息!下一次降雨在……

梅雨“中场”休息!下一次降雨在……

上海宝山
2026-06-26 01:21:37
数百名医生已证实:维生素B12的真相,最好花点时间看看

数百名医生已证实:维生素B12的真相,最好花点时间看看

岐黄传人孙大夫
2026-06-19 18:45:03
周鸿祎开怼黄仁勋:站着说话不腰疼

周鸿祎开怼黄仁勋:站着说话不腰疼

快科技
2026-06-25 07:49:08
武汉考生郭斌721分拿下全国第一!分数线一出,有人笑醒有人失眠

武汉考生郭斌721分拿下全国第一!分数线一出,有人笑醒有人失眠

优墨出品
2026-06-24 14:34:01
出席APEC峰会可以,但拒绝跟中方见面?高市早苗甩脸色找错人了

出席APEC峰会可以,但拒绝跟中方见面?高市早苗甩脸色找错人了

触摸史迹
2026-06-26 05:22:15
已经宣布独立建国,但中国拒不承认的10个国家!

已经宣布独立建国,但中国拒不承认的10个国家!

老达子
2026-06-12 06:35:04
江苏南京知名生鲜商超两家分店,突然同时关闭,6月27日正式停业

江苏南京知名生鲜商超两家分店,突然同时关闭,6月27日正式停业

捣蛋窝
2026-06-26 04:16:06
江苏一女子用洗碗机清洗小龙虾,意外发现经“低温慢煮”后虾肉格外Q弹

江苏一女子用洗碗机清洗小龙虾,意外发现经“低温慢煮”后虾肉格外Q弹

黄河新闻网吕梁
2026-06-25 15:25:47
汪小菲不让玥儿回北京,马筱梅反驳被怼:不关你事!后妈太难当了

汪小菲不让玥儿回北京,马筱梅反驳被怼:不关你事!后妈太难当了

沧海一书客
2026-06-26 03:56:04
1-3!亚洲冠军1分垫底,连续2届世界杯出局,让亚足联彻底丢面子

1-3!亚洲冠军1分垫底,连续2届世界杯出局,让亚足联彻底丢面子

宝哥精彩赛事
2026-06-25 11:56:04
有退休金的人发现一个奇怪的现象:手里有20、30万存款的老人,最后过得好的,几乎都做了同两个让子女意外的决定

有退休金的人发现一个奇怪的现象:手里有20、30万存款的老人,最后过得好的,几乎都做了同两个让子女意外的决定

心理观察局
2026-06-07 06:37:04
波兰摘下挂了3年的乌克兰国旗,战争还没打完,最铁盟友先翻了脸

波兰摘下挂了3年的乌克兰国旗,战争还没打完,最铁盟友先翻了脸

魅力乌克兰
2026-06-26 01:32:28
为什么越来越多的大学生宁愿扎堆挤文员岗,也不愿意进厂做技工?

为什么越来越多的大学生宁愿扎堆挤文员岗,也不愿意进厂做技工?

今朝牛马
2026-06-25 22:45:36
上海交大发现:高血脂患者如果每周饿几次,其效果堪比药物作用?

上海交大发现:高血脂患者如果每周饿几次,其效果堪比药物作用?

健康科普365
2026-06-22 13:45:17
2026-06-26 06:32:49
商道童言 incentive-icons
商道童言
关注数字经济及创新案例研究
1793文章数 1567关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

霍尔木兹海峡再现风险:一艘货船遇袭 数艘油轮折返

头条要闻

霍尔木兹海峡再现风险:一艘货船遇袭 数艘油轮折返

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

本地
时尚
教育
公开课
军事航空

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

女人不管多大年纪,夏天都要准备一两条过膝裙,舒适又提气质

教育要闻

6月25日,2026年山东高考分数线发布:体育类一段线574分

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:现在到了关注朝鲜问题的时候了

无障碍浏览 进入关怀版