网易首页 > 网易号 > 正文 申请入驻

AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3

0
分享至

OpenAI发布GPT-5

当地时间8月7日,OpenAI推出基础大模型更新,GPT-5面世了。OpenAI表示,这是公司迄今为止最智能、最快、最有用的模型,有内置思维能力,可以将专家级智能交到每个人手中。这款模型在编程、数学、写作、健康、视觉智能等领域有最先进的性能,且知道何时应该快速响应、何时应该思考更长时间。目前GPT-5可供所有用户使用,但免费用户还需要等待几天时间才能使用完整的推理功能。

点评:OpenAI强调GPT-5的幻觉率下降,而且对人类的“阿谀奉承”减少了。从基准测试看,GPT-5在不少基准测试中的得分超过o3和o4-mini,不过GPT-5的分数与前代模型的差距并没有很大。这款模型的能力能否代表最先进的人工智能水平,还需要观察。该模型发布后,特斯拉CEO马斯克表示,Grok 4在ARC-AGI基准测试中击败了GPT-5。

OpenAI推出两款开源模型

北京时间8月6日凌晨,OpenAI开源了gpt-oss-120b和gpt-oss-20b两个推理模型,这是OpenAI时隔六年再次开源模型。其中gpt-oss-120b参数量为1170亿,采用MoE(专家)架构,激活参数量51亿。gpt-oss-20b参数量为210亿,同样采用MoE架构,激活参数量36亿。gpt-oss-120b可以在单张80GB容量的GPU上运行,gpt-oss-20b可以在16GB内存的消费级设备上运行。

点评:OpenAI的开闭源策略已发生转变。随着DeepSeek引领开源的方向,此前OpenAI CEO山姆·奥尔特曼(Sam Altman)就表示,OpenAI认为推出强大、有推理能力的新开源模型“非常重要”。不过,OpenAI还是倾向于在旗舰模型上采取闭源策略。新发布的两款开源模型参数量相对较小,适合部署在端侧设备上。

Anthropic推出Claude Opus 4.1

北京时间8月6日凌晨,AI创业公司Anthropic发布了Claude Opus 4.1,称这一模型是Opus 4在代理任务、现实世界编码和推理方面的升级版。这款模型主要是在深入研究、数据分析、代理(agentic)搜索方面的能力比前一代有所提升。Anthropic表示,新产品擅长处理复杂的多步骤问题,该公司将其定位为更有效的AI智能体(Agent)。

点评:这款模型推出,也标志着Anthropic更频繁地推出产品渐进式更新。该公司表示,以往公司只专注于发布重大版本更新,此次更新意味着公司转向推动编码模型渐进式改进,公司还将在未来几周内推出更多更新。这种渐进式更新可以提高AI的可用性,这次推出的Claude Opus 4.1在代码编写、代理方面的迭代很实用。

谷歌发布世界模型Genie 3,支持实时交互

北京时间8月6日,谷歌发布新一代世界模型Genie 3,这是谷歌第一个允许进行实时交互的世界模型。该模型对世界物理特性的建模可以模拟水、光等自然现象,可以生成包含动物、植物在内的生态系统,还可以创造动画角色,并模拟复杂环境下各种元素的相互作用。在Genie 3生成的动态世界里,可以以每秒24帧的速度进行导航,并在720p的分辨率下保持长达几分钟的画面一致性,该模型的视觉记忆还可以追溯至一分钟前。

点评:谷歌沿着世界模型的路径往前迈了一步。谷歌表示,世界模型是迈向AGI(通用人工智能)的关键垫脚石,因为世界模型允许AI智能体在丰富的模拟环境中不受限制地训练。这款新模型突破了世界模型的能力边界,不过仍有一些局限性,例如可执行的动作空间有限、难以在一个共享环境中模拟多个智能体的交互、难以准确模拟真实世界的位置、交互持续时长无法长达数小时。

小红书开源多模态大模型dots.vlm1

8月6日,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编码器NaViT,具备多模态理解与推理能力。hi lab称,在主要的视觉评测集上,dots.vlm1的整体表现已接近当前领先模型,如Gemini 2.5 Pro与Seed-VL1.5 thinking。这一模型可以看懂复杂的图文交错图表,理解表情包背后的含义,分析两款产品的配料表差异,还能辨别博物馆中文物、画作名称。

点评:小红书今年开始在大模型领域发力。6月6日,小红书开源了其首款大语言模型,并在之后开源了专用模型,以及视觉、奖励模型等前沿方向的研究成果。作为大模型界的新玩家,小红书的后续动作值得关注。

马斯克宣布xAI将开源Grok-2大语言模型

8月6日,特斯拉CEO埃隆·马斯克宣布,其创办的xAI公司将于下周开源Grok 2模型,进一步推进人工智能模型的开源策略。Grok 2最早于2024年8月13日以Beta版本形式发布,当时就因其出色的推理能力和独特的"反觉醒"特性备受关注。与第一代Grok相比,Grok 2在多个方面实现了显著提升,特别是在复杂问题处理和逻辑推理方面表现突出。

点评: Grok 2此次开源将为开发者提供研究和应用xAI核心技术的机会,同时X平台正为订阅用户推出图片生成新功能,这意味着xAI在持续加码开源生态。

2025年AI应用市场半年报:近七成原生App用户规模负增长

8月5日消息,QuestMobile发布了《2025年AI应用市场半年报》。报告显示,2025上半年AI应用发展迅速,已经形成了四大梯队的产业格局。第一梯队由AI搜索引擎、AI综合助手这两个赛道组成,且一骑绝尘领先于其他赛道。截至6月,AI搜索引擎和AI综合助手的MAU分别达到了6.85亿和6.12亿。第二梯队由AI社交互动、AI专业顾问组成,月活跃用户规模分别为1.26亿、1.11亿。与此同时,原生APP市场进入洗牌期,整个上半年,近七成原生APP玩家月活跃用户规模出现负增长,尤其是手机厂商预装的AI手机助手,以及中长尾玩家,在使用场景缺失、同质化的问题影响下,增长乏力。

点评:报告中还有一项备受关注的数据:DeepSeek的月活跃用户数从3月份的最高1.93亿下降到了6月份的1.62亿。然而这并不代表DeepSeek热潮的退潮,R1模型效应仍在,只不过渠道发生分流。QuestMobile数据显示,2025年5月,DeepSeek App流失用户中,56.0%使用了百度,42.1%使用了QQ浏览器,39.4%使用了豆包。

AMD第二季度营收同比增长32%

当地时间8月5日,AMD披露2025年第二季度财报。该季度AMD营收76.85亿美元,同比增长32%,创下季度新高,净利润则为8.72亿美元。第二季度,AMD数据中心收入同比增长14%,达到32亿美元,但未达到分析师预期。AMD表示,第二季度业绩受到贸易政策的影响,这些限制导致约8亿美元的库存及相关费用。当地时间8月6日,AMD股价下跌6.42%,8月7日涨5.69%,

点评:AMD的业绩受到AI芯片出口限制一定的影响。该公司称,第二季度非GAAP毛利率为43%,如果剔除贸易政策带来的库存相关费用损失影响,该季度非GAAP毛利率约为54%。从市场需求看,AMD CEO苏姿丰则表示,市场对计算与AI产品组合的需求旺盛。该公司预计,未来季度中AI收入将同比增长。

谷歌称AI搜索未致网站流量下滑

大量研究表明,用户转向使用人工智能搜索功能和使用人工智能聊天机器人正在抢走出版商网站的流量。但谷歌否认了这一说法,谷歌的数据显示,与去年同期相比,来自该搜索引擎的点击量总体保持“相对稳定”,只是部分网站点击量有所增加,另一些则有所减少。谷歌副总裁兼搜索主管利兹·里德 (Liz Reid) 在一篇博客文章中写道:“这些数据与第三方报告形成鲜明对比,这些报告错误地指出了总流量的急剧下降——通常基于有缺陷的方法、孤立的例子或在搜索中推出人工智能功能之前发生的流量变化。”

点评:谷歌认为一些第三方报告的研究结果有误。此前,皮尤研究中心发布报告称,当谷歌提供AI概览(即搜索结果顶部的AI生成摘要)时,用户“不太可能”点击链接。对此,里德还在博客中指出,谷歌的研究结果与一些基于“有缺陷的方法论”的第三方报告相矛盾。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026新规落地:嫖娼仍是违法!处罚证据全公开,别再心存侥幸

2026新规落地:嫖娼仍是违法!处罚证据全公开,别再心存侥幸

复转这些年
2026-02-13 05:20:07
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
惊喜连连!18岁全红婵强势归队,4大好消息藏不住了

惊喜连连!18岁全红婵强势归队,4大好消息藏不住了

卿子书
2026-02-12 08:15:51
黄金未来有可能到3万元一克?

黄金未来有可能到3万元一克?

流苏晚晴
2026-02-13 18:05:31
上海5000万消费券明天开抢!春节可用!赶紧定闹钟↗

上海5000万消费券明天开抢!春节可用!赶紧定闹钟↗

东方不败然多多
2026-02-13 14:50:54
两个日本巨头,三菱和索尼,突然在中国市场砸下了重注

两个日本巨头,三菱和索尼,突然在中国市场砸下了重注

扶苏聊历史
2026-02-13 13:36:01
1985年百万大裁军,被撤销的四大军区司令员与政委,后来都去往何处?

1985年百万大裁军,被撤销的四大军区司令员与政委,后来都去往何处?

老杉说历史
2026-02-13 16:35:06
银行员工:若你60-80岁了,一定要停止存款,原因让人意想不到

银行员工:若你60-80岁了,一定要停止存款,原因让人意想不到

王二哥老搞笑
2026-02-12 11:18:57
成都气温逐步降 请注意保暖

成都气温逐步降 请注意保暖

掌上金牛
2026-02-13 16:39:02
初代小米SU7彻底停产!小米汽车:准备了至少10年以上的备件保障能力

初代小米SU7彻底停产!小米汽车:准备了至少10年以上的备件保障能力

快科技
2026-02-12 22:14:07
李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

子芫伴你成长
2026-01-25 08:10:03
黄酒再次被讨论!专家发现:脑梗病人喝黄酒,不用多久或有7变化

黄酒再次被讨论!专家发现:脑梗病人喝黄酒,不用多久或有7变化

蜉蝣说
2026-02-12 15:16:45
河南一起重机企业年会现场摆放40台点钞机,“全网最爱发钱老板”崔培军入场时全体员工起立鼓掌,现场将发放现金6000万元

河南一起重机企业年会现场摆放40台点钞机,“全网最爱发钱老板”崔培军入场时全体员工起立鼓掌,现场将发放现金6000万元

极目新闻
2026-02-13 16:15:51
时隔4年,日本再次扣押中国大陆渔船

时隔4年,日本再次扣押中国大陆渔船

观察者网
2026-02-13 10:44:05
中国最著名“叛国者”去世,逃亡99.9%概率死,0.1%奇迹改写一生

中国最著名“叛国者”去世,逃亡99.9%概率死,0.1%奇迹改写一生

近史谈
2026-02-11 19:15:10
21年,韩国引进一中国东北虎,刚到韩国动物园,就遭到本土虎攻击

21年,韩国引进一中国东北虎,刚到韩国动物园,就遭到本土虎攻击

南权先生
2026-02-06 15:46:38
有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

王二哥老搞笑
2026-02-06 15:54:51
王宝强导演黑帮片开机!持枪坐龙椅,讲唐人街故事,也学陈思诚?

王宝强导演黑帮片开机!持枪坐龙椅,讲唐人街故事,也学陈思诚?

头号电影院
2026-02-12 20:20:48
逆转大胜!霍勒迪31+9+7,森萨博28+4,快船很无奈:西部第九易主

逆转大胜!霍勒迪31+9+7,森萨博28+4,快船很无奈:西部第九易主

篮球大视野
2026-02-13 12:47:54
刘强东光送年货没发钱,60岁村民被问是否失望,老人家回答太戳心

刘强东光送年货没发钱,60岁村民被问是否失望,老人家回答太戳心

观察鉴娱
2026-01-31 09:45:47
2026-02-13 21:55:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
244408文章数 621499关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

浙江"一人公司"兴起 前大厂程序员靠AI直接月入200万

头条要闻

浙江"一人公司"兴起 前大厂程序员靠AI直接月入200万

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

家居
本地
亲子
教育
公开课

家居要闻

中古雅韵 乐韵伴日常

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

亲子要闻

看看后妈是怎么做的

教育要闻

希望这位宝妈想明白后,可以再回来找我!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版