OpenAI要做硬件，但不是眼镜；腾讯发布首个工业级AIGC游戏引擎｜直面AI周报|谷歌|ar|微软|机器人|知名企业|openai|全球开发者大会

OpenAI要做硬件，但不是眼镜；腾讯发布首个工业级AIGC游戏引擎｜直面AI周报

2025-05-23 16:19:51　来源: 直面派

北京举报

分享至

OpenAI

奥特曼牵手“上一代硬件之神”艾维

OpenAI宣布以全股票交易方式，收购由前苹果设计总监Jony Ive创办的AI设备初创公司io，交易金额高达65亿美元（约合469亿元人民币），为公司历史上最大规模收购。早在2024年Q4，OpenAI已持有io公司23%股份。本次全资收购意在推动AI硬件落地，被视为向“AI设备时代”迈出的关键一步。

小面君：AI写得再聪明，还是要找个身体安放。Jony Ive的设计+OpenAI的大脑，听起来像是在造“未来版iPhone”——只不过这次，可能是AI在用你，而不是你在用手机。根据《华尔街日报》掌握的OpenAI内部电话会议记录，这款设备尺寸小巧、无屏幕、可以感知周围环境，且不会是智能眼镜。

GPT-5形态披露，

OpenAI要做AI界的“全能王”

OpenAI副总裁Jerry Tworek近日在Reddit透露，下一代大模型GPT-5将集成Codex、Operator、Deep Research和Memory等多个模块，致力于打造“All in One”型全能助手，减少用户在不同AI工具间来回切换的麻烦。GPT-5的核心提升方向，是大幅增强模型在计算类任务中的执行力。

小面君：以前是“装插件”，现在是“全套带走”。GPT-5这波整合，不只是堆功能，更是要变成一个真正听得懂、干得动、记得住的AI搭子。

OpenAI“星际之门”落地阿联酋，

全球AI基建版图再扩张

OpenAI与G42、Oracle、英伟达、思科、软银宣布合作启动“Stargate UAE”，这是OpenAI在阿布扎比部署的首个国际AI基础设施项目。该项目预计将建设1GW算力集群，首期200兆瓦将于2026年投入运营。同时，OpenAI也将启动亚太地区考察，推动“星际之门”在全球多国落地。

小面君：AI大模型卷完“智商”，开始卷“地盘”。Stargate UAE不只是个算力项目，更是OpenAI跑马圈地的国际信号弹——接下来，谁握有基础设施，谁就能定AI时代的“国运”。

腾讯

腾讯发布首个工业级AIGC游戏引擎“混元游戏”

腾讯推出“混元游戏”视觉生成平台，标志着首个工业级AIGC游戏内容生产引擎正式发布。平台依托大模型能力，面向游戏美术设计提供AI工具包，大幅提升素材生成与概念草图的效率，号称可提效数十倍。该平台还构建多算法模型矩阵，针对关键痛点进行专项优化，助力游戏制作全面AI化。

小面君：别说玩家“AI上号”了，现在连游戏素材都“AI画图”。混元游戏想要重塑整个游戏工业流水线的生产逻辑，卷不卷你说了不算，大模型说了算。

QQ浏览器升级为AI浏览器，

QBot携多Agent亮相

腾讯宣布QQ浏览器正式升级为AI浏览器，推出QBot超级助手，融合混元与DeepSeek双模型，涵盖AI搜索、浏览、办公、学习、写作等功能。首次上线“AI高考通”“下载助理”“股票助理”等多种灰度Agent，同时支持AI和网页搜索双视图模式。

小面君：在AI浏览器的赛道上，腾讯显然不服寂寞。QQ浏览器迈出成为“智能平台”的步伐，正面迎战早已布局夸克的阿里阵营：大厂争锋，浏览器功能不再只是“看网页”，而是AI生态的主战场。

美团

美团灰测“NoCode”AI编程工具

美团AI编程工具“NoCode”已进入灰度测试，由公司研发质量与效率团队开发，定位“Vibe Coding”，实现自然语言对话式生成网站、小程序、运营工具等功能。该策略延续今年3月CEO王兴提出的“AI at Work”“AI in Products”“Building LLM”三大战略方向新浪财经新浪财经。

小面君：早在内部，美团通过CatPaw让团队的AI编码占比达50%，将研发效率推上新高度；现在NoCode上场，商家和运营人员也能“像点外卖一样”生成工具。美团在AI道路上从“内部助攻”逐渐走向“面向客户赋能”。

字节

字节跳动与清华联合发布ChatTS

字节跳动联合清华大学发布多模态大模型ChatTS，聚焦时序数据处理与推理能力，填补该领域国内空白。模型强调在AIOps、金融等需处理复杂时序信息场景中的应用潜力，旨在提升AI对时间维度下因果逻辑的理解与响应能力。

抖音重拳出击“AI起号”乱象，

封禁多账号整治低俗内容

抖音近日发布公告，宣布专项治理“AI起号”乱象，重点打击AI生成低俗猎奇视频、伪造虚拟专家传播育儿内容、售卖AI视频账号等行为。目前平台已清理311条违规内容，封禁15个严重违规账号。抖音提醒，任何形式的账号交易或转让均属违规，鼓励创作者合法合规使用AI并标注生成内容。

飞书推出“知识问答”AI产品

飞书正式发布AI功能“知识问答”，依托DeepSeekR1等大模型，并结合RAG增强和知识图谱，能够智能整合企业内部文档、群聊、会议、知识库等多源信息，支持Web与App端运作，并在权限体系下保障安全问答。

小面君：字节跳动这波操作就是“三驾马车齐头进化”：从“造脑”出发——ChatTS补齐了多模态时序推理空白；再到“立规”—抖音严肃管控AI起号乱象，守住内容生态底线；再到“落地”—飞书借助DeepSeek‑R1让企业知识变身智能问答。这三步按节奏走下来，就是技术研发、安全合规、场景赋能三位一体，构成了字节跳动AI闭环打法。

谷歌

谷歌I/O重磅更新：

搜索上AI标签，浏览器装Gemini助手

在2025 I/O大会上，谷歌宣布搜索引擎新增“AI模式”入口，用户可用自然语言提问，获取AI生成的图文总结。Chrome浏览器则将内置Gemini助手，可跨标签页操作，甚至代劳浏览网页。另有图像模型Imagen 4、视频模型Veo 3、AI电影制作工具Flow、异步编程助手Jules，以及XR平台与智能眼镜计划，全面强化AI布局。

小面君：谷歌一边给搜索加AI外挂，一边在Chrome里塞进新“搭子”，还顺手扔出一堆创意工具和XR设备，像是说：别急着唱衰，我还没开始认真打。Perplexity慌不慌不确定，开发者是真得跟紧点了。

苹果

苹果智能眼镜芯片曝光，

预计2026年量产，主打低功耗

据外媒报道，苹果正为智能眼镜研发专用芯片，目标在2026或2027年实现量产。新芯片基于Apple Watch的S系列架构打造，相较于iPhone的A系列芯片功耗更低。苹果正针对智能眼镜体积小、电池受限的特点进行优化，意在实现更长续航与更强AI功能支持。

小面君：苹果这是在悄悄“磨刀”做眼镜，芯片都打磨到手表级别的低功耗了。一旦量产，可能不仅是科技新品，而是下一场“穿戴革命”的序曲。

苹果推出PH2D方法，

推动人形机器人训练低成本高效化

苹果近日公开名为PH2D（Physical Human-Humanoid Data）的新训练方法，结合人类教练与机器人示范者，提升人形机器人的学习效率。相较传统“高成本+高人工”的训练路径，PH2D使用改造后的消费级设备采集数据，显著降低训练门槛。相关论文已于本周三发布，标志着苹果在机器人AI研究上的新突破。

苹果iOS 19将开放AI模型，

打造“Apple Intelligence”开发生态

据知情人士透露，苹果计划在即将到来的WWDC上公布AI开放战略，届时将向第三方开发者开放其大语言模型。苹果正开发专用SDK与框架，允许开发者基于“Apple Intelligence”打造AI功能，强化应用生态，提升硬件吸引力。这将是iOS 19的一大核心升级。

小面君：在AI的赛场，经常能看到上一代互联网/移动互联网战事的影子。帮助苹果打造帝国的生态，在AI时代也会被顺利搭建起来吗？

苹果拟允许欧盟用户更换默认语音助手

据爆料，苹果计划在iPhone、iPad与Mac等设备上，为欧盟用户开放更换默认语音助手的权限，用户未来可选择Alexa或谷歌助手代替Siri。这一调整被视为苹果应对欧盟数字市场法规（DMA）的又一重要动作，进一步放宽系统封闭性，提升用户自由度。

其他

阿里Qwen发布偏好建模新作，

WorldPM模型亮相

阿里旗下Qwen团队推出偏好建模新系列WorldPM，包括WorldPM-72B及多个变体，覆盖RLHF、UltraFeedback等主流训练方式。该系列以1500万条偏好数据进行大规模训练，验证偏好建模与语言建模存在类似的扩展规律（scaling laws），有望提升模型在监督学习中的表现。

微软Build大会发布企业级智能体解决方案，

推动开放AI网络

在Build 2025大会上，微软发布了一整套智能体平台解决方案，重点包括Azure AI Foundry、Windows AI Foundry、GitHub Copilot 智能体进化以及Microsoft 365 Copilot智能体编排等功能，同时支持MCP协议与Entra Agent ID身份治理，推动“开放智能体网络”构建，吸引Fujitsu、Stanford等机构广泛接入。

特斯拉人形机器人Optimus炫技家务

特斯拉近日展示Optimus人形机器人在家庭场景中的多项能力，包括扔垃圾、扫地、搅拌锅中食物、关闭窗帘等。马斯克在采访中重申Optimus将是特斯拉“最重要的产品之一”。这段演示视频被认为是目前为止Optimus最成熟的一次功能展示，展示其向通用型AI体迈进的实用性。

Claude 4登场，

Anthropic发布全球最强编码AI

5月22日，Anthropic正式发布Claude 4系列模型，包含Claude Opus4与Claude Sonnet4。Opus4被誉为当前最佳编码模型，擅长长时任务与AI代理执行；Sonnet4则是对Sonnet3.7的全面升级，强化对用户指令的理解与响应，展现出更高水平的编程与推理能力，标志Claude进入智能执行新时代。

中国AR公司XREAL携手谷歌，

发布首款安卓XR平台旗舰眼镜

在Google I/O大会上，谷歌宣布与中国AR公司XREAL战略合作，推出全球首款专为Android XR平台打造的旗舰AR眼镜——Project Aura。该设备采用光学透视（OST）技术，由谷歌、XREAL与高通三方共研，覆盖平台、硬件、芯片三个核心层，标志中国AR力量正式站上全球XR舞台中心。

昆仑万维发布Skywork超级智能体

5月22日，昆仑万维正式推出天工超级智能体（Skywork Super Agents），结合AI Agent架构与deep research技术，可一站生成文档、PPT、表格、播客等内容，被称为“AI版Office”。其深度检索能力在GAIA榜上全球排名第一，超越OpenAI相关产品，标志中国企业在信息生成与搜索方面取得技术突破。

百度飞桨发布PaddleOCR 3.0

5月20日，百度飞桨团队正式开源发布PaddleOCR 3.0，识别精度相比上一版本提升13%。新版本在多语言支持、手写体识别与文档精度解析方面取得突破，进一步丰富了其在开源与产业落地中的应用能力。PaddleOCR 3.0全面适配飞桨3.0框架，为复杂文档解析提供更强支撑。

研究发现：AI可自发形成“社会习俗”

伦敦城市学院与哥本哈根信息技术大学的研究显示，在没有中央协调与预设规则的条件下，多个AI体也能自发形成行为规范与社会习俗。这一研究已发表于《Science Advances》，被视为AI群体行为理解的重要进展，模拟结果显示，AI可在去中心化环境中协作出统一的行为规则。

欢迎在评论区留言~
如需开白请加小编微信：dongfangmark

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.