OpenAI
奥特曼牵手“上一代硬件之神”艾维
OpenAI宣布以全股票交易方式,收购由前苹果设计总监Jony Ive创办的AI设备初创公司io,交易金额高达65亿美元(约合469亿元人民币),为公司历史上最大规模收购。早在2024年Q4,OpenAI已持有io公司23%股份。本次全资收购意在推动AI硬件落地,被视为向“AI设备时代”迈出的关键一步。
小面君:AI写得再聪明,还是要找个身体安放。Jony Ive的设计+OpenAI的大脑,听起来像是在造“未来版iPhone”——只不过这次,可能是AI在用你,而不是你在用手机。根据《华尔街日报》掌握的OpenAI内部电话会议记录,这款设备尺寸小巧、无屏幕、可以感知周围环境,且不会是智能眼镜。
GPT-5形态披露,
OpenAI要做AI界的“全能王”
OpenAI副总裁Jerry Tworek近日在Reddit透露,下一代大模型GPT-5将集成Codex、Operator、Deep Research和Memory等多个模块,致力于打造“All in One”型全能助手,减少用户在不同AI工具间来回切换的麻烦。GPT-5的核心提升方向,是大幅增强模型在计算类任务中的执行力。
小面君:以前是“装插件”,现在是“全套带走”。GPT-5这波整合,不只是堆功能,更是要变成一个真正听得懂、干得动、记得住的AI搭子。
OpenAI“星际之门”落地阿联酋,
全球AI基建版图再扩张
OpenAI与G42、Oracle、英伟达、思科、软银宣布合作启动“Stargate UAE”,这是OpenAI在阿布扎比部署的首个国际AI基础设施项目。该项目预计将建设1GW算力集群,首期200兆瓦将于2026年投入运营。同时,OpenAI也将启动亚太地区考察,推动“星际之门”在全球多国落地。
小面君:AI大模型卷完“智商”,开始卷“地盘”。Stargate UAE不只是个算力项目,更是OpenAI跑马圈地的国际信号弹——接下来,谁握有基础设施,谁就能定AI时代的“国运”。
腾讯
腾讯发布首个工业级AIGC游戏引擎“混元游戏”
腾讯推出“混元游戏”视觉生成平台,标志着首个工业级AIGC游戏内容生产引擎正式发布。平台依托大模型能力,面向游戏美术设计提供AI工具包,大幅提升素材生成与概念草图的效率,号称可提效数十倍。该平台还构建多算法模型矩阵,针对关键痛点进行专项优化,助力游戏制作全面AI化。
小面君:别说玩家“AI上号”了,现在连游戏素材都“AI画图”。混元游戏想要重塑整个游戏工业流水线的生产逻辑,卷不卷你说了不算,大模型说了算。
QQ浏览器升级为AI浏览器,
QBot携多Agent亮相
腾讯宣布QQ浏览器正式升级为AI浏览器,推出QBot超级助手,融合混元与DeepSeek双模型,涵盖AI搜索、浏览、办公、学习、写作等功能。首次上线“AI高考通”“下载助理”“股票助理”等多种灰度Agent,同时支持AI和网页搜索双视图模式。
小面君:在AI浏览器的赛道上,腾讯显然不服寂寞。QQ浏览器迈出成为“智能平台”的步伐,正面迎战早已布局夸克的阿里阵营:大厂争锋,浏览器功能不再只是“看网页”,而是AI生态的主战场。
美团
美团灰测“NoCode”AI编程工具
美团AI编程工具“NoCode”已进入灰度测试,由公司研发质量与效率团队开发,定位“Vibe Coding”,实现自然语言对话式生成网站、小程序、运营工具等功能。该策略延续今年3月CEO王兴提出的“AI at Work”“AI in Products”“Building LLM”三大战略方向新浪财经新浪财经。
小面君:早在内部,美团通过CatPaw让团队的AI编码占比达50%,将研发效率推上新高度;现在NoCode上场,商家和运营人员也能“像点外卖一样”生成工具。美团在AI道路上从“内部助攻”逐渐走向“面向客户赋能”。
字节
字节跳动与清华联合发布ChatTS
字节跳动联合清华大学发布多模态大模型ChatTS,聚焦时序数据处理与推理能力,填补该领域国内空白。模型强调在AIOps、金融等需处理复杂时序信息场景中的应用潜力,旨在提升AI对时间维度下因果逻辑的理解与响应能力。
抖音重拳出击“AI起号”乱象,
封禁多账号整治低俗内容
抖音近日发布公告,宣布专项治理“AI起号”乱象,重点打击AI生成低俗猎奇视频、伪造虚拟专家传播育儿内容、售卖AI视频账号等行为。目前平台已清理311条违规内容,封禁15个严重违规账号。抖音提醒,任何形式的账号交易或转让均属违规,鼓励创作者合法合规使用AI并标注生成内容。
飞书推出“知识问答”AI产品
飞书正式发布AI功能“知识问答”,依托DeepSeekR1等大模型,并结合RAG增强和知识图谱,能够智能整合企业内部文档、群聊、会议、知识库等多源信息,支持Web与App端运作,并在权限体系下保障安全问答。
小面君:字节跳动这波操作就是“三驾马车齐头进化”:从“造脑”出发——ChatTS补齐了多模态时序推理空白;再到“立规”—抖音严肃管控AI起号乱象,守住内容生态底线;再到“落地”—飞书借助DeepSeek‑R1让企业知识变身智能问答。这三步按节奏走下来,就是技术研发、安全合规、场景赋能三位一体,构成了字节跳动AI闭环打法。
谷歌
谷歌I/O重磅更新:
搜索上AI标签,浏览器装Gemini助手
在2025 I/O大会上,谷歌宣布搜索引擎新增“AI模式”入口,用户可用自然语言提问,获取AI生成的图文总结。Chrome浏览器则将内置Gemini助手,可跨标签页操作,甚至代劳浏览网页。另有图像模型Imagen 4、视频模型Veo 3、AI电影制作工具Flow、异步编程助手Jules,以及XR平台与智能眼镜计划,全面强化AI布局。
小面君:谷歌一边给搜索加AI外挂,一边在Chrome里塞进新“搭子”,还顺手扔出一堆创意工具和XR设备,像是说:别急着唱衰,我还没开始认真打。Perplexity慌不慌不确定,开发者是真得跟紧点了。
苹果
苹果智能眼镜芯片曝光,
预计2026年量产,主打低功耗
据外媒报道,苹果正为智能眼镜研发专用芯片,目标在2026或2027年实现量产。新芯片基于Apple Watch的S系列架构打造,相较于iPhone的A系列芯片功耗更低。苹果正针对智能眼镜体积小、电池受限的特点进行优化,意在实现更长续航与更强AI功能支持。
小面君:苹果这是在悄悄“磨刀”做眼镜,芯片都打磨到手表级别的低功耗了。一旦量产,可能不仅是科技新品,而是下一场“穿戴革命”的序曲。
苹果推出PH2D方法,
推动人形机器人训练低成本高效化
苹果近日公开名为PH2D(Physical Human-Humanoid Data)的新训练方法,结合人类教练与机器人示范者,提升人形机器人的学习效率。相较传统“高成本+高人工”的训练路径,PH2D使用改造后的消费级设备采集数据,显著降低训练门槛。相关论文已于本周三发布,标志着苹果在机器人AI研究上的新突破。
苹果iOS 19将开放AI模型,
打造“Apple Intelligence”开发生态
据知情人士透露,苹果计划在即将到来的WWDC上公布AI开放战略,届时将向第三方开发者开放其大语言模型。苹果正开发专用SDK与框架,允许开发者基于“Apple Intelligence”打造AI功能,强化应用生态,提升硬件吸引力。这将是iOS 19的一大核心升级。
小面君:在AI的赛场,经常能看到上一代互联网/移动互联网战事的影子。帮助苹果打造帝国的生态,在AI时代也会被顺利搭建起来吗?
苹果拟允许欧盟用户更换默认语音助手
据爆料,苹果计划在iPhone、iPad与Mac等设备上,为欧盟用户开放更换默认语音助手的权限,用户未来可选择Alexa或谷歌助手代替Siri。这一调整被视为苹果应对欧盟数字市场法规(DMA)的又一重要动作,进一步放宽系统封闭性,提升用户自由度。
其他
阿里Qwen发布偏好建模新作,
WorldPM模型亮相
阿里旗下Qwen团队推出偏好建模新系列WorldPM,包括WorldPM-72B及多个变体,覆盖RLHF、UltraFeedback等主流训练方式。该系列以1500万条偏好数据进行大规模训练,验证偏好建模与语言建模存在类似的扩展规律(scaling laws),有望提升模型在监督学习中的表现。
微软Build大会发布企业级智能体解决方案,
推动开放AI网络
在Build 2025大会上,微软发布了一整套智能体平台解决方案,重点包括Azure AI Foundry、Windows AI Foundry、GitHub Copilot 智能体进化以及Microsoft 365 Copilot智能体编排等功能,同时支持MCP协议与Entra Agent ID身份治理,推动“开放智能体网络”构建,吸引Fujitsu、Stanford等机构广泛接入。
特斯拉人形机器人Optimus炫技家务
特斯拉近日展示Optimus人形机器人在家庭场景中的多项能力,包括扔垃圾、扫地、搅拌锅中食物、关闭窗帘等。马斯克在采访中重申Optimus将是特斯拉“最重要的产品之一”。这段演示视频被认为是目前为止Optimus最成熟的一次功能展示,展示其向通用型AI体迈进的实用性。
Claude 4登场,
Anthropic发布全球最强编码AI
5月22日,Anthropic正式发布Claude 4系列模型,包含Claude Opus4与Claude Sonnet4。Opus4被誉为当前最佳编码模型,擅长长时任务与AI代理执行;Sonnet4则是对Sonnet3.7的全面升级,强化对用户指令的理解与响应,展现出更高水平的编程与推理能力,标志Claude进入智能执行新时代。
中国AR公司XREAL携手谷歌,
发布首款安卓XR平台旗舰眼镜
在Google I/O大会上,谷歌宣布与中国AR公司XREAL战略合作,推出全球首款专为Android XR平台打造的旗舰AR眼镜——Project Aura。该设备采用光学透视(OST)技术,由谷歌、XREAL与高通三方共研,覆盖平台、硬件、芯片三个核心层,标志中国AR力量正式站上全球XR舞台中心。
昆仑万维发布Skywork超级智能体
5月22日,昆仑万维正式推出天工超级智能体(Skywork Super Agents),结合AI Agent架构与deep research技术,可一站生成文档、PPT、表格、播客等内容,被称为“AI版Office”。其深度检索能力在GAIA榜上全球排名第一,超越OpenAI相关产品,标志中国企业在信息生成与搜索方面取得技术突破。
百度飞桨发布PaddleOCR 3.0
5月20日,百度飞桨团队正式开源发布PaddleOCR 3.0,识别精度相比上一版本提升13%。新版本在多语言支持、手写体识别与文档精度解析方面取得突破,进一步丰富了其在开源与产业落地中的应用能力。PaddleOCR 3.0全面适配飞桨3.0框架,为复杂文档解析提供更强支撑。
研究发现:AI可自发形成“社会习俗”
伦敦城市学院与哥本哈根信息技术大学的研究显示,在没有中央协调与预设规则的条件下,多个AI体也能自发形成行为规范与社会习俗。这一研究已发表于《Science Advances》,被视为AI群体行为理解的重要进展,模拟结果显示,AI可在去中心化环境中协作出统一的行为规则。
欢迎在评论区留言~
如需开白请加小编微信:dongfangmark
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.