据路透社报道,欧盟周五表示,将坚持实施具有里程碑意义的人工智能立法的时间表,以回应一百多家科技公司为推迟欧盟人工智能规则而做出的联合努力。
近日,Y Combinator 更新了李飞飞在旧金山 AI 创业学校的访谈视频。李飞飞在访谈中明确表示,空间智能将是下一个人工智能革命的关键领域,只有让 AI 理解三维世界,它才能真正迈向通用人工智能(AGI)。
过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。
大模型
1)OpenAI 招聘主管批评 Meta:令人绝望
近期 Meta 与 OpenAI 之间的纠葛不断,源于 Meta 的挖人计划,后续 OpenAI CEO Sam Altman 亲自下场回应称「令人反感」,同时公司多位高管也在内部信中表示「会努力留住每个人」。
而在近日,OpenAI 的招聘负责人 Joaquin Quiñonero Candela 也发文回应了 Meta 近期的「挖墙脚」事件,称 Meta 过于激进。
Joaquin 在文中透露,Meta 向 OpenAI 的员工开出高薪岗位,但 offer 有效期仅为短短几小时,员工几乎没有时间与自己的主管进行沟通。Joaquin 批评称,「这种行为不道德,甚至是令人绝望的」。
2)李飞飞:AI 的未来在于空间智能,三维世界理解是 AGI 的关键
近日,Y Combinator 更新了李飞飞在旧金山 AI 创业学校的访谈视频。李飞飞回顾了自己从创办 ImageNet 到推动深度学习和物体识别发展的一路历程,并重点提到她如今正攻克 AI 领域最具挑战性的前沿技术——空间智能。
她在访谈中明确表示,空间智能将是下一个人工智能革命的关键领域,只有让 AI 理解三维世界,它才能真正迈向通用人工智能(AGI)。
李飞飞解释道,与语言模型的构建相比,空间智能的挑战更为复杂,因为人类对三维世界的感知能力相对较弱,然而她坚信,通过软硬件的融合与创新,这一难题是可以解决的。
李飞飞将 ImageNet 的诞生视为计算机视觉与深度学习领域的范式转变,而她现在的目标是通过攻克空间智能,继续引领人工智能的变革。她表示,AI 必须超越生成模型,进入三维世界的理解,才能真正实现 AGI。
3)苹果开源全新代码生成模型
近日,苹果公司在 HuggingFace 平台悄然上线其最新大模型成果——DiffuCoder-7B-cpGRPO。
这一版本在原有 DiffuCoder-Instruct 的基础上,进一步引入了 Coupled-GRPO 强化学习算法进行微调,显著提升了在代码生成任务上的表现。根据官方说明,该模型在 EvalPlus 基准测试中性能提升 4.4%,并有效减轻了解码过程中对自回归偏差的依赖。
DiffuCoder-7B-cpGRPO 属于苹果打造的扩散式大语言模型系列,具备 76.2 亿参数,采用 bfloat16 精度训练,支持基于提示词的代码生成。其训练流程基于 DiffuCoder-7B-Instruct 初始化,并在 2.1 万条代码数据上进行一个 epoch 的后训练。
4)Grok 4 跑分曝光
近期,X 博主 @legit_api 曝光了马斯克旗下 xAI 即将发布的新一代模型 Grok-4 及其编程版本 Grok-4 Code 的一组基准测试成绩,引发关注。
在被称为「人类最后的考试」(HLE)的评估中,Grok-4 取得了 35% 的基础得分,开启推理功能后进一步提升至 45%,显著领先于 OpenAI 的 o3 以及 Google Gemini 系列在该测试中的表现。
除了 HLE,Grok-4 在其他基准测试中也表现出色。在 GPQA 测试中,该模型得分达到了 87%-88%;而面向代码能力的 SWE Bench 评测中,Grok-4 Code 的得分则在 72%-75% 之间。
5)欧盟表示将继续按计划推出人工智能立法
据路透社报道,欧盟周五表示,将坚持实施具有里程碑意义的人工智能立法的时间表,以回应一百多家科技公司为推迟欧盟人工智能规则而做出的联合努力。
包括 Alphabet、Meta、Mistral AI 和 ASML 等巨头在内的全球科技公司一直在敦促欧盟委员会推迟推出《人工智能法案》,称这将损害欧洲在快速发展的人工智能领域的竞争机会。
报道援引欧盟委员会发言人托马斯·雷尼尔的话说:“我确实看到了很多关于《人工智能法案》的报道、信件和言论。让我尽可能明确地说明,这项法案没有停摆,没有宽限期,也没有暂停。”
《人工智能法案》是一项基于风险的人工智能应用监管法规,它彻底禁止了少数“不可接受风险”的用例,例如认知行为操纵或社交评分。该法案还定义了一系列“高风险”用途,例如生物识别和面部识别,以及用于教育和就业等领域的人工智能。应用程序开发者需要注册其系统并履行风险和质量管理义务,才能进入欧盟市场。
AI应用
1)报道称B站即将推出 “代号 H” AI 创作工具,力推视频播客业务
据 Tech 星球今日爆料,B站正发力视频播客业务,平台即将推出一系列扶持政策,以及在B站内部项目名称为“代号 H”的 AI 创作工具。
爆料称B站即将推出的 AI 创作工具,在内部的项目名称为“代号 H”,主要用于帮助播客创作者节省视频素材查找和剪辑工作,创作者输入内容,该工具即可自动生成画面。该 AI 创作工具可以支持文案、音频两种格式的输入,主要适配播客和泛知识杂谈图文两种模板,目前可以做到千字内容 6 分钟内生成完毕,预计可以缩减到 3 分钟,“目前定向邀请创作者体验的反馈是超出预期的”。
2)智元发布新款人形机器人灵犀X2-N,能在轮式和足式之间自由切换
7月7日上午消息,智元宣布发布哪吒机器人灵犀X2-N。据智元方面介绍,它最大亮点在于其双形态设计,能在轮式和足式之间自由切换。
足式状态下,可以盲走上台阶,甚至手持近12斤重物也能稳健前行;切换到轮式形态,移动高效,边走边滑,面对单边桥、斜坡等复杂地形,都能轻松应对,过桥、越坡后稳稳落地,还能在坡道上灵活转向。即便遭遇外力推搡,轮式形态下也稳如泰山,抗冲击能力极强。
AI基础设施
1)Meta系初创公司Nectar Social获860万美元融资,用AI解码全网消费动因与情绪
Nectar Social 新获 860 万美元融资,使总融资额进一步提升。
这家位于西雅图地区的初创公司提供社区管理、营销、分析和社交监听工具的订阅服务,企业可利用这些工具在 Facebook、Reddit 和 TikTok 等社交媒体平台上监测趋势与客户动态。
曾任职于Meta 的Misbah Uraizee 与 Farah Uraizee 于 2023 年创立了这家目前拥有 13 名员工的公司。她们已从 True Ventures 和 GV(原 Google Ventures)等投资方处累计筹集 1060 万美元。
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.