【CNMO科技消息】2月3日,小米创办人,董事长兼CEO雷军发文称,小米团队的多篇最新研究成果,成功入选ICLR 2026,研究方向涵盖多模态推理、强化学习、GUI Agent、端到端自动驾驶以及音频生成等领域。他还表示,ICLR是人工智能领域国际顶级会议之一,致力推动人工智能理论与方法的前沿研究与创新发展。
![]()
据CNMO了解,在强化学习方向,小米团队的《Shuffle-R1》创新提出数据动态重组框架,通过成对轨迹采样和优势值批次重排序两项核心技术,攻克多模态大模型训练中的优势坍缩与轨迹沉默难题,显著提升梯度信号质量,在多个基准测试中以极低计算开销超越已有强化学习基线。
![]()
移动智能体领域,小米团队的《MobileIPL》首创迭代偏好学习框架,基于Thinking-level DPO实现思考步骤的细粒度优化,结合三阶段指令演化机制突破高质量轨迹稀缺瓶颈,在AITZ等主流GUI-Agent测试中刷新性能纪录,并显著提升分布外场景鲁棒性。
在端到端自动驾驶研究方面,小米团队的《ReCogDrive》则实现了技术融合创新。该研究通过分层认知数据流水线注入驾驶先验知识,利用认知引导扩散规划器生成物理可行轨迹,并首创DiffGRPO强化学习算法直接优化驾驶策略,在NAVSIM与Bench2Drive的闭环测试中领先现有方案。
小米团队其他创新成果包括《ThinkOmni》实现文本推理能力向全模态的零成本迁移;《Flow2GAN》融合流匹配与对抗生成实现高保真少步音频合成;《WorldSplat》突破4D驾驶场景生成技术等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.