本期为TechBeat人工智能社区第761期线上Talk。
北京时间4月22日(周三) 20:00,清华大学博士生徐泽来、徐哲轩、苑会宁的Talk将准时在TechBeat人工智能社区开播!
他们与大家分享的主题是:大模型在多智能体任务中的评估、训练与Scaling。届时他们将结合三篇工作(其中一篇为 CVPR Oral、一篇被 ICLR 录用),详细介绍大模型在多智能体系统中的探索与实践。
Talk·信息
主题:大模型在多智能体任务中的评估、训练与Scaling
嘉宾:清华大学 - 徐泽来 徐哲轩 苑会宁
时间:北京时间4月22日(周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
Talk·介绍
随着任务难度的提升,大模型智能体正从单智能体走向多智能体的合作与竞争,如何在多智能体任务中评估、训练并Scale大模型的能力变得重要。
本次分享将结合我们的三篇工作,详细介绍大模型在多智能体系统中的探索与实践。
Talk大纲
1. 背景:大模型与多智能体
2. 评估:VS-Bench (CVPR 2026 Oral)
3. 训练:MARSHAL (ICLR 2026)
4. Scaling:WideSeek-R1
Talk·预习资料
![]()
[1] VS-Bench: Evaluating VLMs for Strategic Abilities in Multi-Agent Environments 论文链接:https://arxiv.org/abs/2506.02387 代码链接:https://github.com/zelaix/VS-Bench 项目主页:https://vs-bench.github.io
[2] MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs 论文链接:https://arxiv.org/abs/2510.15414 代码链接:https://github.com/thu-nics/MARSHAL 项目主页:https://thu-nics.github.io/MARSHAL
![]()
[3] WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning 论文链接:https://arxiv.org/abs/2602.04634 代码链接:https://github.com/RLinf/RLinf/tree/main/examples/agent/wideseek_r1 项目主页:https://wideseek-r1.github.io
Talk·提问交流
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
![]()
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
![]()
徐泽来
清华大学·博士生
徐泽来,清华大学电子系博士生,研究方向为多智能体强化学习和大模型智能体。徐泽来的研究专注于用多智能体强化学习提升大模型的推理、决策、组织等能力,其中Strategic Langauge Agent在狼人杀博弈中实现了人类决策水平的智能体;MARSHAL通过自博弈RL训练提升模型在多智能体系统中的推理泛化能力;WideSeek-R1通过多智能体RL探索智能体维度的scaling机制,相关工作发表于ICML,ICLR,NeurIPS,CVPR(Oral)等会议中。
个人主页: https://www.techbeat.net/grzytrkj?id=45990
![]()
徐哲轩
清华大学·准博士生
徐哲轩,本科就读于中国科学技术大学少年班学院,主修计算机科学与技术,以专业前2%的绩点直博清华大学电子工程系,师从汪玉教授。研究方向聚焦于多智能体系统、强化学习与具身智能。本科期间,曾作为项目负责人独立主持国家自然科学基金青年学生基础研究专项(全国每年约150人入选)。此外,以共同第一作者身份完成两篇学术论文,其中一篇被CVPR 2026收录为Oral。
![]()
苑会宁
清华大学·博士生
2025级博士生,主要研究方向为大模型智能体、强化学习和世界模型,目前发表学术论文有:一篇NeurIPS 2023,一篇KDD 2025,一篇ICLR 2026,一篇Nature子刊Computational Science。
个人主页: https://www.techbeat.net/grzytrkj?id=46416
-The End-
![]()
如果你也想成为讲者
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
预约本期Talk
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.