网易首页 > 网易号 > 正文 申请入驻

Talk预告 | 清华大学团队:大模型在多智能体任务中的评估、训练与Scaling

0
分享至

本期为TechBeat人工智能社区761线上Talk。

北京时间4月22(周三) 20:00,清华大学博士生徐泽来、徐哲轩、苑会宁的Talk将准时在TechBeat人工智能社区开播!

他们与大家分享的主题是:大模型在多智能体任务中的评估、训练与Scaling。届时他们将结合三篇工作(其中一篇为 CVPR Oral、一篇被 ICLR 录用),详细介绍大模型在多智能体系统中的探索与实践。

Talk·信息

主题:大模型在多智能体任务中的评估、训练与Scaling

嘉宾:清华大学 - 徐泽来 徐哲轩 苑会宁

时间:北京时间4月22日(周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

随着任务难度的提升,大模型智能体正从单智能体走向多智能体的合作与竞争,如何在多智能体任务中评估、训练并Scale大模型的能力变得重要。

本次分享将结合我们的三篇工作,详细介绍大模型在多智能体系统中的探索与实践。

Talk大纲

1. 背景:大模型与多智能体

2. 评估:VS-Bench (CVPR 2026 Oral)

3. 训练:MARSHAL (ICLR 2026)

4. Scaling:WideSeek-R1

Talk·预习资料



[1] VS-Bench: Evaluating VLMs for Strategic Abilities in Multi-Agent Environments 论文链接:https://arxiv.org/abs/2506.02387 代码链接:https://github.com/zelaix/VS-Bench 项目主页:https://vs-bench.github.io

[2] MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs 论文链接:https://arxiv.org/abs/2510.15414 代码链接:https://github.com/thu-nics/MARSHAL 项目主页:https://thu-nics.github.io/MARSHAL

[3] WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning 论文链接:https://arxiv.org/abs/2602.04634 代码链接:https://github.com/RLinf/RLinf/tree/main/examples/agent/wideseek_r1 项目主页:https://wideseek-r1.github.io

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!


你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍


徐泽来

清华大学·博士生

徐泽来,清华大学电子系博士生,研究方向为多智能体强化学习和大模型智能体。徐泽来的研究专注于用多智能体强化学习提升大模型的推理、决策、组织等能力,其中Strategic Langauge Agent在狼人杀博弈中实现了人类决策水平的智能体;MARSHAL通过自博弈RL训练提升模型在多智能体系统中的推理泛化能力;WideSeek-R1通过多智能体RL探索智能体维度的scaling机制,相关工作发表于ICML,ICLR,NeurIPS,CVPR(Oral)等会议中。

个人主页: https://www.techbeat.net/grzytrkj?id=45990


徐哲轩

清华大学·准博士生

徐哲轩,本科就读于中国科学技术大学少年班学院,主修计算机科学与技术,以专业前2%的绩点直博清华大学电子工程系,师从汪玉教授。研究方向聚焦于多智能体系统、强化学习与具身智能。本科期间,曾作为项目负责人独立主持国家自然科学基金青年学生基础研究专项(全国每年约150人入选)。此外,以共同第一作者身份完成两篇学术论文,其中一篇被CVPR 2026收录为Oral。


苑会宁

清华大学·博士生

2025级博士生,主要研究方向为大模型智能体、强化学习和世界模型,目前发表学术论文有:一篇NeurIPS 2023,一篇KDD 2025,一篇ICLR 2026,一篇Nature子刊Computational Science。

个人主页: https://www.techbeat.net/grzytrkj?id=46416

-The End-


如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

牛油果生活观
2026-06-02 19:09:43
退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

大风新闻
2026-06-03 19:48:17
不到24小时,美国接连迎来三大坏消息,内部实情已被曝光

不到24小时,美国接连迎来三大坏消息,内部实情已被曝光

策前论
2026-06-03 14:52:30
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
为什么现在外敌越来越不怕中国?著名军事专家戴旭曾一针见血

为什么现在外敌越来越不怕中国?著名军事专家戴旭曾一针见血

叹为观止易
2026-06-03 05:36:51
继续黑马之旅!淘汰郑钦文之人横扫22号种子,首进大满贯四强

继续黑马之旅!淘汰郑钦文之人横扫22号种子,首进大满贯四强

全景体育V
2026-06-03 19:09:08
今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

老郭在学习
2026-06-03 13:31:11
苹果5款新品官宣,6月9日,正式发布

苹果5款新品官宣,6月9日,正式发布

科技堡垒
2026-06-03 09:40:13
霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

每日经济新闻
2026-06-03 07:49:10
王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

帝哥说史
2026-06-02 21:40:03
四川巴中一小学为教师定制1500元一套的西装,官方通报:存在决策程序失当、经费使用不规范等问题,校长马某某停职

四川巴中一小学为教师定制1500元一套的西装,官方通报:存在决策程序失当、经费使用不规范等问题,校长马某某停职

扬子晚报
2026-06-03 07:22:58
钟景辉,今日在睡梦中离世

钟景辉,今日在睡梦中离世

最江阴
2026-06-03 14:08:54
妻子穿几十元T恤,丈夫满身名牌做医美车内常备上万现金,却不愿出2500生活费!遭多年家暴,女子起诉离婚,发现1400万元已被转走

妻子穿几十元T恤,丈夫满身名牌做医美车内常备上万现金,却不愿出2500生活费!遭多年家暴,女子起诉离婚,发现1400万元已被转走

华商网
2026-06-03 17:03:16
2026届高考生,为何被称作近十年最尴尬一届?真实现状太扎心

2026届高考生,为何被称作近十年最尴尬一届?真实现状太扎心

老特有话说
2026-06-03 15:07:06
特朗普称对伊朗海上封锁或持续至9月

特朗普称对伊朗海上封锁或持续至9月

新华社
2026-06-03 18:30:30
运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

杨华评论
2026-06-03 02:20:48
放不下的顿巴斯,回不去的体面

放不下的顿巴斯,回不去的体面

秋月独朗
2026-06-03 14:14:30
昨天面试了一个前台,37岁,是个宝妈。她工资要的很低,说2500就可以,但有个条件,9点来上班,正常是8点。没想到老板拒绝了

昨天面试了一个前台,37岁,是个宝妈。她工资要的很低,说2500就可以,但有个条件,9点来上班,正常是8点。没想到老板拒绝了

背包旅行
2026-06-03 17:26:49
难堪大任!王楚钦任国乒队长不到36小时,乒协主席王励勤受到牵连

难堪大任!王楚钦任国乒队长不到36小时,乒协主席王励勤受到牵连

削桐作琴
2026-06-03 16:23:15
月入130万,排队两小时!下沉市场真能接住漂亮饭?

月入130万,排队两小时!下沉市场真能接住漂亮饭?

红餐网
2026-06-03 12:08:10
2026-06-03 20:28:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2401文章数 596关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

民警驾车致1死1残获刑1年2个月 女伤者刚试管有了胚胎

头条要闻

民警驾车致1死1残获刑1年2个月 女伤者刚试管有了胚胎

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

家居
数码
艺术
本地
公开课

家居要闻

江畔轻奢 观云大宅

数码要闻

全球首款UWB 8K键盘登场!CHERRY XTRFY K63W Pro发布

艺术要闻

二十年前割麦的场景

本地新闻

用杨柳青年画的方式,打开天津

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版