网易首页 > 网易号 > 正文 申请入驻

因果强化学习丨周日直播·因果科学与大语言模型读书会

0
分享至

导语

本次是的第九期。近年来因果强化学习领域取得了诸多进展,因果科学与强化学习的结合展现了提升强化学习求解效率、可解释性和泛化能力的可能性。本次直播分享,来自南京大学的博士陈雄辉将会与大家一同讨论因果强化学习领域的新进展以及在结合过程中遇到的挑战。

集智俱乐部联合北京大学大数据科学研究中心博士研究生李昊轩、伦敦大学学院计算机博士研究生杨梦月,卡耐基梅隆大学和穆罕默德·本·扎耶德人工智能大学博士后研究员陈广义共同发起。这是我们因果科学系列读书会的第五季,旨在探讨在大模型之后为何仍需“因果科学”?大模型如何推动因果科学的研究进展?因果科学能否在推理能力、可解释性和可信性等方面启发更优大模型的设计?以及因果科学的最新进展如何在实际领域中应用和落地?希望汇聚相关领域的学者,共同探讨因果科学的发展和挑战,推动学科发展。

背景

近年来,因果推断领域取得了诸多进展,引起了机器学习领域研究人员的广泛关注。最近的一项重要进展便是因果强化学习。强化学习是一项讨论在给定状态下如何寻找最优动作的技术,研究人员期待通过在强化学习中引入因果科学技术,提高强化学习的求解效率、可解释性和泛化能力。本次直播分享将围绕因果科学与强化学习的交叉领域——因果强化学习展开,重点关注因果科学的关键技术,包括因果结构学习、表征学习和动作效用估计等,以及因果科学与强化学习中环境模型(世界模型)结合的最新进展,并分享未来的潜在挑战。

大纲

  • 强化学习和因果相关背景介绍

  • 基于因果结构的强化学习方法

  • 基于因果表征的强化学习方法

  • 基于因果效用估计的强化学习方法

  • 因果科学技术与强化学习结合的未来研究方向

主讲人简介

陈雄辉,南京大学LAMDA组博士生,导师是俞扬教授。研究重点在于解决强化学习在在线交互成本敏感的真实应用场景中的挑战和基于大模型的决策研究,涉及技术包括离线强化学习,世界模型学习,sim2real 迁移,因果推断,基于大语言模型的决策和决策大模型等。目前有10+篇论文发表在NeurIPS,ICML,ICLR,TPAMI等顶会上。其研究成果也在互联网,化工和军工等多行业成功落地。

主持人介绍

李昊轩, 北京大学大数据科学研究中心,数据科学(统计学)博士,CCF会员、IEEE会员、ACM会员。研究兴趣为因果机器学习理论、反事实公平性、推荐系统去偏、分布外泛化、多源数据融合、生物信息学和大语言模型等。已在ICML、NeurIPS、ICLR、KDD、WWW、AAAI、IJCAI等多个CCF-A顶尖会议以第一作者发表多篇论文,其中5篇论文被评选为Spotlight或Oral,现为ICML、NeurIPS、ICLR、KDD、WWW、AAAI、IJCAI等多个顶会PC member或Area Chair,以及TKDE、TOIS、TKDD、The Innovation、《中国科学:信息科学》等多个顶级期刊审稿人,14项发明专利。连续两年获得北京大学博士最高研究奖“校长奖学金”,获国家奖学金,九坤(人工智能方向)奖学金,北京大学三好学生,两项成果获北京大学“挑战杯”五四青年科学奖特等奖,并获得首批国家自然科学基金青年学生基础研究项目(博士研究生)30万资助。

直播信息

9月29日20:00-22:00(周日),直播报名入口见后文。

集智俱乐部 B站和视频号免费直播,扫码可预约:

扫码预约本次直播

若需要观看视频回放,文末扫码付费参加可加入腾讯会议,可提问交流、加入群聊、获取视频回放及更多学习资料,成为因果科学社区种子用户,与一线科研工作者沟通交流,共同推动因果科学社区的发展。

参考文献

  • Xiong-Hui Chen, Yang Yu, Zhengmao Zhu, Zhihua Yu, Zhenjun Chen, Chenghe Wang, Yinan Wu, Rong-Jun Qin, Hongqiu Wu, Ruijin Ding, Fangsheng Huang: Adversarial Counterfactual Environment Model Learning. NeurIPS 2023

  • Zheng-Mao Zhu, Xiong-Hui Chen, Hong-Long Tian, Kun Zhang, Yang Yu: Offline Reinforcement Learning with Causal Structured World Models. FCS.

  • Yu-Ren Liu, Biwei Huang, Zheng-Mao Zhu, Hong-Long Tian, Mingming Gong, Yang Yu, Kun Zhang: Learning World Models with Identifiable Factorization. NeurIPS 2023

因果科学社区

“因果”并不是一个新概念,而是一个已经在多个学科中使用了数十年的分析技术。集智俱乐部在过去4年期间围绕研究人员的不同角度的需求,举办了4季相关主题的读书会,形成了数千人规模的社区。

【】基于《Elements of Causal Inference》,探讨因果科学在机器学习方面的应用,如强化学习和迁移学习等,并分享工业应用。

【】聚焦实操和基础,深入学习《Causal inference in statistics: A primer》和《Elements of causal inference: foundations and learning algorithms》。

【】回顾社会学、经济学、医学,计算机等领域的因果模型和范式,尝试用现代模型提供新思路。

【】探讨因果表征学习的理论、技术和最新应用,涉及因果生成模型、可解释性、公平性及工业落地。

主要围绕因果科学的最新进展,包括因果科学与大模型的结合等方面进行深度的探讨和梳理,希望给在这个领域的研究者提供一个全面的研究图景。共同探讨因果科学的未来发展以及面临的挑战。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
导弹铺天盖地,俄军创纪录发射,乌克兰被炸出绿光

导弹铺天盖地,俄军创纪录发射,乌克兰被炸出绿光

兵国大事
2026-06-02 22:09:15
会玩,保险公司:使用特斯拉 FSD 就打折 50% 保费!

会玩,保险公司:使用特斯拉 FSD 就打折 50% 保费!

新浪财经
2026-06-04 14:29:20
男子花15元买彩票,中了6022万元!

男子花15元买彩票,中了6022万元!

深圳晚报
2026-06-03 19:37:04
等待这名“清官”的,是比斩首更可怕的刑罚

等待这名“清官”的,是比斩首更可怕的刑罚

通往远方的路
2026-06-03 15:40:46
被美国遣返的美籍华人,如今成无国籍人,中国做法值得全世界学习

被美国遣返的美籍华人,如今成无国籍人,中国做法值得全世界学习

探源历史
2026-06-02 14:28:29
奚梦瑶父亲凭仪态火出圈:178超模被衬成小鸟依人?她爸啥来头

奚梦瑶父亲凭仪态火出圈:178超模被衬成小鸟依人?她爸啥来头

新金牌娱乐观察家
2026-06-04 10:43:53
确认下台!塞国一夜变天,武契奇接班人已选浮现,对华态度不简单

确认下台!塞国一夜变天,武契奇接班人已选浮现,对华态度不简单

卷史
2026-06-04 13:26:42
“托举孩子进山姆”为何惹众怒?

“托举孩子进山姆”为何惹众怒?

新民周刊
2026-06-03 18:41:19
硬如钢板!布伦森末节13分引大逆转:带膝盖+脚踝伤病仍出手31次

硬如钢板!布伦森末节13分引大逆转:带膝盖+脚踝伤病仍出手31次

颜小白的篮球梦
2026-06-04 11:16:02
人大院长说美国不配称“美”,应该改名

人大院长说美国不配称“美”,应该改名

难得君
2026-06-04 08:40:02
武统、和统都没戏了?岛内军事专家:中国大陆已经走上第3条路

武统、和统都没戏了?岛内军事专家:中国大陆已经走上第3条路

混沌录
2026-06-03 12:25:12
50岁黄晓明和周杰伦泰国酒吧聚会,体型差对比强烈,状态令人惊艳

50岁黄晓明和周杰伦泰国酒吧聚会,体型差对比强烈,状态令人惊艳

草莓解说体育
2026-06-04 15:35:37
31岁青年学者讣告刷屏!当人生终点只剩“内卷清单”,引全网热议

31岁青年学者讣告刷屏!当人生终点只剩“内卷清单”,引全网热议

火山詩话
2026-06-04 09:21:28
BR预测:里夫斯将和湖人续约,合同金额为4年1.568亿美元

BR预测:里夫斯将和湖人续约,合同金额为4年1.568亿美元

懂球帝
2026-06-04 16:22:21
丢人!粉笔CEO在中国人民大学演讲时用脏话辱骂学生,并中途离场

丢人!粉笔CEO在中国人民大学演讲时用脏话辱骂学生,并中途离场

听心堂
2026-06-04 12:38:15
AI脸引发全民生理性厌恶,AI美颜正在慢慢毁掉我们的审美

AI脸引发全民生理性厌恶,AI美颜正在慢慢毁掉我们的审美

西楼知趣杂谈
2026-06-04 12:14:18
耻辱啊!菲律宾外长听到这个数字,当场就想拿手机走人!

耻辱啊!菲律宾外长听到这个数字,当场就想拿手机走人!

阿龙聊军事
2026-06-04 11:52:32
法国特种兵突袭11万吨俄罗斯油轮,不到24小时,普京政府准时断供

法国特种兵突袭11万吨俄罗斯油轮,不到24小时,普京政府准时断供

近史博览
2026-06-04 04:18:59
有AI“复活”张雪峰预测2026年高考作文题 考生家长直呼“太离谱”!

有AI“复活”张雪峰预测2026年高考作文题 考生家长直呼“太离谱”!

闪电新闻
2026-06-04 10:12:15
近70万海归挤回国,海归硕士求职被一句“我们不承认”给堵了回去

近70万海归挤回国,海归硕士求职被一句“我们不承认”给堵了回去

杰丝聊古今
2026-06-04 12:56:50
2026-06-04 18:12:49
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5865文章数 4676关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

女子花27万买的车4年后突然被扣押 交管部门:是"假车"

头条要闻

女子花27万买的车4年后突然被扣押 交管部门:是"假车"

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

旅游
游戏
艺术
家居
军事航空

旅游要闻

1.5亿人次复苏背后 入境游面临 “软实力”大考

《地平线456》女角色颜值对比:下巴竟越来越宽!

艺术要闻

唐寅『梅花册』

家居要闻

220平对味儿家 空间情绪宅

军事要闻

美众议院要求特朗普停止对伊动武并撤军

无障碍浏览 进入关怀版