![]()
2025年,理查德·萨顿(Richard Sutton)站上了图灵奖的领奖台。
这项计算机科学领域的最高荣誉,旨在表彰他和安迪·巴托(Andrew Barto)在强化学习领域的开创性贡献。
自20世纪80年代起,萨顿与巴托便在一系列论文中,构建了强化学习的数学基础与核心算法。
最近,萨顿在社交媒体上,分享了他在颁奖典礼上的获奖感言。他说,所谓强化学习,是指一台机器可以从自身的经验中学习,通过不断的试错,最终找到完成任务的方法。
![]()
而且,整个学习过程,没有任何人会直接告诉它应该怎么做。他还提到,这个充满远见的构想,并非诞生于我们这个时代。早在1947年,艾伦·图灵(Alan Turing)就首次提出了这一概念的雏形。
能够因为复兴这项至关重要,却仍处于萌芽阶段的思想而获奖,萨顿感到荣幸且谦卑。
萨顿还提到了三个深刻影响他学术生涯的人。分别是安迪·巴托、奥利弗·塞尔弗里奇、以及玛莎·斯蒂恩斯特鲁普。前两位是他的导师,而最后一位是他的妻子。
他说,导师教给了他知识、治学态度、治学之道:“大道至简,或许是所有抱负中最为宏伟的一种。”
而妻子则让他时刻保持清醒与脚踏实地。
以下是演讲全文,DeepSeek翻译、整理如下:
各位女士,各位先生,晚上好。
强化学习的核心思想是,机器可以无需人为指令,仅凭自身的经验,通过不断地试错,自主地探索出解决问题的方法。据我所知,在1947年最早提出这一构想的,正是艾伦·图灵先生。因此,能够为复兴这一至关重要但仍处于萌芽阶段的思想而荣获以他命名的奖项,让我倍感荣幸,也诚惶诚恐。
在此,我尤其想感谢三个人。
首先是安迪·巴托(Andy Barto)。作为我的博士生导师,他塑造了我整个治学之道,特别是让我深刻体会到严谨的学术精神、精湛的钻研技巧以及尊重前人广博研究的重要性。
其次,我要感谢我的另一位重要导师:奥利弗·塞尔弗里奇(Oliver Selfridge),可惜他已经与世长辞。奥利弗教导我,“大道至简”或许是所有抱负中最为宏伟的一种。
第三位,我要感谢玛莎·斯滕斯特鲁普(Martha Steenstrup),她是我的人生伴侣,也是我思想上的切磋诤友。是她让我时刻保持清醒与脚踏实地。
最后,我还要感谢阿尔伯塔大学。在过去的22年里,这里为我个人以及强化学习的研究提供了最理想的环境。
这三位恩师益友以及我的大学,在我心中强化了这样一种信念:既要追求能够产生深远影响的创想,又不能因此而沾沾自喜。他们教导我,对卓越思想的求索之路固然严肃,但最好的方式是怀着一颗赤子之心,以谦逊、友善和乐观的态度去探索。对此,我永怀感激。
我也想感谢在座的各位,感谢你们今晚共聚一堂,一同颂扬我们对卓越智慧的追求。
非常感谢。
注:图源Sutton的社交媒体
作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信Q1yezi,共同交流行业动态与技术趋势!
GPU 训练特惠!
H100/H200 GPU算力按秒计费,平均节省开支30%以上!
扫码了解详情☝
点「赞」的人都变好看了哦!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.