何恺明MIT最新演讲:AI for Science将成为科研新范式
从ResNet到生成模型,再到AI for Science,何恺明的科研之路映射了AI发展的过去与未来。
在麻省理工学院施瓦茨曼计算学院举办的“拓展计算视野”系列讲座中,MIT电气工程与计算机科学系副教授、计算机科学与人工智能实验室成员何恺明博士就生成式模型这一主题发表了精彩演讲。
这位计算机视觉领域的翘楚,谷歌学术引用次数已突破40万次的影响力第一学者,正向AI for Science领域迈进。
01 何恺明的学术旅程,从ResNet到生成模型
何恺明在演讲中回顾了深度学习的发展历程。他指出,“在ResNet出现以前,Deep learning的大厦上空漂浮着一朵乌云,而ResNet去掉了这朵乌云。”
ResNet的出现首次让深度学习模型能够训练极深的神经网络,解决了梯度消失和网络退化问题。这项工作不仅获得了2016年CVPR最佳论文奖,单篇引用量已超过15万次。
何恺明的贡献远不止于此。他还介绍了Faster R-CNN、Mask R-CNN等系列研究。其中Mask R-CNN解决了图片中的实例级对象分割问题,获得了ICCV 2017的最佳论文奖。
02 生成式模型,AI研究的新前沿
在MIT的讲座中,何恺明首先介绍了生成式模型的概念及其广泛应用,包括文本生成、图像生成、视频生成(如Sora),以及在科学领域如蛋白质设计和天气预报中的应用。
他强调了生成式模型与判别式模型的区别,并指出生成式模型的核心在于概率建模,即学习数据背后的潜在分布。
何恺明还深入探讨了深度学习在生成式模型中的作用,介绍了当前主流方法,包括变分自编码器(VAE)、生成对抗网络(GAN)、自回归模型和扩散模型。
03 未来方向:AI for Science
何恺明在现场演讲中透露,接下来的研究方向将是AI for science,将聚焦视觉和NLP大一统做self-supervised X+AI。
他认为“AI能够帮助我们打破这些壁垒,创造出一种共同语言”。这意味着AI有望成为连接不同学科领域的桥梁,提供一种统一的科学发现方法论。
何恺明展望未来的发展将围绕“更高级别模型的构建块”,表明生成式模型可能成为未来AI科学家的基础组成部分。
04 AI科学家:科研新范式
何恺明对AI for Science的展望与当前发展趋势高度契合。近年来,AI科学家技术已经从概念构想加速迈向实际应用。
这些由大语言模型驱动的、具备专业科学知识且有一定自主性的智能体,能够自主提出科学猜想和研究方案。
AI科学家系统按照功能定位可分为两类:一类是辅助人类科学家的“科研助手”,另一类则是完全自主的科学发现系统。
例如,美国斯坦福大学开发的“虚拟实验室”在线系统,可以根据人类科学家的需求,组建不同学科背景的AI科学家团队展开科研。
05 中国在AI for Science领域的布局
我国也在积极布局AI for Science领域。2024年10月,上海人工智能实验室联合多家单位开源了多智能体科学社群模拟系统——“虚拟科学家”。
2025年7月,联合崖州湾国家实验室和中国农业大学等单位,发布了首个生物育种领域的自主科学发现系统“丰登·基因科学家”。
在该系统的辅助下,科研人员在主粮作物中发现了数十个此前未被报道的基因功能,并获得实验证实。
近日,国务院印发《关于深入实施“人工智能+”行动的意见》,提出加快实施“人工智能+”科学技术行动,率先建立基于AI的新型科研和研发范式。
06 技术挑战与未来展望
尽管AI科学家在技术上已取得阶段性成果,但在可靠可控、人机关系、科研伦理、合规监管等诸多方面仍有大量问题亟待解决。
科学界长久以来关于“AI是否会取代人类”“AI是否会弱化人类独立思考能力”等问题的争论也在持续。
何恺明在CVPR2025的演讲中也提出了深思:“我们是否还在生成模型的‘AlexNet前时代’?”
尽管MeanFlow等新技术已经取得了显著进步,但在概念上仍然受限于迭代的Flow Matching和扩散模型框架。
未来,AI科学家技术有望与机器人和传感器深度结合,通过传感器感知实验环境并借助机器人执行实验,从而完成从假设提出到实验验证的全自主科学发现闭环。
我们已经可以看到“AI作物遗传学家”在稻田中检查水稻生长,“AI土壤学家”在月球基地分析月壤,“AI核物理学家”在辐射环境中操作仪器。
这些曾经科幻中的场景,正逐步成为现实。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.