网易首页 > 网易号 > 正文 申请入驻

AI Agent在如何改变企业研发

0
分享至

关于AI Agent在企业研发中的应用,先讲一个真实的案例研究。根据研发部门的规模,大概可以判断这是一家美国综合性的工业与科技集团,市值在千亿美元以上。

研究对1, 018 位科学家进行了随机试验,对照不同的分组使用AI给工作数量和质量带来的变化。他们自己训练了一个研发用的大模型,就是一个图神经网络系统,用来生成具有指定特性的化合物的配方。有点像文生图一样,科学家想要一个什么样的化学结构,就输入指令进系统,然后通过其中的扩散模型,生成各种各样的化学结构,科学家再对这些生成的材料进行评估,筛选出候选的材料。在整个的研发管线里,研发部门判别出化合物产品的原型,下面就给交给产品部门了。

研究发现,使用AI工具,发现的新材料增加44%,申请的专利增加39%,创新增加了17%。这些化合物具有新颖性,质量更高,所以很多是可以申请专利。AI 可以提升研发效率大概在13%-15%。

(来源:Artificial Intelligence, Scientific Discovery and Product Innovation)

这项研究去年底公布,在 AI 、研发、行业圈子里引起了不小的轰动,它证明了AI 对于企业研发有显著提升作用。AI 对企业中的应用效果,我之前也看过很多研究,比如说对企业的客服、呼叫中心之类的真实场景的研究,这是第一次看到比较高质量的对企业研发的研究。

引入AI对企业研发机制、协作方式和组织会带来什么呢?创意生成阶段花费的时间大幅度减少了,对生成的候选新材料进行判断的时间增加了。可以看出,引入AI,较资深的科学家是赢家,充分发挥了他们的能力和经验,而底层的1/ 3 初级科学家是输家,他们使用AI工具基本没有任何提升。这家企业在引入AI工具之后,就对研发部门做了一次调整,裁掉了 3% 的人,主要是初级的研发人员,增加了一些比较资深和高级的科学家。当企业引入AI 的时候,企业的组织协作方式一定会带来变化。

那么究竟谁在做研发Agent?首先是科技巨头都在做,如微软、谷歌等;其次是一些行业巨头也在做,如生物医药、化学、电子、汽车、材料等,第三是大学和研究机构在做,往往跟行业或科技巨头合作;第四是AI 大模型企业,就是像OpenAI、 Anthropic 这些公司,都会推出 deep research功能,而数据和代码功能也可以被归入泛研发领域,实际上是一种通用agent;第四,就是一些初创企业,它们直接进入垂直领域,或者聚焦在整个研发管线中的某一个片段上、某一个模块上,它们也可以归为原生的AI初创企业,在新材料和生物医药领域比较多,也是高专利密度领域。

再举一个例子,约翰霍普金斯大学和AMD 联合做了一个研发agent。我看完论文之后,觉得专业领域的人做本专业的agent,优于那些科技巨头做上述专业的agent 。

约翰霍普金斯在生物医药领域在全球是顶尖的,它主导了这项研究。这张图上的每个小人都是一个agent,有医学博士后、软件工程师,医学博士生,还有机器学习的工程师。实验流程上,包括文献检索、规划形成、数据准备、实施实验、报告撰写,然后到报告的评审,全部都是agent完成的,甚至最后的评审也是用AI来做的。

它得出的一些结论中,有些细节很有意思。如它试用了 OpenAI 的三个模型,今年初,最好的模型是OpenAI的推理模型o1-preview,还有 o1-mini,还有一个 GPT-4o。他发现确实是 o1 preview是最好用的,最不好用是 GPT-4o,每一代大模型的提升,最终需要在实用中验证。这个实验 agent可以用全自动模式,也可以用协同模式,最终证明协同模式出来的结果还是比全自动要好。协同模式就是在每一个节点都会有一个人类专家的反馈。

当实验用agent完成时,它的成本就变成算力成本。这里要说明的一点,测试结果所说的节省了84% 的成本,主要是相对测试基准,与其他前沿研发agent相比的结果,主要是在实际运行实验agent时的时间成本和推理的成本。

研究发现,使用研发agent也会带来一些问题。第一个就是学术的严谨性。医药生物学领域的实验报告、论文,都需要人类专家或者同行的审核。第二,实验中所使用的底层数据集和算法中固有的偏见,可能带入到整个的研究流程里面,agent可能全盘接收,导致系统性的偏差。最后,当 agent自主性越来越强,研究结果究竟是由人负责还是由agent负责,这就要求必须明确披露人工智能的参与程度。

上面两个例子,一个是代表了企业内实际应用的,一个是代表了学术机构正在探讨的。接下来分享一下最近很火的一篇论文。我看完之后,感觉它实际上就是谈下一代研发agent的。

(来源:Welcome to the Era of Experience )

这篇由谷歌DeepMind负责强化学习的副总裁西尔弗(Daivd Silver)和今年图灵奖获得者、强化学习奠基人萨顿(Richard Sutton)共同撰写的论文《欢迎来到经验时代》,把大模型分成了三个阶段,模拟的阶段,人类数据阶段,实验数据的阶段。它的一个核心的观点,就是说我们现在研究大模型,不仅仅是在预训练阶段撞上了数据墙,而且整个AI的研究都撞上了数据墙。我们现在用的有质量的人类数据,已经基本上耗尽了,更多真正高质量的数据的来源,是在人类的边界之外。AI在进入经验时代,即agent不断地从与环境互动的经验中学习。

他们举了三个例子,第一个是AlphaGo 战胜李世石的第二番棋中出现的神之 37 手;第二个是 DeepSeek 在训练R0模型时,直接用了无监督的强化学习,里面所谓的Aha时刻,就是模型涌现了新的智慧;第三个例子,是最近谷歌的AlphaProof,除了用人类所有的解法训练之外,自己又去尝试了很多新的解法,结果参加数学奥林匹克得了银牌。

这三个例子,是在AI具备了先验的知识之后,学习中主要不再使用人类投喂的数据,而是围绕机器和自己所在环境里产生的数据来进行学习,这代表了大模型发展的未来。

论文面讲得最多的其实就是研发agent。如持续学习,就是说agent能够持续地跟自己的环境的互动,而不是说现在是一问一答就结束了。这样agent就能自己持续地调整和适应。现在大模型能提供越来越持久的记忆力,上下文已经过到了上千万token,也有企业号称将提供无限记忆力的。持续学习,才能称得上是真正的的智能体。第二个就观察和行动,agent可以通过数字接口和真实世界进行互动,包括物理世界。以后观察世界的角度,agent仰望星空的感觉,可能跟人类不大一样。第三个就是奖励机制,以前是人给它设定的,那么它以后通过自己的算法,会为自己不断地涌现出围绕着自己的经验而产生的奖励机制。所以agent可能为自己构建一个世界模型。

上面讲的这个三个例子,第一个是大型企业中的应用,而且是一个大型的企业,一千多位科学家在用,证明AI 在研发领域确实可以提升效率。第二个是在一个世界顶级大学的实验agent,证明了它的有效性和局限性,但是大多数专业人士是愿意去试用。第三个例子,实际上说明的是agent的能力,最终还是取决于前沿的大模型取得的突破。我们期待agent在研发领域更快应用起来,一方面取决于垂直领域的know-how与AI更深入的结合,另外一方面,前沿大模型的创新和突破,包括产生算法新范式,依然是最基础、最引领的。

最后小结几点。首先,我们沿着现在的技术路线,几乎可以看到agent在研发部门会实现单点-模块-工作流-多智能体协作-业务-组织-生态这样一个顺序渗透,同时agent的自主性会越来越强,沿着工具-助手-代理-专家-创新者-组织者这样一路成长,中间会看到从专业代理到专业人士,之间的界限会越来越模糊。研发agent更值得信任,还是取决于大模型新范式,如经验性的学习,值得期待。最后,所有这些技术的突破,会不断挑战发明创造的伦理,agent与人类的权利和责任怎么去划分;如何防止有人去滥用和恶意使用。最后,当agent 越来根据自己的经验来终身学习,自己投喂自己数据,自己设立奖励机制,它自主性越来越强,那人类如何能控制它。

本文来自智慧芽“AI重塑知识产权价值”大会上的演讲,有调整。

参考:

Artificial Intelligence, Scientific Discovery and Product Innovation

Agent Laboratory: Using LLM Agents as Research Assistants

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Welcome to the Era of Experience

下载演讲PDFAgent如何改变企业研发

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南省足协:对张家界队打人球员禁赛12个月,教练等6人禁赛6个月

湖南省足协:对张家界队打人球员禁赛12个月,教练等6人禁赛6个月

懂球帝
2026-06-26 23:54:26
中纪委怒批:公务员也是人,正常生活不应问责处理!

中纪委怒批:公务员也是人,正常生活不应问责处理!

细说职场
2026-06-24 10:55:30
4-2大冷门,中超第14掀翻中超第4,青岛海牛终结中超4连败

4-2大冷门,中超第14掀翻中超第4,青岛海牛终结中超4连败

侧身凌空斩
2026-06-26 21:35:37
柬埔寨安徽商会会长刘忍被捕:录音曝光令人发指,贩卖人口起家!

柬埔寨安徽商会会长刘忍被捕:录音曝光令人发指,贩卖人口起家!

眼光很亮
2026-06-08 07:13:32
世界杯疯狂1夜:亚洲2队出线 韩国命悬一线 20队晋级

世界杯疯狂1夜:亚洲2队出线 韩国命悬一线 20队晋级

体育哲人
2026-06-26 13:11:25
山东第一大城市,发展迅猛,将来很可能成为“北方第二城”?

山东第一大城市,发展迅猛,将来很可能成为“北方第二城”?

刘小顺
2026-06-26 15:26:24
老艺术家何庆魁,被亲儿子捅刀:他嫖不动了,每月1万够花了

老艺术家何庆魁,被亲儿子捅刀:他嫖不动了,每月1万够花了

调侃国际观点
2026-06-22 18:05:50
花心帅哥被当街砍杀,交往的30多个女友中是否隐藏凶手

花心帅哥被当街砍杀,交往的30多个女友中是否隐藏凶手

深夜探案馆
2026-06-27 00:43:05
泰缅边境又炸了!妙瓦底倒了,更血腥的“KK园区2.0”正在崛起

泰缅边境又炸了!妙瓦底倒了,更血腥的“KK园区2.0”正在崛起

小小科普员
2026-06-25 16:06:40
黄金跌麻了!6月26日国内金价全线下跌,现在能上车吗?

黄金跌麻了!6月26日国内金价全线下跌,现在能上车吗?

别人都叫我阿腈
2026-06-26 14:40:04
无偿为邻居儿子补课,她竟反手举报,高考结束后她崩溃大哭!

无偿为邻居儿子补课,她竟反手举报,高考结束后她崩溃大哭!

黄家湖的忧伤
2025-03-12 17:19:44
中国球迷谈支持日本队:我们90后从小看日本动漫长大 愿架起友谊桥梁

中国球迷谈支持日本队:我们90后从小看日本动漫长大 愿架起友谊桥梁

漫川舟船
2026-06-26 18:11:15
又一条励志新闻翻车了!

又一条励志新闻翻车了!

胖胖说他不胖
2026-05-20 09:55:14
比机票还贵的机建燃油,到底是谁发明的?

比机票还贵的机建燃油,到底是谁发明的?

差评XPIN
2026-06-26 01:55:24
高考最难省份诞生!家长欲哭无泪:高考600分,却连一本都上不了

高考最难省份诞生!家长欲哭无泪:高考600分,却连一本都上不了

凯旋学长
2026-06-25 17:18:12
佛得角和乌兹受邀来华:国足今年至少与3支世界杯球队交锋!

佛得角和乌兹受邀来华:国足今年至少与3支世界杯球队交锋!

邱泽云
2026-06-26 23:03:25
美官员称伊朗“蓄意”袭击了一艘新加坡籍货船,伊朗革命卫队海军声明:船只通过霍尔木兹海峡必须与其协调,违规船舶“将受到处置”

美官员称伊朗“蓄意”袭击了一艘新加坡籍货船,伊朗革命卫队海军声明:船只通过霍尔木兹海峡必须与其协调,违规船舶“将受到处置”

政知新媒体
2026-06-26 13:46:17
欧洲人彻底被中国逼疯了!

欧洲人彻底被中国逼疯了!

安安说
2026-06-26 10:24:14
韩红关闭评论!舆论波及慈善基金会,大量捐赠人断捐,终于翻车了

韩红关闭评论!舆论波及慈善基金会,大量捐赠人断捐,终于翻车了

萌神木木
2026-06-22 20:41:41
财经重磅利好!玻璃基板赛道5家正宗龙头,上游辅材有望爆发长牛

财经重磅利好!玻璃基板赛道5家正宗龙头,上游辅材有望爆发长牛

爱看剧的阿峰
2026-06-26 18:57:12
2026-06-27 08:24:49
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
407文章数 65关注度
往期回顾 全部

科技要闻

GPT-5.6发布,旗舰模型先向可信伙伴开放

头条要闻

13岁女孩称被两男子性侵 家属:警方立案4个月后撤案

头条要闻

13岁女孩称被两男子性侵 家属:警方立案4个月后撤案

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

"索具龙头"领大额罚单

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

艺术
本地
亲子
时尚
公开课

艺术要闻

莫兰迪不多见的简约风景画!

本地新闻

世界杯球迷节:比球赛更好玩的派对

亲子要闻

你的底线来了,老兵月子中心了解一下

殡葬专业,我可以干一辈子

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版