AI Agent在如何改变企业研发|算法|实验|核心技术|agent

AI Agent在如何改变企业研发

2025-04-28 22:53:03　来源: 未尽研究

上海举报

分享至

关于AI Agent在企业研发中的应用，先讲一个真实的案例研究。根据研发部门的规模，大概可以判断这是一家美国综合性的工业与科技集团，市值在千亿美元以上。

研究对1, 018 位科学家进行了随机试验，对照不同的分组使用AI给工作数量和质量带来的变化。他们自己训练了一个研发用的大模型，就是一个图神经网络系统，用来生成具有指定特性的化合物的配方。有点像文生图一样，科学家想要一个什么样的化学结构，就输入指令进系统，然后通过其中的扩散模型，生成各种各样的化学结构，科学家再对这些生成的材料进行评估，筛选出候选的材料。在整个的研发管线里，研发部门判别出化合物产品的原型，下面就给交给产品部门了。

研究发现，使用AI工具，发现的新材料增加44%，申请的专利增加39%，创新增加了17%。这些化合物具有新颖性，质量更高，所以很多是可以申请专利。AI 可以提升研发效率大概在13%-15%。

（来源：Artificial Intelligence, Scientific Discovery and Product Innovation）

这项研究去年底公布，在 AI 、研发、行业圈子里引起了不小的轰动，它证明了AI 对于企业研发有显著提升作用。AI 对企业中的应用效果，我之前也看过很多研究，比如说对企业的客服、呼叫中心之类的真实场景的研究，这是第一次看到比较高质量的对企业研发的研究。

引入AI对企业研发机制、协作方式和组织会带来什么呢？创意生成阶段花费的时间大幅度减少了，对生成的候选新材料进行判断的时间增加了。可以看出，引入AI，较资深的科学家是赢家，充分发挥了他们的能力和经验，而底层的1/ 3 初级科学家是输家，他们使用AI工具基本没有任何提升。这家企业在引入AI工具之后，就对研发部门做了一次调整，裁掉了 3% 的人，主要是初级的研发人员，增加了一些比较资深和高级的科学家。当企业引入AI 的时候，企业的组织协作方式一定会带来变化。

那么究竟谁在做研发Agent？首先是科技巨头都在做，如微软、谷歌等；其次是一些行业巨头也在做，如生物医药、化学、电子、汽车、材料等，第三是大学和研究机构在做，往往跟行业或科技巨头合作；第四是AI 大模型企业，就是像OpenAI、 Anthropic 这些公司，都会推出 deep research功能，而数据和代码功能也可以被归入泛研发领域，实际上是一种通用agent；第四，就是一些初创企业，它们直接进入垂直领域，或者聚焦在整个研发管线中的某一个片段上、某一个模块上，它们也可以归为原生的AI初创企业，在新材料和生物医药领域比较多，也是高专利密度领域。

再举一个例子，约翰霍普金斯大学和AMD 联合做了一个研发agent。我看完论文之后，觉得专业领域的人做本专业的agent，优于那些科技巨头做上述专业的agent 。

约翰霍普金斯在生物医药领域在全球是顶尖的，它主导了这项研究。这张图上的每个小人都是一个agent，有医学博士后、软件工程师，医学博士生，还有机器学习的工程师。实验流程上，包括文献检索、规划形成、数据准备、实施实验、报告撰写，然后到报告的评审，全部都是agent完成的，甚至最后的评审也是用AI来做的。

它得出的一些结论中，有些细节很有意思。如它试用了 OpenAI 的三个模型，今年初，最好的模型是OpenAI的推理模型o1-preview，还有 o1-mini，还有一个 GPT-4o。他发现确实是 o1 preview是最好用的，最不好用是 GPT-4o，每一代大模型的提升，最终需要在实用中验证。这个实验 agent可以用全自动模式，也可以用协同模式，最终证明协同模式出来的结果还是比全自动要好。协同模式就是在每一个节点都会有一个人类专家的反馈。

当实验用agent完成时，它的成本就变成算力成本。这里要说明的一点，测试结果所说的节省了84% 的成本，主要是相对测试基准，与其他前沿研发agent相比的结果，主要是在实际运行实验agent时的时间成本和推理的成本。

研究发现，使用研发agent也会带来一些问题。第一个就是学术的严谨性。医药生物学领域的实验报告、论文，都需要人类专家或者同行的审核。第二，实验中所使用的底层数据集和算法中固有的偏见，可能带入到整个的研究流程里面，agent可能全盘接收，导致系统性的偏差。最后，当 agent自主性越来越强，研究结果究竟是由人负责还是由agent负责，这就要求必须明确披露人工智能的参与程度。

上面两个例子，一个是代表了企业内实际应用的，一个是代表了学术机构正在探讨的。接下来分享一下最近很火的一篇论文。我看完之后，感觉它实际上就是谈下一代研发agent的。

（来源：Welcome to the Era of Experience ）

这篇由谷歌DeepMind负责强化学习的副总裁西尔弗(Daivd Silver)和今年图灵奖获得者、强化学习奠基人萨顿（Richard Sutton）共同撰写的论文《欢迎来到经验时代》，把大模型分成了三个阶段，模拟的阶段，人类数据阶段，实验数据的阶段。它的一个核心的观点，就是说我们现在研究大模型，不仅仅是在预训练阶段撞上了数据墙，而且整个AI的研究都撞上了数据墙。我们现在用的有质量的人类数据，已经基本上耗尽了，更多真正高质量的数据的来源，是在人类的边界之外。AI在进入经验时代，即agent不断地从与环境互动的经验中学习。

他们举了三个例子，第一个是AlphaGo 战胜李世石的第二番棋中出现的神之 37 手；第二个是 DeepSeek 在训练R0模型时，直接用了无监督的强化学习，里面所谓的Aha时刻，就是模型涌现了新的智慧；第三个例子，是最近谷歌的AlphaProof，除了用人类所有的解法训练之外，自己又去尝试了很多新的解法，结果参加数学奥林匹克得了银牌。

这三个例子，是在AI具备了先验的知识之后，学习中主要不再使用人类投喂的数据，而是围绕机器和自己所在环境里产生的数据来进行学习，这代表了大模型发展的未来。

论文面讲得最多的其实就是研发agent。如持续学习，就是说agent能够持续地跟自己的环境的互动，而不是说现在是一问一答就结束了。这样agent就能自己持续地调整和适应。现在大模型能提供越来越持久的记忆力，上下文已经过到了上千万token，也有企业号称将提供无限记忆力的。持续学习，才能称得上是真正的的智能体。第二个就观察和行动，agent可以通过数字接口和真实世界进行互动，包括物理世界。以后观察世界的角度，agent仰望星空的感觉，可能跟人类不大一样。第三个就是奖励机制，以前是人给它设定的，那么它以后通过自己的算法，会为自己不断地涌现出围绕着自己的经验而产生的奖励机制。所以agent可能为自己构建一个世界模型。

上面讲的这个三个例子，第一个是大型企业中的应用，而且是一个大型的企业，一千多位科学家在用，证明AI 在研发领域确实可以提升效率。第二个是在一个世界顶级大学的实验agent，证明了它的有效性和局限性，但是大多数专业人士是愿意去试用。第三个例子，实际上说明的是agent的能力，最终还是取决于前沿的大模型取得的突破。我们期待agent在研发领域更快应用起来，一方面取决于垂直领域的know-how与AI更深入的结合，另外一方面，前沿大模型的创新和突破，包括产生算法新范式，依然是最基础、最引领的。

最后小结几点。首先，我们沿着现在的技术路线，几乎可以看到agent在研发部门会实现单点-模块-工作流-多智能体协作-业务-组织-生态这样一个顺序渗透，同时agent的自主性会越来越强，沿着工具-助手-代理-专家-创新者-组织者这样一路成长，中间会看到从专业代理到专业人士，之间的界限会越来越模糊。研发agent更值得信任，还是取决于大模型新范式，如经验性的学习，值得期待。最后，所有这些技术的突破，会不断挑战发明创造的伦理，agent与人类的权利和责任怎么去划分；如何防止有人去滥用和恶意使用。最后，当agent 越来根据自己的经验来终身学习，自己投喂自己数据，自己设立奖励机制，它自主性越来越强，那人类如何能控制它。

本文来自智慧芽“AI重塑知识产权价值”大会上的演讲，有调整。

参考：

Artificial Intelligence, Scientific Discovery and Product Innovation

Agent Laboratory: Using LLM Agents as Research Assistants

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Welcome to the Era of Experience

下载演讲PDF：Agent如何改变企业研发

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.