网易首页 > 网易号 > 正文 申请入驻

对话西湖大学张岳:AI科学家能自动写论文、审稿、做实验,学生要尽早使用AI工具

0
分享至

搜狐科技《思想大爆炸——对话科学家》栏目第138期,对话西湖大学工学院终身教授张岳

嘉宾简介:

张岳,西湖大学工学院终身教授,曾在新加坡科技与设计大学担任助理教授。主要研究领域为自然语言处理、文本挖掘、机器学习和人工智能。

  • DeepScientist最关键的因素,是贝叶斯优化问题以及学术经验指导的试错问题。

  • 如果人和机器共同加速科研进展,而不去担心发表范式的滞后,科研的可复现性会大大提升,也不存在弄虚造假的问题。

  • AI本身的研究和AI安全研究一定是齐头并进的,并且AI是可控的。

  • 未来想把计算机科学家变成全学科的科学家,真正帮助人类设计新材料,发明新物质,解决更多的挑战。

出品|搜狐科技

作者|周锦童

编辑|杨 锦

人工智能迅猛发展,西湖大学再度成为聚光灯下的焦点。近日,张岳教授团队研发了一款AI科学家系统——DeepScientist,引发了网友们的关注。

DeepScientist是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统,它在多个前沿人工智能科学任务中,首次实现自主产出超越人类最佳方法(State of the Art,简称SOTA)的研究成果。

DeepScientist工作流程是怎样的?克服了哪些局限性?AI科学家的出现会不会改变科研范式?带着这些问题,搜狐科技对话了西湖大学工学院终身教授张岳,听他分享DeepScientist从研发到落地的故事。

中国首个AI科学家

“DeepScientist”的命名是文章一作翁诣轩的手笔,最开始本想叫Deep Researcher,但和Open AI开发的搜索智能体重名,所以就有了DeepScientist。

谈及研究初衷,张岳表示:“我们开发DeepScientist的最终目的是想做一个具有自主科研能力的科研大模型智能体,因为人类在研究过程面临很多挑战,科学家的精力有限,如果大模型能帮助人类解决这些挑战,就能推动科学发展。”

在这一到两年的时间,张岳团队有关DeepScientist的探索取得了里程碑式进展。

在AI文本检测任务中,DeepScientist用两周时间就实施和验证了超过1000种不同的假设,取得了相当于人类三年的进展,其设计的方法实现了7.9%的性能提升,成功超越了人类现有SOTA方案。而且DeepScientist还在智能体失败归因、LLM推理加速等任务上也分别达成了新的SOTA,同样仅需数周时间即可超越人类表现。

人类科研很大程度上是试错的过程,成功和失败的经验再加上已有知识,是构成科学家发明创造的一个基础,另一个基础是可以试错迭代,根据实验结果调整方案,这也是张岳团队设计DeepScientist的出发点。

AI科学家的概念是去年6月被正式提出的,日本Sakana AI公司率先推出了AI scientist的智能体系统,张岳实验室也在同期进行相关研究。

“2023年4月Open AI推出ChatGPT-4后,我们都在想同一个问题:当 AI具备一定的智能(解决新问题的能力)后,能不能帮助人类加速科研进展?所以从去年6月开始,AI科学家的概念和系统原型不断在国际上被推出来,我们也做了很多基础贡献。”张岳如是说。

世界上第一篇正式发表的AI科学家文章,就是张岳团队今年4月推出的CycleResearcher,这也是DeepScientist的前身。当时他们还推出了世界上第一个人类专家水平的自动审稿大模型DeepReviewer,AI科学家写完论文后根据审稿意见可以回过头改进。

不过,CycleResearcher是单线的科研系统,并不能真正解决人类的挑战,只是有写学术论文的能力,这样的科学家不能产出真正改变人类生活的科学成果。

等到了DeepScientist这个版本就实现了迭代式的进步,能夜以继日地进行科研,真刀实枪地改变人类生活,达到人类探索中尚未达到的科研高度。这里面最关键的因素是贝叶斯优化问题以及学术经验指导的试错问题,这也是“里程碑”意义所在。

回到贝叶斯优化过程,张岳也进行了解释:“首先要制定一个目标,比如我们的研究全是AI算法,那我想让算法精确率达到多少,然后进行两方面的驱动。”

一是根据科学知识、文献去设想现有方法的不足,这是理论上的驱动。另一个驱动是实证上的,写代码后去运行,看看取得的实际效果如何。这需要一些测试基准,可以认为是实验数据,然后算法根据实验数据得到运行结果,结果也必须是可评估的,评估出它的准确率后就可以进一步指导试错过程。这样一来,DeepScientist就具备了从大量的想法和尝试中归纳总结并渐进式探索的能力。

张岳称,在整个过程中,还要分不同的层次。比如顶端有一些技术路线的指导,指引以后再往下细分,细分就是指这一条技术路线会有不同的设置,每个设置下面都有不同的结果,根据这些试错反馈,还要回溯到顶层,评估技术路线要不要进行调整。

“类比来说就像发明灯泡,要尝试不同的材料,并且根据试错的结果,还需要再进行一些理论的分析,指导下一步的试错。”张岳举例道。

用AI写论文、审稿、做实验

在张岳看来,DeepScientist的出现一定会催生新的发表范式和科研范式。

“我上学发表第一篇顶会论文的时候,整个会上不过一百篇论文,现在同样的会议超过了一万篇,科研速度快,论文数量激增了100倍,我们在arXiv上看文章,但开会时间往往比科研结果晚9个月甚至更多,开会的时候就学不到什么新知识,传统的发表范式跟不上了。”

此外,张岳还称现在会议的审稿系统也接近崩溃状态,因为投稿量太大,有经验的审稿专家工作超负荷,每个作者都需要审稿,但作者的认真程度和专业知识参差不齐,导致论文质量大大下降。

AI科学家出现之后,会进一步增加学术迭代速度,人类所拥有的技术也就越多,所以未来发表范式会转变,也许不再需要学术会议。

“我们实验室推出了一个新的平台AiraXiv,既可以接受arXiv的文章,也可以接受AI写的文章,再用AI审稿人自动把关,标注文章质量,进行个性化算法推荐,每天根据用户喜好从海量论文中筛选出最相关、最喜爱的文章进行推送,这样大家的科研结果就可以用AI快速写成文章,快速公之于众,不需要等到学术会议发表。”张岳如是说。

至于科研范式也会有所转变。如果每个实验室都用AI助力做实验、写论文,科学家就可以把软件工程和论文负担交给AI,大大地解放双手。而且科学家还可以帮助AI进一步提升科研效率,毕竟科学家的洞见是现在大模型不具备的,大模型可能试错100次,才得到3个正向结果,而在科学家的指导下,可能只需要试错10次。

在张岳看来,如果人和机器共同加速科研进展,而不去担心发表范式的滞后,每一个实验室就是所见即所得的文章,科研的可复现性会大大提升,因为所有的代码都是AI写的,所有的实验过程都可以被公开追溯,不存在故意弄虚造假的问题。

第三是发表迭代,很快每个人都能第一时间得到最相关的文章,将来的学术会议会变成由AI自动聚集兴趣最相关的科学家成一个小组,科学家可以随时拉一个20-100人的会议,以最高效的线上、线下方式交流科研成果。

张岳认为这是将来必由的范式转变。下个月,世界第一AI科学家大会将在北京召开,他们邀请了国内外最相关的科研人员参加进行小范围讨论。

“大会主席由人把关,但允许世界上愿意参与的学者通过我们的AI科学家系统进行研究,并自动生成论文投稿到会议,然后接受AI审稿,整个AI科学家大会对新的学术范式以及新兴领域会带来什么影响,我们也拭目以待。”张岳如是说。

全学科人工智能科学家

不过,也有许多网友担心,一个无需人类干预的AI系统,是否存在研究方向失控或被误导的风险呢?

对此,张岳表示:“AI安全问题一直是我们重视的问题,所以DeepScientist公之于众,我们也采取了审慎的策略。”

第一批公开可以使用的接口只通过AI科学家会议公开,并且每位想使用的科学家需要提交书面申请,张岳团队会从众多申请者中遴选出少部分最有挑战性、符合伦理标准的研究对象,再进行合作实验,同时他们也会有伦理规范的检验工具。

“比如,我们实验室有AI生成论文自动检测系统,可以准确地检测出论文是否由AI生成,我们也有世界上第一个AI审稿人大模型,之后我们又做了AI安全审稿人的工作,让审稿人不被恶意的用户欺骗,做到评价可靠。”张岳举例道。

在他看来,AI本身的研究和AI安全研究一定是齐头并进的,并且张岳深信AI是可控的。

“作为一位AI语言模型学者,我们对语言模型的工作机理相对比较了解,所以对于AI的可控程度我是持比较积极的态度,我也十分鼓励学生们尽早、更多地使用AI工具,毕竟未来人一定要和AI协同工作。”

“AI取代了50%以上的程序员,但还是需要最优秀的程序员来控制AI才能生成好的系统,我们用多了之后才能真正让AI理解你,才能得心应手地写出想要的东西,如果完全依靠AI,那是做不出来的,而且我们也能检测出来论文是不是AI代写的。”张岳笑道。

国际上也有一些团队在尝试有关AI科学家的研究,在张岳看来,我们国家处在国际最前沿的水平。

目前,张岳团队正在做两方面的工作。一是让它更聪明,拥有更深刻的洞见和更强的推理能力,能在试错更少的情况下得到正面的结果,提升科研效率。二是想让它从计算机科学家扩展为通用学科的科学家,解决生物、物理、化学等各个学科的问题。

“在这些问题上,我们团队也有尝试,像一般学科,数据并不是存在计算机里,往往是实验得到的,经过一年的开发,我们打造了Airalogy平台,可以让每一个实验室都以最方便的形式把实验数据电子化上传云端,最近也全球上线了。”

张岳团队还加了一些巧思和设计,让导师和AI对话,告诉AI正在做什么实验,学生也可以通过拍照、对话的形式,快速地把正在做的实验电子化。

“我们相信当收到足够多的通用学科实验数据后,就可以把现在的计算机科学家变成全学科的科学家,真正帮助人类设计新材料,发明新物质,解决更多的挑战,促进社会进步。”张岳如是说。

运营编辑 |曹倩审核|孟莎莎

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
评分!中国女排0-3负捷克女排,仅3人表现达标、7人不及格

评分!中国女排0-3负捷克女排,仅3人表现达标、7人不及格

隐于山海
2026-06-04 02:27:28
罗马诺:皇马已与卡拉菲奥里团队接触,球员符合技术特点要求

罗马诺:皇马已与卡拉菲奥里团队接触,球员符合技术特点要求

懂球帝
2026-06-04 02:16:20
国乒男队选出二队长有争议,王励勤做出新调整,樊振东也笑了

国乒男队选出二队长有争议,王励勤做出新调整,樊振东也笑了

阿信点评
2026-06-03 19:40:16
云南,一方丈不幸身亡,整理遗物银行卡有528万存款,方丈女儿提出继承遗产,寺庙:出家人,这笔钱属于寺庙!

云南,一方丈不幸身亡,整理遗物银行卡有528万存款,方丈女儿提出继承遗产,寺庙:出家人,这笔钱属于寺庙!

LULU生活家
2026-05-30 18:01:03
3-1放虎归山!上海传3坏消息广厦收3利好,让王博有了翻盘的底气

3-1放虎归山!上海传3坏消息广厦收3利好,让王博有了翻盘的底气

后仰大风车
2026-06-03 07:10:06
江苏一单亲妈妈和小12岁男子姐弟恋,怀孕后男友玩失联!男方:孩子不一定是我的;朋友:两人的关系像母子

江苏一单亲妈妈和小12岁男子姐弟恋,怀孕后男友玩失联!男方:孩子不一定是我的;朋友:两人的关系像母子

台州交通广播
2026-06-04 00:48:27
唐山美女老板王立新去世,年仅40岁,不见女儿最后一面,原因痛心

唐山美女老板王立新去世,年仅40岁,不见女儿最后一面,原因痛心

180视角
2026-06-03 11:30:21
5月车市较量:销量背后暗流涌动

5月车市较量:销量背后暗流涌动

烽火瞭望者
2026-06-03 06:21:20
6人上双!中国男篮4分险胜,3人可以进大名单,2人被杜锋用废

6人上双!中国男篮4分险胜,3人可以进大名单,2人被杜锋用废

慢歌轻步谣
2026-06-04 02:14:41
放不下的顿巴斯,回不去的体面

放不下的顿巴斯,回不去的体面

秋月独朗
2026-06-03 14:14:30
今早台州一辆问界M9底部起火!刚刚,问界回应:非车辆自身原因导致

今早台州一辆问界M9底部起火!刚刚,问界回应:非车辆自身原因导致

都市快报橙柿互动
2026-06-03 12:22:15
6中4!拯救中国男篮!现象级最强新秀后卫

6中4!拯救中国男篮!现象级最强新秀后卫

篮球实战宝典
2026-06-03 21:31:13
李若彤回怼“连姑姑都下沉演短剧了”:我是演员,又不是天上神仙,角色合适就愿意演

李若彤回怼“连姑姑都下沉演短剧了”:我是演员,又不是天上神仙,角色合适就愿意演

台州交通广播
2026-06-03 23:21:05
倒查13年,央国企开始慌了

倒查13年,央国企开始慌了

职场资深秘书
2026-04-28 22:06:07
600188,拟超160亿元重大收购!注入电力资产!

600188,拟超160亿元重大收购!注入电力资产!

证券时报e公司
2026-06-03 19:40:33
发现没有?超市、菜市场已出现大怪现象,值得每个人深思

发现没有?超市、菜市场已出现大怪现象,值得每个人深思

快乐彼岸
2026-06-04 00:40:41
曼联球员身价涨跌:梅努上涨2000万欧为最大涨幅,德利赫特身价跌幅最多

曼联球员身价涨跌:梅努上涨2000万欧为最大涨幅,德利赫特身价跌幅最多

懂球帝
2026-06-04 00:28:11
头号大热出炉!世界杯6大夺冠热门来了!阿根廷仅第4,葡萄牙第5

头号大热出炉!世界杯6大夺冠热门来了!阿根廷仅第4,葡萄牙第5

球叮足球
2026-06-03 09:47:29
谁来追责?浙江医院惊天乱象!花高价挂专家号,等来一场致命误诊

谁来追责?浙江医院惊天乱象!花高价挂专家号,等来一场致命误诊

牛锅巴小钒
2026-06-03 18:48:02
国乒又一女将26岁退役!孙颖莎送祝福,她已低调赴宁波履新

国乒又一女将26岁退役!孙颖莎送祝福,她已低调赴宁波履新

酷侃体坛
2026-06-03 22:18:25
2026-06-04 03:40:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4863文章数 9193关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

房产
亲子
本地
艺术
公开课

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

亲子要闻

9岁孩童竟患上冠心病!医生说明原因,父母后悔不已……

本地新闻

用杨柳青年画的方式,打开天津

艺术要闻

二十年前割麦的场景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版