网易首页 > 网易号 > 正文 申请入驻

Ai2推出Asta:具备科学家思考力的人工智能合作者

0
分享至

Ai2(艾伦人工智能研究所)今天推出了Asta,这是一个集成的开放生态系统,旨在改变使用人工智能代理进行科学研究的方式。当人工智能工具充斥着研究领域时——通常是不透明、未经测试和未经证实的——Asta提供了一种有原则的替代方案:一个全面的集合,包括一个代理人工智能研究助理、第一个严格的科学代理基准套件,以及一套用于构建值得信赖的工具的开发人员资源。


这些组件共同构成了高性能科学人工智能的基础,它是透明的、基于证据的,旨在赢得科学家、开发人员和机构的信任。

Ai2首席执行官Ali Farhadi表示:“人工智能可以为科学带来变革,但前提是它必须与科学本身保持相同的标准。”“借助Asta,我们不仅在构建一个助手,还在构建一个建立在透明度、可重复性使用和科学严谨性基础上的生态系统。它专为真正的研究人员解决实际问题而设计,也是为开发人员创造下一代为加速科学发现而设计的代理工具。”

Asta:一个新型研究伙伴

Asta的核心是一个专门为科学家设计的开源人工智能助手。与通用工具不同,Asta了解科学研究工作流程的需求。它不仅检索信息,还审查文献,综合证据,并(在测试版中)分析数据,同时提供引用。

Asta已经被包括芝加哥大学和华盛顿大学在内的194所机构的研究人员使用,它正在加速现实世界的发现——从确定治疗靶点到探索新的研究领域。

芝加哥大学知识实验室主任James Evans说:“研究人员比以往任何时候都更难进行文献检索和综合。”“Ai2的Asta人工智能代理、基准和工具生态系统有助于打破这些障碍。它的系统有望加速从直觉到洞察力的道路,改变我们在科学理解的广阔领域中的导航方式。”


一个完全集成的科学人工智能生态系统

Asta不是一个独立的工具。这是一个全栈生态系统,旨在支持科学人工智能开发和使用的整个生命周期:

Asta:一个开源的人工智能代理研究助理,帮助科学家浏览文献、综合发现和分析数据。它完全透明,引用来源,旨在集成到现实世界的工作流程中。

AstaBench:一个严格的基准测试套件,为复杂的多步骤研究任务(从文献理解到代码执行和端到端发现)的科学AI代理性能设定了标准。它在11个基准测试中推出了2400多个问题,为研究人员和开发人员提供了一种可重复的、基于证据的方法来评估和比较代理。在发布时,AstaBench包括16个排行榜,涵盖所有基准类别、四个子类别的代理性能,以及包括性能和成本效益在内的总体排名。

Asta Resources:一个开发者工具包,包括开源代理、API、科学后训练语言模型,以及对科学语料库工具的访问,这是Ai2语义学者API基础设施的MCP扩展(200多万篇论文)。它提供了构建和评估值得信赖的科学代理所需的一切。

Ai2首席科学家Dan Weld说:“在建造Asta时,我们专注于研究人员面临的问题。”。“我们需要人工智能工具,通过执行复杂的多步骤计划、解释他们的想法并以证据为基础,真正节省我们的时间。这就是Asta所提供的。它不仅仅是一个助手,而是一个旨在像科学家一样思考的合作者。”


为科学人工智能设定标准

随着代理人工智能获得动力,噪音也在增加。新的工具每周都会出现,通常都有不透明的声明,也没有标准的评估方法。作为一个全面的框架,用于在真实的科学任务上测试和比较人工智能代理,而不是合成提示,Asta用AstaBench填补了这一空白。

Asta v0科学代理在Ai2的初步评估中以52.5%的得分领先,比次佳系统高出近10分。GPT-5 mini和Claude 3.5 Haiku搭配专用框架也是强有力的竞争者,这要归功于它们的低成本。然而,AstaBench揭示了许多智能体在编码等复杂任务中苦苦挣扎,突显了未来的挑战和专门构建的科学智能体的价值。

此基准测试套件与Asta资源配对,后者为开发人员构建满足相同高标准的代理提供了构建块。开发人员可以使用Asta资源构建代理,然后使用AstaBench对其进行评估,从而创建一个整个生态系统都能从中受益的科学改进器。

Asta的独特之处不仅在于它的功能,还在于它的构建方式:完全开源、开放获取,并以科学价值观为基础。当其他人竞相通过封闭系统和专有代理来定义该领域时,Ai2正在制定一条透明、有原则且旨在发展的集体前进道路。


展望未来

Asta只是个开始。随着科学人工智能领域的不断发展,Ai2致力于通过新的功能和工具来扩展Asta,从而突破研究人员和开发人员的能力界限。

Asta最令人兴奋的功能之一是数据分析。它允许用户上传自己的真实世界数据集,并使用自然语言进行探索。他们可以提出复杂的问题,并得到基于统计推理的严格、可解释的答案。它旨在通过生成和测试新的假设来加速数据驱动的发现,可以支持社会科学、生物学和气候研究等领域的工作,帮助科学家从原始数据转向有意义的结论。


未来的Asta版本还将包括实验复制、科学编程和长期研究规划等高级功能,使我们更接近能够真正支持端到端科学工作流程的人工智能研究助理。

NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。

特别活动推荐


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
德约科维奇历史第400胜蒙阴影,赛后坦承情绪失控,幸运逃过惩罚

德约科维奇历史第400胜蒙阴影,赛后坦承情绪失控,幸运逃过惩罚

体育妞世界
2026-01-25 00:55:03
重磅,辽宁队裁掉亨特,有意引进加洛威,徐杰崴脚报销第一阶段!

重磅,辽宁队裁掉亨特,有意引进加洛威,徐杰崴脚报销第一阶段!

体坛小快灵
2026-01-25 11:06:20
军统战犯狱中悟透:沈醉早获特赦无关起义,源于一桩隐秘大功

军统战犯狱中悟透:沈醉早获特赦无关起义,源于一桩隐秘大功

磊子讲史
2026-01-06 10:50:49
再见了陈佩斯,再见了赵本山,再见了冯巩,央视春晚迎来流量时代

再见了陈佩斯,再见了赵本山,再见了冯巩,央视春晚迎来流量时代

泠泠说史
2025-12-12 14:15:40
不要轻易做手术!医生提醒:65岁后,这4类手术可尽量避免

不要轻易做手术!医生提醒:65岁后,这4类手术可尽量避免

路医生健康科普
2026-01-23 10:10:57
库里拒绝沦为科比!可名嘴看得出,库里现在就是科比!

库里拒绝沦为科比!可名嘴看得出,库里现在就是科比!

氧气是个地铁
2026-01-25 11:37:50
单场18+1!火箭新人变2阵核心,获杜兰特点名,队内超6非他莫属

单场18+1!火箭新人变2阵核心,获杜兰特点名,队内超6非他莫属

熊哥爱篮球
2026-01-25 13:13:31
2025年,江苏学校砍人案徐加金被注射死刑,临刑前哭着抽完2根烟

2025年,江苏学校砍人案徐加金被注射死刑,临刑前哭着抽完2根烟

晓悦流年
2025-09-04 14:58:47
王刚没想到,离婚24年,成方圆会以这种方式,给自己上了生动一课

王刚没想到,离婚24年,成方圆会以这种方式,给自己上了生动一课

林雁飞
2026-01-22 23:51:27
地球上有外星人?马斯克:我就是

地球上有外星人?马斯克:我就是

澎湃新闻
2026-01-25 00:41:08
2026年养老金继续涨?人社部部长表态了!取消挂钩调整可行吗?

2026年养老金继续涨?人社部部长表态了!取消挂钩调整可行吗?

李健政观察
2026-01-25 13:08:19
农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

白云故事
2026-01-22 17:30:05
贾玲的丑国代Y瓜!

贾玲的丑国代Y瓜!

八卦疯叔
2026-01-25 11:13:19
青木率99%,高市早苗乐得连喊3声“万岁”,麻生:中方不足畏惧

青木率99%,高市早苗乐得连喊3声“万岁”,麻生:中方不足畏惧

阿伧说事
2026-01-24 15:33:04
特朗普抵京前,美国先通知中国,不想谈2件事,中方大规模抛美债

特朗普抵京前,美国先通知中国,不想谈2件事,中方大规模抛美债

墨兰史书
2026-01-25 08:35:07
45岁仍拍三级片,败光两任亿万家产,62岁坦言后悔嫁给钟镇涛

45岁仍拍三级片,败光两任亿万家产,62岁坦言后悔嫁给钟镇涛

无人倾听无人倾听
2026-01-17 15:17:25
黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

查尔菲的笔记
2025-12-16 15:14:06
76岁波波维奇罕见亮相:拄拐行走需要被人搀扶 中风后遗症明显

76岁波波维奇罕见亮相:拄拐行走需要被人搀扶 中风后遗症明显

追球者
2026-01-25 08:05:16
1973年,毛主席问杨振宁:万寿无疆科学吗?杨振宁的回答,让主席笑了

1973年,毛主席问杨振宁:万寿无疆科学吗?杨振宁的回答,让主席笑了

寄史言志
2026-01-24 17:53:13
1985年,主席女婿离开卫戍区,临走收到2条“死命令”:不准转业,不准退休

1985年,主席女婿离开卫戍区,临走收到2条“死命令”:不准转业,不准退休

寄史言志
2026-01-03 18:27:14
2026-01-25 13:36:50
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1634文章数 510关注度
往期回顾 全部

科技要闻

马斯克SpaceX背后的她:现实版钢铁侠小辣椒

头条要闻

专家:已有欧洲国家开始考虑"联合中国对抗美国"

头条要闻

专家:已有欧洲国家开始考虑"联合中国对抗美国"

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

王玉雯方严正声明 剧方回应:涉事人员已被开除

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

房产
健康
本地
公开课
军事航空

房产要闻

正式官宣!三亚又一所名校要来了!

耳石脱落为何让人天旋地转+恶心?

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版