网易首页 > 网易号 > 正文 申请入驻

Ai2推出Asta:具备科学家思考力的人工智能合作者

0
分享至

Ai2(艾伦人工智能研究所)今天推出了Asta,这是一个集成的开放生态系统,旨在改变使用人工智能代理进行科学研究的方式。当人工智能工具充斥着研究领域时——通常是不透明、未经测试和未经证实的——Asta提供了一种有原则的替代方案:一个全面的集合,包括一个代理人工智能研究助理、第一个严格的科学代理基准套件,以及一套用于构建值得信赖的工具的开发人员资源。

这些组件共同构成了高性能科学人工智能的基础,它是透明的、基于证据的,旨在赢得科学家、开发人员和机构的信任。

Ai2首席执行官Ali Farhadi表示:“人工智能可以为科学带来变革,但前提是它必须与科学本身保持相同的标准。”“借助Asta,我们不仅在构建一个助手,还在构建一个建立在透明度、可重复性使用和科学严谨性基础上的生态系统。它专为真正的研究人员解决实际问题而设计,也是为开发人员创造下一代为加速科学发现而设计的代理工具。”

Asta:一个新型研究伙伴

Asta的核心是一个专门为科学家设计的开源人工智能助手。与通用工具不同,Asta了解科学研究工作流程的需求。它不仅检索信息,还审查文献,综合证据,并(在测试版中)分析数据,同时提供引用。

Asta已经被包括芝加哥大学和华盛顿大学在内的194所机构的研究人员使用,它正在加速现实世界的发现——从确定治疗靶点到探索新的研究领域。

芝加哥大学知识实验室主任James Evans说:“研究人员比以往任何时候都更难进行文献检索和综合。”“Ai2的Asta人工智能代理、基准和工具生态系统有助于打破这些障碍。它的系统有望加速从直觉到洞察力的道路,改变我们在科学理解的广阔领域中的导航方式。”

一个完全集成的科学人工智能生态系统

Asta不是一个独立的工具。这是一个全栈生态系统,旨在支持科学人工智能开发和使用的整个生命周期:

Asta:一个开源的人工智能代理研究助理,帮助科学家浏览文献、综合发现和分析数据。它完全透明,引用来源,旨在集成到现实世界的工作流程中。

AstaBench:一个严格的基准测试套件,为复杂的多步骤研究任务(从文献理解到代码执行和端到端发现)的科学AI代理性能设定了标准。它在11个基准测试中推出了2400多个问题,为研究人员和开发人员提供了一种可重复的、基于证据的方法来评估和比较代理。在发布时,AstaBench包括16个排行榜,涵盖所有基准类别、四个子类别的代理性能,以及包括性能和成本效益在内的总体排名。

Asta Resources:一个开发者工具包,包括开源代理、API、科学后训练语言模型,以及对科学语料库工具的访问,这是Ai2语义学者API基础设施的MCP扩展(200多万篇论文)。它提供了构建和评估值得信赖的科学代理所需的一切。

Ai2首席科学家Dan Weld说:“在建造Asta时,我们专注于研究人员面临的问题。”。“我们需要人工智能工具,通过执行复杂的多步骤计划、解释他们的想法并以证据为基础,真正节省我们的时间。这就是Asta所提供的。它不仅仅是一个助手,而是一个旨在像科学家一样思考的合作者。”

为科学人工智能设定标准

随着代理人工智能获得动力,噪音也在增加。新的工具每周都会出现,通常都有不透明的声明,也没有标准的评估方法。作为一个全面的框架,用于在真实的科学任务上测试和比较人工智能代理,而不是合成提示,Asta用AstaBench填补了这一空白。

Asta v0科学代理在Ai2的初步评估中以52.5%的得分领先,比次佳系统高出近10分。GPT-5 mini和Claude 3.5 Haiku搭配专用框架也是强有力的竞争者,这要归功于它们的低成本。然而,AstaBench揭示了许多智能体在编码等复杂任务中苦苦挣扎,突显了未来的挑战和专门构建的科学智能体的价值。

此基准测试套件与Asta资源配对,后者为开发人员构建满足相同高标准的代理提供了构建块。开发人员可以使用Asta资源构建代理,然后使用AstaBench对其进行评估,从而创建一个整个生态系统都能从中受益的科学改进器。

Asta的独特之处不仅在于它的功能,还在于它的构建方式:完全开源、开放获取,并以科学价值观为基础。当其他人竞相通过封闭系统和专有代理来定义该领域时,Ai2正在制定一条透明、有原则且旨在发展的集体前进道路。

展望未来

Asta只是个开始。随着科学人工智能领域的不断发展,Ai2致力于通过新的功能和工具来扩展Asta,从而突破研究人员和开发人员的能力界限。

Asta最令人兴奋的功能之一是数据分析。它允许用户上传自己的真实世界数据集,并使用自然语言进行探索。他们可以提出复杂的问题,并得到基于统计推理的严格、可解释的答案。它旨在通过生成和测试新的假设来加速数据驱动的发现,可以支持社会科学、生物学和气候研究等领域的工作,帮助科学家从原始数据转向有意义的结论。

未来的Asta版本还将包括实验复制、科学编程和长期研究规划等高级功能,使我们更接近能够真正支持端到端科学工作流程的人工智能研究助理。

NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。

特别活动推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美女歌唱家沦为贪官情妇,收巨额财物,半生奢靡放纵,下场太解气

美女歌唱家沦为贪官情妇,收巨额财物,半生奢靡放纵,下场太解气

往史过眼云烟
2026-04-15 14:46:46
张婉婷曝宋宁峰近况:他每天就是下跪、哭、悔过,就是死都不离开

张婉婷曝宋宁峰近况:他每天就是下跪、哭、悔过,就是死都不离开

观鱼听雨
2026-04-15 22:30:00
杭州一女子KTV消费近200万,被丈夫发现后想要回:我被男模PUA了

杭州一女子KTV消费近200万,被丈夫发现后想要回:我被男模PUA了

我不叫阿哏
2026-04-16 01:42:11
卸妆后,王一博邋遢油腻,张柏芝像土拨鼠,刘晓庆神似秃头阿哥

卸妆后,王一博邋遢油腻,张柏芝像土拨鼠,刘晓庆神似秃头阿哥

手工制作阿歼
2026-04-15 17:39:28
长的太漂亮了,真正的珠圆玉润,标准的东方美

长的太漂亮了,真正的珠圆玉润,标准的东方美

生活新鲜市
2026-03-27 07:21:32
又有2名间谍被抓!潜藏中国17年,境外渗透曝光,泄密细节惊人

又有2名间谍被抓!潜藏中国17年,境外渗透曝光,泄密细节惊人

蜉蝣说
2026-04-15 11:03:59
阿尔特塔创造队史纪录:目标直指欧冠冠军,半决赛对手出炉

阿尔特塔创造队史纪录:目标直指欧冠冠军,半决赛对手出炉

足球狗说
2026-04-16 05:40:31
迪拜帆船酒店:将停业1年半

迪拜帆船酒店:将停业1年半

第一财经资讯
2026-04-15 19:05:49
浙金中心案件关键性进展:追回 11亿赃款,逃亡境外者全部押解回国

浙金中心案件关键性进展:追回 11亿赃款,逃亡境外者全部押解回国

新浪财经
2026-04-15 14:09:10
1942年延安产了一批帽子,样子不好看没人愿戴,主席笑着说:我戴

1942年延安产了一批帽子,样子不好看没人愿戴,主席笑着说:我戴

芳芳历史烩
2026-03-30 21:22:47
罗伯逊看好赵心童世锦赛卫冕:他让很多球手畏惧,打法太有压迫性

罗伯逊看好赵心童世锦赛卫冕:他让很多球手畏惧,打法太有压迫性

杨华评论
2026-04-15 21:33:53
史上最抢手皇后,6位帝王轮番霸占60年不停歇,48岁还被人争着要

史上最抢手皇后,6位帝王轮番霸占60年不停歇,48岁还被人争着要

小豫讲故事
2026-04-12 06:00:09
纳斯达克金龙中国指数收涨0.75%,热门中概股多数上涨

纳斯达克金龙中国指数收涨0.75%,热门中概股多数上涨

每日经济新闻
2026-04-16 05:05:47
男子骑摩托闯高速被拦,交警质问“是不是张雪机车给你打鸡血了”,张雪回应视频已删除;当地:江苏禁止摩托上高速,正核查

男子骑摩托闯高速被拦,交警质问“是不是张雪机车给你打鸡血了”,张雪回应视频已删除;当地:江苏禁止摩托上高速,正核查

山西晚报
2026-04-15 18:16:50
官方:全美有1.7亿人观看25-26赛季NBA常规赛,较上赛季提升86%

官方:全美有1.7亿人观看25-26赛季NBA常规赛,较上赛季提升86%

懂球帝
2026-04-16 04:55:15
打了45天,美以最新伤亡出炉,两党高层接连发难,特朗普被逼宫

打了45天,美以最新伤亡出炉,两党高层接连发难,特朗普被逼宫

Ck的蜜糖
2026-04-16 06:56:46
1936年,前清翰林嫌红军没文化,毛主席笑了:让舒同给他写封信

1936年,前清翰林嫌红军没文化,毛主席笑了:让舒同给他写封信

兴趣知识
2026-04-16 01:55:57
女子因感冒输液休克,已花80万治疗仍昏迷未醒!丈夫:出诊者无医学资质

女子因感冒输液休克,已花80万治疗仍昏迷未醒!丈夫:出诊者无医学资质

上观新闻
2026-04-15 12:44:09
5轮0出场!伊万重点提拔的国足新星惨遭韩鹏无视,沦为中超多余人

5轮0出场!伊万重点提拔的国足新星惨遭韩鹏无视,沦为中超多余人

零度眼看球
2026-04-16 06:37:25
张雪峰去世不到一个月,员工宣布离职,低价挖客户,账号已私密

张雪峰去世不到一个月,员工宣布离职,低价挖客户,账号已私密

180视角
2026-04-15 17:52:51
2026-04-16 07:32:49
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1708文章数 511关注度
往期回顾 全部

科技要闻

ChatGPT十亿用户又怎样?Anthropic直接贴脸

头条要闻

美国发布新一轮涉伊朗制裁措施

头条要闻

美国发布新一轮涉伊朗制裁措施

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

谢娜现身环球影城,牵手女儿温馨有爱

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

本地
艺术
亲子
数码
健康

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

艺术要闻

张大千『 花菓荟萃册』

亲子要闻

梅婷12岁女儿近照火了,完美复刻妈妈的颜值,这是生了个小梅婷

数码要闻

消息称苹果iPad Air明年将用上OLED屏幕,但仍有个遗憾

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版