网易首页 > 网易号 > 正文 申请入驻

Ai2发布开源AI开发智能体系列 可适应任意代码库

0
分享至


人工智能正在快速发展,改变着开发者编写代码的方式。随着代码越来越快地流入GitHub等代码仓库,机器智能现在与人类开发者并肩工作。

根据艾伦人工智能研究所的观点,编码智能体面临一个根本性问题:大多数都是封闭的,训练成本昂贵,难以研究或适应私有代码库。为了解决这个问题,该公司今日发布了Ai2开放编码智能体系列,让构建和训练定制编码智能体变得简单易用。

SERA智能体的核心能力

该系列的首个发布版本名为SERA(软验证高效仓库智能体),能够解决超过55%的SWE-Bench Verified基准测试问题,这一表现超越了同等规模的先前开源模型。

SERA的每个组件都是开源的,包括模型、代码以及与Anthropic公司Claude Code的集成。它只需一行代码即可启动,用户无需任何大语言模型训练经验。

SERA提供两个版本:SERA-32B和SERA-8B。前者是320亿参数的模型,在SWE-bench Verified基准测试中表现强劲,在标准设置下能解决约55%的问题,超越了大多数开源模型如Qwen3-Coder,以及在相同推理设置下的封闭模型,包括Mistral3的Devstral Small 2。后者是80亿参数的模型,能解决29.4%的SWE-Bench Verified问题,而强化学习基线模型仅为9.4%。

技术突破与成本优势

Ai2使用专门的模型,在每个代码库的8000个合成轨迹上进行训练,始终能够匹配甚至超越作为教师模型的GLM-4.5-Air的性能,后者拥有超过1000亿个参数。

Ai2表示,一个特别有希望的结果是,较小的完全开源模型能够复制甚至超越更强大"教师"编码智能体的性能。通过在320亿参数级别针对特定代码库的有利专业化和微调,SERA能够以三分之一的规模超越一些1000亿参数的通用模型。在部署时,这意味着更小的内存占用和更低的计算需求,从而大大降低成本,而不会牺牲质量。

在商品云硬件上重现Ai2主要实验结果的总成本约为400美元,比目前市场上许多现有方法便宜约100倍。

易用性与未来发展

该公司解释说,此次发布包含开发者和研究人员快速上手所需的一切,以便重现、测试和基于SERA进行构建:基于两行代码的轻量级部署,用于启动、部署和推理。还有设置脚本和推理优化,使SERA能够与Claude Code协同工作。

Ai2表示,打算使用相同的方法来不断改进并扩展到更大的骨干网络,但强调当前的流程已经足够便宜和可行,任何人都可以运行、定制和迭代。

Q&A

Q1:SERA智能体是什么?它有什么特殊能力?

A:SERA(软验证高效仓库智能体)是Ai2发布的开源AI编码智能体,能够解决超过55%的SWE-Bench Verified基准测试问题,超越了同等规模的先前开源模型。它的特殊之处在于完全开源,只需一行代码即可启动,用户无需大语言模型训练经验。

Q2:SERA有哪些版本?性能如何?

A:SERA提供两个版本:SERA-32B(320亿参数)和SERA-8B(80亿参数)。SERA-32B在标准设置下能解决约55%的问题,超越了大多数开源和封闭模型。SERA-8B能解决29.4%的问题,远超强化学习基线模型的9.4%表现。

Q3:使用SERA的成本如何?

A:SERA的成本非常低廉。在商品云硬件上重现主要实验结果的总成本约为400美元,比目前市场上许多现有方法便宜约100倍。由于模型规模优化,部署时内存占用更小,计算需求更低,大大降低了使用成本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

阿纂看事
2026-01-09 09:48:35
缅北明珍珍伏法,不满30岁魂归黄泉,坟前注定只有荒草无祭品

缅北明珍珍伏法,不满30岁魂归黄泉,坟前注定只有荒草无祭品

一盅情怀
2026-01-30 20:39:34
深夜,全线崩盘!凌晨,史诗级大逆转来了

深夜,全线崩盘!凌晨,史诗级大逆转来了

中国基金报
2026-01-30 08:47:09
深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

亿通电子游戏
2026-01-30 11:58:27
德国那位军事专家说得够直白:美国不是怕中国,是怕打了也白打

德国那位军事专家说得够直白:美国不是怕中国,是怕打了也白打

扶苏聊历史
2026-01-28 18:04:09
泡过“药水”的5种菜,很多人不知道,菜贩都不吃,过年劝你少买

泡过“药水”的5种菜,很多人不知道,菜贩都不吃,过年劝你少买

风月得自难寻
2026-01-31 01:35:21
中国的航母舰载机总教头,是从美国斩杀线上“捡回来”的

中国的航母舰载机总教头,是从美国斩杀线上“捡回来”的

枫冷慕诗
2026-01-28 11:55:47
唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

章眽八卦
2026-01-05 12:27:07
西媒:皇马未直接进入欧冠16强,俱乐部主席弗洛伦蒂诺愤怒

西媒:皇马未直接进入欧冠16强,俱乐部主席弗洛伦蒂诺愤怒

星耀国际足坛
2026-01-30 13:13:57
中国航天重大损失,实践三十二号发射失利,中国航天开年遇挫!

中国航天重大损失,实践三十二号发射失利,中国航天开年遇挫!

阿龙聊军事
2026-01-18 20:27:20
球迷批乌克兰名将演戏:咋不把600万奖金捐给祖国母亲 有种去当兵

球迷批乌克兰名将演戏:咋不把600万奖金捐给祖国母亲 有种去当兵

风过乡
2026-01-30 07:42:37
孙守刚、张弓,有新职

孙守刚、张弓,有新职

新京报政事儿
2026-01-30 10:15:03
日本警告中国:中国再拿历史牌施压日本,什么问题都解决不了!

日本警告中国:中国再拿历史牌施压日本,什么问题都解决不了!

安安说
2026-01-30 09:07:29
42架大运直飞前线 里面装啥?上百架战机全程护航:敢拦直接击落

42架大运直飞前线 里面装啥?上百架战机全程护航:敢拦直接击落

聚峰军评
2026-01-29 05:51:53
1-2!U17国足热身赛遭乌兹别克逆转,张伯霖闪击,邝兆镭失误送礼

1-2!U17国足热身赛遭乌兹别克逆转,张伯霖闪击,邝兆镭失误送礼

我爱英超
2026-01-30 21:38:38
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
第二、三批市属国企搬迁至北京城市副中心,时间表明确

第二、三批市属国企搬迁至北京城市副中心,时间表明确

新京报
2026-01-30 19:54:40
央视曝光军工重大泄密:间谍使用了美人计

央视曝光军工重大泄密:间谍使用了美人计

南权先生
2026-01-27 15:39:22
3天爆4个惊天大瓜,知三当三、偷税漏税、吸毒涉毒,郭晶晶也遭殃

3天爆4个惊天大瓜,知三当三、偷税漏税、吸毒涉毒,郭晶晶也遭殃

趣文说娱
2026-01-29 16:34:46
王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

姜大叔侃球
2026-01-30 20:08:18
2026-01-31 05:31:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15806文章数 49687关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

伊朗总统:若美国寻求谈判 就必须停止挑衅

头条要闻

伊朗总统:若美国寻求谈判 就必须停止挑衅

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

艺术
房产
手机
教育
公开课

艺术要闻

惊艳!越南摄影师镜头下的妩媚女子!

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

手机要闻

差200元!红米Turbo 5与Max该怎么选?这4点核心差异看完不纠结!

教育要闻

害群之马!老师因“把分数写在试卷上”被家长投诉,官方要求整改

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版