网易首页 > 网易号 > 正文 申请入驻

阿里开源「深度研究」王炸Agent,登顶开源Agent模型榜首

0
分享至


▲头图由AI生成

智东西
作者 王涵
编辑 漠影

智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通义DeepResearch

在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集中,通义DeepResearch模型凭借3B激活参数,性能超越基于OpenAI o3DeepSeek V3.1Claude-4-Sonnet等旗舰模型的ReAct Agent(推理-行动智能体)。


▲基准测试成绩排名


▲基准测试分数

目前,通义DeepResearch的模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源,开发者和用户可自行下载模型与代码。


下载地址:

Github:

https://github.com/Alibaba-NLP/DeepResearch

Hugging Face:

https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

魔搭社区:

https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

深度研究作为近一年的AI研究热点,吸引了谷歌、OpenAI、Anthropic等众多主流企业投入研发。

深度研究研发的现有方法大多采用“单窗口、线性累加”的信息处理模式,在处理长周期任务时,Agent易遭遇“认知空间窒息”与“不可逆的噪声污染”,导致推理能力降低,难以完成复杂研究任务。

据介绍,为解决这些问题,阿里通义团队构建了一套合成数据驱动的完整训练链路,覆盖预训练与后训练阶段。

该链路以Qwen3-30B-A3B模型为基础进行优化,设计了RL算法验证与真实训练模块,涵盖真实与虚拟环境,并借助异步强化学习算法及自动化数据策展流程,有效提升了模型的迭代速度与泛化能力。

在推理阶段,通义团队还设计了ReAct基于自研IterResearch的Heavy两种模式。ReAct用于精准评估模型的基础内在能力,Heavy则通过test-time scaling策略,充分挖掘模型的性能上限,确保在长任务中也能实现高质量推理。

结语:阿里进一步补全开源布局

今年以来,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,且均取得开源SOTA成绩。通义DeepResearch的开源,进一步丰富了阿里在AI智能体领域的开源布局。

通义DeepResearch的开源为深度研究Agent赛道提供了“轻量化高性能”的新选择,也为全球开发者攻克长周期复杂研究任务提供了关键工具支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
警方通报:小区内发生一起致3死1伤刑事案件,嫌犯畏罪自杀身亡

警方通报:小区内发生一起致3死1伤刑事案件,嫌犯畏罪自杀身亡

澎湃新闻
2026-02-07 02:00:06
特朗普起诉美两部门索赔至少100亿美元,美财长承认:若他胜诉,费用将由美民众承担

特朗普起诉美两部门索赔至少100亿美元,美财长承认:若他胜诉,费用将由美民众承担

环球网资讯
2026-02-06 18:41:17
笑喷 法国运动员在开幕式上出糗:当着全球观众的面摔倒 原因曝光

笑喷 法国运动员在开幕式上出糗:当着全球观众的面摔倒 原因曝光

风过乡
2026-02-07 08:09:38
爆笑!孙继海调侃邵佳一:02世界杯你去了?邵佳一:上场比你多

爆笑!孙继海调侃邵佳一:02世界杯你去了?邵佳一:上场比你多

念洲
2026-02-07 07:51:57
5.9公斤黄金被拦截!一女子崩溃:我的600万元啊……

5.9公斤黄金被拦截!一女子崩溃:我的600万元啊……

深圳晚报
2026-02-06 22:53:09
以色列已准备好对伊朗发动大规模打击,或比“十二日战争”更加残酷

以色列已准备好对伊朗发动大规模打击,或比“十二日战争”更加残酷

极目新闻
2026-02-07 10:04:57
演员立威廉:身心几近崩溃,已重新安排遗嘱!去年被诊断出甲状腺癌二期

演员立威廉:身心几近崩溃,已重新安排遗嘱!去年被诊断出甲状腺癌二期

都市快报橙柿互动
2026-02-07 00:32:47
牢A让每个粉丝给他每个月充电988元,这镰刀够锋利!

牢A让每个粉丝给他每个月充电988元,这镰刀够锋利!

廖保平
2026-02-07 09:20:42
委内瑞拉全面驱逐俄企,欧盟出台新的对俄制裁,桑杜拒绝诺奖提名

委内瑞拉全面驱逐俄企,欧盟出台新的对俄制裁,桑杜拒绝诺奖提名

史政先锋
2026-02-07 13:25:08
湖北95后小伙从上海走回老家过年!36天瘦了27斤

湖北95后小伙从上海走回老家过年!36天瘦了27斤

大风新闻
2026-02-07 11:36:06
特朗普:预计到我本届任期结束时 道指将站上10万点

特朗普:预计到我本届任期结束时 道指将站上10万点

财联社
2026-02-07 13:40:26
炸裂!山东夫妇到美国帮女儿带孩子,5年后连带女儿遭洋女婿杀害

炸裂!山东夫妇到美国帮女儿带孩子,5年后连带女儿遭洋女婿杀害

谈史论天地
2026-02-07 08:40:06
苹果变瓷砖后续:同事曝内幕,提前调包早有预谋,涉事人恐遭重罚

苹果变瓷砖后续:同事曝内幕,提前调包早有预谋,涉事人恐遭重罚

离离言几许
2026-02-07 13:30:06
年会苹果机变瓷砖后续!同事曝主任早有预谋,公司处罚结果曝光

年会苹果机变瓷砖后续!同事曝主任早有预谋,公司处罚结果曝光

离离言几许
2026-02-07 10:00:08
谷爱凌:25年备战亚冬会意外重伤 脑子里流血癫痫发作差点没醒过来

谷爱凌:25年备战亚冬会意外重伤 脑子里流血癫痫发作差点没醒过来

818体育
2026-02-07 16:08:42
杨瀚森复出2+1!开拓者逆转灰熊终结6连败 夏普伤退格兰特23分

杨瀚森复出2+1!开拓者逆转灰熊终结6连败 夏普伤退格兰特23分

醉卧浮生
2026-02-07 13:19:05
明珍珍被执行死刑,最后照片曝光,死前已无法自理

明珍珍被执行死刑,最后照片曝光,死前已无法自理

复转这些年
2026-02-05 23:51:59
2015年饭局上,是谁举报了毕福剑?举报者和老毕的最终结局如何?

2015年饭局上,是谁举报了毕福剑?举报者和老毕的最终结局如何?

文史道
2026-02-03 06:45:08
冲3金!22岁谷爱凌霸气发声:我保持着4大纪录 已无需再证明什么

冲3金!22岁谷爱凌霸气发声:我保持着4大纪录 已无需再证明什么

风过乡
2026-02-07 09:22:43
美国前总统克林顿呼吁全面公开爱泼斯坦文件,要求川普政府举行公开听证会

美国前总统克林顿呼吁全面公开爱泼斯坦文件,要求川普政府举行公开听证会

爆角追踪
2026-02-07 16:00:48
2026-02-07 16:44:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11202文章数 116965关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

特朗普想搞"五国集团"取代G7 这次带上了中国和俄罗斯

头条要闻

特朗普想搞"五国集团"取代G7 这次带上了中国和俄罗斯

体育要闻

中国体育代表团亮相米兰冬奥会开幕式

娱乐要闻

何超欣说和何猷君没竞争,实力遭质疑

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

教育
本地
游戏
公开课
军事航空

教育要闻

小学奥数,求阴影部分面积

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

《生化危机4重制版》更换E加密 令PC玩家不满

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

重大转变 特朗普签令调整军售排序

无障碍浏览 进入关怀版