网易首页 > 网易号 > 正文 申请入驻

阿里开源「深度研究」王炸Agent,登顶开源Agent模型榜首

0
分享至


▲头图由AI生成

智东西
作者 王涵
编辑 漠影

智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通义DeepResearch

在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集中,通义DeepResearch模型凭借3B激活参数,性能超越基于OpenAI o3DeepSeek V3.1Claude-4-Sonnet等旗舰模型的ReAct Agent(推理-行动智能体)。


▲基准测试成绩排名


▲基准测试分数

目前,通义DeepResearch的模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源,开发者和用户可自行下载模型与代码。


下载地址:

Github:

https://github.com/Alibaba-NLP/DeepResearch

Hugging Face:

https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

魔搭社区:

https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

深度研究作为近一年的AI研究热点,吸引了谷歌、OpenAI、Anthropic等众多主流企业投入研发。

深度研究研发的现有方法大多采用“单窗口、线性累加”的信息处理模式,在处理长周期任务时,Agent易遭遇“认知空间窒息”与“不可逆的噪声污染”,导致推理能力降低,难以完成复杂研究任务。

据介绍,为解决这些问题,阿里通义团队构建了一套合成数据驱动的完整训练链路,覆盖预训练与后训练阶段。

该链路以Qwen3-30B-A3B模型为基础进行优化,设计了RL算法验证与真实训练模块,涵盖真实与虚拟环境,并借助异步强化学习算法及自动化数据策展流程,有效提升了模型的迭代速度与泛化能力。

在推理阶段,通义团队还设计了ReAct基于自研IterResearch的Heavy两种模式。ReAct用于精准评估模型的基础内在能力,Heavy则通过test-time scaling策略,充分挖掘模型的性能上限,确保在长任务中也能实现高质量推理。

结语:阿里进一步补全开源布局

今年以来,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,且均取得开源SOTA成绩。通义DeepResearch的开源,进一步丰富了阿里在AI智能体领域的开源布局。

通义DeepResearch的开源为深度研究Agent赛道提供了“轻量化高性能”的新选择,也为全球开发者攻克长周期复杂研究任务提供了关键工具支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
收评:沪指微跌0.07%险守4000点 医药等防御性板块逆势走强

收评:沪指微跌0.07%险守4000点 医药等防御性板块逆势走强

财联社
2025-11-12 15:04:04
后续!曾医生的父母替女儿道歉了,字字带着泪和痛!没抱怨任何人

后续!曾医生的父母替女儿道歉了,字字带着泪和痛!没抱怨任何人

魔都姐姐杂谈
2025-11-12 10:42:22
全运会乒乓球:首个男单8强席位出炉!樊振东输1局,4:1势如破竹

全运会乒乓球:首个男单8强席位出炉!樊振东输1局,4:1势如破竹

国乒二三事
2025-11-12 13:13:48
湖南省岳阳市岳阳楼区人大常委会党组副书记、副主任严石龙被查

湖南省岳阳市岳阳楼区人大常委会党组副书记、副主任严石龙被查

极目新闻
2025-11-12 15:14:21
首次以中央名义开展!中央考核巡查组,进驻地方开展明查暗访等

首次以中央名义开展!中央考核巡查组,进驻地方开展明查暗访等

政知新媒体
2025-11-11 20:40:29
英伟达市值一夜蒸发超万亿元!这只AI科技股大跌16%,发生了什么?比特币跌超3%,加密币全网超15万人爆仓,32亿元灰飞烟灭

英伟达市值一夜蒸发超万亿元!这只AI科技股大跌16%,发生了什么?比特币跌超3%,加密币全网超15万人爆仓,32亿元灰飞烟灭

每日经济新闻
2025-11-12 06:26:06
2909亿身家有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身家有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

冷紫葉
2025-11-11 20:23:54
只有去过才知道:真正的美国,和新闻里说的根本不是一回事

只有去过才知道:真正的美国,和新闻里说的根本不是一回事

诗意世界
2025-11-11 22:33:55
20岁在俄罗斯圣彼得堡失联女留学生确认已离世,其父发声:案件正在办理,具体细节不便透露

20岁在俄罗斯圣彼得堡失联女留学生确认已离世,其父发声:案件正在办理,具体细节不便透露

极目新闻
2025-11-12 13:28:55
土耳其防长证实坠毁军用运输机上20人全部遇难

土耳其防长证实坠毁军用运输机上20人全部遇难

界面新闻
2025-11-12 15:39:31
后续来了!17分钟的视频始作俑者原来竟是她,都是吃醋惹的祸

后续来了!17分钟的视频始作俑者原来竟是她,都是吃醋惹的祸

魔都姐姐杂谈
2025-11-12 09:04:33
曾主任抛媚眼照被挖出!明目皓齿很调皮,网友:真的好迷人

曾主任抛媚眼照被挖出!明目皓齿很调皮,网友:真的好迷人

阿纂看事
2025-11-12 15:42:36
认真刷完曾医生和祖院长的视频,谁看了不说一句窒息?

认真刷完曾医生和祖院长的视频,谁看了不说一句窒息?

诗意世界
2025-11-10 18:51:56
人民币被踢出局!刚刚,英国掀桌子死保美元!

人民币被踢出局!刚刚,英国掀桌子死保美元!

深度报
2025-11-11 21:43:58
高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

临云史策
2025-11-11 22:00:26
高市支持率82%,薛领事被围攻,日防卫省称先发制人,特朗普发声

高市支持率82%,薛领事被围攻,日防卫省称先发制人,特朗普发声

科普100克克
2025-11-12 06:11:34
套现超4亿元!永辉超市董事长减持永辉,公司前三季度亏损7.1亿元

套现超4亿元!永辉超市董事长减持永辉,公司前三季度亏损7.1亿元

每日经济新闻
2025-11-12 17:06:12
某些领导们,不要再折腾老百姓和自己的手下了……

某些领导们,不要再折腾老百姓和自己的手下了……

靠山屯闲话
2025-11-12 10:40:48
9个月没系统训练?陈梦4-0何卓佳晋级八强 后2局连续挽救局点逆转

9个月没系统训练?陈梦4-0何卓佳晋级八强 后2局连续挽救局点逆转

颜小白的篮球梦
2025-11-12 13:35:30
81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

揽星河的笔记
2025-11-12 12:36:17
2025-11-12 18:08:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10728文章数 116895关注度
往期回顾 全部

科技要闻

Meta"宫斗"持续,AI教父杨立昆被"气"走了

头条要闻

"大客户"租两豪车后人间蒸发 车行找到车后一看天塌了

头条要闻

"大客户"租两豪车后人间蒸发 车行找到车后一看天塌了

体育要闻

太阳三连胜&活塞东部第一 哪个更想不到

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

时尚
房产
亲子
健康
数码

“廓形穿衣法”太火了!掌握这5个法则让你美一整个冬天

房产要闻

海垦城建·鹿城壹号品牌发布会暨美学示范区璀璨启幕

亲子要闻

爸爸说今天让孩子们自制披萨

血液科专家揭秘白血病七大误区

数码要闻

阿里首款自研旗舰双显AI眼镜 夸克AI眼镜S1 11月27日发布

无障碍浏览 进入关怀版