网易首页 > 网易号 > 正文 申请入驻

人大、清华DeepAnalyze,让LLM化身数据科学家

0
分享至



来自人大和清华的研究团队发布了DeepAnalyze,首个面向自主数据科学的 agentic LLM。DeepAnalyze引起了社区内广泛讨论,一周内收获1000多个GitHub星标、20w余次社交媒体浏览量。

DeepAnalyze正在不断完善中,诚邀大家交流合作!欢迎研究者和从业者在GitHub提交pull request,成为contributor,共建DeepAnalyze!

DeepAnalyze-8B 能够模拟数据科学家的行为,在真实环境中主动编排、优化操作,最终完成复杂的数据科学任务。支持各种以数据为核心的任务:

  • 数据任务:自动化数据准备、数据分析、数据建模、数据可视化、数据洞察、报告生成;
  • 数据研究:可在任意数量的结构化数据(数据库、CSV、Excel)、半结构化数据(JSON、XML、YAML)、非结构化数据(TXT、Markdown)中进行开放式深度研究,生成分析师级别的研究报告;



DeepAnalyze 是一个 agentic LLM,无需任何启发式 workflow,即可自主完成复杂数据科学任务

  • 论文链接:https://arxiv.org/pdf/2510.16872
  • 代码、Demo链接:https://github.com/ruc-datalab/DeepAnalyze
  • 模型链接:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
  • 数据链接:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K

DeepAnalyze 的论文、代码、模型、数据均已开源,欢迎大家体验!

DeepAnalyze: 自主完成数据科学全流程

DeepAnalyze 可本地部署,作为您的私有数据科学助手!

DeepAnalyze 是什么?

现有将 LLMs 应用于自主数据科学的方法,可以分为两类:

  • 领域特定的 LLM:面向数据科学的代码生成 LLM、结构化数据理解 LLM...
  • 基于 workflow 的智能体:人为设计 workflow,通过 prompt 调用闭源 LLM 完成任务

现有工作面临两方面局限性:

  • 仅支持单点任务(例如数据分析、数据建模),无法端到端完成数据科学全流程。
  • 闭源模型未在真实环境中的数据科学任务上训练过,难以编排和优化各种复杂操作。

DeepAnalyze 希望推动基于 LLM 的数据科学系统从 workflow-based agent 范式转变到可训练的 agentic LLM 范式。

数据科学的复杂性为训练 agentic LLM 提出了新的挑战,包括:

  • 奖励稀疏:数据科学的复杂性使得 LLMs 在训练的早期阶段基本无法成功完成任务,难以获得正向奖励信号,从而导致 agentic LLM 训练过程崩溃。
  • 路径稀缺:数据科学的解决过程通常依赖长链推理,求解轨迹的稀缺使得 LLMs 缺少足够的指导,导致其在庞大的搜索空间中进行低效且盲目的试错式探索。



针对这两个问题,DeepAnalyze 引入了:

  • Curriculum-based Agentic Training:在真实环境中从单一任务到符合任务渐进式训练 LLM,让大模型逐步提升能力,避免在复杂任务上奖励信号为 0 导致的强化学习失效
  • Data-grounded Trajectory Synthesis:自动化合成 500K 数据科学的推理、环境交互数据,在庞大的搜索空间中提供正确路径的指导

通过在真实环境中的 agentic 训练,DeepAnalyze 具备了自动编排和自适应优化操作的能力,能端到端地完成数据科学全流程,包括具体的数据任务和开放式的数据研究。

DeepAnalyze 在数据科学 Benchmarks 上表现优异

1. DeepAnalyze-8B 在 DataSciBench(端到端数据科学 Benchmark)优于所有开源模型,和 GPT-4o 相媲美



2. DeepAnalyze 在 DSBench 数据分析和数据建模任务上由于基于 workflow 的智能体



3. DeepAnalyze 在面向数据的深度研究中取得最佳表现,能生成分析师级别的分析报告



例如:



更多实验结果请参见 DeepAnalyze 论文。

总结

  • DeepAnalyze 是首个面向自主数据科学的 agentic LLM,具备两项关键能力:自主编排(autonomous orchestration)和自适应优化(adaptive optimization)。
  • DeepAnalyze 作为一个基础模型,可以直接应用,或通过提示(prompting)或监督微调(supervised fine-tuning)进一步定制以适应特定场景。
  • 提出的Curriculum-based Agentic Training 训练范式和 data-grounded trajectory synthesis 数据合成方法,解决了复杂场景下的奖励稀疏(reward sparsity)和轨迹稀缺(trajectory scarcity)问题,实现对需要多种能力的高复杂度任务的有效学习。

附 DeepAnalyze 交流讨论群:https://mmbiz.qpic.cn/sz_mmbiz_jpg/KmXPKA19gWic6zf3dIibVR9xawZv04VjicAI9yx40Al0AcA4sv5MDErrLrloTbEKUDiah5vc0K5jpgKibrfJwrXT6hg/640?wx_fmt=jpeg&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1#imgIndex=7

作者介绍:



张绍磊,中国人民大学信息学院助理教授,位于中国人民大学讲席教授范举教授团队。他博士毕业于中国科学院计算技术研究所,导师为冯洋研究员。他的研究方向涵盖大语言模型、多模态大模型、AI for Data Science。相关研究成果在 NeurIPS、ACL、ICLR 等国际人工智能与自然语言处理会议发表论文 30 余篇,开源的多语言大模型、多模态大模型、数据科学大模型在 GitHub 社区累计获得 5000 + 星标。他长期担任 CCF-A 类国际会议 ACL ARR 的领域主席和责任编辑。个人主页:zhangshaolei1998@github.io。



范举,中国人民大学教授、博士生导师,国家级青年人才,中国计算机学会数据库专委会、大数据专委会执行委员。研究方向包括:数据治理技术与系统、智能数据库系统等。相关研究成果在计算机领域国际顶级期刊 / 会议发表论文 60 余篇。作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目、面上项目,以及多项产学研合作项目。先后获得 ICDE 2025 Best Paper Runner-Up、ACM SIGMOD Research Highlight Award、ACM China Rising Award、宝钢优秀教师等奖励。

RUC-DataLab是中国人民大学信息学院、数据工程与知识工程教育部重点实验室设立的科研团队,负责人是范举教授,团队专注于数据系统+人工智能 (Data+AI)交叉领域,致力于将数据技术与人工智能技术深度融合,从而打造更加智能、高效的新型数据系统。主要研究方向包括:(1)数据库系统智能化(AI4DB):利用人工智能技术提升数据库系统的查询性能、自治能力等;(2)数据库技术赋能AI系统(DB4AI):利用数据管理技术支撑大模型训练的数据准备、大模型推理的低延迟、高吞吐优化;(3)数智融合的新型数据科学系统(AI4DS):利用推理大模型、多模态语义理解与智能体等技术,提升数据科学系统的智能化水平与执行性能,有效释放数据价值。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拒演率93%!最寒酸综艺收官,赵晓卉两天救场炸翻全场:你们装什么装?

拒演率93%!最寒酸综艺收官,赵晓卉两天救场炸翻全场:你们装什么装?

可乐谈情感
2026-04-12 16:58:49
又一起吃他汀猝死!医生再三提醒:春季吃他汀的人,要警惕这4点

又一起吃他汀猝死!医生再三提醒:春季吃他汀的人,要警惕这4点

岐黄传人孙大夫
2026-04-13 14:10:03
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
谈崩了,万斯返回美国,特朗普通告全球,不许中国向伊朗提供武器

谈崩了,万斯返回美国,特朗普通告全球,不许中国向伊朗提供武器

梦仙境aa
2026-04-13 12:33:09
川崎工程师坦白:整个日本摩托圈,看到张雪俩字,心就咯噔一下

川崎工程师坦白:整个日本摩托圈,看到张雪俩字,心就咯噔一下

嘴角上翘的弧度
2026-04-11 07:02:09
蓝战非领奖穿着被吐槽!网友:都是千万级别网红,郭有财绅士儒雅

蓝战非领奖穿着被吐槽!网友:都是千万级别网红,郭有财绅士儒雅

火山詩话
2026-04-11 15:43:54
谈崩了!万斯返回美国,特朗普通告全球:不准中国向伊朗提供武器

谈崩了!万斯返回美国,特朗普通告全球:不准中国向伊朗提供武器

笑谈历史阿晡
2026-04-13 13:33:19
轻断食再次封神!复旦大学研究证实:让肝脏脂肪在3月内少20.5%?

轻断食再次封神!复旦大学研究证实:让肝脏脂肪在3月内少20.5%?

垚垚分享健康
2026-04-13 10:35:48
姘头的“姘”,不要读pìn,不然丢不起那个人!

姘头的“姘”,不要读pìn,不然丢不起那个人!

未央看点
2026-04-12 00:03:07
佛说:能遇见此文,皆是福报加持,往后人生皆顺,内心有底气

佛说:能遇见此文,皆是福报加持,往后人生皆顺,内心有底气

金沛的国学笔记
2026-04-12 20:26:38
以色列摩萨德局长换人,为白俄罗斯裔犹太人,任内塔尼亚胡军事秘书,总理办公室称他“极具声望”,批评者称他缺乏情报工作经验

以色列摩萨德局长换人,为白俄罗斯裔犹太人,任内塔尼亚胡军事秘书,总理办公室称他“极具声望”,批评者称他缺乏情报工作经验

极目新闻
2026-04-13 10:55:21
河北富豪苑刚:靠假结婚移民加拿大,欲娶外甥女为妻,遭姐夫杀害

河北富豪苑刚:靠假结婚移民加拿大,欲娶外甥女为妻,遭姐夫杀害

壹知眠羊
2026-03-24 07:17:58
一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

一场战争彻底把中国打醒!美军作战最毒的是什么?中国用30年看清

小兰聊历史
2026-04-08 01:20:00
盲目的大学扩招,正在反噬整个社会

盲目的大学扩招,正在反噬整个社会

凡人志
2026-03-25 01:34:53
常冰玉轰147,狂赚157万奖金!赛后绅士行为引热议,像极了赵心童

常冰玉轰147,狂赚157万奖金!赛后绅士行为引热议,像极了赵心童

球场没跑道
2026-04-13 08:26:20
万科全员降薪

万科全员降薪

地产微资讯
2026-04-11 13:46:45
马頔李纯去天津自驾游,开13万的车,2人吃6菜还打包勤俭持家

马頔李纯去天津自驾游,开13万的车,2人吃6菜还打包勤俭持家

椰黄娱乐
2026-04-13 10:33:11
爆大冷!大黑马26分惨败:轮休主力不想赢球,如愿避开哈登骑士

爆大冷!大黑马26分惨败:轮休主力不想赢球,如愿避开哈登骑士

体坛小李
2026-04-13 09:35:21
继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

潮鹿逐梦
2026-04-02 12:31:48
三星家族结清12万亿遗产税!兄妹3人与母砸锅卖铁硬扛

三星家族结清12万亿遗产税!兄妹3人与母砸锅卖铁硬扛

时尚的弄潮
2026-04-08 02:41:46
2026-04-13 16:11:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12751文章数 142624关注度
往期回顾 全部

科技要闻

传荣耀与字节跳动接洽“豆包手机”合作

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴 身材未反弹

财经要闻

起底AI"造黄"灰产:19.9元"一键脱衣"

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

旅游
本地
手机
亲子
公开课

旅游要闻

洛阳国际牡丹园“混血”黑牡丹——水墨丹青迎来最佳观赏期

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

手机要闻

4月20日发布!华为Pura X Max全方位外观公布:共三款配色

亲子要闻

郭碧婷传授备孕经验,二胎顺转剖后,整个人废了,尤其是肢体上

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版