网易首页 > 网易号 > 正文 申请入驻

一天仅需5毛钱,开源框架替你半夜跑实验!7*24小时待命

0
分享至


新智元报道

编辑:LRST

【新智元导读】开源框架Deep Researcher Agent帮你全天候自动跑深度学习实验,节省大量重复劳动。它通过自主循环完成想方案、执行、监控与反思,仅需每天五毛钱。不依赖LLM API,实现实时控制与手机端监控,真正解放研究者精力,让他们专注于思考。

做深度学习研究的朋友,谁没经历过这种日子,改超参 → 跑训练 → 等 6 小时 → 看结果 → 再改 → 再跑 → 再等。

Deadline前这个循环要重复上百次。凌晨三点定闹钟爬起来,就为了瞄一眼loss有没有降下去——降了,松一口气继续睡;没降,眼泪都快下来了还得改一版重新提交。

而最让人崩溃的不是辛苦,是这件事本质上是机械的:你早就想好了要试什么,剩下的只是把它跑出来而已。这部分时间,本该属于真正的思考。

有没有可能,让一个AI Agent替你把这部分跑掉?

GitHub上最近有一个开源项目叫Deep Researcher Agent的框架,正面回答了这个问题——你睡觉的时候,它在炼丹;你写论文的时候,它已经把 results table 准备好了。


项目链接:https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7


它是怎么工作的?

框架的核心,是一个THINK → EXECUTE → MONITOR → REFLECT的自主循环。


THINK(想方案)Agent 读取项目说明 + 历史实验记忆,分析当前最优结果,决定下一步该试什么。注意——它不只是改超参,还能改模型代码、换 loss 函数、加数据增强策略。

⚙️ EXECUTE(写代码 + 起任务)Agent自动改代码或config,先跑一个强制 dry-run(2 步前向反向)确认没bug,然后才把真正的训练打到GPU上。

MONITOR(盯着,但不花钱)这里是整个项目最强的一招:训练期间,Agent完全不调用 LLM API。它只做三件事:

  • kill -0 $PID看进程还活着没

  • nvidia-smi看 GPU 在不在干活

  • tail看日志最后几行

这三个操作的API成本是

REFLECT(看结果 + 决定下一步)训练结束,Agent 解析日志、提取指标、跟历史最优对比、记录里程碑,然后开下一轮。

整个循环24小时不间断。你想介入?随时可以——往项目目录里扔一个指令文件就行,Agent下一轮自动读到。

一天成本五毛钱,这是怎么做到的

24/7跑LLM Agent,听起来不应该很贵吗?


关键就在前面那个「零成本 MONITOR」。

一天24小时里,90%以上的时间都在训练,这段时间 LLM 调用费 = 0。只有开头「想方案」和结尾「看结果」才需要请大模型出马,每次几分钟。

算下来:


一天五毛钱,够你跑一整个礼拜也比一杯咖啡便宜。

跑半年内存不涨:两层「恒定记忆」

长时间运行的Agent有个经典毛病:上下文越积越长,又慢又贵又蠢

Deep Researcher Agent的解法是一个两层记忆系统:

  • 第一层:人类写的项目说明(冻结不变,最大3000字符)——告诉Agent你想干什么、约束是什么

  • 第二层:Agent自己维护的滚动日志——关键成果自动压缩到 1200 字符以内,最近决策只保留15条

总记忆量恒定在约5000字符。Agent 跑1天是这个数,跑6个月还是这个数。

不是demo

是真打过仗

这个框架不是放在paper里看看的玩具。它已经在多个真实研究项目中连续跑了30多天

自主完成500+轮实验循环,单个项目指标比 baseline 提升52%(200+ 次全自动实验跑出来的),同时管理4 个项目、4 台 GPU 服务器,最长连续运行30+ 天,期间人类只介入了五六次

Claude和Codex都能用,配置一行切换

框架不绑定单一LLM:

  • Anthropic系:Claude Sonnet 4.6(快) / Claude Opus 4.6(最强)

  • OpenAI系:Codex 5.3(快) / GPT 5.4(最强)

config改一行就能切,谁强用谁。

躺床上也能炼丹:手机端实时监控

配合Happy Coder App(iOS / Android),可以在手机上:实时查看实验进度、接收训练完成 / 出 bug 推送、随时给Agent下达「换个方向」的指令。

端到端加密,代码和结果完全私密。

这意味着你真的可以在地铁上、在咖啡馆、在床上指挥一整套深度学习实验流水线。

一键装好,7 个斜杠命令

git clone之后跑一句python install.py,立刻获得7个 Claude Code / Codex 斜杠命令:


完全不会用?仓库里有个AI_GUIDE.md——把这个文件直接丢给任何 AI 助手,它会交互式地一步步带你装好、跑起第一个实验。新手友好到这个地步。

AI科研工具对比

目前主流的AI研究工具——Claude Scholar、AI Scientist、SWE-Agent等——要么帮你写论文,要么帮你写代码。但没有一个能真正替你把实验跑出来

Deep Researcher Agent是第一个专门为「跑」深度学习实验设计的开源 Agent 框架,而不是为「写」

⚠️ 但是,请先看完这一段再去 Star

作者在 README 里挂了一段非常严肃的声明,我觉得这一段比项目本身更值得放到这篇文章里:

本项目严禁用于学术造假与任何形式的科研不端行为。

这个框架被造出来,只有一个目的——把跑实验里那些机械、重复的环节从研究者身上拿掉,让大家把节省下来的时间,投入到真正重要的事情:思考上面。

idea必须由人来提供。请不要寄希望于用本项目进行学术不端,这不是我们的项目初衷,也不是这个社区欢迎的事情。

学术应当保持纯粹。Agent可以替你跑实验,但idea、判断与责任必须由人来承担。我们真诚地希望每一位使用者都能human in the loop地去思考,在自己的研究方向上做出属于自己的、真实的贡献

在这个动辄「AI一键生成论文」的时代,看到一个开源作者主动给自己的工具立这样的边界,挺打动人的。

工具是中立的,但作者立场不必中立。

一个人的精力是有限的。研究者本该把时间花在读论文、想 idea、解读结果上,而不是花在凌晨三点爬起来看loss有没有降。

Deep Researcher Agent想做的,就是把后者还给机器,把前者留给人。

如果你也是炼丹人,如果你也曾在deadline前哭着改config——

这一次,让AI替你熬夜。你去睡觉。

参考资料:

https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一家三口长时间停车开空调,险些丧命!

一家三口长时间停车开空调,险些丧命!

环球网资讯
2026-05-09 19:55:37
国家阶级固化完成:这世界上不可能再有国家可以取代中美了!

国家阶级固化完成:这世界上不可能再有国家可以取代中美了!

天老爷
2026-05-08 15:50:54
Lexus:北方人眼里的“破丰田”,为什么是广东人的“情怀座驾”

Lexus:北方人眼里的“破丰田”,为什么是广东人的“情怀座驾”

小鹿CC
2026-05-09 22:50:29
玄彬获视帝现场表白妻儿 高清镜头下的孙艺珍美翻了

玄彬获视帝现场表白妻儿 高清镜头下的孙艺珍美翻了

草莓解说体育
2026-05-09 16:42:05
世乒赛3比0横扫日本实现12连冠,梁靖崑表现最为突出,谁不赞成?

世乒赛3比0横扫日本实现12连冠,梁靖崑表现最为突出,谁不赞成?

一拙见
2026-05-11 06:31:37
人大代表:建议确保乡镇干部收入高于县直同级20%以上,引发共鸣!

人大代表:建议确保乡镇干部收入高于县直同级20%以上,引发共鸣!

细说职场
2026-05-10 10:09:56
1-1!卫冕冠军拒绝出局 山西男篮主场球迷不满吹罚,怒斥裁判

1-1!卫冕冠军拒绝出局 山西男篮主场球迷不满吹罚,怒斥裁判

小徐讲八卦
2026-05-11 06:52:52
1天涨粉10万的博士爸爸:这代孩子的“前额叶损伤”,可以这么养

1天涨粉10万的博士爸爸:这代孩子的“前额叶损伤”,可以这么养

新东方
2026-05-06 17:46:49
史诗级合作!英伟达联手康宁光连接扩产 10倍 5大供应商直接起飞

史诗级合作!英伟达联手康宁光连接扩产 10倍 5大供应商直接起飞

元芳说投资
2026-05-10 06:20:08
手机顶部出现这4个图标,马上关机!你的手机可能正在被人控制

手机顶部出现这4个图标,马上关机!你的手机可能正在被人控制

职场资深秘书
2026-05-10 13:51:21
中国运河进度89%!2026通江达海:俄方喜出望外,越南彻底焦虑了

中国运河进度89%!2026通江达海:俄方喜出望外,越南彻底焦虑了

潮鹿逐梦
2026-05-09 18:53:36
进去就没命!四川黄泉路有去无回,政府封禁400年,至今无解!

进去就没命!四川黄泉路有去无回,政府封禁400年,至今无解!

网络易不易
2026-04-19 14:59:01
从1-1到1-0!一次VAR判罚,或决定4队命运,曼城和阿森纳大悲大喜

从1-1到1-0!一次VAR判罚,或决定4队命运,曼城和阿森纳大悲大喜

梅亭谈
2026-05-11 02:05:06
基恩谈判罚:知道VAR会回看所有细节时就绝对不要对门将上手

基恩谈判罚:知道VAR会回看所有细节时就绝对不要对门将上手

懂球帝
2026-05-11 02:37:14
马克·库班购入球队股份,但并非达拉斯小牛队

马克·库班购入球队股份,但并非达拉斯小牛队

好火子
2026-05-11 05:58:19
新势力还咋吹!曝特斯拉满血FSD国内开测,连小鸟都能躲?

新势力还咋吹!曝特斯拉满血FSD国内开测,连小鸟都能躲?

小李车评李建红
2026-05-10 08:00:03
为什么女教师成了单身女的最重灾区?网友剖析一针见血,我明白了

为什么女教师成了单身女的最重灾区?网友剖析一针见血,我明白了

夜深爱杂谈
2026-04-27 22:11:39
马汀法国站夺冠,Aprilia包揽前三

马汀法国站夺冠,Aprilia包揽前三

赛场名场面
2026-05-10 21:04:49
31岁乌克兰女数学家23页证明,一周内连解两大世纪谜题!

31岁乌克兰女数学家23页证明,一周内连解两大世纪谜题!

補懂事的孩紙
2026-05-10 11:44:50
历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

听心堂
2026-03-31 15:52:04
2026-05-11 07:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15178文章数 66858关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

艺术
家居
数码
健康
时尚

艺术要闻

全国最值得去的八大最美古镇

家居要闻

菁英人居 全能豪宅

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

干细胞能让人“返老还童”吗

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

无障碍浏览 进入关怀版