网易首页 > 网易号 > 正文 申请入驻

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

0
分享至

Claw AI Lab团队
量子位 | 公众号 QbitAI

你还在一个人做科研吗?

科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。

一个人方向偏了没人提醒,遇到歧义没人讨论,结果不对只能反复试错。所谓的“自动科研”,很多也只是把这一切封装成一条无人参与的流水线——人被拿掉了,但问题没有变。

但真正高效的科研,从来不是流水线。它更像一个实验室:不同角色同时推进,不同路径并行展开,发现被共享,错误被更早暴露,方向在不断讨论中收敛。人始终在关键位置,做判断、给方向、改路径。



△clawailab.ai

由Liu Fayao(刘发耀,新加坡A*STAR研究科学家),Ye Deheng(叶德珩,前腾讯AI合伙人&首席专家)和Chen Tianrun(陈天润,魔芯科技创始人)带领的研究团队提出了Claw AI Lab

Claw AI Lab想做的,就是把这种协同方式变成一个可以运行的系统。你定义方向,多个agent协同推进,多个项目并行展开,过程持续演化;你可以随时介入、修正、回滚,让研究形成真正的闭环。

你不再是一个人做科研。

你是在带一个实验室,让研究自己运转起来。

金字塔式分层架构管理+用户友好UI

Claw AI Lab采用金字塔式分层架构,将科研流程拆解为从研究方向设定、方法设计与实验规划,到代码实现与结果分析的多层级体系,形成自上而下逐级细化的科研闭环。

每一层由专属Agent负责,通过任务队列与上下文紧密连接,使系统既具备全局规划能力,又能高效执行细节任务。同时,上层决策可根据下层实验结果动态调整,实现持续迭代与闭环优化。



△Claw AI Lab的操作界面

系统提供可视化操作界面,用户可以像PI一样定义研究课题、拆解任务,并实时查看各个Agent的执行状态与中间结果。复杂的科研流程被抽象为直观的操作与进度面板,大幅降低使用门槛。

同时支持三种模式

Lab讨论模式:多方向并行调研,跨方向讨论达成共识,生成统一假设。

Lab独立研究模式:多方向并行调研,各方向共享知识库独立生成假设,速度更快但无跨方向共识。

论文复现模式:单Agent全流程复现目标论文的方法与实验。

Claude Code Harness

如果说传统AI编程助手解决的是“写一段代码”,那么Claw Code Harness解决的是“把一个研究想法真正落成可运行实验”。

在Claw AI Lab里,模型不再一次性吐出代码片段,而是像工程师一样进入Turn Loop:先读取本地代码库、数据集和模型检查点,再迭代完成“理解任务、编写main.py、运行测试、定位报错、继续修复”的闭环。



△实验代码生成流程

更关键的是,系统会在运行环境中注入一个不可编辑的Experiment Harness,统一负责时间预算控制、指标上报、异常值校验,以及最终生成标准化的results.json。这意味着Claw不只是“会写代码”,而是在建立一条从想法到实验结果的可信执行链路,让AI生成的不是demo,而是真正能落地、能复现、能被继续优化的研究代码。

从“单一”智能体到“群体”智能

科研从来不是单打独斗的过程。真正重要的突破,往往诞生于反复的讨论、质疑与修正之中——一个想法被提出、被推翻、被重构,在多轮批判与协作中逐渐逼近正确答案。

想象以下场景:你创建了一个具身智能实验室,你是PI并且你有三名研究员,他们的方向分别是VLM、VLA和World Model。你希望研究一下具身智能里面最新的video action model最能落地的方向。



讨论前:



World Model研究员

主张worldmodel+边预测边做决策,认为可控性、安全性和在线重规划才是工业部署的关键;

VLA研究员

主张train with video, infer with action,认为训练时使用视频监督、执行时直接输出动作,才兼顾效率与闭环稳定;

VLM研究员

认为短期最容易落地的不是直接控制,而是任务理解、执行监控、异常预警和自动化,因为这些模块更容易进入真实系统。

在Claw AI Lab里,讨论并结合各家优缺点,收敛出更强的idea得出一套更优、更可部署的方案,如下:

  • 训练阶段,用视频监督学习更强的动态表征;
  • 执行阶段,保留直接动作输出,确保低时延闭环控制;
  • 系统上层,引入planning / safety layer做重规划和约束筛选;
  • 执行旁路,增加步骤理解、异常监控、anticipation和可解释推理,用于纠错、恢复和长期运维。

除此之外,在Claw AI Lab内,讨论不会只给一个“看起来合理”的答案,它还会把争议背后的原因挖掘出来。

争议一:人类视频到底该不该直接迁移到机器人动作?

共识:它的近中期最大价值在于预训练和中间表示,而不是直接替代低层动作监督。

争议二:为什么World Model和VLA有截然不同的主张?

共识:前者代表系统可控性与安全性,后者代表低时延执行效率,真正更稳健的路线不是二选一,而是把两者放进同一个分层闭环里。

所以,Claw AI Lab不只是“让多个agent一起说话”。它更像一次真正的组会,分歧被展开,假设被暴露,证据被对齐,路线被重组,最后产出更强的共识、更清晰的优先级,以及下一步真正值得验证的研究方向。

科研不再只是生成一个结果,而是一个由群体智能驱动、不断收敛和演化的过程。

Lab模式的项目结果示例

项目简介:这个项目旨在对大模型中的hallucination进行系统化量化,不仅判断结果是否出错,还深入到推理过程,识别错误是如何产生、如何传播的。其难点在于缺乏统一标准答案、错误往往具备“表面合理性”,且在多步推理中会被不断放大。为此,项目通过结构化拆解模型输出流程,引入多维度一致性与过程级分析,实现对hallucination的细粒度度量与定位,从而将这一长期依赖经验判断的问题,转化为可分析、可优化的工程问题。



论文复现模式的项目结果示例

项目简介:这个项目旨在在真实工程环境中复现PhyCustom在FLUX模型上的效果,不只是复现论文结果,更验证“物理属性可控生成”能否在复杂系统中稳定落地。其难点在于,物理属性难以被生成模型准确表达,同时复现过程对数据、训练细节和实现路径高度敏感,稍有偏差就可能导致结果失真甚至失效。为此,项目通过将方法嵌入完整的实验执行链路,对关键步骤进行约束与追踪,使每一次训练与生成都有可依赖的上下文与反馈,从而让复现过程从“不可控的试错”,转变为“可追踪的系统性验证”。



代码链接:
https://github.com/Claw-AI-Lab/Claw-AI-Lab
项目主页:
https://clawailab.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重要调整!央视直播CBA总决赛有变,广厦把握2个机会,或诞生奇迹

重要调整!央视直播CBA总决赛有变,广厦把握2个机会,或诞生奇迹

以茶带书
2026-06-02 14:29:45
董路再封神?足球小将杀入意大利杯决赛:6战全胜 小组赛狂轰14-0

董路再封神?足球小将杀入意大利杯决赛:6战全胜 小组赛狂轰14-0

风过乡
2026-06-02 07:55:13
韩股闪崩! KOSPI 5分钟跌超400点 SK海力士跌超4% LG跌超15%

韩股闪崩! KOSPI 5分钟跌超400点 SK海力士跌超4% LG跌超15%

每日经济新闻
2026-06-02 09:23:02
我手术需30万父母不理,公婆卖房救我,病好爸妈让我给弟拿200万

我手术需30万父母不理,公婆卖房救我,病好爸妈让我给弟拿200万

千秋历史
2026-05-28 19:46:33
土耳其站队了!正式向世界宣布:以色列若继续打加沙,会让他好看

土耳其站队了!正式向世界宣布:以色列若继续打加沙,会让他好看

傲傲讲历史
2026-05-31 09:18:17
荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

共工之锚
2026-06-01 13:17:56
快来看穿山甲带崽的视频!广东象头山已形成稳定可自我维持的繁殖种群

快来看穿山甲带崽的视频!广东象头山已形成稳定可自我维持的繁殖种群

新快报新闻
2026-06-01 22:55:10
济南这家知名火锅店突然停业闭店!同一品牌近一年多在济南已关门店超10家

济南这家知名火锅店突然停业闭店!同一品牌近一年多在济南已关门店超10家

齐鲁壹点
2026-06-02 15:56:47
张予曦,小荷才露尖尖角

张予曦,小荷才露尖尖角

东方不败然多多
2026-06-01 09:43:45
中美军方密谈了两天,谈完后才公布!真正让高市早苗哭的时刻到了

中美军方密谈了两天,谈完后才公布!真正让高市早苗哭的时刻到了

知法而形
2026-06-02 10:53:46
随着萨巴伦卡2-0淘汰大坂直美,法网女单四分之一决赛对阵出炉

随着萨巴伦卡2-0淘汰大坂直美,法网女单四分之一决赛对阵出炉

俯身冲顶
2026-06-02 07:28:45
Lisa世界杯单曲被骂低俗,近期路透图孕相十分明显,孩子生父成谜

Lisa世界杯单曲被骂低俗,近期路透图孕相十分明显,孩子生父成谜

花哥扒娱乐
2026-06-01 21:21:24
彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

火山詩话
2026-06-02 10:33:01
游泳运动员季新杰社媒发布自曝帖后秒删,随后称账号被盗

游泳运动员季新杰社媒发布自曝帖后秒删,随后称账号被盗

懂球帝
2026-06-02 16:02:50
985女性在相亲市场吃瘪男生掉头就走网友说:该校出品,必属精品

985女性在相亲市场吃瘪男生掉头就走网友说:该校出品,必属精品

黯泉
2026-06-02 14:24:23
华为“韬定律”又让国内的赢学家们自嗨起来

华为“韬定律”又让国内的赢学家们自嗨起来

廖保平
2026-06-01 12:30:02
烈日当头下,和尚躬身收麦!坚守祖训的白马寺,打了多少假僧脸?

烈日当头下,和尚躬身收麦!坚守祖训的白马寺,打了多少假僧脸?

削桐作琴
2026-06-02 15:27:07
《星际2》发布史诗级更新,玩家惊呼:这是星际3吧!

《星际2》发布史诗级更新,玩家惊呼:这是星际3吧!

热搜摘要官
2026-06-02 00:00:32
21次精准命中!CNN曝AI接管战争,俄军“百公里安全区”一夜崩塌

21次精准命中!CNN曝AI接管战争,俄军“百公里安全区”一夜崩塌

小小科普员
2026-06-01 16:20:46
人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

潮鹿逐梦
2026-06-01 22:43:07
2026-06-02 19:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
12727文章数 176476关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

5岁儿子29万存款被妈妈取到剩40块 爸爸起诉法院判了

头条要闻

5岁儿子29万存款被妈妈取到剩40块 爸爸起诉法院判了

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
亲子
手机
本地
公开课

艺术要闻

周杰伦花 1.36 亿拍下这幅画

亲子要闻

闪闪小葵花成长正当时

手机要闻

曝华为畅享100 Pro Max已立项:代号“叶问”,预计年底前后登场

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版