网易首页 > 网易号 > 正文 申请入驻

丛乐/王梦迪再出手!打造首个AI-XR协同科学家,可实时指导和纠偏

0
分享至

这对华人学术伉俪再次出手!美国斯坦福大学教授丛乐和美国普林斯顿大学教授王梦迪二人和团队以及合作者研发出一款名为 LabOS 的 AI 应用,并在相关论文中表示 LabOS 是业内首个 Al-XR Co-Scientist。他们在论文中写道:“LabOS 可以充当 AI 导师,指导新手达到专家级水平,无需进行手把手培训或长时间试错。”假如一个真人科学家进入实验室却没遵循无菌操作规范?或者一个真人科学家的试剂孵育时间与标准方案不符?LabOS 都会记下这些操作偏差并提供指导。而当向 LabOS 提供实验记录和参考方案的时候,它不仅能够识别每个步骤,还能生成分步指导,更能将实验操作和参考方案进行匹配,必要时还能做出情境感知警告,并能给出下一步操作的建议,这意味着 LabOS 已经具备在真实湿实验室中开展科研工作的能力。更关键的是,随着使用时间的叠加以及测试时扩展系统性能的提升,LabOS 能够实现自我进化,这让它拥有像真人科学家一样的成长规律,从而能够持续应对科研探索中的新挑战。


(来源:https://arxiv.org/pdf/2510.14861)

在构造上,LabOS 集成了多模型 AI 智能体、智能眼镜与人机协作界面,这让 LabOS 能够观察到真人科学家所看到的内容,以及让 LabOS 能够理解实验情境并提供实时辅助。研究中,本次团队通过癌症免疫学、生物机制研究和干细胞工程这三项生物医学研究方向展现了 LabOS 的能力。

在癌症免疫学的案例中,他们要求 LabOS 去发现一个癌症免疫治疗靶点,为此他们先是让 LabOS 生成假设,并通过多步推理分析进行靶点识别,期间 AI 智能体推荐将 CEACAM6 作为推定靶点,随后他们在增强自然杀伤细胞抗肿瘤活性的实验中验证了这一靶点。

在生物机制研究的案例中,他们利用 LabOS 成功识别出了能够调控细胞融合的基因 ITSN1。

在干细胞工程的案例中,他们通过佩戴智能眼镜来与 LabOS 进行交互,每隔 5 秒-10 秒 LabOS 都能将第一人称视角的数据流传输到服务器并能调用视觉语言模型(VLM,Vision-Language-Model)智能体。


(来源:https://arxiv.org/pdf/2510.14861)

LabOS 的本领也获得了第三方的认可。在 Humanity's Last Exam 中,LabOS 达到大约 32% 的最高准确率;在 LAB-Bench: DBQA 和 LAB-Bench: LitQA 中,LabOS 分别达到 61% 与 65% 的最高准确率,较次优模型最高高出 8%。其中,Humanity's Last Exam 是一个由全球近千名领域专家共同打造的多模态基准测试,涵盖数学、自然科学和人文社科等上百个学科的数千个高难度问题。


(来源:https://arxiv.org/pdf/2510.14861)

既然 LabOS 是一个 XR Co-Scientist,那么它的人机交互必然要通过 XR 界面进行。当前,市面上的 XR 硬件基本都支持界面渲染、手势识别以及运行 Unity/Android 应用成语。基于此,在使用 LabOS 的时候,既可以将眼镜数据流传输到本地 GPU 服务器,也可以将眼镜数据流传输到云端,从而进行实时的智能体推理。当本地 GPU 服务器接收到 5 秒-10 秒的短视频片段之后,就能将视频转发到 LabOS AI 智能体进行分析和推理,并能将结构化的 JSON 输出返回到 XR 眼镜,在 JSON 信息获得解析之后,就能为真人科学家提供实时的视觉反馈与音频反馈。

研究中,该团队分别测试了 AR/XR 眼镜和 VR/XR 头显,其中 AR/XR 眼镜的效果更好。原因在于,AR/XR 眼镜拥有开放式的周边视野,其重量一般低于 85 克可以确保真人佩戴的舒适度,同时支持 2 小时以上的续航时间,以及支持 6 自由度和手势识别的三维感知人机交互。通过 AR/XR 智能眼镜界面和实时多模态感知,LabOS 可以将 AI 推理直接连接到实验室,使用时只需佩戴 XR 眼镜即可获得 AI 智能体提供的自适应情境感知指导,这些指导包括分布指令、错误检测与修正提示,甚至包括适用于无菌流程的手势或语音交互。

为了让 LabOS 具备“实验室视觉”,研究人员收集了 200 余段他们在真实实验中使用相机和佩戴智能眼镜时拍摄的第一人称视角视频,基于此合成了一个名为 LabSuperVision(LSV)的基准数据集,以用于评估 AI 模型的实验室感知能力和实验室推理能力。研究人员在论文中写道,LSV 是一个由真人标注的实验室视频数据集,能被用于实验室操作视频的理解和推理设计。LSV 中包含 200 个高质量的视频会话,每个视频的长度一般在 2 分钟-10 分钟,最长的达到 45 分钟,这些视频会话由 7 名真人科学家在仪器区、试验台和组织培养室等实验室场景录制,确保捕捉到了真实的科研操作过程。


(来源:https://arxiv.org/pdf/2510.14861)

由于一些主流 AI 模型在 LSV 上数据集表现较为平淡,所以研究人员使用了一些公开的科研实验视频、他们自己内部录制的数据以及真人标注的数据来针对 VLM 进行后期训练。通过此,他们打造出一款名为 LabOS VLM 的模型,该模型可以解析 XR 眼镜的视觉输入,并能将视觉嵌入和语言模型加以对齐,从而能够针对和实验室场景相关的视频进行解读和推理,这让 LabOS 能够监控操作、检测偏差和验证结果,以及能将多模态数据流与其他科研方案进行同步,这让 LabOS 能以协研科学家的身份真正地在实验室中实现感知、理解与协同操作。LabOS 还支持科研工作流程的三维空间建模和四维空间建模,能够捕获仪器、样品和真人操作之间的时空关系,并能实现过程回放、假设分析和基于模拟的培训。


(来源:https://arxiv.org/pdf/2510.14861)

据了解,LabOS 采用多智能体推理架构,其中包含规划、开发、评审和工具创建等智能体,它们可以共同执行假设生成、实验设计、数据分析和自适应改进。LabOS 还具备自我进化的能力,通过基于网络搜索、科学文献和相关数据它可以自主生成一种名为“工具海洋”的模块,从而能够不断扩展分析能力。这种自我进化的特性让 LabOS 尤其擅长通过推理时扩展来解决新的科研课题。基于此,LabOS 让科研实验室具备了 AI 可感知能力和 AI 可操作能力,故能被用于干实验推理的智能体 AI 系统,也能和支持 XR 的多模态人机协同湿实验操作界面相集成,借此创建一个端到端的框架,从而能够连接假设生成、实验设计、物理验证和自动文档记录。


图 | 相关论文(来源:https://arxiv.org/pdf/2510.14861)

从相关论文可知,LabOS 希望解决的问题是:科学成果的诞生依赖于以下两个相互关联的领域:第一个是提出预测或猜想的计算领域,第二个是能够证明猜想的实验领域。近年来,AI 通过加速模拟、预测和设计已经彻底改变了计算领域,但物理实验室依然是未能被 AI“攻克的山头”。此前,AI 在感知能力、协调性和重复性上仍然存在一定不足,而科研实验结果往往要依赖于那些难以从人类这里“继承”给 AI 的真人操作技能。与此同时,此前的智能体 AI 主要活跃在数字领域,即根据文本、数据和模拟来规划实验和合成工具。但是,智能体 AI 无法感知动态实验室环境,更无法进行实际操作。另一方面,类似于实验室机械臂之类的自动化机器人固然具备一定能力,但大多必须遵循已被设计好的规则,这不仅导致重新部署的成本较高,而且很难适应真实科研环境的变化。

而 LabOS 通过多模态感知、自主进化智能体以及 XR 赋能的人机协作,将计算推理与物理实验融为一体。如前所述,LabOS 已能在癌症免疫治疗靶点和干细胞工程等领域得到应用,这表明 LabOS 能够突破计算设计的局限,直接地参与实验过程,从而能将真实世界中的科研实验室转变为人类与机器共同进化、智能协作的发现场域。

参考资料:

论文原文https://arxiv.org/pdf/2510.14861

https://ece.princeton.edu/people/mengdi-wang

https://profiles.stanford.edu/186687

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!深圳一上市公司董事长,被安徽颍上县监察委立案调查,并实施管护,上月他还向大学捐赠王阳明雕像

突发!深圳一上市公司董事长,被安徽颍上县监察委立案调查,并实施管护,上月他还向大学捐赠王阳明雕像

每日经济新闻
2025-11-03 23:30:08
墨西哥牛油果之都市长怀抱幼子被当众枪杀,曾誓言根除贩毒集团,该州4年7位市长遇害

墨西哥牛油果之都市长怀抱幼子被当众枪杀,曾誓言根除贩毒集团,该州4年7位市长遇害

红星新闻
2025-11-03 14:06:23
演都不演了!全红婵复出夺冠不到24小时,三大恶心情况发生了

演都不演了!全红婵复出夺冠不到24小时,三大恶心情况发生了

丁丁鲤史纪
2025-11-03 14:55:34
突发!美国海军船厂发生大规模械斗死伤惨重,核航母潜艇受损!

突发!美国海军船厂发生大规模械斗死伤惨重,核航母潜艇受损!

李博世财经
2025-11-03 17:17:48
要熬多久,我们的经济才能反弹?

要熬多久,我们的经济才能反弹?

流苏晚晴
2025-11-03 19:04:51
李在明支持率53%,高市早苗支持率82%

李在明支持率53%,高市早苗支持率82%

天真无牙
2025-11-03 13:32:06
工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

大道微言
2025-11-01 08:58:16
00年空姐女神!超模身材+明星脸,这身材颜值真的绝了,你喜欢吗

00年空姐女神!超模身材+明星脸,这身材颜值真的绝了,你喜欢吗

素然追光
2025-10-17 02:45:03
伊朗披露哈马斯前领导人哈尼亚遇刺细节:一枚导弹“击穿窗户”,他当时正在打电话

伊朗披露哈马斯前领导人哈尼亚遇刺细节:一枚导弹“击穿窗户”,他当时正在打电话

环球网资讯
2025-11-03 19:44:58
从张家界赤裸裸搞钱的所长到怀化蛮横扣人的所长,都有湘西遗风

从张家界赤裸裸搞钱的所长到怀化蛮横扣人的所长,都有湘西遗风

细雨中的呼喊
2025-11-03 12:02:05
10岁患儿被切除6个器官迎来反转!舆论从网暴医生,转为网暴父母

10岁患儿被切除6个器官迎来反转!舆论从网暴医生,转为网暴父母

垛垛糖
2025-11-03 14:51:45
卫冕冠军遭绝杀!全运会浙江0-1 末轮不胜山东=出局 王钰栋被换下

卫冕冠军遭绝杀!全运会浙江0-1 末轮不胜山东=出局 王钰栋被换下

我爱英超
2025-11-03 18:46:32
四川:完全赞成、坚决拥护

四川:完全赞成、坚决拥护

新京报政事儿
2025-11-03 18:55:01
特朗普访华安排有变,他提出的时间表,中方不同意,推迟了2个月

特朗普访华安排有变,他提出的时间表,中方不同意,推迟了2个月

影孖看世界
2025-11-03 18:41:30
国民党主席位置坐稳,郑丽文摊牌了:两岸不回归和平,其他是侈谈

国民党主席位置坐稳,郑丽文摊牌了:两岸不回归和平,其他是侈谈

晓鰀爱八卦
2025-11-02 13:48:27
3换3!交易彻底失败!西部最烂球队诞生

3换3!交易彻底失败!西部最烂球队诞生

篮球实战宝典
2025-11-04 00:03:53
台湾问题已接近“临界点”,两大信号已释放,大陆可能要动手了!

台湾问题已接近“临界点”,两大信号已释放,大陆可能要动手了!

小lu侃侃而谈
2025-11-03 19:21:05
正式签协议前,美代表翻脸了,将继续对华调查,我外交部斩钉截铁

正式签协议前,美代表翻脸了,将继续对华调查,我外交部斩钉截铁

玉涵简书
2025-11-03 15:33:06
疑似张智栋前同事发文:北大高材生,成为世界闻名大毒枭

疑似张智栋前同事发文:北大高材生,成为世界闻名大毒枭

吃瓜体
2025-11-03 11:15:35
美交通部长称或因政府“停摆”关闭空域

美交通部长称或因政府“停摆”关闭空域

界面新闻
2025-11-03 22:37:43
2025-11-04 04:00:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15815文章数 514261关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

日本组建特种作战旅 主要面向海外作战

头条要闻

日本组建特种作战旅 主要面向海外作战

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

男导演曝丑闻 蒋欣的含金量还在上升

财经要闻

最新省市GDP:谁在飙升,谁掉队了?

汽车要闻

环比增长28.7% 方程豹品牌10月销量31052辆

态度原创

教育
本地
时尚
旅游
公开课

教育要闻

康熙身边的洋顾问

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

这些才是适合普通人的穿搭!多穿基础款和半身裙,简约又得体

旅游要闻

湖光塔影 小众公园影湖楼

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版