网易首页 > 网易号 > 正文 申请入驻

丛乐/王梦迪再出手!打造首个AI-XR协同科学家,可实时指导和纠偏

0
分享至

这对华人学术伉俪再次出手!美国斯坦福大学教授丛乐和美国普林斯顿大学教授王梦迪二人和团队以及合作者研发出一款名为 LabOS 的 AI 应用,并在相关论文中表示 LabOS 是业内首个 Al-XR Co-Scientist。他们在论文中写道:“LabOS 可以充当 AI 导师,指导新手达到专家级水平,无需进行手把手培训或长时间试错。”假如一个真人科学家进入实验室却没遵循无菌操作规范?或者一个真人科学家的试剂孵育时间与标准方案不符?LabOS 都会记下这些操作偏差并提供指导。而当向 LabOS 提供实验记录和参考方案的时候,它不仅能够识别每个步骤,还能生成分步指导,更能将实验操作和参考方案进行匹配,必要时还能做出情境感知警告,并能给出下一步操作的建议,这意味着 LabOS 已经具备在真实湿实验室中开展科研工作的能力。更关键的是,随着使用时间的叠加以及测试时扩展系统性能的提升,LabOS 能够实现自我进化,这让它拥有像真人科学家一样的成长规律,从而能够持续应对科研探索中的新挑战。


(来源:https://arxiv.org/pdf/2510.14861)

在构造上,LabOS 集成了多模型 AI 智能体、智能眼镜与人机协作界面,这让 LabOS 能够观察到真人科学家所看到的内容,以及让 LabOS 能够理解实验情境并提供实时辅助。研究中,本次团队通过癌症免疫学、生物机制研究和干细胞工程这三项生物医学研究方向展现了 LabOS 的能力。

在癌症免疫学的案例中,他们要求 LabOS 去发现一个癌症免疫治疗靶点,为此他们先是让 LabOS 生成假设,并通过多步推理分析进行靶点识别,期间 AI 智能体推荐将 CEACAM6 作为推定靶点,随后他们在增强自然杀伤细胞抗肿瘤活性的实验中验证了这一靶点。

在生物机制研究的案例中,他们利用 LabOS 成功识别出了能够调控细胞融合的基因 ITSN1。

在干细胞工程的案例中,他们通过佩戴智能眼镜来与 LabOS 进行交互,每隔 5 秒-10 秒 LabOS 都能将第一人称视角的数据流传输到服务器并能调用视觉语言模型(VLM,Vision-Language-Model)智能体。


(来源:https://arxiv.org/pdf/2510.14861)

LabOS 的本领也获得了第三方的认可。在 Humanity's Last Exam 中,LabOS 达到大约 32% 的最高准确率;在 LAB-Bench: DBQA 和 LAB-Bench: LitQA 中,LabOS 分别达到 61% 与 65% 的最高准确率,较次优模型最高高出 8%。其中,Humanity's Last Exam 是一个由全球近千名领域专家共同打造的多模态基准测试,涵盖数学、自然科学和人文社科等上百个学科的数千个高难度问题。


(来源:https://arxiv.org/pdf/2510.14861)

既然 LabOS 是一个 XR Co-Scientist,那么它的人机交互必然要通过 XR 界面进行。当前,市面上的 XR 硬件基本都支持界面渲染、手势识别以及运行 Unity/Android 应用成语。基于此,在使用 LabOS 的时候,既可以将眼镜数据流传输到本地 GPU 服务器,也可以将眼镜数据流传输到云端,从而进行实时的智能体推理。当本地 GPU 服务器接收到 5 秒-10 秒的短视频片段之后,就能将视频转发到 LabOS AI 智能体进行分析和推理,并能将结构化的 JSON 输出返回到 XR 眼镜,在 JSON 信息获得解析之后,就能为真人科学家提供实时的视觉反馈与音频反馈。

研究中,该团队分别测试了 AR/XR 眼镜和 VR/XR 头显,其中 AR/XR 眼镜的效果更好。原因在于,AR/XR 眼镜拥有开放式的周边视野,其重量一般低于 85 克可以确保真人佩戴的舒适度,同时支持 2 小时以上的续航时间,以及支持 6 自由度和手势识别的三维感知人机交互。通过 AR/XR 智能眼镜界面和实时多模态感知,LabOS 可以将 AI 推理直接连接到实验室,使用时只需佩戴 XR 眼镜即可获得 AI 智能体提供的自适应情境感知指导,这些指导包括分布指令、错误检测与修正提示,甚至包括适用于无菌流程的手势或语音交互。

为了让 LabOS 具备“实验室视觉”,研究人员收集了 200 余段他们在真实实验中使用相机和佩戴智能眼镜时拍摄的第一人称视角视频,基于此合成了一个名为 LabSuperVision(LSV)的基准数据集,以用于评估 AI 模型的实验室感知能力和实验室推理能力。研究人员在论文中写道,LSV 是一个由真人标注的实验室视频数据集,能被用于实验室操作视频的理解和推理设计。LSV 中包含 200 个高质量的视频会话,每个视频的长度一般在 2 分钟-10 分钟,最长的达到 45 分钟,这些视频会话由 7 名真人科学家在仪器区、试验台和组织培养室等实验室场景录制,确保捕捉到了真实的科研操作过程。


(来源:https://arxiv.org/pdf/2510.14861)

由于一些主流 AI 模型在 LSV 上数据集表现较为平淡,所以研究人员使用了一些公开的科研实验视频、他们自己内部录制的数据以及真人标注的数据来针对 VLM 进行后期训练。通过此,他们打造出一款名为 LabOS VLM 的模型,该模型可以解析 XR 眼镜的视觉输入,并能将视觉嵌入和语言模型加以对齐,从而能够针对和实验室场景相关的视频进行解读和推理,这让 LabOS 能够监控操作、检测偏差和验证结果,以及能将多模态数据流与其他科研方案进行同步,这让 LabOS 能以协研科学家的身份真正地在实验室中实现感知、理解与协同操作。LabOS 还支持科研工作流程的三维空间建模和四维空间建模,能够捕获仪器、样品和真人操作之间的时空关系,并能实现过程回放、假设分析和基于模拟的培训。


(来源:https://arxiv.org/pdf/2510.14861)

据了解,LabOS 采用多智能体推理架构,其中包含规划、开发、评审和工具创建等智能体,它们可以共同执行假设生成、实验设计、数据分析和自适应改进。LabOS 还具备自我进化的能力,通过基于网络搜索、科学文献和相关数据它可以自主生成一种名为“工具海洋”的模块,从而能够不断扩展分析能力。这种自我进化的特性让 LabOS 尤其擅长通过推理时扩展来解决新的科研课题。基于此,LabOS 让科研实验室具备了 AI 可感知能力和 AI 可操作能力,故能被用于干实验推理的智能体 AI 系统,也能和支持 XR 的多模态人机协同湿实验操作界面相集成,借此创建一个端到端的框架,从而能够连接假设生成、实验设计、物理验证和自动文档记录。


图 | 相关论文(来源:https://arxiv.org/pdf/2510.14861)

从相关论文可知,LabOS 希望解决的问题是:科学成果的诞生依赖于以下两个相互关联的领域:第一个是提出预测或猜想的计算领域,第二个是能够证明猜想的实验领域。近年来,AI 通过加速模拟、预测和设计已经彻底改变了计算领域,但物理实验室依然是未能被 AI“攻克的山头”。此前,AI 在感知能力、协调性和重复性上仍然存在一定不足,而科研实验结果往往要依赖于那些难以从人类这里“继承”给 AI 的真人操作技能。与此同时,此前的智能体 AI 主要活跃在数字领域,即根据文本、数据和模拟来规划实验和合成工具。但是,智能体 AI 无法感知动态实验室环境,更无法进行实际操作。另一方面,类似于实验室机械臂之类的自动化机器人固然具备一定能力,但大多必须遵循已被设计好的规则,这不仅导致重新部署的成本较高,而且很难适应真实科研环境的变化。

而 LabOS 通过多模态感知、自主进化智能体以及 XR 赋能的人机协作,将计算推理与物理实验融为一体。如前所述,LabOS 已能在癌症免疫治疗靶点和干细胞工程等领域得到应用,这表明 LabOS 能够突破计算设计的局限,直接地参与实验过程,从而能将真实世界中的科研实验室转变为人类与机器共同进化、智能协作的发现场域。

参考资料:

论文原文https://arxiv.org/pdf/2510.14861

https://ece.princeton.edu/people/mengdi-wang

https://profiles.stanford.edu/186687

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男方花30多万“闪婚”,新娘竟背负巨债!婚介查征信只是靠……

男方花30多万“闪婚”,新娘竟背负巨债!婚介查征信只是靠……

福建第一帮帮团
2025-11-01 19:04:21
江苏省委书记、省长,分别为“苏超”冠亚军颁奖

江苏省委书记、省长,分别为“苏超”冠亚军颁奖

新京报政事儿
2025-11-01 22:31:25
中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

叮当当科技
2025-11-02 00:09:19
百病不离肝!对肝脏最好的3种食物,一周吃2次,养肝护肝,别错过

百病不离肝!对肝脏最好的3种食物,一周吃2次,养肝护肝,别错过

阿龙美食记
2025-10-30 11:53:11
广东男篮揭幕战!杜锋拒绝输球,胡明轩全力出击,央视直播

广东男篮揭幕战!杜锋拒绝输球,胡明轩全力出击,央视直播

体坛瞎白话
2025-11-02 08:27:53
为什么现在主流舆论要反对躺平

为什么现在主流舆论要反对躺平

大刘说说
2025-11-01 14:41:36
中企正式宣布!回购中国已购光刻机,外媒:ASML专利权或不保

中企正式宣布!回购中国已购光刻机,外媒:ASML专利权或不保

混沌录
2025-11-01 16:25:05
刘强东吐槽朋友圈照片:这是谁拍的?害得我在老婆面前抬不起头!

刘强东吐槽朋友圈照片:这是谁拍的?害得我在老婆面前抬不起头!

可乐谈情感
2025-11-02 08:13:01
拿纸巾擦拭歼-20?美军看完目瞪口呆,答案就在1丝米隐身涂层上

拿纸巾擦拭歼-20?美军看完目瞪口呆,答案就在1丝米隐身涂层上

梁讯
2025-11-02 05:05:21
一场4-3,苏超大结局,奖金分配:第8名仅4万,网友:苏大强呢

一场4-3,苏超大结局,奖金分配:第8名仅4万,网友:苏大强呢

大秦壁虎白话体育
2025-11-01 23:18:21
悲情!南通队一赛季就输了一场球:全员呆立+泪洒现场 曾4-0泰州

悲情!南通队一赛季就输了一场球:全员呆立+泪洒现场 曾4-0泰州

风过乡
2025-11-01 22:19:22
从选调生提拔为区委常委,“85后”蔡哲分享成长历程

从选调生提拔为区委常委,“85后”蔡哲分享成长历程

新京报政事儿
2025-11-02 10:34:57
大反转!明天抵达江苏!

大反转!明天抵达江苏!

江南晚报
2025-11-02 02:05:27
澎湃江苏公众号发文:抱歉,确实没提前准备泰州夺冠的稿子

澎湃江苏公众号发文:抱歉,确实没提前准备泰州夺冠的稿子

懂球帝
2025-11-01 23:30:56
中国商务部就安世半导体问题表态,罕见措辞引发国际关注

中国商务部就安世半导体问题表态,罕见措辞引发国际关注

一个有灵魂的作者
2025-11-01 16:15:43
“台独”沈伯洋被立案 郭正亮:全台几百万人鼓掌

“台独”沈伯洋被立案 郭正亮:全台几百万人鼓掌

看看新闻Knews
2025-11-02 00:17:04
“为了孩子吃上饭,自己只能靠喝水撑着”!政府“停摆”满月, 4200万美国人吃饭成问题,多少个“截止日期”被错过了

“为了孩子吃上饭,自己只能靠喝水撑着”!政府“停摆”满月, 4200万美国人吃饭成问题,多少个“截止日期”被错过了

每日经济新闻
2025-11-01 17:49:10
200万吨大豆烂港!巴西赌中国离不开它,中国在48小时之内反杀!

200万吨大豆烂港!巴西赌中国离不开它,中国在48小时之内反杀!

未曾青梅
2025-10-26 23:56:58
豪门狂欢夜:拜仁15连胜创历史 阿森纳夺9连胜 利物浦2-0+皇马4-0

豪门狂欢夜:拜仁15连胜创历史 阿森纳夺9连胜 利物浦2-0+皇马4-0

侃球熊弟
2025-11-02 04:00:22
王家卫录音门事件不断发酵,大导演其实挺恶心,众多明星卷入其中

王家卫录音门事件不断发酵,大导演其实挺恶心,众多明星卷入其中

花哥扒娱乐
2025-11-01 20:51:32
2025-11-02 11:08:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15806文章数 514254关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

妻儿3人被丈夫发小杀害 妻子指甲里有凶手的DNA

头条要闻

妻儿3人被丈夫发小杀害 妻子指甲里有凶手的DNA

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

离世的他曾是刘德华张学友御用班底

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

教育
家居
艺术
手机
公开课

教育要闻

收藏!2026山东高考报名日程表!18日缴费!第7条公安类院校、专项计划特别注意!

家居要闻

吸睛艺术 富有传奇色彩

艺术要闻

隈研吾翻车?设计了武汉酒店,网友:像一栋“凉席大厦”

手机要闻

红米Turbo 5再次被确认:9000mAh电池+100W闪充,能否接棒K系列?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版