“留声不如留影,留影不如留形。”这是留形科技(Manifold Tech)的口号。
在具身智能与数字化浪潮席卷的当下,音频与二维影像已难以满足物理世界向数字空间映射的深度需求。
尤其是对于行进中的机器人,或是需要精准复刻的现实场景而言,包含深度、尺寸与空间逻辑的三维“形”数据,是构建空间感知的基石。它既是数字世界的底图,也是机器进入真实世界的“空间语言”。
依托在激光雷达(LiDAR)、SLAM(即时定位与地图构建)及机器人导航领域的经验积累,留形科技创始人秦佑铭、徐威等人带领团队走出了一条“算法驱动硬件轻量化”的道路。
他们用算法与系统工程能力降低对高成本硬件的依赖,把过去昂贵、笨重、强项目制的高精度三维能力,变成可规模化落地的工具与模组。
在这一理念驱动下,留形科技形成了双线并行的技术版图:
在三维重建领域,留形将测绘级能力下沉。推出 MindPalace(留形机)等手持扫描设备,面向林业调查、古迹保护、泛测绘、建筑家装等场景,以更低门槛、更高效率的方式生产可交付的三维成果,让“三维数据获取”从项目制走向工具化、规模化。
![]()
图 | 留形机器人部署全家桶 (来源:留形科技)
而在机器人领域,他们将自身定位为机器人的“海马体”供应者。通过 Odin 系列模组为具身智能体提供稳定、连续、可重定位的空间感知与空间记忆能力,让机器人在真实复杂环境中不“迷路”、不“失忆”,并能更自然地与语言与语义系统协同。
![]()
图 | 留形产品Odin1 (来源:留形科技)
留形的技术也已在大型活动中参与机器人部署与场地三维建模,目前团队正在探索更多真实世界的落地场景,解锁更多空间智能的可能性。
近日,问芯与留形科技舒俊源博士进行了一场对话,围绕团队的产品线布局及其在空间智能与机器人感知领域的核心技术理念交换了见解。
以下是对话内容(有删减,但未改变原意):
从春晚舞台走向楼梯间
问芯: 听说今年春晚的机器人的扭秧歌表演使用了留形的产品。你们的技术为机器人提供了哪些支持?能否举例说明具体细节?
舒俊源: 我们主要承担的是春晚场地三维建模与部署底图的生产工作:把现场空间一比一还原到数字世界,形成可用的三维底图,用于机器人部署阶段的定位与走位规划。对于机器人而言,部署前的地图质量决定了它在舞台上的走位、站位、上场和退场是否“稳”、是否“准”、是否可复现。
问芯:既然谈到了机器人,你能再举一些具体的例子吗?我们的产品具体能为机器人的行动带来哪些改变?
舒俊源:我们看到很多服务机器人——送餐、酒店、外卖配送——仍主要工作在“二维平面”范式里,更多依赖轮式底盘在平整地面运行。一旦进入更复杂的真实空间,比如室内外穿行、存在台阶、起伏地面、窄通道、低特征长走廊等场景,传统方案就容易出现定位漂移、重定位失败或行为不稳定。
而留形的思路是:先把机器人最核心、最难的一层补齐——稳定的空间感知与空间记忆。这样机器人在复杂场景里仍能保持高可靠的定位与避障能力,具备更强的连续性与可控性。我们也发布过一些演示视频,比如机器人在办公场景中自主递送物品,替代重复的人力动作;以及在隧道等“低特征”环境中,依然能够维持稳定建图与定位能力——这类场景在真实机器人应用中非常普遍。
问芯:刚才提到的隧道场景,在技术开发中算不算是一种挑战极限的场景?
舒俊源:是的,我们统称为“退化场景”。比如狭窄楼梯间、长距离直道隧道等,都属于传统建图与定位算法的“高风险区”。在长隧道中,结构特征高度重复,机器人虽在前进,但从传感器观测上有效信息量很低,传统方法容易出现定位约束不足、漂移累积、回环难以形成等问题。
针对这些痛点,我们在多传感器融合与系统工程上做了深度优化,形成更适配真实环境的鲁棒方案。我们在这一领域投入了很大精力,因为退化场景并不是“少数极端”,而是机器人走向真实世界时绕不开的日常。
问芯:除了辅助具身智能,你们的技术在空间重建上也有很广泛的应用。你们的技术与传统的三维重建技术相比,有哪些独特之处?
舒俊源:传统测绘往往使用全站仪等设备做点对点测量,更多得到的是离散测量点的空间位置与距离信息;无人机倾斜摄影适用于室外大范围测绘,但对室内环境、复杂遮挡、光照与作业限制等仍有天然边界。这些方式在许多场景下时间成本高、交付链路重,往往只能以“项目制服务”方式提供,限制了终端用户自己使用与规模化落地。
留形想做的是“反过来”:把测绘级能力下沉为人人可用的工具。今天使用我们的手持三维扫描设备,很多过去需要专业团队长周期完成的工作,可以以更快的速度完成数据采集并形成可用成果。我们希望让三维建模摆脱繁琐的项目制模式——让更多行业用户真正用得起、用得顺、用得出结果。
问芯:你们是如何实现在这么小的载体内,在如此短的时间内处理高密度的空间信息的?
舒俊源:核心是多传感器融合:激光雷达、视觉相机、IMU 等协同工作。同时我们推出了 MindSLAM 多传感器融合算法,通过时间同步、几何一致性约束与鲁棒估计,使系统在降低算力依赖的同时,获得高密度、高效率与更稳定的建图与定位能力。这既来自算法,也来自工程化的系统设计。
问芯:它就像“海马体”一样承担了感知和记忆的功能。
舒俊源:没错。我们一直用“海马体”做比喻:如果一个动物失去海马体,会丧失方向感与空间记忆。机器人也一样——没有稳定的空间记忆,就难以在真实世界长期连续地行动。我们的目标是让机器人获得更可靠的空间感知与空间记忆能力,从而支撑导航、重定位、任务执行乃至更高层的语义理解与交互。
问芯: 近两年来,主流媒体主要关注模型和算力。相比之下,你认为空间智能是否被低估?
舒俊源:空间智能与具身智能是紧密耦合的。模型解决“理解与生成”,空间智能解决“落地与行动”——机器人要真正进入真实世界,必须具备稳定的空间感知、持续建图与可靠重定位能力。未来大模型与空间智能会深度结合:空间智能提供三维底图与稳定状态估计,大模型提供语义、规划与交互能力,两者共同构成具身智能的核心基础设施。
让每个人成为三维建模专家:两条产品线的定位
问芯: 请介绍一下你们的产品体系。不同类型产品的核心用户是谁?如何满足他们的需求?
舒俊源:我们有两条产品线:空间智能(MindPalace留形机)和机器人(Odin 奥丁之眼)。
MindPalace 用于三维建模与数字化底图生产,应用涵盖林业、矿业、建筑家装、古迹保护,以及影视游戏等领域。它的成果也可以与头显设备如 Vision Pro、VR/AR 结合,形成更沉浸的空间体验。随着具身智能发展,MindPalace也被越来越多用于机器人任务的地图构建、训练真值获取与快速部署。
机器人方向的主要产品是 Odin 系列:我们把它定位为具身智能体的“感知与记忆底座”,为机器人提供空间感知、空间记忆与重定位能力,并支持上层导航栈与语义能力更快落地。
问芯:我看我们最近推出了新产品 Q9000,它的价格做到了千元级别,这对于行业来说意味着什么?
舒俊源:传统高端扫描设备普遍昂贵,且系统复杂,往往以项目制交付为主。我们推出 Q9000 的初衷,是让操作更简单,让三维扫描真正成为终端用户的生产力工具。
通过算法优化以及依托成熟的供应链体系,我们把价格打到更可普及的区间(万元以内)。我们希望提升产品普适性:用更便捷的体验和更可接受的成本,让三维建模不再局限于高端专业领域,让更多行业用户能更低门槛地获得可交付的三维成果。
问芯:既然价格降到了这个区间,背后肯定做了大量的成本优化。在优化过程中,我们舍弃了什么?
舒俊源: 核心逻辑是“算法主导降本”。过去某些能力需要依赖非常昂贵的高性能传感器与复杂链路,我们通过多传感器融合与系统设计,在可控硬件成本下依然获得用户最关心的核心体验:系统稳定性、抗退化能力、赋色一致性与快速建模效率。Q9000 主打工具属性,覆盖大量“需要快速、低成本获得三维数据”的场景需求。
问芯:目前产品还有哪些可以进一步完善或提升的空间?
舒俊源:关键在于深入行业工作流,提供垂直细分能力。比如林业的树高与特征标注、家装的CAD测绘与一键出图,以及横截面测量、噪点处理、物体滤除等能力都在持续推进。我们的目标是把三维设备真正做成“像手机一样好用”的工具:快速采集、快速处理、快速交付。
下一步,让机器人“自主探索”
问芯:最近“世界模型”非常火热,你认为它与你强调的“空间智能”有什么区别和联系?
舒俊源:世界模型更多体现的是 AI 在逻辑推理和认知层面的能力,而我们更关注机器人在真实物理世界中行动所必需的三维空间底座能力。两者的目标是一致的,都是让机器人更好地理解世界,只是关注的层级不同。
我们强调的“空间智能”,是让机器人在统一的坐标系中完成感知、定位、记忆与行动,把空间关系真正变成可计算、可执行的基础能力。在这个基础上,世界模型和大模型才能更有效地发挥作用,而不是停留在抽象推理层面。
问芯:在目前的机器人供应链中,我们是如何定位自己的?
舒俊源:我们把自己定位为具身智能导航与感知的核心赋能者。更准确地说,我们不做整机,而是专注为机器人提供最底层、也是最容易成为短板的一层能力——稳定的空间感知与空间记忆,相当于机器人的“眼睛”和“海马体”。
只有把这一层补齐,机器人才能在真实复杂环境中做到看得清、记得住、走得稳,从而更快、更可靠地进入真实行业与家庭场景。
问芯:关于机器人行业,有专家认为明年将是“筛选年”,行业的泡沫是否会破裂将见分晓。作为从业者,你的体感是怎样的?
舒俊源:我认同“筛选”会发生,而且这本身是一个必然、也是健康的过程。过去两年,很多效果可以在 Demo 环境中实现,但一旦进入真实场景——光照变化、动态人群、狭窄通道、重复结构、粉尘与遮挡——差距就会被迅速放大。
行业正在从“能动”走向“能长期稳定地动”。在这个阶段,稳定可靠的空间感知与空间记忆能力会从“加分项”变成“生存项”。无论最终哪家整机公司脱颖而出,对高质量、可规模化落地的空间能力的需求只会越来越强。
问芯:这么看来,你们受到的行业波动影响,是否会比那些处于下游的整机企业要小一些?
舒俊源:某种程度上是的。因为我们提供的是共性底座能力,而不是某一类机器人的单点功能。整机路线会分化,但空间感知与空间记忆几乎是所有具身智能体都绕不开的能力。从人形、四足到轮式机器人,从巡检、仓储到室内服务,只要需要在真实空间中长期运行,就离不开稳定定位、持续建图和可靠重定位。
我们也通过“模块 + 软件栈”的方式,把这些能力做成可复用的工程体系,帮助客户更快落地。目前我们已经服务了近两百家机器人客户,其中也包括多家行业头部企业。对我们来说,行业进入筛选期并不意味着需求收缩,反而意味着客户更愿意为真正可靠的底座能力买单。
问芯:关于机器人感知领域,你认为接下来的发展趋势是什么?
舒俊源:趋势非常清晰:机器人正在从“先建图、后规划”的预设模式,走向真正的自主探索。也就是说,不再依赖提前扫描好的环境,而是在陌生空间中边走边感知、边定位、边决策,持续形成并更新自己的空间认知。这意味着感知系统必须更加稳定、连续,并能够长期工作在真实环境中,而不仅仅是在理想条件下完成一次性任务。
问芯:从被动输入转向主动探索,这个跨越需要哪些技术方向上的关键改进?
舒俊源:核心有两个方向。第一是极稳定、跨场景适用的空间感知与空间记忆能力,这是所有自主探索能力的底座;第二是语义理解能力,让机器人不仅知道“哪里能走”,还知道“应该如何完成任务”,比如识别门、楼梯、通道等具有行动意义的空间要素。
我们最近开源的 Odin-Nav-Stack,就是基于 Odin 稳定感知和空间记忆能力,结合快速发展的大模型,在工程层面做的一些探索,希望能为业界提供可参考的实现路径。
问芯:随着新品的推出,留形科技下一阶段在技术、商业或生态建设上的目标是什么?
舒俊源:在技术层面,我们会持续增强机器人在真实世界中的空间感知与空间记忆能力,并与语义能力结合,推动从基础导航走向更复杂的交互任务闭环。同时,我们也在打通“留形机 + Odin”的协同体系,为具身智能提供覆盖建图、部署、定位、感知的一体化解决方案,帮助合作伙伴更快完成落地。
在商业与生态层面,我们希望服务更多机器人客户,实现从小批量试产到规模量产的跨越,并拓展到更广泛的“泛机器人”领域,如智能割草机、智能叉车等。我们始终相信:具身智能的规模化落地,离不开稳定可靠的空间能力,而留形希望成为那个把机器人真正带进真实世界的核心赋能者。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.