
ROBOT INDUSTRY
当行业热衷于展示炫酷Demo时,跨维智能已悄然将具身智能技术带入上百个真实场景,实现亿元级营收。这家公司从“具身大脑”起步,坚持仿真到现实的技术铁律,逐步“长出”身体,并开源核心平台。其选择背后,是一条从技术理想主义通向规模商业化的独特路径。
早在2021年,当“具身智能”还仅是学术圈的前沿概念时,跨维(深圳)智能数字科技有限公司(以下简称“跨维智能”)便已成立。跨维智能创始人、香港中文大学(深圳)教授贾奎的初衷并非追逐风口,而是解决一个根本问题:如何让AI理解并处理三维物理世界的信号。他洞察到,泛智能制造场景对自动化、柔性化的刚性需求,与具身智能的技术特性天然契合。这一定位,让跨维智能从诞生之初就避开了纯技术演示,直指“创造劳动力价值”的商业核心。
![]()
图1 跨维智能创始人、香港中文大学(深圳)教授 贾奎
跨维智能CMO林嘉伟将这条路径形容为“沿途下蛋”:“跨维智能没有一开始就押注人形机器人整机,而是先从泛智能制造场景最急需的3D视觉感知与‘具身大脑’切入,用明确的产品为客户降本增效。当技术基座与市场认知成熟后,才顺势推出自研的Dexbot人形机器人系列,进军商业服务等更加开放的场景。”
1
以Sim2Real为基,构建数据驱动的世界模型

“具身智能所需的数据是多模态的——涉及视觉、力觉、触觉,以及机器人本体的动作和电机信号,而且是绝对三维和物理的,”贾奎指出,“这类数据在互联网上几乎不存在。”真机采集路径成本高企,无法启动驱动AI进化的“缩放定律”,这成为制约行业发展的根本瓶颈。
跨维智能的答案,是自研基于生成式仿真的世界模型(GS-World)。其核心并非简单地复刻现实世界的表象,而是从底层对物理规律进行数学建模,在虚拟世界中高效生成海量符合牛顿力学的高保真合成数据。“仿真的核心是让交互符合物理规律,”林嘉伟解释道,“我们通过可微仿真等技术在底层做了大量工作,确保合成数据可用于模型训练并可部署于真机操作。”
![]()
图2 跨维智能CMO 林嘉伟
作为技术底座的DexVerse引擎,在“模拟真实”与“计算效率”间取得了工程化平衡,无需追求对某个具体场景每一处细节的完美复刻,而是通过算法高效制造出足够多样化的数据,以覆盖任务的数据分布,从而实现泛化能力。这种能力,使得跨维智能能将传统自动化中长达数月的现场部署调试周期缩短90%以上,实现了“虚拟到现实”的高效迁移。
面对“仿真与现实存在差距”的质疑,贾奎的回应直指问题核心:“真机数据之间同样存在差距。问题的关键不在于复刻某个具体场景的每一个细节,而在于能否生成足够多样化的数据来覆盖任务的数据分布。”跨维智能的实践表明,当仿真数据在物理规律上足够严谨,且在多样性上远超有限的真机采集时,模型在现实世界中的表现反而更具鲁棒性和泛化性。
2
“沿途下蛋”与“AI定义”的务实哲学

跨维智能的产品路线图,生动诠释了其“沿途下蛋”的务实策略。聚焦于泛智能制造场景的“眼睛”和“大脑”,跨维智能推出了自研的纯视觉3D传感器(DexSense)和“具身智能大脑”软件(PickWiz/XWiz)。
林嘉伟表示,跨维智能的解决方案,使得传统工业机械臂和协作机器人瞬间获得了柔性作业能力,迅速在汽车零配件、3C电子、家电等几十个细分行业的上下料、分拣、装配等环节落地,服务超千个项目,带来了稳定的亿元级营收基本盘,也完成了核心技术在严苛工业环境下的验证与迭代。
当技术基座与市场对更通用自动化需求同步成熟时,跨维智能顺理成章地“长出了身体”,于2024年发布自研人形机器人Dexbot W1系列。对于采用“轮式底盘+人形上身”的构型,林嘉伟的解读充满成本与工程考量:在工厂、商场等室内半结构化环境中,轮式在移动效率、成本、稳定性和续航上都优于双足,这也符合公司聚焦上半身灵巧操作的技术基因。
![]()
图3 跨维智能DexForce W1 Pro
在设计DexForce W1 Pro时,团队将机器人的构型参数作为可优化的变量,置入DexVerse仿真环境。针对目标场景任务库,以任务成功率、能耗、成本等为综合目标函数,通过强化学习和可微优化反向推导出更优的硬件设计参数。
“这类似于在虚拟世界中进行‘机械进化’,”贾奎阐述道,尽管最终设计还需结合供应链现实,但这一本体设计流程从根本上改变了传统“先设计硬件,再编写软件”的机器人开发模式,实现了硬件为AI能力深度定制。
产品矩阵的模块化设计进一步体现了商业化思维。DexForce W1 Pro版移除了移动底盘,针对固定工位场景提供更高性价比选择,降低了客户尝试门槛。林嘉伟指出,人形机器人规模化的核心成本壁垒,并非硬件BOM成本,而是部署调试的“软成本”。因此,跨维智能致力于降低对现场工程师的依赖,避免陷入传统自动化项目制“人海战术”的泥潭。
3
深耕工业与拓荒服务的双轮驱动

贾奎基于对产业自动化程度的洞察,将泛智能制造场景锁定为创业初期的突破口。“工厂对提升效率、解决人力难题的需求非常刚性且迫切。只要技术能达到或超过人类的效率,其投资回报率计算就非常清晰。”他回忆道。在2021—2022年行业冷启动期,团队正是依靠深入工厂一线,用原型系统演示真实的降本增效价值,才赢得了早期客户,甚至不计成本进行概念验证。

图4 跨维智能人形机器人在多个场景应用
工业领域的成功,为跨维智能树立了“解决问题”而非“展示技术”的市场形象。他们的“大脑”软件适配了主流机械臂品牌,解决了柔性生产中最棘手的“小批量、多品种”问题。在新能源电池模组的复杂装配、户外物流园区的无序分拣等场景中,跨维智能的解决方案实现了行业首例的落地应用。这背后,是DexVerse引擎支撑的快速场景适配能力——通过对通用基座模型进行自动化微调,能在数天内针对新工件、新环境完成模型优化,满足工业客户对稳定性、节拍和近乎100%成功率的严苛要求。
在夯实工业基本盘的同时,跨维智能基于同一技术基座,开辟了商业服务这一第二增长曲线。Dexbot W1系列作为软硬一体平台,被投入咖啡制作、饮品售卖、文旅导览等场景。
林嘉伟阐释了其逻辑:商业服务场景对绝对效率的要求低于泛智能制造场景,但更注重人机交互体验与商业模式闭环,是验证人形机器人通用性、走近普通消费者的理想试验场。目前,跨维的机器人已在广州等核心城市实现常态化运营,服务数万名顾客。
对于未来规模化应用的行业判断,林嘉伟给出了三个方向:商业服务、文旅导览,以及需要“巡检+简单操作”的复合场景。贾奎则从更宏观的产业视角补充,汽车、3C等高端制造业仍将是自动化需求最前沿的领域,但人形机器人在这类高度结构化产线中的独特价值,将体现在需要双臂协同、全身协调的复杂装配环节,而非替代现有的成熟工位。
4
开源、协同,通往通用智能的未来

在构建自身商业版图的同时,跨维智能正将目光投向更广阔的行业生态,其开源的EmbodiChain平台,意味着全球首个用100%生成式数据自动训练具身智能模型的“数据流水线”诞生。
在EmbodiChain的架构中,跨维智能不使用任何真实数据训练模型,其结果是它在操作成功率上大幅领先部分主流方法,并且即使研究人员像“捣乱者”一样更换桌布、移动物体、改变光照,模型依然稳定,甚至在某些任务中,由于去除了容易过拟合的背景噪声,模型的表现反而比用真实数据训练还要好。

图5 跨维智能亮相多地行业展会
贾奎对开源有着深刻的认知:“如果数据问题不解决,行业无法做大。”他预见,当生成式仿真成为主流,数据将逐步“平权”,企业的核心竞争力将转向对技术范式的深刻理解、产品化工程能力以及在垂直场景中构建完整解决方案的速度。
开源EmbodiChain,是希望降低行业门槛,吸引更多开发者和研究者共同完善具身智能的基础设施,就像移动互联网时代的安卓系统,最终催生出繁荣的应用生态。
贾奎判断,真正基于三维物理的“世界模型”将成为技术竞争的焦点,而更自然、更低成本的真人动作数据采集方式也将出现。
阅读更多内容,欢迎订购《机器人产业》杂志。
点击跳转!圈内人都在看的专家观点
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.