网易首页 > 网易号 > 正文 申请入驻

比SOTA提速10倍!北大DragMesh重塑3D交互,物理零失真

0
分享至


新智元报道

编辑:LRST

【新智元导读】让静态3D模型「动起来」一直是图形学界的难题:物理模拟太慢,生成模型又不讲「物理基本法」。近日,北京大学团队提出DragMesh,通过「语义-几何解耦」范式与双四元数VAE,成功将核心生成模块的算力消耗降低至SOTA模型的1/10,同时将运动轴预测误差降低了10倍。得益于底层数学的完备性,该模型无需任何标注,即可让任意静态Mesh实现符合物理规律的实时交互。

在生成式AI的浪潮下,业界已经可以通过LRM、TripoSR等模型生成高质量的静态3D资产。

然而,一个完整的3D世界模型(World Model)不仅需要知道物体「长什么样」,更需要理解它们「怎么动」以及如何响应用户的交互。

当前的3D交互生成领域面临着一道难以逾越的「交互-保真度鸿沟」:

1. 物理模拟派(如基于优化的方法):虽然物理一致性高,但计算过于沉重,无法满足实时交互需求。

2. 纯生成派(如基于扩散模型的方法):虽然生成速度较快,但经常违反运动学约束,产生「关节脱臼」、「穿模」或轨迹漂移等幻觉。

为了打破这一僵局,北京大学团队推出了DragMesh,这是一个专为实时交互设计的轻量级框架,它没有盲目堆砌算力,而是从数学表征和架构设计底层入手,实现了物理真实性与计算效率的双重飞跃。


论文链接:https://arxiv.org/abs/2512.06424

代码链接:https://github.com/AlGeeksGroup/DragMesh

项目主页:https://aigeeksgroup.github.io/DragMesh

核心技术

两大创新重塑3D交互

DragMesh 并没有采用端到端的暴力生成,而是提出了解耦的设计哲学。团队认为,现有模型之所以庞大且低效,是因为试图用一个网络同时解决「语义理解」(这是微波炉还是柜子?)和「动作生成」(它该怎么转?)这两个性质完全不同的问题。

语义-几何解耦范式

DragMesh将交互过程拆解为两个轻量级流水线:


inference pipeline(推理流程)

意图推理:利用 VLM(如 GPT-4o)的通识能力,快速判断用户的交互意图,解决语义歧义(例如:判断关节类型是旋转的合页还是滑动的抽屉)。

几何回归:团队设计了专用的 KPP-Net (Kinematics Prediction Network) 。不同于通用的点云编码器,KPP-Net采用了双流注意力机制,专门用于从 Mesh 和拖拽信号中回归精准的关节轴和原点。

这种解耦设计使得核心生成网络不再需要「猜测」物体结构,而是直接基于预测出的运动学参数进行生成,大幅减轻了模型负担。

双四元数VAE

为了解决传统欧拉角(万向节死锁)或变换矩阵(参数冗余、不连续)的问题,团队引入了双四元数 (Dual Quaternions, DQ) 作为核心运动表征。

一个单位双四元数仅需8个参数,即可同时完美描述三维空间中的旋转和平移,且天然满足螺旋运动理论。



基于此,团队构建了DQ-VAE。


DQ-VAE training pipeline

非自回归Transformer解码器:摒弃了容易产生误差累积的自回归方式,采用并行解码,保证了长序列动作的连贯性 。

FiLM条件注入:将KPP-Net预测的关节先验通过FiLM (Feature-wise Linear Modulation) 层注入到Transformer的每一层中,确保生成的每一帧都严格「听从」物理约束。

物理修正模块:在解码器末端引入残差修正,进一步微调轨迹以消除微小的物理漂移,确保最终输出严格遵循物理法则 。

性能评测

算力暴降,精度暴涨

团队在GAPartNet和Objaverse数据集上进行了广泛的对比实验,结果显示DragMesh在各项指标上均实现了高效提升 。

效率:比SOTA提速10倍


性能对比,横轴为计算量 (GFLOPs),气泡大小代表参数量。紫色气泡代表现有的通用模型(如DragAPart, PartRM),它们往往参数量巨大且计算昂贵 。DragMesh(左下角)的核心生成模块参数量仅为27.5M,GFLOPs 仅为5.2 。

相比MeshArt (304M Params, 1540 GFLOPs) 和DragAPart (1100M Params, 350 GFLOPs),DragMesh的计算开销降低了5到10倍,且无需针对每个物体单独训练。

精度:几何误差降低一个数量级

在运动学预测的消融实验中,架构的优势尤为明显 :

Baseline (PointNet),轴预测误差高达450.0mrad

Ours (KPP-Net),通过解耦设计与双流注意力机制,轴预测误差降至45.0mrad,原点预测误差仅为1.8mm

这意味着用户在拖拽柜门时,DragMesh预测的旋转轴偏差极小,几乎不会出现门板「飞出」或「歪斜」的现象。

物理一致性可视化


对比分析

在定性对比中,面对微波炉、折叠椅等物体时,

ArtGS / PartRM:因为流程复杂需要的前验内容较多,经常出现结构崩坏或无法识别的情况(图中标空缺部分)。

DragMesh:无论是平移(抽屉)还是旋转(门、翻盖),都能生成平滑、结构完整的运动轨迹,且严格保持了物体的刚性结构 。

总结与展望

开启通用物理交互新纪元

DragMesh的发布不仅仅是提出了一个新的模型,更重要的是验证了一条通往3D世界模型的极简路径 。

传统方法往往需要针对「旋转」和「平移」分别设计约束,而DragMesh采用的双四元数从数学底层上实现了刚体运动的「大一统」 。

根据沙勒定理,空间中任意刚体运动都可以描述为螺旋运动。这意味着 DragMesh 的核心架构天然具备描述世间万物复杂运动的能力。

无论是机械臂的复合扭转,还是更精密的螺旋传动,DragMesh 无需修改底层架构,即可将其纳入「语义-几何」的统一流形中。

得益于解耦设计与DQ-VAE的紧凑表征,DragMesh成功将物理交互带入实时时代,证明了我们不需要等待分钟级的物理模拟,也不需要忍受离线渲染的延迟。

在未来的元宇宙构建、机器人仿真以及数字孪生场景中,DragMesh这种「即拖即动、即动即真」的轻量化范式,将成为赋予静态资产「物理常识」的基础设施 。

未来,DragMesh将继续利用其在螺旋理论上的数学优势,向多关节级联及更复杂的动力学场景从容扩展,让AI真正理解物理世界的运行规律。

参考资料:

https://arxiv.org/abs/2512.06424

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
说啥也不走!国米“失望之星”要继续证明自己,让齐沃很是无语

说啥也不走!国米“失望之星”要继续证明自己,让齐沃很是无语

里芃芃体育
2026-01-09 05:00:03
1985年,李讷带丈夫去买车,厂长盯着她的脸看了半天,死活不肯收钱,结果她接下来的举动,让在场所有人都红了脸

1985年,李讷带丈夫去买车,厂长盯着她的脸看了半天,死活不肯收钱,结果她接下来的举动,让在场所有人都红了脸

桃烟读史
2026-01-07 01:02:14
马杜罗为何不慌?进了DEA“牢笼”,反而拿到了博弈主动权

马杜罗为何不慌?进了DEA“牢笼”,反而拿到了博弈主动权

回旋镖
2026-01-05 23:14:21
美国抓捕马杜罗后 委内瑞拉宣布计划释放囚犯

美国抓捕马杜罗后 委内瑞拉宣布计划释放囚犯

新浪财经
2026-01-09 04:09:29
这位成熟阿姨完把丰满的身材穿出了独特的魅力

这位成熟阿姨完把丰满的身材穿出了独特的魅力

牛弹琴123456
2026-01-09 11:42:43
丹麦国防部:若美国武力夺取格陵兰岛 丹麦士兵可“先开枪再请示”

丹麦国防部:若美国武力夺取格陵兰岛 丹麦士兵可“先开枪再请示”

财联社
2026-01-08 14:40:05
当你隔壁是个超级大国:东南亚人眼中的中国,到底是什么样的?

当你隔壁是个超级大国:东南亚人眼中的中国,到底是什么样的?

斜烟风起雨未
2025-12-24 13:32:53
饶颖:赵忠祥与我发生关系多年,他有特殊癖好,令我身心受到伤害

饶颖:赵忠祥与我发生关系多年,他有特殊癖好,令我身心受到伤害

凡知
2025-05-07 16:00:01
解放军历史上最烂的自动步枪就是它:粗制滥造的代名词63式步枪

解放军历史上最烂的自动步枪就是它:粗制滥造的代名词63式步枪

瀚霖学史
2026-01-08 09:29:19
朝鲜2025年给农民盖了多少套房子?

朝鲜2025年给农民盖了多少套房子?

IN朝鲜
2026-01-08 13:16:51
飞机上偶遇那英!

飞机上偶遇那英!

锋哥与八卦哥
2026-01-08 13:19:49
为啥说生命的尽头是玄学?网友:我去那家公司上班,后期公司就垮

为啥说生命的尽头是玄学?网友:我去那家公司上班,后期公司就垮

带你感受人间冷暖
2026-01-07 00:10:05
窦靖童:妈妈钱多到用不完,但穷苦潦倒的爸爸,却成她如今的心病

窦靖童:妈妈钱多到用不完,但穷苦潦倒的爸爸,却成她如今的心病

丰谭笔录
2025-12-25 11:35:18
中国战略机遇期要来了?如果美国武力夺取格陵兰岛,美欧可能决裂

中国战略机遇期要来了?如果美国武力夺取格陵兰岛,美欧可能决裂

扶苏聊历史
2026-01-09 11:52:35
26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

杜鱂手工制作
2026-01-06 18:48:05
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
什么时候向大陆摊牌?吴思瑶最新表态,向大陆喊话,其实已经露馅

什么时候向大陆摊牌?吴思瑶最新表态,向大陆喊话,其实已经露馅

DS北风
2026-01-08 18:42:10
4680电池的大饼,马斯克不想画了

4680电池的大饼,马斯克不想画了

远川科技评论
2026-01-08 22:32:25
从场均39分,退步到24分,正确答案都给了,还能做错!趁早重建吧

从场均39分,退步到24分,正确答案都给了,还能做错!趁早重建吧

老梁体育漫谈
2026-01-09 00:52:43
高中生校内身亡,校方在家长赶到前转运遗体?河南新蔡通报

高中生校内身亡,校方在家长赶到前转运遗体?河南新蔡通报

新京报
2026-01-09 14:40:01
2026-01-09 15:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14293文章数 66451关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

52票赞成47票反对 特朗普怒了:对委动武或遭限制

头条要闻

52票赞成47票反对 特朗普怒了:对委动武或遭限制

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

更智能更豪华 乐道L90加配置会贵多少?

态度原创

时尚
艺术
本地
游戏
公开课

这一次,抖音美妆让36万用户来定义美

艺术要闻

Sean Yoro:街头艺术界的“冲浪高手”

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

《FF7re》导演回应小游戏 遵循原作保留原味?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版