![]()
创投笔记
# 世界基座模型,需要具备什么能力 #
![]()
王仲远
智源研究院院长
第一,要物理正确,光学折射、重力、流体、物体运动都要符合真实物理规律。视频生成模型可能生成一群在天上飞的猪,但物理世界不会这样运行。如果机器人装上一个不能区分真实和虚幻的“大脑”,它可能误以为自己是钢铁侠,这会带来严重风险。
第二,要有动作因果可溯。模型不能只知道画面变化,还要知道Action会导致什么结果。比如,一瓶水有没有盖盖子,当人类看到它快掉落时,自然会预判不同后果,世界模型需要把这种动作与后果之间的关系学进去。
第三,要有长时间序列一致性。很多视频生成模型可以生成5秒、10秒甚至1分钟的视频,但并不代表它真正理解时间。如果给一个瓶子加水,旁边有一个时钟,镜头移开再移回来,模型要知道现实中确实经过了10秒或20秒,而不是随意生成一个看似合理的画面。
第四,要有通用泛化能力。世界基座模型必须能应用在多个下游场景,就像大语言模型可以用于很多任务一样。它不能只是一个特定场景的工具,而要能服务具身、物理仿真、科学预测等多种任务。
合 作 对 接
扫码添加投资人说运营者微信,备注「商务合作」详细沟通。
超 级 社 群
【投资人说】正在组建超级创业者社群、超级读者群、超级媒体群等,目前总人数已超1000人。
关注【投资人说】微信公众号,发送信息「进群」,与各行业精英直接交流,共同进步。
旗 下 媒 体
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.