![]()
杨剑飞这十年,算是把科技浪潮踩得明明白白。
2012年进中山大学移动信息工程学院,赶上互联网热潮的风口,2014年扎进大疆做视觉算法,亲眼见证无人机行业的元年,还总往上海、武汉、台北的黑客松赛场跑,48小时极限编程练出的0到0.1产品化能力,怕是行业里没几个人比他扎实。
后来他穿梭在新加坡南洋理工、加州伯克利等几所顶尖高校,最终一头扎进“PhysicalAI”这个领域,去年还在南洋理工创立了MARS实验室,正式开启教职生涯。
![]()
本来想,像他这样踩中多个风口的人,大概率是个“卷王”。
但接触下来才发现,他反倒称自己是“躺平”的人。
这种“高效学习远胜于耗时间”的理念,放在现在的科研圈,确实挺难得。
![]()
他深耕的PhysicalAI,核心不是让机器人单纯动起来。
一开始他也觉得,RGB相机加雷达,就能构建完整的三维世界表征。
但在哈佛访学期间,和光学、实验物理研究者深入交流后,他发现之前的认知太局限了。
真实世界里,多光谱信息、电磁信号这些看不见的维度,都是客观存在的。
![]()
如此看来,PhysicalAI的核心是更准确、全面地观测物理世界,再用AI去解释这些观测结果。
这一点在生命科学领域也能找到印证,显微镜、基因测序本质上都是新观测方式加AI分析的组合。
毫无疑问,这是个值得长期投入的方向。
2026年,他的团队重点还是放在以人为本的具身智能研究上。
![]()
比如更安全自然的人机交互,他判断具身智能3到5年可能落地,到时候人机交互的人性化问题躲不开。
另外,团队也在VLA方向发力,探索多模态接入能否提升动作表达精度。
他还参与了Meta的ProjectAria项目,研究XR眼镜和具身智能的结合。
现在XR眼镜的显示、芯片、电池技术都在突破,短期能做自然交互入口,长期配合边缘算力,还能帮家里的机器人理解用户需求。
![]()
当下具身智能的应用场景之争,吵得挺热闹。
有人说该进工厂拧螺丝、搬东西,也有人觉得家庭才是趋势。
杨剑飞的观点很明确,核心还是在toC端。
工业场景是结构化的,传统工业机器人已经做得很好了。
![]()
具身机器人在工业领域的价值,只体现在处理不规则物体、杂乱环境这些传统机器人搞不定的地方。
但这些需求更适合工业自动化公司解决,不是通用具身智能的潜力所在。
那家庭场景的话,人形机器人是不是最好的形态?不同场景有不同优势,但通用家用机器人,人形形态适配性确实更强。
一方面,家庭空间本就是按人的尺度设计的,人形机器人能上下台阶,这是轮式机器人比不了的,尤其是海外很多多层住宅,这种优势更明显。
![]()
另一方面,情感接受度很关键。
像小鹏机器人,不光步态逼真,外观、材质的设计也能带来拟人化的温度,让人们更容易接受它融入生活。
当然,人形不一定非得是双足,这是更细节的讨论了。
中美在具身智能赛道上的差异也很有意思。
![]()
国内是供应链自下而上,很多公司搞全链路自研,从本体到模型、数据都自己做。
这种模式能建独立生态,但也容易资源分散,同质化问题突出。
而且国内的开源模型,声量往往大于可用性,缺乏社区认可的基础模型。
美国则是分层创新,很多团队专注单一技术层,硬件直接采购国内的成熟产品。
![]()
这种模式能集中资源搞突破,差异化更明显,开源生态也更成熟,比如π系列模型就成了很多研究的基础。
不过国内的硬件制造和工程化能力是优势,松山湖的供应链让产品能做得快、做得好,迭代周期也比海外短。
现在美国有些创业者都想“做美国的宇树”,这也能看出国内硬件的领先地位。
![]()
具身智能发展的痛点不少,数据问题首当其冲。
机器人数据采集成本高、不连续,合成数据能不能解决?杨剑飞觉得,仿真数据和真实数据得并行。
仿真数据容易规模化,但和现实有差距,真实数据成本高,可迁移性更强。
现在也有提升真实数据效率的办法,比如UMI的统一夹爪,还有用第一视角人类视频训练能促进智能涌现。
![]()
行业共识是预训练用仿真和视频数据,场景落地靠真实数据校准,再加上世界模型补充。
开源对行业发展的作用,不用多说,肯定能加速创新,但也会带来不确定性。
不过早期阶段,这种不确定性正是创新的源头。
![]()
硬件方面,UMI的开源夹爪让社区有了很多改进,有人改成了三指灵巧手。
软件层面,围绕PaLM-E、π系列模型的微调改造,也出了不少实质性进展。
杨剑飞觉得,机器人领域的开源价值比纯软件领域还大,能同时撬动硬件、算法、数据、应用多个层面的创新。
宇树机器人之所以普及,PaLM-E、Llama能形成生态,都是开源逻辑的体现。
![]()
国内现在就缺一个像DeepSeek那样的具身智能开源模型,来带动整个社区的创新。
最后说说人才培养,现在很多高校在讨论要不要设具身智能本科专业。
杨剑飞觉得,机器人是高度系统化的工程领域,涵盖机械、电子、计算机等多个学科。
本科课程如果不聚焦,学生容易学得杂而不精。
![]()
过去这些年,真正推动机器人教育进步的,其实是竞赛。
像RoboMaster这样的比赛,让学生在团队里完成整机设计、调试,这种实践训练比课堂有效得多。
他在大疆参与RoboMaster测试时就发现,全栈型人才大多来自顶尖战队。
所以说,本科专业只是个框架,关键是让学生有机会参与系统级工程,把机器人从零做成可运行的产品。
![]()
具身智能的发展,不是单纯堆技术那么简单。
杨剑飞的经历和洞察告诉我们,这是个需要感知物理世界、适配人类需求、构建生态协同的系统工程。
国内有硬件和工程化的优势,只要补齐开源模型、数据生态的短板,再做好人才培养的实践落地,大概率能在这个领域实现突破。
未来,当杀手级应用出现,分布式数据体系建立起来,具身智能或许就能迎来自己的“ChatGPT时刻”,真正走进千家万户。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.