想象一下未来:清晨,一台看护机器人温柔地将家里的老人扶下床,帮他们穿戴整齐;清洁机器人穿梭在孩子的房间,将散落的玩具放回书架,把脏衣服收进洗衣篮;工厂里,一双灵巧的机械手,正从第一个脆弱的元件开始,组装着下一代智能手机。
这并非天马行空的幻想,而是我们正在加速奔赴的现实。
就在刚刚到来的2026年,《科学美国人》(Scientific American杂志用其首期封面文章,为我们描绘了这样一幅人机共存的蓝图。该杂志是全球历史最悠久、影响力最深远的科普杂志之一,自1845 年创刊以来,在科研界、教育界和科普领域均享有极高声誉。它不仅是科学传播的标杆,更是连接顶尖科学家与普通读者的重要桥梁。
![]()
文章作者深入探访了全球顶尖的机器人研究中心——斯坦福机器人中心,试图回答一个终极问题:当机器人走出井然有序的工厂,进入我们混乱、不可预测的日常生活时,最大的障碍究竟是什么?
答案或许出乎很多人的意料,并非算力,也非视觉,而是——触觉
斯坦福机器人中心主任Oussama Khatib一语道破天机:“机器人领域最大的挑战就是接触(contact)。”这篇深度报道,正是围绕这一核心挑战展开的。
▍“接触”的鸿沟:为何机器人连鞋带都系不好?
![]()
人类与机器人之间,存在着一道名为“触觉”的巨大鸿沟。
我们人类是“狂野且不可预测的”,而机器人则被编程规则牢牢束缚,难以应对混乱。当一个机器人要与人类,尤其是好动的小孩或脆弱的老人安全共存时,它必须变得极其灵活、柔顺。它的肢体不仅要坚固,能稳定地输出力量,更要拥有像人手一样灵巧、敏锐的末端执行器。
然而,现实是骨感的。
我们人类的手,是由27块骨头和30多块肌肉组成的精妙杰作。我们的“本体感觉”,即对身体位置和运动的感知,与皮肤上检测压力和温度的细胞感受器协同工作,构成了一个复杂而强大的触觉系统。这套系统让我们在五到七岁之间就能掌握系鞋带这样复杂的任务。
但反观当今最先进的机器人,它们的手大多还停留在“钳爪”(jaw grippers)的水平——两个“手指”相对夹紧物体。这种设计在抓取刚性、形状规则的物体时或许够用,但一旦面对柔软、易碎或形态不规则的物体,就立刻捉襟见肘。
文章中提到,即便是像特斯拉Optimus机器人在2024年演示的空中抓网球,也往往依赖于遥操作(teleoperation),即背后有个人类在实时控制。如果让它自主离线玩接球游戏,恐怕就是另一番景象了。
这并非新问题。早在1960年代初,第一台工业机器人Unimate就被安装在通用汽车的工厂里。这个重达3000磅的大家伙,其专利描述的功能是“程序化物品转移”,说白了就是用它的爪子从流水线上抓取和举起滚烫的金属铸件。它的动作粗糙,需要人类先手动“教”它一遍动作路径。尽管它也能完成一些如打高尔夫球、从易拉罐里倒饮料等表演,但本质上,它只能在被严格定义好的结构化环境中工作。
而斯坦福的机器人专家们正在做的,正是要将机器人从这样“守规矩”的领域,带入一个充满不确定性的世界。“在这个世界里,你不知道你将要去哪里,当你触摸物体时,你甚至可能会弄坏它,”Khatib教授解释道。他追求的是一种他称之为“人类顺应性”(human compliance)的特质,即机器人能像人类一样,通过触摸和感觉来适应环境。
▍赋予“第六感”:用摄像头为机器人打造“皮肤”
![]()
为了跨越这道鸿-沟,科学家们必须为机器人创造出一种人造的“触觉”。文章揭示了两项极具前景的突破性技术,它们都巧妙地利用了视觉来模拟触觉。
第一项来自斯坦福大学的助理教授Monroe Kennedy III,他开发了一种名为DenseTact的传感器。这项技术通过为标准的机器人夹爪装备一层半透明的硅胶“皮肤”来增强其触觉。当夹爪接触物体时,物体会在硅胶上留下印记。夹爪内部,一个摄像头会持续观察这层皮肤的内表面,而一个LED灯则负责照亮它。物体造成的形变会改变光的反射,摄像头捕捉到这些细微的光影变化,就能将其转化为对所接触物体的精确数学表达。
DenseTact的强大之处在于其惊人的辨识能力。实验中,两台配备了DenseTact的机器人可以通过相互“摩擦”织物样本,来判断它们之间夹着的是哪一种布料。在区分两种、三种或五种丝绸时,其准确率高达98%以上。这已经远远超出了传统机器人的能力范畴。
另一项类似但同样出色的技术来自麻省理工学院(MIT)。博士生Sandra Liu和她的同事们创造了一个名为GelSight的系统。它同样利用了摄像头、凝胶和光线,让机器人能够通过触摸来识别物体。Liu的团队已经证明,GelSight传感器可以仅凭触觉,在一堆玩具砖块中,准确识别出乐高积木
Liu用一个生动的例子解释了这项技术的意义:“当我抓一个滑溜溜的芒果时,我的抓握方式会和我抓一个硬邦邦的苹果时完全不同。”这种基于触觉的自适应抓握,正是GelSight等技术希望赋予机器人的能力。一个包裹在橡胶垫里的柔软、可弯曲的机器人手掌,在抓取涂满油漆的费雪玩具时,表现出了最佳的抓握性能。
这些“人造皮肤”技术,虽然实现路径略有不同,但核心思想都是将触觉问题转化为一个视觉分析问题,为冰冷的机器赋予了感知世界纹理、软硬、形状的“第六感”。
▍深入斯坦福:从家务机器人到深海“阿凡达”
![]()
理论的突破,最终要落实到实践中。文章作者在斯坦福机器人中心3000平方英尺的实验室里,亲眼见证了这些前沿技术催生出的新一代机器人。
首先是家务场景的明星——TidyBot。在一个模拟卧室里,两台机器人协同工作,目标是清理房间。TidyBot首先会利用其车载摄像头扫描整个空间,确定哪些物体放错了位置。然后,它会尝试识别每个物体属于哪个类别——是玩具,是衣服,还是其他。最后,它会规划路径,将物体放回它认为正确的地方。
在一次测试中,TidyBot成功地捡起地上的帽子,打开抽屉,把它放进去,然后关上抽屉。但在另一些测试中,它也暴露了现阶段的局限性。比如,它在尝试捡起一小块黄色的乐高积木时失败了;在另一次演示中,由于围观的人太多,环境过于复杂,导致它无法确定盘子应该放在哪里。正如中心执行董事Steve Cousins所说,机器人可以通过机器学习进行训练,但一次成功的演示可能需要尝试几十次。
如果说TidyBot展现了机器人在家庭环境中的潜力与挣扎,那么另一位“大明星”——OceanOne,则将机器人的应用边界拓展到了人类难以企及的深海。
OceanOne是一个拥有人形上半身和鱼形尾部的“水下阿凡达”。它的设计极具亲和力,拥有两只手臂和一张“脸”,尾部则集成了八个全向推进器,使其能在水中灵活移动。它的橡胶手指在被挤压时会轻微弯曲,充满了“柔性”之美。
OceanOne最核心的能力,是它能潜入1000米(约3300英尺)的深海,并带给操作者实时的力反馈(haptic feedback)。这意味着,当远在海面研究船上的驾驶员通过控制器操作OceanOne的手指时,他能“感觉”到机器人触摸到的一切。
这台机器人已经完成了数次惊人的任务。它曾在迪拜的世界最深游泳池里与一名潜水员“对弈”;在科西嘉岛附近,它下潜到一艘公元二世纪的古罗马沉船遗址,由Khatib教授亲自远程操控,用它柔软的手指,从沉船中轻轻取回了一盏脆弱的古代油灯。目前,一个名为OceanOneK的升级版本正在研发中,将具备更强的深潜能力。
作者亲身体验了OceanOne的控制系统。当他在屏幕上看到一个球放在一块类似明胶的物体上,并推动控制器让球滚动时,他感受到的那种顺滑、即时的反馈,背后是巨大的算力在支撑。“这真的非常困难,因为我们正在实时模拟可变形的膜,同时还要感受它并用力推动它,”Khatib解释道。
▍结语:复杂的机器人与更复杂的人
![]()
在领略了斯坦福实验室里种种令人惊叹的机器人之后,作者引出了文章结尾发人深省的两个核心事实:
第一,机器人技术是复杂的。
第二,人,是让一切变得更复杂的变量。
从笨重的Unimate到灵巧的OceanOne,机器人技术无疑取得了长足的进步。但正如TidyBot面对一块小小的乐高积木时的无助,要让机器人真正无缝地融入我们混乱、动态、充满意外的人类世界,还有很长的路要走。
我们正处在一个激动人心的技术拐点上。破解“触觉”密码,让机器人学会如何与世界以及与我们进行轻柔而智能的物理交互,是这场革命能否成功的关键。斯坦福和全球其他顶尖实验室的探索,正在为我们铺设通往那个“人机共存”未来的道路,尽管这条路,注定漫长而曲折。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.