网易首页 > 网易号 > 正文 申请入驻

仿人机器人触觉与语音技术正加速突破

0
分享至


仿人机器人正快速从工厂、物流场景向更广泛的通用场景拓展,甚至逐步迈入家庭,成为老年人的陪伴与助理。这一进程背后,是生成式 AI 与智能体技术的持续驱动,以及感知能力的全面升级。

Cadence CEO Anirudh Devgan 在近期的一次演讲中表示:"机器人领域的预测规模可能达到25万亿美元,而全球GDP约为110万亿美元。如果这一预测成真,其体量之大令人震惊。"

当前,仿人机器人主要集中在电子和汽车工厂、仓储物流以及专业清洁等场景。TrendForce预测,2026年中国仿人机器人产量将增长94%。与此同时,各类感知能力的发展进度不尽相同——视觉和自然语言处于前列,而触觉与听觉仍是最难攻克、也最具商业价值的技术挑战。

Synopsys产品营销总监Marc Swinnen指出:"自然语言技术之所以发展迅速,是因为它的应用不限于机器人领域,规模化带来了广泛的技术红利。视觉技术也相当成熟,但同样面临自动驾驶领域遇到的物体识别难题。触觉方面,压力传感和纹理感知已经做得不错了,但最难的可能是将所有感知融合在一起。"

Siemens EDA产品负责人Sathishkumar Balasubramanian表示,大语言模型的出现正在改变这一切:"传感器我们一直都有,区分触摸A和触摸B的数字化方案也一直存在,但我们不知道如何让它像人一样工作。有了大语言模型,仿人机器人就拥有了一个可以驱动一切的大脑——无论是语音理解、触觉感知,还是推理与反应,都能得以实现,而且速度极快。"

触觉:从工业机械臂到仿人双手

目前,工业机械臂末端执行器的触觉技术相对成熟,而仿人手部的触觉研究还处于起步阶段。Synaptics高级产品营销经理Sam Toba表示,触觉感知涉及力、剪切、滑动和温度等多维度参数,对应技术包括电容式、压电式、光学、磁性等多种方案。

"我们的触觉芯片内置了机器学习算法,"Toba说,"电容感应的最大优势在于响应速度极快。当你握住一个罐子时,一旦检测到滑动趋势,就必须立即做出反应。"

在手掌内部集成MCU或MPU进行边缘预处理,可以有效避免CPU过载。Toba解释道,手指上的传感器会同时以多种模式高频采集数据,若将所有数据直接发送给主机,系统将不堪重负。通过在本地进行数据过滤,可以大幅降低传输压力,同时节省功耗。

Texas Instruments机器人与工业自动化总经理Giovanni Campanella指出,闭环处理对于触觉反馈至关重要:"比如握杯子的力道不对,就会导致杯子破碎。这就是一个需要超快响应的闭环反馈场景。可以选择在边缘端直接完成处理,也可以借助千兆级以上的高速通信(如以太网或SerDes)将数据回传给机器人大脑。"

在具体应用中,并非所有场景都需要五指完整的仿人手。Grinn创始人、嵌入式IoT专家Robert Otreba认为,两指甚至一指的触控方案已足以满足许多需求,关键在于在每个处理层级引入适当的智能,以减少信号传输噪声并降低系统负担。

听觉与语音:迈向实时自然交互

仿人机器人被期望能够实时、自然地进行语言交流,但不同语言和地区口音带来了不小的挑战。Synaptics副总裁兼总经理John Weil表示,语音技术的核心在于模型规模与本地化之间的权衡:"如果用一个通用英语模型覆盖所有情况,模型体量就会增大,成本随之上升,需要更多芯片或内存。能够根据用户所在地区动态切换本地化模型,是我们正在帮助客户探索的方向。"

他举例说,在日本市场,一款模型在语言准确性上获得认可,但用户仍有抱怨,认为"听起来太年轻,措辞不够得体"。这说明语音技术不仅要做到语义正确,还要考虑语气、语态和文化背景。

语境理解同样不可或缺。Weil以咖啡机为例指出,语音激活设备需要判断语音是否真正在对它发出指令,而非用户之间的闲聊。他在CES展示了结合波束成形麦克风阵列的方案,使设备能够判断声音来源方向,从而增强语境感知能力。

Campanella补充道,家庭环境中噪声来源复杂多样,机器人必须具备精准的声源定位与噪声抑制能力:"这需要高信噪比的优质信号链,加上内置硬件加速器的MCU,才能有效区分目标语音与环境噪声。"

另一个重要议题是边缘处理与云端处理的选择。Weil指出,大厂倾向于推动设备连接云端服务,但许多产品厂商并不希望将数据共享给Google或Apple,更希望构建自己的、具备上下文感知能力的本地系统。

展望:感知融合推动机器人走向通用

Imagination Technologies产品管理总监Rob Fisher观察到,不同地区对机器人和人机交互界面的接受度存在差异:"在中国,消费者对车载语音交互、大屏幕等创新体验有着强烈需求;在欧洲,安全性仍是首要考量。"

Nvidia副总裁兼总经理Deepu Talla强调,精度是物理AI面临的核心挑战,不同场景的精度要求差异悬殊:"通用化、精细化的灵巧操作,需要先进传感器、执行器与实时安全控制的协同配合。"

Nvidia还与Cadence合作,将智能体AI与物理AI芯片IP及机器人仿真库相结合,致力于弥合仿真与现实之间的差距,助力仿人机器人在真实场景中的部署。

Synopsys产品管理高级总监Matt Commens总结道:"在CES上,我们看到很多公司在尝试模拟人类行为,这需要复杂的软件决策系统、大量电机、传感器,以及它们之间的无线通信。这正是客户当下正在攻克的问题,希望我们很快能看到更多能够处理家务的商用仿人机器人。"

Q&A

Q1:仿人机器人的触觉传感技术目前发展到什么程度?

A:目前仿人机器人手部的触觉研究仍处于早期阶段,主要借鉴工业机械臂的触觉方案。常见技术包括电容式、压电式、光学、磁性等多种传感方式,可测量力、剪切、滑动和温度等参数。手掌内部通常集成MCU进行边缘预处理,以过滤噪声、降低主机负载。大语言模型的引入,使机器人能够更快地学习和响应触觉信号,但距离真正像人手一样灵巧操作,仍有较大差距。

Q2:仿人机器人的语音识别如何处理不同语言和口音的问题?

A:语音模型可以选择构建一个覆盖所有场景的通用模型,也可以根据用户所在地区动态切换本地化模型。前者模型体量大、成本高;后者响应更快、体验更好,但需要更多系统智能。此外,文化语境也很重要,例如在日本市场,用户不仅要求语义准确,还对语气和措辞有具体要求。波束成形麦克风等技术可帮助设备判断声音方向,提升语境感知能力。

Q3:仿人机器人的语音处理是放在边缘端还是云端更合适?

A:这取决于具体应用场景和厂商需求。云端方案依托大厂服务,功能强大但涉及数据共享;边缘端方案延迟低、隐私保护更好,适合对数据主权有要求的产品厂商。许多企业希望构建自有的、具备上下文感知能力的本地语音系统,避免依赖Google或Apple等平台。硬件加速器的普及,也使边缘端运行复杂语音模型成为可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为老不尊、被“儿子”打耳光?身居上海豪宅的她反倒活成人生范本

为老不尊、被“儿子”打耳光?身居上海豪宅的她反倒活成人生范本

枫尘余往逝
2026-05-07 13:27:01
吴宜泽夺冠后,姐姐吴宜然凭颜值火出圈,身材火辣是机车爱好者

吴宜泽夺冠后,姐姐吴宜然凭颜值火出圈,身材火辣是机车爱好者

胡一舸南游y
2026-05-07 23:59:00
新车刚出厂就已老化,汽车用钢陷入低价低质内卷!

新车刚出厂就已老化,汽车用钢陷入低价低质内卷!

金投网
2026-05-06 17:02:47
国际足联要疯了,没有软肋的中国足球已经天下无敌

国际足联要疯了,没有软肋的中国足球已经天下无敌

枫冷慕诗
2026-05-07 11:32:38
人走茶凉!《陈翔六点半》赚不到钱球球退出,根本原因早已注定

人走茶凉!《陈翔六点半》赚不到钱球球退出,根本原因早已注定

橙星文娱
2026-05-06 11:09:03
当年千手观音的聋哑人领舞,被富商苦追8年,如今她成了这副摸样

当年千手观音的聋哑人领舞,被富商苦追8年,如今她成了这副摸样

石辰搞笑日常
2026-05-06 01:25:36
成都一绿化带现“情花毒”曼陀罗?官方:有毒非政府种植,将核实移除

成都一绿化带现“情花毒”曼陀罗?官方:有毒非政府种植,将核实移除

上游新闻
2026-05-07 16:35:15
心酸!5月B级车也开始大降价,最大降幅48%,合资车成“白菜价”

心酸!5月B级车也开始大降价,最大降幅48%,合资车成“白菜价”

芭比衣橱
2026-05-07 01:50:58
张亮儿子17岁当爹了!?

张亮儿子17岁当爹了!?

八卦疯叔
2026-05-06 11:04:32
白菜价买断!法甲豪门捡大漏,巴萨23岁天才即将正式远走法国

白菜价买断!法甲豪门捡大漏,巴萨23岁天才即将正式远走法国

生活新鲜市
2026-05-07 16:56:40
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
16岁游客玩瀑布秋千坠亡后续:家属已和解,知情人曝景区赔偿金额

16岁游客玩瀑布秋千坠亡后续:家属已和解,知情人曝景区赔偿金额

娱乐圈圈圆
2026-05-06 17:33:41
美国知名餐厅老板枪杀亚裔妻子,2个幼孩也不放过,最后吞枪自尽

美国知名餐厅老板枪杀亚裔妻子,2个幼孩也不放过,最后吞枪自尽

译言
2026-05-07 08:50:49
CBA最新消息!胡明轩尿检结果出炉,季后赛规则临时修改,朱芳雨这下被坑惨了

CBA最新消息!胡明轩尿检结果出炉,季后赛规则临时修改,朱芳雨这下被坑惨了

林子说事
2026-05-07 15:15:03
队报:阿隆索时期皇马就存在内讧;阿韦洛亚称成绩差因跑动少

队报:阿隆索时期皇马就存在内讧;阿韦洛亚称成绩差因跑动少

懂球帝
2026-05-08 02:45:06
重庆洪崖洞景区奶芙店私自增加所售奶芙制品重量,官方通报

重庆洪崖洞景区奶芙店私自增加所售奶芙制品重量,官方通报

界面新闻
2026-05-07 15:36:33
保姆纵火案真相揭露,藏僧通灵朱小贞,林生斌竟然只是颗棋子

保姆纵火案真相揭露,藏僧通灵朱小贞,林生斌竟然只是颗棋子

纸鸢奇谭
2025-01-12 22:07:14
出资20亿元,京东正式拿下AMC牌照

出资20亿元,京东正式拿下AMC牌照

界面新闻
2026-05-07 19:24:53
甘肃省长为来自甘肃的“00后”新科斯诺克世锦赛冠军吴宜泽点赞

甘肃省长为来自甘肃的“00后”新科斯诺克世锦赛冠军吴宜泽点赞

澎湃新闻
2026-05-07 21:26:28
漓江水如镜,美女貌似花

漓江水如镜,美女貌似花

东方不败然多多
2026-05-07 20:43:41
2026-05-08 03:23:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
18243文章数 49703关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

教育
数码
时尚
家居
军事航空

教育要闻

二模很重要!2026临沂二模、青岛二模语文、数学试题及答案!

数码要闻

大疆宣布ROMO 2代扫地机器人5月11日发布:清洁力更强 不怕零食掉渣

今年最火的4双平底鞋,配小黑裙好看又气质!

家居要闻

破茧成蝶 土味精装房爆改

军事要闻

特朗普:美伊"很可能"达成协议

无障碍浏览 进入关怀版