AI的新拐点：具身智能何时迎来属于它的“ChatGPT时刻”？|算法|模态|机器人|大模型|人工智能

AI的新拐点：具身智能何时迎来属于它的“ChatGPT时刻”？

2025-11-06 10:33:05　来源: 上观新闻

上海举报

分享至

在“认知智能”掀起全球浪潮之后，AI的下一场革命正悄然展开——它不再只会“思考”，而开始“行动”。在日前举行的ROSCon China 2025大会现场，一场聚焦《等待具身智能的ChatGPT时刻》论坛中，机器人与人工智能领域专家共同探讨：具身智能如何突破算法边界、跨过数据瓶颈，并真正走进现实世界。

地瓜机器人生态负责人、古月居创始人胡春旭认为，具身智能的兴起是AI发展进入“智能化时代”的必然趋势。“AI会重塑一切——机器人、汽车、家居，无一例外。”但他也坦言，行业正面临智能通用性不足和数据标准混乱的双重挑战。“现在的数据量不小，但质量不高，没有统一标准，许多数据无法真正用于训练模型。”他强调，要推动具身智能落地，必须同时完善多模态数据结构、统一标准体系，并构建开放的开发者生态。胡春旭提出“软硬结合、端云一体”的技术思路：通过端侧计算与云端协同来平衡成本与性能。他预测，具身智能的首个大规模落地场景极可能出现在零售与服务领域——这些场景结构化程度高、算力需求相对可控，是最适合机器人“从实验室走向街头”的地方。

深圳市机器人协会秘书长谭维佳以产业观察者的身份指出，机器人行业过去十年虽在政策推动下快速发展，但渗透率依旧低、成本居高不下。具身智能的兴起，为这个“老行业”注入了新动力。“它让机器人行业重新焕发希望，也迫使我们革自己的命。”在她看来，具身智能并非从零开始，而是通过AI与开源社区的融合，大幅缩短行业的技术学习曲线。面对当前行业痛点，谭维佳认为“硬件先行”是关键——没有稳定的构型、成熟的控制系统与完整的供应链，再强的算法也难以落地。她提出“沿途下蛋”的策略：在迈向AGI的过程中，先聚焦具体应用场景，让机器人在执行单一任务中创造实际价值。“中国的产业链和制造业基础让我们有机会率先验证具身智能的商业模式。先让机器人做好一件事，再去触及通用智能。”

“我们不能被AI神话裹挟，而应关注如何在真实物理世界中实现稳定交互。”非夕科技的施丰鸣以工程技术视角切入，认为具身智能是实现通用人工智能最有潜力的路径之一，但必须警惕短期炒作。他指出，行业当前最大问题是过度依赖单一模型结构，尤其是VLA（视觉-语言-动作）模型。“VLA能看、能听，但缺乏触觉，就像一个听觉敏锐却没有手感的人。”他介绍，非夕科技的自适应机械臂通过高频力控闭环，实现了“触觉级”的动作调整，能在精密任务中模拟人类的肌肉记忆。“人靠潜意识控制手部力度，机器人也要学会类似的反馈。”施丰鸣强调，具身智能的突破不只靠算法，还依赖标准化接口、多模态融合与开源硬件生态的协同——“只有让机器人真正感受到世界，它才能成为智能体，而非机械臂。”

大湾区大学访问学者姚嘉俊带来了“人本”视角的思考。他表示，具身智能的推广不仅是技术问题，更涉及社会心理和伦理挑战。“在一些高危行业，我们希望用机器人替代人工，但工人往往抗拒配合数据采集——他们担心自己会被技术取代。”这让具身智能在落地初期就面临社会阻力。技术层面上，姚嘉俊指出VLA模型结构仍过于简单，算力与控制流拥堵是关键瓶颈。“当机器人关节超过30个，系统就容易卡顿。”他建议借鉴MOE架构，引入触觉、强化算力调度能力。他同时提到，算力优化与模型分层是未来重点方向。在更长远的想象中，他描绘了一个更具人文气息的愿景：“当我老了，希望有一个机器人能陪伴我、推着我去看世界。”对他而言，具身智能的意义不仅是提高效率，而是重新定义“人与智能”的关系。

嘉宾们一致认为，算力与生态是具身智能未来竞争的双引擎。数据标准、多模态融合、硬件成熟、社会认知，每一个环节都可能成为“ChatGPT时刻”的前奏。

从认知智能到具身智能，人工智能的“第二场革命”正悄然展开。正如胡春旭所言：“智能化的浪潮不可阻挡。问题不会少，但未来一定会来。”

原标题：《AI的新拐点：具身智能何时迎来属于它的“ChatGPT时刻”？》

栏目主编：王蔚文字编辑：王柏玲

来源：作者：文汇报袁婧

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.