网易首页 > 网易号 > 正文 申请入驻

对话魔珐科技柴金祥:让AI「白领」拥有身体,为3D数字人做基建

0
分享至


“从AI的具像化方向看,一种身体形态是具身领域的‘蓝领’,即人形机器人,而另一种形态就是3D数字人,即AI‘白领’。我认为,未来‘白领’的应用空间会更加广阔。”

在人形机器人及其组件如火如荼的当下,魔珐科技创始人兼CEO柴金祥提出了AI影响产业和社会的另一种可能——通过3D数字人,让AI在线上也拥有“身体”。

近日,魔珐科技(Xmov)宣布正式上线具身智能3D数字人开放平台——魔珐星云。作为全球首个高质量、低时延、高并发、低成本、多终端的具身智能3D数字人开放平台,魔珐星云基于魔珐科技自主研发的文生多模态3D大模型及云-端协同架构,突破了传统数字人技术在质量、成本、延时之间的铁三角难题,不仅实现了从语义到身体语言的自然生成,更在系统架构层面完成了性能、成本和响应速度的协同优化,让AI完成了从“大脑”到“身体”的进化。

柴金祥认为,魔珐星云有望成为驱动下一代人机交互——即“多模态具身交互”的关键底层基础设施,对未来的人机交互模式、数字内容创作和服务行业产生深远影响,为整个行业带来重大变革。

魔珐星云发布现场,「明亮公司」与柴金祥就3D数字人目前的行业进展、未来展望等进行了交流。以下为问答精选(根据需求有表述调整):


成为3D数字人的「基础设施」

Q:为什么要选择做开放平台?

柴金祥:目前来看,我们的数字人产品在行业中相对而言成本更低、质量更好,各方面领先优势都比较明显。

这种情况下,对于有实际需求的公司而言,选择大投入自主研发的结果未必更好,甚至无法保证质量,倒不如拥抱我们的生态,利用我们的平台做自己的应用。这也是我们选择对平台进行开放的原因。


本质上讲,我们做的是基础设施如同大模型是AI技术层的基础设施,3D数字人作为AI“身体”的一种形态,也需要一个基础设施,我们称之为人形机器人中的“白领”,对应当前具身领域的“蓝领”人形机器人。

另外,选择将平台开放给开发者还有一层原因,即如今很多公司都在重复“造轮子”——大家不仅重复招人,而且花很多钱做出来的东西却没有我们效果好,这是一种隐形的浪费和低效。一个公司不是每件事情都要亲自去做,大模型已经验证了这一点,大多数公司只要调用其能力即可,无需自建,这样也可以把关注点有效聚焦在应用层。

Q:目前具身智能领域,数据短缺情况依旧比较严重。你们是如何解决数据规模这一问题的?

柴金祥:从AI的角度看,“大脑”方面的数据获取,在起步阶段相对容易,毕竟互联网上已经存在大量数据资源。即便是Sora,其基本数据获取也可以通过抓取海量网络视频和图片完成。

加入“具身”之后,数据一下子就变得稀缺了。即便是非常简单的数据,比如抓杯子、叠衣服,都要进行反复采集,因为这些数据从来没有过,需要从0开始积累。同样,作为AI另一种“身体”形态,3D数字人的数据也是非常稀缺的,需要一点点去构建起来。

而且,目前绝大多数人形机器人公司以前做的都是单点动作抓取,这也是为什么扩展至人体动作数据之后,人才缺乏的原因之一。

从积极的角度看,3D数字人的数据相较于视频更加结构化,只要采集到人体关键的动作数据即可。整体而言,完全描述人体动作需要的数据比生成视频和图片的量要小很多,而且我们也可以通过采用2D的数据对其进行丰富,如同仿真数据对真实数据的补充一样。

但这并不意味着3D数字人的制作就更容易,因为这个领域的难题并非仅仅是数据量,还有数据更难处理、人才较少等其他维度的困难。

我们很快发布一个大模型,其中包括数字人可以任意走路的功能。比如,你可以告诉它往前走5步,趴下,然后再爬起来。当然,我们可以直接把人形机器人领域的数据拿来进行仿真,重复已有数据的动作,但我们的优势在于,可以让数字人自主行动,自主站立自主行走,无需遥控。

在落地方面,今天的“大脑”已经很强了,相较于具身的人形机器人,我觉得让AI“白领”拥有身体非常重要,比如一个展厅,有一个3D数字人讲解和只用一台讲解器,体验的差别是非常大的。


数据积累方面已具备先发优势

Q:是否可以理解成,AI未来会有两个方向,一条在线下,沿着具身机器人方向走,主要承担“蓝领”工作,另一条在线上,即3D数字人,主要负责“白领”工作。

柴金祥:是的,但长远来看,这两条线也会统一。

从实际需求看,现实中的一个白领在虚拟世界里也可以成为一个“蓝领”,乃至其他任何角色,而我们为虚拟世界打造的每个数字人角色,未来都有可能直接驱动现实中的机器人,让它们实现相同的动作,推动AI从虚拟走向现实

虽然直到目前行业对具身机器人的热情仍旧比较高,但我认为,随着大家在虚拟世界中的时间越来越长,AI“白领”的空间将比“蓝领”更广阔。而且作为蓝领的具身机器人,训练难度可能相对还小一点,比如一个动作只要采集到数据、反复训练即可,但“白领”数字人需要的能力更丰富,要想做好更困难,但我认为也更有价值。

Q:就3D数字人领域而言,如果一个公司想跻身头部,最重要的能力有哪些?

柴金祥:我觉得大致可以总结为三个维度。

首先,公司和团队必须要坚定。因为这是一件很难的事情,我们不仅要意识到它的重要性和难度,更要看到它的未来和长期价值;其次是质量,这是最基础的能力。

再次,要有数据和强劲的美术能力。与大模型所需的数据相比,3D数据可能是最高质量的数据之一,我们用了大约十年的时间才构建起目前这个规模的数据库。这个价值点在于,即便是大厂,积累这些数据也需要经历这样漫长的过程和同样的时间。从这个角度而言,我们起步早无疑具有先发优势。

单纯看数字人,门槛其实很低,但有些可能只有对口型的功能,不仅无法生产数字人的动作,更不能驱动人形机器人。这也是为什么2D数字人几乎没有市场,客户也不愿买单,因为效果确实比较差。

此外,即便具备相对充足的数据,从团队的角度看,3D内容生产和AI生成结合的人才目前依旧非常稀缺。尤其是动作表情,全世界范围内的专业人才都很少,所以公司不仅要大胆招聘人才,更要持续培养人才。

Q:人才稀缺的原因有哪些?


柴金祥:一个主要原因是,这个行业的前身是影视动画游戏,这些人才中懂AI的很少,而近几年新兴的AI人才,又很少懂影视动画游戏和3D制作。这两条线不仅数据不交叉,人才也不交叉。


实际上,包括阿里、腾讯、百度、商汤、讯飞等在内的大厂,都曾亲自上阵做过3D数字人,但目前坚持下来的很少,仅剩几个仍在继续的公司做得也不太好。大家可能做个两三年就会发现这件事很难,投入很高也不一定达到预期。

因为这件事不像文生文、文生图那么简单,拿到一个通用大模型改一下就可以。如果没有数据、没有长期的积累,几乎寸步难行。


商业化市场已达一定成熟度

Q:经过近几年发展,AI在提升客户付费意愿方面有何变化,是否有一些案例?

柴金祥:以医院场景为例,其中有一些垂直供应商,负责为医院提供终端产品、软件等服务。这些客户一个个拓展是非常慢的,所以我们就直接输出底层能力,比如在终端实现提问、挂号、付费等,他们可以直接调用我们的API,都不需要额外加价。

但其中有个前提,就是我们本身的规模化程度,包括是否能部署到各种终端、是否足够便宜、是否足够易用等。原因很简单,对于软件产品而言,如果想让别人购买使用,首先要做到人无我有,尤其是大厂不能有,否则肯定会被虹吸;其次要质量过硬,且易得易用。

另外,低成本、高并发、多终端以及信创等都要同时跟上,否则规模化一定会有问题,即便客户很想用,但可能会因为太贵,或者响应时间太长,或者没法实现终端产品的提升等原因放弃购买。

从应用看,如同大模型的发展路径一样,未来AI不仅一定会需要3D数字人这样的“身体”,更需要一个可以随时调用的基础设施去优化资源配置并提升效率。一方面,像陪练、教学、面试甚至银行服务等很多场景,有没有“身体”带来的差异体验会非常大。以后甚至不会有APP,所有的服务都直接由一个数字人来完成。

另一方面,大模型是必须的,但做大模型是有门槛的,这方面我们具备更多积累和先发优势。从语言模型到动作模型,数据能力变得更垂直,有了数据之后如何复制人类的感知能力又极为关键。

从商业化前景上看,我们认为市场也已经达到一定的成熟度。而且,决定做3D数字人基础设施这件事时,我门就已经考察过应用场景,比如赛诺菲就已经开始使用。

换言之,如果市场中多数企业没有相关预算和费用,那我们做再多投入也不会产生很大价值。

Q:目前商业化应用的领域与几年前相比,是否有一些变化?

柴金祥:差不多,只是可能服务不一样。我们成为底层能力后,就可以覆盖所有行业,而且可以做到以前无法实现的功能,比如聊天机器人。

陪伴这个领域,现在大多是没有真人形象或者形象很简单的产品,一旦我们可以输出这种能力,这类产品就可以马上调用,跟调用大模型一样简单。

医院场景也一样,以前我们是没法做的,因为其中的终端设备芯片能力太弱了,比手机差很多。

珐星云有个很重要的特点就是百元芯片也能跑,而且能保证质量因为我们自研的文生多模态3D大模型和云-端拆分的架构创新也正因此,应用场景中对终端屏幕的要求可以不必很高,从而实现了规模化商业化的必要条件。

还有银行,其中的自助终端目前保有量约200万台,如果要把这些都升级为AI终端并达到智能体70%的普及率,这个市场将非常可观,而类似的场景还有很多。

酒店里电视机其实也是一个典型场景,虽然市场很大,但以前由于设备太差根本跑不动,也没法做到规模化。就像如果大模型的token价格不是迅速降低,那么目前大多数终端也不会沾到边,可见便宜是多么重要。

对于我们来讲,很多市场是真实存在、等待开发的,核心在于有没有能力做到足够便宜,质量足够好,体验足够好。这也是我们一直追求的目标。


在海外,输出能力比输出产品更有效

Q:目前海外进展情况如何?

柴金祥:魔珐星云预计两三周以后会在海外上线。

软件产品在海外做B端其实蛮难的,因为高于1万美金的订单基本上都要线下做,这导致软件类产品很难规模化,而且准入门槛也很高。但如果是输出一个“能力”相对比较容易,任何公司只要在线上调试效果即可,所以规模化也相对简单。

截至目前,中国似乎很少有成功全球化的软件产品,但DeepSeek作为大模型这种“基础设施”,通过开源的方式就迅速实现了大规模的全球化应用。

所以,如果你的技术非常强,做到了应用,就应该成为基础设施但要避开大厂的能力,否则如果在成本、易用性上面没有优势,必定会很快被大厂吞没。

Q:海外是否有已经触达的场景?

柴金祥:我们此前已经积累了不少服务在华外企的经验,验证了我们的底层的能力,比如Chatbot、陪练模型等。这些东西放到美国也有很大需求,尤其比如销售、陪练甚至客服、面试等领域,可能需求比国内还要大,但们海外很多国家现在还不具备这方面的能力,所以我们要做的就是去触达各行各业。

另外,有些行业可能已经具备了一些智能体,但这些智能体既没有形象也没有身体,又或者他们已经调用了某个大模型,但也是只有大脑没有身体,这些都是我们可以拓展的空间。

Q:海外上线的第一站会选在哪里?

柴金祥:我们会直接全球同步上线。在产品设计研发阶段,我们就已经植入了全球各地的语言和形象,但未来主打市场可能还是希望在美国。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
婆婆带全家去旅游,到检票没买我和儿子的票,我直接带着儿子回家

婆婆带全家去旅游,到检票没买我和儿子的票,我直接带着儿子回家

小秋情感说
2025-11-04 14:14:44
追平生涯纪录!布朗尼5+6助攻赛季首进三分 连获重用太励志

追平生涯纪录!布朗尼5+6助攻赛季首进三分 连获重用太励志

醉卧浮生
2025-11-04 13:38:24
最高涨幅13%!税收新政落地首周黄金饰品普遍涨价,板料经营商暂停报价观望市场

最高涨幅13%!税收新政落地首周黄金饰品普遍涨价,板料经营商暂停报价观望市场

财联社
2025-11-04 15:20:16
上海停车场后续:原配背景被扒,老公已失业,阿三一毛钱都拿不到

上海停车场后续:原配背景被扒,老公已失业,阿三一毛钱都拿不到

来条娱吃
2025-11-04 20:06:25
“安世大劫案”越闹越大,巴西找中方要说法,荷兰被“公开处刑”

“安世大劫案”越闹越大,巴西找中方要说法,荷兰被“公开处刑”

史评
2025-11-03 21:30:05
天安门前的华表柱是用来干什么的?

天安门前的华表柱是用来干什么的?

壹贰叁的壹
2025-07-07 09:54:36
蓝盈莹蔡文静撞衫,蔡文静当场黑脸,网友:她俩穿的像司仪!

蓝盈莹蔡文静撞衫,蔡文静当场黑脸,网友:她俩穿的像司仪!

娱圈小愚
2025-11-04 08:56:23
悲催!网传济南某头部监理企业公布冬休,正式员工每月仅有1000元

悲催!网传济南某头部监理企业公布冬休,正式员工每月仅有1000元

火山诗话
2025-11-04 15:01:39
涉嫌严重违法,李晓红被查

涉嫌严重违法,李晓红被查

FM93浙江交通之声
2025-11-04 18:48:06
以色列将不宣而战,对法军开打,美军威胁炸联合国维和部队

以色列将不宣而战,对法军开打,美军威胁炸联合国维和部队

小樾说历史
2025-11-03 12:02:21
李云迪再陷桃色风波,女主照片被扒疑似有两人视频流出

李云迪再陷桃色风波,女主照片被扒疑似有两人视频流出

挪威森林
2025-11-02 12:56:16
新开的白云机场t3航站楼,被吐槽了

新开的白云机场t3航站楼,被吐槽了

爱下厨的阿酾
2025-11-04 14:02:43
博士毕业于东北林业大学,东北农大副教授以通讯作者身份在一区Top期刊上发表研究论文

博士毕业于东北林业大学,东北农大副教授以通讯作者身份在一区Top期刊上发表研究论文

植物研究进展
2025-11-04 23:19:37
复合11年后,李嫣谢振轩联手,撕碎了王菲和谢霆锋仅剩的体面

复合11年后,李嫣谢振轩联手,撕碎了王菲和谢霆锋仅剩的体面

冷紫葉
2025-11-03 17:07:58
中国正在上演的诡异经济

中国正在上演的诡异经济

难得君
2025-10-29 19:26:55
叙利亚朱拉尼没想到,中方会动用一票否决权,俄美英法力挺也没用

叙利亚朱拉尼没想到,中方会动用一票否决权,俄美英法力挺也没用

阿柒的讯
2025-11-03 21:26:06
南京大学发布情况说明

南京大学发布情况说明

新京报政事儿
2025-11-04 13:13:53
贵州省纪检监察机关对从江县“12·2”乡镇自用船舶较大沉船事故严肃追责问责

贵州省纪检监察机关对从江县“12·2”乡镇自用船舶较大沉船事故严肃追责问责

界面新闻
2025-11-04 15:22:46
蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让中国人寒心了

蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让中国人寒心了

阿校谈史
2025-11-03 18:20:19
罗马诺实锤!利物浦将与27万周薪双核谈判

罗马诺实锤!利物浦将与27万周薪双核谈判

澜归序
2025-11-04 12:32:31
2025-11-05 00:03:00
明亮Company incentive-icons
明亮Company
追踪新商业、好公司。
608文章数 401关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

男子被警方扣押1000万元无罪后申诉要求返还 警方回应

头条要闻

男子被警方扣押1000万元无罪后申诉要求返还 警方回应

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

爸爸去哪儿6孩子现状,个个不同

财经要闻

马斯克"万亿薪酬"计划,突爆重大利空

汽车要闻

把海岸诗意织进日常 法拉利Amalfi重塑超跑生活方式

态度原创

旅游
游戏
亲子
艺术
本地

旅游要闻

这个冬天,一起奔赴黑龙江的冰雪之约!

好评新作突然从各大主机商店下架:今年刚刚推出

亲子要闻

幼儿园免费背后藏着影响每个家庭的人口危机。

艺术要闻

何镜堂院士出手!广州再添150米新地标

本地新闻

秋颜悦色 | 在榆中,秋天是一场盛大的视觉交响

无障碍浏览 进入关怀版