网易首页 > 网易号 > 正文 申请入驻

对话魔珐科技柴金祥:让AI「白领」拥有身体,为3D数字人做基建

0
分享至

“从AI的具像化方向看,一种身体形态是具身领域的‘蓝领’,即人形机器人,而另一种形态就是3D数字人,即AI‘白领’。我认为,未来‘白领’的应用空间会更加广阔。”

在人形机器人及其组件如火如荼的当下,魔珐科技创始人兼CEO柴金祥提出了AI影响产业和社会的另一种可能——通过3D数字人,让AI在线上也拥有“身体”。

近日,魔珐科技(Xmov)宣布正式上线具身智能3D数字人开放平台——魔珐星云。作为全球首个高质量、低时延、高并发、低成本、多终端的具身智能3D数字人开放平台,魔珐星云基于魔珐科技自主研发的文生多模态3D大模型及云-端协同架构,突破了传统数字人技术在质量、成本、延时之间的铁三角难题,不仅实现了从语义到身体语言的自然生成,更在系统架构层面完成了性能、成本和响应速度的协同优化,让AI完成了从“大脑”到“身体”的进化。

柴金祥认为,魔珐星云有望成为驱动下一代人机交互——即“多模态具身交互”的关键底层基础设施,对未来的人机交互模式、数字内容创作和服务行业产生深远影响,为整个行业带来重大变革。

魔珐星云发布现场,「明亮公司」与柴金祥就3D数字人目前的行业进展、未来展望等进行了交流。以下为问答精选(根据需求有表述调整):

成为3D数字人的「基础设施」

Q:为什么要选择做开放平台?

柴金祥:目前来看,我们的数字人产品在行业中相对而言成本更低、质量更好,各方面领先优势都比较明显。

这种情况下,对于有实际需求的公司而言,选择大投入自主研发的结果未必更好,甚至无法保证质量,倒不如拥抱我们的生态,利用我们的平台做自己的应用。这也是我们选择对平台进行开放的原因。


本质上讲,我们做的是基础设施如同大模型是AI技术层的基础设施,3D数字人作为AI“身体”的一种形态,也需要一个基础设施,我们称之为人形机器人中的“白领”,对应当前具身领域的“蓝领”人形机器人。

另外,选择将平台开放给开发者还有一层原因,即如今很多公司都在重复“造轮子”——大家不仅重复招人,而且花很多钱做出来的东西却没有我们效果好,这是一种隐形的浪费和低效。一个公司不是每件事情都要亲自去做,大模型已经验证了这一点,大多数公司只要调用其能力即可,无需自建,这样也可以把关注点有效聚焦在应用层。

Q:目前具身智能领域,数据短缺情况依旧比较严重。你们是如何解决数据规模这一问题的?

柴金祥:从AI的角度看,“大脑”方面的数据获取,在起步阶段相对容易,毕竟互联网上已经存在大量数据资源。即便是Sora,其基本数据获取也可以通过抓取海量网络视频和图片完成。

加入“具身”之后,数据一下子就变得稀缺了。即便是非常简单的数据,比如抓杯子、叠衣服,都要进行反复采集,因为这些数据从来没有过,需要从0开始积累。同样,作为AI另一种“身体”形态,3D数字人的数据也是非常稀缺的,需要一点点去构建起来。

而且,目前绝大多数人形机器人公司以前做的都是单点动作抓取,这也是为什么扩展至人体动作数据之后,人才缺乏的原因之一。

从积极的角度看,3D数字人的数据相较于视频更加结构化,只要采集到人体关键的动作数据即可。整体而言,完全描述人体动作需要的数据比生成视频和图片的量要小很多,而且我们也可以通过采用2D的数据对其进行丰富,如同仿真数据对真实数据的补充一样。

但这并不意味着3D数字人的制作就更容易,因为这个领域的难题并非仅仅是数据量,还有数据更难处理、人才较少等其他维度的困难。

我们很快发布一个大模型,其中包括数字人可以任意走路的功能。比如,你可以告诉它往前走5步,趴下,然后再爬起来。当然,我们可以直接把人形机器人领域的数据拿来进行仿真,重复已有数据的动作,但我们的优势在于,可以让数字人自主行动,自主站立自主行走,无需遥控。

在落地方面,今天的“大脑”已经很强了,相较于具身的人形机器人,我觉得让AI“白领”拥有身体非常重要,比如一个展厅,有一个3D数字人讲解和只用一台讲解器,体验的差别是非常大的。

数据积累方面已具备先发优势

Q:是否可以理解成,AI未来会有两个方向,一条在线下,沿着具身机器人方向走,主要承担“蓝领”工作,另一条在线上,即3D数字人,主要负责“白领”工作。

柴金祥:是的,但长远来看,这两条线也会统一。

从实际需求看,现实中的一个白领在虚拟世界里也可以成为一个“蓝领”,乃至其他任何角色,而我们为虚拟世界打造的每个数字人角色,未来都有可能直接驱动现实中的机器人,让它们实现相同的动作,推动AI从虚拟走向现实

虽然直到目前行业对具身机器人的热情仍旧比较高,但我认为,随着大家在虚拟世界中的时间越来越长,AI“白领”的空间将比“蓝领”更广阔。而且作为蓝领的具身机器人,训练难度可能相对还小一点,比如一个动作只要采集到数据、反复训练即可,但“白领”数字人需要的能力更丰富,要想做好更困难,但我认为也更有价值。

Q:就3D数字人领域而言,如果一个公司想跻身头部,最重要的能力有哪些?

柴金祥:我觉得大致可以总结为三个维度。

首先,公司和团队必须要坚定。因为这是一件很难的事情,我们不仅要意识到它的重要性和难度,更要看到它的未来和长期价值;其次是质量,这是最基础的能力。

再次,要有数据和强劲的美术能力。与大模型所需的数据相比,3D数据可能是最高质量的数据之一,我们用了大约十年的时间才构建起目前这个规模的数据库。这个价值点在于,即便是大厂,积累这些数据也需要经历这样漫长的过程和同样的时间。从这个角度而言,我们起步早无疑具有先发优势。

单纯看数字人,门槛其实很低,但有些可能只有对口型的功能,不仅无法生产数字人的动作,更不能驱动人形机器人。这也是为什么2D数字人几乎没有市场,客户也不愿买单,因为效果确实比较差。

此外,即便具备相对充足的数据,从团队的角度看,3D内容生产和AI生成结合的人才目前依旧非常稀缺。尤其是动作表情,全世界范围内的专业人才都很少,所以公司不仅要大胆招聘人才,更要持续培养人才。

Q:人才稀缺的原因有哪些?


柴金祥:一个主要原因是,这个行业的前身是影视动画游戏,这些人才中懂AI的很少,而近几年新兴的AI人才,又很少懂影视动画游戏和3D制作。这两条线不仅数据不交叉,人才也不交叉。


实际上,包括阿里、腾讯、百度、商汤、讯飞等在内的大厂,都曾亲自上阵做过3D数字人,但目前坚持下来的很少,仅剩几个仍在继续的公司做得也不太好。大家可能做个两三年就会发现这件事很难,投入很高也不一定达到预期。

因为这件事不像文生文、文生图那么简单,拿到一个通用大模型改一下就可以。如果没有数据、没有长期的积累,几乎寸步难行。

商业化市场已达一定成熟度

Q:经过近几年发展,AI在提升客户付费意愿方面有何变化,是否有一些案例?

柴金祥:以医院场景为例,其中有一些垂直供应商,负责为医院提供终端产品、软件等服务。这些客户一个个拓展是非常慢的,所以我们就直接输出底层能力,比如在终端实现提问、挂号、付费等,他们可以直接调用我们的API,都不需要额外加价。

但其中有个前提,就是我们本身的规模化程度,包括是否能部署到各种终端、是否足够便宜、是否足够易用等。原因很简单,对于软件产品而言,如果想让别人购买使用,首先要做到人无我有,尤其是大厂不能有,否则肯定会被虹吸;其次要质量过硬,且易得易用。

另外,低成本、高并发、多终端以及信创等都要同时跟上,否则规模化一定会有问题,即便客户很想用,但可能会因为太贵,或者响应时间太长,或者没法实现终端产品的提升等原因放弃购买。

从应用看,如同大模型的发展路径一样,未来AI不仅一定会需要3D数字人这样的“身体”,更需要一个可以随时调用的基础设施去优化资源配置并提升效率。一方面,像陪练、教学、面试甚至银行服务等很多场景,有没有“身体”带来的差异体验会非常大。以后甚至不会有APP,所有的服务都直接由一个数字人来完成。

另一方面,大模型是必须的,但做大模型是有门槛的,这方面我们具备更多积累和先发优势。从语言模型到动作模型,数据能力变得更垂直,有了数据之后如何复制人类的感知能力又极为关键。

从商业化前景上看,我们认为市场也已经达到一定的成熟度。而且,决定做3D数字人基础设施这件事时,我门就已经考察过应用场景,比如赛诺菲就已经开始使用。

换言之,如果市场中多数企业没有相关预算和费用,那我们做再多投入也不会产生很大价值。

Q:目前商业化应用的领域与几年前相比,是否有一些变化?

柴金祥:差不多,只是可能服务不一样。我们成为底层能力后,就可以覆盖所有行业,而且可以做到以前无法实现的功能,比如聊天机器人。

陪伴这个领域,现在大多是没有真人形象或者形象很简单的产品,一旦我们可以输出这种能力,这类产品就可以马上调用,跟调用大模型一样简单。

医院场景也一样,以前我们是没法做的,因为其中的终端设备芯片能力太弱了,比手机差很多。

珐星云有个很重要的特点就是百元芯片也能跑,而且能保证质量因为我们自研的文生多模态3D大模型和云-端拆分的架构创新也正因此,应用场景中对终端屏幕的要求可以不必很高,从而实现了规模化商业化的必要条件。

还有银行,其中的自助终端目前保有量约200万台,如果要把这些都升级为AI终端并达到智能体70%的普及率,这个市场将非常可观,而类似的场景还有很多。

酒店里电视机其实也是一个典型场景,虽然市场很大,但以前由于设备太差根本跑不动,也没法做到规模化。就像如果大模型的token价格不是迅速降低,那么目前大多数终端也不会沾到边,可见便宜是多么重要。

对于我们来讲,很多市场是真实存在、等待开发的,核心在于有没有能力做到足够便宜,质量足够好,体验足够好。这也是我们一直追求的目标。

在海外,输出能力比输出产品更有效

Q:目前海外进展情况如何?

柴金祥:魔珐星云预计两三周以后会在海外上线。

软件产品在海外做B端其实蛮难的,因为高于1万美金的订单基本上都要线下做,这导致软件类产品很难规模化,而且准入门槛也很高。但如果是输出一个“能力”相对比较容易,任何公司只要在线上调试效果即可,所以规模化也相对简单。

截至目前,中国似乎很少有成功全球化的软件产品,但DeepSeek作为大模型这种“基础设施”,通过开源的方式就迅速实现了大规模的全球化应用。

所以,如果你的技术非常强,做到了应用,就应该成为基础设施但要避开大厂的能力,否则如果在成本、易用性上面没有优势,必定会很快被大厂吞没。

Q:海外是否有已经触达的场景?

柴金祥:我们此前已经积累了不少服务在华外企的经验,验证了我们的底层的能力,比如Chatbot、陪练模型等。这些东西放到美国也有很大需求,尤其比如销售、陪练甚至客服、面试等领域,可能需求比国内还要大,但们海外很多国家现在还不具备这方面的能力,所以我们要做的就是去触达各行各业。

另外,有些行业可能已经具备了一些智能体,但这些智能体既没有形象也没有身体,又或者他们已经调用了某个大模型,但也是只有大脑没有身体,这些都是我们可以拓展的空间。

Q:海外上线的第一站会选在哪里?

柴金祥:我们会直接全球同步上线。在产品设计研发阶段,我们就已经植入了全球各地的语言和形象,但未来主打市场可能还是希望在美国。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5.15早评|出乎意料!光着站岗!A股要爆!

5.15早评|出乎意料!光着站岗!A股要爆!

龙行天下虎
2026-05-15 08:20:06
36岁哈登太狠了,又达成80年NBA独一无二纪录,要2年8000万不过分

36岁哈登太狠了,又达成80年NBA独一无二纪录,要2年8000万不过分

大西体育
2026-05-14 20:29:11
太平公主到底有多放纵?深夜急召壮汉入府,次日宫女连头都不敢抬

太平公主到底有多放纵?深夜急召壮汉入府,次日宫女连头都不敢抬

网络易不易
2026-05-14 12:37:31
《生活大爆炸》续集首曝预告,多位老面孔回归

《生活大爆炸》续集首曝预告,多位老面孔回归

追星雷达站
2026-05-14 08:11:02
长得漂亮却坏事做尽,三次入狱,被摘除4处器官的她,如今怎样

长得漂亮却坏事做尽,三次入狱,被摘除4处器官的她,如今怎样

地球记
2026-05-14 04:32:28
何猷君奚梦瑶夫妇吃路边大排档,还带保镖一起,也是太接地气

何猷君奚梦瑶夫妇吃路边大排档,还带保镖一起,也是太接地气

话娱论影
2026-05-15 11:30:22
华为Mate X7直降1000元

华为Mate X7直降1000元

界面新闻
2026-05-15 09:45:02
成了,中国和美国谈成了

成了,中国和美国谈成了

安安说
2026-05-15 10:50:12
原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

夜深爱杂谈
2026-05-14 20:28:51
iPhone 17 Pro大降价!网友:安卓阵营的日子更不好过了

iPhone 17 Pro大降价!网友:安卓阵营的日子更不好过了

快科技
2026-05-15 11:37:31
灰色紧身套装杀疯!贴身包裹下的原生曲线太顶了

灰色紧身套装杀疯!贴身包裹下的原生曲线太顶了

只要高兴就好
2026-05-15 05:30:46
Model Y降价到24.99万仍是智商税?三电、空间遭国产车降维打击!

Model Y降价到24.99万仍是智商税?三电、空间遭国产车降维打击!

阿芒娱乐说
2026-05-14 11:16:01
广西壮族自治区主席韦韬一行莅临广西五和博澳药业调研指导

广西壮族自治区主席韦韬一行莅临广西五和博澳药业调研指导

环球网资讯
2026-05-14 16:50:17
禹作敏最嚣张的时候有多无法无天?

禹作敏最嚣张的时候有多无法无天?

尚书乔
2024-11-10 00:00:03
从教15年,我终于看清:“从不补课”的年级第一,到底骗了多少人

从教15年,我终于看清:“从不补课”的年级第一,到底骗了多少人

户外阿毽
2026-05-14 11:52:08
马斯克:空军一号上只有我和黄仁勋!网友:全球最有钱的和全球市值最高的才有机会坐

马斯克:空军一号上只有我和黄仁勋!网友:全球最有钱的和全球市值最高的才有机会坐

大白聊IT
2026-05-14 00:58:40
“工资表”被查了,罚款632.88万元!5月起,这25个发薪危险点,企业抓紧自查

“工资表”被查了,罚款632.88万元!5月起,这25个发薪危险点,企业抓紧自查

祥顺财税俱乐部
2026-05-15 09:09:03
时隔九年,特朗普再访华:2017年他带走了2535亿美元大单,2026年他能带走什么?

时隔九年,特朗普再访华:2017年他带走了2535亿美元大单,2026年他能带走什么?

昨日Mirror
2026-05-15 10:06:56
朱芳雨拒绝放走焦柏乔!广东第一中锋将离队,曾被杜锋点名要人!

朱芳雨拒绝放走焦柏乔!广东第一中锋将离队,曾被杜锋点名要人!

绯雨儿
2026-05-15 08:38:33
特朗普访华,日本有了新计划,俄喊话中国,李在明的表态真高明

特朗普访华,日本有了新计划,俄喊话中国,李在明的表态真高明

瞻史
2026-05-15 09:34:15
2026-05-15 12:24:49
明亮Company incentive-icons
明亮Company
追踪新商业、好公司。
651文章数 408关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

103岁和86岁老人认识3个月"闪婚":孤独感消失了

头条要闻

103岁和86岁老人认识3个月"闪婚":孤独感消失了

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛回应住男生单人间:女孩的配得感

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
手机
艺术
公开课
军事航空

教育要闻

初升高访校高峰已到!这些门门道道要搞清楚

手机要闻

谷歌推送安卓Canary 2605,整合Frosted Glass类磨砂玻璃风格

艺术要闻

15幅 丹麦画家Carsten Henrichsen风景油画

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版