网易首页 > 网易号 > 正文 申请入驻

把数字人变得更有呼吸感,这家张江公司7年做了什么?

0
分享至

今年初以来,Chat GPT在国内刮起一股大语言模型的旋风,构建于大语言模型之上的产品应用成为行业热点,AI大模型加数字人便是一大热门方向。

叠境数字科技(上海)有限公司,上海科技大学孵化的第一家企业,早在2018年就打算用AIGC和光场采集技术去驱动数字人,让数字人变得更加真实,更加“能说会道”。

近日,张通社来到位于张江绿地MTOWN的叠境数字,请数字人业务总经理李彦,谈一谈叠境数字的数字人产品以及她对技术与赛道的看法。

以下是采访实录,对内容略有删减。

01

AI让数字人能“聊天”

张通社:叠境数字目前有两大业务板块,其一是城市级数字孪生,其二是数字人。两者似乎有着挺大的差异。从公司定位看,叠境数字为什么要发展这两块业务?

叠境数字(李彦):叠境数字是上海科技大学孵化的第一家企业,公司愿景是“创造每个人都可以拥有的元宇宙”。我们希望将上科大的科研成果进行转化,开发出相应的产品来。

虽然这两块业务的着力方向不同,数字孪生的重点在于大规模城市的数字底座快速创建,数字人的重点在于形象的生动逼真,交互自然,但是两者依赖着相同的底层技术栈:他们都是以叠境数字的人工智能与光场采集作为底层技术栈。数字孪生业务就用到了我们在人工智能技术上的全部技术积累,着力在大尺度静态场域;数字人业务则用到了光场采集技术和智能视觉技术(人工智能的一个分支),着力点在塑造数字人超写实的外形和拥有通用性的沟通理解能力。

我们认为数字人不应该只有一个好看的皮囊,他/她应该能和人对话,变成更加智能的数字人。目前,叠境数字拥有一百多项自主研发的人工智能及光场视觉知识产权,这构建了我们在数字人业务上的专业技术壁垒,让我们有足够的技术实力去发展数字人业务。

张通社:叠境数字成立于2016年,从2018年开始,叠境数字就开展了数字人业务,公司的数字人业务的发展经历了什么过程?

叠境数字(李彦):叠境数字一直坚持用算法驱动数字人,目前数字人业务经历了三个阶段的发展。在第一阶段,我们运用了计算机图形学的技术能力,为一些知名艺人构建了数字分身,这些数字分身是基于视频形式而呈现的,会被投放到歌星的演唱会现场。

在第二阶段,我们开始和视觉创意顶流的艺术家合作,共同构建原创的数字人形象。这些数字人主打形象美观和逼真,皮肤细节要做到十分清晰。这些数字人形象曾和不少知名一线消费品牌方达成合作,成为它们的品牌代言人。不过,这属于客户定制款,每个数字人都有自己的脚本,制作成本相对较高。

在第三阶段,我们看到了Transformer神经网络模型,高性能的算力和海量的数据带来了生成式AI浪潮,并认为生成式AI与数字人结合将是一个很好的机会。有了AIGC,数字人不光是一个人形,它可以和人类进行交流,应用场景变得更多了。这是我们当下数字人业务的着力方向。

02

AI数字人是如何炼成的?

张通社:一位AI数字人,它的背后具体会由哪些技术驱动的?

叠境数字(李彦):首先,我们认为一位AI数字人要用到计算机图形学技术,用于高效地生成美观逼真的人物形象。

其次,他/她的交互部分涉及大语言模型和语音识别生成技术。大语言模型可以让数字人自然地回复人类的提问,语音识别技术可以将人类语音转化为计算机可解读的文本。具体而言,人们说的话,通过语音识别技术,输入进大模型中去,从而生成对应的对话语句,最后通过语音生成技术,让数字人讲出来。

除了让数字人说话互动的部分,我们还运用光场采集技术与深度神经网络,让数字人的说话方式与人物形态更加自然和真实。按照行业内的说法,就是把数字人变得更有呼吸感。我们会用深度相机捕捉上百个人类真实的说话声音、口型以及动作,并生成对应的3D模型,输入深度神经网络之中,让AI学习人类自然的说话方式。通过这样的AI学习,数字人说话的语音语调和动作神态就会变得更加真实自然。

张通社:目前,制作一位AI数字人遇到的最大技术挑战是什么?

叠境数字(李彦):现在最大的技术难点在于数字人说话与口型对应起来。如果一位数字人所说的话,与他/她的嘴型无法一一对应,就会显得不真实。

为了让数字人的声音与口型对应起来,我们运用深度相机去捕捉数百人的说话口型,包括普通人和专业播音员,并把这些关于口型的3D数据输入AI模型。从目前进展看,我们能够做到中文语音和口型贴合自然。比如,当发出拼音里“o”的音时,人类会有轻微噘嘴的动作,而我们的数字人也会显示与人类一样的嘟嘴口型。

我们还准备进一步改进这项技术,让他/她不仅能捕捉说话人的口型,而且还能捕捉人的面部上百块肌肉变化,这就能让数字人呈现更自然的说话神态,精度可达毫米级别。

03

数字人的应用场景被AI拓宽

张通社:AI数字人的应用场景是什么样的?

叠境数字(李彦):目前,我们在新闻媒体与地产园区都有落地的项目。这些数字人可为我们客户提供“提效”的价值。

例如,我们已与第一财经达成合作,为他们制作了新闻主播数字人伊可。以往新闻主播的工作往往需要一个团队的支持,涉及到摄影师、化妆师、导播等人员。

对于数字人伊可,她的声纹、口型和动作均基于深度神经网络生成。同时我们根据第一财经主播的外形,精心设计了符合主播风格的数字人形象。只需要一份文字稿件,不需要其他人员参与,数字人伊可就能完成实时直播。

除此之外,我们的数字人还落地于园区运营企业。这些数字人可以实现员工入园的门禁打卡,访客身份识别和接待、预订会议室等功能。

张通社:据说叠境数字正在开发手语大模型,这是一款怎么样的产品,请介绍一下这款产品以及开发进度?

叠境数字(李彦):这是一款面向聋哑人的AI大模型产品。一般而言,聋哑人通常使用手势和口型进行沟通,那么通过这款产品的协助,聋哑人能和正常人进行无障碍沟通。

为了更好地贴合聋哑人真实的交流情况,我们分别对通用手语和上海地区自然手语,采集了2000至3000个常用手语字的数据。

为了力求真实,我们坚持收集关于手语的多种多样的高质量数据内容。

首先,我们在光场采集设施中获取大量关于口型和手势的样本,并且样本年龄分布大,包括小孩和老人多层次年龄段。其次,我们还进入社区服务中心和医院,用相机记录聋哑人在真实情形下的手势和口型状态。

仅仅记录常用的手语字还不够,我们还记录下聋哑人在真实语境中,表达一段完整意思的影像。于是,我们团队分别在几十个具体的交流场景中,用深度相机记录下聋哑人如何表达完整的一句话。

通过这种方式,可供AI学习的数据不再是一个个间断的字,而是一句句连续的话,资料更贴合真实的交流状态。通过这些高质量数据的训练,手语大模型的生成手语内容会更加真实自然。

对于工作进展,我们已经基本完成了数据采集,预计今年10月完成手语大模型的第一版本,推广至城区的几个社区服务中心。明年6月,手语大模型会推广至全上海市聋哑人办事的窗口单位。

04

数字人的未来发展方向

张通社:当下的数字人赛道显得格外热闹,一些属于围绕IP重运营的虚拟偶像,一些是有着中之人的虚拟主播,还有用AI驱动的服务型数字人。您怎么看待未来数字人赛道发展?

叠境数字(李彦):我认为未来各种各样的数字人一定是百花齐放的,不同场景不同需求会需要不同的数字人。未来的数字人不会取代人,但是很有可能数量会超过人。随着技术不断进步,数字人的制作成本会不断降低,功能会更加强大,它们会变得更多,像NPC一样生活在我们周围。

从叠境数字着力发展的服务型数字人看,我觉得这种数字人能体现出一种服务平权。原来专人提供的VIP服务,现在只需一位数字人就能办到,一位数字人可让成千上万的人享受VIP服务。

从不同服务对象看,To B场景中的数字人能为企业提高效率,原本需要一群人去做的事情,现在一个数字人就能完成。To C场景中的数字人可以提供陪伴价值,比如陪着说话,讲故事。对于一些特殊群体,这些数字人可为他们获取原本难以获取的信息,比如为老人阐述养老金等扶助政策。

张通社:数字人技术演进到现在,仍有不少人不认可这种产品,他们觉得数字人仍然不够真实,您怎么看待这个现象?

叠境数字(李彦):我相信,给技术一些时间,数字人技术一定会不断地自我迭代。只要不断用它,它一定会越来越好。

当下数字人之所以不够真实,因为还有技术瓶颈待突破。之前,一位客户抱怨数字人就是一个假模特,买回来以后就束之高阁,没有用。等到今年生成式AI爆发后,这位客户又找回来了,他觉得数字人可以和人交互了,变得更有用了。

又比如,以往的数字人企业需要消耗大量的GPU资源去渲染数字人的精美外形。不过,随着技术不断突破,他们发现自己对GPU的依赖正在不断下降,并且性价比高的GPU变得越来越多,制作数字人成本将会不断下降。

所以,我觉得技术发展是一个螺旋上升的过程。过几年后,数字人的技术会更上一个台阶,更加具有真人感,会有更多人愿意与数字人交互起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马斯克空降中国,不是为了造车!他盯上一个比芯片更致命的资源

马斯克空降中国,不是为了造车!他盯上一个比芯片更致命的资源

米师傅安装
2026-02-17 20:56:23
大年初四,中方通告全球,美军机闯入黄海,解放军第一时间反制

大年初四,中方通告全球,美军机闯入黄海,解放军第一时间反制

Ck的蜜糖
2026-02-21 02:39:23
花滑女单两大日本夺冠热门失误丢金!张瑞阳第19

花滑女单两大日本夺冠热门失误丢金!张瑞阳第19

体坛周报
2026-02-20 08:51:10
当利润跌破4%,一场比新车更惨烈的战争开始了

当利润跌破4%,一场比新车更惨烈的战争开始了

大佬灼见
2026-02-20 09:03:49
真相大白!疑微博之夜换位置女子正面曝光,和杨幂助理多细节对上

真相大白!疑微博之夜换位置女子正面曝光,和杨幂助理多细节对上

喜欢历史的阿繁
2026-02-19 17:08:33
农村怪象越来越多,除了“妻荒”外,如今又有4大怪象出现了

农村怪象越来越多,除了“妻荒”外,如今又有4大怪象出现了

长歌侃娱
2026-02-20 13:19:06
龙云得知儿子被解放军击毙后,怒闯中南海,毛主席却摆手:你回家看看吧

龙云得知儿子被解放军击毙后,怒闯中南海,毛主席却摆手:你回家看看吧

历史回忆室
2026-02-18 23:40:13
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
俄国对中国统一大业的态度大变?台海若开战,俄军会有什么动向?

俄国对中国统一大业的态度大变?台海若开战,俄军会有什么动向?

通鉴史智
2026-02-19 21:59:34
点赞中超冠军,海港为中超争光:让对手创耻辱纪录,主帅即将下课

点赞中超冠军,海港为中超争光:让对手创耻辱纪录,主帅即将下课

建哥说体育
2026-02-20 08:00:00
美俄背后“分赃”?王毅好猛,一句话说透真相,欧洲听完集体破防

美俄背后“分赃”?王毅好猛,一句话说透真相,欧洲听完集体破防

井普椿的独白
2026-02-19 17:33:02
龙门石窟一游客被抬上救护车,救援人员称因突发疾病导致,景区曾发公告称游客接近最大承载量停止售票

龙门石窟一游客被抬上救护车,救援人员称因突发疾病导致,景区曾发公告称游客接近最大承载量停止售票

极目新闻
2026-02-20 15:20:03
3月开始中国或将迎来四大降价潮:除房价以外,这5类也要降价了

3月开始中国或将迎来四大降价潮:除房价以外,这5类也要降价了

说故事的阿袭
2026-02-19 10:35:24
太真实!河南舅舅锁门躲拜年,一看门口礼物,戳中无数人的痛点…

太真实!河南舅舅锁门躲拜年,一看门口礼物,戳中无数人的痛点…

瓜哥的动物日记
2026-02-21 00:04:26
刘震云:一个人不喜欢去别人家,也不喜欢别人来自己家,十有八九是这几种心态!

刘震云:一个人不喜欢去别人家,也不喜欢别人来自己家,十有八九是这几种心态!

LULU生活家
2025-12-26 19:00:16
油价大降超0.45元/升,创近新低的油价,春节后2月24日油价或再涨

油价大降超0.45元/升,创近新低的油价,春节后2月24日油价或再涨

油价早知道
2026-02-21 00:21:46
曝超级外援有望重返CBA!曾单场狂砍43+9,山东、北京或全力争抢

曝超级外援有望重返CBA!曾单场狂砍43+9,山东、北京或全力争抢

老叶评球
2026-02-20 09:33:53
为什么女人在发生关系后,都想让男人帮她拍照呢?

为什么女人在发生关系后,都想让男人帮她拍照呢?

思絮
2026-01-10 19:44:13
临近春节,《惊蛰无声》被多家影院控诉,张艺谋或将脸面尽失

临近春节,《惊蛰无声》被多家影院控诉,张艺谋或将脸面尽失

TVB的四小花
2026-02-20 23:40:11
2026-02-21 03:52:49
张通社
张通社
加冕科技旗下深耕产业园区的科创新媒体。
1900文章数 194关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

艺术
时尚
本地
公开课
军事航空

艺术要闻

你绝对不想错过的石涛五十幅国画作品!

冬季羽绒服是最“受捧”的单品,这样选款和搭配,舒适耐看

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

消息人士透露:美军赴黄海活动 解放军有效应对处置

无障碍浏览 进入关怀版