网易首页 > 网易号 > 正文 申请入驻

罗永浩在用的数字人,拿下世界互联网大会科技大奖

0
分享至


智东西
作者 李水青
编辑 漠影

今年6月,罗永浩的数字人登上百度电商直播间,连续6小时不间断“带货”,一边调侃、一边拎着可乐、喝着奶茶,与助播朱萧木的数字人一唱一和,引发1300万人次围观。这场直播最终实现GMV(商品交易总额)5500万元,刷新了数字人带货纪录。

▲罗永浩的数字人直播

现在,驱动这场直播的“AI总导演”,站上了世界互联网大会乌镇峰会的领奖台。

在11月6日至9日举行的2025年世界互联网大会乌镇峰会上,百度“剧本驱动多模协同的高拟真数字人技术”荣获领先科技奖,实现连续三年获奖。


▲百度CTO王海峰在讲解高拟真数字人技术

从罗永浩的数字分身到世界互联网大会的领奖舞台,我们看到数字人好像跟前几年我们印象中的不一样了,一个问题随之浮现:

让数字人跨越“形似”的初级阶段,进入“神形兼备”的全新境界,百度是如何做的?

一、乌镇大会上的AI新风向:数字人成大模型经典落地场景

世界互联网大会“领先科技奖”是全球互联网科技发展的一个风向标。

在今年的世界互联网大会乌镇峰会上,评审委员会从34个国家和地区征集了424项科技成果,经海内外专家评审,最终遴选出17项年度领先成果。

其中,作为融合了大语言模型与多模态技术的创新应用,百度“剧本驱动多模协同的高拟真数字人技术”成功入选。一同入选的还有中国科学院计算技术研究所、中国科学院软件研究所的“处理器芯片软硬件全自动设计”,清华大学“北斗三号卫星导航信号关键技术及应用”等成果。


▲2025年世界互联网大会领先科技奖颁奖现场

当下,数字人正成为AI最具代表性的落地场景之一。百度“剧本驱动多模协同的高拟真数字人技术”体现了这一趋势,不仅是语言、视觉、语音技术的融合创新,更是百度多年AI技术的集大成者。

从2023年“知识增强大语言模型关键技术”到2024年“文心智能体技术”,百度成为唯一连续三年获奖的人工智能公司。

二、何以“高拟真”?5大核心技术,为数字人注入“灵魂”

过去我们谈数字人,更多是关注“像不像”;而今天百度的数字人,已经进入“神似”的维度。何以“高拟真”?

其核心,在于以文心大模型为内核的“剧本驱动多模协同技术”,让数字人具备了自我理解、规划和表演的能力。该技术有以下五大创新点:


1、剧本驱动多模协同:为数字人注入“灵魂”

传统数字人依赖人工脚本和单模态驱动,而百度的这项技术能生成一份真正意义上的“剧本”, 剧本生成的核心在于语言模型驱动下的多模态协同,不仅有“说什么”,还有“怎么说、说的时候怎么配合动作表情”。

比如,当提到“法令纹”时,视觉系统会自动指向对应面部区域;当数字人“送福利”时,语音模块会自动调整语调,表现出兴奋情绪。甚至在双人互动时,还能标记“在哪个词后接话”,实现无缝对话。

这让数字人不再只是“说话的模型”,而是真正拥有导演级的多模态表达协调力。


2、融合多模规划与深度思考的剧本生成:让对话自然流畅

数字人不止能说台词,还能“思考剧情”。百度通过融合多模规划与大模型推理,实现了对对话上下文的整体理解。

在直播中,数字人不仅能按照预设剧本推进,还能根据直播间实时热度及用户反馈,智能调整讲解节奏与互动内容,实现衔接自然的动态交互。

这正是数字人老罗能秒接网络热梗,展现出鲜明人设与活泼语言风格的技术基础。

3、动态决策的实时交互:赋予“临场反应”能力

基于大模型的实时感知与决策能力,数字人不再是单向输出的播报机器,而具备了类似真人的现场“判断力”。

它能够理解弹幕评论、感知直播间氛围,并据此做出实时反馈,如回答用户提问、玩梗互动、调整讲解策略,从而极大提升了互动的真实感与用户的参与感。

4、文本自控的语音合成:告别“机械朗读”

声音,是数字人“灵魂”的另一半。百度的语音合成大模型通过“文本自控”机制,让声音摆脱机械朗读感,实现与表达与语义、情绪高度一致。

其核心在于,模型能深度理解直播台词的文风与语境,并结合发音人(如罗永浩)的独特特征,将文本信息“翻译”成自然、富有感染力的声音。

通过对话上下文编码器,百度解决了双人直播中声音配合的难题,实现了罗永浩与朱萧木数字人之间流畅、自然的对话效果。


5、高一致性超拟真长视频生成:挑战“时长极限”

数字人直播常常持续数小时,如何让其在长时间内保持表情、动作和场景的自然连贯,是一项行业难题。

百度通过结合多模态视频理解、跨模态信号生成等关键技术,攻克了高可控交互、长时间一致性保持等业界难题,实现了高一致性、超拟真的数字人长视频生成,将AI视频生成的应用边界从“秒级”拓展至“小时级”。

罗永浩数字人直播6小时全程动作自然、视线交互精准,就是这一技术的成果。

可以看到,百度以“神、形、音、容、话”的统一能力,构建一个兼具表达力与情感力的数字人系统。它不只是模仿人类,而是在理解人类表达逻辑的基础上“再创造人类体验”。

三、从罗永浩到万千场景:10万数字人,让开播成本暴降80%

顶尖的技术价值,最终需要通过大规模应用与实实在在的商业效益来验证。

在百度,这项获奖技术的规模化落地已现成效。官方数据显示,基于该技术已生产超过10万个数字人,覆盖电商、教育、法律、健康等数十个行业,助力商家开播成本降低80%,直播转化率提升31%。

以“罗永浩数字人”为例,其6月15日的首秀不仅是技术实力的展示,更是一场成功的商业实践:

整场直播持续6小时,AI调用知识库1.3万次,生成9.7万字产品讲解内容,双数字人搭档做出超8300个动作。从直播效果来看,整场直播吸引1300万人次观看,GMV突破5500万元,部分核心品类带货单量甚至超过罗永浩5月真人首秀同期数据。

罗永浩本人也通过视频表示“让我惊讶”、“完美收官”,称数字人直播“可能代表了电商直播的新趋势”。

▲罗永浩的数字人直播

技术红利正渗透至千行百业。在山东德州夏津县,三位平均年龄超65岁的老支书,借助百度“慧播星”数字人技术,进行7×24小时不间断直播,精准讲解产品、实时回复问题。开通数字人直播短短一个月,他们的地瓜直播间订单近万单,总销售额突破15万元,成功售出农产品3.3万斤

据悉,这种“真人+数字人”双轨模式已形成可复制的助农路径——百度电商“一村一品”项目通过“慧播星”等技术,累计帮助全国1000多户农民增收,商品交易总额超2500万元

可以看到,从超头主播的直播间到田间地头的助农现场,百度数字人技术正在智能客服、虚拟教师、数字代言人、互动娱乐等多个领域落地开花。

结语:AI数字人迎技术产业升级,带来商业新增长点

从罗永浩直播间里那个能接梗、会互动、神形兼备的数字人,到赋能十万数字人降低商业成本、提升转化效率的产业平台,我们看到,以大模型为核心的AI数字人技术,已成为驱动产业升级、创造商业新增长点的强大引擎。

数字人的发展,已走过“形似”、“神似”,正进入百度所定义的“高拟真”、“高说服力”阶段。而未来,数字人或将真正在某些方面超越真人,实现超长待机、千人千面、多语言多风格的极致服务。

过去的十年,百度在AI上的每一次突破,都像是铺设通向未来的基石。世界互联网大会展现出的新风向表明,技术长期主义与系统化布局是推动智能产业发展的必由之路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
反转!库尼亚力劝拉特克利夫:曼联必须推翻这位巨星离队决定

反转!库尼亚力劝拉特克利夫:曼联必须推翻这位巨星离队决定

奶盖熊本熊
2025-11-08 12:17:14
损失惨重!特朗普20亿美元比特币押注“爆雷”,从“信徒”到“受害者”只用了半年

损失惨重!特朗普20亿美元比特币押注“爆雷”,从“信徒”到“受害者”只用了半年

FX168链界观察
2025-11-08 10:25:12
广州市教育局明确:并非“官方”教辅

广州市教育局明确:并非“官方”教辅

番禺台
2025-11-08 00:09:22
她是马斯克的白月光:美的无可挑剔,生理性喜欢!上头不是没原因

她是马斯克的白月光:美的无可挑剔,生理性喜欢!上头不是没原因

牛牛叨史
2025-11-06 15:48:40
曝美团人员在京东折扣超市偷装摄像采集设备,窃取商业信息被警方带走

曝美团人员在京东折扣超市偷装摄像采集设备,窃取商业信息被警方带走

星岛记事
2025-11-07 18:51:23
我退休52岁,找个48岁农村光棍,洞房夜他的一个举动,我泪流不止

我退休52岁,找个48岁农村光棍,洞房夜他的一个举动,我泪流不止

今日美食分享
2025-11-08 06:03:39
张素芬11月加仓动向公开!布局冷门股,散户速看!

张素芬11月加仓动向公开!布局冷门股,散户速看!

慧眼看世界哈哈
2025-11-08 08:40:05
北京协和医院专家:“主食越少越好 甚至完全不吃”观念需纠正

北京协和医院专家:“主食越少越好 甚至完全不吃”观念需纠正

红星新闻
2025-11-06 17:53:32
一觉醒来印度的天塌了!美国和巴基斯坦太狠,中国:我啥都不知道

一觉醒来印度的天塌了!美国和巴基斯坦太狠,中国:我啥都不知道

书中自有颜如玉
2025-11-08 12:57:53
特斯拉 Model Y 新版本发布,续航离谱!

特斯拉 Model Y 新版本发布,续航离谱!

花果科技
2025-11-08 11:07:56
中国恢复安世芯片出口,荷兰将放弃控制权

中国恢复安世芯片出口,荷兰将放弃控制权

半导体行业观察
2025-11-08 10:15:00
学医后才明白,降血压最好的习惯,不是多运动、少吃盐,而是这个

学医后才明白,降血压最好的习惯,不是多运动、少吃盐,而是这个

今日养生之道
2025-11-08 02:56:12
刘道玉被免去武汉大学校长的真实原因

刘道玉被免去武汉大学校长的真实原因

听哲学
2025-11-08 12:30:00
惨败掘金25分只是开始,两点或让勇士提前退出冠军争夺

惨败掘金25分只是开始,两点或让勇士提前退出冠军争夺

姜大叔侃球
2025-11-08 14:17:53
陈梦这到底是没占着天时地利,还是实力真就差了点啊

陈梦这到底是没占着天时地利,还是实力真就差了点啊

小光侃娱乐
2025-11-08 11:15:03
荷兰服软,中国芯片恢复供货,台媒:荷兰这一跪,承认全面败北

荷兰服软,中国芯片恢复供货,台媒:荷兰这一跪,承认全面败北

王姐懒人家常菜
2025-11-08 01:32:44
强得可怕!日本科学家发明蓝光LED获诺奖,彻底改变人类生活

强得可怕!日本科学家发明蓝光LED获诺奖,彻底改变人类生活

麦大人
2025-10-26 15:03:11
人民网痛批!广州地铁捅大娄子!网友:我只想坐地铁,不想被割!

人民网痛批!广州地铁捅大娄子!网友:我只想坐地铁,不想被割!

娱乐圈见解说
2025-11-08 01:38:05
特斯拉股东大会引爆科技圈:自动驾驶安全性超人类10倍,2026年迎机器人与Cybercab量产潮

特斯拉股东大会引爆科技圈:自动驾驶安全性超人类10倍,2026年迎机器人与Cybercab量产潮

环球网资讯
2025-11-07 16:09:04
央视11月8日直播乒乓时间表:CCTV16直播全运会乒乓球!附赛程表

央视11月8日直播乒乓时间表:CCTV16直播全运会乒乓球!附赛程表

皮皮观天下
2025-11-08 08:49:32
2025-11-08 14:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10713文章数 116894关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

头条要闻

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

梁婷为辛芷蕾发声:没什么可质疑的

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

数码
艺术
时尚
教育
公开课

数码要闻

每周一部原创:苹果高管透露 2026 年 Apple TV 内容“轰炸”计划

艺术要闻

邱振中教授热衷丑书,被喷“高等学府里的混混”,冤枉他吗?

推广 || 断舍离N次也不会断了它,买过最值的冬日单品之一

教育要闻

张桂梅:宋佳年轻漂亮,但“有些脾气还是像我”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版