网易首页 > 网易号 > 正文 申请入驻

今日启明星︱数字时代的追光人——访2023级星友张迎梁博士

0
分享至

张迎梁

叠境数字科技(上海)有限公司

首席技术官

邀约张迎梁进行采访,有他作为星友代表在2023年启明星颁证会上发言这一因素。但于我而言还想满足两个诉求:一是启明星协会顾庆生秘书长一直希望能够多提供一些星友中的创新创业榜样;二是近年来时常听到数字人、数字孪生等名词概念,我虽对这些概念有自己的解读,但感觉还是不够深入。那天在星友颁证会上张迎梁的发言让我意识到他就是我要找的人:

“作为一名人工智能领域的科研人员,我一直用‘追光之旅’来形容自己的科研生涯。在上海科技大学读研究生时,我首次接触到了光场的概念。大多数人听到光场的时候,第一反应都是好奇这是什么,能干什么?其实我一开始也有同样的疑问,直到熬夜写完第一个光场渲染器时,看着屏幕上渲染的画面能够动态变焦时,我才意识到,‘噢,这就是光场渲染啊’。”

“惊出几身汗”的调试过程至今难忘

大一时迎梁才开始接受编程方面的训练,他当时对编程非常感兴趣。大二时报名参加了学校和宁波市的编程大赛,他很享受写代码,并通过代码解决问题的过程。对代码和编程语言的日益熟悉让他逐渐找到自己感兴趣的研究方向,也让他逐渐意识到自己的知识储备、研究深度等远不足够,因此迎梁决定继续攻读硕士学位,希望能够更深入地探索计算机领域。在备战考研期间,迎梁被刚建校的上海科技大学的办学模式、实力和愿景所吸引,最后十分幸运地成为上海科技大学信息学院的第二届研究生。

当时上科大张江校区还在建设中,第一年的教学、科研实验是在岳阳路319号中国科学院上海分院的8号楼进行的。研二时,上科大的研究生学习暂转到张江海科路的中国科学院上海高等研究院。那段时间研究生们会在岳阳路、海科路两边跑。

有一次为向校内外专家和领导演示他们实验室在光场数据采集方面的科研工作,需要快速搭建一套演示装置,并完成一些硬件搭建和软件算法调试的工作。此次要调试的设备是由8个相机模组组成的相机阵列。

他们临时接到通知,演示提前到了第二天上午,距离领导来访只剩下十几个小时,张迎梁和一位博士生一起承担起相机阵列采集重建的演示调试工作。迎梁从当晚一直到第二天早晨通宵达旦不断调试,但直到临近领导要来观看的时间点还是没有调试出结果,迎梁说自己在整个过程中已是惊出几身汗,所有人已准备放弃。好在功夫不负有心人,在最后的10分钟,裸眼三维显示屏上终于出现了立体的光场渲染效果,最终得以如时、如愿完成演示。

这个过程虽然很痛苦,但对迎梁的启发也很大。“只有自己喜欢一件事,才会有动力去为这件事情付出全身心的投入和努力。”他笑着说道。

张迎梁从容地面对科研路上的种种挑战,不畏艰难,始终朝着心中那个方向前进,因为他相信,星光不问赶路人,时光不负实干人。

回溯“惊出几身汗”的那次调试情景,迎梁至今记忆犹新,印象深刻。

“现在我更清楚,当时我们所演示的就是通过多相机光场阵列,利用光的摄入完成物体的光场信息采集,以达到获取被采物体的更精细、更准确的几何和材质信息来做物体的实时3D渲染。”

那次令迎梁终生难忘的演示也让第一次看到这样渲染效果的领导和专家被惊艳到。迎梁也是从那时起接触到光场技术,并以此作为他之后的科研方向。后来他又在此基础上继续研究光场的重建和渲染,并发表了相关学术论文。而他的博士课题正是基于光场数据的三维重建。

研究生时加盟叠境

5年后成为首席技术官

这次对张迎梁的采访是在距上科大咫尺之遥的叠境数字公司内完成的。采访后半段的话题转向叠境数字和被访人如何走向创业之路。如今已是叠境数字首席技术官的张迎梁这样讲述道:

过去20年里,《黑客帝国》《头号玩家》等科幻电影中的构想成了元宇宙的最初蓝本——人们通过脑机接口或者虚拟现实(VR)头盔连入逼真的虚拟世界,在那里社交、生活、工作,分不清虚幻和现实——而‘叠境’这个看起来略带诗意的词汇,其实意味着一个把虚拟和现实重叠起来的环境,即一个把一切实物数字化的环境,完美诠释了平行世界与数字未来的高度互通。

除此之外,张迎梁对“叠境”的理解也在不断深化:“叠境从中文语义来讲是重叠的环境,既有现实又有虚拟环境重叠交织的涵义。叠境数字这些年一直在做数字化的物体、人物、场景。英文名DGene还有一层涵义是未来虚拟世界的人或许具有数字基因。这个名称里还有数字化的时代、数字化生成的涵义。”

听完“叠境”名字由来的故事,我仿佛探索了一个充满挑战和惊喜的数字世界,思考了虚实世界的本质和意义。作为上海科技大学孵化的第一家人工智能企业,叠境数字自2016年成立以来,坚持基础研发,围绕光场技术、三维重建、智能视觉等核心技术,先后研发了动态光场影棚、穹顶光场、自由视点等多视角采集系统。2020起,公司依托与上科大的科研合作,尝试通过人工智能技术,降低元宇宙内容的制作成本,探索产学研一体化的创新路径。

“伊可”让数字人技术走近大众

公司目前的主要业务就是数字人和数字孪生,叠境数字也是国内最早一批从事这方面技术研发的专业机构之一。

虚实融合数字孪生底座系统通过叠境数字长期在光场技术和三维智能视觉领域的技术积累,以精准的三维模型、GIS信息系统为依托,连通孤立的二维视频数据,将动态视频与静态场景相融合,使碎片化的场景在数字孪生底座中全方位展现,构建可以实时响应动态数据的数字孪生三维系统,提升三维时空的全景可视可达与智能感知研判能力,实现高效指挥、管理和运营的目标。主要面向城市治理、工业智能、园区管理、应急指挥等数字化应用场景的需求。

数字人包括从品牌代言、功能型播报数字人 (如电视台主播) 到与大语言模型相结合的智能数字人。在2023年7月7日第一财经成立20周年的大会上,第一财经携手叠境数字联合打造的数字人主播“伊可”正式上岗,在每个交易日中午11点档的《市场零距离》节目中直播公司和市场资讯,晚间21点在网端的“正在”频道中直播美股盘前资讯。端庄的举止、自然的语速、稳定的状态,作为业界首个多维形象人工智能型数字主播,伊可现在已经参与第一财经四档节目的播报。

“我们利用光场采集技术,准确捕捉人物脸部和姿态特征,并将其制作成模型再进行皮肤、动画加工,随后通过自主研发的语音驱动数字人的人工智能技术,只要把文本输入到系统内,数字人就可以播报,后面不需要‘中之人’来驱动,伊可的口型、脸部表情、眼神等都由人工智能来控制。”迎梁星友说起的数字人主播伊可,我也曾从媒体上看过相关报道,但这两年没有关注,可一问周边的年轻人都说知道伊可。业内也曾有过关于数字人主播的问世对主播这一职业带来的挑战的议论。

“伊可”数字主播采用了全流程智能化的技术方案,数字人形象经过精心设计,依照第一财经主播天团的外形和声音数据,由人工智能与艺术的创意结合而成,既符合媒体主播的职业标准,又符合大众审美。在我看来伊可的问世至少帮助大家开始了解数字人技术,加快了这一技术的普及推广,这无论如何都是件好事。

构建手语大模型

帮助聋哑人理解外部世界

说起近一两年更有意思的研发课题,迎梁的兴奋点被点燃:我们现在正在做的更有意义的是手语大模型,这是今年与上科大、上海广播电视台 (SMG) 一起做的“润爱无声”项目,利用交互智能建立手语大模型,其初衷和目标就是帮助聋哑人看病、办理各种业务,更重要的是让他们更方便融入社会。

聋哑人没有听觉,也没法说话,他们获得信息的途径主要来自视觉,表达自我的方式是手语。为了达到目标,科研人员采集动态的三维人体动作数据、口型数据和文本数据,将多模态数据进行清洗、训练,实现基础的手语模型;在此基础上,优化医院、社区服务中心等特殊领域应用场景,使聋哑人在机器助理的协同下,可以跟普通人一样顺利地看病和办理各种业务;最终通过模型和聋哑人大量的交互,形成自我学习的能力,成为聋哑人了解世界、学习知识过程中不可或缺的伙伴。

为了使以上美好的情景在现实生活中得以实现,张迎梁和团队首先从一个小的应用切入,经多方走访调研后,他们选了如何服务于聋哑人看牙医这样一个非常具体的场景,课题组的设想是服务对象一进入牙防所就有一套针对性的手语服务程序帮助服务对象一一完成诊疗过程。为此,课题组正在与手语老师一起采集手语数据。张迎梁说他充分意识到手语大模型建成不易,但这件事一旦做成其社会意义不言而喻。

手语大模型的另一个应用场景是社区服务,譬如证件遗失补办这种事对聋哑人来说并不容易。但以后聋哑人就可以通过手语直接和一台机器对话来完成身份证补办等一些社区服务项目了。称之为手语大模型,是因为需要采集的手语的量其实很大。

迎梁举例说,手语有很多细节,有通用手语,也有地方性手语,就如同口语表达,既有普通话,也有各地的方言是一个道理。表述同样一件事,不同地区的手语方式有差异,因此手语的采集量很大。此外,已有的手语模型比较偏重于二维,而叠境数字正在做的是三维的手语数字人。现在还没有专门的手语大模型,目前的手语数字技术还不够实用,至少对聋哑人还不实用。

“虽然研发过程中会有很多困难和挑战,但我们认定这就是叠境数字强调要做的有温度的人工智能,发掘技术对人类社会有益的潜能,让弱势群体得到更多的关注与帮助,这也是企业应有的社会责任,我们愿意也乐意迎接挑战。”

启明星项目提供体育

元宇宙直播观赛新方案

最后聊到的启明星项目似乎也撞上了迎梁的兴奋点,他申报的启明星项目是“构建面向未来的沉浸式、可互动式体育元宇宙直播观赛新方案”,想通过研制多视角视频编码、低延时传输、三维视频融合等新技术,提出新算法的方式打破现有VR体育直播、自由视角直播以及体积视频技术手段的限制,希望实现面向移动终端App、VR、增强现实 (AR) 等沉浸式播放媒介的体育元宇宙赛事直播新体验。

新方案也是希望提供球员视角观赛、现场任意位置的虚拟视角直播,提供给观众自由活动、自由观看的元宇宙沉浸式全新观赛体验。

在2022年北京冬奥会上,叠境数字作为国内领先的自由视点技术公司,为大赛提供了可快速制作“时间凝结”等特效的自由视点直播系统,并专为冰壶比赛设计了相应的自由视点采集系统,部署了48套4K超高清多视角相机系统在赛场周围,成为国际上第一家将自由视点直播技术应用在冰壶赛场的团队,也为大家带来了可以近距离观看运动员们掷壶精彩瞬间的新体验。

除了体育赛事,在一些大型的综艺节目,如2021年东方卫视《伟大舞者》中的部分镜头所应用的拍摄技术也是叠境数字“自由视点”的一个具体应用。

入选2020福布斯

中国30岁以下菁英榜单

尽管重心已经转向企业运营,但多年来的科学训练和叠境数字不断追求科技创新的属性,使得作为公司首席技术官 (CTO) 的张迎梁在学术上始终有追求,入行以来围绕三维人物、物体、环境等内容的高精度重建和渲染,已在计算机视觉图形学领域的国际顶级学术会议和期刊发表多篇论文。

入职以来,他负责了叠境数字动态光场影棚、自由视点、数字孪生城市、超写实数字人等产品的研发工作,研发成果先后在世界互联网大会、中国国际进口博览会、世界移动通信大会、世界人工智能大会等展览会上展出。

也因为以上业绩,张迎梁于2020年入选福布斯中国30岁以下菁英 (30Under30) 榜单,于2021年入选胡润30岁以下中国创业领袖榜单。可以看出,迎梁是一位迎风而立、日后有可能成为行业栋梁的创业先锋。

最后,和迎梁一起畅想未来,他认为虚拟与现实世界的边界在逐渐缩小,也许会出现一个开放而可协作的虚实世界,将成为我们日常生活中信息交互的一种主要形式。这会给人类社会带来怎样的发展方向?又会往何处去?值得我们一起去思考和探索。

-本文选自《世界科学》杂志2023年第12期“今日启明星”栏目-

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高圆圆的脚是我见过最漂亮的脚丫子。

高圆圆的脚是我见过最漂亮的脚丫子。

别人都叫我阿螫
2026-04-09 17:29:15
张雪公布自己设计的跨界踏板车设计图,最新回应:正在制作踏板摩托,这款踏板偏运动越野风格,售价可能比传统的贵一点

张雪公布自己设计的跨界踏板车设计图,最新回应:正在制作踏板摩托,这款踏板偏运动越野风格,售价可能比传统的贵一点

鲁中晨报
2026-04-07 17:13:05
广州外卖骑手年均薪酬15万主播20万

广州外卖骑手年均薪酬15万主播20万

南方都市报
2026-04-09 07:07:13
震惊!73岁日本大爷在丰田40年,退休来中国大厂,已离职在找工作

震惊!73岁日本大爷在丰田40年,退休来中国大厂,已离职在找工作

火山詩话
2026-04-09 07:00:22
关于卢卡·东契奇在欧洲腿筋治疗的最新报道

关于卢卡·东契奇在欧洲腿筋治疗的最新报道

夜白侃球
2026-04-10 10:34:05
震惊!网传辽宁有人将价值百万奔驰S450L作陪葬品,引发轩然大波

震惊!网传辽宁有人将价值百万奔驰S450L作陪葬品,引发轩然大波

火山詩话
2026-04-10 09:17:24
年轻时是帅的教科书,老了却丑得千姿百态,这6位男神越活越走样

年轻时是帅的教科书,老了却丑得千姿百态,这6位男神越活越走样

八斗小先生
2026-03-28 10:49:09
全网催张雪换手机!荣耀真飞到重庆给他换了

全网催张雪换手机!荣耀真飞到重庆给他换了

大风新闻
2026-04-10 11:36:17
痛心 | 余红李牺牲!年仅45岁!

痛心 | 余红李牺牲!年仅45岁!

天津广播
2026-04-10 10:25:57
惨不忍睹! 《黑袍纠察队》星光第一季与第五季对比

惨不忍睹! 《黑袍纠察队》星光第一季与第五季对比

3DM游戏
2026-04-09 14:19:15
老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

未央看点
2026-04-05 15:48:09
央视3次怒批电动车解限速,电动车限速25km/h,不如给电摩上绿牌

央视3次怒批电动车解限速,电动车限速25km/h,不如给电摩上绿牌

电动车的那些事儿
2026-04-09 07:50:14
“浑身是血”的美军上校,15分钟转移了

“浑身是血”的美军上校,15分钟转移了

中国新闻周刊
2026-04-09 18:49:47
广东省高级人民法院刑一庭审判员、三级高级法官王一民被查

广东省高级人民法院刑一庭审判员、三级高级法官王一民被查

南方都市报
2026-04-10 10:44:09
福建车辆坠河5死后续,亲戚澄清3条真相,尤其痛心是车外男子身份

福建车辆坠河5死后续,亲戚澄清3条真相,尤其痛心是车外男子身份

观察鉴娱
2026-04-10 09:35:57
总台记者观察丨美伊停火谈判 黎巴嫩成各方博弈焦点

总台记者观察丨美伊停火谈判 黎巴嫩成各方博弈焦点

北青网-北京青年报
2026-04-10 09:24:06
NASA宇航员目睹6次陨石撞月,地面控制中心尖叫失控

NASA宇航员目睹6次陨石撞月,地面控制中心尖叫失控

固件更新中
2026-04-10 08:10:17
1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

鉴史录
2026-04-09 20:22:15
以色列一夜击杀200名真主党武装 真主党被曝请求停火

以色列一夜击杀200名真主党武装 真主党被曝请求停火

桂系007
2026-04-09 22:26:13
创历史!詹皇父子连线连续上演 老詹26+8+11屡送暴扣夺回第四

创历史!詹皇父子连线连续上演 老詹26+8+11屡送暴扣夺回第四

醉卧浮生
2026-04-10 12:12:47
2026-04-10 13:20:49
世界科学 incentive-icons
世界科学
《世界科学》编辑部运营账号
1875文章数 26928关注度
往期回顾 全部

科技要闻

程序员惊喜,每月100美元!OpenAI推新套餐

头条要闻

再次"一肩挑"的苏林 将中国作为出访的首个国家

头条要闻

再次"一肩挑"的苏林 将中国作为出访的首个国家

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

全新一代理想 L8 五座旗舰+5C增程系统 三季度交付

态度原创

艺术
游戏
本地
家居
公开课

艺术要闻

于小冬2026年4月油画新作《花季》

《灵魂面甲》正式版上线 灵犀互娱持续深耕国产游戏出海

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版