网易首页 > 网易号 > 正文 申请入驻

不得了,这个新技术把视频压缩到了0.02%!

0
分享至

来源:市场资讯

(来源:量子位)

感谢AI!

原生1个G的视频,现在只需要传200K数据就能看了——

视频数据的压缩率干到了0.02%,但依旧能保持画面的高清、连贯和画面细节。

或许你会问,这又有什么用呢?

想象一下,你身处于太平洋的一艘远洋货轮中,卫星信号只有一两格,刷个朋友圈,加载内容的圈圈都要转好久。

但正是因为有了这项AI技术,现在在如此极端的环境之下,你甚至可以直接看高清的世界杯直播!


没错,视频传输的物理法则,算是被重写了。

而这项新研究,正是来自中国电信人工智能研究院(TeleAI)的技术——生成式视频压缩(GVC,Generative Video Compression)

作为国资央企、全球领先的综合智能信息服务运营商,中国电信不仅拥有覆盖海陆空天的通信网络基础设施,更具备将前沿AI技术与实际通信场景深度融合的能力。

这种“云网融合+AI原生”的独特优势,使得GVC技术从实验室走向远洋船舶、应急现场等真实极端环境成为可能。


那么这项研究到底是如何做到的,以及又能给我们现实生活带来什么改变,我们继续往下看。

在介绍这项黑科技之前,我们需得先聊聊现在的视频是怎么传输的。

无论是你要看的Netflix、B站,还是微信视频通话,背后主要依靠的是HEVC(H.265)或VVC(H.266)这类传统视频编码标准。

这些技术的底层逻辑,说白了是像素的极致搬运:编码器拼命计算哪些像素是不变的、哪些是移动的,然后尽可能多地保留像素信息,再想办法塞进有限的带宽里。

这种逻辑在宽带富裕时很完美,但在极限环境下(极低带宽)会迅速崩盘。

一旦带宽不够,传统编码器为了凑合传输,只能疯狂丢弃高频信息。结果我们都见过:画面糊成一团,甚至直接卡死。

但 TeleAI 团队换了个思路,如果我不传像素了呢?

GVC的核心逻辑是:不再传递画面本身,而是传递“如何画出这幅画面”的指令。

打个比方:


刚刚说的只是打个比方,实际情况要复杂得多,传输的内容也并非只有文字。

这就是技术报告中提到的核心理念:用计算,换宽带(Trading computation for bandwidth)。

把传输的压力,转移到了推理计算上。


视频地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

既然不传像素,那这0.02%的数据里到底装了什么?

技术报告揭示了GVC系统的内部构造,它主要由神经编码器(Neural Encoder)生成式视频解码器(Generative Video Decoder)两部分组成。

里面传输的是一种被称为压缩Token的极小数据包,这些Token里包含了视频的灵魂,主要分为两类:

经过 TeleAI 团队的测试,这些Token的大小可以被压缩到极致的0.005 bpp - 0.008 bpp(bits per pixel,比特每像素)。

这是什么概念?通常我们看的高清视频,bpp至少在0.1以上。GVC直接把数据量砍掉了两个数量级。

除此之外,在接收端,还有一个扩散模型(Diffusion Model)严阵以待。

它接收到这些简短的Token指令后,利用预训练好的海量世界知识(比如它本来就知道海浪长什么样,足球长什么样),结合指令中的特征,开始脑补并生成视频。

这在通信理论上,实现了一次巨大的跨越。

香农-韦弗(Shannon-Weaver)通信模型将通信分为三个层级:

传统视频压缩在死磕Level A,而GVC直接跳到了Level C


它不在乎每一个像素点是否和原图一模一样(比如这片树叶的纹理是否100%重合),它在乎的是:在人眼看来,这是否是一场连贯、清晰、真实的球赛?在机器看来,能否准确识别出这是否是越位?

极端压缩听起来很玄,但具体指标并不含糊。

技术报告中展示了在MCL-JCV权威数据集上的测试结果,数据非常硬核。

画质吊打传统算法

在极低码率下(0.005 bpp左右),使用LPIPS(一种更符合人类视觉感知的画质评价指标)进行对比:

技术报告中给出了一个惊人的对比结论:传统方法(如HEVC)要想达到和GVC同样的视觉画质,需要消耗6倍以上的带宽!


这意味着,在同样的渣画质网络下,GVC能让你看清C罗的表情,而HEVC只能让你看清C罗是个移动的色块。

不只是给人看,机器也能用

有人会问:AI生成的视频,会不会失真?比如把球生成没了?

这是一个非常犀利且实在的问题。

为此,团队在DAVIS2017视频分割任务上进行了验证;结果显示,在bpp=0.01的极限压缩下,GVC重建视频的J&F指标(衡量分割准确度)显著高于HEVC。


这说明GVC传输的不仅仅是“好看”的皮囊,更是“准确”的语义。即使是AI重绘的,关键物体(人、车、球)的位置和轮廓也是精准的,完全不影响后续的AI分析。

消费级显卡也能跑

计算换宽带,那会不会把电脑算爆?

确实,生成式模型通常是算力黑洞。但 TeleAI 通过模型小型化、知识蒸馏等手段,搞定了落地的最后一公里。

报告数据显示,经过优化的GVC模型,在消费级GPU(如RTX 4090)上,生成一组29帧的画面大约只需要0.95秒到1.35秒。

虽然比不上传统解码器的毫秒级速度,但在很多非实时或准实时的场景下(比如直播延迟几秒),这已经是完全可用的状态了。

0.02%,这篇技术报告所展现的关键数据已然非常惊艳,但它背后更加可期的,还是这项技术给未来带来的改变。

除了开头我们提到的世界杯的例子外,在报告展示的Demo场景中,GVC还展现了其它极端网络环境下的情况:


视频地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

实际上,GVC并非孤立的技术突破,而是建立在“智传网(AI Flow)”理论体系之上。

智传网(AI Flow)是人工智能与通信、网络交叉领域的一项关键技术,即通过网络分层架构,基于连接和交互,实现智能的传递和涌现。

在去年的世界人工智能大会(WAIC)上,中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授,介绍了 TeleAI 在智传网(AI Flow)研究中所发现的三个定律:信容律、同源律、集成律。

信容律描述大模型的本质规律和能力边界,通过数据压缩的方式来衡量模型的知识密度,也就是智能能力。

同源律则展现大模型的“部分”与“整体”关系,在相同训练计算开销下,能指导得到数量更多、性能更好的不同大小的家族模型。

集成律能指导大模型“单体”与“群体”的协同,通过多个模型集成的方式,实现智能能力的提升与涌现。


视频地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

基于智传网(AI Flow)的信容律,在AI时代,通信的本质不再是单纯的数据传输,而是智能的分发与协同。

在此体系下,GVC通过“用计算换带宽”的资源置换策略,实现了通信效率与感知质量的最优平衡。

GVC就是这一理论的最佳实践:当带宽成为瓶颈时,我们就燃烧算力来换取自由。

从像素还原到语义生成,视频压缩技术正在经历一场类似从功能机到智能机的范式转移。

GVC标志着视频通信正从像素搬运迈向语义生成的新阶段。

作为央企在AI+通信融合创新中的重要成果,它不仅为远洋通信、应急救援、边缘智能等场景提供了高效可行的解决方案,更开启了以任务有效性为核心的下一代视频传输范式:

在未来的互联网里,流淌在光纤和电波中的,可能不再是庞大的原始数据,而是高度浓缩的智慧和指令。

技术报告地址:

https://www.arxiv.org/abs/2512.24300

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海人终于体会到了引进印度人的“快乐”!

上海人终于体会到了引进印度人的“快乐”!

步论天下事
2026-04-25 09:34:47
湖南男子买烟炫富,致使一家三口被灭,2岁儿子在遗体边躺了两天

湖南男子买烟炫富,致使一家三口被灭,2岁儿子在遗体边躺了两天

莫地方
2026-04-24 00:10:03
一旦武统台湾,这4个台湾人必上“斩首”名单,一个都跑不掉!

一旦武统台湾,这4个台湾人必上“斩首”名单,一个都跑不掉!

混沌录
2026-04-23 21:14:04
伊朗最高领袖明确下令,霍尔木兹海峡突传大消息!伊朗总统、革命卫队发声

伊朗最高领袖明确下令,霍尔木兹海峡突传大消息!伊朗总统、革命卫队发声

每日经济新闻
2026-04-26 14:16:05
天涯神贴之东三省人口持续流出的真正原因

天涯神贴之东三省人口持续流出的真正原因

回旋镖
2026-04-26 13:42:15
湖南美女“克拉姐姐”去世,年仅25岁,原今年订婚,棺木不能入家

湖南美女“克拉姐姐”去世,年仅25岁,原今年订婚,棺木不能入家

裕丰娱间说
2026-04-25 22:47:12
湖火大战G4里夫斯伤情报告出炉,41岁老詹怕是又要单核带队起飞?

湖火大战G4里夫斯伤情报告出炉,41岁老詹怕是又要单核带队起飞?

仰卧撑FTUer
2026-04-26 11:26:03
切尔诺贝利被遗忘的60万人:拿铲子对抗核辐射,没人告诉他们真相

切尔诺贝利被遗忘的60万人:拿铲子对抗核辐射,没人告诉他们真相

网易新闻出品
2026-04-26 08:51:02
250万赔偿不算啥?官方介入,崔丽丽事件“创先河”,释放3大信号

250万赔偿不算啥?官方介入,崔丽丽事件“创先河”,释放3大信号

天天热点见闻
2026-04-25 06:27:01
圆明园地下大反转,大火烧掉的仅是圆明园的表皮

圆明园地下大反转,大火烧掉的仅是圆明园的表皮

混沌录
2026-04-24 21:02:11
白宫枪击案枪手身份成迷,又有消息称枪手是加州理工码农

白宫枪击案枪手身份成迷,又有消息称枪手是加州理工码农

爆角追踪
2026-04-26 12:53:28
争议?19岁王钰栋提前结束谢场+怒摔水瓶!5场0球后他5次情绪失控

争议?19岁王钰栋提前结束谢场+怒摔水瓶!5场0球后他5次情绪失控

我爱英超
2026-04-26 14:15:58
这台大众很不大众 解读一汽-大众ID. AURA T6

这台大众很不大众 解读一汽-大众ID. AURA T6

新出行
2026-04-25 14:01:58
时间有变!赵心童VS丁俊晖,央视更改直播频道,谁能进世锦赛8强

时间有变!赵心童VS丁俊晖,央视更改直播频道,谁能进世锦赛8强

体育大学僧
2026-04-26 08:50:39
赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

齐鲁壹点
2026-04-26 07:18:18
穆杰塔巴伤情曝光!比想象更重,他用一招终结美以斩首战术

穆杰塔巴伤情曝光!比想象更重,他用一招终结美以斩首战术

闻识
2026-04-26 04:59:24
白宫晚宴枪击案全网最全细节:特工疑与枪手互开数枪,特朗普在台上十分淡定

白宫晚宴枪击案全网最全细节:特工疑与枪手互开数枪,特朗普在台上十分淡定

爆角追踪
2026-04-26 10:29:13
震惊!东方甄选员工集体辞职要挟俞敏洪,被网友直言“蠢出天际”

震惊!东方甄选员工集体辞职要挟俞敏洪,被网友直言“蠢出天际”

火山詩话
2026-04-26 07:09:07
“妈,我在隧道救了个人,我可能出不去了……”小伙被困后拨通母亲电话留下遗言

“妈,我在隧道救了个人,我可能出不去了……”小伙被困后拨通母亲电话留下遗言

都市快报橙柿互动
2026-04-26 00:33:10
白宫晚宴传出5到8声枪响!95后枪手带多件武器,1特工被枪击,穿防弹衣幸免于难

白宫晚宴传出5到8声枪响!95后枪手带多件武器,1特工被枪击,穿防弹衣幸免于难

红星新闻
2026-04-26 11:31:31
2026-04-26 15:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3012347文章数 6941关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

旅游
手机
家居
公开课
军事航空

旅游要闻

下一站|一天体验越南三大特色

手机要闻

vivo Y600 Pro手机现身中国电信终端产品库,4月27日发布

家居要闻

自然肌理 温润美学

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗总统:不会在压力、威胁下进行谈判

无障碍浏览 进入关怀版