网易首页 > 网易号 > 正文 申请入驻

助力打造更强AI视频模型,火山引擎发布大模型训练视频预处理方案

0
分享至

10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”谭待说。

自研多媒体处理框架BMF ,助力豆包视频生成模型突破业界难题

据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

抖音集团视频架构负责人王悦表示,对大模型厂商而言,上述过程中面临着诸多挑战。

“首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

借助Intel的CPU、GPU等不同资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

Bytedance Research 负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。火山引擎视频云团队提供的点播解决方案还为PixelDance生产的视频提供了从编辑、上传、转码、分发、播放的全生命周期一站式服务,让模型的商业化应用有了保障。

据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用 DiT 架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题,在业界引起广泛关注。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

多项“音视频+AI”技术方案,助力企业全链路适配AIGC时代

此次活动中,火山引擎还发布了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D&大场景重建方案,从视频的生产端、交互端到消费端,全链路融入了AI的能力。

火山引擎视频云负责人Yongyuan 指出,在AI视频时代,人和AI交互变得更加动态和生动,这要求处理链路更加智能和交互。

以对话式AI实时交互方案为例,依托豆包大模型和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和自然语言处理的强大能力,可实现毫秒级人声检测和打断响应,以及丝滑稳定的端到端响应体验。

在沉浸式消费体验方面,火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景。

大会上,王悦还透露了字节自研视频编解码芯片的最新进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,成本节省了95%以上,还在2024MSU世界编码器大赛中一举夺得最佳ASIC编码器。

王悦表示,该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。

火山引擎视频云团队为字节跳动提供音视频技术,并通过火山引擎服务外部客户。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宝妈高铁堵道后续:知情人透原因,正脸被扒黑皮胖脸,已全网社死

宝妈高铁堵道后续:知情人透原因,正脸被扒黑皮胖脸,已全网社死

鋭娱之乐
2025-11-10 20:55:45
烧光1亿、资金断裂、老板被悬赏!周杰伦代言的品牌也撑不住了?

烧光1亿、资金断裂、老板被悬赏!周杰伦代言的品牌也撑不住了?

品牌观察官
2025-11-11 12:21:20
东契奇38+6+7湖人一节发力击退黄蜂,里夫斯24+5+7布里奇斯34+8+5

东契奇38+6+7湖人一节发力击退黄蜂,里夫斯24+5+7布里奇斯34+8+5

湖人崛起
2025-11-11 10:27:18
上海警方通报网传“某女编剧自称曾袭警后通过关系被放行”

上海警方通报网传“某女编剧自称曾袭警后通过关系被放行”

澎湃新闻
2025-11-11 09:04:27
令人窒息!长沙医生不雅视频事件,网传是祖院长亲手把底裤送出

令人窒息!长沙医生不雅视频事件,网传是祖院长亲手把底裤送出

火山诗话
2025-11-11 09:47:31
图灵奖得主:中国顶尖大学新生比斯坦福新生优秀,但4年后却……

图灵奖得主:中国顶尖大学新生比斯坦福新生优秀,但4年后却……

尚曦读史
2025-11-11 07:27:05
皇马内讧升级!两大核心公开对喷!阿隆索镇不住,银河战舰成笑话

皇马内讧升级!两大核心公开对喷!阿隆索镇不住,银河战舰成笑话

阿泰希特
2025-11-11 10:25:39
进攻红军城失败的俄军突击小组阵亡画面曝光!尸体被炸得残缺不全

进攻红军城失败的俄军突击小组阵亡画面曝光!尸体被炸得残缺不全

环球热点快评
2025-11-10 21:57:07
苹果 iPhone Air 2 被曝大幅推迟:富士康已拆除大部分生产线

苹果 iPhone Air 2 被曝大幅推迟:富士康已拆除大部分生产线

IT之家
2025-11-11 06:35:42
慈禧嘴里那颗8亿的夜明珠,下落已经查明:被宋美龄卖给一美国人

慈禧嘴里那颗8亿的夜明珠,下落已经查明:被宋美龄卖给一美国人

普览
2025-11-11 03:07:26
体制“铁饭碗”迎大地震!西安郑州财政局绩效降18%,补贴归零

体制“铁饭碗”迎大地震!西安郑州财政局绩效降18%,补贴归零

慧眼看世界哈哈
2025-11-11 10:13:36
今晨徐浦大桥3车相撞,其中2车相互卡住难以分离

今晨徐浦大桥3车相撞,其中2车相互卡住难以分离

上观新闻
2025-11-11 13:57:06
湖南人民医院事件后续,偷拍者身份已曝光,曾医生有口难辩

湖南人民医院事件后续,偷拍者身份已曝光,曾医生有口难辩

平老师666
2025-11-10 23:42:34
中国银行等多家银行宣布将关停部分App

中国银行等多家银行宣布将关停部分App

每日经济新闻
2025-11-11 08:36:48
小米汽车“挖孔”机盖外观专利获授权

小米汽车“挖孔”机盖外观专利获授权

界面新闻
2025-11-11 11:36:15
疯传!大批媒体曝:吴亦凡监狱中绝食死亡?

疯传!大批媒体曝:吴亦凡监狱中绝食死亡?

澳洲红领巾
2025-11-11 11:25:36
稀土的现实与想象

稀土的现实与想象

阿罗汉不约
2025-11-09 14:29:08
长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

火山诗话
2025-11-11 09:07:42
沉默6天后,中国航天传来新消息,神舟二十号返回任务有序推进!

沉默6天后,中国航天传来新消息,神舟二十号返回任务有序推进!

鱼缸里的假山
2025-11-11 11:48:49
震惊!航班登机口一瞒报孕期孕妇坦言已超36周,出问题要航司负责

震惊!航班登机口一瞒报孕期孕妇坦言已超36周,出问题要航司负责

火山诗话
2025-11-11 06:06:29
2025-11-11 14:23:00
另镜 incentive-icons
另镜
关注新资本、新消费、新文娱
342文章数 72关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

15岁少年疑被骗至柬埔寨 社交账号发信息"找3人换他"

头条要闻

15岁少年疑被骗至柬埔寨 社交账号发信息"找3人换他"

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

何超莲窦骁真的没离婚?

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

手机
数码
家居
旅游
军事航空

手机要闻

全球首发2nm芯片!三星Galaxy S26+渲染图出炉

数码要闻

Olares One 公布:3.3L 本地 AI 终端,搭移动版英伟达 RTX 5090

家居要闻

四方食事 不过人间烟火

旅游要闻

溱洧水城 | 在《诗经》的源头,与一场千年浪漫重逢

军事要闻

美媒承认:乌重镇即将被攻克

无障碍浏览 进入关怀版