网易首页 > 网易号 > 正文 申请入驻

英伟达发布 Eagle 2.5 视觉语言 AI 模型:8B 参数媲美 GPT-4o

0
分享至

IT之家 4 月 23 日消息,科技媒体 marktechpost 昨日(4 月 22 日)发布博文,报道称英伟达最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。

该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。

创新训练策略

Eagle 2.5 的成功离不开两项关键训练策略:信息优先采样(Information-First Sampling)和渐进式后训练(Progressive Post-Training)。

信息优先采样通过图像区域保留(IAP)技术,保留超过 60% 的原始图像区域,同时减少宽高比失真;自动降级采样(ADS)则根据上下文长度动态平衡视觉和文本输入,确保文本完整性和视觉细节的优化。

渐进式后训练逐步扩展模型上下文窗口,从 32K 到 128K token,让模型在不同输入长度下保持稳定性能,避免过拟合单一上下文范围。这些策略结合 SigLIP 视觉编码和 MLP 投影层,确保了模型在多样化任务中的灵活性。

定制数据集

Eagle 2.5 的训练数据管道,整合了开源资源和定制数据集 Eagle-Video-110K,该数据集专为理解长视频设计,采用双重标注方式。

自上而下的方法采用故事级分割,结合人类标注章节元数据、GPT-4 生成的密集描述;自下而上的方法则利用 GPT-4o 为短片段生成问答对,抓取时空细节。

通过余弦相似度(cosine similarity)筛选,数据集强调多样性而非冗余,确保叙事连贯性和细粒度标注,显著提升了模型在高帧数(≥128 帧)任务中的表现。

性能表现

Eagle 2.5-8B 在多项视频和图像理解任务中表现出色。在视频基准测试中,MVBench 得分为 74.8,MLVU 为 77.6,LongVideoBench 为 66.4;在图像基准测试中,DocVQA 得分为 94.1,ChartQA 为 87.5,InfoVQA 为 80.4。

消融研究(Ablation studies)表明,IAP 和 ADS 的移除会导致性能下降,而渐进式训练和 Eagle-Video-110K 数据集的加入则带来更稳定的提升。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普喊话伊朗:只要宣布无条件投降,再炸美军基地也可以不计较

特朗普喊话伊朗:只要宣布无条件投降,再炸美军基地也可以不计较

一簌月光
2026-03-08 07:32:25
上海建工涨停 !旗下金矿传来喜讯,上海爷叔终于“逆袭”

上海建工涨停 !旗下金矿传来喜讯,上海爷叔终于“逆袭”

每日经济新闻
2026-03-07 21:34:40
谢谢谢娜,贡献出26年内娱的第一个笑话!

谢谢谢娜,贡献出26年内娱的第一个笑话!

娱乐圈笔娱君
2026-03-04 14:03:54
以总理发言人:伊朗每天都在向以色列发射多次导弹攻击,并多次直接击中居民区,耶路撒冷等地均传出防空警报

以总理发言人:伊朗每天都在向以色列发射多次导弹攻击,并多次直接击中居民区,耶路撒冷等地均传出防空警报

观威海
2026-03-05 22:11:14
某大厂员工:月供0.44元,在职场上已经没有“弱点”了。不再是被领导“拿捏”的对象

某大厂员工:月供0.44元,在职场上已经没有“弱点”了。不再是被领导“拿捏”的对象

新浪财经
2026-03-07 18:30:13
伊朗总统最新讲话:美国要求伊朗“无条件投降”是“他们应该带进坟墓的幻想”

伊朗总统最新讲话:美国要求伊朗“无条件投降”是“他们应该带进坟墓的幻想”

闪电新闻
2026-03-07 16:59:09
悲报:或因中日关系紧张,木村拓哉原定出演《九龙城寨》续集,开拍前突然被临时换掉!

悲报:或因中日关系紧张,木村拓哉原定出演《九龙城寨》续集,开拍前突然被临时换掉!

日本物语
2026-03-07 20:35:30
龙虾(OpenClaw)装上了,怎么让它真干活

龙虾(OpenClaw)装上了,怎么让它真干活

AI深度研究员
2026-03-06 08:00:09
四川丈夫哽咽护妻:母亲没回老家,亲戚要求删视频,岳母出面硬刚

四川丈夫哽咽护妻:母亲没回老家,亲戚要求删视频,岳母出面硬刚

离离言几许
2026-03-06 19:30:27
俄罗斯被曝向伊朗提供情报,包括美军舰船和飞机的定位,白宫回应!美国准备部署第三艘航母,紧急批准对以色列超1.5亿美元军售

俄罗斯被曝向伊朗提供情报,包括美军舰船和飞机的定位,白宫回应!美国准备部署第三艘航母,紧急批准对以色列超1.5亿美元军售

每日经济新闻
2026-03-07 13:18:09
假消息看多了,大脑真的会废掉——

假消息看多了,大脑真的会废掉——

心理提升课堂
2026-03-07 09:36:17
离谱!比亚迪闪充的核心,竟是我们小时候吐槽的水池数学题?

离谱!比亚迪闪充的核心,竟是我们小时候吐槽的水池数学题?

趣味萌宠的日常
2026-03-07 22:30:35
《逐玉》ai换脸僵硬出戏,连田曦薇也带不动,原演员被换原因离谱

《逐玉》ai换脸僵硬出戏,连田曦薇也带不动,原演员被换原因离谱

剧芒芒
2026-03-07 14:00:04
起猛了!在唐朝以前,中国竟然根本没有真正的“喵星人”?!

起猛了!在唐朝以前,中国竟然根本没有真正的“喵星人”?!

科普中国
2026-03-06 20:53:00
蔡佳云夺得米兰-科尔蒂纳冬残奥会中国体育代表团首枚金牌

蔡佳云夺得米兰-科尔蒂纳冬残奥会中国体育代表团首枚金牌

界面新闻
2026-03-07 20:23:41
90后单亲妈妈摆地摊起家年赚上千万元:创业初期一天只睡三四个小时,今年要完成收入一个亿的“小目标”

90后单亲妈妈摆地摊起家年赚上千万元:创业初期一天只睡三四个小时,今年要完成收入一个亿的“小目标”

南国今报
2026-03-07 18:29:43
宗教习俗不能扰民:谁给你凌晨敲梆子唤醒的权力?

宗教习俗不能扰民:谁给你凌晨敲梆子唤醒的权力?

西域都护
2026-03-05 22:49:54
以为只是小毛病,一查竟是晚期!做完所有治疗,他还是永远离开了

以为只是小毛病,一查竟是晚期!做完所有治疗,他还是永远离开了

新时代的两性情感
2026-02-18 08:36:45
距亚洲青年纪录只差0.01秒!全国室内大奖赛:小孩姐陈妤颉夺冠

距亚洲青年纪录只差0.01秒!全国室内大奖赛:小孩姐陈妤颉夺冠

全景体育V
2026-03-07 19:37:44
朱亚文的“发言”在全网火了,冯远征的两会建议,含金量还在升

朱亚文的“发言”在全网火了,冯远征的两会建议,含金量还在升

好贤观史记
2026-03-07 09:51:22
2026-03-08 08:32:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
332863文章数 607049关注度
往期回顾 全部

科技要闻

OpenClaw最大的推手是闲鱼和小红书

头条要闻

中国货船通过霍尔木兹海峡后 美国宣布200亿美元计划

头条要闻

中国货船通过霍尔木兹海峡后 美国宣布200亿美元计划

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

手机
教育
本地
数码
游戏

手机要闻

vivo X300 Max真机曝光,圆形后摄方案

教育要闻

教育部部长:去年高中阶段教育毛入学率92%

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

数码要闻

苹果MacBook Neo跑分出炉:A18 Pro少了一个核心 GPU被反杀

外媒:Xbox新主机恐成微软绝唱!失败即退出硬件市场

无障碍浏览 进入关怀版