网易首页 > 网易号 > 正文 申请入驻

英伟达发布 Eagle 2.5 视觉语言 AI 模型:8B 参数媲美 GPT-4o

0
分享至

IT之家 4 月 23 日消息,科技媒体 marktechpost 昨日(4 月 22 日)发布博文,报道称英伟达最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。

该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。

创新训练策略

Eagle 2.5 的成功离不开两项关键训练策略:信息优先采样(Information-First Sampling)和渐进式后训练(Progressive Post-Training)。

信息优先采样通过图像区域保留(IAP)技术,保留超过 60% 的原始图像区域,同时减少宽高比失真;自动降级采样(ADS)则根据上下文长度动态平衡视觉和文本输入,确保文本完整性和视觉细节的优化。

渐进式后训练逐步扩展模型上下文窗口,从 32K 到 128K token,让模型在不同输入长度下保持稳定性能,避免过拟合单一上下文范围。这些策略结合 SigLIP 视觉编码和 MLP 投影层,确保了模型在多样化任务中的灵活性。

定制数据集

Eagle 2.5 的训练数据管道,整合了开源资源和定制数据集 Eagle-Video-110K,该数据集专为理解长视频设计,采用双重标注方式。

自上而下的方法采用故事级分割,结合人类标注章节元数据、GPT-4 生成的密集描述;自下而上的方法则利用 GPT-4o 为短片段生成问答对,抓取时空细节。

通过余弦相似度(cosine similarity)筛选,数据集强调多样性而非冗余,确保叙事连贯性和细粒度标注,显著提升了模型在高帧数(≥128 帧)任务中的表现。

性能表现

Eagle 2.5-8B 在多项视频和图像理解任务中表现出色。在视频基准测试中,MVBench 得分为 74.8,MLVU 为 77.6,LongVideoBench 为 66.4;在图像基准测试中,DocVQA 得分为 94.1,ChartQA 为 87.5,InfoVQA 为 80.4。

消融研究(Ablation studies)表明,IAP 和 ADS 的移除会导致性能下降,而渐进式训练和 Eagle-Video-110K 数据集的加入则带来更稳定的提升。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印度裔当选纽约市长,当众吃手抓饭

印度裔当选纽约市长,当众吃手抓饭

远方青木
2025-11-11 23:07:55
两条新闻,全翻车了...

两条新闻,全翻车了...

胖胖说他不胖
2025-11-11 16:28:47
什么事是你交了男朋友才知道的?网友:鼻子大的真的大还厉害

什么事是你交了男朋友才知道的?网友:鼻子大的真的大还厉害

带你感受人间冷暖
2025-11-12 00:05:08
石破茂卸任后直言:中日若开战,日本百分之百会亡国

石破茂卸任后直言:中日若开战,日本百分之百会亡国

丹徒生
2025-11-12 05:53:54
只有去过才知道:真正的美国,和新闻里说的根本不是一回事

只有去过才知道:真正的美国,和新闻里说的根本不是一回事

诗意世界
2025-11-11 22:33:55
从三航母到求职难:经济转型期的宏大叙事与个体困境

从三航母到求职难:经济转型期的宏大叙事与个体困境

流苏晚晴
2025-11-11 20:16:54
1.2亿!马云妻子买下前意大利使馆,学学顶级富豪的资产安全操作

1.2亿!马云妻子买下前意大利使馆,学学顶级富豪的资产安全操作

商悟社
2025-11-12 00:55:09
Shams:独行侠老板承担了责任,承认交易东契奇是一个错误

Shams:独行侠老板承担了责任,承认交易东契奇是一个错误

懂球帝
2025-11-11 23:51:05
既想当官又想发财,内蒙古政协原副主席王中和涉受贿行贿案被公诉

既想当官又想发财,内蒙古政协原副主席王中和涉受贿行贿案被公诉

界面新闻
2025-11-12 10:19:54
A股午评:创业板指半日跌1.58%,全市场超4000只个股飘绿,光伏设备、培育钻石、可控核聚变等概念走弱

A股午评:创业板指半日跌1.58%,全市场超4000只个股飘绿,光伏设备、培育钻石、可控核聚变等概念走弱

界面新闻
2025-11-12 11:34:06
全运会乒乓球:第1块金牌出炉!头号种子4:1夺冠,成功登上领奖台

全运会乒乓球:第1块金牌出炉!头号种子4:1夺冠,成功登上领奖台

国乒二三事
2025-11-12 06:59:34
官方:独行侠总经理尼科-哈里森被解雇

官方:独行侠总经理尼科-哈里森被解雇

懂球帝
2025-11-12 02:21:04
有内鬼?巴特勒支持追梦:每个人都要为球队利益做出牺牲

有内鬼?巴特勒支持追梦:每个人都要为球队利益做出牺牲

懂球帝
2025-11-12 13:05:04
首次以中央名义开展!中央考核巡查组,进驻地方开展明查暗访等

首次以中央名义开展!中央考核巡查组,进驻地方开展明查暗访等

政知新媒体
2025-11-11 20:40:29
俄罗斯在红军城对乌军展开攻势,乌克兰第二大城市一区域已全面被俄军控制!俄方强硬回应日本制裁!特朗普最新发声......

俄罗斯在红军城对乌军展开攻势,乌克兰第二大城市一区域已全面被俄军控制!俄方强硬回应日本制裁!特朗普最新发声......

每日经济新闻
2025-11-12 06:58:54
破防了!中方首次在大会上用“冲绳原住民”,结果日本闹了一个月

破防了!中方首次在大会上用“冲绳原住民”,结果日本闹了一个月

青青子衿
2025-11-11 02:11:09
人民币被踢出局!刚刚,英国掀桌子死保美元!

人民币被踢出局!刚刚,英国掀桌子死保美元!

深度报
2025-11-11 21:43:58
镇政府回应“3岁幼童拿泡泡糖没付款引发争执”:高度重视,多部门在处理

镇政府回应“3岁幼童拿泡泡糖没付款引发争执”:高度重视,多部门在处理

红星新闻
2025-11-11 19:18:16
噩耗:14亿人的守护神走了!他瞒过全世界、为中国玩命60年!

噩耗:14亿人的守护神走了!他瞒过全世界、为中国玩命60年!

凡知
2025-11-11 17:13:47
吴雅婷和王栎鑫为女儿庆生,正式告诉儿女离婚,唯伊心疼妈妈大哭

吴雅婷和王栎鑫为女儿庆生,正式告诉儿女离婚,唯伊心疼妈妈大哭

观察鉴娱
2025-11-12 09:54:44
2025-11-12 13:31:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314712文章数 606741关注度
往期回顾 全部

科技要闻

Meta"宫斗"持续,AI教父杨立昆被"气"走了

头条要闻

国台办发言人读赖氏家庙祖训:怕他没听清 我再念一遍

头条要闻

国台办发言人读赖氏家庙祖训:怕他没听清 我再念一遍

体育要闻

太阳三连胜&活塞东部第一 哪个更想不到

娱乐要闻

辛芷蕾配得上威尼斯影后吗?

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

能得到央视的肯定 长安马自达EZ-60可不简单

态度原创

健康
本地
数码
家居
公开课

血液科专家揭秘白血病七大误区

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

数码要闻

微软史上销量最惨淡产品:仅售出 11 套,还被退回 8 套

家居要闻

国美学子 打造筑梦空间

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版