网易首页 > 网易号 > 正文 申请入驻

多模态通用感知能力超越 GPT-5,书生・万象 3.5 大模型开源

0
分享至

IT之家 9 月 3 日消息,上海人工智能实验室(上海 AI 实验室)今日宣布开源通用多模态大模型书生・万象 3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。


InternVL3.5 本次开源有 9 种尺寸的模型,参数涵盖 10 亿-2410 亿,可满足各场景需求。其中,旗舰模型 InternVL3.5-241B-A28B 在多学科推理基准 MMMU 中获 77.7 分,为开源模型中最高分;多模态通用感知能力超越 GPT-5,文本能力领跑主流开源多模态大模型。


与 InternVL3.0 相比,InternVL3.5 在图形用户界面(GUI)智能体、具身空间感知、矢量图像理解与生成等多种特色任务上实现显著提升。

本次升级,上海 AI 实验室研究团队重点强化了 InternVL3.5 面向实际应用的智能体与文本思考能力,在 GUI 交互、具身空间推理和矢量图形处理等多个关键场景实现从“理解”到“行动”的跨越,并得到多项评测验证。

  • GUI 交互部分,InternVL3.5 在 ScreenSpot-v2 元素定位任务以 92.9 分超越同类模型,同时支持 Windows / Ubuntu 自动化操作,并在 WindowsAgentArena 任务大幅领先 Claude-3.7-Sonnet。
  • 在具身智能体测试中,InternVL3.5 表现出理解物理空间关系并规划导航路径的能力,在 VSI-Bench 以 69.5 分超过 Gemini-2.5-Pro。
  • 在矢量图形理解与生成方面,InternVL3.5 在 SGP-Bench 以 70.7 分刷新开源纪录,生成任务 FID 值也优于 GPT-4o 和 Claude-3.7-Sonnet。

具体来看,InternVL3.5 可跨 Windows、Mac、Ubuntu、Android 等多个平台,识别界面元素并自主执行鼠标、键盘操作,实现恢复已删除文件、导出 PDF、邮件添加附件等任务的自动化。


InternVL3.5 具备更强的 grounding 能力,可以泛化到全新的复杂大量小样本的具身场景,配合抓取算法,支持可泛化的长程物体抓取操作,助力机器人更高效地完成物品识别、路径规划与物理交互。


作为上海 AI 实验室书生大模型体系的重要组成部分,InternVL 聚焦视觉模型技术,InternVL 全系列全网下载量已突破 2300 万次

IT之家附开源地址:

  • 技术报告链接:https://huggingface.co/papers/2508.18265
  • 代码开源 / 模型使用方法:https://github.com/OpenGVLab/InternVL
  • 模型地址:https://huggingface.co/OpenGVLab/InternVL3_5-241B-A28B
  • 在线体验链接:https://chat.intern-ai.org.cn/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李春平死了

李春平死了

霹雳炮
2025-11-05 22:34:23
十五运会广州限行首日路面车流大减 有市民提早20分钟到工位

十五运会广州限行首日路面车流大减 有市民提早20分钟到工位

新快报新闻
2025-11-06 13:23:09
直辖市“70后”市委常委,任新设区首任区委书记

直辖市“70后”市委常委,任新设区首任区委书记

上观新闻
2025-11-06 15:59:05
广州卖房业主又要遭受暴击了……

广州卖房业主又要遭受暴击了……

楼市前线
2025-11-05 19:01:11
中国加入CPTPP对全球有何影响?商务部:将带动成员国出口增长2.5%-11.8%

中国加入CPTPP对全球有何影响?商务部:将带动成员国出口增长2.5%-11.8%

界面新闻
2025-11-06 16:34:05
火箭大胜灰熊 没有正经控卫 火箭如何成为全联盟最强进攻效率球队

火箭大胜灰熊 没有正经控卫 火箭如何成为全联盟最强进攻效率球队

大话火箭队
2025-11-06 15:50:07
许家印的空中“劳斯莱斯”,内部首次被拍,机龄已有13.2年

许家印的空中“劳斯莱斯”,内部首次被拍,机龄已有13.2年

普陀动物世界
2025-11-06 08:56:09
队记:杨瀚森将随开拓者队出征四天后开始的五连客场之旅

队记:杨瀚森将随开拓者队出征四天后开始的五连客场之旅

懂球帝
2025-11-06 16:14:25
社保局审核员揭秘:你的“视同缴费年限”,是这么一笔笔算出来的

社保局审核员揭秘:你的“视同缴费年限”,是这么一笔笔算出来的

小李子体育
2025-11-05 09:08:32
56号秀的春天,勇士后卫威尔-理查德15中10砍30分7板3助1断

56号秀的春天,勇士后卫威尔-理查德15中10砍30分7板3助1断

懂球帝
2025-11-06 13:56:22
3-4,7-10,赵心童为何总是难以,击败塞尔比,看完这三点就懂了

3-4,7-10,赵心童为何总是难以,击败塞尔比,看完这三点就懂了

生活新鲜市
2025-11-06 10:58:15
向毛岸英扔下汽油弹的南非飞行员,在51年时获安慰奖,最后咋样了

向毛岸英扔下汽油弹的南非飞行员,在51年时获安慰奖,最后咋样了

抽象派大师
2025-11-04 08:50:03
冯小刚没说错!不沾烟酒不混饭局的陈道明,如今70岁竟变成了这样

冯小刚没说错!不沾烟酒不混饭局的陈道明,如今70岁竟变成了这样

基斯默默
2025-09-12 15:45:09
女子申请改名多次被拒,“我的名字”谁说了算?

女子申请改名多次被拒,“我的名字”谁说了算?

环球网资讯
2025-11-05 10:51:03
就问怕不怕,美菲澳新南海搞演习,结果围观的中国军舰比他们还多

就问怕不怕,美菲澳新南海搞演习,结果围观的中国军舰比他们还多

策略述
2025-11-03 18:10:07
邵佳一上任,德甲发文,组建德国助教团,已有国脚主动申请回国足

邵佳一上任,德甲发文,组建德国助教团,已有国脚主动申请回国足

五姑娘说体育
2025-11-06 10:44:40
四川美女张欣去世,仅28岁,结婚半年,婚礼前夕确诊,老公仍结婚

四川美女张欣去世,仅28岁,结婚半年,婚礼前夕确诊,老公仍结婚

普陀动物世界
2025-11-06 06:23:09
4抢断5解围2拦截!曼城庸才变身中场大闸 得3大良师指点飞速成长

4抢断5解围2拦截!曼城庸才变身中场大闸 得3大良师指点飞速成长

雪狼侃体育
2025-11-06 14:32:43
第八届进博会|进博之约 世界共享

第八届进博会|进博之约 世界共享

新华社
2025-11-05 18:21:07
心系广东男篮!李春江:赵睿徐杰胡明轩再次合作, 那这个冠军...

心系广东男篮!李春江:赵睿徐杰胡明轩再次合作, 那这个冠军...

狼叔评论
2025-11-06 16:06:12
2025-11-06 17:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
313789文章数 606717关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

时尚
艺术
亲子
教育
军事航空

中国色特别策划 | 故宫技艺与古意新生

艺术要闻

预定年度十佳!49岁的舒淇,杀疯了

亲子要闻

amh值低怎么调理好?卵子质量不好如何改善?

教育要闻

脑机接口人才招不满,4大方向适配不同学科特长,错过可能亏大了

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版