网易首页 > 网易号 > 正文 申请入驻

全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5

0
分享至

新民晚报记者获悉,近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。

InternVL3.5本次开源有9种尺寸的模型,参数涵盖10亿-2410亿,可满足各场景需求。其中,旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,为开源模型中最高分;多模态通用感知能力超越GPT-5,文本能力领跑主流开源多模态大模型。与InternVL3.0相比,InternVL3.5在图形用户界面(GUI)智能体、具身空间感知、矢量图像理解与生成等多种特色任务上实现显著提升。

上海AI实验室透露,本次升级,研究团队重点强化了InternVL3.5面向实际应用的智能体与文本思考能力,在GUI交互、具身空间推理和矢量图形处理等多个关键场景实现从“理解”到“行动”的跨越,并得到多项权威评测验证。

可根据文字指令编辑矢量图文件。指令示例:在番茄的脸上涂一滴眼泪;左为输入,右为输出

不只是评测成绩亮眼,InternVL3.5在智能办公、机器人训练、AI for Science等实际场景中也展示出强劲实力。例如,InternVL3.5可跨Windows、Mac、Ubuntu、Android等多个平台,精确识别界面元素并自主执行鼠标、键盘操作,实现恢复已删除文件、导出PDF、邮件添加附件等任务的自动化,有效提升办公效率;在AI for Science场景中,模型可协助科研人员进行分子结构解析、材料性能预测等复杂推导。

问题:上面大方框中的纸折叠成一个正方形盒子之后,形成的箭头的形状,应该是下面A、B、C、D中的哪个?回答中间思考过程略

在架构方面,InternVL3.5的基础架构遵循了业界成熟的“ViT-MLP-LLM”范式,并创新提出视觉分辨率路由(ViR),有效解决多模态模型的视觉模块因高分辨率输入导致的效率瓶颈这一普遍性难题。科研人员解释,ViR的创新之处在于它能基于图像语义内容进行自适应计算。

另外值得一提的是,在传统的多模态模型推理部署方案中,视觉编码器和语言模型通常串行执行,部署在同一个或同一组GPU上。然而,这两部分的计算特性截然不同,视觉编码器的计算会阻塞语言模型的执行,导致GPU资源利用率低下。基于此,研究团队提出视觉—语言解耦部署(DvD)方案:将视觉编码器与语言模型分置于不同GPU,并结合BF16精度特征传输与异步流水线设计,使视觉计算与语言生成能够并行执行——这一突破不仅意味着性能上的飞跃,更成为推动高分辨率、强推理能力的多模态大模型在实际场景中落地应用的关键工程成果。

作为上海AI实验室书生大模型体系的重要组成部分,InternVL聚焦视觉模型技术的创新与突破,凭借领先性能和低算力消耗的优势,InternVL全系列全网下载量已突破2300万次。

原标题:《全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5》

栏目编辑:马丹 题图来源:东方IC 图片来源:上海AI实验室 图片编辑:新民晚报 郜阳

来源:作者:新民晚报 郜阳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
裁判最低分!李国旭倒数第三!大连全队打分:双煞最高 3将不及格

裁判最低分!李国旭倒数第三!大连全队打分:双煞最高 3将不及格

刀锋体育
2026-05-10 23:32:58
耻辱!阿森纳 7000 万水货坑惨全队,险成丢分罪人

耻辱!阿森纳 7000 万水货坑惨全队,险成丢分罪人

奶盖熊本熊
2026-05-11 02:00:28
日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

篮球看比赛
2026-02-04 17:46:56
徐正源:球队问题成堆,六连败难短期解决

徐正源:球队问题成堆,六连败难短期解决

稗官青史
2026-05-11 02:29:33
06|取消非市场化行为

06|取消非市场化行为

生命可以承受之轻
2026-05-08 11:23:48
访华仅剩短短几天,美国抛出1890亿美债,中方底牌亮了

访华仅剩短短几天,美国抛出1890亿美债,中方底牌亮了

暗香暗香
2026-05-10 07:44:56
2.16万一把椅子!丰田皇冠驾驶座被改成办公椅:限量70把需抽签

2.16万一把椅子!丰田皇冠驾驶座被改成办公椅:限量70把需抽签

快科技
2026-05-10 20:05:15
梦回巅峰!哈登连拿7分杀死比赛!全场起立欢呼,骑士保留悬念

梦回巅峰!哈登连拿7分杀死比赛!全场起立欢呼,骑士保留悬念

体坛小李
2026-05-10 07:00:48
悲催!网传深圳一工厂停业,无提前告知、无协商沟通,派律师送达

悲催!网传深圳一工厂停业,无提前告知、无协商沟通,派律师送达

火山詩话
2026-05-10 18:29:35
男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

男子为寻求“刺激”,深夜潜入留守妇女家,2020年十多人被其糟蹋

汉史趣闻
2026-05-10 16:38:24
世乒赛!女团卫冕冠军,孙颖莎收获两个好消息,再创历史,早田痛哭

世乒赛!女团卫冕冠军,孙颖莎收获两个好消息,再创历史,早田痛哭

去山野间追风
2026-05-11 02:03:01
Costco美食广场再推新品:6.99美元鸡柳条爆红,美国网友疯狂讨论

Costco美食广场再推新品:6.99美元鸡柳条爆红,美国网友疯狂讨论

华人生活网
2026-05-11 03:36:48
新规落地,反腐力度之大超过历史任何时期

新规落地,反腐力度之大超过历史任何时期

深蓝夜读
2026-05-10 19:41:23
刘涛雨中跪拜妈祖,一道光打下来,福建人彻底信了

刘涛雨中跪拜妈祖,一道光打下来,福建人彻底信了

TVB的四小花
2026-05-10 10:38:33
别吃!寄生虫多达6000条,严重可致死,常州也有!

别吃!寄生虫多达6000条,严重可致死,常州也有!

常州大喇叭
2026-05-09 14:41:26
太过分!皮皮虾风波当事人把泰国濑尿虾说成普通虾,至今没有道歉

太过分!皮皮虾风波当事人把泰国濑尿虾说成普通虾,至今没有道歉

小徐讲八卦
2026-05-10 07:56:14
曼联狂喜!世界级中场点头加盟,碾压巴莱巴太香了

曼联狂喜!世界级中场点头加盟,碾压巴莱巴太香了

一隅非生
2026-05-11 03:59:22
浙江1-1天津津门虎,赛后评分出炉:不是王钰栋第1,浙江28号第1

浙江1-1天津津门虎,赛后评分出炉:不是王钰栋第1,浙江28号第1

俯身冲顶
2026-05-10 21:44:29
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
任正非罕见出镜:华为芯片基础技术研究实验室亮相《新闻联播》

任正非罕见出镜:华为芯片基础技术研究实验室亮相《新闻联播》

IT之家
2026-05-10 22:51:11
2026-05-11 05:11:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
480646文章数 761347关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

亲子
家居
教育
手机
公开课

亲子要闻

从第一声呼唤开始,爱就有了名字

家居要闻

菁英人居 全能豪宅

教育要闻

高考地理中的共享经济

手机要闻

OPPO Reno16系列参数全曝光,就差价格了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版