网易首页 > 网易号 > 正文 申请入驻

全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5

0
分享至



新民晚报记者获悉,近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。

InternVL3.5本次开源有9种尺寸的模型,参数涵盖10亿-2410亿,可满足各场景需求。其中,旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,为开源模型中最高分;多模态通用感知能力超越GPT-5,文本能力领跑主流开源多模态大模型。与InternVL3.0相比,InternVL3.5在图形用户界面(GUI)智能体、具身空间感知、矢量图像理解与生成等多种特色任务上实现显著提升。



上海AI实验室透露,本次升级,研究团队重点强化了InternVL3.5面向实际应用的智能体与文本思考能力,在GUI交互、具身空间推理和矢量图形处理等多个关键场景实现从“理解”到“行动”的跨越,并得到多项权威评测验证。


可根据文字指令编辑矢量图文件。指令示例:在番茄的脸上涂一滴眼泪;左为输入,右为输出

不只是评测成绩亮眼,InternVL3.5在智能办公、机器人训练、AI for Science等实际场景中也展示出强劲实力。例如,InternVL3.5可跨Windows、Mac、Ubuntu、Android等多个平台,精确识别界面元素并自主执行鼠标、键盘操作,实现恢复已删除文件、导出PDF、邮件添加附件等任务的自动化,有效提升办公效率;在AI for Science场景中,模型可协助科研人员进行分子结构解析、材料性能预测等复杂推导。


问题:上面大方框中的纸折叠成一个正方形盒子之后,形成的箭头的形状,应该是下面A、B、C、D中的哪个?回答中间思考过程略

在架构方面,InternVL3.5的基础架构遵循了业界成熟的“ViT-MLP-LLM”范式,并创新提出视觉分辨率路由(ViR),有效解决多模态模型的视觉模块因高分辨率输入导致的效率瓶颈这一普遍性难题。科研人员解释,ViR的创新之处在于它能基于图像语义内容进行自适应计算。

另外值得一提的是,在传统的多模态模型推理部署方案中,视觉编码器和语言模型通常串行执行,部署在同一个或同一组GPU上。然而,这两部分的计算特性截然不同,视觉编码器的计算会阻塞语言模型的执行,导致GPU资源利用率低下。基于此,研究团队提出视觉—语言解耦部署(DvD)方案:将视觉编码器与语言模型分置于不同GPU,并结合BF16精度特征传输与异步流水线设计,使视觉计算与语言生成能够并行执行——这一突破不仅意味着性能上的飞跃,更成为推动高分辨率、强推理能力的多模态大模型在实际场景中落地应用的关键工程成果。


作为上海AI实验室书生大模型体系的重要组成部分,InternVL聚焦视觉模型技术的创新与突破,凭借领先性能和低算力消耗的优势,InternVL全系列全网下载量已突破2300万次。

原标题:《全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5》

栏目编辑:马丹 题图来源:东方IC 图片来源:上海AI实验室 图片编辑:新民晚报 郜阳

来源:作者:新民晚报 郜阳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一地新发现120多名艾滋感染者

一地新发现120多名艾滋感染者

甘肃圈圈
2026-02-01 00:13:01
王石发文疑回应失联传言

王石发文疑回应失联传言

第一财经资讯
2026-02-01 14:15:18
1976年9月8日深夜,一通电话让华国锋脸色铁青,连国宴都没顾上就跑了,紧接着抛出的三个难题,差点让政治局吵翻天

1976年9月8日深夜,一通电话让华国锋脸色铁青,连国宴都没顾上就跑了,紧接着抛出的三个难题,差点让政治局吵翻天

寄史言志
2025-12-18 19:09:15
大舅去世舅妈改嫁,我妈领回表弟又打又骂,表弟长大后:谢谢大姑

大舅去世舅妈改嫁,我妈领回表弟又打又骂,表弟长大后:谢谢大姑

人间百态大全
2025-12-09 06:40:04
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

琴声飞扬
2026-02-01 10:58:30
砸8亿!388米!河南造出世界第一高“钢甲巨人”,敢登顶吗?

砸8亿!388米!河南造出世界第一高“钢甲巨人”,敢登顶吗?

GA环球建筑
2026-01-31 21:05:35
大爆发!韩旭18+6+3+3帽创近28天新高 率队大胜升联赛第二

大爆发!韩旭18+6+3+3帽创近28天新高 率队大胜升联赛第二

醉卧浮生
2026-02-01 17:46:43
原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

以茶带书
2025-12-27 15:26:05
“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

妍妍教育日记
2026-01-30 20:54:12
队记:为了得到字母哥,勇士愿意送走追梦格林

队记:为了得到字母哥,勇士愿意送走追梦格林

懂球帝
2026-02-01 17:45:38
如果一个人还在穿10年前的衣服,那说明几个问题

如果一个人还在穿10年前的衣服,那说明几个问题

放牛娃的遐想
2026-01-07 08:16:47
记者:转会失败让罗马尼奥利错失600万年薪,球员对此很愤怒

记者:转会失败让罗马尼奥利错失600万年薪,球员对此很愤怒

懂球帝
2026-02-01 07:44:07
SNK故意的吧!把《拳皇》最棒的妞统统送给存在感最低的人

SNK故意的吧!把《拳皇》最棒的妞统统送给存在感最低的人

街机时代
2026-01-31 15:00:03
高盛:预计2026年GDP增速为4.8%

高盛:预计2026年GDP增速为4.8%

谭谈投研
2026-02-01 18:06:05
河南郑州的陈大姐说,我都快吓死了,我是来买车的不是来送命的

河南郑州的陈大姐说,我都快吓死了,我是来买车的不是来送命的

华庭讲美食
2026-02-01 17:38:37
下山的神!38岁德约遭逆转+澳网决赛首次输球 失第25冠最后机会?

下山的神!38岁德约遭逆转+澳网决赛首次输球 失第25冠最后机会?

我爱英超
2026-02-01 19:53:13
最恐怖的,来了!

最恐怖的,来了!

中国新闻周刊
2026-01-31 20:24:03
国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

海峡导报社
2026-01-31 21:50:02
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
2026-02-01 22:27:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
428473文章数 759125关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

房产
亲子
本地
游戏
军事航空

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

亲子要闻

特殊儿童的心理干预高于身体干预

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

《最终幻想7:重生》将于近期公布NS2版相关情报

军事要闻

伊朗民众:伊朗不会屈服于美国霸权

无障碍浏览 进入关怀版