网易首页 > 网易号 > 正文 申请入驻

限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌Gemini

0
分享至

快科技1月26日消息,今日,阿里云公布多模态大模型研究进展。

据悉,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,整体性能堪比GPT-4V和Gemini Ultra。

Qwen-VL-Plus和Qwen-VL-Max在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界最佳水平。

基础能力方面,升级版模型能够准确描述和识别图片信息,并且根据图片进行信息推理、扩展创作;具备视觉定位能力,还可针对画面指定区域进行问答。

视觉推理方面,Qwen-VL-Plus和Qwen-VL-Max可以理解流程图等复杂形式图片,可以分析复杂图标,看图做题、看图作文、看图写代码也不在话下。

图像文本处理方面,升级版Qwen-VL的中英文文本识别能力显著提高,支持百万像素以上的高清分辨率图和极端宽高比的图像,既能完整复现密集文本,也能从表格和文档中提取信息。

LLM(大语言模型)之后,大模型领域的下一个爆点是什么?多模态是当前最具共识的方向。过去半年来,OpenAI、谷歌等争相推出多模态模型,阿里云也在2023年8月发布并开源具备图文理解能力的Qwen-VL模型,Qwen-VL取得了同期远超同等规模通用模型的表现。

视觉是多模态能力中最重要的模态,作为人类感知世界、认知世界的第一感官,视觉传递的信息占据了"五感"信息的80%。通义千问视觉语言模型基于通义千问LLM开发,通过将视觉表示学习模型与LLM对齐,赋予AI理解视觉信息的能力,在大语言模型的"心灵"上开了一扇视觉的"窗"。

相比LLM,多模态大模型拥有更大的应用想象力。比如,有研究者在探索将多模态大模型与自动驾驶场景结合,为"完全自动驾驶"找到新的技术路径;将多模态模型部署到手机、机器人、智能音箱等端侧设备,让智能设备自动理解物理世界的信息;或者基于多模态模型开发应用,辅助视力障碍群体的日常生活等等。

目前,Qwen-VL-Plus和Qwen-VL-Max限时免费,用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈登喜迎好帮手,骑士这夺冠拼图终于齐了

哈登喜迎好帮手,骑士这夺冠拼图终于齐了

章蠞户外
2026-03-07 11:38:45
一碗“剥皮蓝莓”,让宝妈努力被全网嘲笑:不仅学历低,认知更低

一碗“剥皮蓝莓”,让宝妈努力被全网嘲笑:不仅学历低,认知更低

妍妍教育日记
2026-03-05 19:58:32
美国海湾盟友考虑撤减对美投资 不满美以突袭伊朗

美国海湾盟友考虑撤减对美投资 不满美以突袭伊朗

中国日报网
2026-03-07 12:34:06
准备同归于尽!伊朗或启用“沉睡小组”,在美国本土执行斩首行动

准备同归于尽!伊朗或启用“沉睡小组”,在美国本土执行斩首行动

东极妙严
2026-03-06 13:43:35
含钾是香蕉的12倍!春天一周吃2次,一补钾、二通便,三排毒

含钾是香蕉的12倍!春天一周吃2次,一补钾、二通便,三排毒

阿龙美食记
2026-03-07 12:55:06
“王兴兴相亲贴”被发现,要求伴侣无不良嗜好,不抽烟不喝酒

“王兴兴相亲贴”被发现,要求伴侣无不良嗜好,不抽烟不喝酒

大风新闻
2026-03-07 10:47:06
0-3、0-0!中超2支升班马无缘开门红,刘建业比李金羽更老练

0-3、0-0!中超2支升班马无缘开门红,刘建业比李金羽更老练

中超伪球迷
2026-03-07 17:31:54
我们大女人就是要看这些好东西的啊!

我们大女人就是要看这些好东西的啊!

精品购物指南
2026-03-06 18:42:35
朱亚文的“发言”在全网火了,冯远征的两会建议,含金量还在升

朱亚文的“发言”在全网火了,冯远征的两会建议,含金量还在升

好贤观史记
2026-03-07 09:51:22
一舞封神后,被东莞首富收入囊中,如今她已是7岁孩子妈妈

一舞封神后,被东莞首富收入囊中,如今她已是7岁孩子妈妈

白面书誏
2026-03-06 16:34:31
伊朗发生地震

伊朗发生地震

日照日报
2026-03-07 16:23:23
内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

品读时刻
2026-02-11 17:18:30
泰山3比0赢铁人,阿尔瓦罗是高级货,泰山的轮换思路大改变

泰山3比0赢铁人,阿尔瓦罗是高级货,泰山的轮换思路大改变

新新自圆其说说体育
2026-03-07 17:45:44
一场0-1爆冷!亚洲杯出线形势乱了,中国队对手有变 赢朝鲜≈4强

一场0-1爆冷!亚洲杯出线形势乱了,中国队对手有变 赢朝鲜≈4强

大秦壁虎白话体育
2026-03-07 17:22:01
扣押巨额资产,带走两名乌克兰战俘:泽连斯基要把欧尔班拉下马

扣押巨额资产,带走两名乌克兰战俘:泽连斯基要把欧尔班拉下马

鹰眼Defence
2026-03-07 18:14:39
随着成都蓉城5-1,中超最新积分榜出炉:申花和津门虎并列倒数第一

随着成都蓉城5-1,中超最新积分榜出炉:申花和津门虎并列倒数第一

侧身凌空斩
2026-03-06 21:37:34
油价暴涨;大量滞留在迪拜的黄金,折价出售!伊朗:一个仅拥有250年历史的国家,想要对一个3000年的国家发号施令,绝对不可能

油价暴涨;大量滞留在迪拜的黄金,折价出售!伊朗:一个仅拥有250年历史的国家,想要对一个3000年的国家发号施令,绝对不可能

每日经济新闻
2026-03-07 10:28:09
汪峰前妻葛荟婕被小7岁男友当众掌掴!自曝分手真相,男方太过分

汪峰前妻葛荟婕被小7岁男友当众掌掴!自曝分手真相,男方太过分

观鱼听雨
2026-03-06 17:26:12
“老舅妈”嫩娘逝世 享年100岁

“老舅妈”嫩娘逝世 享年100岁

看看新闻Knews
2026-03-06 12:54:03
人老了,想多活几年,先管住自己十点:1、不摔倒,2、不劳累……

人老了,想多活几年,先管住自己十点:1、不摔倒,2、不劳累……

三农老历
2026-02-08 01:47:40
2026-03-07 19:27:00
快科技 incentive-icons
快科技
一起关注每日科技热点
107064文章数 260134关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

中国货船"铁娘子"号通过霍尔木兹海峡 大量船舶仍滞留

头条要闻

中国货船"铁娘子"号通过霍尔木兹海峡 大量船舶仍滞留

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

周杰伦田馥甄的“JH恋” 被扒得底朝天

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

本地
家居
时尚
教育
公开课

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

家居要闻

暖棕撞色 轻法奶油风

这些才是适合普通人的穿搭!搭配腰带、多穿牛仔裤,简单舒适

教育要闻

现在学校已经不发教辅了,让家长自愿去书店购买!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版