网易首页 > 网易号 > 正文 申请入驻

智谱GLM-4.5V深度测评:前端复现、文字识别...它确实有点东西!

0
分享至

作者|子川

来源|AI先锋官

智谱又开源了!

两周前,智谱把 GLM-4.5 系列砸向开源圈。

时隔不久,就在两天前,智谱再次宣布开源其最新一代的视觉理解模型——GLM-4.5V。

这是一个视觉能力强悍的多模态推理模型。

根据官方介绍,该模型基于 GLM-4.5-Air 训练,拥有 1060 亿参数和 120 亿激活参数。

先来看一下它的纸面实力。

根据官方发布的技术细节,在 41 个公开的视觉多模态榜单上,GLM-4.5V 的表现在同尺寸模型中最佳,超越了 Step-3、Qwen2.5-VL 等模型。


同时,GLM-4.5V还参与了拍图猜地点积分赛,最终GLM-4.5V的积分排到了该赛事网站的第66名,超越了99%的人类用户。


那它的实际效果到底如何?有介绍的那么厉害吗?老规矩,我们来测一测。

实测一:复现前端页面

发布会上有提到,GLM-4.5V 可以根据网页录屏或截图来复现前端代码。

我们上传一张抖音的截图,让它 1:1 复刻一个一模一样的页面。


生成的效果是这样式的。


一眼看过去,页面上几乎所有的功能,如登录、点赞、收藏等按钮,都被复制粘”过来了。

但缺点也很明显:每个功能模块之间的距离没有把控好,更多 UI 细节没能还原,看起来有点丑(当然,这已经很强了)。

为了测试 GLM-4.5V 的极限,我们还让它 1:1 复刻一个功能入口极其繁多的淘宝首页。


从结果来看,这似乎是把它难住了。

这次它没能把所有的文本信息都复制过来,缺失了一部分功能,比如“淘宝直播”、“88VIP”等模块就没有看到。


实测二:文字识别

接下来,我们测试了它的文字识别能力。我们上传了一张发票,并要求它提取所有关键信息。

提示词:请提取这张照片的内容,其中内容格式‘机器编号’、‘发票代码’、‘发票号码’、‘开票日期’、‘校 验 码’、‘购买方名称’、‘购买方纳税人识别号’、‘购买方地 址、电 话’、‘开户行及账号’、‘货物或应税劳务、服务名称’、‘规格型号’、‘单 位’、‘数 量’、‘单 价’、‘金 额’、‘税率’、‘税 额’、‘价税合计(大写)’、‘价税合计(小写)’、‘销售方名称’、‘销售方纳税人识别号’、‘销售方地 址、电 话’、‘销售方地 址、电 话’、‘开户行及账号’、‘备注’、‘收款人’、‘复核’、‘开票人’ 字段返回信息,返回的结果信息以json格式返回


这一次,GLM-4.5V 表现堪称完美,准确识别并提取出所有的文字信息。


实测三:图像识别与查找

为了测试 GLM-4.5V 的图像识别能力,我们让它玩起了“找东西”游戏。

比如让它找寻图片中有几个“3”。


GLM-4.5V很快答案,并且准确地在图中标注了出来。


升级一下难度,让它在一堆熊猫中寻找一个足球。

说实话,如果不是提前知道答案,小编也很难快速找到。


尽管比较复杂,但还是很快就找到了。


实测4:地理定位

这个测试怎么能少的得了看图识位置呢。

上传一张小编之前去玩时拍的照片,让它猜猜这是哪儿。


回答正确!它很快就识别出这是深圳的“湾区之光”摩天轮。


不过,考虑到这个摩天轮还算比较出名,可能没什么挑战性。再换一张小众点的风景照试试。


这次 GLM-4.5V 就没能准确识别了,它推测这里可能是日本冈山县牛窗地区的某个海滨。

而正确答案其实是:深圳。


目前该模型可以直接在z.ai或智谱清言体验。

同时GitHub、Hugging Face、魔搭社区均已上架,甚至贴心地提供了FP8量化版,大家感兴趣,可以去试玩一番。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏盐城一座在建桥梁垮塌

江苏盐城一座在建桥梁垮塌

界面新闻
2026-02-02 23:46:52
卧槽!5换1,勇士要梭哈一把大的!

卧槽!5换1,勇士要梭哈一把大的!

体育新角度
2026-02-02 22:39:01
格莱美红毯惊现“近乎全裸”造型!美国网友怒怼:这比没穿还尴尬

格莱美红毯惊现“近乎全裸”造型!美国网友怒怼:这比没穿还尴尬

小徐讲八卦
2026-02-03 06:38:51
直线拉升!特朗普宣布:降低关税!

直线拉升!特朗普宣布:降低关税!

中国基金报
2026-02-03 06:10:44
萝莉岛最新黑幕!特朗普、比尔盖茨、马斯克最丑恶一面被曝光……

萝莉岛最新黑幕!特朗普、比尔盖茨、马斯克最丑恶一面被曝光……

网评社
2026-02-02 01:02:21
爱泼斯坦案最新文件曝光,西方“吃人”社会大揭秘!

爱泼斯坦案最新文件曝光,西方“吃人”社会大揭秘!

枫冷慕诗
2026-02-02 13:35:20
央媒怒批、坑害老百姓!臭名昭著的五大相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的五大相声演员,各个难以原谅

梦醉为红颜一笑
2026-02-02 06:12:05
二战结束后,果敢为什么选择加入缅甸,而不回归中国?原因简单

二战结束后,果敢为什么选择加入缅甸,而不回归中国?原因简单

凡人侃史
2026-02-01 22:54:52
台贵客抵达北京!岛内变天信号出现,关键时刻,美日态度惊人一致

台贵客抵达北京!岛内变天信号出现,关键时刻,美日态度惊人一致

书纪文谭
2026-02-02 23:17:16
15万亿瞬间蒸发!特朗普终于动手:这是一场针对中国的金融屠杀?

15万亿瞬间蒸发!特朗普终于动手:这是一场针对中国的金融屠杀?

来科点谱
2026-02-02 19:37:47
对汉族不爽的这人,据说被刑拘了

对汉族不爽的这人,据说被刑拘了

疫苗与科学
2026-02-02 07:06:18
盐城在建大桥突然垮塌,知情人曝现场细节:吊装时桥体直接塌了

盐城在建大桥突然垮塌,知情人曝现场细节:吊装时桥体直接塌了

奇思妙想草叶君
2026-02-03 00:44:29
黄金一夜暴跌近30%,第一批输不起的人魔怔了

黄金一夜暴跌近30%,第一批输不起的人魔怔了

鸣金网
2026-02-02 17:24:54
12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

新浪财经
2026-02-02 23:00:39
爱波斯坦和上海女大佬的风流往事大曝光!

爱波斯坦和上海女大佬的风流往事大曝光!

互联网大观
2026-02-02 15:19:51
澳政府通告全球,撕毁99年租约!中方强硬出手,三大后果即将兑现

澳政府通告全球,撕毁99年租约!中方强硬出手,三大后果即将兑现

不似少年游
2026-02-02 07:12:51
契丹人有多讲究?签订澶渊之盟后,100多年和北宋几乎秋毫无犯

契丹人有多讲究?签订澶渊之盟后,100多年和北宋几乎秋毫无犯

历史摆渡
2026-02-02 20:05:03
两男孩玩火点燃狗笼,小狗被活活烧死!主人:萨摩耶养了7年感情很深,不接受私了,要求孩子家长道歉

两男孩玩火点燃狗笼,小狗被活活烧死!主人:萨摩耶养了7年感情很深,不接受私了,要求孩子家长道歉

新民晚报
2026-02-03 08:16:52
赵睿不当言论后致歉:情绪化回复,不应将情绪发泄在球迷朋友身上

赵睿不当言论后致歉:情绪化回复,不应将情绪发泄在球迷朋友身上

篮球资讯达人
2026-02-02 21:30:53
江西5孩宝妈“倾家荡产”事件冲上热搜:一夜暴富,是普通人最大的坑……

江西5孩宝妈“倾家荡产”事件冲上热搜:一夜暴富,是普通人最大的坑……

桌子的生活观
2026-02-02 12:33:58
2026-02-03 09:35:00
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
425文章数 50关注度
往期回顾 全部

科技要闻

马斯克官宣,SpaceX并购xAI,打造天基算力

头条要闻

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

头条要闻

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

“精准查人”黑产链条遭查

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

房产
亲子
旅游
本地
健康

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

亲子要闻

为什么“月子仇”,会让女人记一辈子?

旅游要闻

一路黔行・爽居畅游 | 贵阳:一城烟火 点燃冬日文旅活力

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

无障碍浏览 进入关怀版