网易首页 > 网易号 > 正文 申请入驻

智谱AI的“类GPT-4o”,让我看到了作业帮、小红书、下厨房的影子

0
分享至

文|周鑫雨

编辑|苏建勋

卷出第一个国产版GPT-4o的,是智谱AI。

智谱AI的2024年主题,一定是在多模态赛道上狂奔。先是2024年7月26日,智谱AI上线了类Sora的视频生成模型“智谱清影”。团队邀请大家使用和反馈的诚意也很足——比起发布半年多了还没开放的Sora,“清影”上来就是免费不限量。

一个月后的8月29日,在国际数据挖掘与知识发现大会(KDD)上,智谱AI带着国产版《Her》、类GPT-4o炸了一波场——在C端产品“智谱清言”中,智谱AI首次上线了“视频通话”功能

这意味着,当“懂王”AI长了眼睛、有了情绪,人与AI的交互方式,离人与人更近了一步。

比如AI也跟上了潮流。最近刷屏游戏圈的《黑神话:悟空》,智谱清言看到后“秒懂”,还能和你唠两句。

同时,智谱AI还放出了最新版的“多模态模型全家桶”,比如能看懂视频和网页的视觉模型GLM-4V-Plus,支持图片编辑的文生图模型CogView-3-Plus。

语言基座模型GLM,也迭代到了GLM-4-Plus版本,更能玩转长文本,也更会做数学题。

智谱版GPT-4o的玩法:辅导作业、口语教练、厨房管家

曾经,GPT-4o的“三段感情迭代”,惊艳了一大批用户。但智谱清言像是个大直男,当要求它“更有感情一点”,它会理性地朝你“泼冷水”:作为一个人工智能,无法表达感情。

不过,智谱清言的视频通话功能,有更适合中国人“活到老学到老”体质的玩法。

比如,它可以是你的随身英语教师。打开摄像头后,你也能体验一把“走到哪,问到哪,学到哪”的高浓度英语学习。

 

△询问番茄的英文。来源:智谱AI

当然,它也可以是“哪里不懂拍哪里”的数学老师。智谱清言的讲解,质量甚至和真人教师有的一拼,不仅循循善诱,还有问答互动。家长再也不用为辅导作业而烦恼!

 

△解答混合运算选择题。来源:智谱AI

平时在家,智谱清言也揽下了生活管家的活。

比如,它能一眼认出瑞幸的包装袋,立马给你来了一段瑞幸历史的科普。不过,智谱清言最后开了小差,将本意为咖啡该怎么储存的问题,理解成了包装袋该怎么储存……

 

△识别瑞幸包装袋。来源:智谱AI

目前,视频通话的过程还无法储存在历史记录中。不过,有了“长了眼”的智谱清言,就仿佛同时下载了作业帮、小红书和下厨房。

新视觉模型上线,看得懂视频,也看得透网页源代码

对于智谱AI而言,2024年绝对是在多模态上狂飙的一年。

在KDD上,智谱AI更新了“模型全家桶”,既发布了新一代的语言基座模型,也发布了升级后的多模态家族:图像/视频理解模型GLM-4V-Plus、文生图模型 CogView-3-Plus。

先来看语言基座模型GLM-4-Plus。

有意思的是,GLM-4-Plus的训练,大量采用了高质量模型合成数据。事实证明,AI合成数据已经可以有效运用于模型训练,降低训练数据的获取成本。

从结果来看,GLM-4-Plus的语言理解能力,与GPT-4o和Llama3.1-405B不相上下。

△综合能力benchmark。图源:智谱AI

而在长文本能力的表现上,GLM-4-Plus和GPT-4o、Claude 3.5 Sonnet两个顶尖模型也并驾齐驱。在清华大学刘知远团队做的长文本测试集InfiniteBench上,GLM-4-Plus甚至略优于两个国外天花板模型。

△长文本能力benchmark。图源:智谱AI

同时,通过采取近端策略优化(PPO,一种提升复杂任务决策能力的训练方法),GLM-4-Plus的数据、代码算法等推理能力有了明显提升,并且能够更好反映人类偏好。

目前,GLM-4-Plus百万Tokens的处理价格为50元,与百度最新的大模型ERNIE 4.0 Turbo差不多持平(百万Tokens输入30元、输出60元)。

△GLM-4-Plus定价。

多模态能力的更新,是最精彩的部分。

相较于上一代GLM-4V,视觉大模型GLM-4V-Plus增加了视频和网页理解能力。

△视觉能力benchmark。图源:智谱AI

比如,只要输入智谱AI官网的截图,GLM-4V-Plus立刻就能转化成html代码,帮助你快速复刻网站。

△GLM-4V-Plus能力测试。图源:作者测试

与一般视频理解模型不同,GLM-4V-Plus不仅看得懂复杂视频,还具备时间感知能力。这意味着你问模型视频第xx秒的内容,它也能给出答案。不过截至发稿前,智谱AI开放平台的模型体验区还不支持上传视频。

美中不足的是,相较于逆天的视觉多模态理解能力,GLM-4V-Plus的多轮对话和文本理解能力显得有些“拉垮”。看来,GLM-4V-Plus离成为GPT-4o,还有相当距离。

△GLM-4V-Plus视频理解能力。图源:智谱AI

在KDD上,智谱AI还发布了新一代的文生图模型CogView-3-Plus。与近期文生图界的“当红炸子鸡”FLUX相比,CogView-3-Plus 20s版本的各项能力基本能打平。

△文生图能力benchmark。图源:智谱AI

输入提示词:桌子上有一台笔记本电脑,电脑旁边放着一个透明玻璃杯,这是一个圆柱形的杯子,半杯水还冒着热气,杯身折射了些许阳光。

△CogView-3-Plus能力测试。图源:作者测试

同时,CogView-3-Plus也支持图片编辑功能,比如改变图中物体的颜色、替换物品等等。

△CogView-3-Plus图片编辑。图源:智谱AI

给2024年1月发布的几款模型,加上“Plus”的后缀,智谱AI花了超过7个月——这也是2023年以来,智谱AI发布模型的最长周期。

可见的是,GPT-4o,对于AI大模型企业而言,是一道能力的分水岭。随着多模态能力的融合,语言理解的“黑箱”刚被打开,又很快被GPT-4o合上了。

多数国内模型厂商的策略是:分而治之,先增强不同模态的单模态模型能力,再攻克融合的难题。

智谱AI的模型矩阵,目前仍然在各自迭代能力的“分治”阶段,而视频通话功能的上线,让用户已经看到了初步多模融合的影子。

欢迎交流

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人不会无缘无故患上糖尿病!专家发现:患糖尿病,多半爱干这9事

人不会无缘无故患上糖尿病!专家发现:患糖尿病,多半爱干这9事

岐黄传人孙大夫
2025-12-31 13:00:06
马杜罗之子号召支持者上街抗议美国入侵行径

马杜罗之子号召支持者上街抗议美国入侵行径

新华社
2026-01-05 13:39:44
女网红在柬埔寨流浪已找到,前后反差,让人脊背发凉

女网红在柬埔寨流浪已找到,前后反差,让人脊背发凉

半耳聆
2026-01-05 11:56:23
2026年地方政府发债拉开序幕 山东省率先发行723.81亿元

2026年地方政府发债拉开序幕 山东省率先发行723.81亿元

证券时报
2026-01-05 12:03:02
特朗普突然发动战争,中国代表团还在委内瑞拉!

特朗普突然发动战争,中国代表团还在委内瑞拉!

胜研集
2026-01-03 17:14:34
曼联官方:阿莫林不再担任球队主帅,达伦·弗莱彻将担任代理主教练

曼联官方:阿莫林不再担任球队主帅,达伦·弗莱彻将担任代理主教练

极目新闻
2026-01-05 18:26:24
业界微坦天花板?田中宁宁从暴力身型到发片机器,她到底经历了啥

业界微坦天花板?田中宁宁从暴力身型到发片机器,她到底经历了啥

素然追光
2026-01-06 05:35:03
接触的人多了你会明白如果一个人还在穿5年前的衣服只说明3个问题

接触的人多了你会明白如果一个人还在穿5年前的衣服只说明3个问题

深度报
2026-01-05 22:52:09
“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

菁妈育儿
2026-01-03 12:44:30
米哈游旗下游戏投资人撤资?谣言,已被上海警方行政处罚

米哈游旗下游戏投资人撤资?谣言,已被上海警方行政处罚

贝壳财经
2026-01-05 16:35:36
真相大白!颜丙涛被爆提前回归赛场是真是假,3方面原因给出答案

真相大白!颜丙涛被爆提前回归赛场是真是假,3方面原因给出答案

曹说体育
2026-01-05 22:56:47
泪崩了!母亲走后22天,父亲凌晨去世,一18岁女孩独自放报丧炮…

泪崩了!母亲走后22天,父亲凌晨去世,一18岁女孩独自放报丧炮…

火山詩话
2026-01-05 05:33:10
再见,程序员!马斯克宣判:奇点就在2026

再见,程序员!马斯克宣判:奇点就在2026

新智元
2026-01-05 11:23:24
聂远女儿和李湘女儿同框,能看得出气质根本不是用钱打扮出来的

聂远女儿和李湘女儿同框,能看得出气质根本不是用钱打扮出来的

手工制作阿歼
2026-01-06 02:57:08
哥伦比亚总统:“特朗普先生,请停止诽谤”

哥伦比亚总统:“特朗普先生,请停止诽谤”

界面新闻
2026-01-05 11:47:29
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
爆冷,1.6秒3分压哨绝杀,布克带领太阳队108-105战胜雷霆队

爆冷,1.6秒3分压哨绝杀,布克带领太阳队108-105战胜雷霆队

好火子
2026-01-06 05:45:23
河北农村取暖问题,不能再耽搁了

河北农村取暖问题,不能再耽搁了

齐鲁壹点
2026-01-05 15:20:13
东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

潇湘晨报
2026-01-05 16:58:18
美国发出“拦截军售就开战”的威胁

美国发出“拦截军售就开战”的威胁

安安说
2026-01-03 12:35:28
2026-01-06 06:20:49
36氪 incentive-icons
36氪
让一部分人先看到未来
150343文章数 2847652关注度
往期回顾 全部

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

时尚
手机
家居
教育
本地

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

手机要闻

1月Turbo混战,中端性能机你选哪个?

家居要闻

白色大理石 奢华现代

教育要闻

深圳学籍卡打印别急!3分钟轻松搞定

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

无障碍浏览 进入关怀版