网易首页 > 网易号 > 正文 申请入驻

一手实测GLM-4.5 VS Kimi K2 VS Qwen3- Coder,它的代码能力确实强!

0
分享至

作者|子川

来源|AI先锋官

在开源这条道路上,越来越多武林高手出现啦!

就在刚刚,智谱也宣布开源了!

此次一共开源了两个模型,都采用混合专家(MoE)架构,分别是

GLM-4.5:总参数量 355B,激活参数 32B;

GLM-4.5-Air:总参数 106B,激活参数 12B。

其中GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3。

先看跑分成绩,在12 个评测基准,包括MMLU Pro、AIME24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3和 BrowseComp。

综合平均分,GLM-4.5 取得了全球模型第三、国产模型和开源模型双料第一的好成绩

再来看大家最关心的价格,GLM-4.5API调用价格是呈阶梯式的。

在输入0-32千Token且输出0-0.2千tokens时,价格为输入0.8元/百万tokens输出2元/百万tokens。

当你的输入32-128千Tokens时,价格则和Deepseek R1和Kimi k2一样。

除此之外,速度也是另一大优势,高速版本实测生成速度最高可至 100 tokens/秒。

这么强的模型,不玩一玩可惜了,老规矩,我们来实测一番。

测试的选手有GLM-4.5,Kimi k2和Qwen3 coder。

先来一道简单前端页面编程题开开胃。

提示词

请创建一个现代化的登录页面,包含以下功能:

- 邮箱和密码输入框

- 登录按钮

- "记住我"和"忘记密码"选项

- Google第三方登录

- 注册链接

要求:深色主题,未来科技风格,居中布局,良好的用户体验。

GLM-4.5:

Kimi:

Qwen3 coder:

三款模型的完成度都非常好,不仅把登陆页面完整生成出来,而且交互效果但做出来了,效果都挺不错。如果非要选择一个,小编可能会更加喜欢Qwen3 coder生成的配色。

加点难度,来一道经典老题,天气卡片。

提示词

Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions

GLM-4.5:

Kimi K2:

Qwen3 coder:

无论是从动画效果还是美感来比较,小编觉得GLM-4.5要更胜一筹,一些UI的细节也做得更好。

为了让大家更加直观的比较不同,我们用下面更加专业的提示词再来比较一下大模型们的美感。

提示词

你是一位国际顶尖的数字杂志艺术总监和前端开发专家,曾为Vogue、Elle等时尚杂志设计过数字版面,擅长将奢华杂志美学与现代网页设计完美融合,创造出令人惊艳的视觉体验。

## 任务

请使用未来科技风格 (Futuristic Tech)设计高级时尚杂志风格的知识卡片,将日常信息以精致奢华的杂志编排呈现,让用户感受到如同翻阅高端杂志般的视觉享受。

* 日期区域:以各风格特有的方式呈现当前日期

* 标题和副标题:根据风格调整字体、大小、排版方式

* 引用区块:设计独特的引用样式,体现风格特点

* 核心要点列表:以符合风格的方式呈现列表内容

* 编辑笔记/小贴士:设计成符合风格的边栏或注释

**技术规范:**

* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript

*FontAwesome:

* Tailwind CSS:

* 中文字体:

* 可考虑添加微妙的动效,如页面载入时的淡入效果或微妙的悬停反馈

* 确保代码简洁高效,注重性能和可维护性

* 使用CSS变量管理颜色和间距,便于风格统一

* 对于液态数字形态主义风格,必须添加流体动态效果和渐变过渡

* 对于超感官极简主义风格,必须精确控制每个像素和微妙的交互反馈

* 对于新表现主义数据可视化风格,必须将数据以视觉化方式融入设计

**输出要求:**

* 代码应当优雅且符合最佳实践,CSS应体现出对细节的极致追求

* 设计的宽度为440px,高度不超过1280px

* 对主题内容进行抽象提炼,只显示列点或最核心句引用,让人阅读有收获感

* 永远用中文输出,装饰元素可用法语、英语等其他语言显得有逼格

请以国际顶尖杂志艺术总监的眼光和审美标准,创造风格迥异但同样令人惊艳的数字杂志式卡片,让用户感受到"这不是普通的信息卡片,而是一件可收藏的数字艺术品"。

GLM-4.5:

Kimi K2:

Qwen3 coder:

这下大家是不是更清晰了,GLM4.5生成的文字卡片不仅有发光背景(凸显未来感),而且颜色搭配也很好看。

除此之外,相比其他两款模型,GLM4.5是唯一有交互设计的,这一局,GLM获胜。

最后来一个终极PK,生成一款三D打砖游戏。

提示词

“创建一个完全由鼠标控制的3D打砖块游戏:

1. 使用Three.js构建沉浸式3D场景,包含以下核心组件:可左右滑动的玩家挡板(Paddle):通过鼠标水平移动控制;具备物理属性的弹跳球体:初始速度适中,碰撞后遵循反射定律;多排彩色悬浮砖块(Bricks):不同颜色对应不同分值

2. 物理效果要求:碰撞检测:球体与砖块/挡板/边界精确碰撞;动态反弹:挡板不同位置碰撞改变球的水平反弹角度;重力模拟:球体运动轨迹呈自然抛物线

3. 游戏机制:计分系统:击碎砖块实时计分(普通砖=10分,金色砖=50分);生命值:初始3条命,球掉落底部则扣除生命;速度进化:每击碎10块砖,球速提升15%

4. 视觉特效:砖块击碎时触发粒子爆炸效果;球体运动轨迹添加动态拖尾光效;挡板碰撞时出现环形冲击波动画

5. 交互增强:实时显示分数和生命值HUD;游戏结束界面显示最终得分+重新开始按钮;添加碰撞音效(使用Web Audio API)”

GLM-4.5:

Kimi K2:

Qwen3 coder:

效果一目了然,GLM生成的可玩性明显更强,而且bug也是最少的,这一局,依旧是GLM获胜。

总的来说,GLM4.5的代码能力确实很强,印象最深就是它的美感,而且每次任务都是一次性完成的。

大家感兴趣的可以去体验一下,在chatglm.cn和 Z.ai都可以免费体验满血版GLM-4.5。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
襄阳警方回应“女子举报被老师强奸拐走孩子”:发生过关系,强奸产子和拐卖证据不足

襄阳警方回应“女子举报被老师强奸拐走孩子”:发生过关系,强奸产子和拐卖证据不足

大风新闻
2026-02-10 20:24:15
冬奥会头号衰男?挪威选手哭着承认出轨求复合 女友:绝不原谅他

冬奥会头号衰男?挪威选手哭着承认出轨求复合 女友:绝不原谅他

风过乡
2026-02-11 21:12:27
72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

深析古今
2025-12-08 12:29:36
娜扎透视裙惊艳全网!这身材这颜值,谁能顶得住?

娜扎透视裙惊艳全网!这身材这颜值,谁能顶得住?

娱乐领航家
2026-02-03 23:30:03
钱再多有啥用?57岁李克勤“家丑”曝光,一个败家子拖垮了全家

钱再多有啥用?57岁李克勤“家丑”曝光,一个败家子拖垮了全家

寻途
2026-01-16 19:58:44
台积电2025年员工分红超2061亿元新台币,人均约264万元新台币

台积电2025年员工分红超2061亿元新台币,人均约264万元新台币

IT之家
2026-02-11 15:18:17
在不对外营业的私人会所多次接受宴请 广西壮族自治区党委政法委原副书记李文博被通报

在不对外营业的私人会所多次接受宴请 广西壮族自治区党委政法委原副书记李文博被通报

红星新闻
2026-02-10 21:42:02
俄外长:俄罗斯 愿通过对话解决乌克兰问题

俄外长:俄罗斯 愿通过对话解决乌克兰问题

每日经济新闻
2026-02-11 07:06:31
官方:马赛主教练德泽尔比下课

官方:马赛主教练德泽尔比下课

懂球帝
2026-02-11 10:31:22
引用7000次也回不去硅谷:Meta顶级华人科学家再入境被拒,那个“收割天才”的时代结束了

引用7000次也回不去硅谷:Meta顶级华人科学家再入境被拒,那个“收割天才”的时代结束了

留学生日报
2026-02-11 15:14:40
悄悄5连胜!联盟第1!西部豪门超级崛起,文班亚马却有所保留

悄悄5连胜!联盟第1!西部豪门超级崛起,文班亚马却有所保留

世界体育圈
2026-02-11 17:18:33
荣获季军!山东男篮21分大胜广厦,琼斯首秀17+14陶汉林12+6

荣获季军!山东男篮21分大胜广厦,琼斯首秀17+14陶汉林12+6

中国篮坛快讯
2026-02-11 21:08:51
英格拉姆顶替库里入选全明星 选择猛龙太明智!

英格拉姆顶替库里入选全明星 选择猛龙太明智!

体坛周报
2026-02-11 07:40:38
纳瓦尔的智慧:没有父母托举,普通人在30-50岁只有一个主线任务

纳瓦尔的智慧:没有父母托举,普通人在30-50岁只有一个主线任务

娱乐圈见解说
2026-02-08 12:41:58
关门!关窗!东莞天气大反转!

关门!关窗!东莞天气大反转!

东莞纪实
2026-02-11 20:44:19
未来两个月,正式转运的三个星座,霉运清零好运全面上线

未来两个月,正式转运的三个星座,霉运清零好运全面上线

小晴星座说
2026-02-11 21:17:21
中国女篮今晚大战国际女篮,附赛程!央视直播表:CCTV5不播!

中国女篮今晚大战国际女篮,附赛程!央视直播表:CCTV5不播!

皮皮观天下
2026-02-11 15:13:10
伊朗,突发!特朗普,重大宣布!

伊朗,突发!特朗普,重大宣布!

新浪财经
2026-02-11 09:52:29
台湾费尽心思安排到解放军内部的间谍,全都被李志豪给揪了出来

台湾费尽心思安排到解放军内部的间谍,全都被李志豪给揪了出来

雪中风车
2026-02-06 08:12:58
特朗普为何难令泽连斯基放弃顿巴斯?

特朗普为何难令泽连斯基放弃顿巴斯?

高博新视野
2026-02-11 16:29:30
2026-02-11 21:51:03
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
430文章数 52关注度
往期回顾 全部

科技要闻

V4来了?DeepSeek 灰度测试新版本

头条要闻

前美国财长顾问:我刚从中国回来 美国没赢

头条要闻

前美国财长顾问:我刚从中国回来 美国没赢

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

广州前首富被判无期 200亿集资窟窿何偿

汽车要闻

比亚迪最美B级SUV? 宋Ultra这腰线美翻了

态度原创

房产
教育
健康
艺术
军事航空

房产要闻

177亿元,砸向超级城更!海南这座城,正式起飞!

教育要闻

寒假早预习!中小学电子课本可下载!

转头就晕的耳石症,能开车上班吗?

艺术要闻

南京人吵起来了:到底谁才算第一高楼?

军事要闻

特朗普:若美伊谈判失败 或再派一支航母打击群

无障碍浏览 进入关怀版