作者|子川
来源|AI先锋官
在开源这条道路上,越来越多武林高手出现啦!
就在刚刚,智谱也宣布开源了!
此次一共开源了两个模型,都采用混合专家(MoE)架构,分别是
GLM-4.5:总参数量 355B,激活参数 32B;
GLM-4.5-Air:总参数 106B,激活参数 12B。
其中GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3。
先看跑分成绩,在12 个评测基准,包括MMLU Pro、AIME24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3和 BrowseComp。
综合平均分,GLM-4.5 取得了全球模型第三、国产模型和开源模型双料第一的好成绩。
再来看大家最关心的价格,GLM-4.5API调用价格是呈阶梯式的。
在输入0-32千Token且输出0-0.2千tokens时,价格为输入0.8元/百万tokens,输出2元/百万tokens。
当你的输入32-128千Tokens时,价格则和Deepseek R1和Kimi k2一样。
除此之外,速度也是另一大优势,高速版本实测生成速度最高可至 100 tokens/秒。
这么强的模型,不玩一玩可惜了,老规矩,我们来实测一番。
测试的选手有GLM-4.5,Kimi k2和Qwen3 coder。
先来一道简单前端页面编程题开开胃。
提示词
请创建一个现代化的登录页面,包含以下功能:
- 邮箱和密码输入框
- 登录按钮
- "记住我"和"忘记密码"选项
- Google第三方登录
- 注册链接
要求:深色主题,未来科技风格,居中布局,良好的用户体验。
GLM-4.5:
Kimi:
Qwen3 coder:
三款模型的完成度都非常好,不仅把登陆页面完整生成出来,而且交互效果但做出来了,效果都挺不错。如果非要选择一个,小编可能会更加喜欢Qwen3 coder生成的配色。
加点难度,来一道经典老题,天气卡片。
提示词
Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions
GLM-4.5:
Kimi K2:
Qwen3 coder:
无论是从动画效果还是美感来比较,小编觉得GLM-4.5要更胜一筹,一些UI的细节也做得更好。
为了让大家更加直观的比较不同,我们用下面更加专业的提示词再来比较一下大模型们的美感。
提示词
你是一位国际顶尖的数字杂志艺术总监和前端开发专家,曾为Vogue、Elle等时尚杂志设计过数字版面,擅长将奢华杂志美学与现代网页设计完美融合,创造出令人惊艳的视觉体验。
## 任务
请使用未来科技风格 (Futuristic Tech)设计高级时尚杂志风格的知识卡片,将日常信息以精致奢华的杂志编排呈现,让用户感受到如同翻阅高端杂志般的视觉享受。
* 日期区域:以各风格特有的方式呈现当前日期
* 标题和副标题:根据风格调整字体、大小、排版方式
* 引用区块:设计独特的引用样式,体现风格特点
* 核心要点列表:以符合风格的方式呈现列表内容
* 编辑笔记/小贴士:设计成符合风格的边栏或注释
**技术规范:**
* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript
*FontAwesome:
* Tailwind CSS:
* 中文字体:
* 可考虑添加微妙的动效,如页面载入时的淡入效果或微妙的悬停反馈
* 确保代码简洁高效,注重性能和可维护性
* 使用CSS变量管理颜色和间距,便于风格统一
* 对于液态数字形态主义风格,必须添加流体动态效果和渐变过渡
* 对于超感官极简主义风格,必须精确控制每个像素和微妙的交互反馈
* 对于新表现主义数据可视化风格,必须将数据以视觉化方式融入设计
**输出要求:**
* 代码应当优雅且符合最佳实践,CSS应体现出对细节的极致追求
* 设计的宽度为440px,高度不超过1280px
* 对主题内容进行抽象提炼,只显示列点或最核心句引用,让人阅读有收获感
* 永远用中文输出,装饰元素可用法语、英语等其他语言显得有逼格
请以国际顶尖杂志艺术总监的眼光和审美标准,创造风格迥异但同样令人惊艳的数字杂志式卡片,让用户感受到"这不是普通的信息卡片,而是一件可收藏的数字艺术品"。
GLM-4.5:
Kimi K2:
Qwen3 coder:
这下大家是不是更清晰了,GLM4.5生成的文字卡片不仅有发光背景(凸显未来感),而且颜色搭配也很好看。
除此之外,相比其他两款模型,GLM4.5是唯一有交互设计的,这一局,GLM获胜。
最后来一个终极PK,生成一款三D打砖游戏。
提示词
“创建一个完全由鼠标控制的3D打砖块游戏:
1. 使用Three.js构建沉浸式3D场景,包含以下核心组件:可左右滑动的玩家挡板(Paddle):通过鼠标水平移动控制;具备物理属性的弹跳球体:初始速度适中,碰撞后遵循反射定律;多排彩色悬浮砖块(Bricks):不同颜色对应不同分值
2. 物理效果要求:碰撞检测:球体与砖块/挡板/边界精确碰撞;动态反弹:挡板不同位置碰撞改变球的水平反弹角度;重力模拟:球体运动轨迹呈自然抛物线
3. 游戏机制:计分系统:击碎砖块实时计分(普通砖=10分,金色砖=50分);生命值:初始3条命,球掉落底部则扣除生命;速度进化:每击碎10块砖,球速提升15%
4. 视觉特效:砖块击碎时触发粒子爆炸效果;球体运动轨迹添加动态拖尾光效;挡板碰撞时出现环形冲击波动画
5. 交互增强:实时显示分数和生命值HUD;游戏结束界面显示最终得分+重新开始按钮;添加碰撞音效(使用Web Audio API)”
GLM-4.5:
Kimi K2:
Qwen3 coder:
效果一目了然,GLM生成的可玩性明显更强,而且bug也是最少的,这一局,依旧是GLM获胜。
总的来说,GLM4.5的代码能力确实很强,印象最深就是它的美感,而且每次任务都是一次性完成的。
大家感兴趣的可以去体验一下,在chatglm.cn和 Z.ai都可以免费体验满血版GLM-4.5。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.