实测DeepSeek vs GLM-5，中国AI杀疯了，程序员危！！|调用|魔方|glm|全模态|deepseek

实测DeepSeek vs GLM-5，中国AI杀疯了，程序员危！！

2026-02-12 13:36:28　来源: 沃垠AI

四川举报

分享至

大家好，我是冷逸。最近，中国模型杀疯了，我也快忙疯了。

进入2026年，感觉我每天16个小时都泡在AI里，也追不上AI进化的速度。每天一睁眼，世界就变了样。

就这几天，Seedance 2.0以极强的导演级AI能力登顶视频王座。就在昨晚，悄悄上线了最新模型。而就在刚刚，智谱AI也发布了全新的基座模型GLM-5。

这是它的bench得分。与自己的GLM-4.7比，大幅提升；与御三家相比，也互有胜负。

真的，麻了。

大家都在快快快快快，我也跟着追追追追追。

好好好，既然都在一个时间上线，那我就一起做期横评吧。

横评GLM-5与DeepSeek

DeepSeek新模型，测试渠道是在DeepSeek官网（已确认使用的是最新版）。

GLM-5是在Z.ai测试，主要是Chat模式。

1）推理：经典洗车难题

先来一道最近热门的「洗车难题」，据说把ChatGPT、Claude、Gork、豆包、千问、元宝都给干趴下了。

我想去洗车，洗车店距离我家50米，你说我应该开车过去还是走过去？

都开启Thinking模式，DeepSeek直接明了：开过去。

GLM-5也是建议开过去。

同时，它还给了2种最佳操作方案。如果店里是人工精洗，那就把钥匙给店员，自己回家休息。如果是机洗，建议洗完再兜个圈，让车身上的风把水吹干。

你别说，GLM-5这还考虑得挺全面的。

但如果不开Thinking模式，我发觉他俩就大相径庭了。GLM仍是让开过去，毕竟洗的是车。DeepSeek则说走过去，因为“50米开车属于‘无效磨损’”……

确实，非Thinking模式下，DS容易出错。

2）前端：信息图

日常发文章，我会经常用到一张信息图，多数情况我都是用Gemini 3 Pro生成。

提示词是：

提炼下面内容的核心关键点，创建一个HTML网页。
文字内容：
{
你的内容
}
网页的设计要求如下：
1.视觉设计：采用{Magazine Layout}风格布局，{深色}主题色，营造现代高端氛围。
2.字体与排版：
·使用超大字体或数字突出核心要点，中文采用大号粗体，强调视觉冲击力。
·英文使用小号字体作为点缀，与中文形成比例反差，提升设计层次感。
3视觉元素：
·融入超大视觉元素（如标题、背景图或装饰）以突出重点，与小型元素形成强烈对比。
·使用简洁的勾线风格图形作为数据可视化或配图元素，保持现代感和清晰度。
4.色彩与效果：运用高亮色（单色透明度渐变）营造科技感，每种高亮色独立使用，避免不同高亮色之间的渐变混杂。
5.技术要求：引入专业图标库（如Font Awesome或Material Icons，通过CDN加载），避免使用emoji作为主要图标。
6.内容要求：提炼内容关键要点，不忽略重要细节。

我整理了GLM-5的一些资料，让DeepSeek和GLM-5都生成一下。

先看DeepSeek的。

整体版式ok，数字和关键词的视觉张力也都有，色彩也是AI常见的青、蓝、紫色。但简洁线条有点过于丰富了，再加上过多的图标，反而不太好看。

再来看下GLM-5的。

倒是简单明了，层次分明，小字、大字和数字错位排版。用的圆角UI，比DeepSeek也入眼了一些。如果是网页浏览，还有悬停动画和光晕视差。

顺手，我还用Gemini 3 Pro生成了下。

单这个信息图Case来说，我感觉GLM-5和Gemini 3不相上下。

3）前端：设计完整网站

前几天，我给大家介绍了一个有意思的产品：。

很多人想体验，但我发现他们没有官方网站。现在，我让DeepSeek和GLM-5分别搓一个。

提示词很简单，我都懒得描述，直接让AI读我的文章来设计网站。

给这篇文章的产品写一个宣传网页： https://mp.weixin.qq.com/s/KM0youAHaJLq45UO3v-L5w

先看GLM-5的。

第一次打开网站，说实话，我有点被惊到了。它在首页做了一个模拟抖音的故障艺术效果，紫色主色调+青粉色的霓虹点缀耐看，也符合产品的调性。

核心板块，Hero、功能、案例、创作以及下载指引，该有的都有。而且，GLM对Logo的提炼非常精准，实际上我并没有告诉他它。

整体看下来，我觉得这就是我想要的产品官网。Loopit的朋友，可以私聊我要源码了。

然后，我们来看看DeepSeek交的。

还蛮好玩的，用鼠标点一下就会随机出现一些字或者图标，确实魔性。

但我觉得它不是产品官网，如果我要真的上架，要改动的地方还不少。不知道大家怎么看这组对比，欢迎评论区告诉我。

4）3D：魔方模拟器

这是x上（@Ryan Lazuka）的一个提示词。

提示词：Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself. 
中文：创建一个HTML文件，其中使用Three.js（通过CDN方式引入）来实现一个功能完备的3D魔方模拟程序。该魔方必须能够自动完成自己的“解谜”过程。

要能够记住魔方的打乱步骤，并反向求解，这特别考验模型的推理和计算能力。

先看下DeepSeek的，它就自己一个人在那玩（演示），完全不让用户玩，大概率是生成失败了。

再来看下GLM-5的，基本还原出来了。在随机打乱后，魔方能自动逆向还原，不会出错。

欢迎大家体验：https://chat.z.ai/space/z1y9j1cck7p0-art

总结一下：在前端这块，从审美到3D，到计算能力，我认为GLM-5的表现都要优于DeepSeek新模型，甚至能够与Gemini 3 Pro扳手腕。

当然，DeepSeek本身也不差，而且在“架构瘦身”和“智商扩容”上有很多创新。而他俩都开源，都Media in China。

也难怪，最近x上有很多老外在疯狂求魔法，求手机账号，来体验我们中国的模型。

Agentic测试：一键做视频

但如果只是测前端、One Shot的话，我觉得把GLM-5想简单了。

接下来，我们上Claude Code，接智谱bigmodel.cn的API来测试。

我的需求很简单，让CC调用Skills一键把文章转成视频。

Skills是用的Remotion，安装的话，我们直接跟CC说就行：

帮我从这个地址安装Remotion Skills：https://github.com/remotion-dev/skills

需求看起来挺简单，但对于模型来说，有很多开发工作要做，还要调用不同的工具，很考验模型的Agentic能力。一开始我把这个需求提给GLM-5，其实我心里是没底的。

不过在它工作了一会儿后，我觉得有底气了。

它直接给我整了一个本地的视频项目，可预览，可渲染，还可以添加音频（需要我给本地音频，或者接AI Audio的API生成）。

我看了一下它写的视频预览界面，我感觉好像进了剪映网页版一样，功能、组件都非常的全。

最后，直接让它把视频渲染出来，添加音乐后就得到了这样一支视频。

整个过程大概20来分钟，一开始我是真没底气，但看到了最终的视频成品，是真的。

这意味着，后面我可以把所有文章都丢给GLM-5，让它帮我生成视频。再接个Audio API，一个教程视频半小时搞定。

这真的大大解放了我。

而我消耗的，无非是GLM的Coding Plan次数。大概率，他们家的Coding Plan这回又要卖爆，所以我提前直接整了个Max套餐。

智谱拼好模⬇️

https://www.bigmodel.cn/glm-coding?ic=NCUSKSTEQQ

进入2026年，一切都在变快。

快到什么程度呢？快到我每天早上醒来，发觉昨天的消息已经不重要了。

从Claude Code到Skills，到Cowork，到OpenClaw，再到今天的GLM-5，以及呼之欲出的DeepSeek V4。

大家都在跑步迈入Agent、大任务时代，这对模型的Agentic能力提出了极高的要求。

海外有Claude、Gemini、GPT三雄争霸，国内今天似乎也有了自己的答案：GLM-5。

前端能打，Agentic能干，以开源的底气干到了Opus级的实力。

我知道，2026一定会很疯狂，但没想到会来得这般的快。

就好像，忽如一夜春风来，千树万树梨花开。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.