网易首页 > 网易号 > 正文 申请入驻

至顶AI实验室硬核评测:AutoGLM沉思能否吊打Manus?

0
分享至

智谱AI推出的AutoGLM沉思高调入场,官方直接定义它为"能探究开放式问题并根据结果执行操作的自主智能体"。这不禁让人想起Manus,同样是能干活的AI Agent,同样声称要解放人类生产力。


既然都是打工人,那就得拉出来溜溜。恰好我们手头有个真实需求——分析MCP(Model Context Protocol)方面的论文,这可是技术含量拉满的活儿。今天,我们就用这个硬核任务来一场正面PK,看看这两位"赛博打工人"到底谁更懂人类的心思。

评测机构:至顶AI实验室

测评时间:2025年3月29日

评测产品:AutoGLM沉思

主要参数:AutoGLM沉思是智谱AI最新推出的自主智能体产品。它的核心能力在于模拟人类思维过程,完成从数据检索、分析到生成报告的全链路工作。

评测主题:AutoGLM沉思能否吊打Manus?

AutoGLM沉思:智谱AI的新王牌

AutoGLM沉思是智谱AI最新推出的自主智能体产品。它的核心能力在于模拟人类思维过程,完成从数据检索、分析到生成报告的全链路工作。简单来说,就是你交代个活儿,它能自己琢磨着把事情办了。

这次我们测试的是AutoGLM沉思版本,作为智谱旗下的重点产品,它承载着与国际顶尖AI Agent一较高下的重任。

评测设计:一个真实的工作场景

为了公平起见,我们设计了一个标准化的测试任务:

任务要求:

寻找两篇关于MCP(Model Context Protocol)的论文

对每篇论文进行深度解读

生成科普报告,要求深入浅出、具有可读性

内容需适合在微信公众号传播

每篇报告约3000字

需要配图表等视觉元素

这个任务涵盖了信息检索、内容理解、创作生成等多个维度,基本能全面考察AI Agent的综合能力。

Round 1:Manus率先出击

我们先让Manus上场。输入提示词后,Manus的表现相当专业:

任务规划阶段:Manus首先给出了四条建议,要求明确:

  1. MCP的具体领域定义

  2. 论文发表时间要求

  3. 科普报告的篇幅

  4. 是否需要视觉元素

在我们补充了MCP的定义(Model Context Protocol)、3000字左右的篇幅要求,以及需要图表等视觉元素后,Manus立即开始工作。

执行过程:从虚拟机界面可以清晰看到Manus的工作流程:

  1. 准备任务

  2. 搜索MCP相关论文

  3. 从中筛选两篇适合的论文

  4. 第一篇论文的阅读与报告创建

  5. 第二篇论文的阅读与报告创建

整个过程中,Manus访问了大量网页,搜集了丰富的资料。

成果展示:

  • 用时:13分钟

  • 第一篇文章:

    《人机AI与数据的桥梁》

    • 标题精准到位

    • 内容涵盖MCP的核心架构、技术原理

    • 结构清晰,科普性强

  • 第二篇文章:

    《技术实现与应用实践》

    • MCP架构详解

    • 生命周期分析

    • 代码示例与部署指南

    • 高级功能介绍

    • 内容更为详实

两篇文章都达到了"深入浅出、适合公众号传播"的标准,可以说是高质量的科普内容。

Round 2:AutoGLM沉思的挑战

接下来轮到AutoGLM沉思登场。我们输入了同样的任务要求。

初始问题:AutoGLM沉思一开始将MCP理解成了其他含义,出现了理解偏差。在我们补充正确的MCP定义后,它开始重新执行任务。

执行过程:与Manus不同的是,AutoGLM沉思的执行过程缺乏进度提示,等待时间较长且让人摸不着头脑。更关键的是:

  • 尝试访问External IP时出现网络超时

  • 多个网站(知乎、某些国外网站)访问受限

  • 由于不是虚拟环境,网络访问存在明显限制

  • 不得不转向其他中文平台获取资料

成果展示:

  • 用时:35分钟

  • 文章标题:

    《大语言模型与外部数据连接的统一标准》

    • 标题偏说明书风格,缺乏吸引力

    • 内容更像是技术介绍文档

    • 科普性和可读性明显不足

    • 缺乏我们要求的"适合公众号传播"的调性

硬核对比:数据说话 1. 生成时间
  • Manus:13分钟

  • AutoGLM沉思:35分钟

AutoGLM沉思耗时接近Manus的3倍,主要原因是网络访问受限导致的重复执行。

2. 理解能力

  • **Manus:**初始理解准确,快速进入工作状态

  • **AutoGLM沉思:**初始出现理解偏差,需要纠正

两者在纠正后都能及时调整,这方面基本打平。

3. 任务分配能力

  • Manus:任务分解清晰,每个步骤都有明确的目标和进度提示

  • AutoGLM沉思:任务执行过程不够透明,缺乏进度反馈

Manus在这一环节明显更胜一筹。

4. 内容生成质量

  • Manus:两篇文章都符合科普要求,标题吸引人,内容深入浅出,结构完整

  • AutoGLM沉思:**内容偏向技术说明书,缺乏科普文章的可读性和传播性

这是最关键的差距所在。

5. 网络访问能力

  • Manus:虚拟机环境,网络访问流畅,信息获取充分

  • AutoGLM沉思:非虚拟机环境,多个网站访问受限,信息获取受阻

技术架构的差异导致了实际使用体验的巨大差别。

结论:Manus暂时领先,但未来可期

从这次硬核评测来看,Manus在当前阶段更胜一筹。它在执行效率、任务规划、内容质量等方面都展现出了更成熟的表现。特别是虚拟机环境带来的网络访问优势,让它能够获取更全面的信息,生成更高质量的内容。

AutoGLM沉思则暴露出一些明显的问题:

  • 网络环境限制严重影响信息获取

  • 内容生成偏向技术文档,缺乏人文关怀

  • 执行过程透明度不足

但是,这并不意味着AutoGLM沉思没有前景。恰恰相反,随着智谱AI推出虚拟机版本、优化网络访问能力,AutoGLM沉思的潜力不容小觑。毕竟,它背后是国产大模型的技术积累,以及对中文场景的深度理解。

更重要的是,这场"神仙打架"的最终赢家永远是我们人类用户。当AI Agent开始内卷,意味着:

  • 更低的调用成本

  • 更精准的指令理解

  • 更聪明的数字助手

AI的进化,终将让每个人都能拥有自己的"赛博打工人"。这个未来,已经在路上了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个软件打磨了28年,被安装超过100亿次,居然赚不到钱?

一个软件打磨了28年,被安装超过100亿次,居然赚不到钱?

码农翻身
2026-01-14 09:00:11
1952年,一农民找到广州市委书记:妈,我是您失散23年的儿子

1952年,一农民找到广州市委书记:妈,我是您失散23年的儿子

知否否知
2024-11-03 12:04:09
9分4助攻,火箭第3后卫更适配阿门 出场顺位超谢泼德 有机会转正

9分4助攻,火箭第3后卫更适配阿门 出场顺位超谢泼德 有机会转正

替补席看球
2026-01-14 11:32:14
吃他汀猝死的人增多?医生含泪告诫:天冷吃他汀,必须多关注6点

吃他汀猝死的人增多?医生含泪告诫:天冷吃他汀,必须多关注6点

健康之光
2026-01-13 10:51:03
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
她是华为的救命恩人,为华为创收5000亿,任正非都不敢直呼她大名

她是华为的救命恩人,为华为创收5000亿,任正非都不敢直呼她大名

墨兰史书
2026-01-03 03:50:02
121-106!这就是哈登的影响力,他才是快船复苏的真正方向盘

121-106!这就是哈登的影响力,他才是快船复苏的真正方向盘

奕辰说球
2026-01-14 10:29:07
曼联的痛!24岁格林伍德戴帽+2妙传+赛季第19球+领跑法甲射手榜

曼联的痛!24岁格林伍德戴帽+2妙传+赛季第19球+领跑法甲射手榜

侧身凌空斩
2026-01-14 09:08:58
又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

议纪史
2026-01-14 10:40:09
何晴生忌儿子许何发文:妈妈生病十年爸爸和澍妈在背后默默付出

何晴生忌儿子许何发文:妈妈生病十年爸爸和澍妈在背后默默付出

千言娱乐记
2026-01-13 21:55:01
夫妻有这 3 属相,2026 年惹不起!小人躲着走,金银堆成山

夫妻有这 3 属相,2026 年惹不起!小人躲着走,金银堆成山

人閒情事
2026-01-14 08:27:06
章小蕙上节目聊后悔和钟镇涛结婚,一个人养儿子,62岁单身不拜金

章小蕙上节目聊后悔和钟镇涛结婚,一个人养儿子,62岁单身不拜金

阿纂看事
2026-01-13 15:24:12
身材丰满的成熟女性这样打扮优雅大方显身材又有女人味

身材丰满的成熟女性这样打扮优雅大方显身材又有女人味

牛弹琴123456
2026-01-11 20:52:40
新的殡葬制度将于2026年3月30号执行,大概意思就是:一切从简

新的殡葬制度将于2026年3月30号执行,大概意思就是:一切从简

百态人间
2026-01-13 16:38:33
29岁网红口子姐去世,父亲病逝,自曝得梅毒,欠债太多下海惹争议

29岁网红口子姐去世,父亲病逝,自曝得梅毒,欠债太多下海惹争议

揽星河的笔记
2026-01-13 13:05:05
为何劳尔在二队6年都没获得机会,阿韦洛亚仅半年就当一队主帅了

为何劳尔在二队6年都没获得机会,阿韦洛亚仅半年就当一队主帅了

星耀国际足坛
2026-01-14 01:16:00
小贾破心魔,杜兰特创59年纪录,火箭3人20+,险胜公牛结束3连败

小贾破心魔,杜兰特创59年纪录,火箭3人20+,险胜公牛结束3连败

毒舌NBA
2026-01-14 11:35:31
OPPO、vivo、荣耀中端元旦销量出炉,消费者最爱谁呢?

OPPO、vivo、荣耀中端元旦销量出炉,消费者最爱谁呢?

科技锋说
2026-01-13 11:17:16
59岁女子成功诞下4斤4两男婴,产妇:因大女儿长期定居国外,夫妻俩感到寂寞,57岁开始备孕

59岁女子成功诞下4斤4两男婴,产妇:因大女儿长期定居国外,夫妻俩感到寂寞,57岁开始备孕

观威海
2026-01-13 15:34:07
2026-01-14 13:11:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
1083文章数 154关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

头条要闻

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

"死了么"App爆火:流量来了 困境未解

汽车要闻

曝Model Y或降到20万以内!

态度原创

本地
亲子
家居
公开课
军事航空

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

亲子要闻

儿童液体钙哪个牌子好?2026十款热门儿童液体钙品牌推荐

家居要闻

心之所向 现代建构之美

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美再发安全警告 敦促美公民立即离开伊朗

无障碍浏览 进入关怀版