最近"桌面AI代理"这个品类突然火了。Claude在1月12号发布了Cowork,被称为"2026年最重要的AI产品发布",核心卖点是让AI能操作你的电脑。但我知道我的读者里应该有不少人还因为各种原因没用上,想体验的。
其实国内这边,MiniMax也推出了类似的产品,定位是"AI原生工作台"。
它有个桌面客户端(Mac和Windows都有),能直接操作你电脑上的本地文件——读取、修改、创建都行。简单说就是:以前你用的大多数AI只能在浏览器里帮你写东西,现在它能真正"接管"你的电脑干活了。
![]()
而且现在新用户前三天还限时免费。让我来测一测它究竟怎么样。
批量处理App图标
我最近在做一个macOS应用,其实代码部分大部分让AI开发完成了,但是准备打包上架的时候,遇到了个很痛苦的情况,我发现它特么比做iOS app还麻烦,居然需要这么多不同尺寸的icon图标...很离谱
![]()
简单来说就是,他需要5种尺寸(16pt、32pt、128pt、256pt、512pt)的图标,每种还要1x和2x两个分辨率,加起来就是10张图。
以前我为了解决这类图片批量处理的问题,还专门给自己开发过一个图片处理网站。但面对这种场景,还是得一个个图片去分别调整尺寸、导出、命名,实在是太麻烦了。
我决定让这个"AI实习生"来试试。
下载了MiniMax的桌面客户端,把我的项目文件夹指给它。然后截了一张Xcode里AppIcon的要求图,直接发过去,说:
我正在开发macOS的应用,然后这种应用要打包上架的话,需要一系列不同尺寸的小图标,你可以参考我的截图。 我们现在的文件夹内已经有我设计好的icon图标的,请帮我按照Xcode要求的尺寸格式帮我批量调整并输出。
![]()
接着,它开始干活了。
首先它看懂了我的截图——这个挺关键的,说明它能理解图片内容,知道Xcode需要哪些尺寸。然后执行命令看了下我的文件夹,发现有一个icon.png源文件,是1024×1024像素的。
接下来它开始规划任务:
太好了!源图标是1024×1024像素,这正好是最大尺寸的2x图标。我可以用它来生成所有其他尺寸的图标。 根据截图,我需要生成以下尺寸: macOS 16pt: 1x=16×16, 2x=32×32 macOS 32pt: 1x=32×32, 2x=64×64 macOS 128pt: 1x=128×128, 2x=256×256 macOS 256pt: 1x=256×256, 2x=512×512 macOS 512pt: 1x=512×512, 2x=1024×1024
然后就开始用sips命令批量生成图标。我能在右边的"MiniMax视窗"里看到它在执行什么命令,一条条绿色的命令飞过去,挺有"监工"的感觉。
说实话,如果是真人实习生,我可能还不好意思一直盯着人家干活。但AI嘛,盯着看完全没有心理负担。
大概一分钟,10张图标全部生成完毕。它还贴心地做了一个表格,列出每种尺寸对应的文件名:
![]()
但真正让我觉得这玩意儿有点东西的,是接下来的操作。
它不仅生成了10张图标,还自动生成了一个Contents.json文件。
![]()
如果你做过iOS/macOS开发就知道,Xcode的Assets.xcassets不只是需要图片,还需要一个json配置文件来告诉Xcode每张图对应什么尺寸。以前我都是手动一张张拖进去,让Xcode自己识别。
但有了这个json文件,直接把整个AppIcon.iconset文件夹拖进Xcode的Assets.xcassets,一拖就完成所有文件的添加。Xcode会自动识别Contents.json并正确配置所有尺寸。
![]()
它最后还告诉我使用方法:
将整个AppIcon.iconset文件夹拖入Xcode的Assets.xcassets中,替换你截图中的空占位符即可。Xcode会自动识别Contents.json文件并正确配置所有尺寸。
我压根没跟它说要生成json配置文件这件事。它是自己"想到"的——既然目标是让用户能直接用在Xcode里,那光有图片还不够,还得有配置文件才能一步到位。
这有点像一个懂行的实习生——你让它做A,它会顺手把A需要的B也做了,还告诉你怎么用。
进阶玩法:把自己的经验封装成"专家"
桌面端测完,我又去网页版逛了逛,发现MiniMax还有个"专家社区"。
![]()
社区里已经有不少官方和用户创建的"专家"了——文档处理助手、从PRD到原型图、故事视频生成、知识消化助手、AI Coder、公众号写作达人……可以理解为封装好的Skills,一键就能用。
我前几天刚写了一篇Coze技能工厂的文章,介绍怎么用Skills封装工作流程。MiniMax的"专家"其实是类似的概念——把一套工作流程封装起来,下次直接调用。
但MiniMax的表达算是更人话一点。它不叫Skills或者Workflow,就叫"专家"。创建过程也是可视化的:你用自然语言描述需求,AI帮你完成实际的创建。比起Claude Skills需要手写配置,这个更适合新手。
我决定自己创建一个试试。
我去年写过一篇的文章,里面给了一套可以生成App原型的提示词。
但用了一段时间后,我发现这套提示词还是缺了几个关键环节——尤其是前面帮助用户澄清需求、表达清楚他到底想要什么的部分。
很多时候用户说"我想做一个播客App",但到底是像小宇宙那样的,还是像喜马拉雅那样的?核心功能是什么?目标用户是谁?这些不问清楚,直接画原型,大概率要返工。
所以我想让MiniMax帮我基于原来的提示词,优化出一个更完善的"花叔的App原型设计大师"。
我把原来的提示词贴进去,然后告诉它需要调整的部分:
帮我创建一个能快速将用户简单初步的想法加工转化为App原型图的专家,我们已经有初步可以帮助用户创建原型图的提示词要求,除了需要改变的部分,请100%维持原样: [原有的提示词...] 需要调整的部分是,用户的想法可能需要做一些澄清才能被更好捕捉,所以在开始的阶段,你应该先作为产品专家去通过1-2个问题帮用户挖掘出更明确的想要实现的想法,然后帮助其创建原型。
![]()
它开始干活了。
先是检查工作区,然后说"我来帮你创建这个App原型图设计专家"。接着就开始执行命令、创建文件夹、写配置文件、生成instruction.md。

有意思的是,它还自动为这个专家生成了一个图标。
最后产出了一个叫"app-prototype-designer"的专家,描述写着:"一个专业的App原型图设计专家。当用户想要将初步的App想法转化为高保真原型图时使用此专家。它会先通过简短的问题帮助用户澄清需求,然后生成可直接用于开发的HTML原型界面。"
它还给我总结了这个专家的核心工作流程。
当然,如果你对描述、图标或者他的工作流程有任何不满意也都可以去「配置」窗口自主调整。
专家建完之后,我去测了下,我说:"帮我设计一个结合阅读和社交的App"。
它没有直接开始画图,而是先问我两个问题:
核心功能定位:你希望这个阅读社交App解决什么核心问题?比如发现和推荐好书、阅读过程中的社交互动、读书笔记整理与分享、阅读习惯的打卡和社区激励? 目标用户与场景:你的App主要面向什么用户群体?深度阅读爱好者、轻度阅读用户、学生群体?
![]()
说实话,这两个问题问得挺到位的。我一开始只是模糊地想"阅读+社交",但被它这么一问,我才认真想了想:核心应该是"发现好书"和"阅读习惯培养",目标用户是"深度阅读爱好者"。
这就是我之前那套提示词缺的东西——帮用户在动手前先想清楚自己要什么。
我回答完之后,它开始正式干活。有意思的是,它不是直接画图,而是先去调研了相关App的设计风格,然后才开始生成原型。
![]()
最后产出了一个叫"书途 BookPath"的完整原型,5个核心页面:发现页、阅读页、习惯页、社区页、个人中心。而且直接部署上线了,给我一个可以点击预览的链接。
![]()
这个原型的完成度挺高的——有书籍推荐、阅读进度、打卡日历、成就徽章、读书圈子,连"追风筝的人"的封面都配上了。如果只是用来验证想法、和团队沟通,完全够用了。
这个功能的想象空间挺大的。比如你是做SEO的,可以把自己的优化流程封装成一个专家;你是财务,可以做一个专门处理报销单的专家;你是自媒体,可以做一个帮你整理选题的专家。
相当于把你的工作经验"教"给AI,以后它就能按你的方法来干活。而且这个专家是可以分享的,你做好了,发布到社区,别人也能用。
这让我想到一个可能性:以后每个人的工作经验都可以被"封装"成一个AI专家。十年老会计的报销审核经验、资深HR的简历筛选标准、老编辑的选题判断——这些原本只存在于人脑子里的隐性知识,现在可以变成可复用的"专家"。
这个实习生值多少钱?
用了整整两天,说说我的判断。
做得好的地方:
真的能操作本地文件。实打实地读你的图片、生成新文件、创建配置,不是在沙盒里模拟。很实用。
有"主动思考"的能力。图标任务它会顺手生成json配置,之前测一个发票整理任务时还发现它会发现抬头异常——会想"用户最终要什么",不是只会机械执行。
能理解图片。我直接截图发给它,它能看懂Xcode需要哪些尺寸,不用我一个个打字说明。
Expert功能有潜力。把工作流程封装成可复用的"专家",这个思路很对。对于有固定SOP的工作场景,能省很多重复沟通的时间。
值多少钱?
如果按实习生的标准来算——能处理图片批量处理、文件整理、信息提取这类杂活,偶尔还能发现问题主动汇报,而且不用管吃喝、不会请假、随叫随到、大半夜让它干活也不用有心理负担。
这样的实习生,一个月给3000块我觉得不亏。
而且说实话,从成本角度考虑,我现在几乎订阅了我在公众号里提到、推荐过的所有AI产品,但其实每个月的订阅费加起来基本也不到3000人民币。这些工具加在一起,能帮我省掉的时间和精力,远比招一个真人实习生划算。
但更重要的是,没有情绪成本。
前段时间听刘飞在三五环的播客里介绍他作为低能量人能做很多事情的原因,其中一点是提到他不喜欢公司体制内的很多无效沟通和情绪消耗,所以他现在的公司正职员工也就他和他的播客搭档跟合伙人潇磊。
说实话这块我还挺有共鸣的。作为一个所谓的「一人公司」,我现在也在做不少事情,但也没给公司招任何一个全职员工。
倒不是觉得其他人帮不到我,而是作为I人,我总觉得和人的沟通上是需要照顾他人情绪和生活的。我还要关注他/她的成长,会觉得老让ta干很基础的工作是不是不合适。大半夜或者周末了,临时要这位同事加班是不是不合适。我如果想法想不清楚,总要反复调整我的想法是不是不合适。
可能是作为打工人的时间太长了,这种共情能力不可避免地产生。所以我确实觉得有个没有情感的AI实习生去帮自己干这种脏活累活是一个挺解压的事。
对于像我这样的I人来说,这一点可能比省钱更重要。
而MiniMax现在是限时免费体验。
国内版指路https://agent.minimaxi.com/
最后
桌面AI代理这个赛道,2026年肯定会很热闹。Claude有Cowork,MiniMax有Agent,Google、微软肯定也在做类似的东西。
对于普通用户来说,现在是尝鲜的好时机——产品都在抢用户,各种免费体验。等市场成熟了,该收费的都会收费。
MiniMax Agent目前Mac和Windows都能用,注册就能体验。如果你也有一堆需要处理的图片、文件、数据、报表,不妨让这个"实习生"试试手。
如果你也是个不太想和人打交道、但又需要有人帮忙干杂活的I人,这个AI实习生可能正好适合你(没有说E人就不需要的意思...
万一它比你想象的能干呢。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.