网易首页 > 网易号 > 正文 申请入驻

终于,无需邀请码,这款刷新GAIA榜单的Agent你立刻就能用!

0
分享至

今年是 AI 的 Agent 之年,也是……邀请码之年

花叔表示:我不理解,难道 "先进智能" 的第一步是“把人挡在门外”?

从 Manus 开始,国内 AI 圈发布新品似乎都要以下三件套:

  1. 邀请码——越难求,越显高级;

  2. “全球首款 ××× Agent”——句式千篇一律,槽点年年翻新;

  3. 全英文炫酷发布视频——受众 90% 是国人,BGM 却像在硅谷。

第一个这么玩确实有创意,但人人都跟风就显得……无聊。

现在我的原则:需要排队的 AI 产品 = 直接忽略。毕竟你想要的,可能只是“我有,别人没有”的优越感——而不是真正的生产力。

Skywork:SOTA 级 Agent,不玩邀请码套路

终于,等来了一个敢让所有人立刻免费上手的深度研究型 Agent —— 天工超级智能体(Skywork Super Agents,方便起见下文简称Skywork).

来,先看成绩单:

他们在GAIA Bechmark评测指标上都超越了前任最佳,达到了SOTA级别。

上面这几个名词你可能比较陌生,我来简单解释下:

  • GAIA Benchmark:General Agent Intelligence Assessment——翻译成大白话就是“看你家 Agent 究竟是学霸还是学渣”的统考。Skywork 在这张卷子上直接把前任第一挤到了旁边。

  • SOTA:State Of The Art,行业里最高水准。拿到这标签=行业“天花板”。

OK,专业解释结束,下面进入正题。

从通用Agent到 “Office 三件套”Agent

现在AI行业对Agent,或者说智能体有两套不同的想法和逻辑。

一类是走工作流的方式,比如Coze、Dify这样的产品让用户自己搭建工作流,去完成一个特定任务的执行;这个逻辑的优势是生成的结果非常可控且个性化,但是对使用者的要求比较高,无论是操作上还是对于完成一个工作所需要经历的流程的认知上;

第二类是走通用Agent,比如Manus、Genspark等,给底层模型足够开放的空间,不做限制,再提供一些工具去实现通用性人物的解决,这类agent的主要优势是能完成的工作范围广,你想要完成的任何工作都可以让agent试试,但是劣势是未对任何场景做优化,产生的结果质量相对不可控,对底层模型能力的依赖性太强。

现在我觉得以模型的发展水平来说,更合理的方式是走中间形态,简化用户的操作,让模型能更自主的完成尽可能大量的工作,但是又最好能对高频场景做优化,用人类的认知去弥补特定场景下模型能力暂时不足的地方。前段时间出圈的设计Agent产品Lovart就是基于这个逻辑,对设计场景做了大量的优化,所以他们在设计VI、海报等方面的表现是明显优于常规的对话式AI和通用Agent的。

那,对打工人来说,日常最需要干的是什么?

写文档、做表格、做PPT。

不管你平时是开会、复盘,还是工作总结、汇报,这“Office三件套“几乎是人人都避不开的。

AI是时候把这些人类不愿意干,觉得枯燥乏味的活给干一干了,令我比较惊喜的是Skywork在产品界面的设计上都强调了他们主打的是这三类高频场景,而且我试了试,效果还真不错。

Skywork 的使用示例

1️⃣ 访问

Skywork有海外版和国内版,海外用户可以马上上 skywork.ai ;国内用户直达 tiangong.cn,无需邀请码。

2️⃣ 模式选择

打开之后,可以先选个模式:文档模式、PPT模式、表格模式、网页模式、播客模式、通用模式,我个人觉得现在他们在前三个office三件套的模式上优化得比较好,也是他们相比其他agent产品的优势所在。

3️⃣ 需求表达

然后,直接表达你的需求就好了,比如我最近要去大理一个社区做分享,本来还头疼做PPT的事,我打算偷个懒,让Skywork给我试试,我输入的要求是:

我是「小猫补光灯」app的开发者,最近我要去给一个社区分享使用AI编程和需求洞察的经验,请帮我设计一个分享的ppt,我希望这份PPT里先包含我的个人介绍、小猫补光灯和小猫补光灯pro这两个app所获得的成绩,以及与之相关的切实可行的ai编程以及需求洞察相关的经验,你可以多找找我的一些对外分享

4️⃣ 需求确认

和OpenAI的DeepResearch类似,其实很多复杂需求你在表达时总会有一些遗漏,你会希望当你把这件事交给AI,或者交给实习生的时候,对方都能思考下你的要求,再跟你做些确认,以免方式一顿乱猜,最后做出来的东西不符合你需求的情况。

DeepResearch的方式是会用一大堆问题询问你的需求,Skywork在这部分做了些创新,让用户做“选择题”而不是更困难的“问答题”。

5️⃣ Todo规划与执行

接下来的过程就是Agent的常规逻辑了,规划完成这项任务所需的步骤,然后逐步执行完成这个步骤。Skywork执行的方式主要是调用MCP去完成网页搜索、浏览、图片下载等任务。

6️⃣ 交付

在收集完信息后,Skywork会形成内容大纲,然后填充内容实现最终的交付。

这个交付的结果我给打个75分吧,有三个方面我还挺惊喜的:

1)视觉效果还不错,而且不是AI PPT产品那种千篇一律的物料模板;

2)居然找到了我的照片,并且放在了PPT里,这点还挺超出预期的;

3)可以直接编辑或者下载PPT,毕竟AI生成的东西不是你可以100%全用的,方便的编辑操作还挺重要。

我觉得还有待提升的地方是有些信息错误,比如这类提到我2024年3月裸辞,但实际是2023年3月,我估计可能是部分信源的不准确或者表达不精准导致的错误。另外,怎么没把我app logo放进来,以及我的个人介绍里没放上我的自媒体昵称和链接还是不那么好。但是作为一个实习生的话,这事我能接受。

Skywork 的优势总结

除了上面的PPT生成任务,我把做文档和做表格的任务也都试了试。感受上是Skywork在信息搜集的深度上做的还不错,毕竟你不管是要做PPT、doc还是excel,前提其实都是你该有足够的信息,MCP模式现在能获取的信息量还挺丰富的,可以看出这个产品的信息搜集是对标OpenAI DeepResearch来的。

但...我也发现了和之前用别的Agent产品类似的问题,国内网页信息源的墙还是障碍重重,AI还没法完全越过,比如多次出现要爬知乎的页面,但是无法访问的情况 这倒是不怪AI了。

不过呢,瑕不掩瑜,Skywork在信息溯源上算是下了相当大的功夫,就算是做出来的PPT,但你只要把下面的“溯源”打开,PPT里每段文字都能看到信息来源是哪里,这对打工人来说,是相当放心了,能让你减少一些被AI幻觉支配的恐惧。

而在写Doc文档方面,Skywork能生成相当好的图文并茂的文档,拿这个功能去做公众号文章的写作,写PRD,或者制定旅行计划等等估计是再合适不过了。我这次让Skywork生成AI Agent发展报告的任务里,TA甚至还帮我生成了一个图表插入到文档里。

Excel任务比较有趣的是,我最开始只是让Skywork帮我收集下最近20年奥斯卡最佳影片获奖影片的一些基础信息,但是我没想到,它帮我把各种信息整理完之后,还做了不少我没有提到的分析。

比如这个评分与票房之间的关系,虽然不是我直接要求的,但还真是我感兴趣的方面,而且在一次任务中能做这种类似的分析,所以确实融入不少数据处理的策略。


Agent的中点

Skywork既不是AI Agent的起点,也不是终点,但我会觉得是个有趣的中点。Agent的发展还需要一个又一个这种中间点的发展历程的出现。

如果你正在为“做 PPT 做到半夜”“Excel 函数写到怀疑人生”“查资料跳转五十个标签页”而头大,不如马上试试这位“AI 打工人”。它真干活,而且是帮你干那些脏活累活。

看完这篇文章,你记住这句话就行了:

Skywork = 深度研究 × AI Office 三件套 × 可精准溯源 × 在线可改

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
16投4中,仅得13分!6届全明星成低效后卫代表,难怪连湖人都不要

16投4中,仅得13分!6届全明星成低效后卫代表,难怪连湖人都不要

弄月公子
2026-02-08 21:30:59
特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

历史有些冷
2026-02-07 18:30:03
因为懒,她两周没摘隐形眼镜,结果悲剧了…

因为懒,她两周没摘隐形眼镜,结果悲剧了…

新欧洲
2026-02-07 19:26:21
郑爽彻底疯狂!街头抱娃与张恒家争执,满头白发穿搭邋遢,孩子哭晕

郑爽彻底疯狂!街头抱娃与张恒家争执,满头白发穿搭邋遢,孩子哭晕

八卦王者
2026-02-06 16:45:29
我40 头一次与男友同居,才知道:男生私处真实样子,让人忍俊不禁

我40 头一次与男友同居,才知道:男生私处真实样子,让人忍俊不禁

枫红染山径
2026-02-07 19:07:42
直接开摆!合砍49分被换下!等着被NBA处罚吧

直接开摆!合砍49分被换下!等着被NBA处罚吧

篮球教学论坛
2026-02-08 18:57:14
第一次和男友同住,我直接懵了:原来男生私下这么“反差萌”!

第一次和男友同住,我直接懵了:原来男生私下这么“反差萌”!

千秋历史
2026-02-06 21:27:29
银行老员工坦言:存款到这个数,就会被系统重点留意

银行老员工坦言:存款到这个数,就会被系统重点留意

王二哥老搞笑
2026-02-08 16:29:23
他在上港效力五年零失球,如今合约到期却被俱乐部送走,引发热议

他在上港效力五年零失球,如今合约到期却被俱乐部送走,引发热议

懂个球
2026-02-07 23:40:02
正式官宣!巴夫金转正,24岁得分手被放弃,佩林卡破罐子破摔?

正式官宣!巴夫金转正,24岁得分手被放弃,佩林卡破罐子破摔?

篮球看比赛
2026-02-08 21:16:20
称赞美国空气香甜的杨舒平,已被美国驱逐出境,如今回国下场凄惨

称赞美国空气香甜的杨舒平,已被美国驱逐出境,如今回国下场凄惨

谈史论天地
2026-02-07 13:20:03
丑橘是转基因水果?专家直言:这几种水果,再便宜也不要买!

丑橘是转基因水果?专家直言:这几种水果,再便宜也不要买!

新时代的两性情感
2026-02-08 18:44:10
刚提的车被刮了!利物浦6000万镑新援遭重伤 体检没发现伤病隐患

刚提的车被刮了!利物浦6000万镑新援遭重伤 体检没发现伤病隐患

雪狼侃体育
2026-02-08 15:47:03
日本真要脱钩了?日本超市大量停用支付宝微信支付,信号相当明显

日本真要脱钩了?日本超市大量停用支付宝微信支付,信号相当明显

青青子衿
2026-02-04 20:56:37
让“油电混动技术”悲哀的是:打败了所有对手,却输给了时代!

让“油电混动技术”悲哀的是:打败了所有对手,却输给了时代!

张鴘喜欢软软糯糯
2026-01-15 19:22:59
中美元首定调!特朗普不踩台海“红线”,台湾买武器以后难了

中美元首定调!特朗普不踩台海“红线”,台湾买武器以后难了

扬子晚报
2026-02-07 13:51:45
暴涨!历史上第一次

暴涨!历史上第一次

风风顺
2026-02-08 13:10:41
擒贼先擒王,美方发现不对劲,中方反制巴拿马后,枪口对准了美国

擒贼先擒王,美方发现不对劲,中方反制巴拿马后,枪口对准了美国

生活魔术专家
2026-02-08 13:47:52
细思极恐!黄磊老婆孙莉高龄怀四胎?肚大如球孕味足,眼神迷离憔悴

细思极恐!黄磊老婆孙莉高龄怀四胎?肚大如球孕味足,眼神迷离憔悴

八卦王者
2026-02-07 16:00:27
约基奇轰20+14+17仍无缘今日最佳!抱歉,你碰到创纪录的卡斯尔了

约基奇轰20+14+17仍无缘今日最佳!抱歉,你碰到创纪录的卡斯尔了

世界体育圈
2026-02-08 13:34:05
2026-02-08 21:40:49
AI进化论花生 incentive-icons
AI进化论花生
AI博主,AppStore付费榜第一的小猫补光灯app开发者
136文章数 60关注度
往期回顾 全部

科技要闻

为实现雄心勃勃的计划,特斯拉开始招人

头条要闻

美国"夺岛"渗入格陵兰居民生活 每天有多国军人抵达

头条要闻

美国"夺岛"渗入格陵兰居民生活 每天有多国军人抵达

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

金晨被罚1500后首露面,表情沉重心事重重

财经要闻

宽基ETF开年大赎回,什么信号?

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

旅游
教育
艺术
时尚
军事航空

旅游要闻

四项硬核举措!泰安全力守护游客春节出游体验

教育要闻

老师工资不得低于公务员的平均工资,我们真的实现了吗?

艺术要闻

何红舟油画作品选

伊姐周六热推:电视剧《成何体统》;电视剧《唐宫奇案》......

军事要闻

捐钱造航母的男孩登上军舰

无障碍浏览 进入关怀版