网易首页 > 网易号 > 正文 申请入驻

斯坦福MIT天团出手!1美元养龙虾,图文视频全包,打工人神外挂

0
分享至


新智元报道

编辑:元宇

【新智元导读】别人还在卷单点能力,Agnes已经把文本Agent、图像、视频和办公自动化打包进开发者工具箱:1美元「养龙虾」,外加图像、视频、PPT一条龙,给出的不是零散的能力点,而是一整套AI生产力。

近日,Agnes旗下核心模型矩阵正式上线Zenmux平台(https://zenmux.ai/models?sort=newest),一口气开放四款主力模型调用,覆盖文本Agent与多模态生成两大核心方向。

其中包括Claw系列的Agnes-1.5-LiteAgnes-1.5-Pro,以及多模态方向的Agnes-Image-1.2Agnes-Video-V1.2,直接把「文本+图像+视频」的整套能力打包上线。

更值得关注的是,上线首周模型调用量即快速攀升,已超过多家头部模型公司同类产品表现,显示出强劲的市场接受度与开发者活跃度,成为近期开发者侧增长最为迅猛的一组模型组合之一。


Agnes模型矩阵在Zenmux正式上线

在行业普遍进入「性能+成本」双重竞争阶段的背景下,Agnes通过高性价比模型与完整工具链的组合,正在迅速打开开发者生态入口。

AgnesClaw

低至1美元的「养虾」入门神器

在OpenClaw热度持续攀升之际,Agnes将「Claw」接入自家App,AgnesClaw一键部署。

用户通过订阅会员(部分地区Starter新用户最低可低至1美元/月)即可免费部署并使用AgnesClaw,同时解锁平台全部高级功能,性价比极高。

AgnesClaw的入口前置到首页,用户一键部署完成后,在对话框中切换至AgnesClaw模式,即可体验「养龙虾」,整体学习体验成本极低。

AgnesClaw目前支持与Telegram绑定,后续接入更多平台,提供定时任务、长期记忆和skills库,包括Agnes预置常用skills(如PPT生成、表格处理、图像/视频生成、AI搜索、深度研究等)和开源skills。

部分AI应用由于底层模型能力的限制,可能存在无法安装或流畅运行特定skill组件的问题。

而Agnes官方表示,AgnesClaw凭借自研的「龙虾」基座模型与强大的工具调用适配能力,几乎可以无缝安装并使用绝大多数热门skills。

用户可以利用它创建定时任务、处理文件并整理为结构化文档、实现办公自动化等。

同时,AgnesClaw具备自我进化能力,通过上下文理解和记忆能力,在使用过程中能更好地理解用户习惯,从而更有效地协助完成任务。


一键部署AgnesClaw

AgnesClaw的最大亮点在于自研的「龙虾」基座模型,这是赋予Agnes版本「龙虾」具备更强的理解力和skill适配能力的核心。

Agnes为用户高性价比「养龙虾」,专门推出了两款不同参数规模基于LLM优化的Agent模型,分别是120B的Agnes-1.5-Pro模型和35B的Agnes-1.5-Lite模型


PinchBench榜单中Agnes-1.5 系列模型在准确性维度表现突出

AgnesClaw定位「下一代极速多模态混合专家模型」,架构上融合了隐式MoE(Latent MoE)、Mamba-2状态空间模型与原生多模态早融合技术,旨在同时解决超长上下文、高频工具调用、复杂Multi-Agent协作三大痛点,打破传统「规模-延迟-记忆」三元悖论

根据全球权威「养虾」AI评测榜单PinchBench,Agnes-1.5-Pro模型在准确性维度表现突出,已跻身榜单前列,成为开发者「最佳养虾模型」选择之一。



PinchBench榜单

Agnes-Image-1.2

开源第一,闭源第二

本次发布中,Agnes 20B全新图像编辑模型Agnes-Image-1.2的表现超出预期。

根据官方公布的测试数据,该模型综合评分达到4.25分(满分5分),在闭源模型中仅次于NanoBananaPro的4.48分,超越了Seedream4.0和Seedream4.5,在开源模型中排名第一。


全新图像模型综合评分达到4.25分(满分5分)

在单项指标上,Agnes-Image-1.2模型在人像维度提升尤为显著,针对人像场景的定向微调有效增强了面部细节保真、局部编辑可控性以及与背景的自然融合能力,Portrait从3.98提升至4.30(+0.32)。

同时,Extract(2.47→3.05,+0.58)与Viewpoint(2.82→3.17,+0.35)也有进一步提升,表明模型在目标区域分离与结构/几何稳定性方面更可靠,有助于复杂编辑任务的一致性表现。

完整模型家族

覆盖多模态全链路

除了Agnes-1.5-Pro与Agnes-1.5-Lite两款模型和Agnes-Image-1.2图像编辑模型,Agnes这次还亮出了更加完整的模型矩阵,包括搜索与研究模型、AI Slides模型、图片与视频生成模型。

在图片和视频生成领域,Agnes构建了完整模型体系,包括图像和视频模型。除了之前介绍的Agnes-Image-1.2(20B)模型,Agnes另外还有一款19B的Agnes-Video-V1.2视频生成模型。

据了解,Agnes-Video-V1.2可实现原生音画同步生成,支持图生视频和特定风格/角色的生成,可适配多种业务场景。

该模型采用双流音视频Transformer架构,能在同一模型中同时生成音频与视频,从而实现人物口型、动作与声音天然同步。模型经测试可在有限显存环境下运行,方便企业级规模化部署和个人开发者的本地实验。

在语言模型方面,Agnes针对自己的主推市场东南亚地区,推出了8B参数的东南亚小语种模型Agnes-SeaLLM,目前已成为该地区小语种理解与生成任务SOTA模型。


东南亚小语种模型Agnes-SeaLLM

在信息处理和研究能力方面,Agnes发布了Agnes-Search(30B)模型和面向复杂研究任务的Agnes-DeepResearch(30B)模型。

前者在内部测试中实现78.6%的推理成本下降,生成速度提升18.6%;后者测试引用准确率为100%,基准测试准确率平均提升14.3%。

在办公自动化场景中,Agnes-Slides(30B)模型可以将网页或文档内容自动生成为PPT,通常1分钟即可生成15—20页演示文稿,平均生成成本低至约每页几美分。

模型后训练为主

RLAF框架减少人工依赖

在底层训练范式上,Agnes采用的是一整套连续演进的技术路径:从CPT(continuous pre-training,持续预训练)到PT(post-training,后训练),再到以自建RL(reinforcement learning)为核心的强化阶段,使模型能力可以持续迭代,而非一次性收敛。

更关键的是,他们把「进化」这件事,从模型层扩展到了Agent层。

在AgnesClaw体系中,Agent不仅调用skills,还可以在任务执行过程中通过反馈不断优化自身策略,实现智能体与skills的协同自进化。

这意味着,系统能力不再完全依赖预训练,而是在真实使用中持续变强。

支撑这套体系的,是一支高度国际化的研究团队——成员来自斯坦福、伯克利、MIT、NUS、NTU,以及清华、浙大、南大、东大等顶尖高校,核心科研带头人包括来自微软亚研院、英特尔研究院的首席科学家,以及高校教授与图灵奖得主门下研究者。

他们提出了一套名为RLAF(Reinforcement Learning with Agentic Feedback)的带智能反馈的新的强化学习框架,以减少对人工标注的依赖。该框架包含两个自研核心组件:

  1. DSPO(Dynamic-filter Sequence-level Policy Optimization):动态过滤序列级策略优化算法

    官方数据显示,在同规模模型对比中,相比DeepSeek Search-R1 (GRPO,7B)实现34.1%的性能提升。

  1. UV(Universal Verifier):通用验证器,用智能评估器替换人工标注数据和人工定义的奖励机制。

在RLAF框架中,多个AI Agent会对模型输出进行自动评估,从逻辑一致性、事实准确性和任务完成度等多个维度生成反馈信号。

这种「AI训练AI」的方式,可以减少大量人工标注,从而降低训练成本并提升效率。

随着AI行业进入新一轮竞争阶段,成本效率正逐渐成为商业化成败的关键因素。而此次登陆Zenmux(https://zenmux.ai/models?sort=newest),某种程度上也是Agnes一个关键分水岭——

模型不再只是「榜单表现」,而是直接进入开发者真实调用与对比的第一线

从上线一周的调用表现来看,这套Claw+多模态组合已经开始改写一部分开发者的选择。

当越来越多模型走向平台化分发,真正能留下来的,或许不只是更强的参数规模,而是谁更便宜、谁更好用、谁更能被快速接入真实世界。

Agnes,显然正在把答案往这个方向推。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一年关闭1500家!中国大超市批量倒闭,内行人道出实情!

一年关闭1500家!中国大超市批量倒闭,内行人道出实情!

老特有话说
2026-05-10 21:02:20
杨得志卸任总参谋长,秘书提醒他:新总长比您资历浅,不用去接机

杨得志卸任总参谋长,秘书提醒他:新总长比您资历浅,不用去接机

橘子谈历史
2026-05-11 06:21:48
美国政坛要出大事了:万斯大概率要当选总统。

美国政坛要出大事了:万斯大概率要当选总统。

阿振观点
2026-04-21 05:22:52
快递员为救落水10岁小孩,弄湿岸边富婆名牌包,富婆:赔我20万!

快递员为救落水10岁小孩,弄湿岸边富婆名牌包,富婆:赔我20万!

白云故事
2025-10-09 14:55:03
衡水中学的清北人数彻底崩了!巅峰期275人,跌至2025年的45人…

衡水中学的清北人数彻底崩了!巅峰期275人,跌至2025年的45人…

火山詩话
2026-05-08 17:44:41
7年败光2亿!邹市明冉莹颖共同发文:二人最终还是迈出了这一步!

7年败光2亿!邹市明冉莹颖共同发文:二人最终还是迈出了这一步!

拳击时空
2026-04-16 06:04:48
35岁男星猝然离世,前妻发长文悼念:心都碎了

35岁男星猝然离世,前妻发长文悼念:心都碎了

热搜摘要官
2026-05-10 10:27:37
慢慢读懂马龙,才懂一句现实:
打江山和守江山,真的不是一回事

慢慢读懂马龙,才懂一句现实: 打江山和守江山,真的不是一回事

小光侃娱乐
2026-04-23 14:55:03
历史如此巧合?杨开慧雕像缺失的石料,竟是主席像的“另一半”!

历史如此巧合?杨开慧雕像缺失的石料,竟是主席像的“另一半”!

珺瑶婉史
2026-03-28 19:55:03
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

通鉴史智
2026-05-11 09:58:09
张柏芝母亲节晒母子4人照,8岁三胎儿子出镜,小眼睛却很帅气

张柏芝母亲节晒母子4人照,8岁三胎儿子出镜,小眼睛却很帅气

黔乡小姊妹
2026-05-11 08:15:13
韩国人对华好感度最新数据公布

韩国人对华好感度最新数据公布

扬子晚报
2026-05-10 15:52:55
5月11日,人社部会公布2026年养老金调整通知吗?社保制度优化

5月11日,人社部会公布2026年养老金调整通知吗?社保制度优化

社保小达人
2026-05-11 10:07:04
西方终于服了?德媒:中国正在像当年的美国一样,悄悄接管世界

西方终于服了?德媒:中国正在像当年的美国一样,悄悄接管世界

奇葩游戏酱
2026-05-08 14:16:40
白鹿遭审判!《奔跑吧》最新收视率直接崩盘,网友要求她退出节目

白鹿遭审判!《奔跑吧》最新收视率直接崩盘,网友要求她退出节目

萌神木木
2026-05-09 15:04:15
快船抽中5号签,祖巴茨交易换来新转机

快船抽中5号签,祖巴茨交易换来新转机

竞技风云录
2026-05-11 08:16:26
和售后斗智斗勇后,我发现80%燃气灶故障,都可以通过两根针解决

和售后斗智斗勇后,我发现80%燃气灶故障,都可以通过两根针解决

装修秀
2026-05-05 12:00:08
泰国突然放大招!这条“陆桥”一旦建成,马六甲海峡的噩梦?

泰国突然放大招!这条“陆桥”一旦建成,马六甲海峡的噩梦?

华山穹剑
2026-05-10 20:35:16
江苏一家瑞幸咖啡店开到村里面,网友评论区玩梗停不下来

江苏一家瑞幸咖啡店开到村里面,网友评论区玩梗停不下来

瓜哥的动物日记
2026-05-11 00:16:43
工资13500元/月(6险2金+双休)2026年编制单位面向社会公开招收427名工作人员公告!5月11日开始报名!

工资13500元/月(6险2金+双休)2026年编制单位面向社会公开招收427名工作人员公告!5月11日开始报名!

材料科学与工程
2026-05-11 10:06:00
2026-05-11 10:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15179文章数 66861关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

游戏
健康
教育
艺术
家居

网友反映PS5北方联通服务器炸了 需要修改DNS

干细胞能让人“返老还童”吗

教育要闻

家长的基本修养是“不拖后腿”

艺术要闻

三位神经科学研究者:年轻人的脑子太累了

家居要闻

菁英人居 全能豪宅

无障碍浏览 进入关怀版