网易首页 > 网易号 > 正文 申请入驻

不限时免费!全球榜单前十AI Lab开放全模态API,我先替你测了

0
分享至


智东西
作者 江宇
编辑 漠影

Tokenmaxxing”(把Token消耗拉到极限)正在成为开发者社区的新热词。Token预算,被视为衡量AI使用深度的新指标。有初创公司CEO甚至把Anthropic账单晒在LinkedIn上,当作公司AI化程度的重要证明。


▲图源:Swan AI CEO Amos Bar-Joseph

然而,一个关键问题被忽略了:我们到底在用Token创造什么?

成本确实在飙升。高盛预测,未来几年Token使用量可能增长24倍以上;英伟达应用深度学习副总裁甚至坦言,AI成本已超过团队薪资


▲图源:高盛

但产出的质量呢?数据给出了不太乐观的答案。

代码生成领域尤为典型。Waydev跟踪50多家企业发现,AI生成代码的长期保留率仅为10%~30%。GitClear的报告更直接:重度AI使用者的代码返工量是非AI用户的9.4倍。另一平台Jellyfish的统计则显示,部分团队代码吞吐量提升2倍,代价却是Token成本飙升近10倍


▲代码翻修量增速超过生产力增速,数据来源:GitClear

当Token消耗持续增长,投入产出比变得尤为主要。Token焦虑,正在成为AI落地的真实阻力。

在这场日益蔓延的“Token焦虑”中,Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布,自6月1日起,旗下全模态模型API无限期免费开放。

一、当Token越来越贵,一家AI Lab把账单直接清零

Agnes AI本次开放覆盖其三款核心模型:文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。


自6月1日起,上述模型API将面向全球开发者无限期免费开放。对于中小团队、独立开发者和创作者而言,模型调用的成本门槛彻底“消失”,试错空间被极大释放。

在Agnes AI看来,高质量AI不应只属于高预算公司。Agnes AI希望通过免费开放文本、图片、视频全模态模型API,让有限的预算更多用于产品创新和功能迭代。

二、文本、图片、视频一起开放,一手实测看看实力

成本归零之后,开发者更关心的是:模型到底能不能打?我们分别对文本、图像和视频模型进行了实测。

  • 文本模型:1M超长上下文,快速搭建生产力场景

Agnes-2.0-Flash支持1M上下文窗口和工具调用,覆盖代码开发、企业知识库、智能客服、文档处理及Agent工作流等场景。为了看看这些能力在实际场景中的表现,我们围绕代码生成、网页搭建和前端设计等方向进行了测试。

首先来看看编程能力。我们先让Agnes-2.0-Flash生成一款飞机大战网页游戏。


模型不仅生成了完整的玩法框架(战机、小怪、Boss战、计分、生命值),还主动加入了连击提示、粒子爆炸、动态星空背景及音效。完成度远超一般Demo,接近可直接游玩的成品。

第二个测试我们换了个方向。只用一句提示词,Agnes-2.0-Flash便完成了一个SBTI人格测试网站的搭建。



网站包含完整的测试流程、结果计算逻辑以及人格类型展示页面,用户完成答题后即可直接查看结果。从最终效果来看,整个体验与常见在线人格测试产品已经十分接近。

从前面的两个案例来看,无论是网页小游戏,还是测试网站,Agnes-2.0-Flash都能够较快完成。

接下来,我们进一步提高难度,把测试重点放在前端设计和产品界面生成能力上。

第三个测试是摄影作品展示网站。生成结果给人的第一印象是审美在线。整体布局和视觉风格已经接近不少独立摄影师作品集网站的完成度。


如果说这考验的是审美和页面布局能力,那么社交产品则更考验复杂的交互能力。为此,我们进一步让Agnes-2.0-Flash生成一个类似X的社交分享网站。


最终生成的页面包含信息流、搜索框、关注按钮、侧边导航栏、推荐内容等多个核心模块,关注、点赞等按钮还可以触发对应动画反馈。从视觉呈现和交互体验来看,整体设计与X的产品形态极为接近。

整体而言,如果仅作为产品Demo或前端原型展示,Agnes-2.0-Flash的能力已经能够满足不少项目早期验证和演示需求。

  • 图像模型:主打可编辑,人像精修、电商图和信息图全覆盖

Agnes-Image-2.0-Flash支持图改图、多图融合、背景替换、局部编辑、文字修改和风格转换等能力,适用于电商主图、广告设计、产品海报和社交媒体内容生产等高频场景。

我们首先尝试了一组人物形象重塑任务,重点测试模型在人像特写场景下的编辑能力。模型需要保留原人物身份特征,同时将其重新塑造成韩流偶像打歌舞台风格。



从结果来看,在大幅修改人物造型的同时,人脸一致性依然保持稳定。同时,皮肤纹理、光影层次和镜头质感也得到了进一步强化,人物看起来更加贴近专业摄影和商业视觉作品的呈现效果。

第二组测试我们把目标放在电商设计场景。我们直接上传了一张护发精油的实拍照片,并要求模型生成一张完整的电商海报。


最终生成结果不仅保留了产品主体和品牌Logo,还自动补充了产品卖点文案、视觉装饰元素以及符合电商风格的版式设计。从成片来看,产品主体突出,光影和质感增强,背景加入了与产品调性相符的视觉元素。对于电商运营、品牌营销和内容团队而言,这类能力能够减少拍摄、修图和排版等环节的工作量。

信息图是对图像模型更复杂的考验。为此,我们设计了两组不同方向的信息图任务。

第一组测试偏向流程图和知识科普场景。


生成结果不仅完成了完整的流程结构搭建,还自动加入了大量图标、插画元素和视觉引导符号。不同步骤之间通过箭头、色块和层级关系进行连接,即使包含大量文字信息,整体依然保持较好的视觉辨识度。

第二组测试则进一步提高难度。我们要求模型根据海洋生物特征生成一套建筑概念设计信息图,既要展示灵感来源,也要呈现设计推导过程和最终建筑方案。


模型完成了从生物形态分析、设计语言提炼到建筑概念落地的完整表达,包含参考素材、结构拆解、色彩分析、空间推演以及最终效果图等多个板块。

两组测试呈现出一个明显的特点:当信息密度持续提升时,Agnes-Image-2.0-Flash不仅能够生成对应内容,还能够主动组织版面结构,让图片同时承担“展示”和“解释”两种功能。

对于需要制作科普内容、商业汇报、设计方案和社交媒体长图的用户来说,这类能力会更加实用。

  • 视频模型:支持音画同出,电影感、角色演技都在线

Agnes-Video-V2.0支持音画同步生成、首帧生视频、首尾帧生视频以及多帧生成能力,输出分辨率可选720P或1080P,可用于短视频制作、广告素材生产、剧情分镜和自动化视频工作流。

首先测试的是Agnes-Video-V2.0的音画同步生成能力。

第一个案例是一段架子鼓演奏视频。

画面中的男孩坐在鼓组前完成演奏动作,在视频开头,他先用脚踩下底鼓踏板,随后才开始使用鼓槌进行演奏。整个过程中,鼓点出现的时机与人物动作能够保持同步。对于音乐演奏类内容而言,这类细节往往比单纯的画面质量更难处理。

第二个案例则进一步增加了复杂度。乐队画面中需要同时出现了主唱、吉他手和鼓手三名人物。

除了乐器演奏声之外,视频还包含主唱开场时清晰的人声报数。从最终效果来看,人声、乐器以及人物动作之间能够保持较好的同步关系。无论是主唱开口时的口型变化,还是鼓手和吉他手的演奏动作,都与对应声音基本匹配。

单从两个案例来看,Agnes-Video-V2.0具备处理复杂音频元素的能力。相比后期单独配音的方案,音画同步生成能够减少剪辑和配音环节,对于短视频创作、音乐内容制作以及剧情视频生成都会更加方便。

随后,我们又测试了一个更具电影质感的场景。

视频中,一名身穿西装的男子走在街头,打电话与另一端的人交流。从最终效果来看,除人物口型与台词对应较好外,面部表情和情绪变化也会随着对话内容发生调整,整体表演很自然。更吸引人的还是整体画面的电影感,画面与背景声配合下,视频看起来更像实景拍摄的片段。

最后,我们测试了一个更具挑战性的人物表演场景。

整个片段几乎没有大幅度动作,更多依赖眼神、呼吸和面部细节来传递情绪。从最终效果来看,人物表演呈现出较强的层次感。相比单纯的“流泪”镜头,这种情绪表达更接近影视作品中的表演方式。

从微表情、情绪递进到镜头表现,Agnes-Video-V2.0生成的视频还具备了戏剧张力,也让AI生成角色向真人演员的表现力又靠近了一步。

从工作流角度看,文本模型负责规划与代码,图像模型专注视觉编辑,视频模型完成动态呈现。三者并非孤立的单点能力,而是一套可开发者组合与调用的全模态能力体系。

三、全球AI Lab第9名,连续登上国际榜单

免费开放不是因为它能力薄弱,恰恰相反——Agnes AI目前位列全球AI Lab第9名,并连续获得多个国际评测体系认可。

文本模型Agnes-2.0-Flash进入Claw-Eval榜单,排名国内前7。该榜单关注真实Agent场景下的复杂任务规划、工具调用和连续执行能力,被视为更接近实战的评测体系。


▲图源:Claw-Eval榜单

图像模型Agnes-Image-2.0-Flash则进入Artificial Analysis Image Editing Leaderboard前列。该榜单采用真实用户盲评,根据生成质量主观打分。


▲图源:Artificial Analysis

与此同时,视频模型Agnes-Video-V2.0也出现在Artificial Analysis Image-to-Video(With Audio)排行榜中,覆盖音画同步生成能力评测。


▲图源:Artificial Analysis

从PinchBench全球前十,到Claw-Eval与Artificial Analysis持续上榜,Agnes已经在文本、图片、视频三大模态获得国际评测体系认可。正是因为有这样的实力,Agnes才将全套API免费开放,让开发者直接在真实应用中使用。

结语:免费开放背后,一场关于AI基础设施的新竞争

随着模型性能不断接近,开发者对成本、稳定性、调用便利性和工程化能力的关注正在上升。

云计算行业曾经历过类似阶段:当基础设施逐渐普及,应用生态也随之扩张。AI领域正在出现相似变化。越来越多开发者希望把精力投入产品设计和用户需求,却仍被调用成本牵制。

Agnes此次无限期免费开放全模态模型API,提供了一个新的观察样本:在继续提升模型能力的同时,进一步降低开发和使用门槛。这会让更多开发者、创作者和中小团队拥有持续试验新产品的空间。对于整个AI生态而言,能力增长之外,普及速度同样值得关注。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文启程访美,“反独”成共同语言,港媒:民进党“抹红”无效

郑丽文启程访美,“反独”成共同语言,港媒:民进党“抹红”无效

海峡导报社
2026-06-01 07:10:03
除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

商业模式桑博士
2026-05-29 07:49:46
难以置信!00后大专求职要5500双休8小时,被网友吐槽“太狂了”

难以置信!00后大专求职要5500双休8小时,被网友吐槽“太狂了”

火山詩话
2026-06-01 11:29:01
吴官正:难忘那夜的秋雨

吴官正:难忘那夜的秋雨

坦腹斋
2018-09-01 16:32:58
给阿嬷的情书,新加坡官媒连批三天,最后承认:这东西,真挡不住

给阿嬷的情书,新加坡官媒连批三天,最后承认:这东西,真挡不住

娱说瑜悦
2026-05-30 17:03:54
韩国股市,涨到熔断

韩国股市,涨到熔断

鲁中晨报
2026-06-01 10:51:03
00后班主任的首届学生要高考了:8岁年龄差,零带班经验,3年时间将班级成绩从中下游“干到”了年级第一

00后班主任的首届学生要高考了:8岁年龄差,零带班经验,3年时间将班级成绩从中下游“干到”了年级第一

大风新闻
2026-06-01 11:34:50
襄阳“割四赔五”后续:23家派出所出手,网红出面也无力扭转局面

襄阳“割四赔五”后续:23家派出所出手,网红出面也无力扭转局面

观察鉴娱
2026-05-31 19:01:32
争口气吧!再过2年,三星和SK凯力士两家企业利润,或将超中国所有国企利润总和

争口气吧!再过2年,三星和SK凯力士两家企业利润,或将超中国所有国企利润总和

回旋镖
2026-05-31 20:50:31
男团成员裤腰低到离谱?网友怒批:这是公共猥亵

男团成员裤腰低到离谱?网友怒批:这是公共猥亵

时光慢旅人
2026-05-30 01:29:08
AI眼镜这么火,哪家最出圈?

AI眼镜这么火,哪家最出圈?

定焦One
2026-05-29 14:23:44
襄阳割四赔五新后续:大批麦客连夜撤走,当地部门紧急出手整改

襄阳割四赔五新后续:大批麦客连夜撤走,当地部门紧急出手整改

奇思妙想草叶君
2026-05-31 23:01:42
王菲这个表情,让张柏芝输得彻彻底底

王菲这个表情,让张柏芝输得彻彻底底

南万说娱26
2026-06-01 09:04:07
印度已经绝望,四重危机正在斩断国运,再过25年,他们可能亡国

印度已经绝望,四重危机正在斩断国运,再过25年,他们可能亡国

贱议你读史
2026-06-01 00:40:03
德比斯:天气一热张雪机车就出问题!回应网友:我不可能每场都赢

德比斯:天气一热张雪机车就出问题!回应网友:我不可能每场都赢

念洲
2026-06-01 09:39:16
释永信的567万,到底送给了谁?

释永信的567万,到底送给了谁?

仕道
2026-06-01 10:55:25
失欧冠后遭英超4队嘲讽!阿森纳双星回怼:冠军到手,笑看柠檬精

失欧冠后遭英超4队嘲讽!阿森纳双星回怼:冠军到手,笑看柠檬精

我爱英超
2026-06-01 07:09:45
闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

兵鉴史
2026-05-30 14:32:11
司机激活智驾后追尾停着的货车 致3人死亡 长安启源回应

司机激活智驾后追尾停着的货车 致3人死亡 长安启源回应

闪电新闻
2026-06-01 10:05:48
五年减少3900万!儿童节,越来越冷清了

五年减少3900万!儿童节,越来越冷清了

西部城市
2026-06-01 11:30:39
2026-06-01 14:40:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11940文章数 117089关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

北大硕士在德国读博迷奸女子 曾是国家奖学金获得者

头条要闻

北大硕士在德国读博迷奸女子 曾是国家奖学金获得者

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

旅游
教育
时尚
家居
数码

旅游要闻

逛故宫的游客注意了,坤宁宫明起检修请绕行

教育要闻

同校同专业!湖北工业大学工程技术学院3个好姐妹考研齐上岸!

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

家居要闻

自信舒展 高背座椅

数码要闻

英伟达发布DLSS 4.5光线重建:支持全部RTX显卡,8月推出

无障碍浏览 进入关怀版