网易首页 > 网易号 > 正文 申请入驻

Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

0
分享至


机器之心发布

机器之心编辑部

刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。

从官网信息来看,Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈:一方面,当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大,但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token(起步 2 美元)。Libra 基于本地算力优先的架构显著降低了这一成本压力,为高 Token 消耗应用扫除障碍。另一方面,虽然主流 Agent 框架允许自定义开发,但技术门槛限制了普及范围。Libra 通过自然语言直接生成 Vibe Agent 的方式不仅简化了交互流程,更重要的是,这种端到端、无需编程的 Agent 生成范式为满足多元化、大规模的个性化 Agent 应用需求开辟了崭新道路。

让我们先看看 Libra 官网 (greenbit.ai) 发布的具体视频介绍:

场景展示:Libra 的 Agentic 规划能力

案例一:10 分钟打造即时 DeepResearch 服务

DeepResearch 作为 “模型即产品” 的 AI Agent 代表,用户想要私有化部署、接入内部数据,不仅面临昂贵的 API 调用费率,而且需要进行额外的手工编排设计。在 Libra 的 Vibe Agent 模式下,行业分析师仅需对话反馈,就能持续调教 agent,并构建专业、个性化的本地市场研究代理服务:

  • 简单描述需求:"我需要分析过去 5 年各市场电动车销量趋势,用 Python 处理数据、进行统计分析并生成可视化图表。需要按人口标准化销量数据,计算年复合增长率,并预测未来 3 年走势。"

  • Libra 智能解析需求,自动生成具备自我规划能力的行动智能体,代理用户进行网页搜索、数据清洗、时序预测、数据分析、可视化等全流程能力

  • 分析师评估代理服务的工作效果:完成了包含 15 个市场的实时市场深度分析报告,包括人均渗透率、区域增长率对比、未来预测等多维度分析,整个过程仅消耗约 80K 需要付费的云端 token,相比同等任务在云端 API 服务的调用成本降低了 90%

  • 持续调教,满意后使用 Libra 一键导出并部署到本地

案例二:一句话调教市场上的最佳 Agent 单品

除此之外,Libra 的对话式 Agent 调教模式能以极快的速度将潮流智能体产品融入用户的场景:

  • 个人 IP 孵化器:只需说 "我想根据我的每天 Mac 软件使用记录,用有趣文字连载我的《00 后职场升职记》小说",瞬间拥有专属 "数字史官",让个人品牌打造变得轻松自如。
  • Second Me:说一句 "我是一个数码产品内容创作者,模拟我的个人工作流,根据我的要求筛选每日数码科技动态,创建一个关于最新智能手机的微博话题",瞬间获得精准分析和引人入胜的微博内容。为你自主监控科技趋势,提炼核心信息,适时生成专业评测观点,让你的数码影响力持续增长。
  • 创意游戏工坊:简单一句 "需要在我的酒吧上线一个可以模拟 AI 大逃杀的对话游戏",分钟级别即可创建基于图灵测试的沉浸式大逃杀游戏体验,参与 AI 角色间的智慧博弈与尔虞我诈。

最重要的是,这些生成的 Agent 服务可以全部在本地执行,尽情使用,忘掉 Token 消耗。当然,有想法的小伙伴已经想到了, “想要专属个人助理”,“生成一个 Libra”,随着 Libra 的技术验证成功,创造力将不再是瓶颈,请开始你的对话式调教。

产品革新:Libra 对 Agent 落地的几点思考

实惠的国民 Agent: Token 总成本直降 90%

不同于普通的对话类 AI 应用,无论是 Cursor、WindSurf 等 AI Editor,还是以 Libra 为代表的 Vibe Agent 产品,都提供了复杂工具调用与多跳场景推理功能作为服务,为用户带来极致的自动化体验,而相应的推理 Token 消耗也呈现数量级的增长,当前 Agent 行业仍然处于 2G 时代的收费短信收发阶段,对有效智能的"提速降费"迫在眉睫。

根据官网信息,为了打造 Agent 服务的 "无限流量" 模式,Libra 团队通过低比特量化压缩、基于优先级的长上下文管理、端云协同等组合优化技术,实现了企业级大型语言模型在消费级桌面设备上的高效运行,从根本上改变了 AI 应用中的模型侧成本结构:

  • 端 + 云服务:采用本地模型优先的 Agent 方案,无需依赖按 Token 计费的 API 费用,消除使用量增长带来的成本压力,长期使用成本降低 90% 以上。
  • 走向消费级硬件:通过先进的模型压缩和优化技术,使消费级桌面硬件 (如 Apple M3 Ultra) 即可流畅运行企业级模型,初始投入降低 95%。
  • 初步成本预估:根据团队估算,假设用户采用最昂贵的消费级桌面硬件 Apple M3 Ultra,使用 Libra 替换纯云端 API 方案后,持续的高强度 Agent 服务月支出从 15 万元降至设备一次性投入 8 万元,初始 Apple M3 Ultra 投资可在不到 3 个月内收回成本,当我们使用更日常的消费级硬件时,成本将进一步下降。

随着开源大模型能力、消费级芯片 Memory 与计算容量的持续提升,通过 Local Token 优先的 "端 + 云" 架构进行 Agent 部署能有效摊薄用户使用成本。

拥抱 Vibe Agent: 对话模式正在拓宽需求的边界

随着对话模式深入人心,语言正在重新定义需求的边界 ——昨日的口头愿望正在转变为今天的实际需求。Libra 团队演示的 Vibe Agent 交互模式,正是对这一需求演化的精准回应。

从最新的 GPT-4o 图像直出、AI IDE 的代码辅助生成再到 Libra 的行动 Agent 生成,交互体验的突破带来的是效率的跨越式提升 —— 传统方式需要数周构建的基础 Agent,在 Vibe Agent 模式下仅需 10 分钟的对话调教,即可让 AI 自主理解场景中的工具需求与流程约束,生成同等甚至更高水平的专业级代理服务。Vibe Coding 以及 Vibe Agent 模式的出现不仅将提高人们对服务响应效率的预期,更将引领 Agent 技术领域不断向更高峰攀升。

从需求表达到服务实现的距离被大幅缩短,使得"即时满足"不再是奢望。随着这些技术的成熟与普及,我们将看到越来越多的个性化、场景化代理服务在各行各业涌现。

Local AI 的正确打开方式: Agent 即资产

Libra 团队的本地优先架构同时揭示了 Agent 时代的关键洞见:个人智能体已然成为无形但珍贵的知识资产。这一思路切中了当前 AI 发展的核心矛盾点。在知识工作者将创意、方法和解决方案输入云端 AI 工具的同时,他们也在不经意间贡献了自己最有价值的资产。

恰当的本地化策略是对这一需求的正面回应 —— 通过围绕用户需求构造本地优先的智能体,用户能够在轻松获得 AI 助力、形成个人工作流的同时,保留对自己独特工作方法的完全控制权,并实现持续迭代提升。这一转变的意义远超简单的隐私保护,它有效回应了个人与 AI 工具的关系边界。

为什么是 Libra?核心技术揭秘

从官网可知,Libra 团队持续投入本地 AI 相关核心技术栈研究,促使 Libra 成为首款在 Apple Mac 系列上直接运行的个性化 Agent 平台。摆脱云端限制,告别高昂 API 费用,让自主适应场景的 Vibe Agent 模式成为可能性:

低比特量化技术

采用基于混合精度量化和 Reasoning-Aware 低比特表征校准技术,将前沿大模型 (QwQ 32B、DeepSeek-R1-70B、Deepseek R1 671B 等) 精准压缩至符合 Apple 消费级 Silicon 硬件计算架构的 3/4 比特混合精度表征,并与 Apple MLX 机器学习推理框架无缝融合。在性能保持方面,将常规 Instruct 类大语言模型性能损失精确控制在 1% 以内,内存需求较 FP16 模式显著下降 75%+。

更令人惊喜的是,Libra 团队验证了低比特量化在提升推理模型 Thinking 阶段效率的意外优势,通过维持推理模型 Thinking 阶段在压缩前后的思考质量并压缩 Thinking 时长,模型在多种复杂推理任务上能力不降反升,相反,经典量化部署方案 (AWQ、GGUF 等) 表现出对推理模型压缩效果的不稳定性,在多项任务中出现性能、思考效率双降等问题)。这套技术栈成功突破了传统量化方法的精度瓶颈,通过精心设计的混合精度表征与重校准策略,在满足消费级硬件适配需求的同时,完美保护了影响模型核心能力的 “Super Weights”。

在 Libra 平台上 Agentic 任务对比测试结果令人振奋 —— 基于混合精度的低比特模型在复杂推理任务上的用户体验与原始模型几乎无差别。凭借这一技术路线,消费级设备如 Mac Studio 或将成为部署个性化 Agent 服务的最理想硬件平台。

自适应上下文管理引擎

为突破本地设备资源限制与模型 Context 窗口制约,同时实现有效的 Token 聚合,Libra 团队创新性地构建了事件驱动的 Token Vibe Orchestration (TVO) 策略。TVO 基于 JSX 的层级资源调度策略,对前后端和历史交互数据进行高效整合,并使用专用模型对原始 contex 进行投机总结与优先级预测,使模型能够预判用户交互意图,对最相关上下文片段进行重排,从而在有限计算资源环境下实现卓越的上下文理解能力。

测试数据表明,这种模型驱动的动态编排架构能有效提升本地 AI Agent 在长文档分析和多轮复杂对话中的记忆能力和指令跟随能力。特别是在 Browser-use 这类涵盖百万级 Token 的场景中,TVO 架构能优先保留高价值信息,显著提升模型响应质量。

响应式 Orchestration 框架

Libra 提出一种创新的 Meta Agent-Orchestration (MAO) 框架,为 Vibe Agents 生成进行 Instance Multi-Agents Orchestration 与资源调度。MAO 框架针对 Orchestration 场景定制了专用策略智能体,内化了复杂的 Orchestration 相关知识,使系统能够自主推理、预测最佳协作路径。基于高效的数据库策略,MAO 能够对大量外部工具链、前后端即时交互 Context 进行系统化整合。这种设计确保各组件间无缝协作,即使在本地设备资源受限的情况下也能保持高效运行。作为框架的重要补充,MAO 还针对数据流通层可用性构造了专用预测器,通过实时图联通性验证,实现了自然语言生成 Agents 的可用性验证,有效降低了任务失败风险。

可以预见,Libra 基于消费级硬件与端到端 Agent 生成的技术方案将加速 Agent 对个人与小微团体办公场景的加持:

1. 桌面级 AI 赋能:企业可直接在 Mac Studio 等消费级设备使用 Libra 运行高性能的 Vibe Agent 服务,为组织提供便捷的 AI 能力获取路径,使 AI 技术与日常办公环境无缝融合。

2. 创新周期加速:产品经理与 AI 玩具开发者等能在熟悉的 Mac 工作站环境中基于 Libra 完成 Agent 原型设计并使用 Libra Engine 导出部署,专注于应用场景创新,快速将 AI 概念转化为实用解决方案。

3. 灵活部署选择:通过 Mac Studio 等消费级硬件实现本地化 AI 能力,为企业提供多元化的部署选项,使各类组织能根据自身需求和 IT 策略灵活采用 AI 技术。

结语

Libra 提出的 Vibe Agent 范式代表了 Agent 技术演进的新方向。这一范式通过对话式交互构建智能体的方法解决了传统 Agent 开发中的技术壁垒问题,将繁复的工程化流程简化为自然语言指令。Vibe Agent 的关键技术价值在于实现了从预定义框架到端到端生成的转变,使非技术背景用户也能根据具体场景需求实现 In-Context 的 Agent 定制。这种范式转换不仅是交互层面的优化,更是对 Agent 开发模式的重构。

在技术实现层面,Libra 通过本地模型优先的架构策略,配合低比特量化和优先级上下文管理,使 Token 成本大幅度下降。这一成本优势使得持续性、高频率的 Agent 交互在经济上变得可行。通过端云协同机制,企业级模型能力被有效压缩并部署至消费级硬件平台,为用户提供接近无限制的生产力体验。从产业发展角度分析,Vibe Agent 范式的价值体现在两个维度:首先,显著降低的计算成本将重塑 Agent 的经济模型,使 AI 能力从企业级资源转变为个人级工具;其次,对话式创建机制将实现 Agent 开发应用的普及,促使专业知识从封闭系统向开放生态转变。Libra 的技术方案为 Agent 技术走向普惠化提供了可验证的实施路径,预计将在近期推动 Agent 应用从概念验证阶段迈向规模化部署阶段。随着端侧计算资源进一步优化,Vibe Agent 模式有望成为下一代 Agentic 产品开发的标准范式。

  • Libra 官方网站:greenbit.ai
  • 申请试用:info@greenbit.ai

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
超百万台国六A库存燃油车砸向二手车市场,抄底燃油车是福还是祸?

超百万台国六A库存燃油车砸向二手车市场,抄底燃油车是福还是祸?

音乐时光的娱乐
2026-06-21 13:43:40
5200 万白菜价!曼联截胡世界杯天才!卡里克中场补强赚麻了

5200 万白菜价!曼联截胡世界杯天才!卡里克中场补强赚麻了

澜归序
2026-06-21 05:46:44
因凡蒂诺私人飞机穿梭观赛 世界杯碳排放雪上加霜

因凡蒂诺私人飞机穿梭观赛 世界杯碳排放雪上加霜

体坛观察猿
2026-06-22 00:55:45
7年败光2个亿,邹市明冉莹颖共同发文,终究还是踏出了这一步

7年败光2个亿,邹市明冉莹颖共同发文,终究还是踏出了这一步

林轻吟
2026-02-11 11:29:40
“机密”文件竟在微信群中传播!查明:档案局服务人员发现涉密文件与儿子工作有关,遂拍照发家庭群,已被辞退;相关负责人被党内严重警告

“机密”文件竟在微信群中传播!查明:档案局服务人员发现涉密文件与儿子工作有关,遂拍照发家庭群,已被辞退;相关负责人被党内严重警告

扬子晚报
2026-06-03 07:37:03
别盲目比退休金!2026年满60岁,拿到这个数已经胜过多数同龄人

别盲目比退休金!2026年满60岁,拿到这个数已经胜过多数同龄人

阿芒娱乐说
2026-06-21 12:31:17
黄瓜立大功?医生发现:经常吃黄瓜的人,不出半年,或有4大改善

黄瓜立大功?医生发现:经常吃黄瓜的人,不出半年,或有4大改善

芹姐说生活
2026-05-09 21:08:03
答谢宴上妻子温柔照料男闺蜜,对我冷眼相待,原来枕边人未属于我

答谢宴上妻子温柔照料男闺蜜,对我冷眼相待,原来枕边人未属于我

阿凯销售场
2026-06-22 00:44:52
730天没进组的顶流:不是无人问津,是报价没人接了

730天没进组的顶流:不是无人问津,是报价没人接了

五观不正
2026-06-21 20:29:12
金·卡戴珊新金发神似梦露,她曾后悔效仿

金·卡戴珊新金发神似梦露,她曾后悔效仿

娱圈观察员
2026-06-22 00:46:19
胜澳大利亚李弘权采访:上场就全力以赴,从防守做起磨合为主!

胜澳大利亚李弘权采访:上场就全力以赴,从防守做起磨合为主!

篮球资讯达人
2026-06-22 01:25:31
老了才明白,只有一个儿子的家庭,儿媳再好,也别交出这5样东西

老了才明白,只有一个儿子的家庭,儿媳再好,也别交出这5样东西

热心市民小黄
2026-06-18 11:44:09
数亿煤矿1200万贱卖,法官套现千万:河南这出“吃干抹净”的局

数亿煤矿1200万贱卖,法官套现千万:河南这出“吃干抹净”的局

有戏
2026-06-12 10:48:18
物业费新规落地!这 6 种情况一分钱不用交,很多业主还不知道

物业费新规落地!这 6 种情况一分钱不用交,很多业主还不知道

度看全球
2026-06-17 00:02:38
小天赐爸爸父亲节崩溃:再也瞒不住了,我对不起走了6年的儿子

小天赐爸爸父亲节崩溃:再也瞒不住了,我对不起走了6年的儿子

绚丽的画卷
2026-06-21 22:59:28
陈建斌蒋勤勤太骄傲了,19岁儿子将入读王力宏母校伯克利大学

陈建斌蒋勤勤太骄傲了,19岁儿子将入读王力宏母校伯克利大学

暖心萌阿菇凉
2026-06-19 13:39:23
C罗六次出征世界杯!12个女友,5个娃3个妈,终被等了9年柜姐收服

C罗六次出征世界杯!12个女友,5个娃3个妈,终被等了9年柜姐收服

法老不说教
2026-06-21 16:13:57
开国大校来看望毛主席,因没有预约不让进:我见主席还用通报?

开国大校来看望毛主席,因没有预约不让进:我见主席还用通报?

纪实文录
2025-06-12 15:22:16
谁能抵挡住张馨予的盛世美颜,李晨真是错过了

谁能抵挡住张馨予的盛世美颜,李晨真是错过了

娱你同欢
2026-06-18 23:07:07
首笔签约达成!湖人启动交易,勇士四处碰壁,库里放姿态无济于事

首笔签约达成!湖人启动交易,勇士四处碰壁,库里放姿态无济于事

呆哥聊球
2026-06-21 18:32:01
2026-06-22 04:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13319文章数 142676关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

西班牙4-0大胜沙特 亚马尔首次世界杯首发+首球

头条要闻

西班牙4-0大胜沙特 亚马尔首次世界杯首发+首球

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

房产
数码
本地
公开课
军事航空

房产要闻

商业清零式退潮,大量住宅登场!三亚又要大规模调规!

数码要闻

曝英特尔"Raptor Lake Next"处理器移动端仅提供"HX"版本

本地新闻

龙腾资江 韵动邵阳

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

时隔44年试射洲际导弹 现场照片传递三个重磅信息

无障碍浏览 进入关怀版