网易首页 > 网易号 > 正文 申请入驻

OpenClaw引爆的AI Agent浪潮中,终于有芯片给端侧“解渴”了

0
分享至

OpenClaw的爆发,让“AI Agent”从概念迅速演变为产业竞赛。这类Agent能自主执行复杂操作,展现出前所未有的执行能力,却也把算力、成本和安全问题推到了台前。

每一次指令交互都需经过云端大模型,Token费用持续累积;设备日志与用户指令全量上云,频频触碰工业与家居场景的数据安全红线。更棘手的是,许多场景要求实时响应、外设协同与稳定运行。显然,完全依赖云端的方案,已力不从心。

端侧AI Agent芯片正成为产业布局的重点方向。芯师爷关注到瑞芯微推出端云协同方案ClawChips,其“SoC沙箱+AI协处理器”的算力解耦架构,试图在成本与场景适配之间找到平衡。本文将从架构逻辑、场景落地等维度拆解ClawChips解决了哪些问题?

省Token、破带宽:

ClawChips技术内核三连问

瑞芯微ClawChips方案的核心思路是主控负责系统运行与外设管理,协处理器专司模型推理。具体实现上,RK3588/RK3576作为运行沙箱,承担操作系统、外设接入与网络连接等通用任务;RK1828 AI协处理器聚焦大模型推理,两者算力独立,互不抢占。





1. 为何选择“SoC+协处理器”解耦方案?

传统硬件升级存在两大痛点,一是研发成本高,每次升级主控需重设计PCB、调试BSP、重新认证;其次是生命周期错配,AIoT设备寿命5-10年,而AI模型迭代仅数月。

瑞芯微的解法是将主控与推理算力解耦,主控保障系统与外设的稳定,协处理器专攻快速迭代的AI推理。通过PCIe/USB高速接口连接协处理器模组,无需改动主板即可升级AI能力,新一代模型出现时仅需更换协处理器模块。



2. 如何击穿“内存墙”与“能耗墙”?

RK1828采用3D堆叠技术,将DRAM晶圆直接堆叠在NPU逻辑晶圆之上,通过高密度TSV/混合键合建立数万个微米级垂直数据通道,具体带来四大优势:

带宽跃升:等效带宽达数百GB/s,消除3B以上大模型带宽瓶颈;

设计简化:内置DRAM,无需外挂颗粒,PCB布板更简洁,BOM更低;

推理高效:实测3B模型推理速度超过100 token/s;

能耗优化:数据传输距离极短,单位比特功耗大幅降低。

3. Token如何省?

ClawChips的智能路由机制根据任务复杂度动态分流,简单任务本地处理,复杂任务上云。相比纯云端方案,系统将高频、轻量、实时性要求高的任务优先本地完成,减轻云端调用压力,让云端资源专注于复杂理解与高质量生成。

基于PinchBench的实测数据,端云协同方案下,办公场景云端调用比例从100%降至46.70%,学习研究场景降至78.43%,辅助工具场景降至38.99%,整体节省约40%的云端Token消耗,实现“本地推理零成本,云端调用更高效”。

从“听懂指令”到“理解意图”:

ClawChips复活老设备

瑞芯微在AIoT垂类领域已有深厚积累,覆盖智能座舱、机器人、智能家居、安防、工控等数十个行业。ClawChips的核心价值在于"叠加",即在原有垂类应用之上赋予Agent能力,让存量设备无需推倒重来即可"长出"智能。

例如在智能座舱场景中,传统车载语音助手采用指令式交互,依赖云端处理,弱网环境下卡顿明显。引入Agent后,系统可理解"我有点热""想去附近好吃的川菜馆"等自然语言,并在本地完成语义理解和基础决策。据瑞芯微介绍,RK3588M+RK1828组合用于车载AI Box,本地运行7B语音助手,支持多模态交互,实现了"数据不出车"的隐私保护。

在机器人应用中,传统工业和服务机器人多采用"程控执行"模式。Agent加入后,机器人从"执行指令"升级为"理解意图"。以仓储物流为例,机器人需自主识别目标、规划路径、避障、调整抓取姿态——原本需大量规则代码,现可通过端侧多模态大模型+Agent框架实现。

瑞芯微的端侧AI全场景布局涵盖智能白电交互、AI电视、端侧离线翻译、AI视频分析盒子等方案,推动传统硬件从"响应指令"向"主动服务"升级。

高带宽+开放生态:

端侧Agent的硬核算力底座

ClawChips的重要壁垒在于高带宽和高算力,这正是支撑Agent类应用大规模Token推理的硬约束。与传统推理的“一次输入、一次输出”不同,Agent需要多轮推理、记忆维护和工具调用,Token消耗量级呈指数级增长。以OpenClaw为例,执行一次“整理桌面文件并分类”的任务,可能需要数十甚至上百次推理调用,累计Token达数万。

因此,客户在选型端侧AI芯片时,通常重点关注四项指标:最大支持模型参数规模、多Agent并发数、首token延迟以及功耗。瑞芯微凭借实测数百GB/s+的高带宽和20TOPS算力,使客户能够在端侧部署7B级别模型,并支持多路并发推理,满足Agent类应用的高强度需求。

除了硬件性能,工具链的完善程度同样影响开发效率。瑞芯微提供RKNN3 SDK,支持TensorFlow、PyTorch、ONNX等主流框架模型的一键转换与量化。开发者可通过RKNN3 SDK对0.5B-8B的LLM/VLM进行深度优化,LLM解码效率提升超过15%。

此外值得一提的是,ClawChips定位为开放平台。客户在构建自有Skill时,完全可以自由开发,瑞芯微提供硬件运行能力与基础示例“抛砖引玉”,将应用层的创新空间留给客户。

端侧Agent的终局想象

展望未来,每个家庭或许将拥有5-10个具备Agent能力的设备,包括智能音箱、扫地机器人、安防摄像头、车载助手等等。若全部依赖云端推理,Token消耗将不可持续。正因如此,端侧模型的持续迭代与Skill生态的扩展,成为推动本地处理比例上升、成本曲线下行的关键驱动力。这一趋势已在2026年加速显现。端侧AI应用快速爆发,工业、农业、服务业等领域的各类机器人正迎来重大机遇。

从OpenClaw到ClawChips,端侧AI Agent的算力底座正经历从“云依赖”到“端云协同”的深刻转变。瑞芯微通过“主控沙箱+协处理器推理”的算力解耦架构,结合3D堆叠DRAM的高带宽优势,为垂类场景中的Agent能力叠加提供了一套可量化的方案。40%的Token节省、3B模型超100 token/s的推理性能、小于15W的功耗,以及开放的工具链生态,共同构成了ClawChips的技术底色。

而端侧Agent的算力需求是否真正能撑起一个新品类,取决于明年这个时候,有多少设备真正用上了ClawChips此类方案。

编者互动

芯师爷注意到,瑞芯微已将其 ClawChips 方案在 GitHub 开源上线,并面向开发者推出专属共创支持机制

扫描下方二维码↓↓,即可申请 RK3588+RK1828 开发套件的无偿借用权益(为期一个月),抢先体验端侧 AI Agent 的全量能力,打磨自己的优质技能。

欢迎开发者一起探索,玩出百样精彩!

ClawChips GitHub 开源地址:

https://github.com/airockchip/c

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
嗜赌成性只是冰山一角,婚内出轨、睡有妇之夫,体坛丑闻毁三观

嗜赌成性只是冰山一角,婚内出轨、睡有妇之夫,体坛丑闻毁三观

阿讯说天下
2026-04-25 11:15:04
中国40艘油轮全线受限!恒力石化遭美方制裁,能源博弈手段太直白

中国40艘油轮全线受限!恒力石化遭美方制裁,能源博弈手段太直白

戗词夺理
2026-04-25 12:14:20
私人账户收款要小心,2026监管新规,普通人必看

私人账户收款要小心,2026监管新规,普通人必看

芳姐侃社会
2026-04-24 22:40:35
72岁林青霞现身香港中文大学,头发浓密,发际线也没上移状态超好

72岁林青霞现身香港中文大学,头发浓密,发际线也没上移状态超好

点点细语
2026-04-25 20:15:26
北京国安主场2比4惨败津门虎,青岛海牛很惊悚,难题给到泰山队

北京国安主场2比4惨败津门虎,青岛海牛很惊悚,难题给到泰山队

姜大叔侃球
2026-04-25 21:54:42
成都双流火灾5死2伤,离消防站仅一个红绿灯,知情人:有12岁女娃

成都双流火灾5死2伤,离消防站仅一个红绿灯,知情人:有12岁女娃

离离言几许
2026-04-25 20:40:56
上海偶遇欧阳娜娜:腿短腰粗衣品差,网友直呼:穿个秋衣就出来了

上海偶遇欧阳娜娜:腿短腰粗衣品差,网友直呼:穿个秋衣就出来了

冷紫葉
2026-04-25 14:40:01
商务部新闻发言人就欧盟第20轮对俄制裁列单中国企业答记者问

商务部新闻发言人就欧盟第20轮对俄制裁列单中国企业答记者问

界面新闻
2026-04-25 19:51:38
沉迷赌博只是冰山一角,插足婚姻,婚内出轨,体坛圈丑闻不断

沉迷赌博只是冰山一角,插足婚姻,婚内出轨,体坛圈丑闻不断

小蔑谈事
2026-04-26 00:48:16
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

鹤羽说个事
2026-04-23 22:45:59
中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

谛听骨语本尊
2026-04-25 14:44:21
上海一市民通过12345“随申拍”举报地铁站台吸烟者,收到答复:巡视员未发现,若发现会制止,不配合会报警,市民:理解但希望加强巡视

上海一市民通过12345“随申拍”举报地铁站台吸烟者,收到答复:巡视员未发现,若发现会制止,不配合会报警,市民:理解但希望加强巡视

纵相新闻
2026-04-25 01:04:05
胆大包天!伊朗33艘快艇闪电突袭:美军来不及出动,眼睁睁吃败仗

胆大包天!伊朗33艘快艇闪电突袭:美军来不及出动,眼睁睁吃败仗

谛听骨语本尊
2026-04-25 16:14:58
事态升级,中方军舰越聚越多,四川舰和辽宁舰汇合,菲日休想闹事

事态升级,中方军舰越聚越多,四川舰和辽宁舰汇合,菲日休想闹事

甜到你心坎
2026-04-25 09:50:11
曝24岁美女谢垚心梗去世,经常跑半马,父亲痛别,带女儿照片看海

曝24岁美女谢垚心梗去世,经常跑半马,父亲痛别,带女儿照片看海

天天热点见闻
2026-04-23 19:23:09
湖人在G3击败火箭后,宣布关于勒布朗·詹姆斯的重要消息!

湖人在G3击败火箭后,宣布关于勒布朗·詹姆斯的重要消息!

夜白侃球
2026-04-25 23:54:45
网红莫氏鸡煲凉透了!从通宵排队到空无一人,终究逃不过昙花一现

网红莫氏鸡煲凉透了!从通宵排队到空无一人,终究逃不过昙花一现

阿郎娱乐
2026-04-23 15:28:38
逆袭进决赛!第82分钟扳平,第87分钟绝杀,瓜帅神了:率队6连胜

逆袭进决赛!第82分钟扳平,第87分钟绝杀,瓜帅神了:率队6连胜

足球狗说
2026-04-26 02:12:14
伊朗33艘快艇闪电突袭美军,来不及出动眼睁睁吃败仗

伊朗33艘快艇闪电突袭美军,来不及出动眼睁睁吃败仗

悦心知足
2026-04-25 21:46:13
2026-04-26 02:31:00
芯师爷
芯师爷
百万半导体人关注的资讯平台
843文章数 1257关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

房产
教育
旅游
亲子
公开课

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

教育要闻

一根风筝线,牵起一个校长的教育梦

旅游要闻

美猴王VS水蜜桃,连云港、无锡文旅“双向奔赴”

亲子要闻

发生率仅十万分之一!这种稀有血型跨省紧急调配,只为守护母婴安全

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版