网易首页 > 网易号 > 正文 申请入驻

Arm Ethos-U85 NPU:利用小语言模型在边缘侧实现生成式 AI

0
分享至

随着人工智能 (AI) 的演进,利用小语言模型 (SLM) 在嵌入式设备上执行 AI 工作负载成为业界关注的焦点。Llama、Gemma 和 Phi3 等小语言模型,凭借其出色的成本效益、高效率以及在算力受限设备上的易部署性,赢得了广泛认可。Arm 预计这类模型的数量将在 2025 年继续增长。

Arm 技术以其高性能与低功耗的显著优势,为小语言模型提供了理想的运行环境,能够有效提升运行效率,并进一步优化用户体验。为了直观展示端点 AI 在物联网和边缘计算领域的巨大潜力,Arm技术团队近期打造了一场技术演示。在演示中,当用户输入一个句子后,系统将基于该句扩展生成一个儿童故事。这项演示受到了微软 “Tiny Stories” 论文和 Andrej Karpathy 的 TinyLlama2 项目的启发,TinyLlama2 项目使用了 2,100 万个故事来训练小语言模型生成文本。

该演示搭载了 Arm Ethos-U85 NPU,并在嵌入式硬件上运行小语言模型。尽管大语言模型 (LLM) 更加广为人知,但由于小语言模型能够以更少的资源和较低的成本提供出色的性能,而且训练起来也更为简易且成本更低,因此越来越受到关注。

在嵌入式硬件上实现基于 Transformer 的小语言模型

Arm 的演示展示了 Ethos-U85 作为一个小型低功耗平台,具备运行生成式 AI 的能力,并凸显了小语言模型在特定领域中的出色表现。TinyLlama2 模型相较 Meta 等公司的大模型更为简化,很适合用于展示 Ethos-U85 的 AI 性能,可作为端点 AI 工作负载的理想之选。

为开发此演示,Arm 进行了大量建模工作,包括创建一个全整数的 INT8(和 INT8x16)TinyLlama2 模型,并将其转换为适合 Ethos-U85 限制的固定形状 TensorFlow Lite 格式。

Arm 的量化方法表明,全整数语言模型在取得高准确度和输出质量之间实现了良好平衡。通过量化激活、归一化函数和矩阵乘法,Arm 无需进行浮点运算。由于浮点运算在芯片面积和能耗方面成本较高,这对于资源受限的嵌入式设备来说是一个关键考量。

Ethos-U85 在 FPGA 平台上以 32 MHz 的频率运行语言模型,其文本生成速度可达到每秒 7.5 到 8 个词元 (token),与人类的阅读速度相当,同时仅消耗四分之一的计算资源。在实际应用的系统级芯片 (SoC) 上,该性能最多可提高十倍,从而显著提升了边缘侧 AI 的处理速度和能效。

儿童故事生成特性采用了 Llama2 的开源版本,并结合了 Ethos NPU 后端,在 TFLite Micro 上运行演示。大部分推理逻辑以 C++ 语言在应用层编写,并通过优化上下文窗口内容,提高了故事的连贯性,确保 AI 能够流畅地讲述故事。

由于硬件限制,团队需要对 Llama2 模型进行适配,以确保其在 Ethos-U85 NPU 上高效运行,这要求对性能和准确性进行仔细考量。INT8 和 INT16 混合量化技术展示了全整数模型的潜力,这有利于 AI 社区更积极地针对边缘侧设备优化生成式模型,并推动神经网络在如 Ethos-U85 等高能效平台上的广泛应用。

Arm Ethos-U85 彰显卓越性能

Ethos-U85 的乘法累加 (MAC) 单元可以从 128 个扩展至 2,048 个,与前一代产品 Ethos-U65 相比,其能效提高了 20%。另外相较上一代产品,Ethos-U85 的一个显著特点是能够原生支持 Transformer 网络。

Ethos-U85 支持使用前代 Ethos-U NPU 的合作伙伴能够实现无缝迁移,并充分利用其在基于 Arm 架构的机器学习 (ML) 工具上的既有投资。凭借其卓越能效和出色性能,Ethos-U85 正愈发受到开发者青睐。

如果在芯片上采用 2,048 个 MAC 配置,Ethos-U85 可以实现 4 TOPS 的性能。在演示中,Arm 使用了较小的配置,即在 FPGA 平台上采用 512 个 MAC,并以 32 MHz 的频率运行具有 1,500 万个参数的 TinyLlama2 小语言模型。

这一能力凸显了将 AI 直接嵌入设备的可能性。尽管内存有限(320 KB SRAM 用于缓存,32 MB 用于存储),Ethos-U85 仍能高效处理此类工作负载,为小语言模型和其他 AI 应用在深度嵌入式系统中的广泛应用奠定了基础。

将生成式 AI 引入嵌入式设备

开发者需要更加先进的工具来应对边缘侧 AI 的复杂性。Arm 通过推出 Ethos-U85,并支持基于 Transformer 的模型,致力于满足这一需求。随着边缘侧 AI 在嵌入式应用中的重要性日益增加,Ethos-U85 正在推动从语言模型到高级视觉任务等各种新用例的实现。

Ethos-U85 NPU 提供了创新前沿解决方案所需的卓越性能和出色能效。Arm 的演示显示了将生成式 AI 引入嵌入式设备的重要进展,并凸显了在 Arm 平台上部署小语言模型便捷可行。

Arm 正为边缘侧 AI 在广泛应用领域带来新机遇,Ethos-U85 也因此成为推动新一代智能、低功耗设备发展的关键动力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
镇书记被双规后,一天上午,43岁副镇长约镇书记的19岁女儿爬山

镇书记被双规后,一天上午,43岁副镇长约镇书记的19岁女儿爬山

乔生桂
2024-06-26 15:50:20
广东加时赢5分!山东输6分,北京赢9分,上海大胜22分,排名大变

广东加时赢5分!山东输6分,北京赢9分,上海大胜22分,排名大变

老吴说体育
2026-04-08 22:09:50
荷兰红灯区:在这里没有做不到,只有你想不到的大尺度

荷兰红灯区:在这里没有做不到,只有你想不到的大尺度

番外行
2026-03-21 13:03:00
美国在国民党豢养的鹰犬终于不装了!不仅卖台,还疯狂攻击大陆

美国在国民党豢养的鹰犬终于不装了!不仅卖台,还疯狂攻击大陆

胡同里有只猫A
2026-03-13 17:46:01
“一夜涨50万元,还谈个啥?”上海二手房市场现卖家大幅跳价,买家不干了

“一夜涨50万元,还谈个啥?”上海二手房市场现卖家大幅跳价,买家不干了

上观新闻
2026-04-06 22:10:08
以色列南部遭伊朗导弹袭击

以色列南部遭伊朗导弹袭击

财联社
2026-04-08 05:26:29
中美俄雷达差距太大!俄预警6000公里,美5500公里,中国令人意外

中美俄雷达差距太大!俄预警6000公里,美5500公里,中国令人意外

阿器谈史
2026-04-02 15:36:40
帅化民:我特别讨厌解放军的一个叫“远火”的武器

帅化民:我特别讨厌解放军的一个叫“远火”的武器

安安说
2026-03-17 11:58:44
《孟沅迟妄》小说:迟妄是学校里众星捧月的校草

《孟沅迟妄》小说:迟妄是学校里众星捧月的校草

雪雀舞渐云釓
2025-08-31 06:51:04
江西女硕士失踪,被发现时已在教授实验室待6年,魔鬼真的存在

江西女硕士失踪,被发现时已在教授实验室待6年,魔鬼真的存在

灿烂夏天
2025-02-10 20:20:13
澳大利亚等5国外长发表联合声明:袭击联合国维和人员不可接受

澳大利亚等5国外长发表联合声明:袭击联合国维和人员不可接受

环球网资讯
2026-04-06 11:51:14
一辆无法上牌的布加迪威航竟拍出1305万元,辅拍机构:买家只能用拖车拖走,作收藏或展示等用途

一辆无法上牌的布加迪威航竟拍出1305万元,辅拍机构:买家只能用拖车拖走,作收藏或展示等用途

极目新闻
2026-04-06 11:33:54
林彪按战功排将,韩先楚、钟伟凭战绩晋升,李运昌、杨国夫遭冷遇

林彪按战功排将,韩先楚、钟伟凭战绩晋升,李运昌、杨国夫遭冷遇

磊子讲史
2026-03-18 11:58:13
奔驰全新E级上市!不足38万起售,外观豪华感十足,搭载2.0T+9AT

奔驰全新E级上市!不足38万起售,外观豪华感十足,搭载2.0T+9AT

小史谈车
2026-04-08 15:11:56
又袭击!伊朗上当了?美伊同意停火,不到24小时,以色列再度出手

又袭击!伊朗上当了?美伊同意停火,不到24小时,以色列再度出手

凡知
2026-04-08 22:29:13
吓我一跳!电和天然气烧水,差距居然差出一个月的买菜钱!

吓我一跳!电和天然气烧水,差距居然差出一个月的买菜钱!

小谈食刻美食
2026-04-08 08:25:32
英媒终于承认:中东打一仗才发现,中国这3张底牌,谁都学不来!

英媒终于承认:中东打一仗才发现,中国这3张底牌,谁都学不来!

阿器谈史
2026-04-02 15:33:03
彭于晏44岁状态布达佩斯生图疯传!素颜无滤镜皮肤紧致如20岁

彭于晏44岁状态布达佩斯生图疯传!素颜无滤镜皮肤紧致如20岁

大鱼娱乐观
2026-04-07 22:25:21
网友叫她 “吴优大胸妹”,这真的是正常身材吗?

网友叫她 “吴优大胸妹”,这真的是正常身材吗?

飛娱日记
2026-02-26 10:03:47
阚清子崩溃大哭48小时,猛料频传,畸形儿真相终揭晓

阚清子崩溃大哭48小时,猛料频传,畸形儿真相终揭晓

爱八卦的晓请
2026-04-07 22:46:59
2026-04-09 04:12:49
爱集微 incentive-icons
爱集微
集微网官方账号
109339文章数 98341关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

伊朗武装部队:伊朗对美以绝不信任

头条要闻

伊朗武装部队:伊朗对美以绝不信任

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

房产
游戏
本地
旅游
公开课

房产要闻

正式动工!珠城马场地块,签约华尔道夫!

真爱拉电线!《终末地》日本市场收入超中国:全球第一

本地新闻

跟着歌声游安徽,听古村回响

旅游要闻

三大花海已浪漫盛放!来这里“花”点时间!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版