网易首页 > 网易号 > 正文 申请入驻

小模型,也是嵌入式的未来

0
分享至

这两天,英伟达一个最新研究结论让业界备受关注——小型语言模型(SLM)才是智能体的未来。紧接着,英伟达又抛出了自己的全新小型语言模型:Nemotron-Nano-9B-V2,该模型在部分基准测试中达到了同类产品中的最高性能。

事实上,小型语言模型(SLM)的风,也刮到了MCU和MPU领域。

小模型,就是“压小”的大模型

小型语言模型(SLM)也许我们早有所接触。SLM 的参数范围从几百万到几十亿不等,而 LLM 则具有数千亿甚至数万亿参数。

SLM是由LLM压缩而来,压缩模型需要在缩小模型的同时,尽可能保留模型的准确性。常见方法如下:

  • 知识蒸馏:利用从大型“教师”模型转移的知识来训练一个较小的“学生”模型;

  • 剪枝:移除神经网络架构中冗余或不那么重要的参数;

  • 量化:降低计算中使用的数值精度(例如,将浮点数转换为整数)。

小型语言模型比大型模型更紧凑、更高效。因此,SLM需要较少的内存和计算能力,非常适合资源受限的边缘或者嵌入式设备。

许多小而强大的语言模型已经出现,证明大小并非一切。常见的10亿到40亿的SLM包括Llama3.2-1B(Meta开发的10亿参数变体)、Qwen2.5-1.5B(阿里巴巴的15亿参数模型)、DeepSeeek-R1-1.5B(DeepSeek的15亿参数模型)、SmolLM2-1.7B(HuggingFaceTB,的17亿参数模型)、Phi-3.5-Mini-3.8B(微软的38亿参数模型)、Gemma3-4B(Google DeepMind的40亿参数模型)。

跑SLM,靠得不光是算力

对MPU来说,跑SLM,似乎不是什么难题。但对开发人员来说,如何知道MCU支持是否支持运行生成式AI?

这个问题没有单一、直接的答案——不过有一个硬性要求,即MCU的神经处理单元(NPU)必须能够加速Transformer运行。

除此之外,跑生成式AI,对于MCU的带宽系统总线以及以及大容量、高速、紧密耦合的内存配置有要求。

其实,现在很多人都去只用GOPS(十亿次运算每秒)或TOPS(万亿次运算每秒)来比较微控制器的原始吞吐量,目前性能最佳的MCU能提供高达250GOPS的算力,而用于生成式AI的MCU将至少提供两倍于此的性能。但原始吞吐量并非衡量实际系统性能的理想指标。

因为成功的生成式AI应用程序需要支持Transformer运算,会在系统内部、内存、神经处理单元、中央处理器以及图像信号处理器等外围功能之间传输大量数据。因此,一个具有高原始吞吐量的系统理论上或许能快速处理大量数据,但如果系统无法将数据快速传输给神经处理单元,实际性能就会十分缓慢,令人失望。

当然,对MPU来说,大带宽、内存、总线之间的紧密耦合也至关重要。

Aizip与Renesas合作的SLM项目

早在去年8月,Aizip就与Renesas携手合作,在MPU上展示了用于边缘系统应用的超高效SLM和紧凑型AI Agents,这些小巧而高效的模型已经集成到基于 Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。

Aizip创建了一系列超高效的小型语言模型(SLM)和人工智能代理(AI Agents),名为 Gizmo,规模从3亿到20亿个参数不等。这些型号支持多种平台,包括适用于广泛应用的 MPU和应用处理器。

SLM使设备边缘应用程序上的AI代理能够提供与大型语言模型(LLM)相同的功能,但在边缘占用空间上。设备上模型具有增强的隐私保护、弹性作和节省成本等优势。虽然一些公司已经成功地减小了手机语言模型的大小,但确保在低成本边缘设备上为自动化应用提供准确的工具调用仍然是这些 SLM 面临的重大挑战。

据介绍,在运行频率为1.2 GHz的单个A55内核的RZ/G2L上,这些SLM可以实现不到3秒的响应时间。

MCU,也在加大对SLM投入

Alif Semiconductor最近发布了最新系列的MCU和融合处理器——Ensemble E4、E6和E8,便主要针对支持SLM在内的生成式AI模型的运行。与此同时,Alif是首家使用 Arm Ethos-U85 NPU(神经处理单元)的芯片供应商,该芯片支持基于Transformer的机器学习网络。

根据基准测试结果显示,该系列在不到2毫秒的时间内进行高能效物体检测、图像分类时间不到8毫秒、在E4设备上执行的SLM在生成文本以根据用户提供的提示构建故事时仅消耗36mW的功率。

Ensemble E4(MCU)采用双Arm Cortex-M55内核,Ensemble E6和E8融合处理器分别基于Arm Cortex-A32内核和双Cortex-M55内核,值得注意的是E4/E6/E8均搭载双Ethos-U55+Ethos-U85,算力非常强大。


Alif认为,相比其他制造商,他们布局更早,因为第一代Ensemble MCU系列早在2021年就发布了,从那时起我们就一直在批量出货E1、E3、E5 和 E7设备。而在其他MCU厂商还停留在第一代AI MCU时,Alif就发布了第二代产品,同时是业界首款支持基于Transformer的网络的MCU,是LLM和其他生成式AI模型的基础。

SLM会是嵌入式的未来

SLM在大幅压缩模型体积的同时,尽可能保留了模型的准确性。这种高效、紧凑的特性,使其完美契合了资源受限的边缘和嵌入式设备,为这些设备带来了前所未有的智能能力。

事实上,边缘AI的未来图景正在徐徐展开,SLM也会是MCU和MPU厂商会布局的关键领域之一。

比如,意法半导体的STM32N6、英飞凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都开始重视NPU。

嵌入式AI最初主要是在Linux系统上运行的相对昂贵的基于微处理器的产品的一项功能。但很快,市场意识到边缘和端点设备中也有AI的空间——其中许多设备都是基于MCU。所以,在2025年下半年,先进的MCU厂商都将提供AI功能的产品纳入其产品组合中。这些厂商的NPU分为Arm Ethos IP一派和自研一派。目前来看,最新的Ethos-U85开始支持Transformer,并且在半年前展示了搭载SLM的效果,其他厂商也在不断跟进。在未来,相信SLM也会彻底改变MCU和MPU的格局。

参考文献

[1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models

[2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model

[3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/

[4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/

[5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

欢迎将我们设为“星标”,这样才能第一时间收到推送消息。

关注EEWorld旗下订阅号:“机器人开发圈”

回复“DS”领取《DeepSeek:从入门到精通》完整版

扫码添加小助手回复“机器人”

进群和电子工程师们面对面交流经验


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
盘中突然闪崩,两个交易日暴跌95%,这只中概股发生了什么?

盘中突然闪崩,两个交易日暴跌95%,这只中概股发生了什么?

财经智多星
2026-02-19 13:50:31
汪小菲家的小杨阿姨晒出自家大阳台,新房装修精致,气派,引热议

汪小菲家的小杨阿姨晒出自家大阳台,新房装修精致,气派,引热议

魔都姐姐杂谈
2026-02-19 13:01:53
相亲一听到什么就不想再接触了?

相亲一听到什么就不想再接触了?

另子维爱读史
2026-02-12 19:54:52
空心化困局:顺帝时代的晚期蒙元军队

空心化困局:顺帝时代的晚期蒙元军队

冷炮历史
2026-02-18 15:28:09
人人人人人!今天无锡提前爆满!

人人人人人!今天无锡提前爆满!

江南晚报
2026-02-19 12:00:57
刚和王毅握手,鲁比奥再表态:完全支持中方,高市早苗失算了

刚和王毅握手,鲁比奥再表态:完全支持中方,高市早苗失算了

阿讯说天下
2026-02-18 22:39:05
特斯拉,把方向盘拆了

特斯拉,把方向盘拆了

放毒
2026-02-19 14:45:23
3天狂轰13.8亿,《飞驰人生3》强势夺冠,沈腾把吴京打懵了

3天狂轰13.8亿,《飞驰人生3》强势夺冠,沈腾把吴京打懵了

八卦南风
2026-02-19 16:47:06
被两代总经理坑麻了!2年前还杀进总决赛,现在直接摆烂,再换GM

被两代总经理坑麻了!2年前还杀进总决赛,现在直接摆烂,再换GM

你的篮球频道
2026-02-19 10:17:14
卢比奥没能打动欧盟,欧盟:我们很好,很多人想加入

卢比奥没能打动欧盟,欧盟:我们很好,很多人想加入

移光幻影
2026-02-19 12:51:15
赵一荻独子回国扫墓,跪在张作霖墓前大哭:我代表您儿子来看您了

赵一荻独子回国扫墓,跪在张作霖墓前大哭:我代表您儿子来看您了

阿校谈史
2026-02-19 15:22:05
没想到,美国和伊朗还没撕破脸,特朗普就和以色列先吵了起来

没想到,美国和伊朗还没撕破脸,特朗普就和以色列先吵了起来

沧海旅行家
2026-02-19 16:49:09
61岁大爷每天吃西洋参,坚持1年没间断,体检结果连医生都羡慕

61岁大爷每天吃西洋参,坚持1年没间断,体检结果连医生都羡慕

吃青菜长高
2026-02-14 08:26:54
林峯老婆晒娃却被骂上热搜,网友:给孩子穿这个,良心不会痛吗?

林峯老婆晒娃却被骂上热搜,网友:给孩子穿这个,良心不会痛吗?

情感大头说说
2026-02-18 22:35:36
如果通货紧缩治不好,整整一代人将会团灭

如果通货紧缩治不好,整整一代人将会团灭

世界灵敏度赵灵敏
2026-02-11 18:59:42
儿子听闻传言“家产分给女儿”,一怒之下找全家理论,母亲:他上来打我两个巴掌……

儿子听闻传言“家产分给女儿”,一怒之下找全家理论,母亲:他上来打我两个巴掌……

台州交通广播
2026-02-13 23:22:17
法布雷加斯:我的行为不符合体育道德,我要为此道歉并永远不再做

法布雷加斯:我的行为不符合体育道德,我要为此道歉并永远不再做

天光破云来
2026-02-19 08:38:06
你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

带你感受人间冷暖
2026-01-29 00:10:05
选择除夕动手!美特种部队再次扣押中国油轮!背后有三大险恶用心

选择除夕动手!美特种部队再次扣押中国油轮!背后有三大险恶用心

荷兰豆爱健康
2026-02-17 19:26:54
身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

青眼财经
2026-02-11 19:36:31
2026-02-19 17:23:00
EEWorld电子工程世界 incentive-icons
EEWorld电子工程世界
即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
238文章数 20关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

尹锡悦被判无期徒刑 金建希在内乱后骂"因为你全毁了"

头条要闻

尹锡悦被判无期徒刑 金建希在内乱后骂"因为你全毁了"

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

时尚
游戏
数码
本地
手机

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

荒野大镖客3爆料汇总!稳步进行还在为PS6做准备?

数码要闻

内存价格崩了 国内最高降价20%:去华强北市场揭秘实情!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

vivo V70 FE手机渲染图曝光:2亿主摄、7000mAh电池

无障碍浏览 进入关怀版