网易首页 > 网易号 > 正文 申请入驻

手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

0
分享至


智东西
作者 李水青
编辑 心缘

智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种设备端运行,性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。


▲Jamba Reasoning 3B开源截图

Hugging Face地址:
http://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B

A21称,Jamba Reasoning 3B基于其新的SSM-Transformer架构构建,上下文窗口长度为256K个token,能够处理高达1M token,与DeepSeek、谷歌、Llama和微软等竞争对手相比效率提升了2-5倍,在基准测试中取得领先成绩。


▲Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型

其将Jamba Reasoning 3B的优势总结为三点:

1、智能性能不下降:由于采用了混合SSM-Transformer架构,Jamba Reasoning 3B比纯Transformer模型更高效。

大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降,而Jamba Reasoning 3B能够处理更长的上下文长度,包括高达100万个token。这使得它在高级智能体系统或多模态应用中非常有用,因为长上下文理解对输出质量至关重要。


▲Jamba Reasoning 3B的性能虽上下文增长损耗小

2、领先的智能:Jamba Reasoning 3B的表现优于DeepSeek、谷歌、Meta和微软的其他设备端模型。

它在指令跟踪任务(IFBench)和常识性知识(MMLU-Pro和Humanity’s Last Exam)方面尤为出色,这使得Jamba Reasoning 3B成为一款高效且智能的模型,可用于高级智能体工作流程或设备端RAG应用。

这些成果源于训练后流程,A21将RLVR、SFT、DPO和GRPO等对齐训练技术与自主研发的专有方法相结合,以确保模型质量。


▲Jamba Reasoning 3B测评超阿里、谷歌等模型

3、专为设备安全使用而构建:此模型获得Apache 2.0许可,可直接下载到用户的计算机或手机上,并使用用户自己的文件在设备上进行定制,以实现完全安全的应用程序,即使断网它们也可以继续运行

Jamba Reasoning 3B的混合SSM-Transformer架构成功利用了比原始Transformer架构小8倍的键值缓存 (KV),即使在上下文增长的情况下也能保持较低的内存占用。

在M3 MacBook Pro上,它每秒可以生成40个token,上下文长度为32K,这一成绩优于Qwen3-4B、DeepSeek Distill Qwen 1.5B、Gemma 3-4B等模型,使其成为高级智能体应用程序中的精简组件。


▲在M3 MacBook Pro上每秒可以生成40个token

该模型目前支持的语言包括:英语、西班牙语、法语、葡萄牙语、意大利语、荷兰语、德语、阿拉伯语和希伯来语。

结语:轻量模型加速迭代,开辟智能体落地新路径

随着企业将AI融入运营,基于云端的大型语言模型暴露出经济效率低下的问题。A21援引研究报告称,40%-70%的AI任务可以通过小型语言模型处理,通过智能路由将成本降低10-30倍。

像Jamba Reasoning 3B这样的设备端轻量模型能够实现经济高效的异构计算分配,在本地处理简单任务,同时保留云端资源用于复杂推理。这为制造业和医疗保健领域的实时应用提供了低延迟,为远程操作提供了离线恢复能力,并增强了数据隐私保护,有望开启了一个去中心化的AI时代。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官方通报:区长冯强,酒驾、工作时间沉迷打高尔夫球

官方通报:区长冯强,酒驾、工作时间沉迷打高尔夫球

极目新闻
2025-11-02 15:48:39
马英九哽咽,韩国瑜拥抱,朱立伦服气,郑丽文的漂亮起手式

马英九哽咽,韩国瑜拥抱,朱立伦服气,郑丽文的漂亮起手式

探源历史
2025-11-01 17:30:39
27分大胜!火箭击退凯尔特人3连胜,杜兰特26分申京16+10+9

27分大胜!火箭击退凯尔特人3连胜,杜兰特26分申京16+10+9

湖人崛起
2025-11-02 10:18:53
用了30年的不粘不锈钢锅要复产了,预售价60元!

用了30年的不粘不锈钢锅要复产了,预售价60元!

恪守原则和底线
2025-11-01 05:10:03
我为什么不想写太子集团的陈志?

我为什么不想写太子集团的陈志?

伢伢复盘
2025-11-02 09:06:28
村民众筹30万元欲硬化通村路,10年间10人去世都未等来动工,街道办称尚在争取上级补助资金

村民众筹30万元欲硬化通村路,10年间10人去世都未等来动工,街道办称尚在争取上级补助资金

大风新闻
2025-11-02 10:04:07
“吉林一号”对台湾省进行全方位拍摄,是一件非常轻松的事情

“吉林一号”对台湾省进行全方位拍摄,是一件非常轻松的事情

吉刻新闻
2025-11-01 00:17:11
突发!石景山游乐园起火,官方通报——

突发!石景山游乐园起火,官方通报——

BRTV新闻
2025-11-02 17:50:18
申裕斌成韩乒历史首人!韩媒:第3次越过中国长城 两人4强创纪录

申裕斌成韩乒历史首人!韩媒:第3次越过中国长城 两人4强创纪录

颜小白的篮球梦
2025-11-02 06:53:23
长春亚泰提前降级!海牛逃出生天,再拿1分将保级,梅州一线生机

长春亚泰提前降级!海牛逃出生天,再拿1分将保级,梅州一线生机

奥拜尔
2025-11-02 17:22:59
广东人,又连任了一个外国总统?

广东人,又连任了一个外国总统?

陆弃
2025-11-02 09:00:03
把工业毒废土当营养土卖,人怎么可以这么坏?

把工业毒废土当营养土卖,人怎么可以这么坏?

历史总在押韵
2025-11-01 23:56:55
56岁大妈下单盲人按摩 “特殊服务”,竟称:“伸进按才管用”

56岁大妈下单盲人按摩 “特殊服务”,竟称:“伸进按才管用”

云端小院
2025-11-02 09:05:55
雷军“自杀式”公关,全网破防了!

雷军“自杀式”公关,全网破防了!

广告创意
2025-11-01 14:09:44
你听过最离谱的八卦是什么?网友:留着上夜班的时候慢慢看

你听过最离谱的八卦是什么?网友:留着上夜班的时候慢慢看

解读热点事件
2025-11-02 00:05:08
影星哈里斯·福特抨击特朗普:随心所欲赚得盆满钵满,世界却走向毁灭

影星哈里斯·福特抨击特朗普:随心所欲赚得盆满钵满,世界却走向毁灭

爆角追踪
2025-11-02 10:48:56
美国过一次万圣节,就要扔掉10亿磅南瓜垃圾!他们为何不吃南瓜?

美国过一次万圣节,就要扔掉10亿磅南瓜垃圾!他们为何不吃南瓜?

怪罗
2025-11-01 23:02:19
开拓者宣布!再见了,杨瀚森!NBA生涯第一次下放

开拓者宣布!再见了,杨瀚森!NBA生涯第一次下放

篮球实战宝典
2025-11-02 03:29:28
1962年,82岁的麦克阿瑟听闻印度对中国开战,一番评论十分犀利!

1962年,82岁的麦克阿瑟听闻印度对中国开战,一番评论十分犀利!

历史龙元阁
2025-11-01 17:00:07
确认开始!大批上海人收到官方短信!多区发布公告

确认开始!大批上海人收到官方短信!多区发布公告

极目新闻
2025-11-02 10:17:53
2025-11-02 18:32:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10684文章数 116892关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

"吉林一号":对台湾省进行全方位拍摄 是非常轻松的事

头条要闻

"吉林一号":对台湾省进行全方位拍摄 是非常轻松的事

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

健康
本地
手机
公开课
军事航空

核磁VS肌骨超声,谁更胜一筹?

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

手机要闻

同样开售三天,小米、vivo、荣耀、OPPO新旗舰销量对比

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版