网易首页 > 网易号 > 正文 申请入驻

阿里开源两款4B小模型:手机电脑都能用,比GPT-4.1-nano还强

0
分享至

智东西8月7日报道,今天上午,通义千问Qwen宣布推出两款更小尺寸的新模型:Qwen3-4B-Instruct-2507Qwen3-4B-Thinking-2507

其中,Qwen3-4B-Thinking-2507的推理能力可媲美中尺寸模型;Qwen3-4B-Instruct-2507在知识、推理、编程、对齐以及agent能力上全面超越了闭源的小尺寸模型GPT-4.1-nano。

此次发布的“2507”版本的Qwen3-4B模型对手机等端侧硬件部署较为友好,目前已在魔搭社区Hugging Face正式开源

▲已在Hugging Face开源(来源:Hugging Face)

魔搭社区:https://modelscope.cn/collections/Qwen3-9743180bdc6b48

Hugging Face:https://huggingface.co/Qwen

一、性能比肩中尺寸模型,agent能力超越GPT-4.1-nano

Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507的上下文理解能力都扩展到了256K,可处理长文本,能支持更复杂的文档分析、长篇内容生成以及跨段落推理等场景。

性能方面,Qwen3-4B-Thinking-2507在复杂问题推理能力、数学能力、代码能力以及多轮函数调用能力上的表现大幅领先Qwen3同尺寸小模型。在Arena-Hard v2基准测试上,Qwen3-4B-Instruct-2507取得43.4分的成绩,更胜一筹。

在非推理领域,Qwen3-4B-Instruct-2507在知识、推理、编程、对齐以及agengt能力上全面超越了闭源的小尺寸模型GPT-4.1-nano,且与中等规模的Qwen3-30B-A3B(non-thinking)性能接近

该模型覆盖了更多语言的长尾知识,在主观和开放性任务中与人类偏好的对齐性增强,能够提供更符合需求的答复。

在推理领域,Qwen3-4B-Thinking-2507表现突出,推理能力可媲美中等模型Qwen3-30B-Thinking。特别是在聚焦数学能力的AIME25测评中,以4B参数量取得了81.3分的成绩。

其通用能力也显著提升,Agent分数超越了更大尺寸的Qwen3-30B-Thinking模型。

结语:小尺寸模型加速AI端侧落地

通义千问此次推出的Qwen3-4B系列新模型,以更小的尺寸实现了性能上的优化,在通用能力上展现出超越同级别模型甚至逼近中大规模模型的实力,并且,小尺寸模型展现出了对端侧硬件的更高的友好度。

无论是腾讯、阿里还是OpenAI等AI老玩家,都开始推出小尺寸模型,并且在agent能力上下功夫。这在一定程度上反映出目前主流市场认为小型语言模型(SLM)对Agentic AI的发展具有重要价值。

这类高性能小模型的开源与普及,将有望加速AI技术在端侧设备的渗透,进而推动更多轻量化、场景化的智能应用落地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一将无能,累死三军!广东队球迷:杜锋快点下课吧

一将无能,累死三军!广东队球迷:杜锋快点下课吧

体育哲人
2026-04-28 21:49:54
瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

小莜读史
2026-04-28 07:14:32
穆里尼奥真要来了!曝弗洛伦蒂诺主导穆帅回归,皇马更衣室麻烦了

穆里尼奥真要来了!曝弗洛伦蒂诺主导穆帅回归,皇马更衣室麻烦了

夏侯看英超
2026-04-28 21:19:37
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
最高可判死刑!奥巴马结局已定?美国司法部介入,特朗普准备收网

最高可判死刑!奥巴马结局已定?美国司法部介入,特朗普准备收网

书纪文谭
2026-04-27 19:15:34
750万“电鸡”压城:深圳“史上最严”整治仍面临五大难题

750万“电鸡”压城:深圳“史上最严”整治仍面临五大难题

南方都市报
2026-04-28 07:00:37
《浪漫满屋》女星宣布怀孕「一次就中」:演艺圈最高龄产妇

《浪漫满屋》女星宣布怀孕「一次就中」:演艺圈最高龄产妇

ETtoday星光云
2026-04-28 13:24:15
台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

老头的传奇色彩
2026-04-27 12:52:27
出门7不捡!路上看到这7样东西,别往家里的带,不吉利!

出门7不捡!路上看到这7样东西,别往家里的带,不吉利!

Home范
2026-04-16 13:17:29
你还别说,陈建斌还挺有力气的,腰部力量还是很强的

你还别说,陈建斌还挺有力气的,腰部力量还是很强的

解说阿洎
2026-04-28 18:17:23
中央政治局会议稳定军心!两天内A股大盘将向上变盘!谁能领涨?

中央政治局会议稳定军心!两天内A股大盘将向上变盘!谁能领涨?

丁丁鲤史纪
2026-04-28 18:24:04
广东丢G1!杜锋直指进攻命中率太低却未提防守,徐杰也在谈效率!

广东丢G1!杜锋直指进攻命中率太低却未提防守,徐杰也在谈效率!

篮球资讯达人
2026-04-28 22:33:25
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
卖一辆赚2400万,连航母都能造的中国,为何还要高价进口消防车?

卖一辆赚2400万,连航母都能造的中国,为何还要高价进口消防车?

小兰聊历史
2026-04-28 00:43:20
TA独家:穆里尼奥有望二度皇马执教 老佛爷亲自主导回归计划

TA独家:穆里尼奥有望二度皇马执教 老佛爷亲自主导回归计划

雪狼侃体育
2026-04-28 22:35:59
英媒:曼城如果夺冠且115项指控罪名成立,冠军可能判给枪手

英媒:曼城如果夺冠且115项指控罪名成立,冠军可能判给枪手

懂球帝
2026-04-28 19:46:05
宇航员从太空回望地球,为何会害怕?他们到底看到了什么?

宇航员从太空回望地球,为何会害怕?他们到底看到了什么?

观察宇宙
2026-04-28 18:36:48
紧急通知!税务要求:立即上报名下全部银行账户,一户都不能漏!

紧急通知!税务要求:立即上报名下全部银行账户,一户都不能漏!

侃故事的阿庆
2026-04-28 08:53:20
DeepSeek升级,气到了黄仁勋

DeepSeek升级,气到了黄仁勋

金错刀
2026-04-27 15:18:59
张雪峰前女友开撕现女友!怒斥对方插足心机重:刚离世就要分股份

张雪峰前女友开撕现女友!怒斥对方插足心机重:刚离世就要分股份

萌神木木
2026-04-28 11:12:07
2026-04-28 23:15:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11710文章数 117049关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

媒体:台海军退役少校登乌鲁木齐舰 给出的结论很直接

头条要闻

媒体:台海军退役少校登乌鲁木齐舰 给出的结论很直接

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

教育
旅游
家居
数码
公开课

教育要闻

5月1日来环球中心,逛成都规模最大的升学咨询会!这份逛展攻略收好

旅游要闻

坐拥顶流文旅热度,深圳如何以盛会势能筑牢长期竞争力?

家居要闻

江景风格 流动的秩序

数码要闻

一加 Ace 6 至尊版发布:165帧大满贯 国补到手价2999元起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版