网易首页 > 网易号 > 正文 申请入驻

5款小模型搞定工具调用:不用数据中心也能跑

0
分享至

大模型能干的活,小模型现在也能干了——而且是在你的笔记本上。

工具调用是Agent系统的核心能力:选准函数、填对参数、把结果串进多步流程。GPT-4、Claude这些 frontier 模型确实擅长,但成本、延迟和硬件门槛让很多企业望而却步。好消息是,一批开源小模型已经追上来了。它们参数紧凑、权重开放,工具调用却是第一梯队水平。


下面这5款模型,全部支持结构化工具调用,Hugging Face 可直接下载。

1. SmolLM3-3B
发布于2025年7月8日,Hugging Face 自家出品。30亿参数,解码器架构,用了分组查询注意力(GQA)和无位置编码(NoPE)。预训练数据11.2T token,涵盖网页、代码、数学和推理,中间还插了1400亿token的推理专项训练。对齐阶段用的是 Hugging Face 自研的 Anchored Preference Optimization(APO)。

工具调用接口给了两套:xml_tools 走 JSON/XML 格式,python_tools 走 Python 函数风格。RAG 系统、边缘设备、低显存机器都能跑,权重、数据集、训练代码全开源。

2. Qwen3-4B-Instruct-2507
阿里通义千问团队8月6日更新的版本。40亿总参数(嵌入层占3.6B),36层 transformer,GQA 配置为32个查询头配8个键值头。这个"非思考模式" variant 针对快反场景优化——直接给答案,不输出思维链。

相比基础版,指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用都有显著提升,多语言长尾知识覆盖也加强了。

3. Llama-3.2-3B-Instruct
Meta 2024年9月发布,Llama 3.2 系列里的轻量款。30亿参数,专为边缘设备和移动端优化,工具调用通过内置的 "tools" 角色和结构化 JSON 格式实现。

训练数据截至2023年12月,上下文窗口12.8万 token。虽然体积只有大模型的零头,但函数调用精度足够支撑多步 Agent 流程,本地部署和 API 微调都很成熟。

4. Phi-4-mini-instruct
微软2025年2月推出,38亿参数。训练数据里合成数据占比极高——网页和代码质量过滤后,用多轮提示链生成教科书级合成数据,数学和编程还专门做了针对性合成。

工具调用走标准的聊天补全接口,function calling 格式与 OpenAI 兼容。亮点是 STEM 任务表现:数学竞赛和代码生成经常越级打怪,比肩参数大几倍的模型。

5. Gemma-3-4B-IT
谷歌2025年3月发布,40亿参数,Gemma 3 系列的指令微调版。支持140多种语言,上下文窗口12.8万 token,视觉编码器让它能同时处理图文。

工具调用通过 "tools" 字段实现,JSON 格式输出函数名和参数。谷歌放出了从预训练到后训练的全流程技术报告,复现门槛相对较低。

选哪一款?显存卡死选 SmolLM3-3B 或 Llama-3.2-3B,要中文能力优先 Qwen3,STEM 任务看 Phi-4-mini,多模态需求考虑 Gemma-3。它们共同的底线是:不用租 A100,单卡甚至 CPU 就能让 Agent 跑起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

坠入二次元的海洋
2026-05-14 18:04:37
父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

另子维爱读史
2026-05-14 20:24:27
上海楼市爆了!

上海楼市爆了!

地产观点
2026-05-14 18:00:07
俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

极目新闻
2026-05-14 09:58:58
成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

靠谱电影君
2026-05-14 18:02:24
入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

搜史君
2026-05-08 13:00:16
美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

澎湃新闻
2026-05-14 21:07:15
醒醒吧中国导演!看完《给阿嬷的情书》,才知资方是影视搅屎棍

醒醒吧中国导演!看完《给阿嬷的情书》,才知资方是影视搅屎棍

秋姐居
2026-05-12 19:26:44
南京一市民在湖边晨练时,发现湖面上有条一米多长的大蛇:这边看到这么大的蛇确实不多见;网友调侃:“白素贞”也出来晨练

南京一市民在湖边晨练时,发现湖面上有条一米多长的大蛇:这边看到这么大的蛇确实不多见;网友调侃:“白素贞”也出来晨练

台州交通广播
2026-05-14 15:50:46
上海乒羽主任:樊振东是国乒独一无二的领军人物 比王楚钦高出一块

上海乒羽主任:樊振东是国乒独一无二的领军人物 比王楚钦高出一块

818体育
2026-05-14 23:56:01
刘和平:蹲过2年大牢却混成副书记,还被百姓称为“青天大老爷”

刘和平:蹲过2年大牢却混成副书记,还被百姓称为“青天大老爷”

云霄纪史观
2026-05-14 17:59:05
三个月交易超7亿美元?特朗普“炒股账本”曝光,硅谷和华尔街巨头一个不少

三个月交易超7亿美元?特朗普“炒股账本”曝光,硅谷和华尔街巨头一个不少

华尔街见闻官方
2026-05-15 05:44:51
从未来可期到万年不红,被卖还数钱的陈瑶,才是娱乐圈一股清流

从未来可期到万年不红,被卖还数钱的陈瑶,才是娱乐圈一股清流

好贤观史记
2026-05-13 14:50:58
5月16日午后开始,连续6天!北京开启多雨模式

5月16日午后开始,连续6天!北京开启多雨模式

新浪财经
2026-05-15 00:25:49
黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

泡泡网
2026-05-14 17:50:15
刚向191国发出通知,大陆转头放行台当局,郑丽文公开力挺一中

刚向191国发出通知,大陆转头放行台当局,郑丽文公开力挺一中

千羽解读
2026-05-14 10:17:47
原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

原来老一辈才是最敢买的!网友:一旦有了条件就开始放飞自我!

夜深爱杂谈
2026-05-14 20:28:51
枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

影孖看世界
2026-05-14 23:06:05
暴涨95%!“最大芯片”公司成功上市!英伟达要当心了

暴涨95%!“最大芯片”公司成功上市!英伟达要当心了

EETOP半导体社区
2026-05-15 07:32:03
特朗普访华代表团集体使用一次性手机,禁止连接中国公共WiFi

特朗普访华代表团集体使用一次性手机,禁止连接中国公共WiFi

桂系007
2026-05-15 00:05:27
2026-05-15 09:07:00
碳基打工人
碳基打工人
坐标北京,靠咖啡续命,靠小红书下饭的普通人类。
2792文章数 36关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
亲子
艺术
本地
公开课

教育要闻

“体育+数学”“体育+美育”“体育+劳动”……这位老师的体育跨学科教学,有趣又有益!

亲子要闻

“67岁自然怀孕”的天赐妈妈,现状曝光:7年前的预言,正在应验

艺术要闻

花园里,花丛中

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版