网易首页 > 网易号 > 正文 申请入驻

2600万参数模型跑通手机端工具调用,Gemini蒸馏版Needle开源

0
分享至

AI模型在手机上本地运行已经不算新鲜事,但能让它真正"动手做事"——比如调用日历查行程、控制智能家居——通常还得依赖云端大模型。Cactus Compute最近放出的Needle,直接把这套能力压缩进了2600万参数的轻量模型里,而且明确说是从Gemini身上"学"来的。

这个数字值得多看一眼。2600万参数是什么概念?现在主流的手机端模型动辄几十亿参数,Needle直接砍掉了两个数量级。开发者Henry Ndubuaku的说法很直接:团队不满于"低价智能手机也能跑的AI代理"几乎没人做,调研后发现AI代理的核心其实是工具调用,而大模型在这件事上性能过剩。


具体速度方面,Needle的预填充处理达到每秒6000 token,解码处理每秒1200 token。训练过程用了16台TPU v6e跑27小时做预训练,后续用Gemini生成的工具调用数据集微调,只花了45分钟。这种"大模型造数据、小模型执行任务"的路线,正在成为边缘AI的标配打法。


不过这里有个微妙的法律灰色地带。Needle的发布页面公开写明是从Gemini-3.1-Flash-Lite蒸馏而来,但Google的Gemini API附加条款明确禁止从Gemini进行提取或蒸馏行为。Cactus Compute选择MIT License开源,代码和模型权重都上了Hugging Face,这种"先斩后奏"的发布策略在AI圈并不罕见——毕竟等合规厘清,窗口期可能早就过了。

Cactus Compute本身也在做消费端产品。他们开发的Cactus Chat是一款让Android和iPhone本地运行AI模型聊天的免费应用,Needle的出现显然是为这类场景补上了关键拼图:能聊天的模型不少,能真正调用手机功能完成任务的却不多。Ndubuaku的野心也很清楚——让千元机用户也能用上AI代理,而不是被排斥在技术红利之外。

工具调用(Function Calling)正在成为端侧AI的必争之地。今年IBM开源的Granite 4.1系列主打prompt遵循和工具调用,Google自家的Gemma 3n也强调手机本地运行,甚至连专门操作手机界面的MAI-UI都冒了出来。Needle的差异化在于极致的轻量化和明确的开源定位,2600万参数意味着它甚至能在比智能手机更弱的设备上运行——智能手表?车载系统?想象空间被打开了。


技术实现上,Needle采用了简化版注意力网络架构。团队公开的文档显示,他们在注意力机制上做了针对性裁剪,牺牲通用能力换取工具调用的专精。这种"偏科"设计在资源受限场景下往往是更务实的选择——与其让模型什么都会一点但什么都做不好,不如把单一能力做透。

对于开发者来说,Needle的 immediate 价值在于降低了构建手机端AI代理的门槛。不需要调用云端API,不需要处理网络延迟,更不需要为用户数据隐私问题头疼。一个能在本地完成日程查询、应用跳转、基础设备控制的模型,足以支撑大量实用场景。Cactus Compute已经在GitHub放出了完整文档和示例,Hugging Face上的模型权重下载量正在爬升。

这场"模型瘦身"运动的终局尚不清晰。Google会不会对蒸馏行为采取动作?Needle在复杂工具链上的实际表现能否经得起考验?低价智能手机的硬件碎片化会不会带来新的适配噩梦?但至少现在,一个2600万参数的模型已经证明:工具调用这件事,或许真的不需要千亿参数才能做好。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
G5骑士117-113逆转活塞 球员评价:4人优秀,3人及格,2人低迷

G5骑士117-113逆转活塞 球员评价:4人优秀,3人及格,2人低迷

篮球资讯达人
2026-05-14 11:12:47
空军一号上,特朗普放下汉堡可乐,改吃牛肉面,旁边还有两个春卷

空军一号上,特朗普放下汉堡可乐,改吃牛肉面,旁边还有两个春卷

魔都姐姐杂谈
2026-05-14 08:17:51
特朗普访华,美国驻华大使馆的评论区亮了

特朗普访华,美国驻华大使馆的评论区亮了

历史总在押韵
2026-05-13 18:29:26
骑士加时逆转3-2活塞:哈登30+8+6比肩詹姆斯 坎宁安39+7+9

骑士加时逆转3-2活塞:哈登30+8+6比肩詹姆斯 坎宁安39+7+9

醉卧浮生
2026-05-14 11:07:28
摩洛哥幸福新娘事件升级!河南一男子刷到该视频,断然与对象退婚

摩洛哥幸福新娘事件升级!河南一男子刷到该视频,断然与对象退婚

火山詩话
2026-05-14 07:04:08
女子穿礼服退款后续:身份被扒已社死,工作被停职,商家准备起诉

女子穿礼服退款后续:身份被扒已社死,工作被停职,商家准备起诉

千言娱乐记
2026-05-13 12:18:49
坐标上海!被裁失业后的生活,引炸评论区,大家同为天涯沦落人…

坐标上海!被裁失业后的生活,引炸评论区,大家同为天涯沦落人…

慧翔百科
2026-05-13 11:30:11
美腿脱口秀女演员爆被人摸腿内幕再次激发民愤!反而都在骂她?

美腿脱口秀女演员爆被人摸腿内幕再次激发民愤!反而都在骂她?

魔都囡
2026-05-14 09:33:23
美职联射手榜:梅西“帽子”被吹,11球居次席;屈佩尔12球领跑

美职联射手榜:梅西“帽子”被吹,11球居次席;屈佩尔12球领跑

懂球帝
2026-05-14 11:37:07
重磅!国家正式出手!不生孩子的时代要结束了?

重磅!国家正式出手!不生孩子的时代要结束了?

一口娱乐
2026-05-13 18:11:47
NBA球队老板手撕华裔女猎手:100亿的仙人跳 搞砸了

NBA球队老板手撕华裔女猎手:100亿的仙人跳 搞砸了

慕容律师
2026-05-13 14:15:09
博主曝华为招人偏爱“苦大仇深 来自农村”,因为这种人没躺平的资本

博主曝华为招人偏爱“苦大仇深 来自农村”,因为这种人没躺平的资本

风向观察
2026-05-13 21:17:39
Auto Research最后一块拼图,Frontier-Eng Bench,工程闭环里最优

Auto Research最后一块拼图,Frontier-Eng Bench,工程闭环里最优

机器之心Pro
2026-05-12 12:14:39
美国车里,也就特斯拉还能在特朗普随行团中充个数

美国车里,也就特斯拉还能在特朗普随行团中充个数

虎嗅APP
2026-05-14 05:51:04
约0.01飞米!中国科学家重要发现,将改写教科书

约0.01飞米!中国科学家重要发现,将改写教科书

上观新闻
2026-05-14 06:48:04
U17亚洲杯大冷:越南3-2力压韩国夺头名!8强诞生,国足战东道主

U17亚洲杯大冷:越南3-2力压韩国夺头名!8强诞生,国足战东道主

侃球熊弟
2026-05-14 04:12:36
创历史首人耻辱纪录!坎宁安空砍39+7+9 季后赛12战狂送69失误

创历史首人耻辱纪录!坎宁安空砍39+7+9 季后赛12战狂送69失误

醉卧浮生
2026-05-14 11:21:08
广东宏远今日早报!老板全额发放奖金,外援全部离队,杜峰去向曝光,多名球队合同到期

广东宏远今日早报!老板全额发放奖金,外援全部离队,杜峰去向曝光,多名球队合同到期

凯丰侃球
2026-05-14 09:40:15
光轮智能与谷歌、英伟达共同定义物理AI仿真标准

光轮智能与谷歌、英伟达共同定义物理AI仿真标准

机器之心Pro
2026-05-12 20:21:07
太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

魔都姐姐杂谈
2026-05-13 22:44:16
2026-05-14 12:23:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿扰
2667文章数 13关注度
往期回顾 全部

科技要闻

马斯克:只有我和黄仁勋坐上了"空军一号"

头条要闻

媒体:特朗普开始访华 中方有一句话是说给全世界听的

头条要闻

媒体:特朗普开始访华 中方有一句话是说给全世界听的

体育要闻

哈登30+8+6创8纪录 第8次赢天王山

娱乐要闻

肖战提名金海燕奖,这一步走得太稳

财经要闻

片仔癀依旧困在“片仔癀”

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

艺术
家居
旅游
房产
健康

艺术要闻

充满光感的花卉油画 | 亚历山大·沙巴德伊

家居要闻

精神奢享 对话塔尖需求

旅游要闻

河北游客来德州旅游被感动 写下2000字感谢信 为一座城点赞

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

干细胞能让人“返老还童”吗

无障碍浏览 进入关怀版