网易首页 > 网易号 > 正文 申请入驻

IBM发布小型开源Granite 4模型,专为移动设备和浏览器设计

0
分享至


IBM公司今日宣布发布Granite 4 Nano,这是一系列专为边缘计算、设备端或浏览器运行而设计的超小型生成式人工智能模型。

该公司表示,这些模型在体积方面展现出极高的性能,代表了公司迄今为止最小的模型。

Granite 4.0 Nano系列包括四个指令模型及其对应的基础模型,参数量从15亿到3.5亿不等。参数是大语言模型在训练过程中学习的内部数值,用于理解用户文本查询的上下文并生成答案。

更大的大语言模型需要更多的计算能力和能源,导致运营成本增加。它们还需要专门的硬件,如强大的图形处理单元和大量的机器内存。而微型大语言模型所需的计算和内存要少得多,这意味着它们可以在消费级硬件上运行,如笔记本电脑、个人电脑和移动设备。

代价是准确性和上下文知识的降低,这些被从模型中精简以减小其尺寸。但通过先进的压缩技术,可以将大量知识和能力打包到更小的尺寸中。

极小型大语言模型增强了隐私和安全性,提供离线推理访问,并允许完全控制和定制。通过避免向云服务器传输敏感数据,本地大语言模型还具有成本效益,因为它们不会产生云费用。

这些模型包括Granite 4.0 H 1B和350M,即15亿和3.5亿参数模型,具有该模型系列的混合架构,以及两个替代的传统基于Transformer的版本,旨在兼容混合工作负载可能没有优化支持的情况。

Granite 4模型采用IBM开发的专门架构,将附加算法与驱动大多数大语言模型的Transformer设计相结合。Transformer使用注意力算法,通过关注输入的最重要部分来理解和生成文本。IBM将Transformer与基于Mamba神经网络架构的处理组件混合,该架构比传统Transformer更具硬件效率。

在次十亿到接近十亿参数模型设计市场中存在激烈竞争,开发者专注于性能和能力。竞争对手包括阿里巴巴集团的Qwen模型、Liquid AI公司的liquid foundation模型和谷歌设计的Gemma模型。

IBM表示,Granite Nano模型在通用知识、数学、编程和安全等各种基准测试中表现优于几个类似规模的模型。此外,Nano模型在智能体工作流程方面表现优于竞争对手,包括在IFEval(指令跟随评估)和伯克利函数调用排行榜v3中的指令跟随和工具调用。

Granite 4.0 H 1B在IFEval准确性方面达到最高分78.5,而Quen3 1.7B为73.1,Gemma 3 1B得分59.3。在工具调用方面,同一模型在伯克利排行榜上获得54.8分,而Quen3为52.2,Gemma 3为16.3。

IBM在高度宽松的开源Apache 2.0许可证下发布了所有Granite 4 Nano模型。该许可证允许广泛的商业使用,并包括对研究的特殊考虑。

Q&A

Q1:Granite 4 Nano模型有什么特点?

A:Granite 4 Nano是IBM发布的超小型生成式AI模型系列,专为边缘计算、设备端或浏览器运行而设计。该系列包括四个指令模型及其基础模型,参数量从15亿到3.5亿不等,具有极高的性能表现。

Q2:小型大语言模型相比大型模型有什么优势?

A:小型大语言模型需要的计算和内存更少,可以在消费级硬件上运行,如笔记本电脑和移动设备。它们增强隐私和安全性,提供离线推理访问,允许完全控制和定制,还能避免云费用,具有成本效益。

Q3:Granite 4模型在性能测试中表现如何?

A:Granite 4.0 H 1B在IFEval准确性测试中达到78.5分,超过Quen3 1.7B的73.1分和Gemma 3 1B的59.3分。在工具调用测试中获得54.8分,也优于Quen3的52.2分和Gemma 3的16.3分。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
福建舰入列,意味着世界海军格局怎样大变?

福建舰入列,意味着世界海军格局怎样大变?

新民周刊
2025-11-08 09:22:57
张家界荒野求生挑战赛只剩17人,有人猜测“选手提前埋食物”,赛事方:不可能,场地严格保密

张家界荒野求生挑战赛只剩17人,有人猜测“选手提前埋食物”,赛事方:不可能,场地严格保密

极目新闻
2025-11-07 21:32:42
中国国民党主席郑丽文确认将祭拜吴石将军

中国国民党主席郑丽文确认将祭拜吴石将军

看看新闻Knews
2025-11-08 08:40:03
妥妥的专家!曾琦每次都是主持核心,两张图看出她在医院里的地位

妥妥的专家!曾琦每次都是主持核心,两张图看出她在医院里的地位

火山诗话
2025-11-08 11:14:13
空乘穿毛衣上班被吐槽“很土”,山东航空回应

空乘穿毛衣上班被吐槽“很土”,山东航空回应

大风新闻
2025-11-08 14:47:09
经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

火山诗话
2025-11-07 13:42:14
太倒霉!女子异地交15年社保,临退休被告知不能当地退,网友炸锅

太倒霉!女子异地交15年社保,临退休被告知不能当地退,网友炸锅

爱写的樱桃
2025-11-06 23:19:21
银行不能再层层加码了

银行不能再层层加码了

阿亮评论
2025-11-07 11:16:19
男子将热水器钢管通电致妻子洗澡时触电身亡 ,14岁女儿致信法院为父求情 终被判无期,判决书体现“司法温度”

男子将热水器钢管通电致妻子洗澡时触电身亡 ,14岁女儿致信法院为父求情 终被判无期,判决书体现“司法温度”

红星新闻
2025-11-08 13:45:22
阳性率上升!除了流感,这种病毒也开始高发,鼻塞、流鼻涕、咳嗽……目前尚无特效药

阳性率上升!除了流感,这种病毒也开始高发,鼻塞、流鼻涕、咳嗽……目前尚无特效药

都市快报橙柿互动
2025-11-08 08:11:17
人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

公子麦少
2025-11-07 14:36:16
特朗普愤怒不已,一连串麻烦都来了

特朗普愤怒不已,一连串麻烦都来了

山河路口
2025-11-07 12:42:45
俄重兵突击,乌拼死抵抗,波克罗夫斯克再现血肉磨坊

俄重兵突击,乌拼死抵抗,波克罗夫斯克再现血肉磨坊

史政先锋
2025-11-07 15:54:33
雷军如今面临的最大难题,不是400亿的亏损

雷军如今面临的最大难题,不是400亿的亏损

诗意世界
2025-11-07 18:13:47
两未成年人致7月龄婴儿死亡,因不满12岁未立案 监护人被判赔90万,只履行完10万

两未成年人致7月龄婴儿死亡,因不满12岁未立案 监护人被判赔90万,只履行完10万

红星新闻
2025-11-07 20:58:12
“眼科女王”曾琦,多张漂亮优雅照片曝光,未来3大困境等着她

“眼科女王”曾琦,多张漂亮优雅照片曝光,未来3大困境等着她

小娱乐悠悠
2025-11-08 11:07:31
器官捐献宣传走进小学,家长情绪崩溃,网友晒的名单触目惊心

器官捐献宣传走进小学,家长情绪崩溃,网友晒的名单触目惊心

知晓科普
2025-11-06 16:58:25
副院长祖雄兵被停职!他口中所谓的“纯洁婚外恋”,是自欺欺人

副院长祖雄兵被停职!他口中所谓的“纯洁婚外恋”,是自欺欺人

鋭娱之乐
2025-11-07 12:47:00
杨瀚森自信一幕!进半场神奇三分为自己竖起大拇指 用英文说完美

杨瀚森自信一幕!进半场神奇三分为自己竖起大拇指 用英文说完美

罗说NBA
2025-11-08 10:30:21
升东部第一!活塞大胜篮网豪取5连胜 坎宁安连3场30+杜伦30+11

升东部第一!活塞大胜篮网豪取5连胜 坎宁安连3场30+杜伦30+11

醉卧浮生
2025-11-08 12:24:34
2025-11-08 15:43:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
14603文章数 49673关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

加拿大总理:加美经济关系已结束

头条要闻

加拿大总理:加美经济关系已结束

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

梁婷为辛芷蕾发声:没什么可质疑的

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

健康
艺术
手机
公开课
军事航空

超声探头会加重受伤情况吗?

艺术要闻

主席的这句名言,竟然背后隐藏惊人秘密!

手机要闻

三星 Galaxy S27 Ultra 手机人脸识别前瞻,180 毫秒极速解锁

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

福建舰更多细节公布 一组动图全方位看清楚

无障碍浏览 进入关怀版