
引言最新研究表明,人工智能行业正在快速发展,更多人可以使用本地设备运行更小巧、更强大的模型来解答他们的大部分问题。IBM 最新的 Granite 模型完全能够胜任这项任务。
![]()
摄影界有句谚语:最好的相机就是你随身携带的那一台。对于过去二十年来的计算机革命而言,这句话同样适用。我们手中的笔记本电脑和手机通常比功能强大的云集群更容易使用,而且往往足以完成我们需要的任务。人工智能领域也正迅速印证这一点。
大型语言模型在过去几年中发展迅猛,但通常也因此体积庞大。目前最庞大的前沿模型需要数百GB的存储空间,正常运行则需要更多内存。即使是性能强劲的现代笔记本电脑,在本地运行这些庞大的语言模型也并非易事,而向云端调用资源往往需要用户长时间等待才能获得响应。
但最新研究表明,对于普通用户每天的大部分查询而言,规模小得多的语言模型 (LLM) 就能充分满足需求。IBM 研究院在其自身的模型开发策略中也看到了这一点的价值。该团队近期推出了Granite 4.0 Nano,这是他们迄今为止最小的语言模型集,专为在手机、笔记本电脑和平板电脑等边缘设备上运行而设计。
斯坦福大学颇具影响力的计算机科学研究实验室Hazy Research 预测,人工智能行业即将迎来变革。在今天发布的一篇博文中,他们指出,我们目前正处于“单体数据中心和前沿模型处理大部分推理流量”的时代。全球基础设施提供商和超大规模数据中心运营商都在争相满足现代人工智能模型对强大功能和计算能力的需求。Hazy 的研究表明,这种情况可能很快就会改变,世界正处于人工智能新时代的开端,届时,更小的模型和更强大的本地硬件或许足以彻底改变未来人工智能的使用方式。
斯坦福大学团队的研究发现,目前最好的本地语言模型能够准确响应“88.7%的日常单轮自然对话和推理查询”。反过来,通过将查询保留在像MacBook Pro这样常见的设备上,无需路由到外部服务器,可以大幅降低能耗。他们认为,人工智能行业在评估性能时应该开始考虑这些能耗成本。他们提出了一种名为“每瓦智能”的新指标。他们还发布了TrafficBench,这是一个以能效为导向的全新基准测试工具,用于比较不同模型和加速器的性能。
Hazy团队发现,本地加速器和云加速器之间的差距正在缩小。但随着苹果的Apple M4 MAX和英伟达的DGX Spark等新型本地设备硬件的出现,这一差距正在迅速缩小,“配备128GB统一内存的消费级笔记本电脑可以运行接近2000亿参数的模型”。
随着最先进的本地语言模型的出现,情况变得更加清晰。他们对 OpenAI 的 gpt-oss、Qwen 的 Qwen3 和 IBM 的 Granite 4.0 进行的测试表明,它们的每瓦智能效率远高于运行在专用硬件上的老一代本地模型。斯坦福大学的研究团队预测,在硬件和模型架构、训练和蒸馏方法的进一步改进推动下,本地智能效率每年将翻一番到两番。
斯坦福大学的研究团队测试了四款 Granite 模型,包括Granite-4.0-H-Micro、Granite-4.0 -H-Tiny和Granite-4.0-H-Small。Granite 4.0 是 IBM 推出的一系列开放、可信的小型模型,最近被誉为“西方的 Qwen ”。这些模型速度快、灵活性高,能够在边缘端以极低的内存需求运行,同时也能够大规模运行。这些模型在设计之初就充分考虑了企业级应用的需求,采用透明的数据源,并完成了通过ISO 42001 认证的构建流程,权重也经过了加密签名。
IBM 的模型系列以对企业友好的 Apache 2.0 许可证发布,最新的 Granite 4.0 Nano 在 Hugging Face 上很受欢迎,并且在通用知识、数学、代码和安全等基准测试中,其性能优于 Qwen、Liquid AI 和 Google 的类似规模的模型。
未来,我们与模型交互的方式将不断演变。但在许多情况下,无需连接远程服务器即可获得满意结果的小型本地模型,在空间受限的场所(例如可穿戴设备)或互联网接入不稳定的地方,将更具价值。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
设为星标 避免错过
虚拟世界没有旁观者,每个点赞都是创造历史的像素
关注我,一起探索AWM⁺
2025-11-03
2025-10-31
2025-10-30
商业赞助
![]()
点击下方 “目录” 阅读更多
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.