NeuReality推出NR1芯片用于大规模AI推理|引擎|gpu|低功耗|人工智能|大语言模型

NeuReality推出NR1芯片用于大规模AI推理

2025-06-12 08:13:22　来源: Ai时代前沿

北京举报

分享至

NeuReality宣称其NR1芯片是第一个真正为推理编排而构建的AI-CPU（人工智能中央处理器）。它与任何GPU或AI加速器配对，可以将GPU的有效利用率提高到接近100%，而当今推理服务器中CPU/NIC架构的传统主机平均利用率为30-50%。

与AI加速器无关的NR1芯片取代了传统的CPU和NIC，这些CPU和NIC阻碍了AI工作负载。NR1处理能力是传统CPU和NIC的六倍，可以大规模驱动最大的GPU吞吐量和AI推理。

多年来，GPU不断发展以满足人工智能的需求，变得更快、更强大。但传统的CPU是专为互联网时代而非人工智能时代设计，这么多年基本保持不变。随着人工智能模型变得越来越复杂，多个人工智能查询的数量越来越多，这造成了越来越大的瓶颈。

与加速器无关的AI-CPU具有低功耗引擎，该引擎将基本的CPU功能与专用的媒体和数据处理器、硬件超视层以及全面的网络和连接IP相结合，可提供更好的性能、更低的能耗和业务投资回报率。事实上，使用在相同AI加速器上运行的相同GenAI模型，概念验证演示表明，与以x86 CPU为中心运行相同GPU的架构相比，NR1在相同的成本和功耗范围内实现了6.5倍的AI Token输出。

随着当前存储和计算资源分离的趋势，人工智能资源的分解使人工智能计算与更广泛的系统实现了简化的隔离。这种分离在数据中心和云工作流程中尤为重要。传统的以CPU为中心的软件操作平台在处理人工智能推理时面临着高成本、功耗和系统瓶颈等挑战。当今基础设施的复杂性和成本障碍往往阻碍了各种推理的完全实现和部署。

为了解决这些问题，NR1芯片巧妙地设计了全面的AI流水线卸载功能。其基于硬件的NR1 AI Hypervisor硬件IP负责数据路径处理和作业调度，包括预处理和后处理引擎、NR1 AI over Fabric网络引擎以及内置的管理和抽象控制器。其结果是重新定义了性价比和最低的运营成本，其特征是低功耗、最小延迟和线性可扩展性。为了实现DevOps和MLOps，NR1附带了完整的软件开发工具包（SDK）和基于K8s的服务层，以便于使用和部署。

主要目标市场

金融与保险

医疗保健和制药

政府与教育

电信

零售和电子商务

现在开启你的人工智能探奇之旅：

NVIDIA DLI 与Ai时代前沿合作，将大门向更多普通用户敞开！无论你是对新技术充满好奇心的爱好者，还是希望提升自己技能的职场人士，这里都有适合你的课程和资源。多门初级课程限时免费！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.