10月14日消息,NVIDIA宣布全球迄今为止最小的AI 超级计算机 NVIDIA DGX Spark™ 正式交付。
作为新一代计算机,DGX Spark 以小巧的桌面机形态提供1 PFLOP AI 性能和128GB 统一内存,使开发者能够在本地运行最高2000亿参数的 AI 模型推理以及对700亿参数的模型进行微调。此外,开发者还可通过 DGX Spark 在本地创建 AI 智能体和运行高级软件堆栈。
NVIDIA 创始人兼首席执行官黄仁勋表示:“2016年,我们为了向 AI 研究者提供专属超级计算机而开发了 DGX-1。我曾亲手在一家名为 OpenAI 的小型初创公司将首台 DGX-1交给埃隆,由此诞生了 ChatGPT,点燃了 AI 变革的火种。DGX-1不仅开启了 AI 超级计算机时代,更揭示了驱动现代AI 发展的规模化法则。如今,DGX Spark 让我们重拾初心——把 AI 计算机交到每位开发者手中,以此引发下一轮技术突破。”
DGX Spark 将整个 NVIDIA AI 平台——包括 GPU、CPU、网络、CUDA® 库及 NVIDIA AI 软件堆栈——整合为一台可置于实验室或办公室的小型系统,该系统拥有加速代理式AI 与物理 AI 开发所需的强大性能。凭借空前的性能与NVIDIA 庞大的生态系统,DGX Spark 将台式机转变为 AI 开发平台。
DGX Spark 系统搭载 NVIDIA GB10 Grace Blackwell 超级芯片、NVIDIA ConnectX®-7 200Gb/s 网卡及 NVIDIA NVLink™-C2C 技术,可提供最高1 PFLOP 的 AI 性能。其带宽是第五代 PCIe 的5倍,并配备128GB CPU-GPU 一致性内存。
预装的 NVIDIA AI 软件堆栈让开发者能够开箱即用,立即投入 AI 项目开发。通过 DGX Spark,开发者可访问包括模型、库及 NVIDIA NIM 微服务在内的 NVIDIA AI 生态系统工具,建立本地工作流,例如定制 Black Forest Labs 的Flux.1模型优化图像生成、使用 NVIDIA Cosmos Reason 视觉语言模型创建视觉搜索与摘要智能体,或使用针对 DGX Spark 优化的 Qwen3开发 AI 聊天机器人等。
为庆祝 DGX Spark 全球交付,黄仁勋赴德克萨斯州星舰基地,亲手将首批 DGX Spark 之一交付给 SpaceX 首席工程师埃隆·马斯克。此次交接承载着对超级计算机起源的致敬——早在2016年,马斯克所在团队就曾从黄仁勋手中接收了首台 NVIDIA DGX™-1超级计算机。
其他首批收到 DGX Spark 的企业有 Anaconda、Cadence、ComfyUI、Docker、谷歌、 Hugging Face、JetBrains、LM Studio、Meta、微软、Ollama 和 Roboflow,他们正在针对DGX Spark 对各自工具、软件和模型进行测试、验证和优化。
纽约大学全球 AI 前沿实验室等全球研究机构已预先使用DGX Spark 加速其 AI 开发工作。(崔玉贤)
本文来自网易科技报道,更多资讯和深度内容,关注我们。