英伟达DGX Spark支持四机集群：4PFlops算力+512GB内存，桌面级“AI工厂”重塑企业智能体部署新范式

2026-03-31

英伟达在GTC 2026全球开发者大会上正式宣布，其“桌面AI超算”DGX Spark的多机互联能力取得显著进展，从原本支持2台设备扩展至4台集群组网。通过ConnectX-7网卡与RoCE 200GbE交换机的低延迟通信，四台设备能够组成一个拥有4PFlops算力与512GB统一内存的紧凑型“桌面数据中心”，无需复杂的传统机架部署，即可实现近乎线性的性能提升。这一突破为企业本地构建自主AI智能体（Autonomous AI Agents）的开发平台提供了创新的解决方案。

DGX Spark四机集群的核心竞争力，首先体现在其卓越的性能扩展能力上。单台DGX Spark拥有1PFlops的AI计算能力和128GB的LPDDR5X统一内存，四台设备并行后，计算能力和内存同步倍增，能够支持高达7000亿参数的前沿大模型推理、处理通信密集型工作负载以及运营本地AI工厂。性能测试表明，在Isaac Lab强化学习任务中，单节点帧率为630FPS，双节点帧率翻倍至1241FPS，四节点则再次翻倍至2520FPS，且延迟基本保持不变；在Nanochat微调任务中，单节点每秒可输出1.84万个Token，四节点每秒可输出7.46万个Token，实现了4倍的线性加速，完全打破了传统机架式服务器“性能提升伴随复杂度激增”的局限。

拓扑结构的灵活适配，让集群可精准匹配不同应用场景。单节点适合低延迟、大上下文长度推理，可运行最高2000亿参数模型，满足本地智能体类工作负载需求；双节点实现均衡扩展，支持最高4000亿参数模型推理，加快微调速度；三节点采用环形拓扑，适配更大模型微调或小型训练任务；四节点搭配RoCE 200GbE交换机，可作为本地推理服务器，承载前沿大模型与AI工厂核心业务，覆盖从原型开发到生产部署的全流程。

软件生态的协同升级，进一步释放了硬件潜力。英伟达同步推出NVIDIA NemoClaw开源技术栈，DGX Spark可提供全栈平台，支持在本地构建、运行长期自主AI智能体，后续无缝扩展至AI工厂等数据中心。即将发布的软件更新将增强系统编排与管理能力，帮助企业实现更快迭代与从原型到生产的平滑过渡。同时，DGX Spark兼容NVIDIA Nemotron 3及各大领先开源模型，确保开发者基于现代化AI软件堆栈构建应用。

英伟达DGX Spark支持四机集群：4PFlops算力+512GB内存，桌面级“AI工厂”重塑企业智能体部署新范式

最新文章