风尚咨询

英伟达DGX Spark支持四机集群:4PFlops算力+512GB内存,桌面级“AI工厂”重塑企业智能体部署新范式

2026-03-31
英伟达在GTC 2026全球开发者大会上正式宣布,其“桌面AI超算”DGX Spark的多机互联能力取得显著进展,从原本支持2台设备扩展至4台集群组网。通过ConnectX-7网卡与RoCE 200GbE交换机的低延迟通信,四台设备能够组成一个拥有4PFlops算力与512GB统一内存的紧凑型“桌面数据中心”,无需复杂的传统机架部署,即可实现近乎线性的性能提升。这一突破为企业本地构建自主AI智能体(Autonomous AI Agents)的开发平台提供了创新的解决方案。
DGX Spark四机集群的核心竞争力,首先体现在其卓越的性能扩展能力上。单台DGX Spark拥有1PFlops的AI计算能力和128GB的LPDDR5X统一内存,四台设备并行后,计算能力和内存同步倍增,能够支持高达7000亿参数的前沿大模型推理、处理通信密集型工作负载以及运营本地AI工厂。性能测试表明,在Isaac Lab强化学习任务中,单节点帧率为630FPS,双节点帧率翻倍至1241FPS,四节点则再次翻倍至2520FPS,且延迟基本保持不变;在Nanochat微调任务中,单节点每秒可输出1.84万个Token,四节点每秒可输出7.46万个Token,实现了4倍的线性加速,完全打破了传统机架式服务器“性能提升伴随复杂度激增”的局限。
拓扑结构的灵活适配,让集群可精准匹配不同应用场景。单节点适合低延迟、大上下文长度推理,可运行最高2000亿参数模型,满足本地智能体类工作负载需求;双节点实现均衡扩展,支持最高4000亿参数模型推理,加快微调速度;三节点采用环形拓扑,适配更大模型微调或小型训练任务;四节点搭配RoCE 200GbE交换机,可作为本地推理服务器,承载前沿大模型与AI工厂核心业务,覆盖从原型开发到生产部署的全流程。
软件生态的协同升级,进一步释放了硬件潜力。英伟达同步推出NVIDIA NemoClaw开源技术栈,DGX Spark可提供全栈平台,支持在本地构建、运行长期自主AI智能体,后续无缝扩展至AI工厂等数据中心。即将发布的软件更新将增强系统编排与管理能力,帮助企业实现更快迭代与从原型到生产的平滑过渡。同时,DGX Spark兼容NVIDIA Nemotron 3及各大领先开源模型,确保开发者基于现代化AI软件堆栈构建应用。

最新文章

骁途S7PRO MAX官宣:海思RYYB传感器领衔+4K/50FPS高帧率,越影影像重塑运动相机夜拍新模式

数码

 

阅读17492

全汉M330中塔机箱发布:磁吸格栅前板+400mm显卡兼容领衔,45.5L容积重塑主流ATX机箱实用新范式

数码

 

阅读17745

明基MA270S国行发布:5K镜面屏+Mac深度适配领衔

数码

 

阅读17020

机械革命imini E300发布:智谱GLM-5-Turbo加持+0.87L极致轻薄,重塑原生AI Agent终端

数码

 

阅读13047

石头M1S Ultra迷你洗烘一体机实拍:超水解慕斯洗+实时净筒领衔,火箭舱设计重塑精致洗护

家电

 

阅读11785

京ICP备2025103387号-2