风尚咨询

英伟达Vera Rubin平台重塑AI基建:单Token成本降至1/10,开启智能体AI工业化时代

2026-03-27
2026年3月17日,英伟达在GTC大会上正式推出了Vera Rubin AI平台。CEO黄仁勋将其称为“代际飞跃”的基础设施方案,通过7款创新芯片与5种机架级系统的协调设计,将单Token成本降低至上一代Blackwell平台的十分之一,每瓦推理吞吐量提高了10倍。该平台涵盖了从大规模预训练到实时智能体推理的整个生命周期,标志着AI产业从“算力竞赛”转向“工业化效率竞争”的新阶段。
Vera Rubin平台的核心架构由七款芯片组成,其中包括88核Vera CPU、搭载288GB HBM4内存的Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机,以及全新集成的Groq 3 LPU推理加速器。NVL72机架通过NVLink 6技术将72块Rubin GPU与36块Vera CPU深度整合,形成强大的算力核心。相比传统架构,该系统在训练混合专家大模型(MoE)时仅需四分之一的GPU资源。Vera CPU机架集成了256块液冷CPU,运行效率是传统CPU的两倍,速度提升了50%,特别针对AI模型验证场景进行了优化。
针对智能体AI对低延迟与长上下文的核心需求,平台创新性地采用“解耦推理”模式:通过Dynamo软件系统,将需要大规模矩阵计算的Prefill(预填充)阶段交由Rubin GPU处理,而对延迟敏感的Decode(解码)阶段卸载至Groq 3 LPU。Rubin GPU凭借22TB/s的内存带宽承载超大模型与KV缓存,Groq 3 LPU则以500MB片上SRAM与150TB/s带宽实现极致低延迟。两者协同下,高端推理层级性能提升35倍,每兆瓦推理吞吐量同步跃升。
黄仁勋在演讲中提出,Token已成为AI时代的大宗商品,算力价值将以Token生产效率与成本重新定义。他划分了五个商业层级:免费层、中端层(每百万Token约3美元)、高级层(约6美元)、高速层(约45美元)、超高速层(约150美元)。以1吉瓦数据中心为例,采用Vera Rubin平台后,每秒Token生成量从Blackwell的200万飙升至7亿,年营收可从300亿美元提升至1500亿美元,若结合Groq LPU更可突破3000亿美元。
数据存储环节,BlueField-4 STX机架通过DOCA Memos框架高效处理海量KV缓存,推理吞吐量提升5倍,能耗大幅降低。软件生态方面,NemoClaw企业级智能体平台为开源项目OpenClaw(被黄仁勋比作“智能体时代的Linux”)提供安全层,Adobe、Salesforce等17家企业已宣布采用其智能体开发工具包。

最新文章

任天堂Switch 22.0.0系统更新:好友备注上线,掌机增强模式重塑续航体验

数码

 

阅读19923

英伟达DGX Rubin NVL8系统选择英特尔至强6作为头节点处理器

数码

 

阅读14282

哈博森MINI 7智能屏控版无人机定价5999元:1英寸大底+28分钟续航,重新定义轻量化航拍旗舰

智能

 

阅读19076

英伟达Vera Rubin平台重塑AI基建:单Token成本降至1/10,开启智能体AI工业化时代

数码

 

阅读12525

苹果发布AirPods Max 2:H2芯片加持,3999元开启头戴式耳机新纪元

数码

 

阅读17413

京ICP备2025103387号-2