近期,英伟达发布了一系列针对人工智能、机器人技术和自动驾驶领域的开放模型、数据集及开发工具,致力于构建一个统一、开放、可扩展的技术生态系统,推动智能体从“云端思考”迈向“现实行动”。
这一系列发布并非零散的技术更新,而是一次系统的战略布局,象征着英伟达从“AI芯片供应商”向“智能体时代基础平台提供者”的全面转型。其根本目的在于降低开发难度,使研究人员、工程师和企业能够更加高效地训练、测试和部署跨场景的智能系统。

在人工智能领域,英伟达扩展了其广受关注的Nemotron模型家族。新推出的NemotronSpeech专注于低延迟语音识别,适用于实时对话系统;NemotronRAG则集成了多模态文档检索与重排能力,显著提升检索增强生成(RAG)系统的准确性和效率;而NemotronSafety新增了敏感内容过滤与个人身份信息(PII)检测功能,为大模型应用提供安全护栏。所有模型均附带训练代码与数据集,已在GitHub和Hugging Face开源,支持社区二次开发。
在机器人领域,英伟达推出了全新的Cosmos世界基础模型系列,包括CosmosReason2(用于复杂场景理解与推理)、CosmosTransfer2.5与CosmosPredict2.5(用于跨环境视频合成与预测)。这些模型使机器人能在仿真环境中学习真实世界的物理规律,并生成高质量合成数据,大幅缩短训练周期。基于此,英伟达还发布了IsaacGR00T N1.6——一个开放的视觉-语言-动作(VLA)模型,专为人形机器人设计,支持全身运动控制与环境交互规划,是迈向通用机器人的关键一步。

自动驾驶方面,英伟达推出了Alpamayo模型家族与AlpaSim仿真框架。Alpamayo采用视觉-语言-动作架构,融合感知、决策与可解释性,专为高阶自动驾驶推理设计;AlpaSim则是开源的闭环仿真平台,可与真实驾驶数据和Cosmos模型联动,实现大规模、高保真的自动驾驶测试。据英伟达汽车部门负责人吴信洲透露,相关技术已与梅赛德斯-奔驰等合作伙伴深度协作,即将进入量产阶段。