2026年4月22日,谷歌在拉斯维加斯举办的Google Cloud Next ’26大会上正式宣布进军“智能体时代”。在AI技术从“对话”转向“行动”的关键时刻,谷歌推出了一套软硬件结合的战略:正式发布第八代TPU芯片(TPU 8t与TPU 8i)以及全新的Gemini企业级智能体平台。同时,谷歌CEO桑达尔·皮查伊宣布,公司2026年的资本支出预计在1750亿至1850亿美元之间,其中超过一半将投向云业务和机器学习领域的算力投资。这些举措不仅标志着谷歌AI战略的全面升级,也彰显了其在激烈的AI竞争中通过革新全栈基础设施来重塑行业格局的雄心。
硬件利刃:第八代TPU“双芯”齐发,训推分离重塑算力
在本次大会上,第八代TPU芯片的首次亮相成为了众人瞩目的焦点。谷歌首次将训练与推理任务分开处理,推出了专注于模型训练的TPU 8t和专注于推理任务的TPU 8i。TPU 8t堪称“算力怪兽”,配备了为混合专家模型优化的SparseCore核心,并配合谷歌自研的Virgo网络拓扑,使得芯片间通信带宽增加了一倍。单个TPU 8t超级计算单元可以集成多达9600颗芯片,总算力高达121 ExaFlops,将前沿模型的开发周期从几个月缩短到几周,单位成本算力较前代提升了2.7倍。

而TPU 8i则致力于打破“内存墙”,通过配备288GB高带宽内存和384MB片上SRAM,它能将完整的对话上下文缓存于芯片内部,大幅减少数据交互延迟。配合新型Boardfly网络拓扑,千颗芯片系统的通信路径缩短56%,使得推理任务的性价比提升80%。这一“双芯”战略,不仅是对英伟达GPU霸主地位的直接挑战,更是为了解决AI智能体大规模部署时面临的成本与延迟痛点。
软件中枢:Gemini企业级平台,从“聊天”进化到“办事”
在软件层面,谷歌将原有的Vertex AI平台全面升级并更名为Gemini企业级智能体平台。这一转变的核心逻辑在于,企业需求已从构建单个AI模型,转向管理成百上千个能够自主执行任务的智能体。新平台集成了Agent Studio低代码开发界面与智能体注册表,允许企业通过自然语言快速创建智能体,并统一管理内部工具与数据。
