谷歌AI强势发力：推出第八代TPU芯片及智能体平台，布局“智能体时代”

2026-04-23

2026年4月22日，谷歌在拉斯维加斯举办的Google Cloud Next ’26大会上正式宣布进军“智能体时代”。在AI技术从“对话”转向“行动”的关键时刻，谷歌推出了一套软硬件结合的战略：正式发布第八代TPU芯片（TPU 8t与TPU 8i）以及全新的Gemini企业级智能体平台。同时，谷歌CEO桑达尔·皮查伊宣布，公司2026年的资本支出预计在1750亿至1850亿美元之间，其中超过一半将投向云业务和机器学习领域的算力投资。这些举措不仅标志着谷歌AI战略的全面升级，也彰显了其在激烈的AI竞争中通过革新全栈基础设施来重塑行业格局的雄心。

硬件利刃：第八代TPU“双芯”齐发，训推分离重塑算力

在本次大会上，第八代TPU芯片的首次亮相成为了众人瞩目的焦点。谷歌首次将训练与推理任务分开处理，推出了专注于模型训练的TPU 8t和专注于推理任务的TPU 8i。TPU 8t堪称“算力怪兽”，配备了为混合专家模型优化的SparseCore核心，并配合谷歌自研的Virgo网络拓扑，使得芯片间通信带宽增加了一倍。单个TPU 8t超级计算单元可以集成多达9600颗芯片，总算力高达121 ExaFlops，将前沿模型的开发周期从几个月缩短到几周，单位成本算力较前代提升了2.7倍。

而TPU 8i则致力于打破“内存墙”，通过配备288GB高带宽内存和384MB片上SRAM，它能将完整的对话上下文缓存于芯片内部，大幅减少数据交互延迟。配合新型Boardfly网络拓扑，千颗芯片系统的通信路径缩短56%，使得推理任务的性价比提升80%。这一“双芯”战略，不仅是对英伟达GPU霸主地位的直接挑战，更是为了解决AI智能体大规模部署时面临的成本与延迟痛点。

软件中枢：Gemini企业级平台，从“聊天”进化到“办事”

在软件层面，谷歌将原有的Vertex AI平台全面升级并更名为Gemini企业级智能体平台。这一转变的核心逻辑在于，企业需求已从构建单个AI模型，转向管理成百上千个能够自主执行任务的智能体。新平台集成了Agent Studio低代码开发界面与智能体注册表，允许企业通过自然语言快速创建智能体，并统一管理内部工具与数据。