2026年4月,作为全球AI算力领域的引领者,英伟达(NVIDIA)对其下一代数据中心GPU——Rubin Ultra进行了重大战略调整。多家供应链和行业媒体透露,英伟达已放弃原先宏大的四芯片(4-Die)封装计划,转而采用更为成熟的双芯片(2-Die)架构。这一决策不仅仅是技术规格的调整,更是AI芯片在面临物理和成本极限时,对工程实际与商业逻辑的一种必要妥协。
激进路线的终结:当野心撞上物理极限
最初,Rubin Ultra被规划为英伟达史上最具野心的产品:计划在一个封装体内集成四颗GPU芯片(Die),并配备多达16个HBM4显存堆栈,旨在追求极限的算力密度。然而,这一设计在工程层面遇到了难以克服的障碍。

核心问题在于先进封装的物理限制。强行集成四颗芯片将导致封装面积急剧增加,达到光罩(Reticle)极限的大约8倍。这不仅引发严重的翘曲风险和散热问题,还直接致使制造良率大幅下降,生产成本攀升。对于致力于大规模量产的英伟达来说,这种“不惜代价”的激进策略不再具有可行性。因此,将四芯片设计从“封装级集成”调整为“板级组装”(即采用2+2双芯片封装配置),成为降低供应链复杂度和制造风险的必然选择。
回归务实:在性能、成本与量产间寻找平衡
从4-Die到2-Die的转变,本质上是英伟达在性能、成本与量产效率之间重新寻找平衡点。2-Die架构虽然减少了单颗封装的芯片数量,但其技术更为成熟,能有效保障制造良率和生产节奏。
值得注意的是,这一调整并不意味着终端性能的全面“腰斩”。英伟达的应对策略是,通过增加机柜中的GPU数量来补偿总算力。例如,原先一个机柜可能配置144颗四芯粒GPU,未来则可能通过配置288颗双芯粒GPU来维持相同的总算力目标(如FP4 15Eflops)。这意味着,虽然单颗芯片的集成度下降,但系统级的性能目标并未改变,只是实现路径从“单点极致”转向了“规模集群”。

产业链连锁反应:并非简单的需求收缩
这一调整对产业链的影响是复杂且微妙的。它并非意味着对上游产能的简单砍半。在晶圆代工端,英伟达并未削减对台积电的订单,反而正在微调投片策略,将更多产能向当前的Blackwell架构倾斜,以保障现有产品线的供应。