小摩的2025年英伟达GTC大会前瞻（信息很多）：英伟达将于下周举办年度GTC大

小摩的2025年英伟达GTC大会前瞻（信息很多）：英伟达将于下周举办年度GTC大会，黄仁勋将于3月18日发表主题演讲。本报告中，我们总结了此次大会对亚洲科技供应链的预期及影响。主要涵盖Blackwell Ultra、Rubin、每机架GPU数量增加影响、和英伟达CPO路线图。

1. 【2025年下半年Blackwell Ultra量产爬坡】

Blackwell Ultra很可能是英伟达在2025年GTC大会上推出的主要产品，它是Blackwell的后续产品。我们的研究显示，Blackwell Ultra（基于台积电N4P工艺的B300）采用了与B200芯片类似的逻辑芯片，但其高带宽内存（HBM）容量更大（288GB，4倍或8倍HBM3e 12层堆叠），功耗也更高（热设计功耗为1.4千瓦）（详见表1）。

我们预计Blackwell Ultra的FP4性能比B200一代提升50%，并于2025年第三季度开始初步量产爬坡。

Blackwell Ultra系统潜在的关键规格变化包括：

1）采用GPU插槽；

2）计算板回归OAM+UBB结构：单块集成板（代号为科迪莉亚）上会有四个GPU模块和两个Grace CPU；

3）更高的功耗；

4）采用电池备份单元（BBU），可能还会使用超级电容器；

5）液冷设计变更，特别是快速断开接头（UQD）和冷板部分；

6）采用ConnectX8 800G网卡；

7）可选择集成混合内存立方体（HMC）和数据中心存储级内存（DC-SCM）。

Blackwell Ultra潜在规格变化的主要受益者可能包括台达（电源及BBU/超级电容器系统供应商）、AES（电池组供应商）、AVC和Auras（冷板供应商）、Fositek（UQD供应商）、纬创（有望在OAM/UBB领域获得更多份额）、SK海力士（主要HBM供应商，HBM含量增加50%）、网络供应商以及插槽供应商（如富士康、乐泰等）。

2. 【Rubin平台】

Rubin平台可能要到2026年才会量产爬坡，但根据去年GTC大会的节奏，我们认为英伟达也可能会分享一些关于Rubin平台的细节。

据我们研究，预计Rubin GPU（基于台积电N3P工艺）将采用双逻辑芯片结构（与Blackwell类似），搭配两颗台积电N3芯片和8个HBM4存储体，HBM总容量达384GB，比Blackwell Ultra增加33%。我们预计其功耗将进一步提升至约1.8千瓦热设计功耗。我们还预计维拉ARM CPU将采用N3制程技术，且极有可能采用2.5D封装结构。

供应链消息显示，Rubin平台可能会提前量产，2025年末或2026年初开始大规模生产，但我们预计最早也要到2026年第二季度才会有大量出货。我们认为Rubin平台可能会采用1.6T网络，搭配两张Connect X9网卡。虽然目前我们还不清楚其系统设计，但我们认为Rubin平台最终可能会考虑采用NVL144和潜在的NVL288机架结构。每机架更高的GPU密度和不断上升的功耗趋势，对电源和散热供应商来说是利好。在我们看来，系统设计的日益复杂对ODM厂商也是有利的。

我们预计2025年GTC大会不会透露太多Rubin Ultra的细节，我们早期研究表明，其芯片设计更为复杂，有4个GPU芯片，可能集成输入输出芯片（I/O Die），12层HBM4堆叠，并且可能在中介层集成共封装光学（CPO）。

3. 【每机架GPU数量增加、NVL144和NVL288的影响】

英伟达可能会提高每机架的GPU密度（例如从目前的NVL36/72升级到NVL144/288产品），以提高成本效益。这可能需要部署独立的电源机架（与NVL72机架的电源架设计不同），每个电源机架支持30万至70万瓦的功率。由于电源机架设计采用了更复杂的解决方案，并且集成了机箱、电源管理控制器（PMC）、电缆等非电源供应单元（PSU）组件，每瓦电源的平均销售价格（ASP）也可能会提高。

此外，我们预计服务器机架对电压的要求也会更高（400V以上），以降低功率损耗，同时BBU/超级电容对于提高电源效率和稳定性的重要性也日益增加。我们认为主要受益者包括台达（BBU/超级电容器系统供应商、电压调节模块供应商）和AES（电池组供应商）。

4. 【英伟达CPO路线图可能成为大会亮点，台积电和基板供应商有望受益】

英伟达可能会在GTC大会上概述其共封装光学（CPO）路线图。我们预计CPO将首先应用于交换领域，作为机架顶部数据中心交换机（包括量子 [InfiniBand] 和频谱 [以太网] 交换机）的可选解决方案，成为Blackwell Ultra平台的一部分。采用CPO对于进一步提升带宽、降低延迟至关重要，同时还能降低功耗（参考我们的台湾会议报告，链接）。

我们认为，短期内基于CPO的交换机的实际应用规模可能仍然较小。CPO应用的关键转折点要等到CPO应用于GPU时才会出现。最早可能要到2027年的Rubin Ultra才会实现。将CPO应用于人工智能GPU（即光引擎 [OE] 将与中介层相连）仍面临多项技术挑战，包括热管理（OE会产生大量热量）、可靠性，以及由于所需尺寸过大导致的IC基板翘曲问题。

随着CPO应用的增加，对于基板供应商来说是重大利好，因为使用CPO的交换机基板尺寸将增加20%-30%。对于应用于GPU中介层的CPO，基板设计尺寸可能达到当前GPU的2-3倍。这将推动玻璃基板核心等新材料的发展，并使欣兴电子等基板供应商受益。