小摩的2025年英伟达GTC大会前瞻(信息很多):英伟达将于下周举办年度GTC大会,黄仁勋将于3月18日发表主题演讲。本报告中,我们总结了此次大会对亚洲科技供应链的预期及影响。主要涵盖Blackwell Ultra、Rubin、每机架GPU数量增加影响、和英伟达CPO路线图。
1. 【2025年下半年Blackwell Ultra量产爬坡】
Blackwell Ultra很可能是英伟达在2025年GTC大会上推出的主要产品,它是Blackwell的后续产品。我们的研究显示,Blackwell Ultra(基于台积电N4P工艺的B300)采用了与B200芯片类似的逻辑芯片,但其高带宽内存(HBM)容量更大(288GB,4倍或8倍HBM3e 12层堆叠),功耗也更高(热设计功耗为1.4千瓦)(详见表1)。
我们预计Blackwell Ultra的FP4性能比B200一代提升50%,并于2025年第三季度开始初步量产爬坡。
Blackwell Ultra系统潜在的关键规格变化包括:
1)采用GPU插槽;
2)计算板回归OAM+UBB结构:单块集成板(代号为科迪莉亚)上会有四个GPU模块和两个Grace CPU;
3)更高的功耗;
4)采用电池备份单元(BBU),可能还会使用超级电容器;
5)液冷设计变更,特别是快速断开接头(UQD)和冷板部分;
6)采用ConnectX8 800G网卡;
7)可选择集成混合内存立方体(HMC)和数据中心存储级内存(DC-SCM)。
Blackwell Ultra潜在规格变化的主要受益者可能包括台达(电源及BBU/超级电容器系统供应商)、AES(电池组供应商)、AVC和Auras(冷板供应商)、Fositek(UQD供应商)、纬创(有望在OAM/UBB领域获得更多份额)、SK海力士(主要HBM供应商,HBM含量增加50%)、网络供应商以及插槽供应商(如富士康、乐泰等) 。
2. 【Rubin平台】
Rubin平台可能要到2026年才会量产爬坡,但根据去年GTC大会的节奏,我们认为英伟达也可能会分享一些关于Rubin平台的细节。
据我们研究,预计Rubin GPU(基于台积电N3P工艺)将采用双逻辑芯片结构(与Blackwell类似),搭配两颗台积电N3芯片和8个HBM4存储体,HBM总容量达384GB,比Blackwell Ultra增加33%。我们预计其功耗将进一步提升至约1.8千瓦热设计功耗。我们还预计维拉ARM CPU将采用N3制程技术,且极有可能采用2.5D封装结构。
供应链消息显示,Rubin平台可能会提前量产,2025年末或2026年初开始大规模生产,但我们预计最早也要到2026年第二季度才会有大量出货。我们认为Rubin平台可能会采用1.6T网络,搭配两张Connect X9网卡。虽然目前我们还不清楚其系统设计,但我们认为Rubin平台最终可能会考虑采用NVL144和潜在的NVL288机架结构。每机架更高的GPU密度和不断上升的功耗趋势,对电源和散热供应商来说是利好。在我们看来,系统设计的日益复杂对ODM厂商也是有利的。
我们预计2025年GTC大会不会透露太多Rubin Ultra的细节,我们早期研究表明,其芯片设计更为复杂,有4个GPU芯片,可能集成输入输出芯片(I/O Die),12层HBM4堆叠,并且可能在中介层集成共封装光学(CPO)。
3. 【每机架GPU数量增加、NVL144和NVL288的影响】
英伟达可能会提高每机架的GPU密度(例如从目前的NVL36/72升级到NVL144/288产品),以提高成本效益。这可能需要部署独立的电源机架(与NVL72机架的电源架设计不同),每个电源机架支持30万至70万瓦的功率。由于电源机架设计采用了更复杂的解决方案,并且集成了机箱、电源管理控制器(PMC)、电缆等非电源供应单元(PSU)组件,每瓦电源的平均销售价格(ASP)也可能会提高。
此外,我们预计服务器机架对电压的要求也会更高(400V以上),以降低功率损耗,同时BBU/超级电容对于提高电源效率和稳定性的重要性也日益增加。我们认为主要受益者包括台达(BBU/超级电容器系统供应商、电压调节模块供应商)和AES(电池组供应商)。
4. 【英伟达CPO路线图可能成为大会亮点,台积电和基板供应商有望受益】
英伟达可能会在GTC大会上概述其共封装光学(CPO)路线图。我们预计CPO将首先应用于交换领域,作为机架顶部数据中心交换机(包括量子 [InfiniBand] 和频谱 [以太网] 交换机)的可选解决方案,成为Blackwell Ultra平台的一部分。采用CPO对于进一步提升带宽、降低延迟至关重要,同时还能降低功耗(参考我们的台湾会议报告,链接)。
我们认为,短期内基于CPO的交换机的实际应用规模可能仍然较小。CPO应用的关键转折点要等到CPO应用于GPU时才会出现。最早可能要到2027年的Rubin Ultra才会实现。将CPO应用于人工智能GPU(即光引擎 [OE] 将与中介层相连)仍面临多项技术挑战,包括热管理(OE会产生大量热量)、可靠性,以及由于所需尺寸过大导致的IC基板翘曲问题。
随着CPO应用的增加,对于基板供应商来说是重大利好,因为使用CPO的交换机基板尺寸将增加20%-30%。对于应用于GPU中介层的CPO,基板设计尺寸可能达到当前GPU的2-3倍。这将推动玻璃基板核心等新材料的发展,并使欣兴电子等基板供应商受益。