英伟达 Blackwell Ultra(GB300) 已成为当前AI算力领域的“地表最强”芯片。它不仅是Blackwell架构的超级增强版,更是专门针对大模型推理和长上下文场景进行了极致优化。 1. 核心规格:地表最强的“三大件” 第一,显存容量达到了惊人的 288GB 这是 GB300 最恐怖的地方。它搭载了 288GB 的 HBM3e 显存。这是一个什么概念呢?以前的 H100 是 80GB,GB200 是 192GB,而 GB300 直接干到了 288GB。 实际意义:这意味着单张显卡就能把一个 3000 亿参数的大模型(比如 Llama 3.1 405B)完全装进去。以前跑这种大模型需要把数据在多张显卡之间传来传去,会有延迟;现在 GB300 一口吞下,直接让 AI 的反应速度从“思考半天”变成了“秒回”。 第二,算力单位是“PetaFLOPS” 在最新的 FP4 精度格式下,GB300 的算力高达 15 PetaFLOPS。 实际意义:FP4 是英伟达专门为 AI 推理发明的新格式,既省资源又快。配合这个算力,GB300 处理视频生成、大语言模型对话的效率是前代产品的数倍,而且成本极低。 第三,带宽高到“离谱” 这里有两层带宽概念: 显存带宽:达到了 8 TB/s。这是数据进出芯片的速度,就像高速公路的收费站,收费站越宽,堵车越少。8TB/s 的带宽保证了 288GB 的显存能被瞬间读取。 芯片互联带宽:通过英伟达自研的 NV-HBI 技术,芯片内部的两个“大脑”(双晶粒)之间通信带宽高达 10 TB/s。这确保了它虽然是由两颗芯片封装在一起,但运行起来就像一颗单一的大芯片一样顺畅。



