华为CloudMatrix 384超节点由昇腾 910C 组网。
昇腾 910C 单卡算力为 781.25 Tflops,内存总带宽为 3200 GB/s,基于 8 个 HBM2e 存储堆叠,GPU互联带宽为 400 GB/s。该芯片采用 Chiplet技术,通过拼接两颗昇腾910系列的训推一体芯片,形成专注于纯训练任务的高性能算力单元。
Ascend910C采用12nm工艺制程,单卡算力较前代提升40%,功耗降低15%,可支持千亿参数大模型训练。910C良品率已达到40%,产线实现盈利。
华为CloudMatrix 384超节点由昇腾 910C 组网。
昇腾 910C 单卡算力为 781.25 Tflops,内存总带宽为 3200 GB/s,基于 8 个 HBM2e 存储堆叠,GPU互联带宽为 400 GB/s。该芯片采用 Chiplet技术,通过拼接两颗昇腾910系列的训推一体芯片,形成专注于纯训练任务的高性能算力单元。
Ascend910C采用12nm工艺制程,单卡算力较前代提升40%,功耗降低15%,可支持千亿参数大模型训练。910C良品率已达到40%,产线实现盈利。
猜你喜欢
【223评论】【129点赞】
【426评论】【70点赞】
【147评论】【51点赞】
【1评论】【1点赞】
【132评论】【51点赞】
【55评论】【16点赞】
【67评论】【10点赞】
作者最新文章
热门分类