【[564星]DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法

爱生活爱珂珂 2025-02-26 10:23:33

【[564星]DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。亮点:1. 性能卓越,部分场景速度提升高达2.7倍;2. 代码简洁,核心功能仅约300行代码;3. 支持混合专家模型(MoE),适配多种矩阵形状】

'DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling'

GitHub: github.com/deepseek-ai/DeepGEMM

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注