【[564星]DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。亮点:1. 性能卓越,部分场景速度提升高达2.7倍;2. 代码简洁,核心功能仅约300行代码;3. 支持混合专家模型(MoE),适配多种矩阵形状】
'DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling'
GitHub: github.com/deepseek-ai/DeepGEMM
【[564星]DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。亮点:1. 性能卓越,部分场景速度提升高达2.7倍;2. 代码简洁,核心功能仅约300行代码;3. 支持混合专家模型(MoE),适配多种矩阵形状】
'DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling'
GitHub: github.com/deepseek-ai/DeepGEMM
作者最新文章
热门分类
科技TOP
科技最新文章