【[719星]Chitu(赤兔):专注于效率、灵活性和可用性的高性能大语言模型推

爱生活爱珂珂 2025-03-16 18:27:48

【[719星]Chitu(赤兔):专注于效率、灵活性和可用性的高性能大语言模型推理框架,让AI部署更灵活、更高效。亮点:1. 支持多种主流大语言模型,如DeepSeek、LLaMA等;2. 性能卓越,FP8模型在3节点上的输出速度可达BF16模型在6节点的75%~90%;3. 硬件适配广泛,不仅支持NVIDIA GPU,还兼容非NVIDIA GPU和CPU】

'Chitu is a high-performance inference framework for large language models, focusing on efficiency, flexibility, and availability.'

GitHub: github.com/thu-pacman/chitu

大语言模型 高效推理 硬件适配 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注