【[719星]Chitu(赤兔):专注于效率、灵活性和可用性的高性能大语言模型推理框架,让AI部署更灵活、更高效。亮点:1. 支持多种主流大语言模型,如DeepSeek、LLaMA等;2. 性能卓越,FP8模型在3节点上的输出速度可达BF16模型在6节点的75%~90%;3. 硬件适配广泛,不仅支持NVIDIA GPU,还兼容非NVIDIA GPU和CPU】
'Chitu is a high-performance inference framework for large language models, focusing on efficiency, flexibility, and availability.'
GitHub: github.com/thu-pacman/chitu
大语言模型 高效推理 硬件适配 AI创造营