Deepmind的科学家HarrisChan绘制的DeepSeek-R1训

蚁工厂 2025-01-21 13:43:14

Deepmind的科学家Harris Chan绘制的 DeepSeek-R1 训练/蒸馏可视化过程。

这张图展示了 DeepSeek-R1 模型的训练流程,包括 DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型的训练步骤,以及如何将 DeepSeek-R1 的能力蒸馏到其他模型上。

0 阅读:100
蚁工厂

蚁工厂

感谢大家的关注