OpenAI员工AidanMcLaughlin对DeepSeek-R1核心强化

蚁工厂 2025-09-28 13:01:25

OpenAI员工Aidan McLaughlin对DeepSeek-R1核心强化学习算法GRPO的评价。

[挖鼻]技术上不好评价,但当“前沿实验室”并不公布他们的算法时这种说法毫无意义 ​​​

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注