ReinforcementLearningofLargeLanguage

爱生活爱珂珂 2025-07-15 09:37:10

Reinforcement Learning of Large Language Models, Spring 2025

UCLA Ernest K. Ryu 教授主讲的“强化学习与大语言模型”春季课程2025正式上线!🎉

🎓 内容涵盖:深度强化学习基础、大语言模型原理及两者结合的前沿研究。

📚 详细章节:从MDP基础、深度策略梯度方法(A3C、PPO、GRPO)、到人类反馈强化学习(PPO、DPO)和可验证奖励强化学习(RLVR)。

🎥 丰富视频资源:每章配备高质量讲解视频,助你系统掌握理论与实践。

📝 课后作业:针对每个模块设计,强化理解与应用。

👨‍🏫 授课教师:Ernest K. Ryu,UCLA数学助理教授,深度学习与强化学习领域权威。

🔍 先修要求:具备深度学习基础,无需强化学习或大语言模型经验。

📖 额外资源:课程主页提供讲义、出版物、软件工具与研究项目介绍。

主页:

Youtube:

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注