《DeepSeek-R1 思维学:让我们深入探讨大型语言模型的推理能力》
arxiv.org/pdf/2504.07128
“像 DeepSeek-R1 这样的大型推理模型标志着大型语言模型(LLMs)在解决复杂问题时的根本性转变。与直接为给定输入生成答案不同,DeepSeek-R1 会创建详细的多步推理链,似乎在提供答案之前“思考”问题。这种推理过程对用户是公开的,为研究模型的推理行为提供了无限机会,并开辟了“思维学”这一新领域。
基于 DeepSeek-R1 推理的基本构建模块分类,我们的分析探讨了思维长度的影响和可控性、对长或复杂上下文的管理、文化与安全性问题,以及 DeepSeek-R1 在认知现象(如类人类的语言处理和世界建模)方面的表现。我们的研究结果呈现出一幅复杂的图景。值得注意的是,我们发现 DeepSeek-R1 存在一个“最佳推理点”,在这一点上,额外的推理时间反而会损害模型性能。”