昨天看DeepSeek r1模型的技术报告,其中有个非常有意思的点... 在R1思维过程中他会自动使用多种语言进行思考。
虽然使用多种语言进行思考对于模型来说是有好处,但对于做校正的工作人员来说是有困难的,所以限制模型在一段思考中只使用一种语言。加上这个限制之后大模型的能力稍微的降低了。
这个问题想到人类建造巴别塔的故事,有点哲学映射在里头。同时拿这个问题去问了deepseek,他给出的回答也挺好的(参考图片)。
昨天看DeepSeek r1模型的技术报告,其中有个非常有意思的点... 在R1思维过程中他会自动使用多种语言进行思考。
虽然使用多种语言进行思考对于模型来说是有好处,但对于做校正的工作人员来说是有困难的,所以限制模型在一段思考中只使用一种语言。加上这个限制之后大模型的能力稍微的降低了。
这个问题想到人类建造巴别塔的故事,有点哲学映射在里头。同时拿这个问题去问了deepseek,他给出的回答也挺好的(参考图片)。
评论列表
作者最新文章
热门分类
科技TOP
科技最新文章
用户16xxx93
这么牛,反正比我牛,我答不出来