今晚DeepSeek更新:
DS新模型上线,依然是纯文本模型,不是多模态,但:
a)上下文能力从 128K Token 大幅提升至 1M Token,一次可处理的信息量激增近10倍,足以处理如《三体》三部曲全文等超长文本
b)知识库日期更新到2025年5月,原本是2024年7月。这可能意味着基于更近期数据训练的全新基础模型。
今晚DeepSeek更新:
DS新模型上线,依然是纯文本模型,不是多模态,但:
a)上下文能力从 128K Token 大幅提升至 1M Token,一次可处理的信息量激增近10倍,足以处理如《三体》三部曲全文等超长文本
b)知识库日期更新到2025年5月,原本是2024年7月。这可能意味着基于更近期数据训练的全新基础模型。
作者最新文章
热门分类
财经TOP
财经最新文章