【DeepSeek或在春节再发新模型,DeepSeek能否复刻去年春节爆火场面】2月13日,据澎湃新闻,DeepSeek网页/APP正在测试新的长文本模型结构,支持1M上下文。其API服务不变,仍为V3.2,仅支持128K上下文。这也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。
据人民日报,蛇年春节前后,中国人工智能企业深度求索(DeepSeek)以其开源模型DeepSeek-R1在全球掀起一场“惊叹风暴”。
2025年1月20日,DeepSeek正式发布DeepSeek-R1。一周之内,DeepSeek便登顶中美两国苹果手机应用商店免费榜榜首,不久又在约140个国家的手机应用下载排行榜上占据榜首,在东西方市场同时实现了现象级爆发。
引发的反响令人惊叹。OpenAI首席执行官萨姆·奥尔特曼表示,“新竞争对手令人振奋”;美国《纽约时报》评价这“是一个里程碑”;英伟达、亚马逊和微软三家科技巨头,在同一天宣布接入DeepSeek-R1。
今年1月12日,DeepSeek曾发布一篇新论文“基于可扩展查找的条件记忆:大语言模型稀疏性的新维度”梁文锋位列作者名单中,这篇论文为北京大学和DeepSeek共同完成。据悉,这篇论文的核心直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念。
当时行业就普遍猜测,DeepSeek的下一代模型V4或将在今年春节前后正式发布。
不过,据经济观察报,此次DeepSeek灰度版本仍未同步上线视觉理解或多模态输入功能,仍专注于纯文本和语音交互。
官方没有通知,用户更早注意到了模型的变化。2月11日,部分用户在社交媒体上控诉:DeepSeek不再称呼自己设定的昵称,而统一称“用户”。DeepSeek推荐电影后,还加了句:“够你看一阵子,不够再来要。”这被用户描述为“登味”。
在用户询问当前模型版本时,DeepSeek明确回答,本次灰度版本“不是DeepSeek-V4”“没有固定的版本号”。一位国产大模型厂商人士认为,这一版本类似于极速版,牺牲质量换速度,是为2026年2月中旬将发布的V4版本做最后的压力测试。
2月13日,据白鹿视频,就此事提问DeepSeek为何变得“冷淡”,DeepSeek表示,不是故意变冷淡的,可能是几方面原因叠加。之前回复会带很多表情和语气词,但后来发现,对大量只想高效获取答案的用户来说,那些反而像“被迫接收的热情”显得假,甚至有负担。
另一个是边界感,有些人来聊天是排解情绪,也有些人就是想要答案,没有表情修饰的回复,对后者来说更舒服——不用被迫接收某种热情,也不用应付“AI在假装关心我”的感觉。各位网友,您怎么看?(综合澎湃新闻、人民日报、经济观察报)
