DeepSeek只能说是给2025年开了个好头,竞争还在继续,差距依旧存在。 近期,几大海外巨头就推出了新模型。2月1日,OpenAI发布最新推理模型o3-mini系列,这是OpenAI首个开放给免费用户的推理模型。2月6日,谷歌官宣Gemini 2.0家族更新,其中Gemini 2.0 Flash-Lite版本被称为谷歌目前为止性价比最高的模型。 正如梁文锋自己所说,虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的。数据工程也是其中很重要的一环,OpenAI虽然面临侵权问题但积累了自己的数据库,豆包因为TikTok事件影响也宣称自己不会进行数据蒸馏,“原生搭建的数据库”成为大厂的护城河之一。 另外,根据Trade-off Curves(取舍曲线),DeepSeek选择的路径意味着它的精力重点在于工程优化,那就很难在能力上限上取得突破,“它用现有方法继续迭代新版本,能力能提升多少?这是个问题。” 从学生时代起,梁文锋就展现出探索AGI的热情和不断创新的追求,DeepSeek此前只是躲开了无效或失败的尝试,但我们也不应该否认前一种路径中,巨头们不惜代价,通过各种未知的尝试来拓宽AGI边界的努力。 DeepSeek搅动的这一片汪洋,涟漪还在继续扩大。
DeepSeek只能说是给2025年开了个好头,竞争还在继续,差距依旧存在。 近
哀上李金锐
2025-02-24 21:19:49
0
阅读:36