#DeepSeekV3模型完成小版本升级#好消息,就在前天晚上,DeepSee

差评XPIN 2025-03-26 14:39:47

#DeepSeekV3模型完成小版本升级# 好消息,就在前天晚上,DeepSeek -V3-0324 上线了,模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些小优化。现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。虽然 V3-0324 仅仅是小版本升级,但也丝毫不妨碍它一上线,就有人说它的代码能力,直追克劳德。

在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。

所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。咱们也简单试了试,看看 V3-0324 到底有多能打。

我先做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的是 V3-0324 和普通版 Claude 3.7 Sonnet 。只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。更别提 UI 设计了, V3-0324 做出来的画板让我不是很有创作的欲望。。。

不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳;但老版本的 V3 压根没运行起来,只能说两个版本高下立判了;再来看普通版 Claude 3.7 Sonnet,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出框了。

最后,我又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。V3 的页面倒是做出来了,但没什么设计可言。反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。

综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。但如果要说完全超越 Claude 3.7 Sonnet ,我觉着暂时还不太行。

不过大伙儿也别忘了, V3-0324 它便宜啊,百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。所以在某种程度上, V3-0324 的确可以跟 Claude 3.7 Sonnet 媲美了。小版本更新就已经如此强悍了,不知道在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。

0 阅读:13
差评XPIN

差评XPIN

用知识和观点Debug the world!