【华泰计算机】Kimi K2“再”梳理!
为啥之前不关注,今天又关注了?
Nature今天发表文章,指出“K2是另一个DeepSeek时刻”,和R1似曾相识的感觉。
K2定位:是「基础」模型,「不是推理」模型。
K2能力:「对标甚至超过」海外GPT、Claude、Gemini同级别的「非推理」模型,Agent/代码能力强。因为是开源的,评价和口碑非常不错。
K2细节:1T的参数(vs R1的671B),训练数据15.5T tokens,还是「Scaling Law」。架构上几乎复刻DeepSeek-V3架构【DeepSeek含金量还在提升!后续V4/R2更值得期待了】。Agent能力强 ,是因为加了很多Agent任务的合成数据到训练中。
注意 :1)虽然是「非推理」模型,但是Kimi输出长度是普通模型的3倍 ,继续「Scaling law」,和我们一直强推算力吻合 。2)未来会出多模态和思考模型,值得期待。
怎么看:软件之前调整较多,人心思涨。叠加明天凌晨OpenAI发布会,两件事合并发酵。
怎么选?
强β: 三六零、彩讯股份、鼎捷数智、汉得信息、合合信息、泛微网络等
AI落地快:
【港股】讯飞医疗、迈富时、第四范式、北森控股、金蝶国际等;
【A股】硬件:萤石网络。软件:海天瑞声、税友股份、金山办公、星环科技等。
a股股票[超话]