DeepSeek的梁文锋又整了个大活!新论文提出的NSA架构直接让大模型处理长文本速度飙升11.6倍,这技术革新太硬核了。 难怪连海外大厂都抢着合作,AMD连夜把DeepSeek-V3集成到MI300X芯片上,实测数学和代码能力居然碾压GPT-4。 最服气他说的“想让山村孩子用上硅谷同款AI助教”,这种理想主义在资本狂飙的AI圈简直就是清流。 看着他们团队95后占比超75%的阵容,突然懂了为啥网友说这是“用年轻人热血浇灌出的中国奇迹”。
万万没想到!DeepSeek的最大竞争对手不是Open,也不是GPT,而是又
【7评论】【9点赞】