昨晚饭局,一位刚离职的DeepSeek核心工程师喝多了说:梁文锋能当选全球十大科学人物,是因为他做了一件同行不敢想的事。 这位工程师没说透,但圈内人都清楚,那件“不敢想的事”,就是把顶尖AI模型彻底开源,还把训练成本压到了同行不敢信的地步 12月8日《自然》官网公告里,梁文锋带着“科技颠覆者”头衔在列。理由很直接,就是DeepSeek搞的开源革命。 DeepSeek-R1是6600亿参数的顶尖模型,增量训练只花29.4万美元。用512张H800 GPU练了80小时,还不到GPT-4o成本的1/20。 推理成本更实在,缓存未命中时才0.55美元/百万tokens。比Claude Opus 4便宜20多倍,单次用下来就几毛钱。 模型权重和训练框架全公开。后来直接冲到Hugging Face点赞榜第一,约8730次点赞,全球开发者都在抢着用。 西方大公司还在砸上千亿搞技术门槛,把AI藏起来收钱。梁文锋直接掀了桌子,说这是人类共同的科学进步。 背后是真技术撑着,用“纯强化学习”框架,让模型自己琢磨解题,不用多花算力。 中铁物资和天翼云合作,给铁建云链做了智能助手。供应商咨询不用人工守着,响应又快又准。 深圳政务、中山住建局也在用它。中山一二三四五热线接入后,群众答疑效率提升了50%。 交个朋友用它写口播稿,原来人工要20多分钟,AI只要2分钟,效率比人工高10倍。 中国移动、中国中化都在用它做国产化部署,中石油也完成了全栈适配,央企都认这个技术。 有人说开源赚不到快钱。但实打实的合作案例摆着,从政务到企业,用的人越来越多。 科学本来就不是用来垄断的。中小企业不用花大价钱,非洲小实验室也能用上顶尖AI搞研究。 梁文锋当选其实打醒了不少人。真正的厉害不是让别人用不起,而是让更多人能用得上、用得好。 各位读者你们怎么看?欢迎在评论区讨论。 deepsig
