DeepSeek创始人梁文锋，再次震动全球AI领域：R1训练真29.4万美

洒脱风筝 2025-10-23 15:49:56

DeepSeek创始人梁文锋，再次震动全球AI领域：R1训练真29.4万美这29.4万美元的训练成本，犹如一颗投入平静湖面的石子，在全球AI领域激起千层浪。要知道，在AI模型训练这个烧钱的“战场”上，以往的大模型训练成本动辄千万甚至上亿美元，像OpenAI训练GPT-4据说消耗超过1亿美元。而梁文锋团队却用如此低的成本，打造出能与国际顶尖模型媲美的R1，怎能不让人震惊？梁文锋能取得这样的成绩，和他一路走来的经历息息相关。他出生于1985年，广东湛江人，家庭环境很普通，父母都是小学语文老师。但他从小就对知识充满渴望，展现出超高的天赋。2002年，他凭借优异的成绩考入浙江大学电子信息工程专业，在那里开启了长达八年的学术钻研之路，2010年成功拿下信息与通信工程硕士学位。这八年的沉淀，为他之后在AI领域的创业创新打下了坚实的基础。早在2008年，还在浙大校园的梁文锋就展现出了超前的眼光。当时正值全球金融危机，他却敏锐地察觉到机器学习技术在全自动量化交易中的潜力，于是和伙伴们一头扎进这个领域，积累了大量的市场行情数据。2013年，毕业后的他和同窗好友徐进创立了杭州雅克比投资管理有限公司，正式开启了量化投资的实战。后来，2015年他又创立了杭州幻方科技有限公司，也就是后来大名鼎鼎的幻方量化。在幻方量化期间，他带领团队一路高歌猛进。2016年10月推出首个AI模型，开启了量化与AI融合的新征程；2017年不断扩充研发团队，让AI模型更深入地融入量化策略；2018年确定了AI主导的方向，还斩获了私募金牛奖，名声大噪；2019年自主研发“萤火一号”训练平台，进一步巩固了技术优势，2021年资产管理规模强势突破千亿大关，幻方量化也成为国内量化投资头部梯队的一员。到了2023年，梁文锋又做出了一个大胆的决定，进军通用人工智能领域，并在7月创立了杭州深度求索人工智能基础技术研究有限公司（DeepSeek）。2024年12月26日，DeepSeek - V3模型重磅上线且开源，就已经惊艳了业界。而2025年1月20日推出的DeepSeek - R1模型，更是让世界看到了中国AI的力量。R1模型在多任务挑战中的表现，能与OpenAI o1正式版平分秋色，这对于中国AI来说是极大的突破。 R1模型之所以能引发全球震动，除了成本低，其技术突破才是关键。以往的大模型训练，就像是人类手把手教小孩，需要大量人工标注数据和设计规则。但梁文锋团队反其道而行之，把模型扔进一个只有“对”与“错”的环境，让它自己去尝试、去犯错、去成长。就像在2024年美国数学邀请赛（AIME）中，R1一开始解题准确率只有15.6% ，经过80小时自主训练后，飙升至77.9%，配合“自洽解码”技术后更是达到86.7%，超过了全球90%的参赛学生。而且，它在解题时还会像人一样写下反思语句，这简直不可思议。在算法上，R1也有创新。传统强化学习需要独立算法评估模型表现，而DeepSeek发明的“群体相对策略优化”（GRPO）技术，让模型自己当裁判。这就好比学生们互相批改作业，模型通过对比群体表现来调整自己的策略，不仅节省了30%的算力资源，还使得R1仅用512张H800 GPU，就完成了核心训练阶段。不过，R1也并非完美无缺。在数据伦理方面，它的基础模型训练数据中包含12%的AI生成内容，虽然没有直接复制竞品，但“知识溯源”的问题还是引发了关于AI知识产权的讨论。在实际应用中，像法律推理和医疗诊断这些对准确性要求极高的领域，R1的长链推理错误率仍有18%，还需要进一步优化。梁文锋和他的R1模型，给全球AI领域带来了新的思考和方向。低成本、高效能的训练模式，也许会成为未来AI发展的新趋势。各位读者你们怎么看？欢迎在评论区讨论。

0 阅读：0