DeepSeek创始人梁文锋,再次震动全球AI领域:R1训练真29.4万美

洒脱风筝 2025-10-23 15:49:56

DeepSeek创始人梁文锋,再次震动全球AI领域:R1训练真29.4万美 这29.4万美元的训练成本,犹如一颗投入平静湖面的石子,在全球AI领域激起千层浪。要知道,在AI模型训练这个烧钱的“战场”上,以往的大模型训练成本动辄千万甚至上亿美元 ,像OpenAI训练GPT-4据说消耗超过1亿美元。而梁文锋团队却用如此低的成本,打造出能与国际顶尖模型媲美的R1,怎能不让人震惊? 梁文锋能取得这样的成绩,和他一路走来的经历息息相关。他出生于1985年,广东湛江人,家庭环境很普通,父母都是小学语文老师。但他从小就对知识充满渴望,展现出超高的天赋。2002年,他凭借优异的成绩考入浙江大学电子信息工程专业,在那里开启了长达八年的学术钻研之路,2010年成功拿下信息与通信工程硕士学位。这八年的沉淀,为他之后在AI领域的创业创新打下了坚实的基础。 早在2008年,还在浙大校园的梁文锋就展现出了超前的眼光。当时正值全球金融危机,他却敏锐地察觉到机器学习技术在全自动量化交易中的潜力,于是和伙伴们一头扎进这个领域,积累了大量的市场行情数据。2013年,毕业后的他和同窗好友徐进创立了杭州雅克比投资管理有限公司,正式开启了量化投资的实战。后来,2015年他又创立了杭州幻方科技有限公司,也就是后来大名鼎鼎的幻方量化。在幻方量化期间,他带领团队一路高歌猛进。2016年10月推出首个AI模型,开启了量化与AI融合的新征程;2017年不断扩充研发团队,让AI模型更深入地融入量化策略;2018年确定了AI主导的方向,还斩获了私募金牛奖,名声大噪;2019年自主研发“萤火一号”训练平台,进一步巩固了技术优势,2021年资产管理规模强势突破千亿大关,幻方量化也成为国内量化投资头部梯队的一员。 到了2023年,梁文锋又做出了一个大胆的决定,进军通用人工智能领域,并在7月创立了杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。2024年12月26日,DeepSeek - V3模型重磅上线且开源,就已经惊艳了业界。而2025年1月20日推出的DeepSeek - R1模型,更是让世界看到了中国AI的力量。R1模型在多任务挑战中的表现,能与OpenAI o1正式版平分秋色 ,这对于中国AI来说是极大的突破。 R1模型之所以能引发全球震动,除了成本低,其技术突破才是关键。以往的大模型训练,就像是人类手把手教小孩,需要大量人工标注数据和设计规则。但梁文锋团队反其道而行之,把模型扔进一个只有“对”与“错”的环境,让它自己去尝试、去犯错、去成长。就像在2024年美国数学邀请赛(AIME)中,R1一开始解题准确率只有15.6% ,经过80小时自主训练后,飙升至77.9%,配合“自洽解码”技术后更是达到86.7%,超过了全球90%的参赛学生。而且,它在解题时还会像人一样写下反思语句,这简直不可思议。 在算法上,R1也有创新。传统强化学习需要独立算法评估模型表现,而DeepSeek发明的“群体相对策略优化”(GRPO)技术,让模型自己当裁判。这就好比学生们互相批改作业,模型通过对比群体表现来调整自己的策略,不仅节省了30%的算力资源,还使得R1仅用512张H800 GPU,就完成了核心训练阶段。 不过,R1也并非完美无缺。在数据伦理方面,它的基础模型训练数据中包含12%的AI生成内容,虽然没有直接复制竞品,但“知识溯源”的问题还是引发了关于AI知识产权的讨论。在实际应用中,像法律推理和医疗诊断这些对准确性要求极高的领域,R1的长链推理错误率仍有18%,还需要进一步优化。 梁文锋和他的R1模型,给全球AI领域带来了新的思考和方向。低成本、高效能的训练模式,也许会成为未来AI发展的新趋势。各位读者你们怎么看?欢迎在评论区讨论。

0 阅读:0
洒脱风筝

洒脱风筝

感谢大家的关注