DeepSeek创始人梁文峰再次语出惊人!他说:“我们经常说中国AI和美国有一两

百日依山尽 2025-10-15 13:36:37

DeepSeek创始人梁文峰再次语出惊人!他说:“我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的!” 这位深耕 AI 领域十余年的技术派创业者,从早期参与 Transformer 架构优化到带领团队推出自主研发的大模型,始终以 “不跟风” 著称,连业内都知道他最反感 “拿来主义”,这次的表态显然不是随口一说。 事情得从 OpenAI 的 Sora 横空出世说起,那段时间国内不少企业忙着对标,各种 “类 Sora” 模型密集亮相,数据上看着都不差,有的甚至宣称达到了 GPT-4 七八成的水平。也就是这时候,梁文峰在一场行业闭门会上抛出了那个尖锐观点,当场就有人追问他 “原创差在哪”,他没直接回答,而是翻出了 DeepSeek 的研发日志。 日志里记着他们放弃传统标注数据训练的过程,团队花了八个月打磨 “辩论式训练” 机制,让模型在解题时自己和自己较真,光微积分测试就跑了十万组数据,最终把准确率提至 98.7%,效率比传统模型翻了三倍。这背后是梁文峰坚持的 “产业真问题导向”,他常跟团队说马斯克的例子,说人家搞创新想的是改变文明,不是先算投入产出比。 这种思路在 DeepSeek 落地时体现得更明显。医疗领域里,他们没急着做通用诊断模型,而是扎进罕见病领域,分析数十万份病例后识别出 7 种新的基因突变模式;法律场景中,把合同审查从 8 小时压到 20 分钟,错误率降到 1.5%。这些突破不是靠模仿国外技术参数,而是盯着国内行业的真实痛点啃硬骨头。 反观前两年的 “百模大战”,不少模型刚出来就忙着比参数、拼速度,可真到产业应用时却掉了链子。有企业曾试过用某仿 GPT 模型处理医疗票据,结果错误率高达 12%,还得靠人工返工。梁文峰对此早有察觉,他在内部会议上不止一次强调,美国搞出 GPT 的关键是创新方法论,人家把基础研究、应用开发全压缩在一个组织里,咱们却还在走 “成果转化” 的老路子。 现在行业里已经有了变化。武汉大学团队基于 DeepSeek 开源技术,把机器人灵巧手成本压到 100 美元以内,性能却达到工业级水平,已经在咖啡店里端盘子、超市里理货了。西部数据中心也搭起了算力共享平台,让欠发达地区花三成成本就能用上六成性能的模型。这些实践正好应了梁文峰的话,中国不缺技术储备,论文数量世界第一,也不缺资金投入,缺的是跳出模仿的勇气。 新加坡《联合早报》前不久还在说中美 AI 竞赛没有中场休息,Sora 又拉开了新赛道。但梁文峰团队的探索已经给出另一种可能,他们正在试水量子化推理架构,要是成了,新药研发周期可能从 12 年缩到 3 年。这不再是跟着别人的脚印走,而是自己踩出一条路来。 对此,你们有什么看法,欢迎评论留言~

0 阅读:88

评论列表

用户10xxx60

用户10xxx60

2
2025-10-15 14:34

就你这个水平就不要在这里写小作文。

百日依山尽

百日依山尽

感谢大家的关注