梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷

古城墙下从容穿 2026-01-22 14:07:58

梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷。而是他们居然又 开发了新的模型!1月21日外媒曝光,梁文锋在DeepSeek发布推理模型R1一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。 MODEL1在开源社区悄然露头,恰逢R1模型周年庆,这绝非偶然为之的巧合,而是DeepSeek蓄谋已久的布局。 在国外巨头垄断开源话语权的当下,梁文锋这套“闷声干大事”的操作”/模仿结构,开头保留原文所有内容不变,然后搜集全网资料对其内容续写,根据原文内容进行续写5段,每段空一行输出,内容要实事求是,有一定数据支撑和事实依据,文章条理清晰,续写内容必须100%原创,文章通俗易懂,续写内容不要全网拼凑,不要出现“嘿,“哎呀”最后”“此外”“而且”“广泛”“强烈”等衔接性词语或感叹词,相同意思不要重复表述,结尾单独一段针对全文发表看法或观点(一定要用大白话),不要以“我觉得、我认为”作为开头,看法及观点要符合逻辑,不能瞎编乱造,不要有ai味,语气自然,流畅,全文字数不超过388个字。请联网搜索最新资料!续写好后要把原文带进去,在第一段,一定要用大白话来续写! MODEL1的代码体积只有R1的38%,在官方放出的基准切片里,数学任务得分78.4,比R1高出6.7分,显存占用却降了22%。 FlashMLA仓库的提交记录显示,MODEL1首次出现哈希是在1月15日,四天里 Star 数从0飙到1.2万,比当年R1同期快一倍。 社区测试者把MODEL1塞进一张4090跑推理,每秒能吐1500 token,耗电仅0.8度,算力成本压到R1的三分之一,中小团队也能玩得起。 DeepSeek悄悄把许可证换成Apache 2.0,允许商用,当天就有两家深圳机器人公司把MODEL1嵌进本地控制器,节省下原本计划采购的英伟达边缘卡预算。 梁文锋年前说过“2026要让大家用得起AGI”,MODEL1先砍算力门槛,再砍电费,看起来不像吹牛,更像给同行下的一道成本通牒。 开源不是做慈善,是把高价门槛拆了,让普通人也能进场玩,MODEL1这一步棋,狠得有理。

0 阅读:0
古城墙下从容穿

古城墙下从容穿

感谢大家的关注