美国这是受到什么刺激了!想出名想疯了,因为李飞飞团队真的做出来了替代deepseek的大模型!市场炸锅了,本以为只用了50美元已经够炸裂了,没有想到还是我肤浅了。真TM讽刺啊!因为经过记者调查发现,这个号称李飞飞团队做出来的s1模型训练,并不是从零开始,而且其基座模型为是国内阿里通义千问(Qwen)模型,同时也只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。 简单一点来说李飞飞团队就是哗众取宠!美国真的是想出名想疯了,前面说deepseek蒸馏的的OpenAICEO以及美国肠子都悔青了,因为他们发现deepseek早就开始大模型研发了。最后事情不了了之,反而是美国开始服软,此外OpenAI旗下的GPT为了争抢更多的用户,直接开放了,不用注册就可以用。 而现在的李飞飞,首先是低成本训练的成功也引发了对AI模型知识产权的疑问,这一点毋庸置疑。其次可不要忽略了本质,那就是1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。 怎么说呢!其实行内人都知道。因为一旦把s1模型换成其他基座模型,新模型就是一盘散沙,根本没有任何的提升和价值。所以你要说真正神奇的是Qwen模型,而不是s1。这才是真正的蒸馏啊!就问美国打脸不
美国这是受到什么刺激了!想出名想疯了,因为李飞飞团队真的做出来了替代deepse
数码科技随时说
2025-02-07 12:59:20
0
阅读:9361
pc2boy
是的,就属于蒸馏再蒸馏那种,没有多大实际作用
用户10xxx13 回复 02-12 10:19
有作用,譬如蒸馏一个大模型中的专业数据,用dp算法为本单位建一个专用小型AI网络,以后调取数据,推理可行性,比一帮人开会省事多了,费用还那么低
Sean 回复 02-09 09:42
犹太喜欢把别人都当成SB
清风明月
美国是真的害怕了,如果失去科技霸权,那么美元霸权和军事霸权都是空中楼阁
网友
牛鬼蛇神都出来了![doge]
L722T
深度求索出了名,树大招风,什么样的人和团队都想来蹭热度。
大神父王喇嘛 回复 02-11 16:18
教母再做ImageNet项目的时候,你估计还是液体,当然没听说过了
败天 回复 02-13 22:44
她是教母又如何,她现在的位置只会帮着美国打中国
既来之则安之
你的意思,你比你的美国主子更聪明了?
大牛
魑魅魍魉牛鬼蛇神群魔乱舞脏水横流
大道至简
印度心态。飞飞心态崩了
无趣
干爆ai,把美国依赖ai继续霸占世界的想法破灭!
一花一世界 一念一尘缘
干死的是霉国AI而已,因为等于告诉世界霉国AI是一个圈钱行业,很快霉国AI行业巨头后面的金主就会离开,然后留下一地鸡毛。
用户10xxx83
50美元,搞AI大模型,你是在搞笑吗?
山川
李鬼而已
大神父王喇嘛
李飞飞还是别喷了
用户10xxx74
50刀干成模型,智商正常人都不会信。
相随
查查这个记者!!!现在为啥不说身体是最真实的了?美国四大科技巨头主动连入DS,你当人家比你傻?
unfair
五十美元蒸馏大模型和当年50元打磨芯片有异曲同工之妙
my god
开源是大杀器
用户86xxx77
为什么我用deepseek app感觉还不如豆包
凯风自南
如果真是这么简单,美国以前怎么没蒸馏?等啥呢?
又是一年四月天
英伟达又涨到了130
或许天南海阔
这都有人信,科研要踏踏实实。
用户13xxx86
狗急跳墙?