如果不是外媒把数据拿出来,多少人还蒙在鼓里!本都以为华为的麒麟9020处理器和国

数码科技随时说 2025-01-27 00:56:50

如果不是外媒把数据拿出来,多少人还蒙在鼓里!本都以为华为的麒麟9020处理器和国内13.5纳米极紫外刻光源已经够自己喝一壶了。没有想到现在DeepSeek又给他们上了一课,不仅是英伟达坐不住了,而且你看Meta等国外企业都发声了,国产算是把他们逼疯了!你看国外马克扎克伯的Meta员工是直接把核心问题提了出来,大概意思就是DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,关键他仅用550万美元训练预算的中国公司就做到了这一点。 说白了其实国内外大模型还真不少,但是能在如此成本下,同时没有使用高精尖的芯片,这才是难能可贵的。所以你看就连Scale AI创始人都表示DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当OpenAI DeepSeek中文名字是深度求索。同时也是在2023年7月成立DeepSeek,同时创始人是梁文峰,浙江大学毕业的,攻读人工智能专业,而且人家还是幻方量化的创始人。最为关键的就是他是把AI模型的遮羞布掀开了,说白了DeepSeek最重要的一点就是把成本降低下来了。当DeeSeekV2发布时候,其实字节,腾讯,百度和阿里都已经开始担心了!主要是创新的模型架构本身看似简单,实际上体验甚至媲美OpenAI,训练成成本也不高。所以你看他直接把模型推理成本被降至每百万Tokens(大模型用来表示自然语言文本的单位)仅1元。 另外再看现在,DeepSeek-V3作为升级版本是12月27号发布的。其中包含了MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,性能上已甩开迄今为止发布的所有开源模型。同时比肩GPT-4o,另外1月20日的时候DeepSeek-R1 正式版发布,同时在1月24号,英伟达股价又大跌了3.12%! 其实怎么说呢!你要知道的是目前DeepSeek-R1是开源和免费使用,但是数学、编程等方面的测试和能力真的毋庸置疑了,比如我们看到的测试中,理科方面,解答高考压轴题手到擒来!并生成用于解释量子力学概念的代码动画等。而且在文科方面,它的推理能力提升了信息的丰富度,能够准确回答脑筋急转弯问题,并对历史事件进行详尽分析。 总之!成本低,主要是不用那么多芯片,体验不输chatGPT和OpenAI等知名国外的AI。所以你看多少人追捧,其实说白了!你看现在新能源,比如小米就是两颗OrinX的英伟达AI算力芯片。但是DeepSeek则是可以用过更低端的芯片,关键是成本低,体验好。现在目前苹果商店,包括xiaomi手机里面都能用。中国AI加油,大家怎么看,你有用过现在国内的AI大模型吗

0 阅读:864

评论列表

pig3head

pig3head

2
2025-01-28 14:51

孝子体验遥遥领先

数码科技随时说

数码科技随时说

感谢大家的关注