如果不是外媒把数据拿出来，多少人还蒙在鼓里！本都以为华为的麒麟9020处理器和国

如果不是外媒把数据拿出来，多少人还蒙在鼓里！本都以为华为的麒麟9020处理器和国内13.5纳米极紫外刻光源已经够自己喝一壶了。没有想到现在DeepSeek又给他们上了一课，不仅是英伟达坐不住了，而且你看Meta等国外企业都发声了，国产算是把他们逼疯了！你看国外马克扎克伯的Meta员工是直接把核心问题提了出来，大概意思就是DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，关键他仅用550万美元训练预算的中国公司就做到了这一点。说白了其实国内外大模型还真不少，但是能在如此成本下，同时没有使用高精尖的芯片，这才是难能可贵的。所以你看就连Scale AI创始人都表示DeepSeek在他们的测试里是表现最好的，与美国最好的模型相当OpenAI DeepSeek中文名字是深度求索。同时也是在2023年7月成立DeepSeek，同时创始人是梁文峰，浙江大学毕业的，攻读人工智能专业，而且人家还是幻方量化的创始人。最为关键的就是他是把AI模型的遮羞布掀开了，说白了DeepSeek最重要的一点就是把成本降低下来了。当DeeSeekV2发布时候，其实字节，腾讯，百度和阿里都已经开始担心了！主要是创新的模型架构本身看似简单，实际上体验甚至媲美OpenAI，训练成成本也不高。所以你看他直接把模型推理成本被降至每百万Tokens（大模型用来表示自然语言文本的单位）仅1元。另外再看现在，DeepSeek-V3作为升级版本是12月27号发布的。其中包含了MoE模型，671B参数，激活37B，在14.8Ttoken上进行了预训练，性能上已甩开迄今为止发布的所有开源模型。同时比肩GPT-4o，另外1月20日的时候DeepSeek-R1 正式版发布，同时在1月24号，英伟达股价又大跌了3.12%！其实怎么说呢！你要知道的是目前DeepSeek-R1是开源和免费使用，但是数学、编程等方面的测试和能力真的毋庸置疑了，比如我们看到的测试中，理科方面，解答高考压轴题手到擒来！并生成用于解释量子力学概念的代码动画等。而且在文科方面，它的推理能力提升了信息的丰富度，能够准确回答脑筋急转弯问题，并对历史事件进行详尽分析。总之！成本低，主要是不用那么多芯片，体验不输chatGPT和OpenAI等知名国外的AI。所以你看多少人追捧，其实说白了！你看现在新能源，比如小米就是两颗OrinX的英伟达AI算力芯片。但是DeepSeek则是可以用过更低端的芯片，关键是成本低，体验好。现在目前苹果商店，包括xiaomi手机里面都能用。中国AI加油，大家怎么看，你有用过现在国内的AI大模型吗

0 阅读：864