三巨头同日接入DeepSeek使用deepseek似乎不难，很多人都部署成功了

烨华聊商业 2025-02-02 12:20:39

三巨头同日接入DeepSeek

使用deepseek似乎不难，很多人都部署成功了？因为大模型推理，本来就很简单，代码才1000多行！

群众对大模型技术不太熟悉，美国又狠命忽悠，说是特别高级的高科技，要几百亿美元才做得出。所以，大家容易误会，以为大模型很复杂。

真相是，高水平大模型的“训练”，确实很复杂。中小公司搞不了训练，搞懂都不容易。但是，大模型“推理”，是很简单的。个人就可以把开源的大模型推理，部署成功，真的不难。

例如我下载了deepseek v3的源码，用python写的。python写大模型代码非常紧凑，最大一个代码文件才800行！加上别的源文件，一共1500行代码就差不多了。里面自己实现了fp8的gemm，也就是8比特表示浮点数的矩阵乘法。其它是借了Meta的PyTorch框架，这就是开源的力量，很厉害的程序代码也不长。

当然这是借助了python。如果用C++来，大模型推理其实也不复杂。

我下载了Meta的LLama开源大模型的C++工程源码，核心的llama.cpp也就是1万行，里面描述了如何进行推理计算。按照C语言的标准，这真的不算复杂。加上别的源文件，一共也就3万多行代码。底层实现都说清楚了。就是有个张量矩阵运算库ggml，要支持各种平台和硬件，如cuda、opencl、blas，这个代码量大。但是这是C工程的特色，库函数弄好了就不用管了，编译就行。

看C代码会比较清楚，大模型推理就是进行了图二的计算过程，矩阵不断地乘了加，加了乘，没几步。当然这是一层，deepseek有60层，但就是重复，代码都一样。

所以，只要有厉害的权重文件开源，把大模型推理玩起来是很简单的！自己看代码都不难，个人PC下载来安装小一些权重的都行。

这就是deepseek开源的厉害之处，推理用起来非常容易！

0 阅读：9569

评论列表

书同文车同轨

36

2025-02-03 18:00

就跟华为做出了卫星手机，一夜之间大家就都会做卫星手机一样。。

记忆有害 回复 03-01 21:37
是的，就跟小米一样，只要别人出了，我很快就能出并且给予超越。[滑稽笑][滑稽笑][滑稽笑][滑稽笑][滑稽笑]

万能宠 回复 记忆有害 03-17 05:13
是那种一直在模仿，从未被超越的那种？

天才

13

2025-02-02 16:37

这发明那么厉害，能不能帮警察把骗子揪出来？

用户11xxx80 回复 02-03 00:20
还真能

49xxx77 回复 02-04 03:37
骗子发评论的语气都是一样的，人眼都能识别。像造成武汉遇害儿童母亲跳楼的那些就该坐牢！

zf

10

2025-02-09 07:51

一点都不难。。。牛顿不就是被苹果砸了一下，就想出了万有引力吗？爱因斯坦不就在专利局业余时间花一两年就搞出了对相对论吗？我笨一点，花五年肯定能想出来。

无云月幽幽 回复 03-01 02:58
西门大官人被潘金莲的竹竿砸到，他无视了千娇百媚的美人，思索了一阵，匆匆回去，不久他发表了万有引力，和老子孔子墨子一起被称为西门子[doge][doge]

百分百神圣一击率

10

2025-02-23 19:37

之前没发出来，都不会。一发出来，个个都说，这很简单。古代，说都不知道爆裂性炸药怎么制造，等别人研究出来后，你们说这很简单，又能了。

午睡王国的狮子

9

2025-02-08 08:13

这b是1450，mate是Facebook的

芸芸众生 回复 02-10 06:47
mate就是mate，是人家总公司改名了。mate才是最高一级的名称。

胡归农

6

2025-02-10 06:13

你懂个卵，卵你都不懂，因为你没有。胡说八道

大好河山

6

2025-02-16 23:06

一般人就别折腾了，还是好好用官网的吧，部署对电脑硬件要求很高，没有外星人那种配置，部署上了也会卡的不会动。

大神父王喇嘛 回复 02-25 15:55
外星人的配置就能跑v3版？[哭笑不得][哭笑不得][哭笑不得]没有至少500g的显存，就不要想着部署满血版

陈雨宁

5

2025-02-11 20:19

确实不难，本质就是与或非三门的排列组合，不停的调整各个环节的加乘项的权重，程序自己找到智能排列组合

小星落尘

4

2025-02-04 23:55

？把调用人家的接口叫做大模型？

送你一杯咖啡 回复 02-14 21:19
好像你做得了码农似的。做码农也要学点东西的。别以为源代码是个人都能看懂。

JYYX 回复 03-02 15:50
deepseek执行模块本生只有1800行，用的都是其他公开的库。框架还是transformer并没有给出新框架。现在大模型最重要地方主要在训练数据。deepseek轰动是搞出了新角度更高效的利用算力。动摇了之前GPU估值的部分根基。

用户18xxx20

4

2025-02-07 15:09

你这是调用api

JYYX 回复 03-02 15:50
deepseek执行模块本生只有1800行，用的都是其他公开的库。框架还是transformer并没有给出新框架。现在大模型最重要地方主要在训练数据。deepseek轰动是搞出了新角度更高效的利用算力。动摇了之前GPU估值的部分根基。

悠然

4

2025-02-10 00:42

本地部署个确实简单，问题是带不动和喂资源的问题，单纯部署个十分钟就搞定，问题是没那么大硬盘去喂，纯文本还好，图源一多4060也带不动，自己的电脑也不太可能搞服务器配置，所以还是白扯

芸芸众生 回复 02-10 06:50
很多互联网公司都是用deepseek专注于自家小模型的适配优化，因为可以大大降低调用资源的费用比。

大好河山 回复 02-16 23:09
关键太吃硬件，普通家庭电脑根本带不动，我估计得用多年前挖矿的矿卡才能带的动，还不如直接用官网或360的，官网不差钱自身服务器资源都不够用，都很卡，普通人弄这个纯粹是瞎折腾。

琪乐融融

3

2025-02-15 18:23

难不成我手机下载了这个软件，也叫接入[开怀大笑]

最佳观众 回复 03-04 17:43
如果你手机关闭流量和WiFi能用，那么你手机就叫架设成功。

真得瑟

3

2025-03-05 00:23

什么时候接入CAD，我不想画图了

小老虎

2

2025-02-04 13:12

感谢分享

烨华聊商业

感谢大家的关注

作者最新文章

1

货币的全球主导地位通常是一个世纪，美元到时间了这图有点牵强，把早年的意大利、葡萄

2

德银：美元贬值40%消除贸易逆差？1。德意志首席银行经济学家peter Hoo

3

看不起印度，是危险的误判我一直也是这个意见，中国舆论太轻视印度了。印度的表现有两

4

这两幅图代表什么意思？在中东，特朗普收获不错。海湾国家这次显示了重要性，沙特、卡

5

Nicholas Eberstadt：中国的“知识资本”被PISA测试成绩夸大2

6

王楚钦vs林昀儒王楚钦打疯了，4:0让林昀儒没脾气。长台相持能力，应该没人打得过

7

存款利率下调钱要不要分散放因人而异吧，一点风险都承受不了的人，就老实在存款里呆着

8

一件T恤，工人只得到1%的价值全球服装上万亿美元，有几千万名员工，过去二十年增长

9

看下中美日三国的30年期国债的利率走势，差别太大了2014年到2025年，日本3

10

《大美丽法案》与美债危机加剧1. 真是这名，Big Beautiful Bill

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

财经TOP

1

6月16日，全天封板复盘。

2

【琅河财经】许家印太天真了，他以为丁玉梅带着500亿，跑到国外就能逃出生天？国家

3

世界十大产油国：一、美国：产量1316万桶/天二、大鹅：产量979万桶/天三、沙

4

我老婆是从2000年的七月份开始抄的股票。当时手里的本金只有7万，准确来说转

5

美国想的真好，想把比特币甩给我们，然后成功消除36万亿美元国债，然而让美国崩溃的

6

注意了！A股再冲3400点！注意券商股表现！今天A股波动加剧，明显地多空拉扯，冲

财经最新文章

1

注意了！A股再冲3400点！注意券商股表现！今天A股波动加剧，明显地多空拉扯，冲

2

世界十大产油国：一、美国：产量1316万桶/天二、大鹅：产量979万桶/天三、沙

3

6月16日，全天封板复盘。

4

【琅河财经】许家印太天真了，他以为丁玉梅带着500亿，跑到国外就能逃出生天？国家

5

美国想的真好，想把比特币甩给我们，然后成功消除36万亿美元国债，然而让美国崩溃的

6

我老婆是从2000年的七月份开始抄的股票。当时手里的本金只有7万，准确来说转