Rubin是首代大规模搭载HBM4的架构。在技术层面，训练主要是Comp

梁斌聊商业 2026-02-02 00:09:51

Rubin 是首代大规模搭载 HBM4 的架构。在技术层面，训练主要是 Compute-bound（计算受限），Batch比较大，而推理，尤其是长文本和高并发，是极度 Memory-bound（带宽受限）的，Batch小，延迟要求高，毕竟是服务大量群众的。Rubin 把带宽拉到 20TB/s 以上，本质上就是为了解决推理时的吞吐瓶颈。

Rubin 当然能训练，英伟达的卡从来不偏科。但为什么要强调推理？因为 HBM4。训练吃算力，推理吃带宽。Rubin 把内存带宽拉到 Blackwell 的两倍多，摆明了是要在推理端降维打击，能训练是保底，推理成本降一个数量级才是 Rubin 让大厂掏钱的主要原因。。

现在大厂手里囤了那么多 H100 还没跑满，为什么还要盯着还没出的 Rubin？就是因为推理太贵。训练是研发投入，咬牙也就过了；但推理是日活开支，那是每天都在烧的钱。Rubin 的 HBM4 就是避免长期烧钱，没有谷歌的TPU也就算了，现在有个魔鬼TPU在边上，TPU 推理每 Token 成本比 H100 低 4 倍，不求变是不行的，不买是不行的。。

我厂有很多V100，也有H100，AMD 的MI250，300X 等，现在GB200还太贵，TPU要用谷歌云不方便，Rubin还没发布，我作为厂长，当然要了解和学习这里面的名堂。。当然我肯定没写过实际代码，就像老黄也没写过，不妨碍我们吹牛啊，对不对。

0 阅读：0

梁斌聊商业

感谢大家的关注

作者最新文章

1

同志们去买珍珠去了，每个员工一挂，我买单，我躲在酒店游了个泳，然后休息，导游吓坏

2

一月份结束了，仅收6.2万美金，无杠杠，无压力，比较轻松，对于我这种业余小散，可

3

昨晚很多票都大跌，我还收了3000美金，虽然，算收益率不值得一提，但每天多少捞一

4

昨天公司同事问我黄金看到多少？我调查了一下，好多人都买了，包括很多没有投资经验的

5

计划今天晚上大部分股票都卖掉，等美伊问题明朗了再回来

6

开完年会，团结的大会，胜利的大会。今天出发去旅游，用上了我从香港买的霸道广角，拍

7

年会抽奖，一等奖iphone 17 pro max；二等奖影石360无人机；三等

8

公司在北海开年会，规模已经起来了北海·北海万豪度假酒店

9

今天收到了香港大火捐款收据，厂里捐两万，我捐一万。。力所能及献上了一点爱心。

10

昨天看到有人讨论佩罗西轻仓苹果，英伟达等大厂的股票的图片，是不是美帝准备对伊朗动

热门分类

财经TOP

1

黄金价格极简史

2

二月份，A股必看热点题材全汇总！！！

3

2月3日游资龙虎榜

4

原来人老了真的会缩水啊

5

2026年，A股走势大盘点！！！

6

好利来生意好不是没原因的。

7

资产千万的大佬，都有哪些烦恼？

8

美国为何不直接冻结中国在美资产？就这么说吧，美国要是真冻结了，反而是帮了中国一把

9

看完涨知识了

10

被低估的颜值。

财经最新文章

1

我闺蜜手里有50万，她把这50万全换成了实物金条，她说黄金能抗通胀，还能当传

2

下周A股就要开市了！过年期间，跟一位炒股多年的朋友交流，他给我说了他的炒股九不买

3

股价最低的20只大盘股！1.中国能建.601868：现价2.39元2.包钢股份.

4

春节档电影谁赚钱，谁亏损，目前来看已经挺明朗了《飞驰人生3》总投资：7亿元（

5

2026股市十大预言：预言10及应对策略。一、全年大方向-大势：慢牛、震荡上行

6

大胆推测，未来10个月黄金走势：1、2月：约1100/克，略微往下调整；2、3月

7

金价未来走势会如何变化！最近金价波动特别大，很多朋友都在关心接下来怎么走。

8

金银价再度大涨2026年2月，金银价再度大涨，这波行情简直炸场！伦敦金现货站稳

9

A股暗藏“黄金坑”！6只10元以下机器人名单汇总，建议收藏研究！1、巨轮智能（现

10

当所有人把钱换成了黄金。就会开始收割了。它就会从1600元一克慢慢降