今天下午和朋友讨论人形机器人领域模型的进展,感觉这个行业对创业公司不大友好。我们

真的不是郑小康 2025-03-23 20:35:28

今天下午和朋友讨论人形机器人领域模型的进展,感觉这个行业对创业公司不大友好。

我们去看国外的 Gemini Robotics、π0,以及 Figure 和智元发出来的机器人模型,目前看,机器人模型距离量产应用还很遥远。特斯拉没有公布 Optimus 的模型进展,可以预期的是,特斯拉也许会比这些公司做得好些,但很难好太多超前太多。

那么机器人模型领域当前最大的拦路虎是什么,是连训练模型的数据都没有。

这个问题,国内两家比较典型的做机器人大脑模型的代表,银河通用和智元,前者侧重于仿真为主,仿真 + 遥操,智元侧重于遥操为主,但也有仿真。

所谓遥操,也就是带上 VR 设备,从机器人的视野看出去,操纵机器人的手脚洗衣服做饭…这是干嘛呢,想想智驾系统是怎么积累到老司机数据的?没错,你在操纵机器人积累高质量数据。

机器人模型短期内还很难量产应用,那特斯拉今年生产 5000 个机器人干嘛呢,答案是,先建立初始的数据集。

目前 Optimus 机器人还没有大规模导入国产供应链,还是以类似舍弗勒这样的传统巨头为主,加上那个 22 自由度的灵巧手,一台 Optimus 机器人成本要大概 10 万美金,5000 台就是 5 亿美金。

在这个基础上,再加 5000 个遥操 VR 设备、5000 个遥操测试员、以及能够基于这些数据集训练模型的算力集群。

这未免太烧钱了,不是营销烧钱,是研发未免太贵了点。

讨论到这里,我的想法是人形机器人模型领域需要一个 DeepSeek - R1 时刻,一个低成本开源的方案,大幅降低创业的门槛。

如果没有 DeepSeek - R1 时刻,以当前的范式,那人形机器人只会是一个比 LLM 门槛更高,对创业公司更不友好的领域。

这未免有点无趣了。

——

PS:感觉 Grok 3 的图像生成挺一般的,换 Gemini 内置的 Imagen 3 一试,啊打扰了。Grok 3 还行...

0 阅读:4
真的不是郑小康

真的不是郑小康

感谢大家的关注