#英伟达开源长视频推理神器##单台A100也能训长视频模型# 只用一台A100（

量子位 2025-07-14 18:00:08

#英伟达开源长视频推理神器##单台A100也能训长视频模型# 只用一台A100（8GPU），就能提升大模型对长视频理解能力？英伟达、MIT、港大等机构，提出长视频推理训练框架LongVILA-R1，把强化学习（RL）扩展到了小时级视频。该框架专为“长视频推理”设计，能处理1小时（3600帧）视频，支持输入画面、字幕、声音一起分析，视频中的来龙去脉、发生了什么事，都能理清。该研究有三大创新： - 新型数据集LongVideo-Reason：包含5.2万组问答样本，覆盖剧情、时序、空间、目标等四类复杂推理，数据来自1.8万段视频片段，由大模型辅助生成和标注。 - 两阶段训练流程：先用链式思维微调（CoT-SFT）进行基础学习，再接入GRPO策略强化训练，让模型在更具挑战性的样本中持续优化推理策略。 - 优化的训练系统MR-SP：支持最长3600帧（约1小时）的视频输入，在8张A100显卡上完成训练不爆显存，还带来2.1倍训练加速。实测结果也很亮眼，这个模型在多个视频推理测试里成绩最好，甚至超过了GPT-4o，在空间推理上还追平了Gemini-1.5-Pro。而且，它在足球、扑克、星际争霸这类复杂场景下的表现，展现出强大的跨时间和叙事建模能力。目前代码与模型已开源，官方表示这一框架未来可应用于机器人、教育、医疗、AR/VR等领域，成为长时任务中的“大脑中枢”。感兴趣的小伙伴可以点击：huggingface.co/papers/2507.07966 GitHub：github.com/NVlabs/Long-RL

0 阅读：4

关注前沿科技资讯，追踪人工智能动态

作者最新文章

1

#字节秘密开发MR设备##字节正开发轻量级混合现实眼镜# 字节正悄悄开发混合现实

2

#普通人如何用好零代码开发##和百度秒哒聊聊零代码开发# 在有了AI Codin

3

#强化学习是最佳方案吗##卡帕西谈AI不会复盘# 强化学习不是终点，「反思式学习

4

【#马斯克公司组团升级#】#SpaceX向xAI输血20亿美元# 马斯克公司上演

5

#麦当劳密码竟是123456##麦当劳泄露六千万人简历# 一串“123456”的

6

#英伟达开源长视频推理神器##单台A100也能训长视频模型# 只用一台A100（

7

#OpenAI首个开源模型再延期##OpenAI开源模型因安全测试延期# Ope

8

#小扎挖人收购两不误##Meta收购语音初创公司PlayAI# Meta继续“买

9

#Grok做游戏究竟什么效果##用Grok4迅速构建游戏原型# 用Grok 4构

10

#马斯克曝员工改代码方式##Grok4能将整个源码粘进对话框# 马斯克曝xAI内

热门分类

科技TOP

1

这台是什么手机？

2

华为的麒麟，都开始外卖了。中兴那边，又收到了10亿美金的催缴单。同样姓“中”，这

3

刚刚！何小鹏朋友圈曝光！小鹏汽车董事长何小鹏最新一条关于AI的朋友圈被曝光，他

4

iPhone12，4GB运存iPhone13，4GB运存iPhone14，6

5

意外惊喜来了！国产高性能AI芯片取得又一重磅突破，景嘉微宣布了，旗下边端侧AI芯

6

荣耀Magic8降价突袭！16+512G仅3824元，比首发省1200元✅优惠

7

没想到Magic8系列后面还有4款，分别是Magic8S、Magic8Air

8

iPhone20爆料看来苹果20周年是真的要搞大动作，供应链消息说iPhone

9

nova15Ultra版本和Mate80标准版对比下来，可能Mate80标准版能

10

📱2k价位真香机！荣耀两款机型霸榜京东热卖榜京东2k价位手机热卖榜中，荣耀X

科技最新文章

1

📱2k价位真香机！荣耀两款机型霸榜京东热卖榜京东2k价位手机热卖榜中，荣耀X

2

📱2026中端机卷王诞生！荣耀WINRT闭眼冲不亏！张予曦同款果然没让人失

3

🔥荣耀手机怎么选？一篇帮你搞定！不踩雷攻略来啦！✅旗舰体验首选：荣耀Mag

4

iPhone11，3110mAhiPhone13，3240mAhiPhone

5

听我一句劝！荣耀推出的中高端新机从这四款去选就对了，那么如何选择更切合使用需求？

6

🔥荣耀这波“内斗”太狠了！Magic8和WIN同台竞技，选机困难症直接犯了！

7

鸿蒙6.0最新预告，大家期待一波

8

这台是什么手机？

9

荣耀新机三连发，到底该选谁？一句话帮你理清：·要拍照轻薄，闭眼入500P

10

ho,完全基于当前爆料参数的iPhone折叠3D打印机模出炉，展开7.76寸闭