【[29星]V1:通过设计辅助任务推动多模态推理的项目。亮点:1. 引入未来预测任务,挑战多模态大模型的推理能力;2. 数据集规模达33K视频,涵盖多种视频来源;3. 采用自监督学习,无需手动标注,高效且可扩展】
'V1: Toward Multimodal Reasoning by Designing Auxiliary Tasks'
GitHub: github.com/haonan3/V1
多模态推理 视频预测 自监督学习 AI创造营
【[29星]V1:通过设计辅助任务推动多模态推理的项目。亮点:1. 引入未来预测任务,挑战多模态大模型的推理能力;2. 数据集规模达33K视频,涵盖多种视频来源;3. 采用自监督学习,无需手动标注,高效且可扩展】
'V1: Toward Multimodal Reasoning by Designing Auxiliary Tasks'
GitHub: github.com/haonan3/V1
多模态推理 视频预测 自监督学习 AI创造营
作者最新文章
热门分类
科技TOP
科技最新文章