DeepMind发布Genie 3:“世界模型”进入可交互时代 DeepM

游乐看科技 2025-08-06 08:16:55

DeepMind 发布 Genie 3:“世界模型”进入可交互时代 DeepMind 正式推出 Genie 3,其首创让用户或 AI 代理以 自然语言生成并实时探索交互式虚拟环境,分辨率达 720p、24 fps,支持持续数分钟的环境互动作业,且可通过提示动态改变场景设置(如天气、角色等)。 Genie 系列始于 Genie 1 与 Genie 2,但 Genie 3 是首个兼容真实时间控制、拥有“视觉记忆”的模型:当你转身离开,再返回原位,之前场景保持一致,不会重新生成或错位。 DeepMind 团队将其视为迈向 通用人工智能(AGI) 关键一步。借助这种模拟环境,未来 AI 软件可在虚拟空间中进行训练、测试与推理,从而减少实体世界中的实验风险与成本规避。嵌入模拟的 AI 代理,如 SIMA,已可在 Genie 3 生成的场景中执行任务(如下达导航、互动指令)。 Genie 3 的意义在于它不仅是一个“智能画图工具”,而更像“程序化沙盒”:你描述场景、给出命令,它即时生成可行动的三维世界,视觉连贯性和物理交互性显著提升。这使得它不仅适用于游戏设计、动画创作等娱乐领域,也具备沉浸式训练、机器人模拟、应急预案等研究价值。但也要看到目前模型仍有局限:物理规则生成并非完全健全,且开放使用仅限于受邀测试者、尚未进入公众应用阶段。 总的看,Genie 3 是开源世界模型生态的重要对标,并将推动 Veo 视频生成模型和 Gemini 系列语言模型与“模拟智能体训练”融合,模拟训练将作为 AI 技术发展的核心环节受到重视。 🟦 你觉得这种“生成可探索的虚拟世界”技术,会在哪些场景改变游戏规则? 数码真相集 智家与网络 AI世界模型 Genie3 虚拟仿真

0 阅读:7
游乐看科技

游乐看科技

感谢大家的关注