Google 发布 Gemini 2.5 Computer Use 模型 Google 于 10 月 8 日发布全新 Gemini 2.5 Computer Use 模型,可在浏览器环境中执行网页任务和交互操作。 该模型基于视觉理解与推理技术,能够直接识别网页内容并完成具体操作,如自动填写表单、提交信息或执行 UI 测试,为缺乏 API 的系统提供自动化方案。谷歌表示,这是 Gemini 系列在推进「可执行任务型 AI 代理」的重要成果。 据悉,Gemini 2.5 Computer Use 支持 13 种基础操作,包括打开网页、输入文字、点击按钮、拖放对象等,适用于测试、任务自动化与网页导航等场景。谷歌表示,该模型在多项网页与移动端基准测试中表现优于同类产品,但目前尚未针对桌面系统级控制进行优化。
Google发布Gemini2.5ComputerUse模型 Goo
飞雪科技
2025-10-10 16:57:43
0
阅读:1