让智能体玩转真实网页环境腾讯新框架突破网页智能体自演进瓶颈
让网页智能体自演进突破性能天花板!
腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真实网页环境中实现10%的性能提升。
由此突破现有基于大语言模型(LLM)的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。
研究指出,世界模型具有知识迁移能力,尽管世界模型未专门训练过GitHub中“点击排序菜单”这类操作,却能准确生成GitHub搜索的排序选项(如“最佳匹配”、“最多星标”等),这表明LLM内建的网页结构常识知识具有可迁移性。
另外研究还指出世界模型具有多样化轨迹生成能力,世界模型生成的菜单项与真实网站高度吻合,证明其能有效提升与未见过网站的交互多样性,这种能力源于LLM预训练阶段吸收的海量网页知识。
团队认为,该发现验证了世界模型作为“虚拟网页引擎”的核心价值——即使存在轻微幻觉,其生成的多样化轨迹仍能显著提升Agent的训练效果。
以下是论文详情。