每日 Harness 开源 · Source
返回本期 · Back to 2026-06-03

论文 · Papers2026-06-03 · Wednesday, June 3, 2026

OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents

arxiv.org原文 ↗

OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents
OpenWebRL 研究视觉 Web agent 的在线多轮强化学习,重点是让 agent 在动态网页环境中交互试错,而不是只模仿静态监督轨迹。论文讨论浏览器环境、视觉观察、动作空间、奖励与长程 credit assignment 等系统问题。值得看的是,Web agent 训练正在从“看截图做 imitation”转向“在网页里持续探索并修正策略”。
浏览

评论 · Comments