Do Agents Know What They Can't Do? Evaluating Feasibility Awareness in Tool-Using Agents
arxiv.org原文 ↗
它关注的是“提前停止”的能力,而不是更努力地调用工具。这个方向很实用:在工具缺失或权限不足时,agent 的主要失败不是答错,而是持续消耗 token、时间和副作用预算。
–浏览
arxiv.org原文 ↗
评论 · Comments