AIRGuard: Guarding Agent Actions with Runtime Authority Control
arxiv.org原文 ↗
这篇论文的判断很正确:agent 风险真正落地在“动作执行”时刻。把权限检查放在 action boundary,比在自然语言层面要求模型自律更稳;挑战是权限策略必须足够细粒度,否则会在可用性和安全性之间来回摆动。
–浏览
arxiv.org原文 ↗
评论 · Comments