每日 Harness 开源 · Source
返回本期 · Back to 2026-05-29

论文 · Papers2026-05-29 · Friday, May 29, 2026

Tool Forge: A Validation-Carrying Toolchain for Governed Agentic Execution

arxiv.org原文 ↗

Tool Forge: A Validation-Carrying Toolchain for Governed Agentic Execution
Tool Forge 的价值不在“又做一个工具注册表”,而在把工具生成、验证、生命周期和路由合成一个可审计工件链。它的局限也在摘要里说得很清楚:当前数字是初始系统 benchmark,尚未证明面对对抗路由、真实 API grounding 和跨系统评估时仍成立。
浏览

评论 · Comments