Tool Forge: A Validation-Carrying Toolchain for Governed Agentic Execution
arxiv.org原文 ↗
Tool Forge 的价值不在“又做一个工具注册表”,而在把工具生成、验证、生命周期和路由合成一个可审计工件链。它的局限也在摘要里说得很清楚:当前数字是初始系统 benchmark,尚未证明面对对抗路由、真实 API grounding 和跨系统评估时仍成立。
–浏览
arxiv.org原文 ↗
评论 · Comments