From Model Scaling to System Scaling: Scaling the Harness in Agentic AI
arxiv.org原文 ↗
论文主张把 foundation model 外围的 harness 作为 agentic AI 的一等扩展对象,而不是只比较模型权重。它关注上下文构造、工具调用、执行编排、验证与记忆等系统层能力,强调长任务表现常由 harness 决定。价值在于把 agent 评估从“模型分数”推向“模型加执行层”的可复现实验。
–浏览
评论 · Comments