每日 Harness 开源 · Source
返回本期 · Back to 2026-06-05

论文 · Papers2026-06-05 · Friday, June 5, 2026

The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development?

arxiv.org原文 ↗

The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development?
Meta-Agent Challenge 测的是 frontier models 能否自主开发 agent 系统,而不是能否在单题上写代码。摘要将 MAC 定位为开放 benchmark,并把它作为评估 recursive self-improvement 的经验代理;这个设置把系统搭建、工具组合和自我迭代纳入同一个任务面。
浏览

评论 · Comments