每日 Harness 开源 · Source
返回本期 · Back to 2026-06-03

论文 · Papers2026-06-03 · Wednesday, June 3, 2026

MCP-Persona: Benchmarking LLM Agents on Real-World Personal Applications via Environment Simulation

arxiv.org原文 ↗

MCP-Persona: Benchmarking LLM Agents on Real-World Personal Applications via Environment Simulation
论文构建模拟个人应用环境的 MCP agent benchmark,用于评估社交、日程、邮件等个人数据场景中的工具使用。
浏览

评论 · Comments