返回本期 · Back to 2026-06-03 论文 · Papers2026-06-03 · Wednesday, June 3, 2026 MCP-Persona: Benchmarking LLM Agents on Real-World Personal Applications via Environment Simulation arxiv.org原文 ↗ 基准协议与互操作工具使用其他垂直 论文构建模拟个人应用环境的 MCP agent benchmark,用于评估社交、日程、邮件等个人数据场景中的工具使用。 –浏览 –点赞 复制链接 评论 · Comments
评论 · Comments