每日 Harness 开源 · Source
返回本期 · Back to 2026-05-30

论文 · Papers2026-05-30 · Saturday, May 30, 2026

Notation Matters: A Benchmark Study of Token-Optimized Formats in Agentic AI Systems

arxiv.org原文 ↗

上下文工程评测方法系统·基础设施
Notation Matters: A Benchmark Study of Token-Optimized Formats in Agentic AI Systems
它把“格式选择”从工程品味拉回到可测量变量:agent 系统中每一步都复制状态、工具结果和结构化参数,冗余 notation 会被循环放大。真正的价值在于提醒评测应同时报告任务质量与 token/latency,而不是只看成功率。
浏览

评论 · Comments