2026 年 6 月9
-
mksglu/context-mode
Context Mode 是 MCP server 和 CLI proxy,作为 AI coding assistants 与 context window 之间的 sandboxed execution/indexing layer。公开摘要称它拦截 Bash、WebFetch、Read 等 tool calls,在隔离 subprocess 中运行,把 raw output 索引进 SQLit…
原文 ↗– -
chopratejas/headroom
Headroom 压缩 agent 读取的 tool outputs、logs、files 和 RAG chunks,定位为 library、proxy、ASGI middleware、callback 和 MCP server。README 称典型上下文中 70-95% 是 boilerplate,项目目标是在进入 LLM 前压缩掉这些冗余,并支持 LangChain、LangGraph、Agn…
原文 ↗– -
Moxie Docs
Moxie Docs 为 GitHub repo 建立 living index,把源代码、测试、文档和历史整理成人可读文档与 agent 可读 MCP context。主页写明每次 merge 后会保持索引更新,提供 source-cited docs、repo conventions、doc gaps 和 verified commands;Starter 计划覆盖 3 个私有 repo、每…
原文 ↗– -
KVarN: Variance-Normalized KV-Cache Quantization Mitigates Error Accumulation in Reasoning Tasks
针对长 horizon reasoning decoding 中 KV-cache 量化误差随时间积累的问题,提出 calibration-free 的 KVarN。方法先做 Hadamard rotation,再对 K/V 矩阵双轴做 variance normalization,以修正 outlying token-scale errors。论文报告在 MATH500、AIME24 和 Hum…
原文 ↗– -
Carto
Carto 为 AI coding agents 生成代码库 domain map、blast radius 和 MCP 工具形式的结构化上下文。digest 对它的定位很明确:帮助 agent 在改代码前理解模块、影响范围和业务域边界。它不是通用检索器,而是把 codebase map 变成可供 agent 查询的操作对象。对于大型 repo,blast radius 信息能帮助控制改动范围和测…
原文 ↗– -
LongAttnComp: Cross-Family Context Compression for Long-Context Reasoning
论文研究跨模型家族的长上下文压缩,用于减少 100k+ token 输入的 prefill 成本。
原文 ↗– -
Leyline: KV Cache Directives for Agentic Inference
Leyline 针对 agentic inference 提出 KV cache directives,用来处理工具调用失败、输出删除、轨迹分叉、回滚和重试等非线性对话操作。传统 KV cache 默认上下文按前缀追加,但 agent 工作流经常需要废弃 stale observation 或从中间节点另开分支。值得看的是,它把推理系统优化从单条聊天流吞吐扩展到 agent 状态编辑和分支探索。
原文 ↗– -
Stria
Stria 是面向 LLM agents 的 grammar-free structural codebase indexer 和 MCP server。它不用 tree-sitter 或语言 parser,而用 phrase extraction 生成结构索引;README 称标准仓库约 0.16 秒 build、sub-ms queries,3.1GB Linux kernel 72,000…
原文 ↗– -
Learning Agent-Compatible Context Management for Long-Horizon Tasks
AdaCoM 训练一个外部 LLM 管理冻结 agent 的上下文,用可学习的修改动作在保留约束、进展和证据的同时删除过期内容。论文在 web search 和 deep research benchmarks 上测试,提出 Fidelity-Reliability Trade-off:强 agent 需要更高保真上下文,弱 agent 反而需要更激进压缩。它的工程意义是上下文管理可作为可迁移模块…
原文 ↗–
2026 年 5 月3
-
Notation Matters: A Benchmark Study of Token-Optimized Formats in Agentic AI Systems
它把“格式选择”从工程品味拉回到可测量变量:agent 系统中每一步都复制状态、工具结果和结构化参数,冗余 notation 会被循环放大。真正的价值在于提醒评测应同时报告任务质量与 token/latency,而不是只看成功率。
原文 ↗– -
Periodic RoPE for Infinite Context LLMs
这不是简单拉长插值,而是把局部位置和全局交互分层处理,因此理论上避免无限外推。摘要仍较短,实际有效性取决于任务是否需要精确全局顺序,而 NoPE 全局层可能牺牲一部分位置可辨性。
原文 ↗– -
Lum1104/Understand-Anything
它把代码理解产物显式化为图,而不是只让 agent 临时读文件。价值在可视化和可复用上下文;风险是图谱新鲜度、抽取准确性和大型仓库增量维护成本。
原文 ↗–