每日 Harness 开源 · Source
主题 · All topics

3.2 上下文工程Context Engineering

本主题共 12 条 · 最早 2026-05-29 · 最新 2026-06-04

视图 · View

2026 年 6 月9

  • mksglu/context-mode

    Context Mode 是 MCP server 和 CLI proxy,作为 AI coding assistants 与 context window 之间的 sandboxed execution/indexing layer。公开摘要称它拦截 Bash、WebFetch、Read 等 tool calls,在隔离 subprocess 中运行,把 raw output 索引进 SQLit…

    2026-06-04github.com原文 ↗
  • chopratejas/headroom

    Headroom 压缩 agent 读取的 tool outputs、logs、files 和 RAG chunks,定位为 library、proxy、ASGI middleware、callback 和 MCP server。README 称典型上下文中 70-95% 是 boilerplate,项目目标是在进入 LLM 前压缩掉这些冗余,并支持 LangChain、LangGraph、Agn…

    2026-06-04github.com原文 ↗
  • Moxie Docs

    Moxie Docs 为 GitHub repo 建立 living index,把源代码、测试、文档和历史整理成人可读文档与 agent 可读 MCP context。主页写明每次 merge 后会保持索引更新,提供 source-cited docs、repo conventions、doc gaps 和 verified commands;Starter 计划覆盖 3 个私有 repo、每…

    2026-06-04moxiedocs.com原文 ↗
  • KVarN: Variance-Normalized KV-Cache Quantization Mitigates Error Accumulation in Reasoning Tasks

    针对长 horizon reasoning decoding 中 KV-cache 量化误差随时间积累的问题,提出 calibration-free 的 KVarN。方法先做 Hadamard rotation,再对 K/V 矩阵双轴做 variance normalization,以修正 outlying token-scale errors。论文报告在 MATH500、AIME24 和 Hum…

    2026-06-04arxiv.org原文 ↗
  • Carto

    Carto 为 AI coding agents 生成代码库 domain map、blast radius 和 MCP 工具形式的结构化上下文。digest 对它的定位很明确:帮助 agent 在改代码前理解模块、影响范围和业务域边界。它不是通用检索器,而是把 codebase map 变成可供 agent 查询的操作对象。对于大型 repo,blast radius 信息能帮助控制改动范围和测…

    2026-06-04github.com原文 ↗
  • LongAttnComp: Cross-Family Context Compression for Long-Context Reasoning

    论文研究跨模型家族的长上下文压缩,用于减少 100k+ token 输入的 prefill 成本。

    2026-06-03arxiv.org原文 ↗
  • Leyline: KV Cache Directives for Agentic Inference

    Leyline 针对 agentic inference 提出 KV cache directives,用来处理工具调用失败、输出删除、轨迹分叉、回滚和重试等非线性对话操作。传统 KV cache 默认上下文按前缀追加,但 agent 工作流经常需要废弃 stale observation 或从中间节点另开分支。值得看的是,它把推理系统优化从单条聊天流吞吐扩展到 agent 状态编辑和分支探索。

    2026-06-03arxiv.org原文 ↗
  • Stria

    Stria 是面向 LLM agents 的 grammar-free structural codebase indexer 和 MCP server。它不用 tree-sitter 或语言 parser,而用 phrase extraction 生成结构索引;README 称标准仓库约 0.16 秒 build、sub-ms queries,3.1GB Linux kernel 72,000…

    2026-06-02github.com原文 ↗
  • Learning Agent-Compatible Context Management for Long-Horizon Tasks

    AdaCoM 训练一个外部 LLM 管理冻结 agent 的上下文,用可学习的修改动作在保留约束、进展和证据的同时删除过期内容。论文在 web search 和 deep research benchmarks 上测试,提出 Fidelity-Reliability Trade-off:强 agent 需要更高保真上下文,弱 agent 反而需要更激进压缩。它的工程意义是上下文管理可作为可迁移模块…

    2026-06-02始 2026-06-01arxiv.org原文 ↗

2026 年 5 月3

  • Notation Matters: A Benchmark Study of Token-Optimized Formats in Agentic AI Systems

    它把“格式选择”从工程品味拉回到可测量变量:agent 系统中每一步都复制状态、工具结果和结构化参数,冗余 notation 会被循环放大。真正的价值在于提醒评测应同时报告任务质量与 token/latency,而不是只看成功率。

    2026-05-30arxiv.org原文 ↗
  • Periodic RoPE for Infinite Context LLMs

    这不是简单拉长插值,而是把局部位置和全局交互分层处理,因此理论上避免无限外推。摘要仍较短,实际有效性取决于任务是否需要精确全局顺序,而 NoPE 全局层可能牺牲一部分位置可辨性。

    2026-05-29arxiv.org原文 ↗
  • Lum1104/Understand-Anything

    它把代码理解产物显式化为图,而不是只让 agent 临时读文件。价值在可视化和可复用上下文;风险是图谱新鲜度、抽取准确性和大型仓库增量维护成本。

    2026-05-29github.com原文 ↗