6.1 框架与脚手架Frameworks & Scaffolds

本主题共 147 条 · 最早 2026-05-29 · 最新 2026-07-25

视图 · View

2026 年 7 月57

agegr/pi-web
pi-web 为 Pi 编码 Agent 提供本地 Web 界面，可浏览历史会话、实时聊天、切换模型并管理技能。前端把命令行 Agent 的状态与配置暴露成可远程访问的工作台，方便长任务观察和多设备使用。部署时应把认证与网络监听配置视为核心功能，因为界面可能直接拥有代码执行能力。
Trending2026-07-25github.com原文 ↗
–
Rendi
Rendi 是基于 Trigger.dev 的 agent harness，把长时后台任务、浏览器自动化和邮件工具放进托管作业系统，无需为每个 agent 单独维护虚拟机。它借助队列、重试和持久执行处理超出一次请求生命周期的工作；路线的优势是复用成熟任务基础设施，代价是安全隔离依赖平台与工具权限设计。
Project2026-07-24github.com原文 ↗
–
LLM Budget Cap
LLM Budget Cap 是一个 Python 包，用 Redis Lua 脚本原子地预留、结算和释放 LLM 调用预算，解决多 worker 并发时“各自检查都未超额、合计却穿透上限”的竞态。README 提供同步与异步客户端，并支持按美元或 token 设日/月共享额度；它把预算控制做成基础设施原语，而不是应用层粗略计数。
Project2026-07-24github.com原文 ↗
–
Fleet
Fleet 用 Telegram topic 映射独立的 Claude Code 或 Codex 会话，让用户从手机发送指令、接收输出，并保持每项任务的上下文隔离。项目把即时通讯当作远程控制面，而不是新建一套聊天 UI；它适合异步监督，但权限、日志脱敏和误触发边界需要部署者认真配置。
Project2026-07-24github.com原文 ↗
–
MoonshotAI/kimi-code
Kimi Code 是终端编程代理，可读取仓库、编辑文件、运行命令并在任务中维护上下文。项目支持多模型后端和工具调用，工作方式接近可脚本化的 coding agent，而非单纯补全插件。开源实现便于审计提示词与执行边界，也让团队能按自身审批和沙箱策略改造。
Trending2026-07-23github.com原文 ↗
–
Introducing OpenAI Presence
OpenAI 发布 Presence，提供部署企业语音和聊天智能体所需的渠道接入、会话运行与运营工具。产品把实时模型能力包装成面向客服和业务流程的托管平台，减少团队自行拼装电话、消息和 agent runtime 的工作。它也使可观测性、人工接管和合规记录成为平台竞争的一部分。
News2026-07-23openai.com原文 ↗
–
langchain-ai/open-swe
Open SWE 面向“提交任务后后台运行”的组织级编码代理，而不是只在开发者终端里同步对话。框架把仓库上下文、执行沙箱、权限边界和异步结果串联起来，便于团队按内部流程定制 agent。它解决的是控制面和工作流骨架，不会自动替代代码所有权、密钥治理与 merge policy；这些组织约束是否被正确建模，决定系统能否安全扩大并发。
Trending2026-07-22github.com原文 ↗
–
QwenLM/qwen-code
Qwen Code 正从单代理 CLI 扩展为完整执行平台：自动记忆保存长期上下文，skills 封装重复流程，子代理和 agent teams 处理并行分工，MCP 连接外部工具。功能面覆盖很广，也使安全模型更复杂，因为记忆、团队消息和第三方工具会形成多条数据与权限路径。值得观察的是它能否给每个代理和技能提供细粒度授权，而不是只在顶层做一次全局确认。
Trending2026-07-22github.com原文 ↗
–
MoonshotAI/kimi-cli
该仓库已把定位更新为 Kimi Code CLI，说明 Moonshot 正在把原有 kimi-cli 收敛为新一代终端代理。它承担代码检索、修改、命令执行与多轮任务编排，也是 Kimi 模型工具调用能力的官方参考实现。处于迁移期的项目最需要关注配置和扩展接口是否稳定；如果名称变化伴随会话或插件格式重做，生态迁移成本可能高于模型替换本身。
Trending2026-07-22始 2026-07-20github.com原文 ↗
–
earendil-works/pi
Pi 是 AI agent harness 项目，包含自扩展 coding agent CLI、agent runtime 和 unified multi-provider LLM API。README 列出的核心包包括 `pi-coding-agent`、`pi-agent-core` 和 `pi-ai`，后者覆盖 OpenAI、Anthropic、Google 等 provider。它与本期多…
Trending2026-07-21github.com原文 ↗
–
anthropics/cwc-workshops
anthropics/cwc-workshops 是 Anthropic Code with Claude workshop 材料仓库。目录包括 agent-battle、agent-decomposition、agents-that-remember、eval-driven-agent-development、how-we-claude-code、production-ready-agent、r…
Trending2026-07-21github.com原文 ↗
–
Codex Micro on Your Phone
这个项目把手机浏览器做成 Codex desktop 的本地控制器，明确声明非 OpenAI 或 Work Louder 官方。Native Shim 方案会让 Codex 看到一个合成的 Codex Micro，走原生硬件 channel 来处理 task-key colors、knob、joystick、MIC 和 command keys；Standard Bridge 则不模拟硬件，靠本地…
Project2026-07-21github.com原文 ↗
–
Codex Harness for Java Unit Testing
JAIPilot CLI 是 Java-only 本地测试生成 harness，测试生成来自用户已经安装并登录的 Codex，不依赖自定义 hosted backend。它优先用 repo 的 Maven/Gradle wrapper，coverage-sensitive 命令直接跑 clean full suite，避免把 focused test 的旧 JaCoCo 报告当作目标选择依据。功能…
Project2026-07-21github.com原文 ↗
–
AstrBotDevs/AstrBot
AstrBot 是集成 IM 平台、LLMs、plugins 和 AI features 的开源 AI agent assistant 框架。仓库结构包含多语言 README、Docker/compose 和 Python 入口，说明目标用户不只是单一聊天机器人部署者。它在 trending 中的意义是把“多平台 IM + LLM + plugin”继续向通用 agent assistant 收敛…
Trending2026-07-21github.com原文 ↗
–
openinterpreter/openinterpreter
openinterpreter/openinterpreter 当前 README 标题为 “A coding agent for open models like Kimi K3”。仓库仍有很高历史关注度，页面显示约 66.8k stars 与 5.7k forks；相关文档说明可通过 Kimi provider 自动选择 `kimi-code` harness，也可用 Moonshot Pla…
Trending2026-07-20始 2026-06-18github.com原文 ↗
–
openai/codex
openai/codex 是 OpenAI 的本地终端 coding agent，README 写明 Codex CLI runs locally on your computer。安装路径包括官方脚本、npm、Homebrew 和 release binary；认证可用 ChatGPT Plus/Pro/Business/Edu/Enterprise，也可配置 API key。仓库页面显示约 9…
Trending2026-07-20github.com原文 ↗
–
Shikigami, run AI coding agents in parallel, each in a Git worktree
Shikigami 是 macOS/Linux 上的并行 coding agent 桌面工具，让 Claude 或 Codex agent 各自在独立 Git worktree 中运行。首页显示 beta 0.30.0、免费使用，并提供 Apple Silicon、Intel macOS 与 Linux AppImage；编辑器里可以查看 diffs、git、数据库和 Docker 工具。sess…
Project2026-07-20shikigami.dev原文 ↗
–
Deepsec
deepsec 是 Vercel Labs 的 agent-powered 漏洞扫描 harness，面向大型现有代码库的按需安全审查。README 的流程是 `npx deepsec init`、安装、由 coding agent bootstrap 项目信息，然后 `scan`、`process`、可选 `revalidate` 和 `export`；它先用 matcher 找候选点，再由 a…
Project2026-07-20github.com原文 ↗
–
Claude Code uses Bun written in Rust now
Simon Willison 检查 Claude Code 安装包，记录它现在使用 Rust 版 Bun 的证据。条目的关键点不是“Claude Code 用了 Bun”这么简单，而是 Anthropic 的 CLI 交付链里出现了更底层的 runtime/打包变化：一个看起来像 JavaScript/Node 工具的安装物，实际运行时材料已经转向 Bun written in Rust。对开发工…
Blog2026-07-20simonwillison.net原文 ↗
–
Chalie - AI peer not employee
Chalie 把自己定位成本机运行的个人 AI companion，而不是远端 SaaS agent；它使用单个 SQLite 文件、静态加密凭据、零遥测，并把敏感动作放进 Allow / Ask / Deny 权限模型。当前能力面很宽，包括长期记忆、目标识别、后台研究、图片和截图索引、真实浏览器操作、双向 MCP、IMAP/CalDAV/CardDAV、受控 shell 与沙盒 Python。R…
Project2026-07-20github.com原文 ↗
–
Harness Handbook: Making Evolving Agent Harnesses Readable,Navigable, and Editable
论文指出现代 agent 的能力同时依赖 foundation model 和 harness，后者负责构造提示、管理状态、调用工具并协调执行。随着模型、API、环境和需求变化，harness 必须持续修改；文章因此提出围绕 readable、navigable、editable 的维护框架。它把 agent 工程中常被当成脚本胶水的部分提升为可分析的软件系统。
Paper2026-07-17arxiv.org原文 ↗
–
Production-grade LangGraph template
langgraph-agent-stack 是一个用于搭建 LangGraph agent 服务的项目模板。它把 graph 定义、API 服务、配置和部署骨架放进同一仓库，解决从 demo notebook 到可运行服务之间的工程空白。项目的价值在目录结构和默认约定：它展示了 LangGraph 应用如何被打包成长期维护的后端服务。
Project2026-07-16github.com原文 ↗
–
PalmClaw: A Native On-Device Agent Framework for Mobile Phones
PalmClaw 描述了一个运行在手机端的 native agent 框架，支持本地工具调用和多步任务执行。论文把 agent 执行环境从浏览器或云端沙箱移到移动设备，因而必须面对权限、设备状态、应用切换和用户交互等约束。它的意义在于为 mobile agent 提供系统框架，而不仅是把屏幕截图交给模型理解。
Paper2026-07-16arxiv.org原文 ↗
–
katanemo/plano
Plano 是面向 agentic apps 的 AI-native proxy 和 data plane。项目摘要覆盖 orchestration、safety、observability 和 LLM routing，说明它把模型调用链路上的策略、监控和安全控制集中到一层。随着 agent 应用增多，这类 data plane 的价值在于让路由和治理不再散落在每个业务服务里。
Trending2026-07-15github.com原文 ↗
–
Kmux
Kmux 是面向 AI coding agents 的并行 terminal workspace。它把多个 agent 会话放进可管理的终端工作区，便于同时跑不同实现路线、查看输出和比较结果。这个项目反映了一个新工作流：开发者不只是和一个 agent 对话，而是在调度多个并发候选实现。
Project2026-07-15github.com原文 ↗
–
FoundationAgents/OpenManus
OpenManus 是开源通用 agent 框架，定位为可复现 Manus 类工作流的实现。它关注规划、工具执行、多步反馈和通用任务自动化，让研究者能在开放代码上观察 agent 系统结构。相比封闭演示，开源框架更利于定位失败模式和比较不同 orchestration 策略。
Trending2026-07-13github.com原文 ↗
–
An Agent in 100 Lines of Lisp
文章用约 100 行 Lisp 展示一个简化 agent 的实现。这个例子把模型调用、工具选择、循环状态和观察结果压缩到最小结构，便于看清 agent 的基本控制流。它不是产品级框架，但能帮助读者把复杂代理系统还原成几个可检查的组成部件。
Blog2026-07-13thebeach.dev原文 ↗
–
Agent Harness Engineering
Addy Osmani 讨论 coding agent 的 harness、上下文、验证和反馈回路设计。文章把 agent 成败从模型能力转移到周围工程系统：如何给上下文、如何执行、如何测试、如何把失败反馈回循环。这个角度解释了为什么同一个模型在不同开发环境中的可靠性会差很多。
Blog2026-07-13addyosmani.com原文 ↗
–
stanfordnlp/dspy
DSPy 是用模块化程序方式构建和优化语言模型系统的 Python 框架。它通过 signatures、modules 和 optimizers 描述 LM pipeline，并把 prompt/示例/参数选择交给可评测的优化流程。与手写 prompt 相比，DSPy 的核心价值是让 RAG、分类和 agent 系统进入可编译、可迭代的工程循环。
Trending2026-07-11github.com原文 ↗
–
anthropics/claude-cookbooks
claude-cookbooks 是 Anthropic 的 Claude API notebooks 与 recipe 集合。仓库用可运行示例覆盖提示、工具调用、结构化输出、RAG 和 agent 流程等常见模式。它适合当作 API 使用手册之外的工程样例库，因为开发者通常需要从最小 recipe 迁移到真实应用。
Trending2026-07-11github.com原文 ↗
–
Workflow as Knowledge
这篇是偏概念模型的论文，把 LLM 工作流本身视为可持久化知识对象。它强调符号形式、对象身份和 live-image 思路，也就是流程、状态和执行上下文应当能被保存、传递、重新激活。文章适合与 agent runtime、notebook 和知识管理系统放在一起看，因为它讨论的是工作流如何成为可引用的长期资产。
Paper2026-07-11arxiv.org原文 ↗
–
SMetric
SMetric 研究 agentic LLM serving 的 GPU 调度，指出多轮 agent session 不能只按单次请求或 token 吞吐来衡量。论文提出 session-level 的均衡调度指标与方法，面向的是一个用户任务内连续多次模型调用带来的尾延迟和公平性问题。它把 serving 讨论从“每秒多少 token”拉回到“一个 agent 任务什么时候真正完成”。
Paper2026-07-11arxiv.org原文 ↗
–
R3
R3 是本地代码和文档审查工具，用 Web UI 组织人类与 AI agent 的反馈。它把 review 对象、评论、AI 建议和本地上下文放到同一界面，目标不是替代 PR，而是提供更细粒度的离线/本地审查工作台。项目看点在协作界面：AI review 要真正有用，必须被纳入人类可追踪的反馈结构。
Project2026-07-11github.com原文 ↗
–
Local Motion
Local Motion 是 Cursor 与 VS Code 插件，用于配置和连接本地 LLM 编码模型。它把本地模型 endpoint、编辑器接入和模型选择组织成开发者可操作的 UI，减少手工改配置的成本。技术意义在于本地 coding model 不再只是命令行 demo，而能进入日常 IDE 工作流。
Project2026-07-11github.com原文 ↗
–
From Prompts to Contracts
论文提出 harness engineering，用可执行监督层把企业 LLM 应用从 prompt 原型整理为生产系统。harness 负责模型 I/O、grounding、验证、工具调用和评估，文中用 contextual contracts、traceable inference steps、behavioral invariants 描述这些边界。它把“提示词写得更好”转成“应用行为可复现…
Paper2026-07-11arxiv.org原文 ↗
–
lessweb/deepcode-cli
deepcode-cli 是为 deepseek-v4 优化的终端 AI 编码助手，支持深度思考、推理强度控制、Agent Skills 和 MCP 集成。README 给出 `npm install -g @vegamo/deepcode-cli` 的安装路径，并通过 `~/.deepcode/settings.json` 配置 `MODEL`、`BASE_URL`、`API_KEY` 等环境。…
Trending2026-07-09github.com原文 ↗
–
Kastor - Terraform-style specs for AI agents
Kastor 把 agent 定义从框架代码或平台 UI 里抽出来，变成 `.agent`、`.tool`、`.prompt` 与 `kastor.hcl` 这类 HCL typed spec。`kastor build` 可以生成 LangGraph runnable project；`kastor plan/apply/destroy` 则用 state、three-way diffs 和 d…
Project2026-07-09github.com原文 ↗
–
huggingface/speech-to-speech
Hugging Face 的 speech-to-speech 是模块化本地 voice-agent pipeline，组件包括 VAD、STT、LLM、TTS，并提供 OpenAI Realtime 兼容 WebSocket API。它把实时语音 agent 拆成可替换模块，方便开发者在本地组合不同模型。兼容 Realtime API 是一个实际工程点：现有客户端可以较低成本迁移或对比实现。
Trending2026-07-08github.com原文 ↗
–
Rowboat
Rowboat 是本地优先的 AI 工作区，定位为 Claude Desktop 替代品，但重点在可构建的自定义操作界面。项目把聊天、工具调用、状态和小型 UI 放在同一工作区里，支持围绕重复任务搭建自己的 agent surface。它体现了一个趋势：桌面 AI 客户端正在从单一 chat box 变成可配置工作台。
Project2026-07-08github.com原文 ↗
–
hesreallyhim/awesome-claude-code
这个 repo 是 Claude Code 资源集合，覆盖官方文档、学习材料、runtime/integration、remote control、status lines、skills、memory、observability、linting 等类别。README 显示约 48.7k stars，并说明当前迭代会优先收录新推荐资源，再逐步迁回旧资源。它的价值不在单个工具，而在把 Claude C…
Trending2026-07-07github.com原文 ↗
–
google-antigravity/antigravity-sdk-python
Google Antigravity SDK 是构建 Antigravity/Gemini agents 的 Python SDK，抽象 agentic loop 和状态基础设施。README 说明 `Agent` 类处理 runtime binary discovery、tool wiring、hook registration 和 policy defaults；高级层提供 stateful…
Trending2026-07-07github.com原文 ↗
–
google/adk-python
google/adk-python 是 Google 的 Python Agent Development Kit，用于构建、评估和部署 AI agents。它覆盖 agent 定义、工具集成、运行时、评估与部署，不只是一个聊天示例。这个仓库的技术看点在于把 agent 工程常见的几段生命周期纳入 SDK，使开发者能用 Python 组织行为、接工具、测效果并接入部署路径。
Trending2026-07-06github.com原文 ↗
–
crynta/terax-ai
terax-ai 是用 Tauri、Rust 和 React 构建的轻量 terminal-first AI-native dev workspace。它把终端作为主要交互面，同时用桌面壳和前端界面承载 AI 编程工作流。Tauri 提供较小本地应用外壳，Rust 负责系统侧集成，React 管理工作区 UI，这种组合适合探索介于 CLI 和 IDE 之间的 agent 开发环境。
Trending2026-07-06github.com原文 ↗
–
The Log is the Agent
这篇论文把 agent 的状态、推理、工具调用和外部副作用都表示为追加事件，agent 本身则是从事件日志到事件日志的纯函数。作者把 event sourcing、continuation-passing style、确定性生成器和可组合状态变换组合起来，使同一条执行轨迹可以被重放、审计、分支和局部改写。它值得看的一点是，论文不是给 agent 再加一个观测层，而是把“日志”提升成了系统语义本身，…
Paper2026-07-06arxiv.org原文 ↗
–
llm-coding-agent 0.1a0
Simon Willison 发布基于 `llm` Python 库的实验性 coding agent。这个版本把模型调用、文件编辑、命令执行和循环控制做成较小实现，便于理解 coding agent 的基本组成。它的价值在教育和实验：先看清最小闭环，再评估商业工具里复杂策略到底增加了什么。
Blog2026-07-04simonwillison.net原文 ↗
–
Hmbown/CodeWhale
CodeWhale 是 Rust 编写的终端 coding agent harness，面向多模型和开源模型工作流。它把模型选择、命令行交互、工具调用和执行循环放在本地终端里。这个项目的看点是为不同模型提供统一运行壳，降低实验开源 coding agent 时对单一供应商工具的依赖。
Trending2026-07-04github.com原文 ↗
–
open-webui/open-webui
Open WebUI 是自托管 AI 平台，支持 Ollama 和 OpenAI-compatible APIs，并设计为可离线运行。README 强调 extensible、feature-rich、user-friendly，还内置 RAG inference engine。它的定位已经超出“本地聊天 UI”：更接近一个把多 runner、RAG、权限、插件和部署体验统一起来的开源 AI 操作…
Trending2026-07-03github.com原文 ↗
–
not much happened today
smol.ai 的 2026-07-01 日报称当天相对安静，但仍汇总了 coding models、agent harnesses 和 Fable 5 re-launch 等社区动态。RSS 描述显示它检查了 12 个 subreddits、544 个 Twitter 源且没有更多 Discord 输入。这样的 issue 价值在于保留社区噪声水平本身：有时“没发生大事”也能帮助判断模型发布、b…
Blog2026-07-03news.smol.ai原文 ↗
–
ZCode - Harness for GLM-5.2
ZCode 页面把自己定义为 GLM-5.2 的 official harness，用于把 AI agents 与现有工具结合起来完成 plan、code、review、deploy。页面示例展示 Goals、长任务、bot control、多 agent collaboration 和 GLM-5.2 深度优化；下载项覆盖 macOS、Windows 和 Linux，页面版本号显示 3.2.3。…
News2026-07-03zcode.z.ai原文 ↗
–
RedPlanetHQ/core
RedPlanetHQ/core 把自己称为 Personal AI OS：一个 always-on、always watching、可命名和塑形、能连接个人工具的自托管 AI 层。仓库结构包含 apps、integrations、packages、hosting、plugin 等目录，说明它不是单个聊天前端。它和 Matrix OS 一样体现出一个趋势：个人 AI 产品正在从 session-b…
Trending2026-07-03github.com原文 ↗
–
Fastest Enterprise AI Gateway
Bifrost 是 MaximHQ 的 AI gateway，用单一 OpenAI-compatible API 统一 23+ providers，包括 OpenAI、Anthropic、AWS Bedrock、Google Vertex、Azure、Groq、Ollama 等。README 标称它比 LiteLLM 快 50 倍，在 5k RPS 下开销低于 100 微秒，并带自动 fallba…
Project2026-07-03github.com原文 ↗
–
Demolab - an opinionated agent-driven computational lab notebook
Demolab 把计算实验写成小 Python 程序后，自动运行、捕获输出、绑定 exact code version，并发布包含 figures、parameters、headline numbers 和 typeset math 的静态页面。README 特别说明 notebook 不是 Jupyter，而是一段 runner script 加一页 prose；entry 是可发布 write…
Project2026-07-03github.com原文 ↗
–
siteboon/claudecodeui
CloudCLI / Claude Code UI 给 Claude Code、Cursor CLI、Codex 和 Gemini CLI 提供桌面与移动端 Web UI。功能包括 project/session 管理、chat、集成 shell、文件树与 live editing、Git staging/commit、browser use、插件系统和可选 TaskMaster AI；自托管可用…
Trending2026-07-02github.com原文 ↗
–
google/agents-cli
google/agents-cli 是面向 coding assistant 的 Google Cloud agent 开发工具包，而不是新的 coding agent。README 写明它通过 CLI commands 和 skills 帮 agent 完成 scaffold、eval generate/grade、deploy、publish gemini-enterprise 和 obser…
Trending2026-07-02github.com原文 ↗
–
danielmiessler/LifeOS
LifeOS 是 Daniel Miessler 的 personal AI infrastructure 项目，面向个人工作流和 agentic automation。digest 没列 README 细节，但它不是单一脚本或聊天界面，而更像把个人知识、任务、自动化、agent 工具和操作习惯组织成一个可持续系统。这个方向的判断标准应当是长期可维护性和低摩擦输入输出，而不是一次性 demo 能跑…
Trending2026-07-02github.com原文 ↗
–
bb
bb 是一个 agentic IDE，桌面 app、Web app、CLI 和 HTTP API 都可驱动同一套工作线程。它让多个 coding agent 在 thread 中运行，用户能实时跟随、随时 steer 或把工作交给另一个 agent；README 明确说 bb 使用用户已经认证过的 provider CLI。当前桌面包主推 macOS Apple Silicon，其他平台可用 `n…
Project2026-07-02github.com原文 ↗
–
ZCode
ZCode 是智谱推出的 Claude Code 风格编程代理产品页，当前 digest 能确认的是其定位：围绕代码理解、编辑和开发工作流包装成 agentic coding 工具。它不是一个开源 repo 条目，因此可读信息少于 README 型项目；但它反映国内模型厂商正在把 coding agent 从模型能力展示推进到面向开发者的独立产品入口。
Project2026-07-02zcode.z.ai原文 ↗
–

2026 年 6 月79

anomalyco/opencode
opencode 是一个开源 AI coding agent，仓库描述直接写着 “The open source coding agent”。作为 Trending 条目，它代表开发者对可审计、可自托管 coding agent 的持续需求。与封闭 IDE 插件相比，开源 agent 的价值在可改工具协议、权限模型、上下文策略和执行环境；这也是 coding agent 基础设施化后的自然分支。
Trending2026-06-29github.com原文 ↗
–
Using Local Coding Agents
Sebastian Raschka 写了一篇本地 coding agent 教程，目标是用 open-source tools 和 open-weight LLMs 搭起可运行栈。原始摘要说明文章源于读者反复询问他的 local agent stack，图示里包括本地模型托管的 inference engine 和 coding agent harness。它的实用性在于把“本地 agent”从概…
Blog2026-06-28magazine.sebastianraschka.com原文 ↗
–
EKKOLearnAI/hermes-studio
EKKOLearnAI/hermes-studio 把 Hermes Agent 做成桌面应用、本地运行时和 Web console 的组合。README 提到它可用于 chat with agents、manage models and profiles、connect platform channels、automate jobs、inspect files、run coding agents…
Trending2026-06-28github.com原文 ↗
–
BuilderIO/agent-native
BuilderIO/agent-native 是一个构建 agent-native apps 的框架，强调 agent 应该在真实产品内部行动，而不是只待在聊天窗口旁边。README 列出的 primitives 包括 shared actions、SQL-backed state、identity、tools、skills、jobs、observability 和 UI surfaces。它代表…
Trending2026-06-28始 2026-06-21github.com原文 ↗
–
receptron/mulmoclaude
MulmoClaude 是本地运行的 AI-native application platform，用 Claude Code 作为 universal controller，把 accounting、wiki、SEC filings reader 等能力放到 plugin registry。README 描述自然语言可以召唤 markdown、charts、forms、wikis、spreads…
Trending2026-06-27github.com原文 ↗
–
TBD, a Mac-native CLI-forward coding agent multiplexer
TBD 是 macOS 原生 SwiftUI 应用，用于管理 git worktrees、embedded terminals 和多 Claude Code sessions。架构上有 tbdd daemon 管 SQLite/GRDB、tmux、git 状态，tbd CLI 做脚本入口，TBDApp 用 SwiftTerm 做 GUI，并通过 Unix socket 上的 JSON RPC 通讯…
Project2026-06-27github.com原文 ↗
–
Smart model routing directly in Claude, Codex and Cursor
workweave/router 是 Anthropic、OpenAI、Gemini 兼容的本地/自托管 proxy，用 on-box embedder 和 cluster scorer 为每个请求选模型。README 声称路由延迟小于 50ms，并支持 streaming、tools、vision、OpenRouter OSS 模型、BYOK 本地加密和 OTLP traces；安装路径从 `n…
Project2026-06-27github.com原文 ↗
–
Mantis, A self-hosted LLM gateway
Mantis 给小团队提供一个自托管 LLM gateway，把 provider-specific logic 收敛到单一 chat-completions API 后面。README 列出 configurable routing、fallback chains、retries、timeouts、cooldowns、exact/semantic caching、AWS Bedrock guar…
Project2026-06-27github.com原文 ↗
–
Jargo - a Golang port of Pipecat for conversational-AI apps
jargo 是 Go 版实时语音 agent 框架，走 WebRTC-native、audio-first 路线。README 说明它实现 STT -> LLM -> TTS streaming pipeline，支持 turn-taking、barge-in、Silero VAD、Smart Turn v3、RTVI data channel、Pion WebRTC 与 pluggable se…
Project2026-06-27github.com原文 ↗
–
heygen-com/hyperframes
HyperFrames 是用 HTML、CSS、媒体资源和 seekable animations 渲染确定性 MP4 视频的开源框架。README 强调 Write HTML. Render video. Built for agents，支持本地 CLI、AI coding agent skills，也可作为托管 authoring workflow 的渲染核心。它把视频生成从时间线编辑器转成…
Trending2026-06-24github.com原文 ↗
–
Build real agentic apps using CUGA
IBM Research 在 Hugging Face 博客展示用 CUGA harness 构建 agentic apps，标题提到 two dozen working examples 和 lightweight harness。它把 agentic app 从单个演示推进到一组可运行样例，覆盖工具调用、环境交互和应用流程。这个角度适合检验 agent 框架是否能支撑真实应用组合，而不是只在单…
Blog2026-06-24huggingface.co原文 ↗
–
bytedance/deer-flow
DeerFlow 2.0 是 ByteDance 开源的 long-horizon SuperAgent harness，README 称它用 sub-agents、memory、sandboxes 和 extensible skills 编排研究、编码和创作任务。项目支持模型配置、MCP、sandbox、IM channels、LangSmith/Langfuse tracing，并给出本地评估…
Trending2026-06-23github.com原文 ↗
–
Sturnus
Sturnus 是 OpenAI-compatible LLM proxy，按 provider 延迟把请求路由到最快后端。它解决的是多模型供应商接入后的运行时选择问题：客户端保持 OpenAI API 形状，代理层根据实时表现做路由。相比静态 fallback，延迟感知代理更贴近生产环境里对尾延迟和可用性的要求。
Project2026-06-23github.com原文 ↗
–
Picot
Picot 是 Pi coding agent 的本地桌面 GUI，打包已知可用的 `pi` runtime，避免另装 CLI 和版本漂移。README 列出聊天、流式输出、图片附件、inline diff、tool-call cards、多 session、多 agent、历史搜索、LAN/mobile 访问、包管理、成本 dashboard、模型选择和 context compaction。它…
Project2026-06-23github.com原文 ↗
–
Oak
Oak 是面向 agents 的版本控制系统，支持虚拟挂载和并行任务工作区。它关注的是 agent 同时探索代码、隔离文件变更和管理任务上下文时的状态问题，而不是传统人类分支协作。这个项目代表了 coding agents 需要的新型开发基础设施：工作区要比单一 git checkout 更可组合。
Project2026-06-23oak.space原文 ↗
–
AI-Gateway
AI-Gateway 是 OpenAI/Groq 兼容的反向代理，通过语义缓存减少 LLM API 调用。README 写出四级匹配：exact、template、semantic、word overlap，并支持 Redis + in-memory fallback、多租户 cache、100 个并发相同请求去重、rate limiting、circuit breaker 和 cost trac…
Project2026-06-23github.com原文 ↗
–
jcode
jcode 是 coding agent harness，README 的核心定位是 multi-session workflows、high customizability 和 performance。仓库采用 Rust，提供 macOS/Linux 安装脚本，并把资源效率作为显性目标，尤其服务于同时跑多个 agent session 的场景。它值得关注在于 coding agent 工具链开始…
Trending2026-06-22始 2026-06-21github.com原文 ↗
–
Flue
Flue 是 TypeScript agent harness，而不是只包一层模型 SDK：README 示例里 `defineAgent` 同时声明 model、tools、skills、sandbox 和 instructions，再用 route 把 agent 暴露成 HTTP 端点。它把 virtual/local/remote container sandbox 作为 agent 定义…
Project2026-06-22始 2026-06-07github.com原文 ↗
–
Persona.js
Persona.js 是一个纯 Vanilla JS agent widget，重点不是绑定某个模型 SDK，而是把前端 agent 面板、SSE streaming、WebMCP page tools 和样式隔离组合起来。页面列出的适配路径覆盖 bare script、AI SDK + WebMCP、OpenAI Agents、LangGraph.js、Hono、Express、SvelteKi…
Project2026-06-21persona-chat.dev原文 ↗
–
slash-agent - Native LLM copilot for your terminal
slash-agent 把 LLM copilot 放进终端工作流，目标是让命令行里的提问、修改和执行更自然地衔接。它的项目定位不是通用聊天应用，而是 native terminal copilot，因此交互边界会更接近 shell、文件和开发命令。对开发者工具来说，这种形态的关键在于低摩擦地把模型建议变成可执行操作。
Project2026-06-20github.com原文 ↗
–
livekit/agents
livekit/agents 是构建实时语音和多模态 AI 代理的框架。README 把它描述为运行在服务器上的 realtime, programmable participants，可创建能 see、hear、understand 的 conversational multi-modal voice agents，并提供可混搭的集成生态。实时代理的难点在低延迟、打断处理和多模态输入输出，它与批…
Trending2026-06-20github.com原文 ↗
–
Wyolet Relay - high throughput, open source LLM router
Wyolet Relay 是一个开源 LLM 请求路由器，定位在高吞吐转发。它位于应用和模型提供商之间，承担请求分发、路由和可能的策略控制。随着应用同时接入多个模型后端，这类 relay 的价值在于把模型选择、限流和故障切换从业务代码中抽离出来。
Project2026-06-20github.com原文 ↗
–
TabbyML/tabby
Tabby 是可自托管的开源 AI 编码助手，定位为 GitHub Copilot 的 open-source、on-premises alternative。README 列出的关键特性包括 self-contained、无需 DBMS 或 cloud service，并提供 OpenAPI interface 方便接入 Cloud IDE 等既有基础设施。自托管路线的关键价值在数据控制、部署可…
Trending2026-06-20github.com原文 ↗
–
Kilo-Org/kilocode
kilocode 是一个开源 agentic engineering 平台，面向 AI 辅助构建和迭代软件。它的定位比单个代码补全插件更宽，覆盖从任务理解到代码修改的工程循环。趋势意义在于 agentic engineering 正在成为一个产品类别：开发者要的不只是回答，而是能进入仓库、执行步骤并留下可验证变更的系统。
Trending2026-06-20github.com原文 ↗
–
BeamWeaver - LangChain/DeepAgents-style agents and workflows for Elixir
BeamWeaver 把 LangChain、LangGraph 和 DeepAgents 风格的代理工作流带到 Elixir/OTP 生态。作者列出的能力包括 agents and tool calling、graph workflows、checkpoints and resumable execution、memory stores、retries 和 fallbacks。它给代理框架提供了…
Project2026-06-20github.com原文 ↗
–
continuedev/continue
Continue 是开源 coding agent，支持 CLI、VS Code 和 JetBrains 插件。多入口形态意味着它可以覆盖终端批处理、编辑器交互和 IDE 内上下文。它代表 coding assistant 从“补全插件”演进到跨工具链 agent 的方向。
Trending2026-06-19github.com原文 ↗
–
bytedance/UI-TARS-desktop
UI-TARS-desktop 是开源多模态 agent stack，连接 GUI agent、视觉模型和桌面/浏览器执行环境。digest 显示它偏完整工程栈，而不是单点 UI automation 工具。它适合观察 computer-use agent 如何从 benchmark demo 走向可安装、可运行的桌面系统。
Trending2026-06-19github.com原文 ↗
–
Open-source back end for multi-user AI agents with shared memory
Lobu 是 OpenClaw 的多租户 gateway，给 Slack、Telegram、WhatsApp、Discord、Teams、Google Chat 和 REST API 提供 agent 接入。README 称它只重写约 40K LOC gateway 层，保持 OpenClaw Pi harness 在 worker 内部运行，并为每个用户或 channel 分配隔离虚拟文件系统与…
Project2026-06-19github.com原文 ↗
–
OSymandias - Open-source runtime for multi-agent AI systems
OSymandias 是 Python library 和 CLI，一条 `osy serve` 启动多代理 runtime，内部管理 PostgreSQL、Redis、RabbitMQ、Qdrant 和 Celery workers。它用 `@osy.tool`、`@osy.agent` 装饰器从类型提示推断 schema，并提供 job、task、agent instance、tool cal…
Project2026-06-19github.com原文 ↗
–
Externalizing Research Synthesis and Validation in AI Scientists through a Research Harness
Xcientist 把文献证据、idea state、实现计划、ablation 记录和 repair trace 都存成持久研究 artifact，使 AI scientist 的推理链可检查。论文提出 claim drift 作为自动科研失败模式：最终可运行 artifact 不再支撑原本机制声明。实验跨 memory system、交通预测和 physics-informed neural…
Paper2026-06-19arxiv.org原文 ↗
–
Verified Detection and Prevention of Concurrency Anomalies in Multi-Agent Large Language Model Systems
这篇论文把多 Agent LLM 系统共享 memory store、vector index、tool registry 的过程建成 read-generate-write 操作，并用 TLA+ 给出 stale-generation、phantom-tool、causal-cascade、tool-effect reordering 四类并发异常的可执行规格。它的技术硬度在于 274 个 Ve…
Paper2026-06-18arxiv.org原文 ↗
–
Relaymux
Relaymux 的设计很窄：Telegram 是 remote control，tmux 是 agent workspace，避免把本地 CLI Agent 包进不可见 orchestration 黑盒。README 写明它启动 agent 时会打开本机可见的 tmux window，用户可以 attach、watch、interrupt、debug；每个 agent run 在默认 `agen…
Project2026-06-18github.com原文 ↗
–
Mira
Mira 是自托管 AI code reviewer：diff、embedding、index、review history 和 vulnerability data 存在用户自己的 SQLite 或 Postgres 中，LLM 可经 OpenRouter、Bedrock 或 OpenAI-compatible endpoint 接入。README 的功能面很宽，包括 full-repo cod…
Project2026-06-18github.com原文 ↗
–
Making budget models punch above their weight with a smart Rust harness
这篇文章讨论用 smart Rust harness 让 budget models 在编码任务上 punch above their weight。关键变量是 harness，而不是模型本身：工具循环、上下文组织、验证反馈和执行隔离会决定小模型能否稳定完成任务。它和本期多篇论文形成同一条线：Agent 性能越来越取决于工具循环、上下文裁剪、验证策略和执行环境，小模型只要被合适地约束和供给反馈，也…
Blog2026-06-18yogthos.net原文 ↗
–
PhoneHarness: Harnessing Phone-Use Agents through Mixed GUI, CLI, and Tool Actions
PhoneHarness 认为真实手机任务不只是 screen tapping，还需要在 GUI、device-side commands 和 host-side tools 之间路由。它提供混合动作执行 harness，使用 deterministic action routing、bounded GUI delegation 和可审计 traces，评分关注可观察副作用是否发生。annotat…
Paper2026-06-17arxiv.org原文 ↗
–
My Homelab AI Dev Platform
这篇 homelab 文章把 OpenCode Web UI 放进 GitOps 运维链路。作者在 TrueNAS host 上建 VM，把 OpenCode webserver 做成 systemd unit，并给它专用 Git 用户：可以 clone 和 push feature branches，但不能直接推 deploy branch。实际工作流是 OpenCode 改 compose/H…
Blog2026-06-17rsgm.dev原文 ↗
–
Agent Harness Lab
Agent Harness Lab 是比较 agent framework 的 Next.js workbench，而不是又一个单一 agent demo。它把 Graphlit 作为共享 context layer，让 Graphlit、OpenAI Agents SDK、Vercel AI SDK、LangGraph、Mastra、Claude Agent SDK 和 Google ADK 并…
Project2026-06-17github.com原文 ↗
–
vercel/ai
Vercel AI SDK 是 TypeScript AI toolkit，用于构建 AI-powered applications 和 agents。它的现实价值在于把 streaming UI、model adapters、tool calling、structured output 和前端框架集成放进一个开发者熟悉的栈。它值得关注是因为很多 AI 产品的差异并不只在模型，而在交互延迟、流式渲…
Trending2026-06-15github.com原文 ↗
–
andrewyng/aisuite
aisuite 提供跨 OpenAI、Anthropic、Google、Mistral、Hugging Face、AWS、Cohere、Ollama、OpenRouter 等 provider 的统一 Chat Completions API。README 还把工具调用、`max_turns` 循环、Agents API、文件/git/shell toolkits 和 MCP 接入放在同一层，并附…
Trending2026-06-15github.com原文 ↗
–
coleam00/Archon
Archon 定位为 open-source harness builder for AI coding，目标是让 AI coding deterministic and repeatable。它用 YAML workflow 定义 agent 流程，这意味着计划、步骤、工具和验证逻辑可以版本化，而不是散落在一次性 prompt 和聊天历史中。仓库包含 Docker、compose、AGENTS/…
Trending2026-06-12github.com原文 ↗
–
Building agents without harness engineering
Rajit Khanna 讨论的是一个反主流判断：与其继续扩大 agent harness，不如减少外部编排，把更多能力压到模型和工具接口本身。文章关注 harness engineering 的复杂度，包括计划、状态、重试、工具调用和外部控制逻辑如何越堆越厚。它值得放进今天的语境，是因为同一份日报里有 Archon、Claw-SWE-Bench、Flightdeck、Remuda 等大量 har…
Blog2026-06-12rajitkhanna.com原文 ↗
–
langchain-ai/deepagents
LangChain Deep Agents 是 batteries-included agent harness，基于 LangGraph，把长程多步任务常用能力打包成默认结构。README 列出 sub-agents、filesystem、context management、shell access、persistent memory、human-in-the-loop、skills、MCP/…
Trending2026-06-10github.com原文 ↗
–
danny-avila/LibreChat
LibreChat 是可自托管的多模型 ChatGPT-like 平台。README 描述它聚合主流 AI providers，并提供 agents、MCP、Artifacts、Code Interpreter、自定义 actions、conversation search 和企业级多用户认证。它的持续流行说明很多团队仍需要可控、可审计、可换供应商的聊天基础设施。
Trending2026-06-10github.com原文 ↗
–
RiddleRun
RiddleRun 是 Docker-first 的 agentic E2E 浏览器测试工具，测试用 JSON 描述自然语言步骤和期望结果。CLI 通过 browser-use agent 执行网页任务，支持按 test-id/tag 运行、输出 JSON artifacts、录制视频，并提供 FastAPI 后端与 Next.js Web UI；这让“让代理像用户一样测网页”具备了可批量运行的形…
Project2026-06-10github.com原文 ↗
–
OpenYabby
OpenYabby 是 Mac 上的开源语音驱动多代理系统：唤醒后描述任务，系统会规划、委派、执行、审查并汇报。README 显示它整合 OpenAI Realtime API、Claude Code/Codex/Aider/Goose/Cline/Continue 等 CLI runners、Mem0 + Qdrant 持久记忆、PostgreSQL/Redis、37 个 connectors…
Project2026-06-10github.com原文 ↗
–
AgentHarness
AgentHarness 是 Apodex-1.0 的开源 deep-research benchmark harness，用于复现标准 ReAct 设置下的公开结果。仓库包含 benchmark、workflow、plugins 和脚本，重点在可重复评测 verification-centric deep research 模型，而不是包装一个新的研究助手 UI。
Project2026-06-10github.com原文 ↗
–
nesquena/hermes-webui
Hermes WebUI 是 Hermes Agent 的 Web/手机界面。README 列出文件树展开折叠、breadcrumb、文本/代码/Markdown/图片预览、`workspace://` 链接、文件编辑/新建/删除/重命名、二进制下载、Git branch 和 dirty count badge。它补的是 agent 操作体验层，让用户不必只通过终端和消息平台管理 Hermes。
Trending2026-06-08始 2026-06-01github.com原文 ↗
–
Thoughts on starting new projects with LLM agents
Eli Bendersky 记录用 LLM agents 启动新项目时的经验。digest 指出 agent 擅长从空仓库快速搭起可运行原型，但架构边界、依赖选择和验证闭环仍要由人把关。它适合和 OpenAI harness 文章一起读：一个看个人项目 bootstrap，一个看团队级 agent 工程化。
Blog2026-06-08eli.thegreenplace.net原文 ↗
–
Shubhamsaboo/awesome-llm-apps
awesome-llm-apps 收集 100+ 可运行 AI Agent、RAG、voice agent 和 LLM app 示例。仓库描述强调 clone、customize、ship，说明它定位为应用模板索引。它适合快速比较不同 agent 框架、检索方案和产品 UI，而不是学习某个单一底层库。
Trending2026-06-08github.com原文 ↗
–
Nightwatch
Nightwatch/ninoxAI 是本地优先、只读的 AI SRE 层，用来把告警风暴归并为 incident 并辅助 RCA。README 说明它可读取 Checkmk、Prometheus、Icinga2、Zabbix、Docker、Kubernetes、AWS、Grafana、GitHub、Git 和主机信息，agent 的能力表被限制为 read-only。它的边界设计清晰：模型形成…
Project2026-06-08github.com原文 ↗
–
I design with Claude more than Figma now
Jane Street 设计师 Edwin Morris 描述自己从 Figma/docs 转向 Claude Code 原型。文章给出的具体工作流是先写问题和方案，再让 Claude 在真实代码库里做出可运行功能，并把原型推到开发环境给用户试；过去 2 个月 Figma 使用场景明显下降，部分原型达到 2000+ 行 diff。团队目前把这些原型称为 living proposal docs，强…
Blog2026-06-08blog.janestreet.com原文 ↗
–
Harness engineering: Leveraging Codex in an agent-first world
OpenAI 文章总结一个“0 手写代码”内部产品实验。团队称 5 个月内由 Codex 生成约百万行代码、合并约 1500 个 PR，最初 3 名工程师平均每人每天 3.5 个 PR；产品已有内部日常用户和外部 alpha testers。文章真正有用的部分是 harness：让每个 worktree 可启动 app、暴露 Chrome DevTools、DOM snapshots、screen…
Blog2026-06-08openai.com原文 ↗
–
Anthropic, please ship an official Claude Desktop for Linux
Claude Code issue #65697 请求 Anthropic 发布官方 Claude Desktop Linux build，理由不是单纯桌面客户端缺席，而是插件测试、desktop extensions、computer use、dictation 和 Cowork 都依赖桌面端。issue 指出 Claude Code CLI 虽然原生支持 Linux，但不能替代 Desktop…
News2026-06-08github.com原文 ↗
–
openai/plugins
openai/plugins 是 Codex plugin 示例集合，包含 manifest、skills、MCP、hooks 等结构。它的实用性在于给插件作者一组最小可运行骨架，减少从空目录摸索 manifest 规则。对想扩展 Codex 的开发者，这比零散文档更容易上手。
Trending2026-06-07github.com原文 ↗
–
microsoft/agent-framework
Microsoft Agent Framework 支持用 Python 和 .NET 构建、编排、部署 AI agents 与 multi-agent workflows。它覆盖企业常见的跨语言栈，并天然靠近 Microsoft 云和开发工具生态。对于组织内部 agent 平台，官方框架的治理、部署和兼容承诺可能比单点功能更重要。
Trending2026-06-07github.com原文 ↗
–
Sidekick
zot-sidekick 是 macOS menu bar app，用于从系统任意位置快速启动和管理 zot coding agent。项目的技术含量不在模型能力，而在把 agent 常驻化、桌面化。对频繁使用 zot 的开发者，少一次终端定位和命令输入就是实际工作流收益。
Project2026-06-07github.com原文 ↗
–
Open Code Review
Open Code Review 是一个 AI-powered code review CLI 工具。它把 review 放在命令行而不是托管平台评论区，适合本地预审、提交前检查或 CI 前的快速反馈。真正的判断点会是它能否给出可定位、可执行的问题，而不是泛泛解释 diff。
Project2026-06-07shaping.systems原文 ↗
–
Nanocode CLI
Nanocode 是轻量 terminal-based AI coding assistant。项目定位避开大型 IDE 插件和复杂 orchestrator，偏向在命令行内快速提问、编辑和生成代码。它的吸引力取决于启动速度、上下文选择和 diff 控制是否足够顺手。
Project2026-06-07github.com原文 ↗
–
Jeju
Jeju 是 local-first agent harness，让开发者用配置定义 agent 行为、设置严格边界并检查每个 effect。README 还强调用 evaluation evidence 改进 agent，这使它更接近可审计运行环境。它适合把一次性 agent prompt 变成可复跑、可比较的工程流程。
Project2026-06-07github.com原文 ↗
–
CopilotKit
CopilotKit 定位为 agents 与 generative UI 的前端栈，覆盖 React、Angular、Mobile、Slack 等入口，并维护 AG-UI Protocol。它解决的是 agent 应用的 UI 层协议、共享状态和 human-in-the-loop workflow。随着 agent 从聊天框进入产品界面，这类前端基础设施会变得比 prompt 示例更关键。
Trending2026-06-07github.com原文 ↗
–
CCC
Claude Command Center 是 local-first dashboard，用一个浏览器标签页并排管理 Claude Code、Codex、Gemini CLI 等 session。README 标题强调 spawn、resume、review，说明它把 agent 当作可并行调度的本地进程组。它适合多模型、多项目并行时减少终端窗口和上下文切换。
Project2026-06-07github.com原文 ↗
–
datawhalechina/hello-agents
Hello-Agents 是 Datawhale 的中文 agent 教程，定位为从原理到实践的系统学习材料。它面向“真正的 AI Native Agent”构建，而不是只讲 prompt；在中文生态中，这类开源教程能降低 agent 架构、工具调用和多智能体实践的入门成本。
Trending2026-06-05github.com原文 ↗
–
anthropics/claude-code
Claude Code 是 Anthropic 的终端内 agentic coding tool：它读取代码库、编辑文件、执行命令，并通过自然语言处理 git workflow。与 autocomplete 不同，它是完整开发任务执行器，因此权限、沙箱、日志和 review 流程都成了产品核心，而不只是模型能力展示。
Trending2026-06-05始 2026-05-30github.com原文 ↗
–
aaif-goose/goose
Goose 是 AAIF 下的开源 AI agent，提供 Desktop、CLI 和 API 形态。官方文档称它可自动化软件开发任务，并通过工具/扩展连接本地工作流；在 agent 标准化背景下，Goose 的意义还包括把 Block 原项目迁入 Linux Foundation 生态。
Trending2026-06-05github.com原文 ↗
–
AgentKitten
AgentKitten 是面向 Apple 平台的 Swift agent 框架，设计目标是 provider-agnostic：同一套 agent 代码可接不同模型供应商。Swift Package Index 显示它有 7 个 library、1 个 macro、Apache 2.0 许可，并通过 Swift 并发相关的数据竞争检查；这使它更像原生应用侧 agent SDK，而不是 Web 后…
Project2026-06-05github.com原文 ↗
–
Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents
Agent libOS 将 LLM agent 的长期执行抽象成 library OS：运行时负责状态持久化、能力授权、恢复、审计和副作用边界。它的贡献不在单个模型能力，而在把权限和执行生命周期放到 runtime 里讨论，适合那些会跨天运行、写文件、调 API、积累状态的 agent。
Paper2026-06-05始 2026-06-04arxiv.org原文 ↗
–
Paseo
Paseo 是 coding agent interface，支持从手机、桌面和 CLI 管理 Claude Code、Codex、Copilot、OpenCode 和 Pi agents。README 摘要显示它运行本地 daemon，负责 agent process orchestration、WebSocket API 和 MCP server；CLI 可安装为 @getpaseo/cli。…
Project2026-06-04github.com原文 ↗
–
Microsoft Build: MAI-Thinking-1 and MAI Family models, Surface RTX Spark Dev Box, and OpenClaw in Windows
smol.ai 汇总 Microsoft Build 上 MAI-Thinking-1、MAI family models、Surface RTX Spark Dev Box 和 Windows agent 生态发布。它把模型、开发硬件和 OpenClaw/Windows agent 集成放在同一脉络里，说明 Microsoft 的路线不只是发布模型，而是补齐本地开发、agent runtime…
Blog2026-06-04news.smol.ai原文 ↗
–
LiteHarness
LiteHarness 用单一 SDK 调用 Claude Agent、OpenAI Agent、Pi AI 等 coding-agent harnesses。相邻 LiteLLM Agent Platform 文档显示该生态关注让 coding agents 在隔离沙箱中运行，并通过 vault/proxy 避免真实密钥暴露给 agent。LiteHarness 的意义在于把不同 harness…
Project2026-06-04github.com原文 ↗
–
zeroclaw-labs/zeroclaw
Rust 写的本地 personal AI assistant runtime。
Trending2026-06-03github.com原文 ↗
–
can1357/oh-my-pi
终端 AI coding agent，集成编辑、LSP、浏览器、子 agent 和多 provider。
Trending2026-06-03github.com原文 ↗
–
Parley
本地 TUI 代码审查工具，支持与 Codex、Claude、OpenCode 等 agent harness 协作。
Project2026-06-03parley.cloudflavor.io原文 ↗
–
iii-hq/iii
iii 是用于实时组合、扩展和观测后端服务的开发框架。README 的核心模型是 Worker、Function、Trigger：API 服务、数据 pipeline、Rust microservice 或 agent capability 都注册为 worker，系统负责路由、序列化、触发和 catalog 通知。它把 agent 添加能力、发现函数、调用工具和追踪执行统一到开发者也使用的运行时…
Trending2026-06-02github.com原文 ↗
–
golemcloud/golem
Golem 是用 WebAssembly components 构建 distributed applications 和 agents 的平台。README 称其服务可在分布式 cloud environment 运行 Wasm components，并支持 Rust、TypeScript、Scala、MoonBit；项目定位为 agent-native platform，强调 never lo…
Trending2026-06-02始 2026-06-01github.com原文 ↗
–
Ministry of Everything
Ministry of Everything 是 CLI-first agent harness，让单个操作者用 durable markdown documents 驱动 Claude Code 或 Codex。每个阶段产出 canvas，后续阶段可读而无需重放整个 chat；所有 turn 提交到个人 Git journal，可 resume、revert、audit 和 reuse。它没有后…
Project2026-06-02github.com原文 ↗
–
From Model Scaling to System Scaling: Scaling the Harness in Agentic AI
论文主张把 foundation model 外围的 harness 作为 agentic AI 的一等扩展对象，而不是只比较模型权重。它关注上下文构造、工具调用、执行编排、验证与记忆等系统层能力，强调长任务表现常由 harness 决定。价值在于把 agent 评估从“模型分数”推向“模型加执行层”的可复现实验。
Paper2026-06-02arxiv.org原文 ↗
–
Dataroom
Dataroom 是面向低预算 GPU 与 Raspberry Pi 的自托管研究 harness。它把研究运行、资源约束和自托管部署放在同一个项目里，目标不是云端大规模训练，而是让小设备也能承担可重复实验工作流。它的价值在于把“研究 harness”从高配服务器迁移到边缘和个人预算环境。
Project2026-06-02github.com原文 ↗
–
mattpocock/sandcastle
Sandcastle 是 TypeScript 库，用 `sandcastle.run()` 编排 sandboxed coding agents。它 provider-agnostic，内置 Docker、Podman、Vercel Firecracker microVM，也支持自定义 sandbox provider；运行后管理 branch strategy、agent 执行和 commit…
Trending2026-06-01github.com原文 ↗
–
Ralphy
Ralphy 把 Claude Code 包进自主任务队列：先用 plan mode 读代码与研究，写 `plan.md`，再执行、测试、提交并推送到 `ralphy/task-` 分支。它有并发 scheduler、kanban dashboard、worktree isolation、Claude usage-limit backoff、circuit breaker、token cap 和…
Project2026-06-01github.com原文 ↗
–

2026 年 5 月11

galilai-group/stable-worldmodel
stable-worldmodel 给 world model 研究提供从数据采集到 MPC 评估的统一接口。README 的数据格式 benchmark 显示本地 LanceDB 无缓存 4814.8 samples/s，本地 HDF5 无缓存 1416.1 samples/s，video 1330.6 samples/s；存储上 HDF5 43.12GB、LanceDB 13.31GB、vid…
Trending2026-05-31github.com原文 ↗
–
ai-boost/awesome-harness-engineering
这个 awesome list 聚焦 AI agent harness engineering，即模型外部的 context、tool interface、planning artifact、verification loop、memory、sandbox 和 orchestration。README 把资源分为 Foundations、Agent Loop、Planning、Context De…
Trending2026-05-31github.com原文 ↗
–
VT Code - open-source terminal coding agent in Rust
VT Code 是 Rust 写的终端 coding agent，定位是带 robust shell safety、代码理解和多 provider failover 的本地开发工具。README 列出 GitHub Copilot、OpenAI、Anthropic、Gemini、DeepSeek、OpenRouter、Ollama、LM Studio 等 provider，并支持 skills、f…
Project2026-05-31github.com原文 ↗
–
SaladDay/cc-switch-cli
cc-switch-cli 是跨平台 CLI，用于管理 Claude Code、Codex、Gemini CLI 等 agent 工具的 provider 配置和环境。它的实用点在于把不同 agent CLI 的配置切换、环境变量和 provider 管理集中起来。值得看的是多 agent 工具共存后，配置漂移本身会成为开发环境维护成本。
Trending2026-05-31github.com原文 ↗
–
GH05TCREW/pentestagent
PentestAgent 是面向黑盒安全测试、bug bounty 和红队流程的 AI agent 框架。它的核心价值不是替代安全人员，而是把侦察、测试、记录和流程推进包装成 agent 可执行工作流。值得看的是安全测试天然要求权限边界、证据记录和可复现步骤，正好检验 agent harness 是否足够可控。
Trending2026-05-31github.com原文 ↗
–
mastra-ai/mastra
Mastra 的定位是把 agent 应用开发从 demo 推向工程框架：不仅有 agent 和工具调用，还把 eval、观测和迭代纳入一等功能。TypeScript 生态让它更贴近 Web 产品团队。
Trending2026-05-30github.com原文 ↗
–
Tiny-vLLM
它不是又一个包装库，而是把推理服务器关键机制拆成可读课程和源码。适合理解 vLLM 背后的内存与 kernel 工程；若要生产部署，还需要补齐模型覆盖、调度鲁棒性和运维能力。
Project2026-05-30github.com原文 ↗
–
Claude Code: Everything you can configure that the docs don’t tell you
这篇文章像一份“源码考古版操作手册”。它最有价值的点是揭示 Claude Code 的控制面比文档更强：hook 可以改写命令、注入上下文、自动批准或阻断操作，这既是扩展能力也是安全责任。
Blog2026-05-30buildingbetter.tech原文 ↗
–
affaan-m/ECC
ECC 是面向 Claude Code、Codex、Opencode、Cursor 等工具的 agent harness 优化包，仓库包含多平台配置、agents、skills、hooks、commands、rules 和安装器。README 声称插件安装可提供 63 agents、249 skills、79 legacy command shims，并强调不要重复叠加插件和手动安装。
Trending2026-05-29github.com原文 ↗
–
Hermes Desktop
它的工程价值在 packaging 而不是重写 agent：把 Python agent、Vue/Koa UI、Electron 更新与平台安装器整合为一个下载物。风险也来自捆绑：上游 hermes-agent、web-ui、Python 版本和补丁链都要持续维护。
Project2026-05-29github.com原文 ↗
–
AG2B
浏览器端 agent runtime，使用 WebMCP 暴露工具并在前端运行 agent loop。
Project2026-05-29ag2b.ai原文 ↗
–