主题 · Topic
6.1 框架与脚手架Frameworks & Scaffolds
本主题共 27 条 · 最早 2026-05-29 · 最新 2026-06-04
2026 年 6 月15
-
Paseo
Paseo 是 coding agent interface,支持从手机、桌面和 CLI 管理 Claude Code、Codex、Copilot、OpenCode 和 Pi agents。README 摘要显示它运行本地 daemon,负责 agent process orchestration、WebSocket API 和 MCP server;CLI 可安装为 @getpaseo/cli。…
原文 ↗– -
Microsoft Build: MAI-Thinking-1 and MAI Family models, Surface RTX Spark Dev Box, and OpenClaw in Windows
smol.ai 汇总 Microsoft Build 上 MAI-Thinking-1、MAI family models、Surface RTX Spark Dev Box 和 Windows agent 生态发布。它把模型、开发硬件和 OpenClaw/Windows agent 集成放在同一脉络里,说明 Microsoft 的路线不只是发布模型,而是补齐本地开发、agent runtime…
原文 ↗– -
LiteHarness
LiteHarness 用单一 SDK 调用 Claude Agent、OpenAI Agent、Pi AI 等 coding-agent harnesses。相邻 LiteLLM Agent Platform 文档显示该生态关注让 coding agents 在隔离沙箱中运行,并通过 vault/proxy 避免真实密钥暴露给 agent。LiteHarness 的意义在于把不同 harness…
原文 ↗– -
Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents
提出 Agent libOS,把长期运行 LLM agent 抽象成 AgentProcess,而不是一次请求-响应调用。运行时包含 process identity、parent-child lineage、lifecycle state、AgentImage 派生的 tool table、typed Object Memory、显式 capabilities、human queues、chec…
原文 ↗– -
zeroclaw-labs/zeroclaw
Rust 写的本地 personal AI assistant runtime。
原文 ↗– -
can1357/oh-my-pi
终端 AI coding agent,集成编辑、LSP、浏览器、子 agent 和多 provider。
原文 ↗– -
Parley
本地 TUI 代码审查工具,支持与 Codex、Claude、OpenCode 等 agent harness 协作。
原文 ↗– -
nesquena/hermes-webui
Hermes WebUI 是 Hermes Agent 的轻量浏览器界面,用 Python 和 vanilla JS 实现,无 build step、无 framework。README 描述三栏布局:sessions/nav、chat、workspace file browser,并支持 model/profile/workspace controls、token context ring 和…
原文 ↗– -
iii-hq/iii
iii 是用于实时组合、扩展和观测后端服务的开发框架。README 的核心模型是 Worker、Function、Trigger:API 服务、数据 pipeline、Rust microservice 或 agent capability 都注册为 worker,系统负责路由、序列化、触发和 catalog 通知。它把 agent 添加能力、发现函数、调用工具和追踪执行统一到开发者也使用的运行时…
原文 ↗– -
golemcloud/golem
Golem 是用 WebAssembly components 构建 distributed applications 和 agents 的平台。README 称其服务可在分布式 cloud environment 运行 Wasm components,并支持 Rust、TypeScript、Scala、MoonBit;项目定位为 agent-native platform,强调 never lo…
原文 ↗– -
Ministry of Everything
Ministry of Everything 是 CLI-first agent harness,让单个操作者用 durable markdown documents 驱动 Claude Code 或 Codex。每个阶段产出 canvas,后续阶段可读而无需重放整个 chat;所有 turn 提交到个人 Git journal,可 resume、revert、audit 和 reuse。它没有后…
原文 ↗– -
From Model Scaling to System Scaling: Scaling the Harness in Agentic AI
论文主张把 foundation model 外围的 harness 作为 agentic AI 的一等扩展对象,而不是只比较模型权重。它关注上下文构造、工具调用、执行编排、验证与记忆等系统层能力,强调长任务表现常由 harness 决定。价值在于把 agent 评估从“模型分数”推向“模型加执行层”的可复现实验。
原文 ↗– -
Dataroom
Dataroom 是面向低预算 GPU 与 Raspberry Pi 的自托管研究 harness。它把研究运行、资源约束和自托管部署放在同一个项目里,目标不是云端大规模训练,而是让小设备也能承担可重复实验工作流。它的价值在于把“研究 harness”从高配服务器迁移到边缘和个人预算环境。
原文 ↗– -
mattpocock/sandcastle
Sandcastle 是 TypeScript 库,用 `sandcastle.run()` 编排 sandboxed coding agents。它 provider-agnostic,内置 Docker、Podman、Vercel Firecracker microVM,也支持自定义 sandbox provider;运行后管理 branch strategy、agent 执行和 commit…
原文 ↗– -
Ralphy
Ralphy 把 Claude Code 包进自主任务队列:先用 plan mode 读代码与研究,写 `plan.md`,再执行、测试、提交并推送到 `ralphy/task-` 分支。它有并发 scheduler、kanban dashboard、worktree isolation、Claude usage-limit backoff、circuit breaker、token cap 和…
原文 ↗–
2026 年 5 月12
-
galilai-group/stable-worldmodel
stable-worldmodel 给 world model 研究提供从数据采集到 MPC 评估的统一接口。README 的数据格式 benchmark 显示本地 LanceDB 无缓存 4814.8 samples/s,本地 HDF5 无缓存 1416.1 samples/s,video 1330.6 samples/s;存储上 HDF5 43.12GB、LanceDB 13.31GB、vid…
原文 ↗– -
anthropics/claude-code
Claude Code 是 Anthropic 的 terminal/IDE/GitHub coding agent,README 称它能理解代码库、执行 routine tasks、解释复杂代码和处理 git workflows。当前 README 还明确 npm 安装已 deprecated,推荐 curl installer、Homebrew cask、Windows PowerShell…
原文 ↗– -
ai-boost/awesome-harness-engineering
这个 awesome list 聚焦 AI agent harness engineering,即模型外部的 context、tool interface、planning artifact、verification loop、memory、sandbox 和 orchestration。README 把资源分为 Foundations、Agent Loop、Planning、Context De…
原文 ↗– -
VT Code - open-source terminal coding agent in Rust
VT Code 是 Rust 写的终端 coding agent,定位是带 robust shell safety、代码理解和多 provider failover 的本地开发工具。README 列出 GitHub Copilot、OpenAI、Anthropic、Gemini、DeepSeek、OpenRouter、Ollama、LM Studio 等 provider,并支持 skills、f…
原文 ↗– -
SaladDay/cc-switch-cli
cc-switch-cli 是跨平台 CLI,用于管理 Claude Code、Codex、Gemini CLI 等 agent 工具的 provider 配置和环境。它的实用点在于把不同 agent CLI 的配置切换、环境变量和 provider 管理集中起来。值得看的是多 agent 工具共存后,配置漂移本身会成为开发环境维护成本。
原文 ↗– -
GH05TCREW/pentestagent
PentestAgent 是面向黑盒安全测试、bug bounty 和红队流程的 AI agent 框架。它的核心价值不是替代安全人员,而是把侦察、测试、记录和流程推进包装成 agent 可执行工作流。值得看的是安全测试天然要求权限边界、证据记录和可复现步骤,正好检验 agent harness 是否足够可控。
原文 ↗– -
mastra-ai/mastra
Mastra 的定位是把 agent 应用开发从 demo 推向工程框架:不仅有 agent 和工具调用,还把 eval、观测和迭代纳入一等功能。TypeScript 生态让它更贴近 Web 产品团队。
原文 ↗– -
Tiny-vLLM
它不是又一个包装库,而是把推理服务器关键机制拆成可读课程和源码。适合理解 vLLM 背后的内存与 kernel 工程;若要生产部署,还需要补齐模型覆盖、调度鲁棒性和运维能力。
原文 ↗– -
Claude Code: Everything you can configure that the docs don’t tell you
这篇文章像一份“源码考古版操作手册”。它最有价值的点是揭示 Claude Code 的控制面比文档更强:hook 可以改写命令、注入上下文、自动批准或阻断操作,这既是扩展能力也是安全责任。
原文 ↗– -
affaan-m/ECC
ECC 是面向 Claude Code、Codex、Opencode、Cursor 等工具的 agent harness 优化包,仓库包含多平台配置、agents、skills、hooks、commands、rules 和安装器。README 声称插件安装可提供 63 agents、249 skills、79 legacy command shims,并强调不要重复叠加插件和手动安装。
原文 ↗– -
Hermes Desktop
它的工程价值在 packaging 而不是重写 agent:把 Python agent、Vue/Koa UI、Electron 更新与平台安装器整合为一个下载物。风险也来自捆绑:上游 hermes-agent、web-ui、Python 版本和补丁链都要持续维护。
原文 ↗– -
AG2B
浏览器端 agent runtime,使用 WebMCP 暴露工具并在前端运行 agent loop。
原文 ↗–