每日 Harness 开源 · Source
主题 · All topics

4.2 技能系统Skills

本主题共 14 条 · 最早 2026-05-29 · 最新 2026-06-04

视图 · View

2026 年 6 月6

  • googleworkspace/cli

    Google Workspace CLI 用一个 `gws` 命令覆盖 Drive、Gmail、Calendar、Sheets、Docs、Chat、Admin 等 API,并由 Google Discovery Service 动态构建。README 摘要称它包含 100+ Agent Skills,一个支持 API 对应一个 SKILL.md,另有 50 个 Gmail、Drive、Docs、C…

    2026-06-04github.com原文 ↗
  • SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale

    把大型 skill library 的选择问题建模成 typed directed graph,而不是单纯 embedding 相似度检索。图边表达依赖、冲突、特化和重复关系;每次检索返回 vector matches、typed-edge neighbors 和 conflict signals,agent 还能通过 propose-then-commit 把执行证据写回图。论文在 ALFWor…

    2026-06-04arxiv.org原文 ↗
  • Inducing Reasoning Primitives from Agent Traces

    提出 Reasoning Primitive Induction,从成功 ReAct traces 中单遍挖掘、聚类重复推理动作,并转成 typed pseudo-tools。每个 pseudo-tool 由自然语言 docstring 说明,测试时由普通 ReAct loop 组合调用。作者报告 induced libraries 反超生成它们的原 agent:RuleArena NBA 从 3…

    2026-06-04arxiv.org原文 ↗
  • pbakaus/impeccable

    impeccable 是面向 AI coding harness 的前端设计技能与命令集合,帮助 agent 在 UI 任务中遵守更具体的设计规范。项目把布局、组件、视觉检查和交互细节沉淀成可复用命令。值得看的是,它把“AI 写前端不好看”拆成技能、约束和审查流程问题。

    2026-06-03github.com原文 ↗
  • Agent Skills Should Go Beyond Text: The Case for Visual Skills

    论文指出文本技能文件对视觉任务存在表达瓶颈,提出把可复用 agent skill 扩展到视觉形式。

    2026-06-03arxiv.org原文 ↗
  • Skill Availability and Presentation Granularity in Large-Language-Model Agents

    SkillsBench 控制实验研究 skill 是否可用以及呈现粒度是否影响 agent 成功率。实验用 30 个领域均衡任务、两个 reasoning 模型、六种 skill 条件,每个 task-condition-model cell 五次试验,共 1,800 行数据。skill availability 提升最强:GPT-5.5 相比无 skill 提升 26.7-36.0 个百分点,D…

    2026-06-02arxiv.org原文 ↗

2026 年 5 月8

  • cursor/plugins

    cursor/plugins 是 Cursor 官方插件规范和插件集合,每个插件目录带 `.cursor-plugin/plugin.json` manifest。README 列出 continual-learning、cursor-team-kit、thermos、create-plugin、agent-compatibility、cli-for-agent、pr-review-canvas、…

    2026-05-31github.com原文 ↗
  • A Claude Code skill that scopes problems like Peter Naur

    Cartographer skill 把 coding request 前置成 problem-theory 产物,而不是直接进入方案设计。它要求 agent 先写 World、Actors、Program correspondence、Known、Assumed、Thin spots 等字段,并把每个需求追溯到现实世界中的对应关系。值得看的是它把“需求澄清”变成可检查 artifact,适合领域…

    2026-05-31github.com原文 ↗
  • anthropics/skills

    这个仓库把 skills 从产品功能变成可共享工件。其重要性在于技能不只是 prompt 片段,还能携带脚本和资源;长期看,skill 版本化、权限和依赖声明会成为 agent 生态的基础设施。

    2026-05-30github.com原文 ↗
  • SkillsInjector: Dynamic Skill Context Construction for LLM Agents

    这篇工作抓住了 skills 机制的核心矛盾:技能库越丰富,静态塞进上下文越容易把模型带偏。动态规划器把 skill 选择变成执行相关的检索和改写问题,但效果会依赖 skill 描述质量以及训练时的任务分布。

    2026-05-30arxiv.org原文 ↗
  • obra/superpowers

    面向 coding agent 的软件开发方法论和可组合 skills 框架。

    2026-05-29github.com原文 ↗
  • hardikpandya/stop-slop

    Stop Slop 是一个写作 skill,结构包含核心 SKILL.md 和 phrases、structures、examples 三类参考文件,用于识别并移除 AI prose 中的套路短语、结构 cliché、节奏问题和 meta-commentary。它更像可移植编辑准则,而不是自动检测器。

    2026-05-29github.com原文 ↗
  • anthropics/knowledge-work-plugins

    这说明 Anthropic 正把 Cowork/Claude Code 的能力生态做成插件市场,而不是只提供通用 agent。插件化降低入门成本,但也把权限、数据访问和组织流程固化进可执行包。

    2026-05-29github.com原文 ↗
  • Leonxlnx/taste-skill

    taste-skill 是前端设计类 agent skills 集合,默认 `design-taste-frontend` v2 会读 brief、推断设计语言,并通过 VARIANCE、MOTION、DENSITY 三个 dial 约束布局、动效和信息密度;还包含 image-to-code、redesign、minimalist、brutalist、brandkit 等分支技能。

    2026-05-29github.com原文 ↗