4.2 技能系统Skills

本主题共 56 条 · 最早 2026-05-29 · 最新 2026-07-20

视图 · View

2026 年 7 月20

ibelick/ui-skills
ibelick/ui-skills 是面向 design engineer 的 UI skill 集合和 CLI。digest 给出的项目定位是把可复用的界面实现经验、组件模式和设计工程流程包装成 agent 可调用的 skills。它关注的不是某个单独组件，而是让 AI coding agent 在做 UI 时带着稳定的视觉、交互和实现约束工作。随着 coding agent 更常接手前端任务，…
Trending2026-07-20github.com原文 ↗
–
Nutlope/hallmark
hallmark 是面向 Claude Code、Cursor 和 Codex 的设计 skill，内置主题和 UI 生成约束。它把视觉偏好包装成 agent 可加载规则，帮助编码助手生成更一致的界面。这个仓库说明“设计系统”正在变成 prompt、规则和 skill 的组合，而不仅是 Figma 文件或 React 组件。
Trending2026-07-16github.com原文 ↗
–
Dynamic Agent Skills: A Lifecycle Survey and Taxonomy of Evolving Skill Libraries
这篇综述把 skill library 看成会持续演化的运行时资产，而不是一组静态 prompt 或脚本。文章按生命周期整理技能发现、表示、检索、执行、更新与治理机制，并比较代码技能、工具技能和程序化记忆等形态。它的价值在于给“agent 会积累能力”这件事建立词汇表，同时指出版本控制、评测和退役机制仍缺统一做法。
Paper2026-07-15arxiv.org原文 ↗
–
google-labs-code/stitch-skills
stitch-skills 是面向 Google Stitch MCP server 的 Agent Skills 集合，并遵循 Agent Skills open standard。它把可复用能力打包成 skill，让 agent 在设计或应用生成流程中调用。这个仓库说明 MCP 相关生态正在从单个工具 endpoint 扩展到可分发能力包。
Trending2026-07-13github.com原文 ↗
–
dotnet/skills
dotnet/skills 是 .NET 团队维护的 agent skills 仓库，为 coding agents 提供 .NET 与 C# 开发任务知识。README 列出多个插件：`dotnet` LSP 集成、`dotnet-msbuild` 构建诊断与现代化、`dotnet-test` 测试运行与分析、`dotnet-ai` LLM/RAG/MCP/ML.NET 相关能力，以及 .NET…
Trending2026-07-09始 2026-07-06github.com原文 ↗
–
Task Decomposition-Guided Reranking for Adaptive Agent Skill Retrieval
SkillReranker 面向大型 skill library 中“多个泛化 skill 都语义相近”的选择难题，在 inference time 用任务分解来重排候选 skill。它同时分解 task 和 skill，生成 subtask、execution-state 与 transition-state 描述，再构成一个有向无环执行图：中间 task states 是节点，candidat…
Paper2026-07-09arxiv.org原文 ↗
–
Skill-extractor turns coding agent transcripts into reusable skills
skill-extractor 从 Claude Code、OpenAI Codex CLI 或其他 agent transcript 里挖可复用 skill，而不是让 agent 平台用不可见 memory 自动学习。它按 confidence 和 utility 给候选打分，并用 trace outcome（successful / meh / failed）加权；候选会进入 VS Code…
Project2026-07-09github.com原文 ↗
–
SawyerHood/dev-browser
dev-browser 是一个 Claude Skill，让 agent 可以通过 sandboxed JavaScript scripts 控制浏览器。README 提到脚本运行在 QuickJS WASM sandbox 中，没有 host access；同时支持 persistent pages，让 agent 一次导航后可以跨多个脚本持续交互，并能 auto-connect 到浏览器。它不…
Trending2026-07-09github.com原文 ↗
–
Geosql: A Claude/Codex skill for geospatial data
GeoSQL 是给 Claude、Codex、GitHub Copilot 的 geospatial analytics skill，面向 PostGIS、BigQuery、Snowflake 和 Wherobots 上的数据分析。README 强调它可以 100% local 或 self-hosted，不需要 SaaS 账号；`pip install geosql && geosql` 后可安…
Project2026-07-09github.com原文 ↗
–
bradautomates/claude-video
claude-video 是让 Claude 下载、抽帧、转录并处理视频的 skill。它把视频转换成模型可操作的文本、图像帧和时间线信息，使 Claude 能总结、分析或引用片段。这个仓库的实用点在于把多模态材料预处理包装成 agent 可调用工作流。
Trending2026-07-08始 2026-07-07github.com原文 ↗
–
JuliusBrussee/caveman
Caveman 是面向 AI coding agent 的 skill/plugin，用更短、更直接的输出风格减少 token 消耗。它约束 agent 的沟通方式和中间叙述，把上下文预算留给代码、命令和关键状态。这个项目很小，但抓住了 coding agent 的真实成本项：语言冗余也会吃掉窗口和账单。
Trending2026-07-08github.com原文 ↗
–
ComposioHQ/awesome-claude-skills
awesome-claude-skills 是 Claude Skills、插件和 agent workflow 的资源列表。它以 curated list 的方式整理技能包、扩展和示例工作流，价值主要来自发现和分类。这个仓库反映 Claude Skills 生态正在从零散技巧转向可复用组件目录。
Trending2026-07-08github.com原文 ↗
–
coreyhaines31/marketingskills
marketingskills 把营销工作拆成 agent skills，覆盖 CRO、copywriting、SEO、analytics、growth、sales/GTM 和 strategy。README 的结构里 product-marketing 是基础 skill，其它 skill 先读取产品、受众和定位，再进入具体任务。这个设计比“让 agent 写营销文案”更系统，因为它把上下文依赖…
Trending2026-07-07github.com原文 ↗
–
hesreallyhim/awesome-claude-code
这是 Claude Code 资源合集，收集 skills、agents、status lines、hooks、工作流和相关开发工具。它本身不是运行时项目，而是用 curated list 映射 Claude Code 生态的增长点。看这个仓库可以快速判断社区把精力投向哪里：提示资产、自动化脚本、状态展示、子代理编排和团队规范都在变成可复用部件。
Trending2026-07-06github.com原文 ↗
–
agentskills/agentskills
agentskills/agentskills 定义 Agent Skills 规范和 `SKILL.md` 文档格式，用于给 agent 安装可复用能力。仓库把技能说明、资源和工作流约束打包，避免把所有领域知识塞进一个巨大系统提示。它反映了 agent 能力工程的一条路线：把提示变成可分发、可版本化、可按任务加载的模块。
Trending2026-07-04github.com原文 ↗
–
SkillCoach: Self-Evolving Rubrics for Evaluating and Enhancing Agentic Skill-Use
SkillCoach 研究 agent 对可复用 skill 的选择和执行质量，用自演化 rubric 从轨迹中更新评价标准。它不是只打一个 pass/fail 分数，而是让 rubric 随任务分布提炼新的评分维度。技术意义在于 skill-based agent 需要可维护的评估体系，否则 skill 数量增长后很难判断 agent 是选错技能、参数错了，还是执行策略不合适。
Paper2026-07-04arxiv.org原文 ↗
–
Skills Are Not Islands: Measuring Dependency and Risk in Agent Skill Supply Chains
这篇把 agent skills 看作 dependency-bearing artifacts，指出它们的 identities、versions、provenance 常常是隐式的，已经造成 duplicated dependencies 和 inconsistent installations。SkillDepAnalyzer 借鉴 SBOM 思路，从自然语言依赖证据中恢复 skill me…
Paper2026-07-03arxiv.org原文 ↗
–
SkillSelect-Serve: Budget-Controllable and QoS-Aware Skill Service Recommendation and Composition for Small LLM Agents
论文把 agent skill 从可检索文档重塑为 Skill Service：每个 skill 带功能描述、依赖、上下文成本、风险和 QoS 属性。Local Micro-Agent Requirement Planner 将自然语言任务转成结构化服务需求，共享 discovery backbone 从大 registry 中召回候选，再用 skill-level marginal suitab…
Paper2026-07-03arxiv.org原文 ↗
–
QUALITY.md - open format/specification, agent skill, and CLI
QUALITY.md 把项目质量评估写成一个开放说明格式，并配套 agent skill 与 CLI。作者在原始描述里强调它最初用于建立 holistic quality evaluation process，后来发现也适合 loop engineering。这里的方向不是再加一个 lint，而是把质量标准、评估步骤和 agent 可执行的检查周期写成项目资产，让修复从事后 review/repa…
Project2026-07-03getquality.md原文 ↗
–
cloudflare/skills
cloudflare/skills 是 Cloudflare 给 Agent Skills 标准准备的一组 skill，覆盖 Workers、Agents SDK 和更广的 Cloudflare Developer Platform。它可通过 Claude plugin marketplace、Cursor marketplace/remote rule、`npx skills add` 或直接复…
Trending2026-07-02github.com原文 ↗
–

2026 年 6 月28

Use-zerostack
use-zerostack 是一个 agent skill，把 Claude Code、Cursor 等 coding agent 的 slash command 映射到 zerostack CLI，让主 agent 可以把实现、计划、审查和复杂编排委派出去。README 给出的命令面很小但明确：`/zs:code`、`/zs:ask`、`/zs:plan`、`/zs:review`、`/zs:p…
Project2026-06-29github.com原文 ↗
–
Shikhu
Shikhu 是 CLI 加 `/shikhu-study` agent skill，目标是帮助开发者学习自己或 AI 生成的代码库。它用 Mercury API 读取源码生成摘要和概念性多选题，用本地 SQLite 的 `coverage.db` 跟踪 knowledge coverage；每个文件需要 3 个 golden questions 才算 fully covered。README 还…
Project2026-06-29github.com原文 ↗
–
vercel-labs/skills
vercel-labs/skills 提供一个开放 agent skills 生态的 CLI，核心入口是 `npx skills`。README 写到它支持 OpenCode、Claude Code、Codex、Cursor 和 68 个以上工具，还能安装 skill 或把某个 skill 直接生成 prompt 传给 agent。它的看点在于把“可迁移的 agent 能力包”做成跨工具分发层，而…
Trending2026-06-28github.com原文 ↗
–
aws/agent-toolkit-for-aws
aws/agent-toolkit-for-aws 是 AWS 官方支持的 agent toolkit，包含 MCP servers、skills 和 plugins。README 明确说它面向 Claude Code、Codex、Cursor 等 coding agents，帮助这些 agent 在 AWS 上 build、deploy、manage applications。它的意义在于云厂商…
Trending2026-06-28github.com原文 ↗
–
xbtlin/ai-berkshire
AI Berkshire 是基于 Claude Code 的价值投资研究框架，把巴菲特、芒格、段永平、李录四种方法论做成 skills 和多 agent 流程。README 列出 16 个 skill，包含深度研究、财报分析、行业筛选、持仓管理和思维工具；它还展示 2024 全年 +69.29%、2025 年至今 +66.38% 的实盘记录。项目真正有意思的地方是把投研纪律、反偏见清单和多源数据校…
Trending2026-06-27github.com原文 ↗
–
SKILL-DISCO: Distilling and Compiling Agent Traces into Reusable Procedural Skills
论文将 FSM-defined scenarios 里的成功轨迹看作未知转移图路径，把可复用 skill 表示成 parameterized finite-state-machine subgraphs。SkillDisCo 从 successful traces 蒸馏 PFSM 子图，再编译成 callable、executable、verifiable procedural skills；AL…
Paper2026-06-27arxiv.org原文 ↗
–
NVIDIA/skills
NVIDIA/skills 是 NVIDIA 发布的官方 agent skills 集合，README 将 skills 定义为 portable instruction sets。它们用于教 AI agents 更好使用 NVIDIA 软件，包括 CUDA-X libraries、AI Blueprints 等，并链接 docs、livestream 和 capability governanc…
Trending2026-06-24github.com原文 ↗
–
Open-geo
open-geo 是 Claude Code skill，用真实登录浏览器跑查询并记录品牌在生成式答案中的可见性。README 写明它检查目标域名是否进入 answer、sources、citations 和正文，使用 SQLite WAL 存本地时间序列，并输出 FastAPI/React dashboard 与 A4 PDF；指标采用 answer→sources→citations funn…
Project2026-06-23github.com原文 ↗
–
openai/skills
openai/skills 是 Codex Agent Skills 的技能目录仓库。README 把 Agent Skills 定义为 agents 可发现并用于特定任务的 instructions、scripts 和 resources 文件夹，强调 “write once, use everywhere”。这个仓库和自动生成 SKILL.md 的论文互相呼应：一个提供技能分发形态，另一个试图…
Trending2026-06-20github.com原文 ↗
–
Surface skill for HTML pages a coding agent watches and reacts to
Surface 提供的是面向编码代理的 HTML 页面观察与响应技能，让代理能看见页面状态并据此采取动作。它的重点不是生成页面，而是把浏览器中的可视反馈纳入编码闭环。对于前端和可视化调试任务，这类技能可以把“截图观察、定位问题、修改代码”变成更连续的工作流。
Project2026-06-20github.com原文 ↗
–
K-Dense-AI/scientific-agent-skills
scientific-agent-skills 是面向科学研究代理的技能库，README 声称已有 160,000+ scientists 使用，提供 140 ready-to-use skills 和 100+ scientific databases，覆盖生物、化学、医学和药物发现。它把领域数据库访问和研究流程写成代理可复用的技能，降低科学任务里反复查库、转换格式和解释字段的成本。这个仓库说明…
Trending2026-06-20github.com原文 ↗
–
Automating SKILL.md Generation for Computer-Using Agents via Interaction Trajectory Mining
这篇面向 computer-using agents，目标是从 GUI 交互轨迹中自动生成 SKILL.md。摘要给出的三阶段流程是 segment GUI trajectories、cluster segments into candidate skills，再训练 skill-aware policy；动机是显式技能库更容易检查，但能否从交互数据中挖掘仍需验证。它把“人教代理做任务”的成本从手…
Paper2026-06-20arxiv.org原文 ↗
–
mattpocock/skills
mattpocock/skills 收集面向工程工作流的 agent skills。它把经验、约束和操作步骤沉淀成可被 agent 调用的技能文件，而不是依赖每次对话重新说明。这个仓库体现 skills 正在成为 AI 开发环境里的新配置层。
Trending2026-06-19github.com原文 ↗
–
Skill Studio - mine, edit, and manage Agent Skills
Skill Studio 是跨平台 Rust 应用，用来挖掘、编辑和管理 agent skills。它把 skills 当作可维护资产，而不是散落在项目里的提示词片段。这个方向值得注意，因为多 agent 工作流越复杂，技能的发现、版本和编辑体验越接近 IDE 或包管理问题。
Project2026-06-19github.com原文 ↗
–
PreAct: Computer-Using Agents that Get Faster on Repeated Tasks
PreAct 把 computer-use Agent 的一次成功执行编译成小型 state-machine program：状态负责检查屏幕是否符合预期，transition 负责执行点击或输入，后续同类任务直接 replay 而不是逐步调用模型。论文报告 replay 比重新让 Agent 观察和推理快 8.5 到 13 倍，且每一步不再消耗语言模型调用；一旦屏幕状态不匹配，控制权会交回 Ag…
Paper2026-06-18arxiv.org原文 ↗
–
addyosmani/agent-skills
agent-skills 是面向 AI coding agents 的 production-grade engineering skills 集合。digest 的重点是把工程流程、代码审查、测试、文档和交付习惯封装成可复用指令包。它值得看是因为 agent 能力越来越取决于可执行流程模板，而不仅是模型本身的代码生成能力。
Trending2026-06-15github.com原文 ↗
–
Adaptive Multi-Resolution Procedural Knowledge Compression for Large Language Models
SKIM 关注的是自然语言 skill，而不是普通文档压缩：skill 里有步骤依赖、工具协议和可执行 workflow，简单摘要会破坏可用性。它按 skill 复杂度自适应生成不同数量的 soft tokens，形成多分辨率过程知识压缩，并且强调离线、轻量，适合频繁更新的社区 skill。实验里 skill 被压到原 token 长度的 30%-60%，同时任务表现比既有压缩方法保留得更好。对于…
Paper2026-06-12arxiv.org原文 ↗
–
google/skills
Google 的 skills 仓库收集面向 Google 产品和技术栈的 Agent Skills，可用 npx skills add google/skills 安装并选择具体技能。README 列出 Gemini API on Agent Platform、Managed Agents API、Skill Registry API、AlloyDB、BigQuery、Cloud Run、Clo…
Trending2026-06-10github.com原文 ↗
–
LatentSkill
LatentSkill 把 agent 的 textual skills 转成 plug-and-play LoRA adapters，让技能知识存到权重空间而不是每步塞进 prompt。它用预训练 hypernetwork 生成 skill LoRA，并支持 scaling 与 parameter-space composition；在 ALFWorld seen/unseen split 成功…
Paper2026-06-10arxiv.org原文 ↗
–
Anything2Skill
Anything2Skill 把外部知识库中的手册、示例、日志和轨迹编译成可复用 agent skills。框架先切 evidence windows，再按 skill-tree prior plan-and-expand，最后生成包含 invocation conditions、contraindications、action moves、workflow steps、constraints、o…
Paper2026-06-10arxiv.org原文 ↗
–
openai/plugins
这是 OpenAI 的 Codex plugin 示例集合，覆盖 manifest、skills、commands、hooks 和 MCP 配置等结构。GitHub 页面显示约 2k stars，语言以 JavaScript 和 Python 为主。它适合当作 plugin scaffolding 的参考，而不是完整产品仓库。
Trending2026-06-08github.com原文 ↗
–
AIP: A Graph Representation for Learning and Governing Agent Skills
AIP 把 agent skill 从一段说明文档改成有类型边的有向执行图，节点可以绑定脚本，也可以保留自然语言步骤。摘要提到 schema-validated YAML 和 typed input/output，这让 skill 可以被校验、组合和治理，减少“技能库越长越像提示词垃圾堆”的风险。
Paper2026-06-05arxiv.org原文 ↗
–
googleworkspace/cli
Google Workspace CLI 用一个 `gws` 命令覆盖 Drive、Gmail、Calendar、Sheets、Docs、Chat、Admin 等 API，并由 Google Discovery Service 动态构建。README 摘要称它包含 100+ Agent Skills，一个支持 API 对应一个 SKILL.md，另有 50 个 Gmail、Drive、Docs、C…
Trending2026-06-04github.com原文 ↗
–
SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale
把大型 skill library 的选择问题建模成 typed directed graph，而不是单纯 embedding 相似度检索。图边表达依赖、冲突、特化和重复关系；每次检索返回 vector matches、typed-edge neighbors 和 conflict signals，agent 还能通过 propose-then-commit 把执行证据写回图。论文在 ALFWor…
Paper2026-06-04arxiv.org原文 ↗
–
Inducing Reasoning Primitives from Agent Traces
提出 Reasoning Primitive Induction，从成功 ReAct traces 中单遍挖掘、聚类重复推理动作，并转成 typed pseudo-tools。每个 pseudo-tool 由自然语言 docstring 说明，测试时由普通 ReAct loop 组合调用。作者报告 induced libraries 反超生成它们的原 agent：RuleArena NBA 从 3…
Paper2026-06-04arxiv.org原文 ↗
–
pbakaus/impeccable
impeccable 是面向 AI coding harness 的前端设计技能与命令集合，帮助 agent 在 UI 任务中遵守更具体的设计规范。项目把布局、组件、视觉检查和交互细节沉淀成可复用命令。值得看的是，它把“AI 写前端不好看”拆成技能、约束和审查流程问题。
Trending2026-06-03github.com原文 ↗
–
Agent Skills Should Go Beyond Text: The Case for Visual Skills
论文指出文本技能文件对视觉任务存在表达瓶颈，提出把可复用 agent skill 扩展到视觉形式。
Paper2026-06-03arxiv.org原文 ↗
–
Skill Availability and Presentation Granularity in Large-Language-Model Agents
SkillsBench 控制实验研究 skill 是否可用以及呈现粒度是否影响 agent 成功率。实验用 30 个领域均衡任务、两个 reasoning 模型、六种 skill 条件，每个 task-condition-model cell 五次试验，共 1,800 行数据。skill availability 提升最强：GPT-5.5 相比无 skill 提升 26.7-36.0 个百分点，D…
Paper2026-06-02arxiv.org原文 ↗
–

2026 年 5 月8

cursor/plugins
cursor/plugins 是 Cursor 官方插件规范和插件集合，每个插件目录带 `.cursor-plugin/plugin.json` manifest。README 列出 continual-learning、cursor-team-kit、thermos、create-plugin、agent-compatibility、cli-for-agent、pr-review-canvas、…
Trending2026-05-31github.com原文 ↗
–
A Claude Code skill that scopes problems like Peter Naur
Cartographer skill 把 coding request 前置成 problem-theory 产物，而不是直接进入方案设计。它要求 agent 先写 World、Actors、Program correspondence、Known、Assumed、Thin spots 等字段，并把每个需求追溯到现实世界中的对应关系。值得看的是它把“需求澄清”变成可检查 artifact，适合领域…
Project2026-05-31github.com原文 ↗
–
anthropics/skills
这个仓库把 skills 从产品功能变成可共享工件。其重要性在于技能不只是 prompt 片段，还能携带脚本和资源；长期看，skill 版本化、权限和依赖声明会成为 agent 生态的基础设施。
Trending2026-05-30github.com原文 ↗
–
SkillsInjector: Dynamic Skill Context Construction for LLM Agents
这篇工作抓住了 skills 机制的核心矛盾：技能库越丰富，静态塞进上下文越容易把模型带偏。动态规划器把 skill 选择变成执行相关的检索和改写问题，但效果会依赖 skill 描述质量以及训练时的任务分布。
Paper2026-05-30arxiv.org原文 ↗
–
obra/superpowers
面向 coding agent 的软件开发方法论和可组合 skills 框架。
Trending2026-05-29github.com原文 ↗
–
hardikpandya/stop-slop
Stop Slop 是一个写作 skill，结构包含核心 SKILL.md 和 phrases、structures、examples 三类参考文件，用于识别并移除 AI prose 中的套路短语、结构 cliché、节奏问题和 meta-commentary。它更像可移植编辑准则，而不是自动检测器。
Trending2026-05-29github.com原文 ↗
–
anthropics/knowledge-work-plugins
这说明 Anthropic 正把 Cowork/Claude Code 的能力生态做成插件市场，而不是只提供通用 agent。插件化降低入门成本，但也把权限、数据访问和组织流程固化进可执行包。
Trending2026-05-29github.com原文 ↗
–
Leonxlnx/taste-skill
taste-skill 是前端设计类 agent skills 集合，默认 `design-taste-frontend` v2 会读 brief、推断设计语言，并通过 VARIANCE、MOTION、DENSITY 三个 dial 约束布局、动效和信息密度；还包含 image-to-code、redesign、minimalist、brutalist、brandkit 等分支技能。
Trending2026-05-29github.com原文 ↗
–