每日 Harness 开源 · Source
主题 · All topics

7.3 安全与攻防Security

本主题共 19 条 · 最早 2026-05-29 · 最新 2026-06-04

视图 · View

2026 年 6 月9

  • Agent-browser-shield

    Agent-browser-shield 是面向 web-browsing AI agents 的浏览器扩展,目标是降低页面误导、prompt injection 和错误操作风险。digest 信息显示它属于浏览器侧安全护栏,不是通用 agent runtime。它的技术价值在于把网页内容、DOM 操作和 agent 决策之间的风险点放到扩展层处理。随着 agent 直接读网页和点击页面变多,这类…

    2026-06-04github.com原文 ↗
  • AI Agents Enable Adaptive Computer Worms

    展示 AI agent 可能把传统蠕虫从固定漏洞利用推向针对每个目标生成定制攻击策略的形态。论文以 WannaCry 这类预设漏洞路径为对照,强调 patch 单一漏洞无法覆盖 agent 自动枚举环境、推理弱点和生成利用方案的风险。它属于安全威胁建模类工作,不是普通 malware 工程复现。值得读的是它把 agent autonomy 带来的攻击面变化讲得很直接。

    2026-06-04arxiv.org原文 ↗
  • 1-Click GitHub Token Stealing via a VSCode Bug

    Ammar Askar 披露一个可导致 GitHub token 被窃取的 VS Code bug。标题中的 1-click 表明交互门槛很低,风险集中在 IDE、扩展或链接处理链路如何暴露开发者凭证。它对 coding-agent 时代尤其重要,因为 agent、IDE 和 GitHub token 的权限常常叠在同一个工作站里。

    2026-06-04blog.ammaraskar.com原文 ↗
  • When Safe Skills Collide: Measuring Compositional Risk in Agent Skill Ecosystems

    论文研究多个单独安全的 agent skills 组合后是否形成不安全能力集合。

    2026-06-03arxiv.org原文 ↗
  • From Prompt Injection to Persistent Control: Defending Agentic Harness Against Trojan Backdoors

    论文提出 ClawTrojan,研究本地 agent harness 中由文件或工具输出触发、写入并跨会话生效的多步 trojan backdoor。OpenClaw-style workspace 中 GPT-5.4 的攻击成功率达到 95.5%,而传统单轮 prompt injection 在同一模型上几乎为零。DASGuard 通过扫描敏感文件中的 control-like text、追踪来…

    2026-06-02始 2026-06-01arxiv.org原文 ↗
  • AgentThreatBench

    OWASP Agent Memory Guard 是 OWASP Incubator 项目,也是 ASI06 Memory Poisoning 的 reference implementation。它作为 agent 与 memory store 之间的 runtime defense layer,筛查每次 read/write,阻断 prompt injection、secret leakage…

    2026-06-02始 2026-05-30github.com原文 ↗
  • mcpguard

    mcpguard 是 MCP server 的扫描器和运行时 firewall,映射 OWASP MCP Top 10 2026。它能扫描 config,输出 JSON/SARIF,并通过 proxy 对 tool call 依据 YAML policy 执行 allow、deny 或 audit;检查项包括 tool poisoning、excessive permissions、command…

    2026-06-01github.com原文 ↗
  • ChatGPT for Google Sheets exfiltrates workbooks

    PromptArmor 披露 Google Sheets 中 ChatGPT 集成可导致 workbook 数据外传。问题不是传统意义上的文件权限越权,而是表格内容、AI 插件、外部请求和模型工具调用形成了新数据流。它值得看,因为办公套件里的 AI integration 会把单元格文本也变成可执行影响源。

    2026-06-01promptarmor.com原文 ↗
  • COMPASS: Cognitive MCTS-Guided Process Alignment for Safe Search Agents

    COMPASS 处理搜索 agent 的 retrieval-induced safety degradation:有害意图在多步检索里可被拆成无害子查询,最终仍导向不安全结果。它用 cognitive tree exploration 合成 stealthy attack trajectories,再用 introspective step-wise alignment 定位风险中间动作并做过程…

    2026-06-01arxiv.org原文 ↗

2026 年 5 月10