每日 Harness 开源 · Source
返回本期 · Back to 2026-06-05

GitHub 热门 · GitHub Trending2026-06-05 · Friday, June 5, 2026

NVIDIA-NeMo/Gym

github.com原文 ↗

NeMo Gym 用“environment”统一评估和训练 agent:一个环境包含 dataset、agent harness、verifier 和 per-task state。README 强调可扩展到数千并发环境,并能在评估、agent optimization 和训练之间切换;它对应的是 agent benchmark 从静态问答向可执行环境迁移。
浏览

评论 · Comments